Автор: Semendjajew K.A.   Bronstein I.N.   Musiol G.   Muhlig H.  

Теги: mathematik  

ISBN: 3-8171-2006-0

Год: 2005

Текст
                    Tabelle 6.2 Differentiationsregeln (s S 400)
Regel
Konstantenregel
Faktorregel
Summenregel
Produktregel für
zwei Funktionen
Produktregel für
n Funktionen
Quotientenregel
Kettenregel für
zwei Funktionen
Kettenregel für
drei Funktionen
Potenzregel
Logarithmische
Differentiation
Differentiation der
Umkehrfunktion
Implizite
Differentiation
Ableitung in
Parameterdarstellung
Ableitung in
Polarkoordinaten
Formel für die Ableitung
c' = 0 (c const)
(cu)' = cu' (c const)
(u ± v)' = u' ±v'
{uv)' = u'v + uv'
{uiU2 Un)' = Yl ul K un
i=l
(u\> vu'-uv'
\v) v* {t^ü)
, du dv
y = u(v(x)) V=TvTx
, du dv dw
y = u(v(w(x))) y=---
(ua)' = cma_V (a e R, a^O)
speziell ( - 1 = —r (u^O)
\uj uz
d(\ny(x)) 1 , , d(\ny)
= -y => y = y—
dx y dx
speziell (uv)' = uv 1 v' In u H j (u > 0)
<p inverse Funktion zu / , d h y — f(x) «=> x = (p(y)
f,{x) = modeT t = -&
dy
F(x,y) = 0 Fx + Fyy' = 0 oder
x = x(t), y = y(t) (t Parameter)
, _ dy _ y /. _ dx . _ dy\
V ~ dx~ x \ ~ dt ' V ~ dt)
P = P&) y Z J^j ^£ (Winkel <p als Parameter)
, dy p sin <p + p cos <p / . dx \
dx p cos (p — p sin <p \ dipj


Inhaltsverzeichnis V =» Tabellenverzeichnis XXXIX => 1 Arithmetik 1 => 2 Funktionen und ihre Darstellung 48 => 3 Geometrie 131 =* 4 Lineare Algebra 259 => 5 Algebra und Diskrete Mathematik 295 => 6 Differentialrechnung 394 =>> 7 Unendliche Reihen 420 =» 8 Integralrechnung 444 => 9 Differentialgleichungen 504 ==> 10 Variationsrechnung 572 =» 11 Lineare Integralgleichungen 583 =>> 12 Funktionalanalysis 616 ==> 13 Vektoranalysis und Feldtheorie 663 => 14 Funktionentheorie 693 ==? 15 Integraltransformationen 730 =* 16 Wahrscheinlichkeitsrechnung und mathematische Statistik 768 =>• 17 Dynamische Systeme und Chaos 821 =* 18 Optimierung 873 => 19 Numerische Mathematik 911 ==> 20 Computeralgebrasysteme 982 =>• 21 Tabellen 1041 =? 22 Literatur 1129 =? Stichwortverzeichnis 1145 =>•
Taschenbuch der Mathematik I.N. Bronstein K.A. Semendjajew G. Musiol H. Mühlig 6., vollständig überarbeitete und ergänzte Auflage * } Verlag Harri Deutsch
Im Auftrag des Verlages Harri Deutsch erarbeitete und erweiterte Lizenzausgabe der bis 1977 erschienenen russischen Orginalausgabe: I. N. Bronstein, K. A. Semendjaew. Taschenbuch der Mathematik für Ingenieure und Studenten ©FIZMATLIT, Moskau Bibliografische Information Der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über (http://dnb.ddb.de) abrufbar. ISBN-10 3-8171-2006-0 (Buch) ISBN-10 3-8171-2016-8 (Buch mit CD-ROM) ISBN-13 978-3-8171-2006-2 (Buch) ISBN-13 978-3-8171-2016-1 (Buch mit CD-ROM) Dieses Werk ist urheberrechtlich geschützt. Alle Rechte, auch die der bersetzung, des Nachdrucks und der Vervielfältigung des Buches - oder von Teilen daraus -, sind vorbehalten Kein Teil des Werkes darf ohne schriftliche Genehmigung des Verlages in irgendeiner Form (Fotokopie, Mikrofilm oder ein anderes Verfahren), auch nicht für Zwecke der Unterrichtsgestaltung, reproduziert oder unter Verwendung elektronischer Systeme verarbeitet werden. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Der Inhalt des Werkes wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren, Herausgeber und Verlag für die Richtigkeit von Angaben und Hinweisen sowie für eventuelle Druckfehler keine Haftung. 6., vollständig überarbeitete und ergänzte Auflage 2005 (c) Wissenschaftlicher Verlag Harri Deutsch GmbH, Frankfurt am Main, 2005 Druck: Clausen &; Bosse, Leck Printed in Germany
Vorwort zur sechsten Auflage Ein Nachschlagewerk und Taschenbuch der Mathematik, wie es der „BRONSTEIN" darstellt, lebt insbesondere auch dadurch, dass die Autoren von Auflage zu Auflage den sich wandelnden Anforderungen des breiten Spektrums der Nutzer gerecht werden und immer wieder den praxisnahen zeitgerechten Bezug sicherstellen Das Taschenbuch enthält einen Querschnitt der Mathematik, wie er sowohl für Studenten als auch für praktisch tätige Ingenieure, Naturwissenschaftler und Mathematiker sowie für die einschlägigen Hochschullehrer erforderlich ist Dem traditionellen Anliegen des Buches - vorgegegeben von den Erstautoren I. N. Bronstein und K. A. Semendjajew A937) - folgend, stehen Anschaulichkeit und leichte Verständlichkeit im Vordergrund, während der Forderung nach mathematischer Strenge bei der gebotenen Kürze der Darstellung nur in angemessenem, für den Ingenieur und Naturwissenschaftler im allgemeinen ausreichendem Umfange Rechnung getragen wird So sind für diesen Nutzerkreis ma- Ithematischer Sachverhalt, Voraussetzungen, Grenzen der Anwendbarkeit und Hinweise auf Besonderheiten bei Anwendungen wichtiger als strenge mathematische Beweise Für weitergehende Bedürfnisse wird jeweils auf die Fachliteratur verwiesen. Für die Neubearbeitung des Bronstein hatten sich der Verlag Harri Deutsch und die neuen Herausgeber und Autoren G. MusiOL und H. MÜHLIG im Vergleich zur ursprünglich zugrunde liegenden 3. russischen Auflage die Aufgabe gestellt, diejenigen Gebiete der Mathematik stärker zu betonen bzw. neu einzubringen, die im Hinblick auf die zunehmende mathematische Modellierung und Durchdringung technischer und naturwissenschaftlicher Prozesse sowie die Nutzung von Computern an Bedeutung gewonnen hatten. Dementsprechend wurden in die ersten Auflagen u a. die folgenden Kapitel bzw Abschnitte aufgenommen: „Computeralgebrasysteme", „Nutzung von Computern in der Numerischen Mathematik", „Dynamische Systeme und Chaos", „Funktionalanalysis", „Integralgleichungen", „Variationsrechnung", „Integraltransformationen" , „Optimierung" und „Numerische Mathematik" Das frühere Kapitel „Algebra" wurde zu „Algebra und Diskrete Mathematik" erweitert und enthält jetzt auch die Unterkapitcl „Elementare Zahlentheorie", „Kryptologie", „Algorithmen der Graphentheorie" und „Fuzzy-Logik". Auch klassische Gebiete erfuhren Ergänzungen. Das Kapitel „Geometrie" z.B. wurde durch „Geodätische Anwendungen" der Trigonometrie und durch ein ausführliches Unterkapitel „Sphärische Trigonometrie" ergänzt; in das Kapitel „Funktionentheorie" wurden die „Elliptischen Funktionen" aufgenommen, im neu gestalteten Kapitel „Wahrscheinlichkeitsrechnung und Mathematische Statistik" die Abschnitte „Monte-Carlo-Methode", „Stochastische Prozesse" und „Stochastische Ketten" und im Kapitel „Numerische Mathematik" die „Methode der finiten Elemente" und die „Schnelle Fourier-Analyse" In einzelnen Kapiteln wurden Formelübersichten in tabellarischer Form aufgenommen (besonders zur Geometrie, zur Differential- und Integralrechnung und zur Vektoranalysis und Feldtheorie), die das praktische Arbeiten erleichtern In die 6 , vollständig überarbeitete Auflage sind alle Ergänzungen und Verbesserungen eingeflossen, die nach der 4 und 5. deutschen Auflage in die 4. englischsprachige Auflage (Springer-Verlag 2004) aufgenommen worden sind Darüber hinaus wurden die Kapitel „Computeralgebrasysteme" und „Dynamische Systeme und Chaos" überarbeitet und erweitert, das letztere z.B um den Abschnitt „Rekonstruktion der Dynamik aus Zeitreihen" Das Kapitel „Algebra und Diskrete Mathematik" wurde durch den Abschnitt „Endliche Körper und Schieberegister" ergänzt Auch für die 6. Auflage steht wieder eine aktuelle elektronische Version zur Verfügung, die den kompletten Inhalt des Buches als vernetzte HTML-Struktur mit farbigen Abbildungen und einer integrierten Suchfunktion enthält Diese auf einem erweiterten Index basierende Suchmöglichkeit, die einen schnellen Zugriff auf alle Inhalte zu einem vorgegebenen Stichwort erlaubt, hat sich als ausgesprochen
II nützlich erwiesen; ebenso die Tatsache, daß der elektronische Bronstein auf allen gängigen Plattformen ohne Installation direkt von der CD-ROM läuft So bietet der Bronstein ein aufeinander abgestimmtes Angebot, das situationsunabhängig und bedürfnisorientiert einen hohen Informationsgehalt liefert. Allen Lesern und Fachkollegen, die mit ihren Stellungnahmen, Bemerkungen und Anregungen zu den vorangegangenen Auflagen des Buches die Überarbeitung erleichtert haben, möchten wir an dieser Stelle unseren herzlichen Dank sagen Besonderer Dank gebührt Frau Prof. Dr. Gabriela Szep (Budapest), die die 4. deutsche Auflage kritisch durchgesehen und zur Erarbeitung der 4. englischsprachigen Auflage wesentlich beigetragen hat Dem Verlag Harri Deutsch danken wir für die nunmehr schon traditionell gewordene effektive Zusammenarbeit Dresden, im Mai 2005 Prof. Dr. Gerhard Musiol Prof. Dr. Heiner Muhlig Koautoren Einige Kapitel und Abschnitte sind in Zusammenarbeit mit Koautoren enstanden. Kapitel bzw. Abschnitt Koautor Sphärische Trigonometrie C.4.1 bis 3.4.3) Dr. H Nickel, Dresden Sphärische Kurven C.4.4) Prof. L Marsolek, Berlin Logik, Mengenlehre, Klassische Algebraische Strukturen, Anwendungen von Gruppen, Ringe und Körper, Vektorräume E.1, 5.2, 5.3, außer 5 3 4, 5 3.7 4 bis 5.3.7.6) Dr. J. Brunner, Dresden Darstellung von Gruppen, weitere Anwendungen von Gruppen E.3.4, 5.3.5.4 bis 5.3.5.6) Prof Dr. R Reif, Dresden Zahlentheorie, Kryptologie, Graphen E.4, 5.5, 5.8) Prof Dr U Baumann, Dresden Fuzzy-Logik E.9) Prof. Dr. Gräuel, Soest Nichtlineare partielle Differentialgleichungen, Solitonen (9 2.4) Prof. Dr. ZiESCHE, Dresden Integralgleichungen A1) Dr. I. Steinert, Düsseldorf Funktionalanalysis A2) Prof Dr. M. Weber, Dresden Elliptische Funktionen A4.6) Dr. N. M. Fleischer, Moskau Dynamische Systeme und Chaos A7) PD Dr. V. Reitmann, Dresden Optimierung A8) Dr. I. Steinert, Düsseldorf Computeralgebrasysteme A9 8.4, 20 ) Prof. Dr. G. Flach, Dresden Aus dem Vorwort zur Neubearbeitung des „Bronstein" Der „BRONSTEIN" ist im deutschsprachigen Raum für Generationen von Ingenieuren und Naturwissenschaftlern und darüber hinaus für viele, die in Ausbildung und Beruf mit Anwendungen der Mathematik befaßt sind, zu einem festen Begriff geworden. Warum also eine Neubearbeitung auf der Basis der letzten russischen Ausgabe*, die bis 1977 erschien? Abgesehen von verlagsrechtlichen Gründen wird mit der vorliegenden Neubearbeitung vor allem das Ziel verfolgt, dem „Bronstein" einen zeitgerechten praxisnahen Bezug zu geben, wie ihn zahlreiche befragte Nutzer sich wünschen Besonderer Dank gilt dem russischen Originalverlag FIZMATLIT und den Rechtsnachfolgern der Ori- *Der Neuubersetzung des russischsprachigen Originals liegt die 3 Auflage (Moskau 1953) zu Grunde
III ginalautoren dafür, daß sie die Zustimmung zur notwendigen Anpassung an die heutigen Ansprüche des Nutzerkreises und der damit verbundenen freien Überarbeitung gaben. Dresden, im Juni 1993 Prof. Dr. Gerhard Musiol Prof. Dr. Heiner Mühlig
Inhaltsverzeichnis V Inhaltsverzeichnis Tabellenverzeichnis XXXIX 1 Arithmetik 1 1.1 Elementare Rechenregeln . . . . . 1 1 1 1 Zahlen 1 1.1.1.1 Natürliche, ganze und rationale Zahlen 1 1.1.1.2 Irrationale und transzendente Zahlen . . 1 1.1.1.3 Reelle Zahlen 2 1.1.1.4 Kettenbrüche 3 1115 Kommensurabilität 4 1.1.2 Beweismethoden. ... . . 5 1.1 2.1 Direkter Beweis . . . 5 1.1.2.2 Indirekter Beweis oder Beweis durch Widerspruch 5 112 3 Vollständige Induktion . . . ... . 5 1.1.2.4 Konstruktiver Beweis . . . 6 113 Summen und Produkte .... 6 1.1.3.1 Summen . . 6 1 1.3.2 Produkte 7 1.1.4 Potenzen, Wurzeln, Logarithmen 8 114 1 Potenzen . . 8 1.1.4.2 Wurzeln 8 114 3 Logarithmen 9 114 4 Spezielle Logarithmen . . . . . 9 1 1.5 Algebraische Ausdrücke . . . 10 115 1 Definitionen 10 1.1.5.2 Einteilung der algebraischen Ausdrücke 11 1 1.6 Ganzrationale Ausdrücke . . . . • 11 1.16.1 Darstellung in Form eines Polynoms 11 1.1.6.2 Zerlegung eines Polynoms in Faktoren 11 1.1.6.3 Spezielle Formeln 12 1.1 6.4 Binomischer Satz 12 116 5 Bestimmung des größten gemeinsamen Teilers zweier Polynome . 14 1.1.7 Gebrochenrationale Ausdrücke 14 1.1.7.1 Rückführung auf die einfachste Form . . 14 117 2 Bestimmung des ganzrationalen Anteils 15 1 1 7.3 Partialbruchzerlegung 15 1.1.7.4 Umformung von Proportionen 17 1.18 Irrationale Ausdrücke .... ... ... 17 1.2 Endliche Reihen 18 12 1 Definition der endlichen Reihe .... . . . 18 1 2.2 Arithmetische Reihen 18 1.2 3 Geometrische Reihe ... 19 1.2.4 Spezielle endliche Reihen 19 1.2.5 Mittelwerte 19 1.2.5.1 Arithmetisches Mittel 19 1 2 5.2 Geometrisches Mittel 20 1.2.5.3 Harmonisches Mittel 20 1.2 5 4 Quadratisches Mittel .... .... 20
VI Inhaltsverzeichnis 1 2.5 5 Vergleich der Mittelwerte für zwei positive Größen a und b . . 20 1 3 Finanzmathematik . . . . 21 1.3.1 Prozentrechnung 21 13 2 Zinseszinsrechnung . . 22 1 3.3 Tilgungsrechnung . 23 1 3.3.1 Tilgung 23 1.3.3.2 Gleiche Tilgungsraten 23 1 3.3 3 Gleiche Annuitäten ... 24 1.3.4 Rentenrechnung 24 1.3 4.1 Rente . . 24 1.3.4.2 Nachschüssig konstante Rente 25 1.3 4.3 Kontostand nach n Rentenzahlungen . 25 1.3.5 Abschreibungen ... ... . 26 1.4 Ungleichungen 28 1.4.1 Reine Ungleichungen . . . 28 1 4.1 1 Definitionen 28 14 12 Eigenschaften der Ungleichungen vom Typ I und II . . 29 14 2 Spezielle Ungleichungen 30 1.4 2.1 Dreiecksungleichung . .... 30 1.4.2.2 Ungleichungen für den Absolutbetrag der Differenz zweier Zahlen . 30 1 4.2 3 Ungleichung für das arithmetische und das geometrische Mittel 30 1 4.2.4 Ungleichung für das arithmetische und das quadratische Mittel . 30 1 4.2 5 Ungleichungen für verschiedene Mittelwerte zweier reeller Zahlen . 30 14.2.6 Bernoullische Ungleichung . 31 14 2 7 Binomische Ungleichung . . . 31 14 2 8 Cauchy-Schwarzsche Ungleichung . . . . 31 1 4.2 9 Tschebyscheffsche Ungleichung . . 31 1 4 2 10 Verallgemeinerte Tschebyscheffsche Ungleichung . . 32 142 11 Höldersche Ungleichung 32 14.2.12 Minkowskische Ungleichung 33 1 4.3 Lösung von Ungleichungen 1. und 2. Grades . . 33 1 4.3.1 Allgemeines . . 33 1.4.3.2 Ungleichungen 1 Grades . . 33 1.4.3.3 Ungleichungen 2. Grades . . 33 1 4.3 4 Allgemeiner Fall der Ungleichung 2. Grades 34 1.5 Komplexe Zahlen . . .34 1.5.1 Imaginäre und komplexe Zahlen . . 34 1.5.1.1 Imaginäre Einheit 34 15 12 Komplexe Zahlen . . . . 34 1.5.2 Geometrische Darstellung. .... . 35 1 5.2.1 Vektordarstellung . . 35 1.5.2.2 Gleichheit komplexer Zahlen 35 1.5.2.3 Trigonometrische Form der komplexen Zahlen 35 1.5 2 4 Exponentialform einer komplexen Zahl .... 36 1 5 2.5 Konjugiert komplexe Zahlen . . 36 1.5.3 Rechnen mit komplexen Zahlen 36 1.5 3 1 Addition und Subtraktion . ... 36 1.5.3.2 Multiplikation 37 1.5.3.3 Division 37 1.5 3.4 Allgemeine Regeln für die vier Grundrechenarten 38 1 5.3 5 Potenzieren einer komplexen Zahl . . .... 38 1.5 3 6 Radizieren oder Ziehen der n-ten Wurzel aus einer komplexen Zahl 38
Inhaltsverzeichnis VII 1.6 Algebraische und transzendente Gleichungen ... .... ... 38 1.6.1 Umformung algebraischer Gleichungen auf die Normalform 38 1.6.1.1 Definitionen 38 1.6.1.2 Systeme aus n algebraischen Gleichungen 39 1.6.1.3 Scheinbare Wurzeln 39 1.6.2 Gleichungen 1. bis 4. Grades 39 1 6.2.1 Gleichungen 1. Grades (lineare Gleichungen) . . 39 1.6.2.2 Gleichungen 2. Grades (quadratische Gleichungen) 40 1 6.2 3 Gleichungen 3. Grades (kubische Gleichungen) 40 1.6.2.4 Gleichungen 4. Grades 42 1 6.2.5 Gleichungen 5. und höheren Grades 43 1.6.3 Gleichungen n-ten Grades 43 1.6.3.1 Allgemeine Eigenschaften der algebraischen Gleichungen . . . . 43 1.6.3.2 Gleichungen mit reellen Koeffizienten 44 1.6 4 Rückführung transzendenter Gleichungen auf algebraische Gleichungen ... 45 1.6.4.1 Definition 45 1.6.4.2 Exponentialgleichungen 46 1.6.4.3 Logarithmische Gleichungen 46 1.6.4.4 Trigonometrische Gleichungen . 46 1.6 4 5 Gleichungen mit Hyperbelfunktionen ... ... 47 Funktionen und ihre Darstellung 48 2.1 Funktionsbegriff 48 2 1.1 Definition der Funktion . . . . 48 2.1.1.1 Funktion 48 2.1.1.2 Reelle Funktion 48 2 113 Funktion von mehreren Veränderlichen 48 2.1.1.4 Komplexe Funktion 48 2.1 1.5 Weitere Funktionen 48 2.1.1.6 Funktionale 48 2.1.1.7 Funktion und Abbildung 49 2.1.2 Methoden zur Definition einer reellen Funktion 49 2 1.2 1 Angabe einer Funktion . . 49 2.1.2.2 Analytische Darstellung reeller Funktionen 49 2 1.3 Einige Funktionstypen 50 2.1.3 1 Monotone Funktionen 50 2.1.3.2 Beschränkte Funktionen .... . . . t 51 2.1.3 3 Extremwerte von Funktionen 51 2.1.3.4 Gerade Funktionen 51 2.1.3.5 Ungerade Funktionen 51 2.1.3.6 Darstellung mit Hilfe gerader und ungerader Funktionen 52 2.1.3.7 Periodische Funktionen 52 2.1.3.8 Inverse oder Umkehrfunktionen 52 2.1.4 Grenzwert von Funktionen 53 2.1.4.1 Definition des Grenzwertes einer Funktion 53 2.1.4 2 Zurückführung auf den Grenzwert einer Folge ... 53 2.1.4.3 Konvergenzkriterium von Cauchy 53 2.1.4 4 Unendlicher Grenzwert einer Funktion 54 2.1.4.5 Linksseitiger und rechtsseitiger Grenzwert einer Funktion . ... 54 2 1.4.6 Grenzwert einer Funktion für x gegen unendlich 54 2.14.7 Sätze über Grenzwerte von Funktionen 55 2.1.4.8 Berechnung von Grenzwerten ... 55
Inhaltsverzeichnis 2.14.9 Größenordnung von Funktionen und Landau-Symbole 57 2.1.5 Stetigkeit einer Funktion .... . . 58 2.1.5.1 Stetigkeit und Unstetigkeitsstelle . 58 2.1.5.2 Definition der Stetigkeit 59 2 1 5.3 Häufig auftretende Arten von Unstetigkeiten 59 2.1.5.4 Stetigkeit und Unstetigkeitspunkte elementarer Funktionen . . 60 2 1.5.5 Eigenschaften stetiger Funktionen 61 2.2 Elementare Funktionen . . 62 2.2.1 Algebraische Funktionen 62 2 2.1.1 Ganzrationale Funktionen (Polynome) 62 2.2 1 2 Gebrochenrationale Funktionen 62 2.2.1.3 Irrationale Funktionen . 63 2.2.2 Transzendente Funktionen . . . . 63 2.2 2 1 Exponentialfunktionen . . . 63 2.2.2.2 Logarithmische Funktionen 63 2.2.2.3 Trigonometrische Funktionen 63 2 2 2.4 Inverse trigonometrische Funktionen 63 2.2.2.5 Hyperbelfunktionen 63 2 2.2.6 Inverse Hyperbelfunktionen 63 2 2.3 Zusammengesetzte Funktionen 63 2.3 Polynome . . . 64 2.3.1 Lineare Funktion ... . 64 2.3.2 Quadratisches Polynom 64 2.3 3 Polynom 3 Grades 64 2.3 4 Polynom n-ten Grades 65 2.3.5 Parabel n-ter Ordnung 66 2.4 Gebrochenrationale Funktionen 66 2 4.1 Spezielle gebrochen lineare Funktion 66 2.4.2 Gebrochenlineare Funktion . . . . . 66 2.4.3 Kurve 3. Ordnung, Typ I 67 2.4.4 Kurve 3. Ordnung, Typ II . . 67 2.4.5 Kurve 3. Ordnung, Typ III . 69 2.4.6 Reziproke Potenz 70 2.5 Irrationale Funktionen . 71 2.5.1 Quadratwurzel aus einem linearen Binom 71 2.5.2 Quadratwurzel aus einem quadratischen Polynom 71 2.5.3 Potenzfuntyion .... . . 71 2.6 Exponentialfunktionen und logarithmische Funktionen . 72 2.6.1 Exponentialfunktion 72 2.6.2 Logarithmische Funktionen 73 2.6.3 Gaußsche Glockenkurve .... ... . 73 2.6.4 Exponentialsumme 73 2.6.5 Verallgemeinerte Gaußsche Glockenkurve .... . . . .74 2.6.6 Produkt aus Potenz- und Exponentialfunktion 75 2.7 Trigonometrische Funktionen (Winkelfunktionen) 76 2.7.1 Grundlagen 76 2.7.1.1 Definition und Darstellung . . . . 76 2.7.1.2 Wertebereiche und Funktionsverläufe ... 78 2.7.2 Wichtige Formeln für trigonometrische Funktionen 80 2.7.2.1 Beziehungen zwischen den trigonometrischen Funktionen . 80 2.7.2.2 Trigonometrische Funktionen der Summe und der Differenz zweier Winkel (Additionstheoreme) . . 80
Inhaltsverzeichnis IX 2.7.2.3 Trigonometrische Funktionen für Winkelvielfache 81 2.7.2 4 Trigonometrische Funktionen des halben Winkels .... . . . 82 2.7.2.5 Summen und Differenzen zweier trigonometrischer Funktionen . . 82 2.7.2.6 Produkte trigonometrischer Funktionen 82 2 7 2.7 Potenzen trigonometrischer Funktionen 83 2.7.3 Beschreibung von Schwingungen 83 2.7.3.1 Problemstellung 83 2.7.3.2 Superposition oder Überlagerung von Schwingungen 83 2.7.3.3 Vektordiagramm für Schwingungen 84 2.7.3.4 Dämpfung von Schwingungen 84 2 8 Zyklometrische Funktionen (Arkusfunktionen) 85 2.8.1 Definition der zyklometrischen Funktionen 85 2.8.2 Zurückführung auf die Hauptwerte 85 2.8.3 Beziehungen zwischen den Hauptwerten 86 2.8.4 Formeln für negative Argumente 87 2.8.5 Summe und Differenz von aresin x und aresin y 87 2.8.6 Summe und Differenz von arecos x und arecos y 87 2.8.7 Summe und Differenz von aretan x und aretan y 87 2.8.8 Spezielle Beziehungen für aresin x, arecos x, aretan x 88 2.9 Hyperbelfunktionen 88 2 9.1 Definition der Hyperbelfunktionen 88 2.9.2 Graphische Darstellung der Hyperbelfunktionen 89 2.9.2.1 Hyperbelsinus 89 2.9.2.2 Hyperbelkosinus 89 2.9.2.3 Hyperbeltangens 90 2.9.2.4 Hyperbelkotangens 90 2.9.3 Wichtige Formeln für Hyperbelfunktionen 90 2.9.3 1 Hyperbelfunktionen einer Variablen ... 90 2.9.3.2 Darstellung einer Hyperbelfunktion durch eine andere gleichen Argumentes . . . 90 2.9.3.3 Formeln für negative Argumente 90 2.9.3.4 Hyperbelfunktionen der Summe und der Differenz zweier Argumente (Additionstheoreme) 91 2.9.3.5 Hyperbelfunktionen des doppelten Arguments 91 2.9.3.6 Formel von Moivre für Hyperbelfunktionen . 91 2.9 3.7 Hyperbelfunktionen des halben Arguments 91 2.9.3.8 Summen und Differenzen von Hyperbelfunktionen 91 2 9.3.9 Zusammenhang zwischen den Hyperbel- und den trigonometrischen Funktionen mit Hilfe komplexer Argumente 92 2 10 Areafunktionen 92 2 101 Definitionen . 92 2.10.1.1 Areasinus 92 2.10.1.2 Areakosinus . . . 92 2.10.1 3 Areatangens 93 2.10 1.4 Areakotangens 93 2.10 2 Darstellung der Areafunktionen durch den natürlichen Logarithmus 93 2.10.3 Beziehungen zwischen den verschiedenen Areafunktionen 94 2.10.4 Summen und Differenzen von Areafunktionen 94 2.10 5 Formeln für negative Argumente 94 2 11 Kurven dritter Ordnung 95 2.11.1 Semikubische Parabel ... . 95 2.11.2 Versiera der Agnesi . . 95
Inhaltsverzeichnis 2 11.3 Kartesisches Blatt . 96 2.11.4 Zissoide 96 2.11.5 Strophoide 96 2.12 Kurven vierter Ordnung . 97 2 12.1 Konchoide des Nikomedes 97 2 12 2 Allgemeine Konchoide ... 98 2 12.3 Pascalsche Schnecke 98 2 12 4 Kardioide . .... 99 2.12.5 Cassinische Kurven 100 2.12.6 Lemniskate ... .101 2.13 Zykloiden . . . . 101 2 13 1 Gewöhnliche Zykloide . . .... . . . 101 2.13.2 Verlängerte und verkürzte Zykloiden oder Trochoiden 102 2.13.3 Epizykloide 103 2 13.4 Hypozykloide und Astroide 104 2.13 5 Verlängerte und verkürzte Epizykloide und Hypozykloide 105 2 14 Spiralen 105 2 14 1 Archimedische Spirale . 105 2.14 2 Hyperbolische Spirale . . . . . . ... 106 2.14.3 Logarithmische Spirale 106 2.14.4 Evolvente des Kreises . . . ... 107 2 14.5 Klothoide . .107 2 15 Verschiedene andere Kurven 108 2 15.1 Kettenlinie oder Katenoide . . . ... . 108 2.15.2 Schleppkurve oder Traktrix 108 2 16 Aufstellung empirischer Kurven . 109 2 16 1 Verfahrensweise . . . . . 109 2.16.1.1 Kurvenbildervergleiche . . . 109 2.16.1.2 Rektifizierung . 109 2 161.3 Parameterbestimmung 109 2.16 2 Gebräuchlichste empirische Formeln ... .... .... 110 2.16.2.1 Potenzfunktionen 110 2 16 2 2 Exponentialfunktionen 110 2.16.2 3 Quadratisches Polynom . . 111 2 16.2.4 Gebrochenlineare Funktion 112 2 16.2.5 Quadratwurzel aus einem quadratischen Polynom . 112 2 16 2 6 Verallgemeinerte Gaußsche Glockenkurve 113 2.16 2 7 Kurve 3. Ordnung, Typ II 113 2 16 2.8 Kurve 3 Ordnung, Typ III . . 113 2.16 2.9 Kurve 3 Ordnung, Typ I 113 2.16.2.10 Produkt aus Potenz-und Exponentialfunktion ... . 114 2.16 2 11 Exponentialsumme . ... 114 2.16.2.12 Vollständig durchgerechnetes Beispiel ... 115 2.17 Skalen und Funktionspapiere 116 2.17.1 Skalen 116 2.17.2 Funktionspapiere 118 2 17.2.1 Einfach-logarithmisches Funktionspapier 118 2 17.2 2 Doppelt-logarithmisches Funktionspapier 118 2.17.2.3 Funktionspapier mit einer reziproken Skala . 118 2.17.2.4 Hinweis . . 119 2.18 Funktionen von mehreren Veränderlichen . . . . . 120 2 18 1 Definition und Darstellung . . . 120
Inhaltsverzeichnis XI 2.18.1.1 Darstellung von Funktionen mehrerer Veränderlicher 120 2.18.1.2 Geometrische Darstellung von Funktionen mehrerer Veränderlicher 120 2.18.2 Verschiedene ebene Definitionsbereiche 121 2.18.2.1 Definitionsbereich einer durch eine Menge gegebenen Funktion . . 121 2.18.2.2 Zweidimensionale Gebiete 121 2.18.2.3 Drei-und mehrdimensionale Gebiete 121 2.18.2.4 Methoden zur Definition einer Funktion 121 2.18.2.5 Formen der analytischen Darstellung einer Funktion 123 2.18.2.6 Abhängigkeit von Funktionen 124 2.18.3 Grenzwerte 125 2.18.3.1 Definition 125 2.18.3.2 Exakte Formulierung 125 2.18.3.3 Verallgemeinerung auf mehrere Veränderliche 125 2.18.3.4 Iterierte Grenzwerte 125 2 18.4 Stetigkeit 126 2.18.5 Eigenschaften stetiger Funktionen 126 2.18.5.1 Nullstellensatz von Bolzano 126 2.18.5.2 Zwischenwertsatz 126 2.18.5.3 Satz über die Beschränktheit einer Funktion 126 2.18.5.4 Satz von Weierstrass über die Existenz des größten und kleinsten Funktionswertes 126 2.19 Nomographie 127 2.19.1 Nomogramme 127 2.19.2 Netztafeln 127 2.19.3 Fluchtlinientafeln 128 2.19.3.1 Fluchtlinientafeln mit drei geraden Skalen durch einen Punkt . . . 128 2.19.3.2 Fluchtlinientafeln mit zwei parallelen und einer dazu geneigten geradlinigen Skala 129 2.19.3.3 Fluchtlinientafeln mit zwei parallelen, geradlinigen Skalen und einer Kurvenskala 129 2.19.4 Netztafeln für mehr als drei Veränderliche 130 3 Geometrie 131 3.1 Planimetrie 131 3.1.1 Grundbegriffe 131 3.1.1.1 Punkt, Gerade, Strahl, Strecke 131 3.1.1.2 Winkel 131 3.113 Winkel an zwei sich schneidenden Geraden 132 3.1.1.4 Winkelpaare an geschnittenen Parallelen 132 3.1.1.5 Winkel im Gradmaß und im Bogenmaß 133 3.1.2 Geometrische Definition der Kreis-und Hyperbel-Funktionen 133 3.1.2.1 Definition der Kreis-oder trigonometrischen Funktionen 133 3.1.2.2 Geometrische Definition der Hyperbelfunktionen 134 3.1.3 Ebene Dreiecke 135 3.1.3.1 Aussagen zu ebenen Dreiecken 135 3.1.3.2 Symmetrie 136 3.1.4 Ebene Vierecke 138 3.1.4.1 Parallelogramm 138 3.1.4.2 Rechteck und Quadrat 138 3.1.4.3 Rhombus oder Raute 138 3.1.4.4 Trapez 138 3.1.4.5 Allgemeines Viereck 139
XII Inhaltsverzeichnis 3 1.4.6 Sehnenviereck 139 3 1.4.7 Tangentenviereck . 140 3 1.5 Ebene Vielecke oder Polygone 140 3.1.5.1 Allgemeines Vieleck 140 3 1 5.2 Regelmäßige konvexe Vielecke 140 3 1.5.3 Einige regelmäßige konvexe Vielecke .. 141 3 1.6 Ebene Kreisfiguren . ... ... 142 3 1.6 1 Kreis ... .142 3.1.6.2 Kreisabschnitt (Kreissegment) und Kreisausschnitt (Kreissektor) 144 3.1 6 3 Kreisring .... . . 144 3.2 Ebene Trigonometrie 145 3.2.1 Dreiecksberechnungen . 145 3.2.1.1 Berechnungen in rechtwinkligen ebenen Dreiecken . . . 145 3.2.1.2 Berechnungen in ebenen schiefwinkligen Dreiecken 145 3.2.2 Geodätische Anwendungen 148 3.2.2.1 Geodätische Koordinaten . . . . . 148 3.2.2.2 Winkel in der Geodäsie 149 3.2.2.3 Vermessungstechnische Anwendungen 151 3.3 Stereometrie . 154 3 3.1 Geraden und Ebenen im Raum 154 3.3.2 Kanten, Ecken, Raumwinkel 155 3.3.3 Polyeder 156 3 3.4 Körper, die durch gekrümmte Flächen begrenzt sind 159 3.4 Sphärische Trigonometrie 163 3 4 1 Grundbegriffe der Geometrie auf der Kugel 163 3.4.1.1 Kurven, Bogen und Winkel auf der Kugel 163 3.4.1.2 Spezielle Koordinatensysteme 165 3.4.1.3 Sphärisches Zweieck 166 3.4 1.4 Sphärisches Dreieck 166 3.4.1.5 Polardreieck 167 3.4 1.6 Eulersche und Nicht-Eulersche Dreiecke 168 3.4.1.7 Dreikant 168 3.4.2 Haupteigenschaften sphärischer Dreiecke . 168 3.4.2.1 Allgemeine Aussagen . . .... 168 3.4.2.2 Grundformeln und Anwendungen 169 3.4.2.3 Weitere Formeln 172 3 4 3 Berechnung sphärischer Dreiecke .... .... . 173 3.4.3.1 Grundaufgaben, Genauigkeitsbetrachtungen 173 3.4.3.2 Rechtwinklig sphärisches Dreieck 173 3.4.3.3 Schiefwinklig sphärisches Dreieck 175 3.4.3.4 Sphärische Kurven . ... 179 3 5 Vektoralgebra und analytische Geometrie ... . 185 3.5.1 Vektoralgebra ! 185 3.5.1 1 Definition des Vektors 185 3.5.1.2 Rechenregeln 186 3.5.1.3 Skalarprodukt und Vektorprodukt .... . . 188 3.5.1.4 Mehrfache multiplikative Verknüpfungen 190 3.5.1.5 Vektorielle Gleichungen 192 3.5 1.6 Kovariante und kontravariante Koordinaten eines Vektors . 193 3 5.17 Geometrische Anwendungen der Vektoralgebra .... . 194 3.5.2 Analytische Geometrie der Ebene 195 3.5 2.1 Ebene Koordinatensysteme . . 195
Inhaltsverzeichnis XIII 3.5.2.2 Koordinatentransformationen 196 3 5 2.3 Spezielle Punkte in der Ebene 197 3.5.2.4 Flächeninhalte 199 3.5.2.5 Gleichung einer Kurve 199 3.5.2.6 Gerade 199 3 5.2.7 Kreis 202 3528 Ellipse 204 3.5.2.9 Hyperbel 206 3.5.2.10 Parabel 208 3.5.2.11 Kurven 2. Ordnung (Kegelschnitte) 210 3.5 3 Analytische Geometrie des Raumes 213 3.5.3.1 Grundlagen, räumliche Koordinatensysteme ... . 213 3.5 3.2 Transformation rechtwinkliger Koordinaten 217 3.5.3.3 Teilung einer Strecke . . 219 3.5.3.4 System aus vier Punkten 219 3.5.3.5 Gleichung einer Fläche 219 3.5.3.6 Ebenen im Raum 220 3.5 3 7 Geraden im Raum 223 3.5.3.8 Schnittpunkte und Winkel von Ebenen und Geraden 225 3.5.3.9 Flächen 2. Ordnung, Gleichungen in Normalform 226 3.5.3.10 Flächen 2. Ordnung, allgemeine Theorie 230 3 6 Differentialgeometrie 232 3.6.1 Ebene Kurven 232 3.6.1.1 Definitionen ebener Kurven . . . 232 3.6.1.2 Lokale Elemente einer Kurve . . . . 232 3.6.1.3 Ausgezeichnete Kurvenpunkte und Asymptoten 238 3.6.1.4 Allgemeine Untersuchung einer Kurve nach ihrer Gleichung .... 243 3 6 15 Evoluten und Evolventen 244 3.6 1.6 Einhüllende von Kurvenscharen 244 3 6.2 Raumkurven 245 3.6.2.1 Definitionen für Raumkurven 245 3.6.2.2 Begleitendes Dreibein 246 3.6.2 3 Krümmung und Windung 248 3 6.3 Flächen 251 3.6.3.1 Definitionen für Flächen . . .... 251 3.6.3.2 Tangentialebene und Flächennormale 252 3 6 3 3 Linienelement auf einer Fläche 253 3.6.3.4 Krümmung einer Fläche 255 3.6.3.5 Regelflächen und abwickelbare Flächen 257 3.6.3.6 Geodätische Linien auf einer Fläche 258 Lineare Algebra 259 41 Matrizen 259 4.1.1 Begriff der Matrix 259 4.1.2 Quadratische Matrizen 260 4.1 3 Vektoren . . 261 4.1.4 Rechenoperationen mit Matrizen . . .... 262 4.1.5 Rechenregeln für Matrizen 265 4 1.6 Vektor- und Matrizennorm . . . . 266 4 16 1 Vektornormen 266 4.1.6.2 Matrizennormen 267 4.2 Determinanten 267
XIV Inhaltsverzeichnis 4.2.1 Definitionen 267 4.2.2 Rechenregeln für Determinanten 268 4 2.3 Berechnung von Determinanten 269 4.3 Tensoren 270 4.3.1 Transformation des Koordinatensystems 270 4.3.2 Tensoren in kartesischen Koordinaten 270 4.3.3 Tensoren mit speziellen Eigenschaften 272 4.3.3.1 Tensoren 2. Stufe 272 4.3 3.2 Invariante Tensoren 273 4.3.4 Tensoren in krummlinigen Koordinatensystemen 274 4.3.4.1 Kovariante und kontravariante Basisvektoren 274 4.3.4.2 Kovariante und kontravariante Koordinaten von Tensoren 1. Stufe 274 4.3.4 3 Kovariante, kontravariante und gemischte Koordinaten von Tensoren 2. Stufe 275 4.3.4.4 Rechenregeln 276 4.3.5 Pseudotensoren 277 4.3.5.1 Punktspiegelung am Koordinatenursprung 277 4.3.5.2 Einfuhrung des Begriffs Pseudotensor 278 4.4 Lineare Gleichungssysteme 279 4.4.1 Lineare Systeme, Austauschverfahren 279 4.4.1.1 Lineare Systeme 279 4.4.1.2 Austauschverfahren 279 4.41.3 Lineare Abhängigkeiten 280 4.4.1.4 Invertierung einer Matrix 280 4.4 2 Lösung linearer Gleichungssysteme 280 4.4.2.1 Definition und Lösbarkeit 280 4.4.2.2 Anwendung des Austauschverfahrens 282 4.4 2.3 Cramersche Regel 283 4.4.2.4 Gaußscher Algorithmus 284 4.4.3 Überbestimmte lineare Gleichungssysteme 285 4.4.3.1 Überbestimmte lineare Gleichungssysteme und lineare Quadratmittelprobleme 285 4.4.3.2 Hinweise zur numerischen Lösung linearer Quadratmittelprobleme 286 4.5 Eigenwertaufgaben bei Matrizen 286 4.5.1 Allgemeines Eigenwertproblem 286 4.5 2 Spezielles Eigenwertproblem 286 4.5.2.1 Charakteristisches Polynom 286 4.5.2.2 Reelle symmetrische Matrizen, Ähnlichkeitstransformationen . . . 288 4.5.2.3 Hauptachsentransformation quadratischer Formen 289 4.5.2.4 Hinweise zur numerischen Bestimmung von Eigenwerten .... 291 4.5.3 Singulärwertzerlegung 293 5 Algebra und Diskrete Mathematik 295 5.1 Logik 295 5.1.1 Aussagenlogik 295 5 1.2 Ausdrücke der Prädikatenlogik 298 5.2 Mengenlehre 299 5.2.1 Mengenbegriff, spezielle Mengen 299 5 2.2 Operationen mit Mengen 301 5.2.3 Relationen und Abbildungen 303 5.2.4 Äquivalenz- und Ordnungsrelationen 306 5.2.5 Mächtigkeit von Mengen 307
Inhaltsverzeichnis XV Klassische algebraische Strukturen 308 5.3.1 Operationen . 308 5.3.2 Halbgruppen 308 5 3.3 Gruppen 309 5.3.3.1 Definition und grundlegende Eigenschaften . . 309 5.3.3.2 Untergruppen und direkte Produkte 310 5 3.3 3 Abbildungen zwischen Gruppen .. 312 5.3.4 Darstellung von Gruppen . . 313 5.3.4.1 Definitionen 313 5.3.4.2 Spezielle Darstellungen .... 313 5.3.4.3 Direkte Summe von Darstellungen 314 5.3.4.4 Direktes Produkt von Darstellungen 315 5.3 4 5 Reduzible und irreduzible Darstellungen 315 5 3 4.6 Erstes Schursches Lemma 316 5 3.4.7 Clebsch-Gordan-Reihe 316 5.3.4.8 Irreduzible Darstellung der symmetrischen Gruppe Sm 316 5.3.5 Anwendungen von Gruppen . . 317 5 3 5.1 Symmetrieoperationen, Symmetrieelemente 317 5.3 5.2 Symmetriegruppen 317 5 3 5 3 Symmetrieoperationen bei Molekülen 318 5.3.5.4 Symmetriegruppen in der Kristallographie 320 5.3.5.5 Symmetriegruppen in der Quantenmechanik 322 5.3.5.6 Weitere Anwendungsbeispiele aus der Physik 322 5 3 6 Ringe und Körper . . . 323 5 3 6 1 Definitionen . . 323 5 3.6.2 Unterringe, Ideale 324 5 3 6 3 Homomorphismen, Isomorphismen, Homomorphiesatz 324 5 3.6 4 Endliche Körper und Schieberegister . 324 5 3.7 Vektorräume . 327 53 7 1 Definition 327 5.3.7 2 Lineare Abhängigkeit 327 5.3.7.3 Lineare Abbildungen ... 327 5.3 7.4 Unterräume, Dimensionsformel 328 5 3 7.5 Euklidische Vektorräume, Euklidische Norm 328 5 3.7.6 Lineare Operatoren in Vektorräumen 329 Elementare Zahlentheorie 330 5.4.1 Teilbarkeit 330 5.4.1.1 Teilbarkeit und elementare Teilbarkeitsregeln 330 5.4.1.2 Primzahlen 330 5.4 1.3 Teilbarkeitskriterien 332 5.4.1 4 Größter gemeinsamer Teiler und kleinstes gemeinsames Vielfaches 333 5 4 15 Fibonacci-Zahlen 334 5.4.2 Lineare Diophantische Gleichungen . 335 5.4.3 Kongruenzen und Restklassen 337 5.4.4 Sätze von Fermat, Euler und Wilson 341 5.4.5 Codierungen 341 5.4.5 1 Prufzeichenverfahren 342 5 4 5.2 Fehlerkorrigierende Codes . 343 Kryptologie . ... . . . . 346 5.5.1 Aufgabe der Kryptologie 346 5 5 2 Kryptosysteme 346 5.5.3 Mathematische Präzisierung 346
XVI Inhaltsverzeichnis 5.5.4 Sicherheit von Kryptosystemen 347 5.5.4.1 Methoden der klassischen Kryptologie 347 5.5.4.2 Affine Substitutionen 348 5.5.4.3 Vigenere-ChifTre 348 5.5.4.4 Matrixsubstitutionen 348 5.5.5 Methoden der klassischen Kryptoanalysis 349 5.5.5.1 Statistische Analyse 349 5.5.5.2 Kasiski-Priedman-Test 349 5.5.6 One-Time-Tape 350 5.5.7 Verfahren mit öffentlichem Schlüssel 350 5.5.7.1 Konzept von Diffie und Hellman 350 5.5.7.2 Einwegfunktionen 351 5 5.7.3 RSA-Verfahren 351 5 5.8 AES-Algorithmus (Advanced Encryption Standard) 352 5.5.9 IDEA-Algorithmus (International Data Encryption Algorithm) 352 5.6 Universelle Algebra 353 5.6.1 Definition 353 5.6.2 Kongruenzrelationen, Faktoralgebren 353 5.6.3 Homomorphismen 353 5.6.4 Homomorphiesatz 354 5.6.5 Varietäten 354 5.6.6 Termalgebren, freie Algebren 354 5.7 Boolesche Algebren und Schaltalgebra 355 5.7.1 Definition 355 5.7.2 Dualitätsprinzip 355 5.7.3 Endliche Boolesche Algebren 356 5.7.4 Boolesche Algebren als Ordnungen 356 5.7.5 Boolesche Funktionen, Boolesche Ausdrücke 356 5.7.6 Normalformen 358 5.7.7 Schaltalgebra 358 5.8 Algorithmen der Graphentheorie 361 5.8.1 Grundbegriffe und Bezeichnungen 361 5.8.2 Durchlaufungen von ungerichteten Graphen 364 5.8.2.1 Kantenfolgen 364 5.8.2.2 Eulersche Linien 365 5.8.2.3 Hamilton-Kreise 366 5.8.3 Bäume und Gerüste 367 5.8.3.1 Bäume 367 5.8.3.2 Gerüste 368 5.8.4 Matchings 369 5.8.5 Planare Graphen 370 5.8.6 Bahnen in gerichteten Graphen 371 5.8.7 Transportnetze 372 5.9 Fuzzy-Logik 374 5.9.1 Grundlagen der Fuzzy-Logik 374 5.9.1.1 Interpretation von Fuzzy-Mengen (Unscharfe Mengen) 374 5.9.1.2 Zugehörigkeitsfunktionen 375 5.9.1.3 Fuzzy-Mengen 377 5.9.2 Verknüpfungen unscharfer Mengen 378 5.9.2.1 Konzept für eine Verknüpfung (Aggregation) unscharfer Mengen . 379 5.9.2.2 Praktische Verknüpfungen unscharfer Mengen 379 5.9.2.3 Kompensatorische Operatoren 382
Inhaltsverzeichnis XVII 5.9 2.4 Erweiterungsprinzip 382 5 9 2.5 Unscharfe Komplementfunktion 382 5.9.3 Fuzzy-wertige Relationen 383 5.9.3.1 Fuzzy-Relationen 383 5.9.3.2 Fuzzy-Relationenprodukt Ro S 385 5.9.4 Fuzzy-Inferenz 386 5.9.5 Defuzzifizierungsmethoden . . . . 388 5.9.6 Wissensbasierte Fuzzy-Systeme . 389 5.9.6.1 Methode Mamdani ... 389 5.9.6.2 Methode Sugeno 389 5 963 Kognitive Systeme 390 5.9 6.4 Wissensbasiertes Interpolationssystem . . . 392 6 Differentialrechnung 394 6.1 Differentiation von Funktionen einer Veränderlichen . .... . . 394 6.1.1 Differentialquotient 394 6.1.2 Differentiationsregeln für Funktionen einer Veränderlicher 395 6 1.2.1 Ableitungen elementarer Funktionen 395 6.1.2.2 Grundregeln für das Differenzieren 395 6 13 Ableitungen höherer Ordnung .... 401 6 1.31 Definition der Ableitungen höherer Ordnung 401 6.1.3.2 Ableitungen höherer Ordnung der einfachsten Funktionen 401 6 13 3 Leibnizsche Regel 401 6 1 3.4 Höhere Ableitungen von Funktionen in Parameterdarstellung . . . 402 6.13.5 Ableitungen höherer Ordnung der inversen Funktion . ... 402 6 14 Hauptsätze der Differentialrechnung 403 6 1.4.1 Monotoniebedingungen 403 6 14 2 Satz von Fermat 403 6.1.4.3 Satz von Rolle 404 6.1.4.4 Mittelwertsatz der Differentialrechnung . . . . . ... 404 6 1 4.5 Satz von Taylor für Punktionen von einer Veränderlichen 405 6.1 4.6 Verallgemeinerter Mittelwertsatz der Differentialrechnung 405 6 15 Bestimmung von Extremwerten und Wendepunkten . . . . . 405 6 15 1 Maxima und Minima . . . . . . 405 6.1.5 2 Notwendige Bedingung für die Existenz eines relativen Extremwertes 406 6.1.5 3 Relative Extremwerte einer differenzierbaren, explizit gegebenen Punktion y = f(x) . 406 6.1.5.4 Bestimmung der globalen Extremwerte 407 6.1.5.5 Bestimmung der Extremwerte einer implizit gegebenen Funktion 407 6 2 Differentiation von Punktionen von mehreren Veränderlichen 408 6.2 1 Partielle Ableitungen 408 6 2.1.1 Partielle Ableitung einer Funktion 408 6 2 1.2 Geometrische Bedeutung bei zwei Veränderlichen 408 6.2 1 3 Begriff des Differentials 408 6.2.1.4 Haupteigenschaften des Differentials 409 6.2.1.5 Partielles Differential 410 6 2.2 Vollständiges Differential und Differentiale höherer Ordnung 410 6.2 2 1 Begriff des vollständigen Differentials einer Funktion von mehreren Veränderlichen (totales Differential) . .. .410 6 2 2.2 Ableitungen und Differentiale höherer Ordnungen 411 6.2.2.3 Satz von Taylor für Funktionen von mehreren Veränderlichen . . 412 6 2 3 Differentiationsregeln für Punktionen von mehreren Veränderlichen . . 413
XVIII Inhaltsverzeichnis 6.2.3.1 Differentiation von zusammengesetzten Funktionen 413 6.2.3.2 Differentiation impliziter Funktionen ... 413 6 2.4 Substitution von Variablen in Differentialausdrücken und Koordinatentransformationen .... ... 415 6.2.4.1 Funktion von einer Veränderlichen 415 6 2.4 2 Funktion zweier Veränderlicher ... . 416 6.2.5 Extremwerte von Funktionen von mehreren Veränderlichen 417 6.2.5.1 Definition 417 6.2.5 2 Geometrische Bedeutung 417 6.2.5.3 Bestimmung der Extremwerte einer Funktion von zwei Veränderlichen . . 418 6.2.5.4 Bestimmung der Extremwerte einer Funktion von n Veränderlichen 418 6.2.5.5 Lösung von Approximationsaufgaben 418 6.2.5.6 Bestimmung der Extremwerte unter Vorgabe von Nebenbedingungen 419 7 Unendliche Reihen 420 7.1 Zahlenfolgen 420 7 1.1 Eigenschaften von Zahlenfolgen . . . 420 7.1.1.1 Definition der Zahlenfolge .420 7.1.1.2 Monotone Zahlenfolgen 420 7.1.13 Beschränkte Folgen . . 420 7 1.2 Grenzwerte von Zahlenfolgen .... . . 421 7.2 Reihen mit konstanten Gliedern . 422 7.2.1 Allgemeine Konvergenzsätze ... . 422 7.2.11 Konvergenz und Divergenz unendlicher Reihen 422 7.2.1.2 Allgemeine Sätze über die Konvergenz von Reihen 423 7.2.2 Konvergenzkriterien für Reihen mit positiven Gliedern . 423 7 2 2.1 Vergleichskriterium 423 7 2.2.2 Quotientenkriterium von d'Alembert 424 7.2.2.3 Wurzelkriterium von Cauchy 424 7 2.2.4 Integralkriterium von Cauchy 425 7.2.3 Absolute und bedingte Konvergenz ... 425 7.2.3.1 Definition 425 7.2.3 2 Eigenschaften absolut konvergenter Reihen 426 7.2.3.3 Alternierende Reihen 426 7.2.4 Einige spezielle Reihen 427 7.2.4.1 Summenwerte einiger Reihen mit konstanten Gliedern 427 7.2.4.2 Bernoullische und Eulersche Zahlen .... . 428 7 2.5 Abschätzung des Reihenrestes . . . 429 7 2 5.1 Abschätzung mittels Majorante 429 7.2.5.2 Alternierende konvergente Reihen .... . 430 7.2.5 3 Spezielle Reihen . 430 7.3 Funktionenreihen . . 430 7.3.1 Definitionen . . . . . 430 7.3.2 Gleichmäßige Konvergenz . . . 431 7.3.2.1 Definition, Satz von Weierstrass . . 431 7.3.2.2 Eigenschaften gleichmäßig konvergenter Reihen 432 7.3.3 Potenzreihen . 432 7.3.3.1 Definition, Konvergenz 432 7.3.3.2 Rechnen mit Potenzreihen . . 433 7.3.3.3 Entwicklung in Taylor-Reihen, MacLaurinsche Reihe 434 7.3.4 Näherungsformeln . . 435
Inhaltsverzeichnis XIX 7 3 5 Asymptotische Potenzreihen 435 7.3.5.1 Asymptotische Gleichheit 435 7.3.5.2 Asymptotische Potenzreihen . 435 7 4 Fourier-Reihen 437 7 4 1 Trigonometrische Summe und Fourier-Reihe . 437 7.4.1.1 Grundbegriffe •. 437 7.4.1.2 Wichtigste Eigenschaften von Fourier-Reihen 438 7 4 2 Koeffizientenbestimmung für symmetrische Funktionen 439 7.4.2.1 Symmetrien verschiedener Art 439 7.4.2.2 Formen der Entwicklung in eine Fourier-Reihe .... 440 7.4.3 Koeffizientenbestimmung mit Hilfe numerischer Methoden 441 7.4 4 Fourier-Reihe und Fourier-Integral 441 7.4.5 Hinweise zur Tabelle einiger Fourier-Entwicklungen . . 442 Integralrechnung 444 8.1 Unbestimmtes Integral 444 8.1.1 Stammfunktion oder Integral 444 8.1.1.1 Unbestimmte Integrale 445 8 1 1.2 Integrale elementarer Funktionen 445 8.1.2 Integrationsregeln 445 8 1.3 Integration rationaler Funktionen .... 449 8.13.1 Integrale ganzrationaler Funktionen (Polynome) 449 8.1.3.2 Integrale gebrochenrationaler Funktionen 449 8 1 3.3 Vier Fälle bei der Partialbruchzerlegung 449 8.1.4 Integration irrationaler Funktionen 452 8.1.4.1 Substitution zur Rückführung auf Integrale rationaler Funktionen . 452 8.1.4.2 Integration binomischer Integranden 453 8.1.4.3 Elliptische Integrale 453 8.1.5 Integration trigonometrischer Funktionen . 455 8 1.5 1 Substitution 455 8 1 5.2 Vereinfachte Methoden 455 8 16 Integration weiterer transzendenter Funktionen 456 8.1.6.1 Integrale mit Exponentialfunktionen 456 8.1.6.2 Integrale mit Hyperbelfunktionen 456 8.1.6.3 Anwendung der partiellen Integration 457 8.16 4 Integrale transzendenter Funktionen 457 8.2 Bestimmte Integrale . . 457 8 2.1 Grundbegriffe, Regeln und Sätze . 457 8 2.11 Definition und Existenz des bestimmten Integrals . 457 8.2 1.2 Eigenschaften bestimmter Integrale 458 8 2.1.3 Weitere Sätze über Integrationsgrenzen 460 8.2.1.4 Berechnung bestimmter Integrale .... 462 8.2.2 Anwendungen bestimmter Integrale .... 464 8.2.2.1 Allgemeines Prinzip zur Anwendung des bestimmten Integrals . . . 464 8.2.2.2 Anwendungen in der Geometrie 465 8.2.2.3 Anwendungen in Mechanik und Physik 467 8.2.3 Uneigentliche Integrale, Stieltjes- und Lebesgue-Integrale 470 8.2.3.1 Verallgemeinerungen des Integralbegriffs . 470 8.2.3.2 Integrale mit unendlichen Integrationsgrenzen 471 8.2 3.3 Integrale mit unbeschränktem Integranden . 473 8.2.4 Parameterintegrale 476 8.2.4 1 Definition des Parameterintegrals 476
XX Inhaltsverzeichnis 8.2.4.2 Differentiation unter dem Integralzeichen 476 8.2.4.3 Integration unter dem Integralzeichen . . 476 8.2.5 Integration durch Reihenentwicklung, spezielle nichtelementare Funktionen . 477 8.3 Kurvenintegrale . . . 479 8 3 1 Kurvenintegrale 1. Art . 480 8.3.1.1 Definitionen .... . . 480 8.3.1.2 Existenzsatz . . .... 480 8.3.13 Berechnung des Kurvenintegrals 1. Art 481 8.3 1.4 Anwendungen des Kurvenintegrals 1. Art ... . 482 8.3.2 Kurvenintegrale 2. Art . 482 8.3.2.1 Definitionen 482 8.3.2 2 Existenzsatz . . 483 8.3.2.3 Berechnung der Kurvenintegrale 2. Art .... . 483 8.3.3 Kurvenintegrale allgemeiner Art 484 8.3.3.1 Definition 484 8 3.3 2 Eigenschaften des Kurvenintegrals allgemeiner Art . . 484 8.3.3.3 Umlaufintegral 485 8.3.4 Unabhängigkeit des Kurvenintegrals vom Integrationsweg 485 8 3 4.1 Zweidimensionaler Fall . . 485 8.3.4.2 Existenz der Stammfunktion ... . 486 8.3.4 3 Dreidimensionaler Fall . . . . . . 486 8.3 4.4 Berechnung der Stammfunktion . . . 486 8 4 Mehrfachintegrale ... 488 8.4.1 Doppelintegral .... 488 8.4.1.1 Begriff des Doppelintegrals 488 8.4.1.2 Berechnung des Doppelintegrals . . . 489 8 4.1.3 Anwendungen von Doppelintegralen . .... 491 8.4.2 Dreifachintegral .... . . 491 8.4.2 1 Begriff des Dreifachintegrals . 491 8.4.2.2 Berechnung des Dreifachintegrals 492 8.4 2.3 Anwendungen von Dreifachintegralen . . .... 496 8 5 Oberflächenintegrale 496 8.5.1 Oberflächenintegrale 1. Art . . ... 496 8 5.1.1 Begriff des Oberflächenintegrals 1 Art 496 8.5.1.2 Berechnung des Oberflächenintegrals 1. Art .... . . 498 8.5.1.3 Anwendungendes Oberflächenintegrals 1. Art . . 499 8.5.2 Oberflächenintegrale 2 Art 499 8.5.2 1 Begriff des Oberflächenintegrals 2 Art . ... 499 8.5 2.2 Berechnung des Oberflächenintegrals 2 Art 501 8.5 3 Oberflächenintegral allgemeiner Art .... . ... 502 8.5 3.1 Begriff des Oberflächenintegrals allgemeiner Art 502 8.5.3.2 Eigenschaften des Oberflächenintegrals . . . . 502 9 Differentialgleichungen 504 9.1 Gewöhnliche Differentialgleichungen ... . 504 9.1.1 Differentialgleichungen 1. Ordnung . . . . 505 9.1.1.1 Existenzsatz, Richtungsfeld . . 505 9.1 1 2 Wichtige Integrationsmethoden . . 506 9.1.1.3 Implizite Differentialgleichungen ... . 509 9.1.1.4 Singulare Integrale und singulare Punkte . . .... 510 9.1.1.5 Näherungsmethoden zur Integration von Differentialgleichungen 1 Ordnung . 513
Inhaltsverzeichnis XXI 9.1.2 Differentialgleichungen höherer Ordnung und Systeme von Differentialgleichungen 515 9.1.2.1 Grundlegende Betrachtungen 515 9 12 2 Erniedrigung der Ordnung 516 9.1.2.3 Lineare Differentialgleichungen n-ter Ordnung 518 9.1.2.4 Lösung linearer Differentialgleichungen mit konstanten Koeffizienten 520 9.1.2.5 Systeme linearer Differentialgleichungen mit konstanten Koeffizienten 522 9.1.2.6 Lineare Differentialgleichungen 2. Ordnung 525 9.1.3 Randwertprobleme 532 9.1 3 1 Problemstellung 532 9.13.2 Haupteigenschaften der Eigenfunktionen und Eigenwerte . ... 533 9.13 3 Entwicklung nach Eigenfunktionen 534 9 13 4 Singulare Fälle 534 9 2 Partielle Differentialgleichungen 535 9.2.1 Partielle Differentialgleichungen 1. Ordnung 535 9 2 1.1 Lineare partielle Differentialgleichungen 1. Ordnung 535 9 2.1.2 Nichtlineare partielle Differentialgleichungen 1. Ordnung . . . . 537 9.2 2 Lineare partielle Differentialgleichungen 2. Ordnung 540 9.2.2.1 Klassifikation und Eigenschaften der Differentialgleichungen 2. Ordnung mit zwei unabhängigen Veränderlichen 540 9.2.2.2 Klassifikation und Eigenschaften der Differentialgleichungen 2. Ordnung mit mehr als zwei unabhängigen Veränderlichen 542 9.2.2.3 Integrationsmethoden für lineare partielle Differentialgleichungen 2. Ordnung 543 9 2.3 Partielle Differentialgleichungen aus Naturwissenschaft und Technik .... 554 9.2.3.1 Problemstellungen und Randbedingungen 554 9.2 3.2 Wellengleichung 555 9.2.3 3 Wärmeleitungs- und Diffusionsgleichung für ein homogenes Medium 556 9.2.3.4 Potentialgleichung 557 9 2 3 5 Schrödinger-Gleichung 557 9.2.4 Nichtlineare partielle Differentialgleichungen: Solitonen, periodische Muster und Chaos 566 9.2.4.1 Physikalisch-mathematische Problemstellung 566 9 2.4.2 Korteweg-de-Vries-Gleichung 568 9.2.4 3 Nichtlineare Schrödinger-Gleichung 569 9 2.4.4 Sinus-Gordon-Gleichung 569 9.2.4.5 Weitere nichtlineare Evolutionsgleichungen mit Solitonlösungen . . 571 10 Variationsrechnung 572 10.1 Aufgabenstellung 572 10 2 Historische Aufgaben 573 10.2 1 Isoperimetrisches Problem 573 10.2.2 Brachistochronenproblem 573 10 3 Variationsaufgaben mit Funktionen einer Veränderlichen 574 10 3.1 Einfache Variationsaufgabe und Extremale 574 10.3 2 Eulersche Differentialgleichung der Variationsrechnung . 574 10 3 3 Variationsaufgaben mit Nebenbedingungen 576 10 3 4 Variationsaufgaben mit höheren Ableitungen 577 10.3.5 Variationsaufgaben mit mehreren gesuchten Funktionen 577 10 3.6 Variationsaufgaben in Parameterdarstellung 578 10 4 Variationsaufgaben mit Funktionen von mehreren Veränderlichen 579
XXII Inhaltsverzeichnis 10.4.1 Einfache Variationsaufgabe . . .... 579 10 4 2 Allgemeinere Variationsaufgaben 580 10.5 Numerische Lösung von Variationsaufgaben 580 10.6 Ergänzungen ... . . 582 10.6.1 Erste und zweite Variation 582 10.6 2 Anwendungen in der Physik . . 582 11 Lineare Integralgleichungen 583 11.1 Einführung und Klassifikation . 583 112 Predholmsche Integralgleichungen 2. Art 584 112 1 Integralgleichungen mit ausgearteten Kernen . 584 112.2 Methode der sukzessiven Approximation, Neumann-Reihe 587 112 3 Fredholmsche Lösungsmethode, Fredholmsche Sätze . . . 589 11.2.3.1 Fredholmsche Lösungsmethode ... . ... 589 112 3 2 Fredholmsche Sätze 591 11.24 Numerische Verfahren für Fredholmsche Integralgleichungen 2 Art . . 592 11.2.41 Approximation des Integrals 592 11.2.4 2 Kernapproximation 594 11.2.4.3 Kollokationsmethode . . . ... ... 596 113 Fredholmsche Integralgleichungen 1 Art 598 113 1 Integralgleichungen mit ausgearteten Kernen 598 11.3.2 Begriffe, analytische Grundlagen ... 599 11.3 3 Zurückführung der Integralgleichung auf ein lineares Gleichungssystem 600 11.3.4 Lösung der homogenen Integralgleichung 1. Art 602 11.3 5 Konstruktion zweier spezieller Orthonormalsysteme zu einem gegebenen Kern 603 11 3.6 Iteratives Verfahren 604 114 Volterrasche Integralgleichungen 605 11.41 Theoretische Grundlagen 605 11.4.2 Lösung durch Differentiation . . . . 606 11.4.3 Neumannsche Reihe zur Lösung der Volterraschen Integralgleichungen 2 Art 607 11.44 Volterrasche Integralgleichungen vom Faltungstyp 608 11.4.5 Numerische Behandlung Volterrascher Integralgleichungen 2. Art . . . 609 115 Singulare Integralgleichungen 611 11.5.1 Abelsche Integralgleichung 611 11.5.2 Singulare Integralgleichungen mit Cauchy-Kernen 612 11.5.2 1 Formulierung der Aufgabe 612 11.5.2.2 Existenz einer Lösung 613 11.5.2.3 Eigenschaften des Cauchy-Integrals . . 613 11 5.2.4 Hilbertsches Randwertproblem ... . . . 613 11.52.5 Lösung des Hilbertschen Randwertproblems .... 614 11.52.6 Lösung der charakteristischen Integralgleichung 614 12 Funktionalanalysis 616 12.1 Vektorräume . . . 616 12.1.1 Begriff des Vektorraumes 616 12 1.2 Lineare und affin-lineare Teilmengen .... 617 12.1.3 Linear unabhängige Elemente . ... 619 12 1.4 Konvexe Teilmengen und konvexe Hülle ... ... . . ..619 12.1 4 1 Konvexe Mengen 619 12.1.4 2 Kegel ... 620 12.1.5 Lineare Operatoren und Funktionale 620 12 1 5 1 Abbildungen . 620
Inhaltsverzeichnis XXIII 12.1.5.2 Homomorphismus und Endomorphismus . . 621 12.1.5.3 Isomorphe Vektorräume 621 12.1.6 Komplexifikation reeller Vektorräume 621 12 1.7 Geordnete Vektorräume . 621 12 1 7.1 Kegel und Halbordnung 621 12.1.7.2 Ordnungsbeschränkte Mengen 622 12.1.7.3 Positive Operatoren 623 12.1.7.4 Vektorverbände ' 623 12.2 Metrische Räume 624 12.2.1 Begriff des metrischen Raumes 624 12.2.1.1 Kugeln, Umgebungen und offene Mengen 626 12.2.1.2 Konvergenz von Folgen im metrischen Raum .... . 626 12 2.1.3 Abgeschlossene Mengen und Abschließung 627 12.2.1.4 Dichte Teilmengen und separable metrische Räume 627 12 2.2 Vollständige metrische Räume 628 12.2.2.1 Cauchy-Folge 628 12.2.2.2 Vollständiger metrischer Raum 628 12.2 2.3 Einige fundamentale Sätze in vollständigen metrischen Räumen . 628 12.2.2.4 Einige Anwendungen des Kontraktionsprinzips 629 12.2 2.5 Vervollständigung eines metrischen Raumes 631 12.2.3 Stetige Operatoren 631 12.3 Normierte Räume 631 12.3.1 Begriff des normierten Raumes 631 12.3.1.1 Axiome des normierten Raumes . 631 12.3.1.2 Einige Eigenschaften normierter Räume 632 12.3.2 Banach-Räume 632 12.3.2.1 Reihen in normierten Räumen 632 12.3.2.2 Beispiele von Banach-Räumen ... . 633 12.3.2.3 Sobolew-Räume 633 12 3.3 Geordnete normierte Räume 634 12.3.4 Normierte Algebren 634 12.4 Hilbert-Räume 635 12.4.1 Begriff des Hilbert-Raumes 635 12.4.1.1 Skalarprodukt 635 12.4.1.2 Unitäre Räume und einige ihrer Eigenschaften 635 12 4 1 3 Hilbert-Raum - 636 12 4.2 Orthogonalität 636 12 4.2.1 Eigenschaften der Orthogonalität 636 12.4.2.2 Orthogonale Systeme 637 12 4 3 Fourier-Reihen im Hilbert-Raum 638 12.4.3 1 Bestapproximation . . . . ... 638 12.4.3.2 Parsevalsche Gleichung, Satz von Riesz-Fischer 638 12.4.4 Existenz einer Basis. Isomorphe Hilbert-Räume ... 639 12.5 Stetige lineare Operatoren und Funktionale . . . 639 12.5.1 Beschränktheit, Norm und Stetigkeit linearer Operatoren 639 12.5.1.1 Beschränktheit und Norm linearer Operatoren 639 12.5.1.2 Raum linearer stetiger Operatoren 640 12 5.1.3 Konvergenz von Operatorenfolgen . 640 12 5.2 Lineare stetige Operatoren in Banach-Räumen . . 640 12.5.3 Elemente der Spektraltheorie linearer Operatoren 642 12.5.3 1 Resolventenmenge und Resolvente eines Operators .... ... 642 12.5.3.2 Spektrum eines Operators 643
XXIV Inhaltsverzeichnis 12.5.4 Stetige lineare Funktionale ... 643 12.5.4.1 Definition . 643 12.5.4.2 Stetige lineare Funktionale im Hilbert-Raum, Satz von Riesz . . 644 12.5.4.3 Stetige lineare Funktionale in Lp 644 12.5 5 Fortsetzung von linearen Funktionalen 645 12.5.6 Trennung konvexer Mengen . . . 645 12 5 7 Bidualer Raum und reflexive Räume 646 12 6 Adjungierte Operatoren in normierten Räumen 646 12.6.1 Adjungierter Operator zu einem beschränkten Operator 646 12.6.2 Adjungierter Operator zu einem unbeschränkten Operator . . . . 647 12.6.3 Selbst adjungierte Operatoren 648 12.6.3.1 Positiv definite Operatoren 648 12632 Projektoren im Hilbert-Raum . . 648 12.7 Kompakte Mengen und kompakte Operatoren ... .... ... 648 12 7 1 Kompakte Teilmengen in normierten Räumen 648 12.7.2 Kompakte Operatoren . . . . . 649 12.7 2 1 Begriff des kompakten Operators 649 12.7.2.2 Eigenschaften linearer kompakter Operatoren 649 12 7 2.3 Schwache Konvergenz von Elementen 649 12.7.3 Fredholmsche Alternative 650 12.7.4 Kompakte Operatoren im Hilbert-Raum . . . 650 12.7.5 Kompakte selbstadjungierte Operatoren 650 12.8 Nichtlineare Operatoren . 651 12 8.1 Beispiele nichtlinearer Operatoren ... 651 12.8.2 Differenzierbarkeit nichtlinearer Operatoren . 652 12.8.3 Newton-Verfahren . . . 652 12 8.4 Schaudersches Fixpunktprinzip .... . . 653 12.8.5 Leray-Schauder-Theorie . . . 654 12 8 6 Positive nichtlineare Operatoren 654 12.8.7 Monotone Operatoren in Banach-Räumen 655 12.9 Maß und Lebesgue-Integral . . . . .... ... 655 12,9 1 Sigma-Algebren und Maße . . .... . . . 655 12.9.2 Meßbare Funktionen 657 12.9.2.1 Meßbare Funktion . 657 12.9.2.2 Eigenschaften der Klasse der meßbaren Funktionen . . . 657 12 9.3 Integration . ... 657 12.9.3.1 Definition des Integrals . . 657 12.9 3 2 Einige Eigenschaften des Integrals 658 12.9.3.3 Konvergenzsätze 658 12.9.4 Lp-Räume 659 12 9.5 Distributionen 660 12.9.5.1 Formel der partiellen Integration . . . . 660 12.9.5 2 Verallgemeinerte Ableitung. . . 660 12.9.5 3 Distribution 661 12 9 5.4 Ableitung einer Distribution 661 13 Vektoranalysis und Feldtheorie 663 13.1 Grundbegriffe der Feldtheorie 663 13.1.1 Vektorfunktion einer skalaren Variablen 663 13 1.1.1 Definitionen . . 663 13.1 1.2 Ableitung einer Vektorfunktion 663 13 1.1.3 Differentiationsregeln für Vektoren 663
Inhaltsverzeichnis XXV 13 1 1 4 Taylor-Entwicklung für Vektorfunktionen 664 13.12 Skalarfelder 664 13.1.2.1 Skalares Feld oder skalare Punktfunktion 664 13.1.2.2 Wichtige Fälle skalarer Felder 664 13.1.2.3 Koordinatendarstellung von Skalarfeldern 665 13.1.2.4 Niveauflächen und Niveaulinien 665 13.1.3 Vektorfelder 665 13.1.3.1 Vektorielles Feld oder vektorielle Punktfunktion 665 13 1.3.2 Wichtige Fälle vektorieller Felder 666 13 1.3.3 Koordinatendarstellung von Vektorfeldern . 667 13.13.4 Übergang von einem Koordinatensystem zu einem anderen . . . 668 13.1.3.5 Feldlinien 669 13.2 Räumliche Differentialoperationen . .... 670 13.2 1 Richtungs- und Volumenableitung ... 670 13.2 1.1 Richtungsableitung eines skalaren Feldes 670 13.2.1.2 Richtungsableitung eines vektoriellen Feldes 670 13 2.1.3 Volumenableitung oder räumliche Ableitung 671 13.2.2 Gradient eines Skalarfeldes ... 671 13 2.2.1 Definition des Gradienten 671 13.2.2.2 Gradient und Richtungsableitung 672 13.2 2.3 Gradient und Volumenableitung 672 13 2 2.4 Weitere Eigenschaften des Gradienten 672 13.2.2.5 Gradient des Skalarfeldes in verschiedenen Koordinaten 672 13.2 2.6 Rechenregeln 673 13.2.3 Vektorgradient 673 13.2.4 Divergenz des Vektorfeldes 673 13.2.4 1 Definition der Divergenz . . 673 13.2.4 2 Divergenz in verschiedenen Koordinaten 674 13.2.4.3 Regeln zur Berechnung der Divergenz 674 13.2.4.4 Divergenz eines Zentralfeldes 674 13.2.5 Rotation des Vektorfeldes 675 13.2.5.1 Definitionen der Rotation 675 13.2.5.2 Rotation in verschiedenen Koordinaten . . . . 676 13.2.5.3 Regeln zur Berechnung der Rotation 676 13.2 5 4 Rotation des Potentialfeldes 677 13.2.6 Nablaoperator, Laplace-Operator 677 13.2.6.1 Nablaoperator 677 13.2.6.2 Rechenregeln für den Nablaoperator 677 13.2.6.3 Vektorgradient 678 13.2.6.4 Zweifache Anwendung des Nablaoperators 678 13 2.6.5 Laplace-Operator 678 13.2.7 Übersicht zu den räumlichen Differentialoperationen . 679 13.2.7.1 Prinzipielle Verknüpfungen und Ergebnisse für Differentialoperatoren 679 13.2.7.2 Rechenregeln für Differentialoperatoren . . 679 13.2.7.3 Vektoranalytische Ausdrücke in kartesischen, Zylinder- und Kugelkoordinaten 680 13 3 Integration in Vektorfeldern 681 13.3.1 Kurvenintegral und Potential im Vektorfeld 681 13.3.1 1 Kurvenintegral im Vektorfeld 681 13.3.1.2 Bedeutung des Kurvenintegrals in der Mechanik 682 13.3.13 Eigenschaften des Kurvenintegrals 682
XXVI Inhaltsverzeichnis 13 3.1.4 Kurvenintegral in kartesischen Koordinaten 683 13.3.15 Umlauf integral eines Vektorfeldes . 683 13 3.1 6 Konservatives oder Potentialfeld . . . 683 13 3.2 Oberflächenintegrale 684 13.3 2 1 Vektor eines ebenen Flächenstückes 684 13.3.2.2 Berechnung von Oberflächenintegralen . . ... . . 685 13 3 2.3 Oberflächenintegrale und Fluß von Feldern 685 13.3 2.4 Oberflächenintegrale in kartesischen Koordinaten als Oberflächenintegrale 2 Art 686 13.3.3 Integralsätze 687 13 3.3 1 Integralsatz und Integralformel von Gauß . 687 13.3.3 2 Integralsatz von Stokes . . . 687 13 3.3 3 Integralsätze von Green . . 688 13.4 Berechnung von Feldern . 689 13.4.1 Reines Quellenfeld . 689 13.4 2 Reines Wirbelfeld oder quellenfreies Wirbelfeld . 689 13 4.3 Vektorfelder mit punktförmigen Quellen . 690 13.4.3 1 Coulomb-Feld der Punktladung 690 13 4 3.2 Gravitationsfeld der Punktmasse 690 13 4 4 Superposition von Feldern 690 13.4.4.1 Diskrete Quellenverteilung 690 13.4.4 2 Kontinuierliche Quellenverteilung . . . 691 13.4 4.3 Zusammenfassung .... 691 13.5 Differentialgleichungen der Feldtheorie .... 691 13 5.1 Laplacesche Differentialgleichung 691 13 5 2 Poissonsche Differentialgleichung . . . . 691 14 Funktionentheorie 693 14 1 Funktionen einer komplexen Veränderlichen . . . . 693 14.1.1 Stetigkeit, Differenzierbarkeit 693 14.1.1.1 Definition der komplexen Funktion . 693 14.1.1.2 Grenzwert der komplexen Funktion ... ... .... 693 14.1.13 Stetigkeit der komplexen Funktion . . . 693 14.11.4 Differenzierbarkeit der komplexen Funktion 693 14.1.2 Analytische Funktionen . 694 14.12.1 Definition der analytischen Funktion . . 694 14.12.2 Beispiele analytischer Funktionen . . . 694 14.12 3 Eigenschaften analytischer Funktionen 694 14.12.4 Singulare Punkte ... 695 14.1 3 Konforme Abbildung 696 14.1.3.1 Begriff und Eigenschaften der konformen Abbildung 696 14 1 3 2 Einfachste konforme Abbildungen 697 14.1.3.3 Schwarzsches Spiegelungsprinzip . . 703 14.1.3.4 Komplexe Potentiale . . 703 14.1.3 5 Superpositionsprinzip 705 14.1.3.6 Beliebige Abbildung der komplexen Zahlenebene ... . 706 14.2 Integration im Komplexen .... . . 707 14.2 1 Bestimmtes und unbestimmtes Integral 707 14.2 1 1 Definition des Integrals im Komplexen 707 14 2 1.2 Eigenschaften und Berechnung komplexer Integrale . . 708 14.2 2 Integralsatz von Cauchy, Hauptsatz der Funktionentheorie . .... 710 14 2.2.1 Integralsatz von Cauchy für einfach zusammenhängende Gebiete 710
Inhaltsverzeichnis XXVII 14.2.2 2 Integralsatz von Cauchy für mehrfach zusammenhängende Gebiete 710 14.2.3 Integralformeln von Cauchy 711 14.2.3.1 Analytische Funktion innerhalb eines Gebietes 711 14.2.3.2 Analytische Funktion außerhalb eines Gebietes 711 14.3 Potenzreihenentwicklung analytischer Funktionen 711 14.3.1 Konvergenz von Reihen mit komplexen Gliedern 711 14.3.1.1 Konvergenz einer Zahlenfolge mit komplexen Gliedern 711 14.3.1.2 Konvergenz einer unendlichen Reihe mit komplexen Gliedern . . . 712 14.3.1.3 Potenzreihen im Komplexen 712 14.3 2 Taylor-Reihe 713 14.3.3 Prinzip der analytischen Fortsetzung 714 14.3.4 Laurent-Entwicklung 714 14.3.5 Isolierte singulare Stellen und der Residuensatz 715 14.3.5.1 Isolierte singulare Stellen 715 14.3.5 2 Meromorphe Funktionen 715 14.3.5.3 Elliptische Funktionen 715 14.3.5.4 Residuum 716 14.3.5.5 Residuensatz 716 14.4 Berechnung reeller Integrale durch Integration im Komplexen 717 14.4.1 Anwendung der Cauchyschen Integralformeln 717 14.4.2 Anwendung des Residuensatzes 717 14.4.3 Anwendungen des Lemmas von Jordan 717 14.4.3.1 Lemma von Jordan 717 14.4.3.2 Beispiele zum Lemma von Jordan 718 14.5 Algebraische und elementare transzendente Funktionen 720 14.5.1 Algebraische Funktionen 720 14.5.2 Elementare transzendente Funktionen 720 14.5.3 Beschreibung von Kurven in komplexer Form 723 14.6 Elliptische Funktionen 724 14.6.1 Zusammenhang mit elliptischen Integralen 724 14.6.2 Jacobische Funktionen 726 14.6.3 Thetafunktionen 727 14.6.4 Weierstrasssche Funktionen 728 15 Integraltransformationen 730 15.1 Begriff der Integraltransformation 730 15.1.1 Allgemeine Definition der Integraltransformationen 730 15.1.2 Spezielle Integraltransformationen 730 15.1.3 Umkehrtransformationen 730 15.1.4 Linearität der Integraltransformationen 732 15.15 Integraltransformationen für Funktionen von mehreren Veränderlichen . . 732 15.1.6 Anwendungen der Integraltransformationen 732 15.2 Laplace-Transformation 733 15.2.1 Eigenschaften der Laplace-Transformation 733 15.2.1.1 Laplace-Transformierte, Original-und Bildbereich 733 15.2.1.2 Rechenregeln zur Laplace-Transformation 734 15.2.1.3 Bildfunktionen spezieller Funktionen 737 15.2.1.4 Diracsche Delta-Funktion und Distributionen 740 15.2.2 Rücktransformation in den Originalbereich 741 15.2.2.1 Rücktransformation mit Hilfe von Tabellen 741 15.2 2 2 Partialbruchzerlegung 741 15.2.2.3 Reihenentwicklungen 742
XXVIII Inhaltsverzeichnis 15.2 2.4 Umkehrintegral 743 15.2.3 Lösung von Differentialgleichungen mit Hilfe der Laplace-Transformation . 744 15.2.3.1 Gewöhnliche Differentialgleichungen mit konstanten Koeffizienten 744 15.2 3.2 Gewöhnliche Differentialgleichungen mit veränderlichen Koeffizienten 745 15 2.3.3 Partielle Differentialgleichungen . . 746 15 3 Fourier-Transformation 747 15.3.1 Eigenschaften der Fourier-Transformation 747 15.3 1.1 Fourier-Integral 747 15.3.12 Fourier-Transformation und Umkehrtransformation 748 15.3.1.3 Rechenregeln zur Fourier-Transformation 750 15.3.1.4 Bildfunktionen spezieller Funktionen 753 15.3.2 Lösung von Differentialgleichungen mit Hilfe der Fourier-Transformation . . 754 15.3 2 1 Gewöhnliche lineare Differentialgleichungen 754 15.3.2.2 Partielle Differentialgleichungen . . 755 15.4 Z-Transformation 757 15 4.1 Eigenschaften der Z-Transformation 757 15.4.1.1 Diskrete Funktionen 757 15.4.1.2 Definition der Z-Transformation 757 15.4.1.3 Rechenregeln 758 15 4.14 Zusammenhang mit der Laplace-Transformation . 759 15 4.1.5 Umkehrung der Z-Transformation 760 15.4.2 Anwendungen der Z-Transformation 761 15.4.2.1 Allgemeine Lösung linearer Differenzengleichungen 761 15.4.2.2 Differenzengleichung 2. Ordnung (Anfangswertaufgabe) 762 15.4.2 3 Differenzengleichung 2. Ordnung (Randwertaufgabe) 763 15.5 Wavelet-Transformation 763 15.5.1 Signale 763 15.5.2 Wavelets 764 15.5.3 Wavelet-Transformation 765 15.5 4 Diskrete Wavelet-Transformation . . 766 15.5.4.1 Schnelle Wavelet-Transformation 766 15.5.4.2 Diskrete Haar-Wavelet-Transformation 766 15 5.5 Gabor-Transformation 766 15.6 Walsh-Funktionen 767 15.6.1 Treppenfunktionen . 767 15.6 2 Walsh-Systeme 767 16 Wahrscheinlichkeitsrechnung und mathematische Statistik 768 16.1 Kombinatorik 768 16 1.1 Permutationen 768 16.1 2 Kombinationen .... 768 16.1.3 Variationen 769 16.1.4 Zusammenstellung der Formeln der Kombinatorik 770 16.2 Wahrscheinlichkeitsrechnung 770 16 2 1 Ereignisse, Häufigkeiten und Wahrscheinlichkeiten . 770 16.2.1.1 Ereignisse 770 16.2.1.2 Häufigkeiten und Wahrscheinlichkeiten 771 16.2.1.3 Bedingte Wahrscheinlichkeiten, Satz von Bayes 773 16.2.2 Zufallsgrößen, Verteilungsfunktion 774 16.2.2.1 Zufallsveränderliche 774 16.2 2 2 Verteilungsfunktion 774
Inhaltsverzeichnis XXIX 16.2.2.3 Erwartungswert und Streuung, TschebyschefFsche Ungleichung . . 776 16.2.2.4 Mehrdimensionale Zufallsveränderliche ... 777 16.2.3 Diskrete Verteilungen 777 16 2.3.1 Binomialverteilung 778 16 2 3 2 Hypergeometrische Verteilung . . . 779 16 2.3 3 Poisson-Verteilung 780 16.2.4 Stetige Verteilungen 780 16.2.4.1 Normalverteilung 780 16 2 4.2 Normierte Nor mal Verteilung, Gaußsches Fehlerintegral 782 16.2 4 3 Logarithmische Normal Verteilung 782 16.2.4.4 Exponentialverteilung 783 16.2.4.5 Weibull-Verteilung 784 16.2 4.6 x2-Verteilung 785 16.2.4 7 Fisher-Verteilung 785 16 2 48 Student-Verteilung . . . 786 16.2.5 Gesetze der großen Zahlen, Grenzwertsätze 787 16.2.5.1 Gesetz der großen Zahlen von Bernoulli 787 16 2 5 2 Grenzwertsatz von Lindeberg-Levy . . 788 16.2.6 Stochastische Prozesse und stochastische Ketten 788 16 2.6.1 Grundbegriffe, Markoffsche Ketten .... 788 16.2.6.2 Poisson-Prozesse 791 16.3 Mathematische Statistik 793 16.3.1 Stichprobenfunktionen 793 16.3.1.1 Grundgesamtheit, Stichproben, Zufallsvektor . . . . . 793 16.3.1.2 Stichprobenfunktionen 794 16.3.2 Beschreibende Statistik . . . 795 16.3.2.1 Statistische Erfassung gegebener Meßwerte 795 16.3.2.2 Statistische Parameter 796 16.3.3 Wichtige Prüfverfahren 797 16.3.3.1 Prüfen auf Normalverteilung 797 16.3.3.2 Verteilung der Stichprobenmittelwerte 799 16 3 3.3 Vertrauensgrenzen für den Mittelwert 800 16.3.3.4 Vertrauensgrenzen für die Streuung . 801 16.3.3.5 Prinzip der Prüfverfahren 802 16.3.4 Korrelation und Regression 802 16 3 4 1 Lineare Korrelation bei zwei meßbaren Merkmalen 802 16 3.4.2 Lineare Regression bei zwei meßbaren Merkmalen 803 16.3.4.3 Mehrdimensionale Regression 804 16.3 5 Monte-Carlo-Methode 806 16.3.5.1 Simulation 806 16.3.5.2 Zufallszahlen 806 16.3.5 3 Beispiel für eine Monte-Carlo-Simulation 808 16.3.5.4 Anwendungen der Monte-Carlo-Methode in der numerischen Mathematik 808 16.3.5.5 Weitere Anwendungen der Monte-Carlo-Methode 810 16 4 Theorie der Meßfehler 811 16.4 1 Meßfehler und ihre Verteilung 811 16 4 1.1 Meßfehlereinteilung nach qualitativen Merkmalen . . . . . 811 16.4.1.2 Meßfehlerverteilungsdichte 811 16.4 1.3 Meßfehlereinteilung nach quantitativen Merkmalen 813 16 4.1.4 Angabe von Meßergebnissen mit Fehlergrenzen . 816 16.4.1.5 Fehlerrechnung für direkte Messungen gleicher Genauigkeit . . 816
Inhaltsverzeichnis 16.4.1.6 Fehlerrechnung für direkte Messungen ungleicher Genauigkeit . . . 817 16.4.2 Fehlerfortpflanzung und Fehleranalyse 818 16.4.2.1 Gaußsches Fehlerfortpflanzungsgesetz 818 16.4.2.2 Fehleranalyse 819 17 Dynamische Systeme und Chaos 821 17.1 Gewöhnliche Differentialgleichungen und Abbildungen 821 17 1.1 Dynamische Systeme 821 17.1.1.1 Grundbegriffe 821 17.1.1.2 Invariante Mengen 823 17.1.2 Qualitative Theorie gewöhnlicher Differentialgleichungen 824 17.1.2.1 Existenz des Flusses und Phasenraumstruktur 824 17.1 2.2 Lineare Differentialgleichungen 825 17.1.2.3 Stabilitätstheorie 827 17.1.2.4 Invariante Mannigfaltigkeiten 830 17.1.2.5 Poincare-Abbildung 834 17.1.2.6 Topologische Äquivalenz von Differentialgleichungen 834 17.1.3 Zeitdiskrete dynamische Systeme 836 17.1.3.1 Ruhelagen, periodische Orbits und Grenzmengen 836 17.1.3.2 Invariante Mannigfaltigkeiten 836 17.1.3.3 Topologische Konjugiertheit von zeitdiskreten Systemen 837 17.1.4 Strukturelle Stabilität (Robustheit) 837 17 1.4.1 Strukturstabile Differentialgleichungen 837 17.1.4.2 Strukturstabile zeitdiskrete Systeme 838 17.1.4.3 Generische Eigenschaften 839 17 2 Quantitative Beschreibung von Attraktoren 840 17.2.1 Wahrscheinlichkeitsmaße auf Attraktoren 840 17.2.1.1 Invariantes Maß 840 17.2.1.2 Elemente der Ergodentheorie 841 17.2.2 Entropien 843 17.2.2.1 Topologische Entropie 843 17.2.2.2 Metrische Entropie 843 17.2.3 Lyapunov-Exponenten 844 17.2.4 Dimensionen 845 17.2.4.1 Metrische Dimensionen 845 17.2.4.2 Auf invariante Maße zurückgehende Dimensionen 848 17 2.4.3 Lokale Hausdorff-Dimension nach Douady-Oesterle 850 17.2.4.4 Beispiele von Attraktoren 850 17.2.5 Seltsame Attraktoren und Chaos 852 17.2.6 Chaos in eindimensionalen Abbildungen 852 17.2.7 Rekonstruktion der Dynamik aus Zeitreihen 853 17 2.7.1 Grundlagen, Rekonstruktionen mit generischen Eigenschaften . . . 853 17 2.7.2 Rekonstruktionen mit prävalenten Eigenschaften 854 17.3 Bifurkationstheorie und Wege zum Chaos 856 17.3.1 Bifurkationen in Morse-Smale-Systemen 856 17.3.1.1 Lokale Bifurkationen nahe Ruhelagen 856 17.3.1.2 Lokale Bifurkationen nahe einem periodischen Orbit 861 17.3.1.3 Globale Bifurkationen 864 17.3.2 Übergänge zum Chaos 865 17.3.2.1 Kaskade von Periodenverdopplungen 865 17.3.2.2 Intermittenz 865 17.3.2.3 Globale homokline Bifurkationen 866
Inhaltsverzeichnis XXXI 17 3.2.4 Auflösung eines Toms 868 18 Optimierung 873 18.1 Lineare Optimierung 873 18 1 1 Problemstellung und geometrische Darstellung 873 18.1.1.1 Formen der linearen Optimierung 873 18 1.1.2 Beispiele und graphische Lösungen . 874 18 1 2 Grundbegriffe der linearen Optimierung, Normalform 875 18 1 2 1 Ecke und Basis 875 18.12 2 Normalform der linearen Optimierungsaufgabe 877 18 1.3 Simplex verfahren . 878 18.1.3.1 Simplextableau 878 18.1.3.2 Übergang zum neuen Simplextableau 878 18.1.3.3 Bestimmung eines ersten Simplextableaus 880 18.1.3.4 Revidiertes Simplexverfahren 881 18 1 3.5 Dualität in der linearen Optimierung 882 18.14 Spezielle lineare Optimierungsprobleme 884 18 1.4.1 TVansportproblem.... . 884 18 1.4.2 Zuordnungsproblem . 886 18.1.4.3 Verteilungsproblem ¦ 887 18 1 4 4 Rundreiseproblem 887 18.14.5 Reihenfolgeproblem 887 18 2 Nichtlineare Optimierung 888 18 2.1 Problemstellung und theoretische Grundlagen . ... 888 18.2.1.1 Problemstellung 888 18 2 1.2 Optimalitätsbedingungen 888 18.2.1.3 Dualität in der Optimierung 889 18.2.2 Spezielle nichtlineare Optimierungsaufgaben . . '890 18.2.2 1 Konvexe Optimierung 890 18.2 2.2 Quadratische Optimierung . 890 18.2.3 Lösungsverfahren für quadratische Optimierungsaufgaben 891 18.2 3 1 Verfahren von Wolfe 891 18.2.3.2 Verfahren von Hildreth-d'Esopo 893 18 2 4 Numerische Suchverfahren . .... ... 893 18.2 4 1 Eindimensionale Suche 894 18 2.4.2 Minimumsuche im n-dimensionalen euklidischen Vektorraum . . . 894 18 2 5 Verfahren für unrestringierte Aufgaben . 895 18 2 5 1 Verfahren des steilsten Abstieges (Gradientenverfahren) 895 18.2 5 2 Anwendung des Newton-Verfahrens 895 18 2.5.3 Verfahren der konjugierten Gradienten 896 18.2.5 4 Verfahren von Davidon, Fletcher und Powell (DFP) 896 18.2.6 Evolutionsstrategien . . . 897 18.2.6.1 Mutations-Selektions-Strategie 897 18.2.6.2 Strategien mit Rekombination . . 897 18.2 7 Gradientenverfahren für Probleme mit Ungleichungsrestriktionen . . . . 898 18.2.7 1 Verfahren der zulässigen Richtungen 898 18.2.7.2 Verfahren der projizierten Gradienten . . . 900 18.2 8 Straf-und Barriereverfahren . . 902 18 2.8.1 Strafverfahren 902 18282 Barriereverfahren 903 18 2.9 Schnittebenenverfahren 904 18 3 Diskrete dynamische Optimierung 905
XXXII Inhaltsverzeichnis 18.3.1 Diskrete dynamische Entscheidungsmodelle 905 18 3.1.1 n-stufige EntScheidungsprozesse 905 18.3.1.2 Dynamische Optimierungsprobleme 905 18.3.2 Beispiele diskreter Entscheidungsmodelle . . 905 18.3.2.1 Einkaufsproblem 905 18.3.2.2 Rucksackproblem 906 18.3.3 Bellmansche Funktionalgleichungen 906 18.3.3.1 Eigenschaften der Kostenfunktion 906 18.3.3.2 Formulierung der Funktionalgleichungen . 907 18.3.4 Bellmansches Optimalitätsprinzip . . 907 18.3.5 Bellmansche Funktionalgleichungsmethode 908 18.3.5.1 Bestimmung der minimalen Kosten 908 18.3.5.2 Bestimmung der optimalen Politik . 908 18.3.6 Beispiele zur Anwendung der Funktionalgleichungsmethode 909 18.3.6.1 Optimale Einkaufspolitik 909 18.3.6.2 Rucksackproblem 909 19 Numerische Mathematik 911 19.1 Numerische Lösung nichtlinearer Gleichungen mit einer Unbekannten 911 19.1.1 Iterationsverfahren 911 19.1.1.1 Gewöhnliches Iterationsverfahren 911 19.1 1.2 Newton-Verfahren 912 19.1 1.3 Regula falsi 913 19.1.2 Lösung von Polynomgleichungen 914 19.1.2.1 Horner-Schema 914 19.1.2.2 Lage der Nullstellen . . 915 19.1.2.3 Numerische Verfahren 916 19.2 Numerische Lösung von Gleichungssystemen 917 19.2.1 Lineare Gleichungssysteme . . 917 19.2.1.1 Dreieckszerlegung einer Matrix 918 19.2.1.2 Cholesky-Verfahren bei symmetrischer Koeffizientenmatrix . . 920 19.2.1.3 Orthogonalisierungsverfahren 920 19.2.14 Iteration in Gesamt-und Einzelschritten 922 19.2.2 Nichtlineare Gleichungssysteme 923 19.2.2.1 Gewöhnliches Iterationsverfahren 923 19.2.2.2 Newton-Verfahren 924 19.2.2.3 Ableitungsfreies Gauß-Newton-Verfahren 924 19.3 Numerische Integration 925 19.3.1 Allgemeine Quadraturformel 925 19.3.2 Interpolationsquadraturen 926 19.3.2.1 Rechteckformel 926 19.3.2.2 Trapezformel 926 19.3.2.3 Hermitesche Trapezformel 927 19.3.2.4 Simpson-Formel 927 • 19.3.3 Quadraturformeln vom Gauß-Typ 927 19.3.3.1 Gaußsche Quadraturformeln 927 19.3.3.2 Lobattosche Quadraturformeln 928 19.3.4 Verfahren von Romberg 928 19.3.4.1 Algorithmus des Romberg-Verfahrens 928 19.3.4.2 Extrapolationsprinzip 929 19.4 Genäherte Integration von gewöhnlichen Differentialgleichungen 931 19.4.1 Anfangswertaufgaben 931
Inhaltsverzeichnis XXXIII 19.4.1.1 Eulersches Polygonzugverfahren . 931 19.4.1.2 Runge-Kutta-Verfahren 931 19.4 1 3 Mehrschrittverfahren 932 19.4.1.4 Prediktor-Korrektor-Verfahren ... 933 19.4.1.5 Konvergenz, Konsistenz, Stabilität . . 934 19 4 2 Randwertaufgaben 935 19.4.2.1 Differenzenverfahren . 935 19 4.2.2 Ansatzverfahren 936 19 4.2.3 Schießverfahren 937 19.5 Genäherte Integration von partiellen Differentialgleichungen .... . . 938 19.5 1 Differenzenverfahren ... 938 19.5.2 Ansatzverfahren . . 939 19.5.3 Methode der finiten Elemente (FEM) . 940 19 6 Approximation, Ausgleichsrechnung, Harmonische Analyse 945 19 6 1 Polynominterpolation . . 945 19.6.1 1 Newtonsche Interpolationsformel 945 19.6.1.2 Interpolationsformel nach Lagrange 945 19 6 1.3 Interpolation nach Aitken-Neville 946 19.6.2 Approximation im Mittel 947 19.6.2.1 Stetige Aufgabe, Normalgleichungen . ... 947 19 6 2 2 Diskrete Aufgabe, Normalgleichungen, Householder-Verfahren . . 948 19.6.2.3 Mehrdimensionale Aufgaben 949 19 6.2.4 Nichtlineare Quadratmittelaufgaben 950 19.6.3 Tschebyscheff-Approximation . 951 19.6.3.1 Aufgabenstellung und Alternantensatz 951 19.6.3 2 Eigenschaften der Tschebyscheff-Polynome 951 19.6.3.3 Remes-Algorithmus . 953 19 6 3 4 Diskrete Tschebyscheff-Approximation und Optimierung . . . 953 19.6.4 Harmonische Analyse 954 19.6.4.1 Formeln zur trigonometrischen Interpolation 954 19.6 4.2 Schnelle Fourier-Transformation (FFT) 955 19 7 Darstellung von Kurven und Flächen mit Hilfe von Splines . 959 19.7.1 Kubische Splines 959 19.7.1.1 Interpolationssplines . 959 19.7.1.2 Ausgleichssplines . . 960 19 7.2 Bikubische Splines 961 19 7.2.1 Anwendung bikubischer Splines . 961 19 7.2.2 Bikubische Interpolationssplines . 961 19 7.2.3 Bikubische Ausgleichssplines 962 19.7.3 Bernstein-Bezier-Darstellung von Kurven und Flächen 962 19.73.1 Prinzip der B-B-Kurvendarstellung . ... 963 19 7.3 2 B-B-Flächendarstellung 964 19.8 Nutzung von Computern .... . 965 19.8 1 Interne Zeichendarstellung . ... 965 19.8.1.1 Zahlensysteme . ... 965 19.8.1.2 Interne Zahlendarstellung . 966 19.8.2 Numerische Probleme beim Rechnen auf Computern 968 19.8.2 1 Einführung, Fehlerarten 968 19 8 2 2 Normalisierte Dezimalzahlen und Rundung .... 968 19.8.2.3 Genauigkeitsfragen beim numerischen Rechnen 970 19.8 3 Bibliotheken numerischer Verfahren . . . 973 19.8.3.1 NAG-Bibliothek 974
XXXIV Inhaltsverzeichnis 19.8.3.2 IMSL-Bibliothek 974 19.8.3.3 Aachener Bibliothek 975 19.8.4 Anwendung von Computeralgebrasystemen 975 19.8.4 1 Mathematica .975 19.8.4 2 Maple 979 20 Computeralgebrasysteme 982 20.1 Einführung k 982 20 1 1 Kurzcharakteristik von Computeralgebrasystemen . . . . . 982 20.1.2 Einführende Beispiele für die Hauptanwendungsgebiete 983 20.1.2.1 Formelmanipulation 983 20.1.2.2 Numerische Berechnungen ... 983 20 1.2 3 Graphische Darstellungen . 984 20.1.2.4 Programmierung in Computeralgebrasystemen 984 20.13 Aufbau von und Umgang mit Computeralgebrasystemen ... . . 984 20.1 3.1 Hauptstrukturelemente 984 20.2 Mathematica 986 20.2.1 Haupstrukturelemente . . 986 20.2.2 Zahlenarten in Mathematica . . . . 987 20.2.2.1 Grundtypen von Zahlen in Mathematica 987 20.2.2.2 Spezielle Zahlen 987 20.2.2.3 Darstellung und Konvertierung von Zahlen 988 20.2 3 Wichtige Operatoren 988 20.2.4 Listen 989 20.2.4 1 Begriff und Bedeutung * 989 20.2.4.2 Verschachtelte Listen 990 20.2.4.3 Operationen mit Listen 990 20.2.4.4 Spezielle Listen 990 20.2.5 Vektoren und Matrizen als Listen 991 20.2 5.1 Aufstellung geeigneter Listen 991 20.2.5.2 Operationen mit Matrizen und Vektoren 991 20.2.6 Funktionen 993 20.2.6.1 Standardfunktionen 993 20.2.6.2 Spezielle Funktionen 993 20.2.6.3 Reine Funktionen 993 20.2 7 Muster 993 20.2.8 Funktionaloperationen 994 20.2.9 Programmierung 995 20.2.10 Ergänzungen zur Syntax, Informationen, Meldungen 996 20.2.10.1 Kontexte, Attribute 996 20.2.10.2 Informationen 997 20 2 10 3 Meldungen . 997 20 3 Maple 998 20.3.1 Hauptstrukturelemente . . . 998 20.3.1 1 Typen und Objekte 998 20.3.1.2 Eingaben und Ausgaben 999 20 3.2 Zahlenarten in Maple 1000 20.3.2.1 Grundtypen von Zahlen in Maple 1000 20.3.2.2 Spezielle Zahlen 1000 20.3 2.3 Darstellung und Konvertierung von Zahlen 1000 20.3.3 Wichtige Operatoren in Maple 1001 20.3.4 Algebraische Ausdrücke . . . .1001
Inhaltsverzeichnis XXXV 20.3.5 Folgen und Listen ... 1002 20 3.6 Tabellen- und feldartige Strukturen, Vektoren und Matrizen ... ... 1003 20 3 6 1 Tabellen- und feldartige Strukturen 1003 20.3.6.2 Eindimensionale Arrays 1004 20 3 6 3 Zweidimensionale Arrays .... . 1004 20 3 6.4 Spezielle Anweisungen zu Vektoren und Matrizen 1005 20.3 7 Prozeduren, Funktionen und Operatoren .... . . . . . 1005 203 7 1 Prozeduren 1005 20.3.7.2 Funktionen . . 1006 20 3.7.3 Funktionaloperatoren ... 1007 20.3.7.4 Differentialoperatoren 1007 20 3 7.5 Der Funktionaloperator map 1007 20 3.8 Programmierung in Maple 1008 20.3.9 Ergänzungen zur Syntax, Informationen und Hilfe ... 1008 20 3 9.1 Nutzung der Maple-Bibliothek 1008 20 3 9.2 Umgebungsvariable 1009 20 3.9 3 Informationen und Hilfe 1009 20.4 Anwendungen von Computeralgebrasystemen 1010 20.4 1 Manipulation algebraischer Ausdrücke .. ...1010 20 4.1 1 Mathematica 1010 20 4 1.2 Maple 1012 20.4.2 Lösung von Gleichungen und Gleichungssystemen . . 1015 20 4 2 1 Mathematica 1015 20.4 2 2 Maple 1017 20 4.3 Elemente der linearen Algebra 1019 20 4 3.1 Mathematica 1019 20 4.3.2 Maple 1021 20 4.4 Differential- und Integralrechnung . ... 1023 20.4.4.1 Mathematica 1023 20 4 4.2 Maple 1027 20 5 Graphik in Computer algebrasystemen . 1030 20 5 1 Graphik mit Mathematica 1030 20.5.1.1 Grundlagen des Graphikaufbaus 1030 20.5.1.2 Graphik-Primitive 1030 20.5.1.3 Graphikoptionen 1031 20 5 1 4 Syntax der Graphikdarstellung 1031 20.5.1.5 Zweidimensionale Kurven .... 1033 20.5 1.6 Parameterdarstellung von Kurven 1034 20 5 1.7 Darstellung von Flächen und Raumkurven . 1035 20 5 2 Graphik mit Maple . 1037 20 5 2.1 Zweidimensionale Graphik . . . . . . 1037 20.5.2 2 Dreidimensionale Graphik 1039 21 Tabellen 1041 21 1 Häufig gebrauchte Konstanten . 1041 21 2 Fundamentale physikalische Konstanten 1041 21 3 Dezimalvorsätze _ . 1043 21 4 Physikalische Einheiten im SI-System 1043 21.5 Wichtige Reihenentwicklungen .... 1045 21 6 Fourier-Entwicklungen . . 1050 21.7 Unbestimmte Integrale . . 1053 21.7.1 Integrale rationaler Funktionen 1053
XXXVI Inhaltsverzeichnis 21.7.1.1 Integrale mit X = ax + b 1053 21.7.12 Integrale mit X = ax2 + bx + c 1055 21.7.1.3 Integrale mit X = a2 ± x2 1056 217.1.4 Integrale mit X = a3 dt x3 1058 21.7.15 Integrale mit X = a4 + x4 1059 21.7 16 Integrale mit X = a4 - x4 1059 21.7.1.7 Einige Fälle der Partialbruchzerlegung 1059 21.72 Integrale irrationaler Funktionen . . . . 1060 21.7.2.1 Integrale mit y/x und a2 ± b2x . 1060 21.7.2.2 Andere Integrale mit y/x . . 1060 217 2 3 Integrale mit Vax + b . 1060 21.7 2.4 Integrale mit Vax + b und y/Jx + g .... . . 1062 21.7 2.5 Integrale mit y/a2 - x2 . . . . 1063 21.7.2 6 Integrale mit y/x2 + a2 . . 1064 21 7 2.7 Integrale mit y/x2 - a2 . 1066 21.7 2.8 Integrale mit \Jax2 + bx + c . . . 1068 21.7.2.9 Integrale mit anderen irrationalen Ausdrücken 1070 21.7.2 10 Rekursionsformeln für Integral mit binomischem Differential . . 1070 21.7.3 Integrale trigonometrischer Funktionen . 1070 217.3.1 Integrale mit Sinusfunktion 1070 21.7.3 2 Integrale mit Kosinusfunktion 1073 217 3 3 Integrale mit Sinus- und Kosinusfunktion 1075 21 7.3.4 Integrale mit Tangensfunktion . . . 1079 21 7 3.5 Integrale mit Kotangensfunktion . . . 1079 21.7.4 Integrale anderer transzendenter Funktionen 1080 21.7.4.1 Integrale mit Hyperbelfunktionen . 1080 21.7.4.2 Integrale mit Exponentialfunktionen ... . . 1081 21 7 4.3 Integrale mit logarithmischen Funktionen . 1082 21.7.4.4 Integrale mit inversen trigonometrischen Funktionen 1084 21.7.4 5 Integrale mit inversen Hyperbelfunktion 1085 21 8 Bestimmte Integrale . . 1086 21.8 1 Bestimmte Integrale trigonometrischer Funktionen 1086 21.8 2 Bestimmte Integrale von Exponentialfunktionen 1087 21.8.3 Bestimmte Integrale logarithmischer Funktionen 1088 21.8.4 Bestimmte Integrale algebraischer Funktionen 1089 21.9 Elliptische Integrale 1091 219.0.1 Elliptische Integrale 1. Gattung 1091 21.9 0.2 Elliptische Integrale 2. Gattung 1091 21.9.0 3 Vollständige elliptische Integrale K und E 1092 21.10 Gammafunktion 1093 21.11 Bessel-Funktionen (Zylinderfunktionen) 1094 21.12 Legendresche Polynome 1 Art (Kugelfunktionen) 1096 21.13 Laplace-Transformationen 1097 21 14 Fourier-Transformationen 1103 21.14.1 Fourier-Kosinus-Transformationen 1103 21.14.2 Fourier-Sinus-Transformationen .... 1109 21.14.3 Fourier-Transformationen . . . . . 1114 21.14.4 Exponentielle Fourier-Transformationen 1116 21 15 ^-Transformationen 1117 21.16 Poisson-Verteilung 1120 21 17 Normierte Normalverteilung .... 1122
Inhaltsverzeichnis XXXVII 21.17.1 Normierte Normalverteilung für 0 00 <x< 1.99 1122 21 18 x2-Verteilung 1124 21.19 Fishersche F-Verteilung 1125 2120 Studentsche £-Verteilung 1127 21.21 Zufallszahlen . 1128 22 Literatur 1129 Stichwortverzeichnis 1145 Mathematische Zeichen 1194
Tabellenverzeichnis XXXIX Tabellenverzeichnis 1 1 Definition der Potenzen . 8 1 2 Lösung kubischer Gleichungen mit Hilfsgrößen 42 2 1 Definitions- und Wertebereich der trigonometrischen Funktionen . 78 2.2 Vorzeichen der trigonometrischen Funktionen . 79 2 3 Spezielle Werte der trigonometrischen Funktionen 79 2.4 Reduktionsformeln oder Quadrantenrelationen der trigonometrischen Funktionen . 79 2.5 Beziehungen zwischen den trigonometrischen Funktionen gleichen Arguments im Intervall 0 < ex < tt/2 . . 81 2 6 Definitions- und Wertebereiche der zyklometrischen Funktionen .... . . 86 2 7 Beziehungen zwischen den Hyperbelfunktionen gleichen Arguments für x > 0 ... 91 2.8 Definitions- und Wertebereiche der Areafunktionen ... ... . .... 93 3.1 Winkelbezeichnungen im Grad-und im Bogenmaß 132 3 2 Eigenschaften einiger regelmäßiger Vielecke . . . 142 3.3 Bestimmungsgrößen ebener rechtwinkliger Dreiecke 145 3 4 Bestimmungsgrößen ebener schiefwinkliger Dreiecke, Grundaufgaben 147 3 5 Umrechnung zwischen Grad und Gon ... . . . 149 3 6 Richtungswinkel bei vorzeichentreuer Streckeneingabe über arctan 149 3 7 Elemente der regulären Polyeder mit der Kantenlänge a 158 3 8 Bestimmungsgrößen sphärischer rechtwinkliger Dreiecke 174 3.9 Grundaufgaben 1 und 2 für sphärische schiefwinklige Dreiecke 175 3.10 Grundaufgabe 3 für sphärische schiefwinklige Dreiecke 175 3.11 Grundaufgabe 4 für sphärische schiefwinklige Dreiecke 177 3.12 Grundaufgaben 5 und 6 für sphärische schiefwinklige Dreiecke 178 3.13 Skalare Multiplikation von Grundvektoren 191 3.14 Vektorielle Multiplikation von Grundvektoren 191 3 15 Skalare Multiplikation von reziproken Grundvektoren . 192 3 16 Vektorielle Multiplikation von reziproken Grund vektoren 192 3 17 Vektorielle Gleichungen 193 3.18 Geometrische Anwendungen der Vektoralgebra .... 194 3 19 Kurvengleichungen 2 Ordnung mit 8 ^ 0 (Mittelpunktskurven) 211 3 20 Kurvengleichungen 2. Ordnung mit 8 = 0 (Parabolische Kurven) 212 3 21 Koordinatenvorzeichen in den Oktanten 214 3 22 Zusammenhang zwischen kartesischen, Kreiszylinder und Kugelkoordinaten ... 216 3.23 Bezeichnungen der Richtungskosinus bei Koordinatentransformation 217 3.24 Gestalt der Flächen 2. Ordnung mit 6 ^ 0 (Mittelpunktsflächen) 230 3 25 Gestalt der Flächen 2. Ordnung mit 8 = 0 (Paraboloide, Zylinder und Ebenenpaare) 230 3 26 Tangenten- und Normalengleichungen 234 3 27 Vektor- und Koordinatengleichungen von Raumkurvengrößen 248 3 28 Vektor- und Koordinatengleichungen von Raumkurvengrößen als Funktion der Bogenlänge . 248 3 29 Gleichungen der Tangentialebene und der Flächennormalen 253 51 Wahrheitstafeln der Aussagenlogik 295 5 2 NAND-Funktion 297 5 3 NOR-Funktion ... 297 5 4 Primitive BRAVAIS-Gitter .320 5 5 BRAVAIS-Gitter, Kristallsysteme und Kristallklassen 321
XL Tabellenverzeichnis 5 6 Einige BoOLEsche Funktionen mit zwei Variablen 357 5 7 Tabellarische Darstellung einer unscharfen Menge . 374 5.8 t- und s-Normen, p e R . . 381 5.9 Gegenüberstellung von Operationen der BoOLEschen und der Fuzzy-Logik 383 6.1 Ableitungen elementarer Funktionen . 396 6 2 Differentiationsregeln . . ... . 400 6.3 Ableitungen höherer Ordnung einiger elementarer Funktionen 402 7.1 Erste Bernoullische Zahlen . . . 428 7.2 Erste Eulersche Zahlen . .429 7 3 Näherungsformeln für einige oft gebrauchte Funktionen.... . 436 8.1 Grundintegrale (Integrale der elementaren Funktionen) . . ... . 446 8.2 Wichtige Integrationsregeln für unbestimmte Integrale . . 447 8.3 Substitutionen zur Integration irrationaler Funktionen I . . 452 8.4 Substitutionen zur Integration irrationaler Funktionen II . 453 8.5 Wichtige Eigenschaften bestimmter Integrale . . . . ... 458 8 6 Kurvenintegrale 1. Art ... . . . . 481 8 7 Kurvenelemente . . . 482 8.8 Ebene Flächenelemente . 492 8 9 Anwendungen von Doppelintegralen . . 494 8 10 Anwendungen von Dreifachintegralen . . . . 497 8 11 Volumenelemente . 497 8.12 Flächenelemente gekrümmter Flächen . . . 499 11.1 Nullstellen der LEGENDREschen Polynome 1. Art . . .594 13.1 Zusammenhang zwischen den Komponenten eines Vektors in kartesischen, Zylinder- und Kugelkoordinaten. . ... ... . . . 669 13.2 Prinzipielle Verknüpfungen bei den Differentialoperatoren 679 13.3 Vektor analytische Ausdrücke in kartesischen, Zylinder- und Kugelkoordinaten . 680 13.4 Linien-, Flächen- und Volumenelemente in kartesischen, Zylinder- und Kugelkoordinaten . . . .... . .... . . 681 14 1 Real- und Imaginärteile der trigonometrischen und Hyperbelfunktionen 722 14.2 Absolutbeträge und Argumente der trigonometrischen und Hyperbelfunktionen . . 723 14.3 Perioden, Nullstellen und Pole der jACOBischen Funktionen . 727 15.1 Übersicht über Integraltransformationen von Funktionen einer Veränderlichen 731 15.2 Vergleich der Eigenschaften von FOURIER- und LAPLACE-Transformation . . . 753 16.1 Zusammenstellung der Formeln der Kombinatorik . . . 770 16.2 Verknüpfungen zwischen Ereignissen . . . . . 771 16 3 Häufigkeitstabelle . . .796 16 4 x2~Anpassungstest 799 16.5 Statistische Sicherheit des Stichprobenmittelwertes . . . 800 17 1 Ruhelagetypen im dreidimensionalen Phasenraum 833 19 1 Hilfstabelle zur FEM 943 19 2 Orthogonalpolynome ... . . . 948 19.3 Zahlensysteme 965 19 4 Parameter für die Basisformate . 968
Tabellenverzeichnis XLI 19.5 Mathematica, Operationen für numerische Berechnungen 975 19.6 Mathematica, Anweisungen zur Interpolation 977 19.7 Mathematica, Numerische Lösung von Differentialgleichungen 978 19.8 Maple, Optionen des Befehls fsolve 980 20 1 Mathematica, Zahlenarten 987 20.2 Mathematica, Wichtige Operatoren 988 20 3 Mathematica, Befehle für die Auswahl von Listenelementen 989 20.4 Mathematica, Operationen mit Listen 990 20 5 Mathematica, Operation Table 990 20.6 Mathematica, Operationen mit Matrizen 991 20.7 Mathematica, Standardfunktionen 993 20.8 Mathematica, spezielle Funktionen 993 20.9 Maple, Basistypen 998 20.10 Maple, Typenubersicht 998 20.11 Maple, Zahlenarten 1000 20.12 Maple, Argumente der Funktion convert 1000 20.13 Maple, Standardfunktionen f 1006 20.14 Maple, spezielle Funktionen 1006 20.15 Mathematica, Anweisungen zur Manipulation algebraischer Ausdrücke 1010 20.16 Mathematica, Algebraische Polynomoperationen 1011 20.17 Maple, Operationen zur Manipulation algebraischer Ausdrücke 1012 20.18 Mathematica, Operationen zur Lösung von Gleichungssystemen 1017 20.19 Maple, Matrizenoperationen 1021 20.20 Maple, Operationen des GAUSSschen Algorithmus 1022 20.21 Mathematica, Operationen der Differentiation 1024 20 22 Mathematica, Anweisungen zur Lösung von Differentialgleichungen 1026 20.23 Maple, Optionen der Operation dsolve 1029 20.24 Mathematica, Zweidimensionale Graphikobjekte 1030 20.25 Mathematica, Graphikanweisungen 1031 20.26 Mathematica, einige Graphikoptionen 1031 20.27 Mathematica, Optionen zur 3D-Graphik 1036 20.28 Maple, Optionen des Plot-Befehls 1037 20.29 Maple, Optionen des Befehls plot3d 1040 21.1 Häufig gebrauchte Konstanten 1041 21.2 Fundamentale physikalische Konstanten 1041 21.3 Dezimalvorsätze 1043 21.4 Physikalische Einheiten im SI-System 1043 21 5 Wichtige Reihenentwicklungen 1045 21.6 Fourier-Entwicklungen .... 1050 21 7 Unbestimmte Integrale 1053 21.8 Bestimmte Integrale 1086 21.9 Elliptische Integrale 1091 21.10 Gammafunktion 1093 21.11 Bessel-Funktionen (Zylinderfunktionen) 1094 21.12 Legendresche Polynome 1. Art (Kugelfunktionen) 1096 21 13 Laplace-Transformationen 1097 21.14 Fourier-Transformationen 1103 21 15 ^-Transformationen 1117 21 16 Poisson-Verteilung 1120 21.17 Normierte Normalverteilung 1122 21.18 x2-Verteilung 1124
XLII Tabellenverzeichnis 21.19 Fishersche F-Verteilung 1125 21.20 Studentsche t-Verteilung 1127 21.21 Zufallszahlen 1128
1 1 Arithmetik 1.1 Elementare Rechenregeln 1.1.1 Zahlen 1.1.1.1 Natürliche, ganze und rationale Zahlen 1. Definitionsbereiche und Bezeichnungen Alle ganzen und gebrochenen Zahlen, die positiven und negativen sowie die Null, werden rationale Zahlen genannt. Man verwendet die folgenden Bezeichnungen (s. 5.2.1,1., S. 300): • Menge der natürlichen Zahlen: N={0,1,2,3,...}, • Menge der ganzen Zahlen: Z= {..., —2, —1,0,1,2,...}, • Menge der rationalen Zahlen: Q= {x\x = - mit p G Z, q € Z und q ^ 0} . Q Die natürlichen Zahlen sind aus dem Bedürfnis des Abzählens bzw. des Ordnens entstanden. Die natürlichen Zahlen werden auch als nichtnegative ganze Zahlen bezeichnet. 2. Eigenschaften der Menge der rationalen Zahlen • Die Menge der rationalen Zahlen ist unendlich. • Die Menge ist geordnet, d.h., für je zwei verschiedene rationale Zahlen a und b kann man angeben, welche von beiden kleiner als die andere ist. • Die Menge ist überall dicht, d.h., zwischen je zwei verschiedenen rationalen Zahlen a und b (a <b) existiert wenigstens eine rationale Zahl c (a < c < b). Daraus folgt, daß zwischen zwei verschiedenen rationalen Zahlen unendlich viele weitere rationale Zahlen liegen. 3. Arithmetische Operationen Die arithmetischen Operationen (Addition, Subtraktion, Multiplikation und Division) mit zwei beliebigen rationalen Zahlen sind stets möglich und liefern im Ergebnis wieder eine rationale Zahl. Eine Ausnahme davon ist die Division durch Null, die unmöglich ist: Die Schreibweise o : 0 hat keinen bestimmten Sinn, da es keine bestimmte rationale Zahl b gibt, die der Gleichung 6-0 = a mit a ^ 0 genügt. Für a = 0 kann b eine beliebige rationale Zahl sein. Die oft verwendete Schreibweise a : 0 = oo (unendlich) bedeutet nicht, daß diese Division möglich ist; es ist lediglich eine Abkürzung für die Aussage: Wenn sich der Nenner Null nähert, wächst der Quotient absolut genommen über alle Grenzen. 4. Dezimalbruch und Kettenbruch Jede rationale Zahl a kann in der Form eines endlichen oder unendlichen periodischen Dezimalbruches oder auch in der Form eines Kettenbruches dargestellt werden (s. 1.1.1.4, S. 3). 5. Geometrische Darstellung Wenn auf einer Geraden ein Anfangspunkt 0 (Nullpunkt), eine positive Richtung (Orientierung) und eine Längeneinheit / (Maßstab, s. auch 2.17.1, S. 116) festgelegt worden sind (Abb.1.1), dann entspricht jeder rationalen Zahl a ein bestimmter Punkt dieser Geraden. Er hat die Koordinate a und ist ein sogenannter rationaler Punkt. Die Gerade wird Zahlengerade genannt. Da die Menge der rationalen Zahlen überall dicht ist, gibt es zwischen je zwei beliebigen rationalen Punkten unendlich viele weitere rationale Punkte. -3-W -2-1 0 1 | 2 | 3 —•-• • • • •—•—• •—•— B 1 iE. 0 12 3 Abbildung 1.1 Abbildung 1.2 1.1.1.2 Irrationale und transzendente Zahlen Für die Analysis reicht die Menge der rationalen Zahlen nicht aus. Obgleich sie überall dicht ist, füllt sie nicht die gesamte Zahlengerade aus. Wenn man z.B. die Diagonale AB des Einheitsquadrats um A
2 1. Arithmetik dreht, so daß B in den Punkt K der Zahlengeraden übergeht (Abb. 1.2), dann hat K keine rationale Koordinate Erst die Einführung der irrationalen Zahlen ermöglicht es, jedem Punkt der Zahlengeraden eine Zahl zuzuordnen (s. auch Hinweis in 5.2.4,3., S. 307) In den Lehrbüchern der Analysis wird eine exakte Definition der irrationalen Zahlen gegeben, z.B. durch Intervallschachtelung Für die Anschauung genügt die Feststellung, daß die irrationalen Zahlen auf der Zahlengeraden die Punkte einnehmen, die als Lücken zwischen den rationalen Zahlen vorhanden sind, und daß jede irrationale Zahl durch einen nichtperiodischen unendlichen Dezimalbruch oder einen nichtperiodischen unendlichen Kettenbruch dargestellt werden kann. Zu den irrationalen Zahlen gehören insbesondere die nicht ganzzahligen reellen Wurzeln der algebraischen Gleichungen der Form xn + an-\Xn~l + • • • + a\X + üq = 0 (n > 1, ganzzahlig; ganzzahlige Koeffizienten). A.1a) Man nennt solche Wurzeln algebraische Irrationalitäten. ¦ A: Einfachste Beispiele für algebraische Irrationalitäten sind die reellen Wurzeln der Gleichungen xn — a = 0, also Zahlen der Form y/ä, wenn sie nicht rational sind ¦ B: v^2 = 1,414..., v^lÖ = 2,154 ... sind algebraische Irrationalitäten Irrationale Zahlen, die keine algebraischen Irrationalitäten sind, nennt man transzendente Zahlen ¦ A: TT = 3,141592 ... , e = 2,718281... sind transzendente Zahlen ¦ B: Die dekadischen Logarithmen der ganzen positiven Zahlen mit Ausnahme von Zahlen der Form 10n sind transzendente Zahlen. Die nichtganzzahligen Wurzeln der quadratischen Gleichung x2 + a\X + a0 = 0 (ai, a0 ganzzahlig) A lb) werden quadratische Irrationalitäten genannt. Sie haben die Form (a + b\[Ü)jc (a, 6, c ganzrational, c ^ 0; D > 0 , quadratfrei). ¦ Die Teilung einer Strecke a im Verhältnis des Goldenen Schnittes x/a = (a — x)/x (s 3.5 2 3,3., S. 198) führt im Falle a = 1 auf die quadratische Gleichung x2 + x — 1 = 0. Die Lösung x = (y/E — l)/2 ist eine quadratische Irrationalität. Sie enthält die irrationale Zahl \/5. 1.1.1.3 Reelle Zahlen Alle rationalen und irrationalen Zahlen werden zu den reellen Zahlen zusammengefaßt. Sie bilden die Menge der reellen Zahlen, die mit R bezeichnet wird. 1. Haupteigenschaften Die reellen Zahlen besitzen die folgenden Haupteigenschaften- • Die Menge der reellen Zahlen ist unendlich. • Die Menge der reellen Zahlen ist geordnet (s. 1.1.1.1,2., S. 1). • Die Menge der reellen Zahlen ist überall dicht (s. 1.1.1.1,2., S. 1) • Die Menge der reellen Zahlen ist stetig, d h , jedem Punkt der Zahlengeraden entspricht eine reelle Zahl. Das gilt für die Menge der rationalen Zahlen nicht. 2. Arithmetische Operationen Die arithmetischen Operationen sind mit reellen Zahlen stets durchführbar und ergeben stets wieder eine reelle Zahl. Eine Ausnahme ist die Division durch Null (s. 1 1.1.1,2., S. 1). Das Potenzieren und seine Umkehrung sind ebenfalls im System der reellen Zahlen möglich; aus jeder positiven reellen Zahl lassen sich beliebige Wurzeln ziehen; zu jeder positiven reellen Zahl gibt es einen Logarithmus mit beliebiger positiver Basis, ausgenommen die Eins als Basis Eine weitergehende Verallgemeinerung des Zahlbegriffs in der Analysis führt zu den komplexen Zahlen (s 1 5, S 34). 3. Zahlenintervall Eine zusammenhängende Menge reeller Zahlen mit den Endpunkten a und b, wobei a < b ist und auch a gleich —oo und b gleich +oo sein kann, wird Zahlenintervall mit den Endpunkten a und b genannt.
1 1 Elementare Rechenregeln 3 Wenn der Endpunkt nicht selbst zum Intervall gehört, spricht man vom offenen Intervallende, im entgegengesetzten Falle vom abgeschlossenen Intervallende. Die Angabe eines Zahlenintervalls erfolgt durch seine Endpunkte a und 6, indem diese in Klammern gesetzt werden. Eine eckige Klammer steht für ein geschlossenes Intervallende, eine runde für ein offenes Es wird zwischen beiderseits offenen Intervallen (a, b), halboffenen Intervallen [a, b) bzw. (a, b] und abgeschlossenen Intervallen [a, b] unterschieden. Für offene Intervalle findet man auch die Bezeichnung ]a, b[ an Stelle von (a, b), analog [a, b[ an Stelle von [a, b) In der graphischen Darstellung wird ein offenes Ende durch eine Pfeilspitze, ein abgeschlossenes Intervallende durch einen Punkt gekennzeichnet. 1.1.1.4 Kettenbrüche Kettenbrüche sind ineinandergeschachtelte Brüche, mit deren Hilfe reelle Zahlen, also rationale und irrationale Zahlen dargestellt und besser approximiert werden können, als es die Dezimalzahldarstellung (s 19 8 1 1,1., S. 965) erlaubt (s. ¦ A und ¦ B auf S. 4). 1. Rationale Zahlen Kettenbrüche rationaler Zahlen sind endlich Für P _ _ , ±_ p ~ — öo J positive rationale Zahlen - > 1 haben sie die ne- # Q benstehende Form V Abkürzend schreibt man - = [a0, fli, ö2, • • •, On]- Die Zahlen a^ (k = 0,1,2,..., n) können mit Hilfe des ElJKLlDischen Algorithmus wie folgt ermittelt werden: ? = ao + ü{o<!l<1), q q g ± = ai + 1{Q<*<l)i n n rx n = a2 + ^@<ü<i), r2 r2 r2 7" 2 rn rn = an_! + @ < < 1), rn-i rn-i rn-i = an (rn+i = 0) rn Die Zahlen p, q sowie r^ (k = 1,2, .., n) sind positive natürliche Zahlen ' 3 + 2. Irrationale Zahlen D Kettenbrüche irrationaler Zahlen a brechen nicht ab Sie heißen daher unendliche Kettenbruche, und man schreibt [ao; a\, a\, .] ¦ >/2 = l + \/2-l = l + -J1— = 1 + — mit Xl = \/2 + 1 = 2 + (y/2 - 1) = 2 + -^— = v^+l xi >/2 + l 1 H mit £2 = V/2 + l = 2-|- (\/2 — 1) = 2 H—7= = 1 H usw Wie x2 = X\, so gilt auch £2 V2 + 1 x3 i3 = £2, £4 = £3, Man erhält rci = £2 = £3 = #4 = • • •, d h für \/2 gilt die Kettenbruchentwick- luugv^= [1,2,2,2, . ] Wenn sich in einem unendlichen Kettenbruch einige der Zahlen a^ wiederholen, dann spricht man von 1 1 1 1 1 O-n-1 H Vx *y A.3a) A.3b) A 3c) A.3d) A.3e)
4 1. Arithmetik einem periodischen Kettenbruch. Es gilt: Jeder periodische Kettenbruch stellt eine quadratische Irrationalität (s. 1.1.1 2, S. 2) dar, und umgekehrt besitzt jede quadratische Irrationalität eine periodische Kettenbruchdarstellung. ¦ Die Zahl \/2 ist eine quadratische Irrationalität und hat die periodische Kettenbruchdarstellung v/2 = [1,2,2,2,...]. 3. Approximation reeller Zahlen Ist a = [ao; ai, a2, • • •] eine beliebige reelle Zahl, dann stellt jeder endliche Kettenbruch dk = [ao;ai,fl2, • ,flfc] = - A-4) eine Approximation von a dar. Der Kettenbruch ak wird auch als k-ter Näherungsbruch von a bezeichnet. Er läßt sich rekursiv wie folgt berechnen: Pk UkPk-l+Pk-2 /, ^ -, -, n i\ /i c\ ak = — = ¦ (fc>l; p_i = l,Pö = ao; 0-1 = 0,go = l). A.5) Qk akqk-i + Qk-2 Nach dem Approximationssatz von Liouville gilt folgende Fehlerabschatzung: \a-ak\ = \a-^\<± A.6) Qk Qk Darüber hinaus kann man zeigen, daß die Näherungsbruche ctk die reelle Zahl a mit wachsender Genauigkeit von unten und von oben abwechselnd approximieren. Die Näherungsbrüche konvergieren besonders schnell gegen a, wenn die Zahlen a* (i = 1,2,..., k) in A 4) große Werte aufweisen. Demzufolge liegt die schlechteste Konvergenz bei Zahlen der Form [1,1,1,...] vor. ¦ A: Aus der Dezimalzahldarstellung von tt erhält man gemäß A.3a) die Kettenbruchdarstellung 7T = [3; 7,15,1,292,...]. Die zugehörigen Näherungsbrüche A 5) mit den Abschätzungen gemäß A.6) 22 . , 1 __2 333 . , , 1 rt , . 355 lauten: ax = — mit |tt - ai| < ^ « 2 • 10 , a2 = — mit |tt - a2\ < j^ «9-10 D, a3 = — mit |7r — ck3| < ——- « 8 • 10~5 . Die tatsächlichen Fehler sind wesentlich kleiner. Sie liegen bei ct\ unter 1,3- 10~3, bei #2 unter 8,4 • 10~5 und bei a$ unter 2,7 • 10-7. Die Näherungsbrüche «1,02 und «3 stellen eine wesentlich bessere Näherung für tt dar als tt in Dezimalzahldarstellung mit entsprechender Stellenzahl. ¦ B: Für die Formel des Goldenen Schnittes x/a = (a — x)/x (s. 3.5.2.3,3., S 198) kann man die folgenden beiden Kettenbruchdarstellungen angeben: x = a[l; 1,1,...] und x — -A + y/E) = -A + [2; 4,4,4,...]). Der Näherungsbruch a4 bringt im ersten Fall eine Genauigkeit von 0,018 a, im zweiten Fall 0,000 001a. 1.1.1.5 Kommensurabilität Zwei Zahlen a und b heißen kommensurabel, d.h. mit gleichem Maß meßbar, wenn sie ganzzahlige Vielfache einer dritten Zahl c sind. Aus a = mc, b = nc (m, n € Z) folgt dann - — x {x rational). A.7) 0 Im entgegengesetzten Falle sind a und b inkommensurabel. ¦ A: Die Länge einer Diagonale und die Seitenlänge eines Quadrates sind inkommensurabel, weil sie die irrationale Zahl y/2 zum Quotienten haben. ¦ B: Strecken, die gemäß dem Goldenen Schnitt (s. 3.5.2.3,3., S. 198) bemessen werden, sind inkommensurabel, weil dieser die irrationale Zahl y/E enthält. Somit sind auch Diagonale und Seitenlänge des regelmäßigen Fünfecks (s. 3.1.5.3, S. 141) inkommensurabel. Man geht heute davon aus, daß HiPPASOS
1.1 Elementare Rechenregeln 5 von Metapontum D50 v u Z ) am Pentagramm, das aus den Diagonalen des regelmäßigen Fünfecks (s 3 1 5 3, S 141) gebildet wird, die irrationalen Zahlen entdeckt hat 1.1.2 Beweismethoden Im wesentlichen unterscheidet man drei Beweismethoden. • direkter Beweis, • indirekter Beweis, • vollständige Induktion Außerdem spricht man noch vom konstruktiven Beweis 1.1.2.1 Direkter Beweis Es wild von einem bereits als richtig bewiesenen Satz (Voraussetzung p) ausgegangen und daraus die Wahrheit des zu beweisenden Satzes (Behauptung q) abgeleitet. Bei der logischen Schlußfolgerung wird vorwiegend die Implikation oder die Äquivalenz verwendet a) Direkter Beweis mit Hilfe der Implikation: In der Implikation p => q folgt aus der Wahrheit der Voraussetzung die Wahrheit der Behauptung (s 4 Zeile der Wahrheitstafel für die „Implikation • 5 1 1,3., S. 295). ¦ Die Ungleichung —-— > vab für a > 0, b > 0 ist zu beweisen. Voraussetzung ist die als richtig erkannte binomische Formel (a + bJ = a2 + 2ab + b2 Daraus folgt durch Subtraktion von Aab : (a 4- bJ — Aab = (a — bJ > 0, und aus dieser Ungleichung erhält man unmittelbar die Behauptung, wenn man sich beim Radizieren wegen a > 0 und b > 0 auf das positive Vorzeichen beschränkt b) Direkter Beweis mit Hilfe der Äquivalenz: Der Beweis wird durch Verifizieren, d h durch den Nachweis der Wahrheit, geführt Man geht dabei von der Wahrheit der Behauptung q aus und zeigt die Wahrheit der Behauptung p, was allerdings nur bei einer Äquivalenzp «=> q möglich ist. Praktisch bedeutet dies, daß alle Operationen, die q in p überführen, umkehrbar eindeutig sein müssen ¦ Die Ungleichung 1 + a + a2 -\ + an < für 0 < a < 1 ist zu beweisen. 1 — a Durch Multiplikation mit 1 — a erhält man (Wegen 1 — a > 0 bleibt das Ungleichheitszeichen bestehen, s auch A 102b)) 1 - a + a - a2 + a2 - a3 ± ¦ ¦ + an - an+1 = 1 - an+1 < 1. Wegen 0 < an+1 < 1 ist die entstandene Ungleichung richtig, und da die durchgeführten Rechenoperationen umkehrbar eindeutig sind, ist auch die Ausgangsungleichung richtig. 1.1.2.2 Indirekter Beweis oder Beweis durch Widerspruch Um die Behauptung q zu beweisen, geht man von der Negation q aus und schließt von q auf eine falsche Aussage r, d h q => r (s. auch 5 1 1,7., S 297) Dann muß aber a'uch q falsch sein, da man bei der Implikation nur von einer falschen Voraussetzung zu einer falschen Behauptung kommt (s 1 Zeile der Wahrheitstafel für die Implikation 5 1 1,3., S 295) Wenn aber q falsch ist, muß q wahr sein. I Es ist zu beweisen, daß die Zahl y/2 keine rationale Zahl ist Angenommen, \/2 sei rational Dann gilt \[2 = a/b mit ganzen Zahlen a, b und b ^ 0 Die Zahlen a,6 sind dabei teilerfremd, d.h., sie besitzen keinen gemeinsamen Teiler Man erhält (\/2J = 2 = a2/b2 oder a2 = 2b2 , d h , a2 wäre eine gerade Zahl, was nur dann möglich ist, wenn a = 2n eine gerade Zahl ist. Es müßte dann wegen a2 = 4n2 = 2b2 auch b eine gerade Zahl sein Das ist offensichtlich ein Widerspruch zur Voraussetzung, daß a und b teilerfremd sind 1.1.2.3 Vollständige Induktion Mit dieser Beweismethode werden Sätze oder Formeln bewiesen, die von natürlichen Zahlen n abhängen Das Prinzip dei vollständigen Induktion lautet Ist eine Aussage für eine natürliche Zahl rio wahr, und folgt aus der Wahrheit der Aussage für eine natürliche Zahl n > n0 die Wahrheit der Aussage für n + 1, dann ist die Aussage für alle natürlichen
6 1 Arithmetik Zahlen n > uq gültig. Danach erfolgt der Beweis in folgenden Schritten: 1. Induktionsanfang: Die Wahrheit der Aussage wird für n = Uq gezeigt Meist kann man n$ = 1 wählen. 2. Induktionsannahme: Die Aussage sei für n wahr (Voraussetzung p). 3. Induktionsbehauptung: Die Aussage sei für n + 1 wahr (Behauptung q). 4. Beweis der Implikation: p => q. Die Schritte 3. und 4. werden zusammengefaßt als Induktionschluß oder Schluß von n aufn + 1 bezeichnet. _ ^ . ,. T-, ! 1 1 1 1 n . . m Es ist die Formel sn = -—- + —— + -—- H 1—-. — = zu beweisen. 1-2 2-3 3-4 n(n + l) n +1 Die einzelnen Schritte des Induktionsbeweises sind: 1. n = 1 : si = -—- = ist ofTensichtlich richtig. 1 1 1 1 n . , r.. ^ , 2- sn = z—r + ^—r + 7:—7 H 1—-, TT = 7 sei wahr für n > 1. 1-2 2-3 3-4 n(n+1) n+1 n + 1 3. Unter der Voraussetzung von 2. ist zu zeigen: sn+i = . * r, ¦ 111 1 1 1 4. Beweis: sn+1 = -— + — + -—- + •••+ + = 5n + 1-2 2-3 3-4 n(n + l) (n+l)(n + 2) (n + l)(n + 2) n 1 n2 + 2n + l (n + 1J n+1 n + 1 (n + l)(n + 2) (n + l)(n + 2) (n+l)(ra + 2) n + 2 ' 1.1.2.4 Konstruktiver Beweis In der Approximationstheorie z.B. wird der Beweis eines Existenzsatzes als konstruktiv bezeichnet, wenn er bei seiner Durchführung bereits Berechnungsvorschriften für eine Lösung liefert, die die Voraussetzungen des Existenzsatzes erfüllt. ¦ Die Existenz einer natürlichen kubischen Interpolations-Spline-Funktion (s. 19.7.1.1,1. S. 959) kann wie folgt nachgewiesen werden: Man zeigt, daß die Berechnung der Spline-Koeffizienten aus den Voraussetzungen des Existenzsatzes auf ein tridiagonales lineares Gleichungssystem (s. 19.7.1.1,2., S. 960) führt, das eindeutig lösbar ist. 1.1.3 Summen und Produkte 1.1.3.1 Summen 1. Definition Zur abkürzenden Schreibweise verwendet man für Summen das Summenzeichen J2' n ai + a2 + ... + an = ]T ak A8) fc=i Mit dieser Abkürzung wird eine Summe von n Summanden ak (k = 1,2, .., n) bezeichnet. Man nennt k Laufindex oder Summationsvariable. 2. Rechenregeln 1. Summe gleicher Summanden , d.h., a^ = a für k = 1,2,.. , n- n ^cljc = na. . A.9a)
1.1 Elementare Rechenregeln 7 2. Multiplikation mit einem konstanten Faktor n n Y,cak = cY,ak- A9b) fc=i fc=i 3. Aufspalten einer Summe n m n EaA: = Eafc + E ak (l<ra<rc). A.9c) k=l k-1 k=m+l 4. Addition von Summen gleicher Länge n n n n EK + h + ck + ...) = Ea* + E bk + Ec* + • • • • (*9d) *:=i fc=i fc=i fc=i 5. Umnumerier ung n m+n—1 n n—m+l Eßfc= E ßfc-m+l , E öfc = E ak+m-l- A.9e) 6. Vertauschen der Summationsfolge bei Doppelsummen n m m n E£«* = £E«*- A9f) t=i fc=i fe=i*=i 1.1.3.2 Produkte 1. Definition Zur abkürzenden Schreibweise verwendet man für Produkte das Produktzeichen \[. n ala2 . an=Y[ak A.10) A;=l Mit dieser Abkürzung wird ein Produkt von n Faktoren ak (k = 1, 2,..., n) bezeichnet, wobei k Laufindex genannt wird 2. Rechenregeln 1. Produkt gleicher Faktoren , d h , ak = a für k = 1,2,..., w Y[ ak = an . A IIa) k=i 2. Vorziehen konstanter Faktoren f[(cak) = cnf[ak A.11b) k=l k=l 3. Aufspalten in Teilprodukte n / m \ / n \ IIa*= üa* II ak) (Km<n). A.11c) fc=l \fc=l / \A;=Tn+l / 4. Produkt von Produkten f[akbkck =(flak)(flbk)(f[ck).... (l.lld) A;=l \k=l / \k=\ / \k=\ J 5. Umnumerierung n m+n—1 n n—m+l Y[ ak = Yl ak.m+1, Yl ak = ]J ak+m-i (l.lle) k=\ k=m k=m k—l
8 1. Arithmetik 6. Vertauschen der Multiplikationsfolge bei Doppelprodukten n m m n nn^=nn^ (inf) i=lk=l fc=li=l 1.1.4 Potenzen, Wurzeln, Logarithmen 1.1.4.1 Potenzen Die Schreibweise ax wird für die algebraische Operation des Potenzierens verwendet. Man bezeichnet a als Basis, x als Exponent und ax als Potenz. Potenzen sind gemäß Tabelle 1.1 definiert. Für die Tabelle 1.1 Definition der Potenzen Basis a beliebig reell, ^ 0 positiv reell 0 Exponent x 0 n = 1,2,3,... n = -1,-2,-3,... P rational. - (p, q ganz, q > 0) Q irrational: lim — fc^oo qk positiv Potenz ax 1 an = a- a- a- ... • a (a hoch n) n Faktoren a~n ai = tfäp (q-te Wurzel aus a hoch p) hm aqi* k-*oo 0 Potenzen gelten bei Beachtung der Definitionsbereiche für Basis und Exponent die folgenden Rechenregeln: axay = ax+y^ ax.ay = ^_= flx-y> A 12) aX bX = (üb)X, ÜX : bX = ^ = (ff , A.13) (ax)y = (ay)x = axy, A.14) ax = exlna (a > 0). A.15) Dabei ist In a der natürliche Logarithmus von a und e = 2,718281828459... seine Basis. Eine spezielle Potenz ist (_i\n _ / +1, falls n gerade, , . { L) ~ \ -1, falls n ungerade [l-iK)) Man beachte besonders: a° = 1 für a ^ 0. 1.1.4.2 Wurzeln In Übereinstimmung mit Tabelle 1.1 wird als n-te Wurzel aus a die positive Zahl \fä (a > 0, reell; n > 0, ganz) A.17a) bezeichnet. Man spricht bei der Berechnung dieser Zahl vom Radizieren oder Wurzelziehen und nennt a den Radikanden und n den Wurzelexponenten. Die 2. und die 3. Wurzel werden auch Quadratwurzel bzw. Kubikwurzel genannt. Für die Lösung der Gleichung xn = a (a reell oder komplex; n > 0, ganz) A.17b) wird häufig auch die Schreibweise x = y/ä verwendet, aber dann repräsentiert diese Darstellung n Werte xk (k = 1,2,..., n), die gemäß A 141b), (s. 1 5.3.6, S 38) zu berechnen sind.
1 1 Elementare Rechenregeln 9 ¦ Die Gleichung x2 = 4 hat die zwei reellen Wurzeln ±2. ¦ Die Gleichung x3 = -8 hat die drei Wurzeln X\ = 1 + i\/3, x2 = -2 und x3 = 1 — i\/3 . 1.1.4.3 Logarithmen 1. Definition Unter dem Logarithmus einer Zahl x > 0 zur .Basis 6 > 0, b ^ 1, oder als Formel geschrieben u = logfe x, wird der Exponent der Potenz verstanden, in die b zu erheben ist, um die Zahl x zu erhalten. Folglich ergibt sich aus der Gleichung bu = x A 18a) die Gleichung log6 x = u, A.18b) und umgekehrt folgt aus der zweiten die erste Gleichung. Speziell gilt lo&l = 0, logt6=l, to&0 = {;~J;J>J; A.18c) Zur Ausdehnung des Logarithmus auf negative Argumentwerte bedarf es der komplexen Zahlen. Logarithmieren einer gegebenen Größe bedeutet das Aufsuchen ihres Logarithmus. Man versteht darunter auch die Umwandlung logarithmischer Ausdrucke gemäß A.19a, 1.19b) Das Aufsuchen einer Größe aus ihrem Logarithmus wird Potenzieren genannt 2. Einige Eigenschaften der Logarithmen 1. Jede positive Zahl besitzt für jede beliebige positive Basis ihren Logarithmus, ausgenommen die Basis b = 1. 2. Für Logarithmen einer gemeinsamen Basis b gelten die folgenden Rechenregeln: log {xy) = logx + logt/, log [ - ] = logx -logy, A 19a) log xn = n log x, speziell gilt log \fx = — log x. A.19b) n 3x2 3/y ¦ Logarithmieren des Ausdrucks n VQ : 2zu6 hg^rf= bg Cx2^) ~ logB2w3) = log3 + 21ogx + i \ogy - log2 - \ogz-3\ogu Um mit A 19a, 1 19b) Summen und Differenzen zu logarithmieren, sind diese vorher, falls möglich, in Produkte oder Quotienten umzuwandeln. Oft wird die inverse Umformung benötigt, d.h die Darstellung eines Ausdrucks mit einigen Logarithmen verschiedener Größen in den Logarithmus eines einzigen Ausdrucks 1 3x2f/y M log3 + 21ogx + - logy - log2 - log2; - 31ogw = log vg . 3. Logarithmen verschiedener Basis sind zueinander proportional, so daß sich die Logarithmen zu einer Basis a über die Logarithmen zur Basis b berechnen lassen. loga x = M \ogb x mit M = loga b = A 20) log6a Man nennt M auch den Transformationsmodul 1.1.4.4 Spezielle Logarithmen 1. Logarithmen zur Basis 10 heißen dekadische oder BRiGGSsc/ie Logarithmen Man schreibt log10£ = lgrc, und es gilt lg(a;10Q) = a + lgx . A21) 2. Logarithmen zur Basis e heißen naturliche oder NEPERsc/ie Logarithmen. Man schreibt logex = lnx. A.22)
10 1. Arithmetik Der Modul zur Überführung der natürlichen in dekadische Logarithmen ist M = Ige = pyx = 0,4342944819 ., A.23) der zur Überführung der dekadischen in natürliche Mi = ^ = In 10 = 2,3025850930. A.24) M 3. Logarithmen zur Basis 2 nennt man Duallogarithmen oder binäre Logarithmen. Man schreibt log2 x = ld x oder log2 x — lb x. A 25) 4. Logarithmentafeln Die dekadischen und die natürlichen Logarithmen stehen in Logarithmentafeln zur Verfügung Sie wurden früher mit Vorteil bei der numerischen Bildung von Potenzen oder zur Vereinfachung numerischer Multiplikationen und Divisionen verwendet. Am häufigsten wurden die dekadischen Logarithmen dazu benutzt. Heute sind die Logarithmentafeln durch die Taschenrechner und Personalcomputer weitgehend aus der rechnerischen Praxis verdrängt. Jede Dezimalzahl, also jede reelle Zahl, in diesem Zusammenhang auch Numerus genannt, kann durch Vorziehen einer Zehnerpotenz 10fc mit ganzzahligem k in der Form x = xl0fc mit 1 < x < 10 A 26a) halblogarithmisch dargestellt werden. Dabei ist x durch die Ziffernfolge von x bestimmt, während 10* die Größenordnung von x angibt. Somit wird \gx = k + \gx mit 0 < lgx < 1, d.h. lgz = 0, . A26b) Man nennt k die Kennzahl und die Ziffernfolge hinter dem Komma von lg x die Mantisse. Letztere wird der Logarithmentafel entnommen ¦ lg 324 = 2, 5105 , also Kennzahl 2 , Mantisse 5105 . Für die durch Multiplikation oder Division mit 10n entstandenen Zahlen, z B. 3240; 324000 , 3,24; 0,0324, haben die Logarithmen die gleiche Mantisse, hier 5105 , aber verschiedene Kennzahlen. Daher sind es die Mantissen, die in den Logarithmentafeln tabelliert sind Beim Ablesen der Mantisse braucht weder auf die Stelle des Kommas noch auf die links oder rechts von der Zahl stehenden Nullen einschließlich der Null vor dem Komma geachtet zu werden. Diese gehen in die Bestimmung der Kennzahl k für einen bestimmten Numerus x ein 5. Rechenschieber Neben den Logarithmen war der Rechenschieber eines der wichtigsten Hilfsmittel in der rechnerischen Praxis. Das Prinzip des Rechenschiebers beruht auf der Anwendung der Formel A.19a), die es ermöglicht, Multiplikationen und Divisionen mit Hilfe von Additionen und Subtraktionen auszuführen. Daher sind auf dem Rechenschieber die Strecken im logarithmischen Maßstab abgetragen (s Skalen- und Funktionspapiere 2.17.1, S 116), so daß die genannten Rechenoperationen auf die Addition und Subtraktion von Strecken zurückgeführt werden können. 1.1.5 Algebraische Ausdrücke 1.1.5.1 Definitionen 1. Algebraischer Ausdruck oder Term werden eine oder mehrere algebraische Größen, wie Zahlen oder Buchstabensymbole, genannt, die durch Zeichen wie, +,-,-,., J usw sowie verschiedene Arten von Klammern zur Festlegung der Operationsfolge der algebraischen Operationen miteinander verknüpft sind. 2. Identität ist eine Gleichheitsbeziehung zwischen zwei algebraischen Ausdrücken, die beim Einsetzen beliebiger Zahlenwerte anstelle der darin aufgeführten Buchstabensymbole erhalten bleibt. 3. Gleichung nennt man eine Gleichheitsbeziehung zwischen zwei algebraischen Ausdrücken, wenn sich im Unterschied zur Identität nur einige spezielle Werte einsetzen lassen. So wird z.B. eine Gleichheitsbeziehung F(x) = }{x) A.27)
1.1 Elementare Rechenregeln 11 zwischen zwei Funktionen ein und derselben Veränderlichen als Gleichung mit einer Unbekannten bezeichnet, wenn sie nur für bestimmte Werte dieser Veränderlichen richtig ist. Bleibt die Gleichheitsbeziehung für beliebige Werte der Variablen x erhalten, dann nennt man sie eine Identität bzw. man sagt, die Gleichung ist identisch erfüllt, und man schreibt F(x) = f(x) 4. Identische Umformungen werden durchgeführt, um einen algebraischen Ausdruck in einen anderen, ihm identisch gleichen zu überführen Solche Umformungen können je nach dem Ziel, das dabei verfolgt wird, verschieden aussehen. Sie sind z.B. zur Gewinnung kürzerer Ausdrücke zweckmäßig, damit das Einsetzen von Zahlen oder weitere Rechnungen bequemer werden Außerdem sind oft Ausdrücke gewünscht, die besonders gut zur Lösung von Gleichungen, zum Logarithmieren, zum Differenzieren, zum Integrieren usw. geeignet sind. 1.1.5.2 Einteilung der algebraischen Ausdrücke 1. Hauptgrößen werden diejenigen allgemeinen Zahlen (Buchstabensymbole) genannt, nach denen die algebraischen Ausdrücke klassifiziert werden; sie sind in jedem Einzelfall festzulegen. Im Falle von Funktionen sind die unabhängigen Variablen die Hauptgrößen. Die übrigen noch nicht durch Zahlen festgelegten Größen sind die Parameter des Ausdrucks. In manchen Ausdrucken werden die Parameter Koeffizienten genannt ¦ Koeffizienten treten z B in Polynomen, FOURIER-Reihen und linearen Differentialgleichungen auf. Ein Ausdruck gehört zu der einen oder anderen Klasse in Abhängigkeit davon, welche Operationen an seinen Hauptgrößen auszuführen sind. Im allgemeinen werden die Hauptgrößen meist mit den letzten Buchstaben des Alphabets x, y, z,u,v,... bezeichnet, die Parameter mit den ersten Buchstaben a, 6, c,. . Die Buchstaben m, n, p, ... verwendet man meist für ganzzahlige positive Parameter werte, z.B. für Indizes bei Summationen und Iterationen 2. Ganzrationale Ausdrücke zeichnen sich dadurch aus, daß in ihnen Additionen, Subtraktionen und Multiplikationen der Hauptgrößen vorgenommen werden, wobei das Potenzieren mit ganzzahligen nichtnegativen Exponenten eingeschlossen ist 3. Gebrochenrationale Ausdrücke enthalten neben den für ganzrationale Ausdrücke genannten Operationen noch Divisionen durch Hauptgrößen, einschließlich des Potenzierens mit negativen ganzzahligen Exponenten, sowie gegebenenfalls Divisionen durch ganzrationale Ausdrücke in den Hauptgrößen 4. Irrationale Ausdrücke zeichnen sich durch das Radizieren, also das Potenzieren mit gebrochenen Exponenten aus, d.h. durch das Radizieren ganz- oder gebrochenrationaler Ausdrücke, die ihrerseits aus Hauptgrößen bestehen 5. Transzendente Ausdrücke, d.h. Exponentialausdrücke, logarithmische und trigonometrische Ausdrücke, enthalten algebraische Ausdrücke mit Haupt großen im Exponenten, unter dem Logarithmuszeichen oder als Argument von Winkelfunktionen. 1.1.6 Ganzrationale Ausdrücke 1.1.6.1 Darstellung in Form eines Polynoms Jeder ganzrationale Ausdruck kann mit Hilfe elementarer Umformungen, also durch Zusammenziehen gleichnamiger Glieder, Addition, Subtraktion und Multiplikation von Monomen und Polynomen, in Form eines Polynoms dargestellt werden ¦ (-a3 + 2a2x - x3)Da2 + Sax) + (a3x2 + 2aV - Aax4) - (a5 + 4a3x2 - 4ax4) = -4a5 + Sa4x - 4a? x3 - Sa4x + 16aV - Sax4 + a3x2 + 2a V - Aax4 - a5 - 4aV 4- Aax4 = -5a5 + 13a3x2 - 2aV - Sax4 . 1.1.6.2 Zerlegung eines Polynoms in Faktoren Polynome lassen sich in vielen Fällen als Produkte von Monomen und Polynomen darstellen. Als Hilfsmittel stehen hierzu das Ausklammern und Gruppieren, spezielle Formeln sowie die allgemeinen Eigenschaften von Gleichungen zur Verfügung.
12 1. Arithmetik ¦ A: Ausklammern: Sax2y — 6bx3y2 4 4cx5 = 2x2Day — Sbxy2 4 2cx3). ¦ B: Gruppieren. 6x2 + xy — y2 — lOxz — 5yz = 6x2 + Sxy — 2xy — y2 — lOxz — 5yz = 3xBx 4 y) — yBx + y)- 5zBx + y) = Bx 4 y)Cx -y- 5z). ¦ C: Anwendung von Gleichungseigenschaften (s auch 1.6 3.1, S. 43): P(x) = x6 — 2x5 4 4x4 4 2x3 — 5x2 a) Ausklammern von x2, b) Feststellung, daß a\ = 1 und c*2 = — 1 Wurzeln der Gleichung P(x) = 0 sind Division von P(x) durch x2(x — l)(x 4 1) = x4 — x2 liefert als Quotienten x2 — 2x 4 5. Dieser Ausdruck läßt sich nicht weiter in reelle Faktoren zerlegen, dap = — 2, q = 5, ^ — g < 0, so daß man erhält- x6 - 2x5 4 4x4 4- 2x3 - 5x2 = x2{x - l)(x + l)(x2 - 2x 4- 5). 1.1.6.3 Spezielle Formeln (x±yJ = x2±2xy + y2, A.28) (x 4 y + zJ = x2 + y2 + z2 4 2xy + 2xz + 2^ , A.29) (x 4- 2/ 4 * 4- • • • + t 4- uJ = x2 4- y2 4- z2 4- • • • 4- t2 + u2 4 +2xy 4 2x2 + • • • 4 2xu 4 2yz 4 • • • 4 2yu 4- -- + 2tu, A 30) (x ± yf = x3 ± 3x2^ 4 3x?/2 ± y3 . A.31) Der Ausdruck (x ± y)n wird nach dem binomischen Satz berechnet (s. A.36a) bis A.36d)). (x + y)(x-y) = x2-y2, A.32) Xn-yn = xn-l + xn-2y + . . . + ^n-2 + yn-l (n > 1 , ganz) ? (! 33) = xn_1 - xn_2?/ + xyn 4 yn~l (n > 1, ungerade), A 34) x-y xn + vn x + y = xn_1 - xn_2y 4 • • • 4- xyn~2 - y71'1 (n > 1, gerade). A.35) X y „n-l ~™-2„, _i_ I „n,n-2 „,n-l x4y 1.1.6.4 Binomischer Satz 1. Erste binomische Formel Die Formel / nn « n-i, n(n-l) rt_oTo n(n — l)(n —2) _ (a + 6)n = an 4 nan *& 4- -^——V 262 + — ^ V" + • • + n(n}" (w-m + 1)fl"-- + • • • 4 nab^ 4 6" A.36a) m! wird binomischer Satz genannt. Er gilt für alle reellen oder komplexen Zahlen a und b und alle n = 1,2,... Zur Verkürzung der Schreibweise sind spezielle Koeffizienten, die Binomialkoeffizienten (s A 37a)) eingeführt worden- <«+*)-=(;)«.-+(?)«-*+(;).~v+(;)«"v+-+(„: J«*-* (:>-a **) bzw (a + i)" = f Qa"-V A.36c) 2. Zweite binomische Formel Wird in A.36a) bis A.36c) die Zahl b durch —b ersetzt, dann erhält man als zweite binomische Formel / ,\« « n i7 n(n — 1) „ 2,2 n(n —l)(n —2) _ o7o (a - 6)n = an - nan~lb 4 -^—Lan~2b2 - ^ V~3&3 +
1 1 Elementare Rechenregeln 13 +... + (_ir»("-i). •(»->»+i)aB_royB+... + oder m! (a - b)n = £ (?) (-l)kan-kbk A.36d) fc=0 W 3. BinomialkoefRzienten Für nichtnegative ganze Zahlen n und /c definiert man als Binomialko- effizient den Ausdruck @ < k < n). A.37a) \kj (n - lfc)!fc! Dabei wird abkürzend mit n' das Produkt der positiven ganzen Zahlen von 1 bis n bezeichnet und Fakultät genannt: n' = 1 • 2 • 3 • ... • n (n = 1,2,. .), per definitionem gilt : 0! = 1. A 37b) Die Werte der BinomialkoefRzienten können aus dem PASCALsc/ien Dreieck abgelesen werden: n 0 1 2 3 4 5 6 6 1 T 0 1 L 6 T (t) 1 5 1 4 15 T C Koeffizienten 1 1 1 2 3 3 6 10 10 20 T /6\ W 1 4 15 T C 1 5 1 ] 6 T /6\ W L 1 T /6\ V6/ Der erste und der letzte Koeffizient jeder Zeile ist definitionsgemäß gleich Eins; jeder andere Koeffizient in dem Schema ergibt sich als Summe der beiden links und rechts oberhalb von ihm stehenden Koeffizienten. Die Berechnung der BinomialkoefRzienten kann mit Hilfe der folgenden Formeln erfolgen: \k) (n-k k\{n-k)\ -r '«•>(;)-'• ö- (;)=¦ <¦*> n+1 k n + 1 n — k + 1 V k /. ™ ,x / n \ n — k (n\ n + 1' _ \k + lj \k + lj ' \kt Hinweis: Für beliebige reelle Zahlen a (ot € R) ist der Binomialkoeffizient wie folgt definiert: (I) a(a- l)(a - 2) ¦ - ¦ (a - k + 1) -l)(-|-2) 3! (k > 1, ganz), 1. A.38c) A.38e) A.38f) A.39) _5^ 6*
14 1 Arithmetik 4. Eigenschaften der Binomialkoeffizienten • Die Binomialkoeffizienten wachsen bis zur Mitte der binomischen Formel A 36b) an, um danach wieder abzunehmen. • Die Binomialkoeffizienten der Glieder, die gleichen Abstand vom Anfang bzw vom Ende der binomischen Formel haben, sind einander gleich. • Die Summe der Binomialkoeffizienten in der binomischen Formel n-ten Grades beträgt 2n . • Die Summe der Binomialkoeffizienten, die an den ungeraden Stellen stehen, ist gleich der Summe der an den geraden Stellen stehenden 5. Binomische Reihe Die Formel A.36a) für den binomischen Satz kann auch auf negative und gebrochene Exponenten ausgedehnt werden Für \b\ < a ergibt (a + b)n eine konvergente unendliche Reihe (s. auch 21.5, S. 1045). (« + bf = a» + na-1* + Ü^a-V + "(" " ff" ~ 2) «"'V + • • • . A 40) 1.1.6.5 Bestimmung des größten gemeinsamen Teilers zweier Polynome 1. Teiler und Vielfaches Das Polynome P(x) ist durch das Polynom Q(x) (Q{x) ^ 0) teilbar, wenn ein Polynom T(x) existiert, so daß P(x) = T(x)Q(x) oder ^\ = T(x) A41) gilt. Ist P(x) durch Q(x) teilbar, so heißt Q(x) Teiler won P(x), und P(x) heißt Vielfaches von Q(x) 2. Größter gemeinsamer Teiler Jedes Polynom, das gemeinsamer Teiler der Polynome P(x) und Q(x) ist und gleichzeitig Vielfaches jedes anderen gemeinsamen Teilers dieser beiden Polynome, heißt größter gemeinsamer Teiler ggT(P, Q) der Polynome P(x) und Q(x). M P{x) = {x- lJ(x - 2){x - 4), Q(x) = {x- lJ{x - 2){x - 3) =*? ggT(P, Q) = (x - lJ(x - 2) Wenn P(x) und Q(x) keine gemeinsamen Polynomfaktoren besitzen, dann nennt man sie teilerfremd Ihr größter gemeinsamer Teiler ist dann eine Konstante. 3. Euklidischer Algorithmus Der EVKLlDische Algorithmus ist eine Methode zur Bestimmung des größten gemeinsamen Teilers zweier Polynome P(x) und Q(x). P(x) sei vom Grade n, Q(x) sei vom Grade m , und es gelte n > m > 0. Dann führt man die folgenden Divisionen durch a) Division von P(x) durch Q(x) führt auf den Quotienten T\(x) und den Rest R\(x). P{x) = Q(x)T!(x) + Ri{x) A.42a) b) Division von Q(x) durch R\(x) führt auf den Quotienten T2(x) und den Rest R2(x) Q(x) = Rx(x)T2(x) + R2{x), A.42b) c) Division von R\(x) durch R2(x) führt auf T3(x) und Rs(x) usw Der größte gemeinsame Teiler der beiden Polynome ist dann der letzte von 0 verschiedene Rest Rk(x). Die Methode ist aus der Arithmetik mit natürlichen Zahlen bekannt (s 1 1.1.4,1., S 3). Die Ermittlung des größten gemeinsamen Teilers wird z B bei der Lösung von Gleichungen eingesetzt, bei der Abspaltung mehrfacher Wurzeln und bei der Anwendung der STURMschen Methode (s 1 6.3.2,2., S. 44). 1.1.7 Gebrochenrationale Ausdrücke 1.1.7.1 Rückführung auf die einfachste Form Jeder gebrochenrationale Ausdruck kann auf die Form eines Quotienten zweier teilerfremder Polynome gebracht werden. Dazu werden nur elementare Umformungen benötigt wie Addition, Subtraktion, Multiplikation und Division von Polynomen und Brüchen sowie Kurzen von Brüchen
1.1 Elementare Rechenregeln 15 i 2x + y öx+ - x + z ¦ Aufsuchen der einfachsten Form von — zT-r— y + {3xz + 2x + y)z2 -y2z + x + z _ Sxz3 + 2xz2 + yz2 + (x3z2 + x)(-y2z + x + z) (x3z2 4- o:)-? z x3z3 + xz 3x2;3 + 2xz2 + yz2 - x3y2z3 - xy2z + £4z2 + x2 + £3z3 + zz A3 + #£ 1.1.7.2 Bestimmung des ganzrationalen Anteils Ein Quotient zweier Polynome mit gemeinsamer Hauptgröße x wird ein echter Bruch genannt, wenn das Polynom im Zähler von niedrigerem Grade ist als das Polynom im Nenner. Im entgegengesetzten Falle spricht man von einem unechten Bruch. Jeder unechte Bruch kann in eine Summe aus einem echten Bruch und einem Polynom zerlegt werden, indem das Zählerpolynom durch das Nennerpolynom dividiert, d.h. der ganzrationale Anteil abgespalten wird. . „ . , . , A ., „, x Sx4 - 10ax3 + 22a2x2 - 2Aa3x + 10a4 ¦ Bestimmung des ganzrationalen Anteils von Rix) = — — • x2 - 2ax + Sa2 —2a3x — 5a4 Cx4-10a:r3+22aV-24a3x +10a4) : (x2 - 2ax + Sa2) = Sx2 - Aax + 5a2 + —n— —r x2 - 2ax - 3a2 Sx4- 6az3+ 9a2x2 4ax3+l3a2x2-24a3x 4ax3+ Sa2x2-12a3x 5aV-12a3:r +10o4 ba2x2-10a3x +15a4 —2a3x — 5a4 - 2a3z- 5a4. R(x) = Sx2 - 4ax + 5a2 + r2 - 2ax + 3a2" Der ganzrationale Anteil einer unecht gebrochenrationalen Funktion R(x) wird auch als asymptotische Näherung für R(x) bezeichnet, weil sich R(x) für große Werte von |aj| wie dieser Polynomanteil verhält. 1.1.7.3 Partialbruchzerlegung Jede echt gebrochenrationale Funktion P(x) anxn + an-ixn~l + • • • + axx + a0 . ^ . H ao. R{x) = —7-7 = — (n < m) A-43) Q(x) bmxm + bm-ixm-1 + • • • + bix + b0 v mit teilerfremdem Zähler- und Nennerpolynom ist eindeutig in eine Summe von Partialbrüchen der Form A a Cx + D 7 TT und 7-5 T- A-44) (x - a)k (x2 + px + q)m mit reellen Zahlen a,p, q und A, C, D zerlegbar. Dazu geht man wie folgt vor: 1. Der Koeffizient bm des Nennerpolynoms wird auf den Wert 1 gebracht, indem Nenner und Zähler von A.43) durch den ursprünglichen Wert von bm dividiert werden. 2. Für das Nennerpolynom Q(x) wird gemäß A.168) (s. S. 44) die Nullstellendarstellung ermittelt: Q{x) = (x- ax)kl {x - a2)k> •••(x- at)kl ¦(x2 + Plx + ai)mi (x2 + p2x + q2)m2 • • • {x2 + prx + qr)mr. A.45)
16 1. Arithmetik Dabei sind ai, a2,. •, &i die / reellen Wurzeln von Q(x). Außerdem hat Q(x) r Paare konjugiert komplexer Nullstellen, die man als Nullstellen der quadratischen Faktoren x2 + Pix + qi (i = 1,2, ., r) /PA2 erhält Die Zahlen pi, qi sind reell, und es gilt: ( — ] — <& < 0 . 3. Der Ansatz für die Partialbruchzerlegung lautet: P(x) Q(x) anxn + an_ia;n_1 -1- \- a\X + ao (x - ai)*1 (x - a2)k2 - • • {x2 + piX + ^i)mi (x2 + p2x + g2)m2 • • • Ai A2 Akl x — ü?i (x — aiJ (x — a\)kl Bl + B2 +•••+ Bfc2 + ••¦ £ - a2 (sc - a2J (z - a2)fc2 | CjX + .Di C2x + D2 + ... + Croia; + £>mi _ x2+piX + qi (x2 +PiX + qiJ (x2 +p\X + qi)mi | ^x + Fx | E2x + F2 ( ( Fm2x + Fm2 ' x2 + p2£ + <?2 (x2 + p2x + g2J ' (x2 + p2x + g2)m2 A46) 4. Zur Bestimmung der Konstanten A\, A2,..., Fi, F2... multipliziert man den Ansatz A 46) mit Q(x) und vergleicht den sich dabei ergebenden Zähler Z(x) mit P(x). Dabei ist Z(x) = F(x). Man ordnet Z(x) nach Potenzen von x und setzt die Koeffizienten gleicher Potenzen von Z(x) und P(x) gleich (Koeffizientenvergleich, auch Methode der unbestimmten Koeffizienten) . 6x2-x + l _A B C _ A(x2 - 1) + Bx(x + 1) + Cx(x - 1) X3 — X X X — 1 £ + 1 x(x2 — 1) Gleichsetzen der Koeffizienten vor gleichen Potenzen von x im Zähler der linken und der rechten Seite der Gleichung führt auf das Gleichungssystem 6 = A + B + C, — 1 = B — C ,\ = —A, dessen Lösung die Werte A = -1, B = 3, C = 4 ergibt ¦ B: — —r = 1 -I- — + 7 -TT Die Koeffizienten Ai, Bu B2, B3 werden mit x{x — ly x x — l (x — i)z (x — iy der Methode der unbestimmten Koeffizienten bestimmt. _ bx2 - 4x +16 ,4 Ax + Fi F>2x + F2 . " C: (*-3)(.2-, + lJ = ^ + ^TTI + (,2-, + lJ- Die Koeffiz" * *' *• D- E2 werden mit der Methode der unbestimmten Koeffizienten bestimmt. Hinweis: Hat das Nennerpolynom Q(x) nur einfache Wurzeln a1} a2,..., am , dann hat der Ansatz A.46) die Form P(x) anxn H h ßix + a0 -Ai A2 Am A.47) A.48) Q(x) (x - ai)(x - a2) - - - [x - am) x — ot\ x - a2 x-am' und die Koeffizienten können wie folgt bestimmt werden: _ P(tti) =PM =PK0 1 C(a,)' 2 <?'(a2)' •¦" m Q'(am)' In den Nennern von A.48) stehen die Werte der Ableitungen —— für x = ai, x = a2,.. , x = am dx ^ 6x2-x + l A B C n i , ¦ ~ = — H r H —r , «i = 0, a2 = +1 und a3 = -1, x6 — x x x — 1 £ + 1 P(x)=6^-, + l,C'(,) = 3^-1^=|| = -l,ß = |g = 3undC = ^ = 4,
1 1 Elementare Rechenregeln 17 A.49c) P(x) 1 3 4 „ ., . , i. , . , x . • x. . . i . -TT— = 1 H . Es ergibt sich die gleiche Lösung wie in Beispiel A. Q{x) x x-l x + \ 1.1.7.4 Umformung von Proportionen Aus der Proportion a c /-, .« x r * i. ^.i • i i . ab de b d . N - = - A.49a) folgen die Gleichungen ad = bc, - = -, 7 = -, - = - A.49b) b d c d b a a c sowie die abgeleiteten Proportionen a±b_c±d a±b_c±d a±c_b±d a+b_c+d b d a c c d a—b c—d Aus der Gleichheit der Proportionen 7- = 7- = • • • = 7- A.50a) folgt ; — = — . A.50b) bi b2 bn & 61 + 62 + ... + bn ^ v 1.1.8 Irrationale Ausdrücke Jeder irrationale Ausdruck kann in der Regel auf eine einfachere Form gebracht werden, und zwar durch Kürzen des Exponenten, Vorziehen von Termen vor das Wurzelzeichen und Beseitigen der Irrationalität im Nenner. 1. Kürzen des Exponenten Eine Kürzung des Exponenten wird erreicht, indem der Radikand in Faktoren zerlegt wird und danach der Wurzelexponent sowie die Exponenten aller Faktoren im Radikanden durch ihren größten gemeinsamen Teiler geteilt werden. ¦ ^16(x12 - 2x11 + x10) = tf4?-x52(x-lJ= fax5{x-l). 2. Beseitigen der Irrationalität Zur Beseitigung der Irrationalität im Nenner gibt es verschiedene Methoden. C: D: 3. Umformung von Potenzen und Wurzeln Durch Anwendung der Rechenregeln für Potenzen und Wurzeln (s. S. 8) lassen sich viele irrationale Ausdrücke vereinfachen. ¦ (yß + V^2" + tf? + ^) (yz _ iß + *fi _ 1^5) = (xl/2 + x2/3 + 3.3/4 + 2-7/12)^1/2 _ ^1/3 + X\/A_xb/12\ _ ^^^7/6^x5/4 + x13/12_x5/6_x_x13/12_xll/12+x3/4^_xll/12+x + ^5/6_a.ll/12_x13/12_ x7/6_a, = a.5/4_;rl3/l2_:rll/l2+x3/4:=14^5_ ^13 _ ij£n + ^3 = ^3/4^ _ ^1/6 _ ^1/3 + ^1/2) = I~x~ _ l2xy _ yföxy 1 x _ 3J2xy2z _ fäxy2z V 2y VV 2y ' '' ]j Ayz2 f8j/¥ 2yz ' 1 x- y/y x- y/y x + y/y ~ [x + y/y) (x - y/y) ~ x2-y' 1 _ x2-xyy+yy* x2-xyy+Vy1 x+yy (x + xVy)(x2-xyy+yy2') *3 + V I 81x6 \{y/2-yßf~\ 9X3 3Xy/x SXy/x{\/2 + y/x) {s/2-yfiJ~ y/2-yfi~ 2-X 3x\/2x + 3x2 2-x
18 1 Arithmetik 1.2 Endliche Reihen 1.2.1 Definition der endlichen Reihe Unter einer endlichen Reihe wird die Summe sn = aQ + ai+a2-\ han = ]Ca* (lt51) i=0 verstanden, deren Summanden in der Regel nach einem bestimmten Gesetz gebildet werden. Die Summanden ai (i = 0,1, 2, . , n) sind Zahlen und heißen Glieder der Reihe 1.2.2 Arithmetische Reihen 1. Arithmetische Reihe 1. Ordnung heißt die Reihe A.51), wenn die Differenz von je zwei aufeinanderfolgenden Summanden konstant ist, d.h. wenn gilt Acii = Oi+i — ai = d = const, also a* = a$ + id. A.52a) Somit wird sn = a0 + (clq + d) + (a0 + 2d) H h (o0 + nd) mit dem Summenwert A.52b) Sn = °^±^{n + 1) = ^Ba0 + nd). A 52c) 2. Arithmetische Reihe k-ter Ordnung heißt eine Reihe, wenn die fc-ten Differenzen Akai der Folge ao, oi, 02, .. , an konstant sind. Die Differenzen höherer Ordnung werden rekursiv durch Auai = Au-lai+l-Au-lai A/ = 2,3, . ,fc) A.53a) gebildet. Sie ergeben sich bequem aus dem folgenden Differenzenschema (auch Dreiecksschema) a0 a>2 Ö3 Aa0 Aai Aa2 A2a0 A2fl! A2a2 A2an_ A3a0 A3ß! A3an_3 2 •. Aka0 •. A*ai Afcan A.53b) A-ao Aan_i Es gilt dann für die Glieder und für die Summe a>i = a0+ I lAao+ [\A2ao + ---+ L]A*ao (i = 1,2, ,n), A.53c) {n + %+(n:1)Aa0+(n+o1)^a0 + -+^++1^a0. A.53d) 1/12/ u 3
1.2 Endliche Reihen 19 1.2.3 Geometrische Reihe Die Summe A51) wird geometrische Reihe genannt, wenn der Quotient von zwei aufeinanderfolgenden Gliedern konstant ist, d.h. wenn gilt -^— = q = const, also a{ = a0ql A 54a) Somit wird Sn — ao + clqQ + o-oQ2 + • • • + aoqn mit dem Summenwert A 54b) qn+l _ l sn = Go :— für q ^ 1 bzw sn = (n + l)a0 für q = 1 A 54c) Für n —> oo (s. 721 1,S 422) erhält man eine unendliche geometrische Reihe, die im Falle \q\ < 1 den folgenden Grenzwert hat s = -^- A 54d) i -q 1.2.4 Spezielle endliche Reihen l + 2 + 3 + ..- + (n-l) + n= ^±12 , A.55) P+(p+l) + (p + 2) + -- +(p + n)^(n+1)^ + n). A.56) 1 + 3 + 5 + • • • + Bn - 3) + Bn - 1) = r*2 , A 57) 2 + 4 + 6 + • • • + Bn - 2) + 2n = n(n + 1), A 58) 12 + 22 + 32 + ... + (n-lJ + n2^yi(yi + 1)i2n+1), A59) 6 13 + 23 + 33 + . . + (n_1K+n3= ^2(n+lJ^ A60) 12 + 32 + 52 + ,,, + Br?_1J=^(^2-l) (L61) 13 + 33 + 53 + • • + Bn - lK = n2Bn2 - 1), A.62) 3n2- 1 - (n + l)x-n + nxn+1 l4 + 24 + 34+ .. + w4=n(n+l)Bn+lQ(^ + 3n-l)> A ^ 1.2.5 Mittelwerte (S auch 16 3 2 2,1., S 796 und 16 4 1 3,1., S 813) 1.2.5.1 Arithmetisches Mittel Arithmetisches Mittel von n Größen ai, a2, , an heißt der Ausdruck ai +a2 + --- + an 1 " x^ = = -\ak A 65a) Für zwei Größen a und b ergibt sich ¦*a = ^y- A.65b)
20 1 Arithmetik Die Größen a, xa und b bilden eine arithmetische Folge 1.2.5.2 Geometrisches Mittel Geometrisches Mittel von n positiven Größen a1? a2, xG = ^/a1a2.. an = f f[ afc j Für zwei Größen a und 6 ergibt sich xG — vab , an heißt der Ausdruck A 66a) A 66b) *g a) b) Abbildung 1.3 1.2.5.3 Harmonisches Mittel Harmonisches Mittel von n Größen a\, a2 xH= -(— + — + ••• + —) = in a\ a2 an J Für zwei Größen a und b ergibt sich rl (\ \\YX 2ab XH=[2{ä+b)\ ' XH = TTb 1.2.5.4 Quadratisches Mittel Quadratisches Mittel von n Größen oi , a2 , Die Größen a, xq und b bilden eine geometrische Folge. Wenn a und b gegebene Strecken sind, dann kann eine Strecke der Länge xG = \Za~b mit Hilfe einer der in Abb. 1.3a oder Abb. 1.3b angegebenen Konstruktionen ermittelt werden Einen speziellen Fall des geometrischen Mittels stellt die Teilung einer Strecke im Verhältnis des Goldenen Schnittes dar (s. 3.5.2.3,3., S. 198). , an heißt der Ausdruck 1 n 1 "l~1 -E- nt{ak A.67a) A 67b) , an heißt der Ausdruck (ai2 4- a22 + • • • + an2 N»S* Für zwei Größen a und b ergibt sich Xq = a' + l A.1 A.68b) Das quadratische Mittel ist von Bedeutung für die Theorie der Beobachtungsfehler. 1.2.5.5 Vergleich der Mittelwerte für zwei positive Größen a und b _.. a + b r-r 2ab Für xA = -^— , xG = Vab, xH = —— , xQ ¦- 2 a + o 1. wenn a < b: a < xh < xg < xa < xq < b, 2. wenn a = b: a = xA = xG = xH = xq = b a2 + b2 alt A.69a) A.69b)
1.3 Finanzmathematik 21 1.3 Finanzmathematik Die Finanzmathematik basiert auf Anwendungen der arithmetischen und geometrischen Reihen, also der Formeln A 52a) bis A 52c) und A 54a) bis A 54d) aber diese Anwendungen sind im Bankwesen so vielfältig und speziell, daß eine eigene Disziplin mit einer Vielzahl spezieller Begriffe entstanden ist So wird in der Finanzmathematik nicht nur die Veränderung eines Kapitals durch Zinseszinsen und Rentenzahlungen betrachtet, sondern sie umfaßt im wesentlichen die Gebiete Zinsrechnung, Tilgungsrech- nurig, Raten- und Rentenrechnung, Abschreibungen, Kurs- und Effektivzinsrechnung sowie Investitionsrechnung Grundlegende Aufgabenstellungen und Lösungsformeln werden im folgenden erläutert. Für das ganze Spektrum der Finanzmathematik muß auf die Literatur verwiesen werden (s [1 2], [1.9]). VerSicherungsmathematik und Risikotheorie, die auf Methoden der Wahrscheinlichkeitsrechnung und mathematischen Statistik beruhen, stellen selbständige Disziplinen dar und werden hier nicht behandelt (s. [1.3], [1 4]) 1.3.1 Prozentrechnung p 1. Prozent Der Ausdruck p Prozent von Kbedeutet —jtzK, wobei mit K in der Finanzmathematik ein Kapital gemeint ist. Das Zeichen für Prozent ist %, d h , es gilt p%=ioö bzw 1% = °'0L (L7°) 2. Aufschlag Werden p% auf K aufgeschlagen, dann erhält man den erhöhten Wert k = K(l+m) A71) p ~ Bezieht man den Aufschlag K auf den neuen Wert K, dann sind in K auf Grund der Proportion K^.k=§ 100 V=^~ A72) F 100 +p v J Prozent Aufschlag enthalten ¦ Bei einem Warenwert von 200 - € ergeben 15 % Aufschlag einen Endpreis von 230. - €. In diesem Preis sind für den Verbraucher p = = 13,04 Prozent Aufschlag enthalten. 115 3. Abschlag oder Rabatt Werden p% Rabatt auf einen Wert K gewährt, dann erhält man den erniedrigten Wert k = K{l~m)- A73) P Bezieht man den Abschlag K-— auf den neuen Wert K , dann sind p = A 74) y 100-p V J Prozent Rabatt gewährt worden ¦ Eine Ware habe einen Wert von 300. — €. Bei 10% Rabatt sind noch 270 — € zu zahlen In diesem Preis sind für den Käufer p = ——— = 11,11 Prozent Rabatt enthalten. F 90
22 1 Arithmetik 1.3.2 Zinseszinsrechnung 1. Zinsen Zinsen stellen entweder eine Gebühr dar, die für einen Kredit (Leihgeld) zu entrichten ist, oder einen Erlös, der von einem Guthaben erzielt wird. Für ein Kapital K , das während einer ganzen Zinsperiode (in der Regel 1 Jahr) angelegt ist, werden am Ende der Zinsperiode Zinsen gezahlt. Dabei ist p der Zinssatz pro Zinspenode, und man sagt, es werden p% Zinsen für das Kapital K gezahlt. 2. Zinseszinsen Da ein Kapital nach jeder Zinsperiode um den Betrag der Zinsen wächst, werden die eingegangenen Zinsen in der jeweils nächsten Zinsperiode mit verzinst. Diese Mitverzinsung heißt Zinseszins. Bei der Veränderung eines Kapitals durch Zinseszinsen sind verschiedene Fälle zu unterscheiden 1. Einmalige Einzahlung Bei jährlichem Zinszuschlag wächst ein Kapital K nach n Jahren auf den Endwert Kn Am Ende des n-ten Jahres gilt: K« = KA + m>)n- <176) P Zur Abkürzung setzt man 1 + —— = q und bezeichnet q als nominellen Aufzinsungsfaktor und A + —-—)m als effektiven Aufzinsungsfaktor. Man spricht von unterjähriger Verzinsung, wenn das Jahr in m gleich lange Zinsperioden unterteilt wird und die Zinsen bereits nach jeder dieser Zinsperioden dem Kapital K zugeschlagen werden. Der P Zinszuschlag pro Zinsperiode beträgt dann K-—— , und das Kapital wächst nach n Jahren mit je m Zinsperioden auf K-=KA+iL)mn A77) an. ¦ Ein Kapital von 5000. — €, das mit 7,2 % pro Jahr verzinst wird, wächst in 6 Jahren a) bei jährlicher Verzinsung auf K6 = 5000A + 0,072N = 7588, 20 € an, b) bei monatlicher Verzinsung auf K72 = 5000A + 0,072/12O2 = 7691,74 €. 2. Regelmäßige Einzahlungen Es sollen Einzahlungen der gleichen Höhe E in gleichen Abständen geleistet werden. Diese Abschnitte sollen mit der Zinsperiode übereinstimmen Wird die Einzahlung jeweils zu Beginn bzw. am Ende einer Zinsperiode geleistet, dann spricht man von einer vorschüssigen (praenumerando) bzw einer nachschüssigen (postnumerando) Einzahlung. Am Ende der n-ten Zinsperiode erhält man den Kontostand Kn , und zwar a) bei vorschüssiger Einzahlung: b) bei nachschüssiger Einzahlung: Kn = Eq^^, A.78a) Kn = E^^-. A.78b) 3. Unterjährige Einzahlungen Ein Jahr bzw. eine Zinsperiode wird in m gleich lange Abschnitte zerlegt Zu Beginn bzw. am Ende eines jeden Teilabschnittes wird der gleiche Betrag E eingezahlt und bis zum Jahresende verzinst. Nach einem Jahr erhält man auf diese Weise den Kontostand K\, und zwar a) bei vorschüssiger Einzahlung: b) bei nachschüssiger Einzahlung: (m — l)pl Kt (ra+l)p m + 200 A 79a) Kx : m + ¦ 200 A.79b)
1 3 Finanzmathematik 23 Im zweiten Jahr wird K\ voll verzinst, hinzu kommen noch die Einzahlungen und Zinsen wie im ersten Jahr, so daß sich nach n Jahren für den Kontostand Kn bei unterjährigen Einzahlungen und jährlicher Verzinsung ergibt a) bei vorschüssiger Einzahlung: b) bei nachschüssiger Einzahlung: Kn = E m, + (m + l)p 200 qn-l q-1 A1 Kn = E m + (m — \)p 200 A 80b) ¦ Bei einem Jahreszinssatz von p = 5,2 zahlt ein Sparer monatlich nachschüssig 1000 — € ein. Nach wie vielen Jahren wird der Kontostand von 500 000. — € erreicht? Aus A.80b), d.h. aus 500000 = 1000 12 +¦ 11-5,2] l,052n-l 200 0,052 , folgt n = 22,42 Jahre 1.3.3 Tilgungsrechnung 1.3.3.1 Tilgung Unter Tilgung versteht man die Rückzahlung von Krediten Dabei soll vorausgesetzt werden 1. Für eine Schuld S werden vom Schuldner jeweils am Ende einer Zinsperiode p% Zinsen verlangt 2. Nach N Zinsperioden sei die Schuld vollständig getilgt. Die Belastung eines Schuldners pro Zinsperiode setzt sich somit aus Zinsen und Tilgungsrate zusammen Falls die Zinsperiode 1 Jahr beträgt, bezeichnet man den finanziellen Aufwand des Schuldners in dem betreffenden Jahr als Annuität Für die Tilgung einer Schuld gibt es verschiedene Möglichkeiten. So können z.B. die Rückzahlungen zu den Verzinsungszeitpunkten oder dazwischen erfolgen, die Rückzahlungsbeträge verschieden hoch oder während der gesamten Laufzeit konstant sein. 1.3.3.2 Gleiche Tilgungsraten Die Tilgung erfolgt unterjährig, es werde aber keine unterjährige Verzinsung mit Zinseszins vereinbart Mit den Bezeichnungen • S Schuld (Verzinsung nachschüssig mit p%), • T = —— Tilgungsrate (T = const), mN • m Anzahl der Tilgungsraten pro Zinsperiode, • N Anzahl der Zinsperioden bis zur endgültigen Tilgung der Schuld ergibt sich für den Schuldner außer der Zahlung der Tilgungsraten noch die folgende Belastung durch Zinsen a) Zinsen Zn für die n—te Zinsperiode: m + 1 Zn '¦ pS_ 100 1- 2m '¦)}¦ A.81a b) Gesamtzinsen Z zur Tilgung einer Schuld S in mN Raten bei N Zinsperioden zu p% Zinsen: z-Tz pS \N~1 i m + 1l h n"l00L 2 + 2m J A 81b) ¦ Eine Schuld von 60 000 -€ wird jährlich mit 8% verzinst 60 Monate lang sollen nachschüssig jeweils 1000 — € getilgt werden. Wie 1 Jahr- hoch sind die jeweils an den Jahresenden anfallenden Zinsen7 Die 2. Jahr: Zinsen für jedes Jahr berechnet man aus A.81a) mit S — 60000 , p = 3 Jahr* 8, ./V = 5 und m = 12 Sie sind in der nebenstehenden Tabelle aufge- 4 Jahr. listet Die Gesamtzinsen hätte man auch mit Hilfe von A 81b) gemäß 5. Jahr. • 60000 T5 - z2 = Z3 = Z4 = Z,= z=- 100 -^ + 1=12200 ¦ € ermitteln können. 4360 -€ 3400. - € 2440 - € 1480 - € 520 -€ Z= 12200 -€
24 1. Arithmetik 1.3.3.3 Gleiche Annuitäten Bei gleichbleibenden Tilgungsraten T = —— nehmen die zusätzlich anfallenden Zinsen im Laufe der mN Zeit ab (s. voranstehendes Beispiel) Bei der Annuitätentilgung wird dagegen zu jedem Zinstermin die gleiche Annuität A, d h. der gleiche Betrag für Zinsen -f Tilgung erhoben. Damit ist die Belastung des Schuldners im gesamten Tilgungszeitraum konstant Mit den Bezeichnungen • S Schuld (Verzinsung mit p% pro Zinsperiode), • A Annuität pro Zinsperiode (A const), • a Tilgungsrate bei m Tilgungen pro Zinsperiode (a const), P • q — 1 + — Aufzinsungsfaktor ergibt sich als Restschuld Sn nach n Zinsperioden: (m — l)p ¦ Sqn- m + - 200 Qn - 1 q A 82) q-\ Dabei beschreibt der Term Sqn den Wert der Schuld S nach n Zinsperioden mit Zinseszins (s A 78a,b)), der zweite Term in A.82) gibt den Wert der unterjährigen Tilgungsraten a mit Zinseszins wieder (s A.82) mit E = a). Für die Annuität gilt. (m — l)p 200 A.83) Dabei entspricht die einmalige Zahlung von A den m Ratenzahlungen a Aus A 83) folgt A > ma Da nach N Zinsperioden die Schuld getilgt sein soll, folgt aus A 82) für Sn = 0 unter Beachtung von A.83): Zur Lösung von Aufgaben der finanzmathematischen Praxis kann A 84) nach einer der Größen A, 5, q oder N aufgelöst werden, wenn die übrigen Größen bekannt sind. ¦ A: Eine Annuitätenschuld über 60000. — € werde jährlich mit 8% verzinst und soll in 5 Jahren getilgt sein Wie hoch sind jährliche Annuität A und monatliche Tilgungsrate a? Aus A 84) bzw. A 83) n n& i ^097 *3Q erhält man. A = 60000 ^— = 15027,39 €, a = ^—^ = 1207,99 € 1 12H — 1,085 200 ¦ B: Ein Kredit in Höhe von S = 100 000 — € soll durch Annuitätentilgung in N = 8 Jahren bei 7,5% Jahreszinsen abgezahlt werden. An jedem Jahresende soll zusätzlich eine Tilgung von 5000. — € erfolgen Wie hoch ist die monatliche Tilgungsrate? Als Annuität A pro Jahr ergibt sich gemäß A.84) A = 100 000 —5 = 17072,70 € Da sich A aus 12 Tilgungsraten a pro Jahr und die 1- ¦ 1,0758 zusätzlichen Zahlungen von 5000 — € am Jahresende zusammensetzt, gilt unter Beachtung von A.83) A = a 112 + ' ' | + 5000 = 17072, 70 Die monatliche Belastung beträgt somit a = 972,62 €. 1.3.4 Rentenrechnung 1.3.4.1 Rente Zahlungen, die in regelmäßigen Zeitabschnitten wiederkehren, und zwar in gleicher oder unterschiedlicher Höhe, vorschüssig oder nachschüssig, werden als Renten bezeichnet Man unterscheidet*
1.3 Finanzmathematik 25 a) Einzahlungen Rentenbeträge werden auf ein Konto eingezahlt und mit Zinseszins verzinst. Es werden die Formeln der Zinseszinsrechnung aus 1.3.2, S. 22 angewendet. b) Rückzahlungen Die Rentenzahlungen erfolgen aus einem Kapital, das mit Zinseszins angelegt ist. Es werden die Formeln der Tilgungsrechnung aus Abschnitt 1 3 3, S. 23 angewendet, wobei die Annuität zur Rente wird. Falls höchstens die jeweils anfallenden Zinsen als Rente ausgezahlt werden, spricht man von einer ewigen Rente Rentenzahlungen (Ein- wie Rückzahlungen) können zu den Zinsterminen, d h. Zinstermin = Rententermin, oder in kürzeren Abständen innerhalb der Zinsperioden, d h. unterjährig vorgenommen werden. 1.3.4.2 Nachschüssig konstante Rente Die Termine für Zinsberechnung und Rentenzahlung sollen übereinstimmen. Die Verzinsung erfolge mit p% Zinseszins, und die Rentenbeträge sollen von der gleichen Höhe R sein. Dann gibt der Renten- endwert Rn an, auf welchen Betrag die regelmäßigen Einzahlungen nach n Zinsperioden angewachsen sind Rn = R^- mit 9 = 1 + ^5- A-85) Der Rentenbarwert R0 stellt den Betrag dar, der zu Beginn der 1 Zinsperiode (einmalig) eingezahlt werden muß, um nach n Zinsperioden mit Zinseszins auf den Rentenendwert Rn angewachsen zu sein flo = ^ mit 9 = l + j^. A86) ¦ Von einer Gesellschaft hat jemand 10 Jahre lang jeweils zum Jahresende 5000. — € zu beanspruchen. Vor der 1. Zahlung hat die Firma Konkurs angemeldet. Als Forderung an den Konkursverwalter kann nur der Barwert Rq geltend gemacht werden Bei Zinsen von 4% pro Jahr gilt 1 qn _ i l-n~n 1-1,04-10 Ro = —R- - R V = 5000 TTTT* = 40554>48 €- qn q-1 q-1 0,04 1.3.4.3 Kontostand nach n Rentenzahlungen Zur nachschüssigen Rentenzahlung stehe ein Kapital K zur Verfügung, das mit p% verzinst wird. Zu jedem Zinstermin werde der Rentenbetrag r ausgezahlt. Der Kontostand Kn nach n Zinsperioden, also auch nach n Rentenzahlungen, beträgt. Kn = Kqn-Rn = Kqn-r<?-—^ mit q = 1 + -£- A.87a) q — 1 100 Folgerungen aus A.87a): r = K-— A.87b) Es ergibt sich Kn — K , d h , das Kapital ändert sich nicht. Es 100 r V 100 liegt der Fall der ewigen Rente vor. Das Kapital wird aufgebraucht, un< gen Aus A 87a) folgt dann für Kn = 0 P r > K-— A 87c) Das Kapital wird aufgebraucht, und zwar nach N Rentenzahlun- r aN - 1 K = ^-^Y A87d) Wird eine unterjährige Verzinsung und eine unterjährige Rentenzahlung vorgenommen, dann ist in den Formeln A 85) bis A 87a) n durch mn und entsprechend q = 1 + —— durch q = 1 + ——— zu ersetzen, 100 100m wenn die ursprüngliche Zinsperiode in m gleich lange neue Zinsperioden unterteilt wird. ¦ Welcher Betrag muß 20 Jahre lang monatlich nachschüssig eingezahlt werden, damit daran anschließend 20 Jahre lang monatlich eine Rente von 2000 - € gezahlt werden kann? Die Verzinsung
26 1 Arithmetik erfolge monatlich mit 0, 5% Aus A.87d) erhält man für n = 20 • 12 = 240 die Summe K, die für die anschließenden Rentenzah- 2000 1 005240 — 1 lungen benötigt wird. K = = 279161,54 € Die dazu notwendigen monatlichen 1,005240-1 0,005 dh i? = 604,19€ 1,005240 0,005 Einzahlungen R ergeben sich aus A.85). R240 = 279161,54 = R 1.3.5 Abschreibungen 1. Abschreibungsarten Bei Gütern, die z B durch Abnutzung oder Alterung eine Wertminderung erfahren, wird jährlich eine Abschreibung vorgenommen. Durch eine solche Abschreibung während eines Bilanzjahres wird der Anfangswert zu Beginn des Jahres auf den Restwert am Ende des Jahres reduziert Es werden folgende Bezeichnungen verwendet: •A Anschaffungswert, •N Nutzungsdauer (in Jahren), •Rn Restwert nach n Jahren (n < N), •an (n = 1,2, .., N) Abschreibungsrate im n-ten Jahr. Die Abschreibungsarten unterscheiden sich vor allem durch die Festlegung der Abschreibungsraten • Lineare Abschreibung, d h gleiche Jahresraten, • Degressive Abschreibung, d h fallende Jahresraten. 2. Lineare Abschreibung Die jährlichen Abschreibungen sind konstant, d h., für die Abschreibungsraten an und den Restwert Rn nach n Jahren gilt A- RN ¦ a, A' Rn '¦ A-RN (n = l,2,...,AT). A.89) N v N Setzt man Rn = 0, dann wird das Gut nach N Jahren auf den Wert Null gesetzt, also vollständig abgeschrieben ¦ Der Anschaffungspreis einer Maschine betrage A = 50 000. — € In 5 Jahren soll sie auf den Restwert R$ = 10000 — € abgeschrieben sein Bei linearer Abschreibung ergibt sich gemäß A 88) und A.89) der nebenstehende Abschreibungsplan. Es ist ein starker Anstieg der prozentualen Abschreibung, bezogen auf den jeweiligen Anfangswert, zu verzeichnen 3. Arithmetisch-degressive Abschreibung Die Abschreibungen sind in diesem Falle nicht konstant Sie nehmen jährlich um den gleichen Betrag d, das Abschreibungsgefälle, ab. Für die Abschreibungsrate im n-ten Jahr gilt an = ai — (n — l)d (n = 2,3, , N + 1; ai und d gegeben). A 90) N Aus dieser Gleichung folgt unter Berücksichtigung der Beziehung A — R^ = Y, an- n=l Jahr 1 2 3 4 5 Anfangswert 50 000 42 000 34 000 26 000 18 000 Abschreibung 8000 8000 8000 8000 8000 Restwert 42 000 34 000 26 000 18 000 10 000 Abschreibung in % vom Anfangswert 16,0 19,0 23,5 30,8 44,4 d = 2[A^a! -(A-RN N(N-l) A.91)
1.3 Finanzmathematik 27 Für d = 0 ergibt sich als Spezialfall die lineare Abschreibung. Im Falle d > 0 folgt aus A.91) A- RN ai > N A.92) wobei a die Abschreibungsrate der linearen Abschreibung ist. Insgesamt muß die erste Abschreibungsrate a\ der arithmetisch-degressiven Abschreibung der folgenden Ungleichung genügen. A — Rn ^A — Rn Rn nA- < CLi < 2- A.93) AT x N ¦ Eine Maschine mit dem Anschaffungswert 50 000. — € soll in 5 Jahren arithmetisch-degressiv auf 10 000. — € abgeschrieben werden Dabei sollen im ersten Jahr 15 000 — € abgeschrieben werden. Der mit den angegebenen Formeln berechnete nebenstehende Abschreibungsplan zeigt, daß die prozentuale Abschreibung, mit Ausnahme der letzten Rate, ausgeglichen ist 4. Digitale Abschreibung Die digitale Abschreibung ist ein Spezialfall der arithmetisch-degressiven Abschreibung, indem gefordert wird, daß die letzte Abschreibungsrate a^ mit dem Abschreibungsgefälle d übereinstimmt. Aus ajv = d folgt: Jahr 1 2 3 4 5 Anfangswert 50 000 35 000 23 500 15 500 11000 Abschreibung 15 000 11500 8 000 4 500 1000 Restwert 35 000 23 500 15 500 11000 10 000 Abschreibung in % vom Anfangswert 30,0 32,9 34,0 29,0 9,1 2(A - RN) N{N + l) ' A 94a) oi = Nd, a2 = (N-l)d, ,aN = d. A.94b) ¦ Der Anschaffungspreis einer Maschine sei A = 50000. — €. auf den Restwert R5 = 10 000. — € abgeschrieben werden Diese Maschine soll in 5 Jahren digital Der mit den angegebenen Formeln berechnete nebenstehende Abschreibungsplan zeigt einen ausgeglichenen Verlauf der prozentualen Abschreibung. 5. Geometrisch-degressive Abschreibung Bei der geometrisch-degressiven Abschreibung werden in jedem Jahr p% vom jeweiligen Restwert des Vorjahres abgeschrieben. Für den Restwert Rn nach n Jahren gilt Jahr 1 2 3 4 5 Anfangswert 50 000 36 665 25 997 17 996 12 662 Abschreibung ai = 5d = 13 335 a2 = Ad = 10 668 a3 = U = 8 001 a4 = 2d = 5 334 a5 = d= 2 667 Restwert 36 665 25 997 17 996 12 662 9 995 Abschreibung in % vom Anfangswert 26,7 29,1 30,8 29,6 21,1 Rn '¦ ¦¦a(i-JLY V loo/ (n = 1,2,. .). A.95) In der Regel ist A gegeben. Beträgt die Laufzeit N Jahre, dann können gemäß A 95) von den Größen Rn,P und N zwei weitere vorgegeben und die dritte dazu bestimmt werden. ¦ A: Eine Maschine mit dem Anschaffungswert 50000. — € soll jährlich geometrisch-degressiv mit 10% abgeschrieben werden. Nach wieviel Jahren unterschreitet der Restwert erstmalig 10 000. — €? Aus A.95) folgt N = ^y y = 15,27 Jahre. ¦ B: An einem Anschaffungswert von A = 1000. — € soll der Verlauf der Restwerte Rn für n = 1.2,..., 10 Jahre bei a) linearer, b) arithmetisch-degressiver, c) geometrisch-degressiver Abschreibung
28 1 Arithmetik demonstriert werden. Das Ergebnis zeigt die Abb. 1.4. /arithmetisch- degressiv -geometrisch-degressiv /linear 2 4 6 8 10 n Abbildung 1 4 6. Abschreibung mit verschiedenen Abschreibungsarten Da bei der geometrisch-degressiven Abschreibung der Restwert Null für endliches n nicht erreicht werden kann, ist es zweckmäßig, von einem bestimmten Zeitpunkt an, z.B. nach m Jahren, von der geometrisch- degressiven zur linearen Abschreibung überzugehen Man legt m so fest, daß von diesem Zeitpunkt an die Abschreibungsraten der geometrisch-degressiven Abschreibung kleiner sind als die der linearen Abschreibung. Aus dieser Forderung folgt m>N-— A.96) V Dabei gibt m das letzte Jahr der geometrischdegressiven Abschreibung und N das letzte Jahr der linearen Abschreibung auf Null an ¦ Eine Maschine mit dem Anschaffungswert 50 000 — € soll in 15 Jahren auf Null abgeschrieben werden, und zwar m Jahre lang geometrisch-degressiv mit jeweils 14% vom Restwert, danach linear. Aus A 96) folgt m > 15 —— = 7, 76, d h , nach m = 8 Jahren ist es zweckmäßig, von der geometrischdegressiven zur linearen Abschreibung überzugehen 1.4 Ungleichungen 1.4.1 Reine Ungleichungen 1.4.1.1 Definitionen 1. Ungleichungen Ungleichungen sind Verknüpfungen zweier algebraischer Ausdrücke durch eines der folgenden Zeichen (., kleiner") („größer oder kleiner") („nicht kleiner") („nicht größer"). Typl > („größer") Typ II Typ III ^ („verschieden von, ungleich") Typ Illa Typ IV > („größer oder gleich") Typ IVa Typ V < („kleiner oder gleich") Typ Va Die Zeichen III und lila, IV und IVa sowie V und Va besitzen jeweils die gleiche Bedeutung, so daß sie sich gegenseitig ersetzen lassen Wenn sich das Zeichen lila auf Größen bezieht, für die die Begriffe „größer" oder „kleiner" nicht definiert sind, z B bei komplexen Zahlen oder Vektoren, dann läßt es sich durch das Zeichen III ersetzen In diesem Abschnitt werden nur reelle Zahlen benutzt 2. Identische, gleichsinnige, ungleichsinnige und äquivalente Ungleichungen 1. Identische Ungleichungen zeichnen sich durch ihre Gültigkeit für alle Werte der in ihnen enthaltenen Buchstabensymbole aus 2. Gleichsinnige Ungleichungen liegen vor, wenn von zwei Ungleichungen beide zum Typ I oder beide zum Typ II gehören. 3. Ungleichsinnige Ungleichungen liegen vor, wenn die eine Ungleichung zum Typ I, die andere zum Typ II gehört.
1.4 Ungleichungen 29 ist a < b, dann ist b Transitivität Ist a > b und b > c, ist a < b und b < c, > > a dann ist a > c dann ist a < c 4. Äquivalente Ungleichungen liegen vor, wenn zwei Ungleichungen mit denselben Unbekannten für die gleichen Werte der Unbekannten richtig sind 3. Lösung von Ungleichungen Ungleichungen können ebenso wie Gleichungen unbekannte Größen enthalten, die gewöhnlich durch die letzten Buchstaben des Alphabets bezeichnet werden. Die Lösung einer Ungleichung oder eines Systems von Ungleichungen zu suchen, bedeutet zu bestimmen, innerhalb welcher Grenzen sich die unbekannten Größen bewegen dürfen, damit die Ungleichung oder alle Ungleichungen des Systems richtig bleiben Lösungen können für alle fünf Typen von Ungleichungen gesucht werden, meistens treten die reinen Ungleichungen vom Typ I und II auf 1.4.1.2 Eigenschaften der Ungleichungen vom Typ I und II 1. Sinnänderung des Ungleichheitszeichens Ist a > b, dann ist b < a; A 97a) A 97b) A.98a) A.98b) 3. Addition und Subtraktion einer Größe Ist a>b, dann ist a±c> b±c, A.99a) ist a < b, dann ist a ± c < b ± c A 99b) Durch Addition oder Subtraktion ein und derselben Größe auf beiden Seiten ändert sich der Sinn der Ungleichung nicht. 4. Addition von Ungleichungen Ist a > b und od, dann ist a + c > b + d, A 100a) ist a < b und c < d, dann ist a + c < 6 + d. A 100b) Zwei gleichsinnige Ungleichungen können seitenweise addiert werden 5. Subtraktion von Ungleichungen Ist a > b und c < d, dann ist a — c > b — d; A 101a) ist a<b und c>d} dann ist a — c <b — d. A.101b) Von einer Ungleichung kann eine andere ihr ungleichsinnige Ungleichung glied- oder seitenweise subtrahiert werden, wobei das Ungleichheitszeichen der ersten Ungleichung erhalten bleibt Im Unterschied dazu lassen sich gleichsinnige Ungleichungen nicht gliedweise subtrahieren. 6. Multiplikation und Division einer Ungleichung mit einer Zahl Ist a > b und c > 0, dann ist ac > bc und - > - , A 102a) c c ist a < b und c > 0, dann ist ac < bc und - < - , A.102b) c c ist a > b und c < 0, dann ist ac < bc und - < - ; A 102c) c c ist a<b und c < 0, dann ist ac> bc und ->-. A 102d)
30 1 Arithmetik Wenn eine Ungleichung beidseitig mit einer positiven Zahl multipliziert oder dividiert wird, dann bleibt der Sinn der Ungleichung erhalten; ist dagegen die Zahl negativ, dann muß der Sinn des Ungleichheits- zeichens umgekehrt werden 7. Ungleichung bezüglich der Kehrwerte Ist 0 < a < b oder a < b < 0, dann ist - > - . A.103) a b 1.4.2 Spezielle Ungleichungen 1.4.2.1 Dreiecksungleichung Für alle reellen Zahlen a, 6, a\, a2,. ., an € R gilt \a + b\ < M + I&l ' A104) bzw. |ai + a2 + • • • + an\ < |oi| + \a2\ + • • • + \an\ A 105) Das Gleichheitszeichen gilt nur, wenn alle Summenden gleiches Vorzeichen besitzen Für 2 bzw n komplexe Zahlen zl5 2:2? > zn € C gilt. ki+£2|<N + N A106) bzw. |*1 + Z2 + • ' • + Zn\ < \Zi\ + \Z2\ + • ¦ • + kn| A.107) Unter dem Absolutbetrag einer komplexen Zahl versteht man ihren Modul \z\ — p (s 1.5.2.3, S. 35) 1.4.2.2 Ungleichungen für den Absolutbetrag der Differenz zweier Zahlen Für zwei reelle Zahlen a, b G R gilt* |a| - |b| < |a-6| < |o| + |6|. A.108a) Der Absolutbetrag der Differenz zweier reeller Zahlen ist kleiner oder gleich der Summe bzw. größer oder gleich der Differenz der Absolutbeträge dieser Zahlen Für zwei komplexe Zahlen z\, z2 € C gilt. Iki|-k2||<ki-^l<kil + l^|. (no8b) 1.4.2.3 Ungleichung für das arithmetische und das geometrische Mittel ai +a2 + ••• + an >Vala2*"an rur Oj>0. A109) n Das arithmetische Mittel von n positiven Zahlen ist größer oder gleich dem geometrischen Mittel dieser Zahlen Das Gleichheitszeichen gilt nur, wenn alle n Zahlen gleich sind 1.4.2.4 Ungleichung für das arithmetische und das quadratische Mittel lai + a2 + --- + an| ax2 + a22 + • • • + an2 ,, nn\ <V 1.110) I n IV n Der Absolutbetrag des arithmetischen Mittels mehrerer Zahlen ist kleiner oder gleich dem quadratischen Mittel dieser Zahlen. 1.4.2.5 Ungleichungen für verschiedene Mittelwerte zweier reeller Zahlen Für die Ungleichungen, die das arithmetische, geometrische, harmonische und quadratische Mittel zweier positiver reeller Zahlen a und b mit a < b miteinander verknüpfen (s auch 1 2 5 5, S 20), gilt a < xu < xq < xa < xq < b. A lila)
1 4 Ungleichungen 31 Dabei bedeuten a + b fT 2ab la2 +b2 nniM xA = -^r-, xG = Vab, xH = ——, xQ = \ —-— , A.111b) 2 o + o V l 1.4.2.6 Bernoullische Ungleichung Für alle reellen Zahlen a > — 1 und ganze Zahlen n > 1 ist (l + a)n> 1+na. A 112) Das Gleichheitszeichen gilt für n = 1 oder für a = 0. 1.4.2.7 Binomische Ungleichung Für alle reellen Zahlen a, 6 E R gilt |a6| < i(a2 + 62). A.113) 1.4.2.8 Cauchy-Schwarzsche Ungleichung 1. Cauchy-Schwarzsche Ungleichung für reelle Zahlen Die CAUCHY-SCHWARZsche Ungleichung gilt für alle reellen Zahlen a^, bj £ R : |ai&i + a2b2 + • • • + anbn\ < y/a^ + a22 + • • • + an2 yjb2 + 622 + • • • + bn2 A.114a) oder (aibi + a2b2 + • • • + anbnJ < (ax2 + a2 + • • • + an2)(&i2 + 622 + • • • + bn2) A.114b) Für zwei endliche Zahlenfolgen mit jeweils n Zahlen ist der Betrag der Summe ihrer paarweisen Produkte kleiner oder gleich dem Produkt der beiden Quadratwurzeln aus den Summen der Quadrate dieser Zahlen. Das Gleichheitszeichen gilt nur für a\ ' b\ = a2 b2 = • • • = an bn Wenn n = 3 ist und {ai, a2,0,3} und {61,62,63} als rechtwinklige kartesische Koordinaten von Vektoren aufgefaßt werden, dann besagt die Ungleichung von Cauchy-Schwarz, daß das skalare Produkt zweier Vektoren betragsmäßig kleiner oder gleich dem Produkt der Beträge dieser Vektoren ist. Wenn n > 3 ist, dann kann diese Aussage auf Vektoren im n-dimensionalen euklidischen Raum ausgedehnt werden. 2. Cauchy-Schwarzsche Ungleichung für komplexe Zahlen Für beliebige komplexe Zahlen 2i,22,. .,zn,wi,w2i...iwneCgilt \z\Wi + Z2W2 H \- ZnWn\ < \jz\Zx + Z2Z2 + • • Z*nZn \jw\W\ + W2W2 -\ WJ>„ A 115) Mit z*, z\, ., w\, iuj, • • •, w* werden die konjugiert komplexen Zahlen zu z\, z2, ., W\, w2,..., wn bezeichnet (s. 1.5.2.5, S. 36). 3. Cauchy-Schwarzsche Ungleichung für konvergente unendliche Reihen und Integrale Ein Analogon zu A.114b) ist die CAUCHY-SCHWARZsche Ungleichung für konvergente unendliche Reihen sowie für bestimmte Integrale: (f>AJ < (f>n2) (f>n2) , A 116) £f(x)(p(x)dx] <(j\f(x)]2dx) (fy{x)]2dx\ A.117) 1.4.2.9 Tschebyscheffsche Ungleichung Wenn ai, a2,..., an, 61,62,..., bn positive reelle Zahlen sind, dann gilt /ai- [ + a2 + --- + an\ (bi + b2 + --- + bn\ < 01 fei +a2b2 + --- + anbn n ) \ n ) ~ n
32 1 Arithmetik für d\ < a2 < < an und b\ < b2 < . < bn oder a\ > a2 > > an und b\ > b2 > > bn ai + a2 H + an h + b2 -\ \-bn\ aib\ + a2b2 -\ h anbn A 118b) n J n für cl\ < a2 < < an und b\ > b2 > . > bn . Für zwei endliche Zahlenfolgen mit n positiven Zahlen ist das Produkt der arithmetischen Mittel dieser Folgen kleiner oder gleich bzw. größer oder gleich dem arithmetischen Mittel der paarweisen Produkte, wenn beide Zahlenfolgen entweder ab- oder zunehmen oder die eine Folge zu- und die andere abnimmt 1.4.2.10 Verallgemeinerte Tschebyscheffsche Ungleichung Wenn a\. a2, . , an, &i, b2, , bn positive reelle Zahlen sind, dann gilt aifc + a2fc + --- + anfc hk + b2k + • • ¦ + bnk < J(a1b1)K + (a2b2)k + ... + (anbn)k n ~ V n für d\ < a2 < ... < an und b\ <b2< < bn oder öi > a2 > .. > an und b\ > b2 > . > bn kaxk + a2k + - • + ank kbYK + b2K + ¦ • • + bn (ai6i)fc + {a2b2)k + • • + (an6n)* A 119b) für d\ < a2 < ... < an und b\ > b2 > > bn n J2 \XkVk\ < n n .fc=l 1.4.2.11 Höldersche Ungleichung 1. Höldersche Ungleichung für Reihen Wenn p und q zwei reelle Zahlen sind, für die - + - = 1 V Q gilt, und wenn xu x2, , xn und yi,y2, , yn beliebige 2n komplexe Zahlen sind, dann gilt A 120a) Diese Ungleichung gilt auch für abzählbar unendlich viele Zahlenpaare. A.120b) wobei aus der Konvergenz der beiden Reihen auf der rechten Seite die Konvergenz der Reihe auf der linken Seite folgt. 2. Höldersche Ungleichung für Integrale Wenn f(x) und g(x) zwei meßbare Funktionen auf dem Maßraum (X, A, p) sind (s 12 9 1,2., S. 656, 12 9 2, S 657), dann gilt. J2\XkVk\ < fc=l p " oc .fc=i j\j{x)g(x)W< \j\f(x)fdß\" \j\g(x)\"dß A 120c)
1.4 Ungleichungen 33 1.4.2.12 Minkowskische Ungleichung 1. Minkowskische Ungleichung für Reihen Wenn p > 1 ist und {x^kZT sowie {yk}kLi m*t %k, Vk £ C zwei Zahlenfolgen sind, dann gilt A.121a) 2. Minkowskische Ungleichung für Integrale Wenn f(x) und g(x) zwei meßbare Funktionen auf dem Maßraum (X,^,//) (s. 12.9.2, S. 657) sind, dann gilt: r oo Ekfc + rf Üb=l p < .fc=l p + " oo £ \y*\p .fc=l J\f(x)+g{x)\>dS < \j\f{x)\*dn P+ \j\g{x)\*dß A.121b) 1.4.3 Lösung von Ungleichungen 1. und 2. Grades 1.4.3.1 Allgemeines Eine Ungleichung wird gelöst, indem man sie schrittweise in äquivalente Ungleichungen umformt Wie bei der Lösung einer Gleichung werden die Summanden von der einen Seite auf die andere gebracht, wobei jeweils das Vorzeichen zu wechseln ist Weiter können beide Seiten der Ungleichung mit ein und derselben Zahl, die ungleich Null sein muß, multipliziert oder dividiert werden, wobei der Sinn des Ungleichheitszeichens erhalten bleibt, wenn diese Zahl positiv ist, sich aber ändert, wenn sie negativ ist. Eine Ungleichung 1 Grades kann auf diese Weise immer auf die Form ax > b A.122) gebracht werden, eine Ungleichung 2. Grades im einfachsten Falle auf die Form x2 > m A.123a) oder x2 < m A 123b) und im allgemeinen Falle auf die Form ax2 + bx + c>0 A.124a) oder ax2 + bx + c < 0. A124b) 1.4.3.2 Ungleichungen 1. Grades Die Ungleichungen 1. Grades besitzen die Lösung x > - für a > 0 a A.125a) und ¦ 5x + 3 < 8z + 1, bx - %x < 1 - 3, -Sx < -2, 1.4.3.3 Ungleichungen 2. Grades Die Ungleichungen 2 Grades x > m besitzen die Lösungen A.126a) und x < - für a < 0 a 2 x>-. a) x2 > m. Für m > 0 ist die Lösung x > y/m und x < —y/m (\x\ > y/rn), für m < 0 ist die Ungleichung identisch erfüllt. b) x2 < m: Für m > 0 ist die Lösung — y/m < x < +y/m (\x\ < y/m), A.125b) A 126b) A.127a) A.127b) A 128a)
34 1 Arithmetik für m < 0 gibt es keine Lösung A.128b) 1.4.3.4 Allgemeiner Fall der Ungleichung 2. Grades ax2 + bx + c>0 A129a) oder ax2 + bx + c < 0 A.129b) Die Ungleichung wird durch a dividiert, wobei sich das Vorzeichen im Falle a < 0 ändert, so daß sie auf die Form x2 + px + q < 0 A 129c) oder x2 + px + q > 0 A 129d) gebracht wird Durch quadratische Ergänzung folgt (z + fJ<(!J-9 (l-129e) oder (x +EJ > @2 _,. A 129f) J9 /p\2 Bezeichnet man x + - mit z und ( - 1 — q mit m , dann ergibt sich die Ungleichung z2 < m A.130a) oder z2 > m A 130b) Nachdem diese gemäß A 128a,b) oder A 127a,b) gelöst ist, kann x bestimmt werden ¦ A: -2x2 + 14rc - 20 > 0, x2 - 7x + 10 < 0 , (x-^) <j, -| < x - - < -, \ Z / tc Z Z Z 3 7 3 7 — - + -<x<- + - Die Lösung ist 2 < :r < 5 ¦ B: x2 + 6z + 15 > 0 , (z + 3J > -6 Die Ungleichung ist identisch erfüllt. / 7\2 9 7 3 7 3 ¦ C: -2x2 + 14x-20<0, [x--] >-, x - - > - und x--< — V 2/ 4 ' 2 2 2 2 Die Lösungsbereiche sind x > 5 und x < 2 1.5 Komplexe Zahlen 1.5.1 Imaginäre und komplexe Zahlen 1.5.1.1 Imaginäre Einheit Als imaginäre Einheit wird eine Zahl i eingeführt, deren Quadrat „-1" ist. In der Elektrotechnik wird meist anstelle von i der Buchstabe j verwendet, um Verwechslungen mit der Stromstärke i zu vermeiden. Die Einführung der imaginären Einheit führt zu einer Verallgemeinerung des Zahlbegriffs, zu den komplexen Zahlen, die in der Algebra und Analysis eine große Rolle spielen und in Geometrie und Physik eine Reihe konkreter Interpretationen bzw. neuer Beschreibungsmöglichkeiten ergaben. 1.5.1.2 Komplexe Zahlen Die algebraische Form einer komplexen Zahl lautet z = a + \b. A.131a) Wenn a und b alle möglichen reellen Werte durchlaufen, dann werden alle möglichen komplexen Zahlen z erzeugt. Die Zahl a wird Realteil, die Zahl b Imaginärteil der Zahl z genannt a = Re(z), b = lm(z) A 131b) Für b = 0 wird z = a, so daß die reellen Zahlen zum Spezialfall der komplexen Zahlen werden Für a = 0 wird z = i b eine „rein imaginäre Zahl". Die komplexen Zahlen bilden die Menge der komplexen Zahlen, die mit C bezeichnet wird
1 5 Komplexe Zahlen 35 Hinweis: Funktionen w = f(z) einer komplexen Variablen z = x+l y werden in der Funktionentheorie (s. 14.1, S 693 ff) behandelt 1.5.2 Geometrische Darstellung 1.5.2.1 Vektordarstellung In Analogie zur Darstellung der reellen Zahlen auf der Zahlengeraden können die komplexen Zahlen als Punkte einer Ebene, der sogenannten GAUSSschen Zahlenebene, dargestellt werden Eine Zahl z = a -f i b ist dann ein Punkt mit der Abszisse a und der Ordinate b (Abb.1.5). Die reellen Zahlen liegen auf der Abszissenachse, die auch reelle Achse genannt wird, die imaginären auf der Ordinatenachse, der imaginären Achse In der so vorgegebenen Ebene ist jeder Punkt durch einen Radiusvektor eindeutig bestimmt (s 3 5 1 1,6., S 186), so daß jeder komplexen Zahl ein bestimmter Vektor entspricht, der in dieser Ebene liegt und vom Koordinatenursprung zu dem betreffenden Punkt führt (Abb. 1.6). Die komplexen Zahlen können also sowohl duich Punkte als auch durch Vektoren dargestellt werden. Im. Achse z=a+bi \ Im. Achse 0 R.Achse a R. Achse x Im. Achse -,-f py A. R. Achse a Abbildung 1 5 Abbildung 1 6 Abbildung 1 7 1.5.2.2 Gleichheit komplexer Zahlen Zwei komplexe Zahlen sind definitionsgemäß gleich, wenn ihre Realteile und Imaginärteile für sich einander gleich sind. Geometrisch betrachtet sind zwei komplexe Zahlen gleich, wenn die zu ihrer Darstellung benötigten Vektoren gleich sind Im entgegengesetzten Falle sind die komplexen Zahlen ungleich Die Begriffe „größeru und „kleiner'" sind für komplexe Zahlen nicht definiert 1.5.2.3 Trigonometrische Form der komplexen Zahlen Die Darstellung z = a + \b A.132a) einer komplexen Zahl wird algebraische Form genannt Wenn Polarkoordinaten anstelle der kartesi- schen Koordinaten verwendet werden (Abb. 1.7), dann ergibt sich die trigonometrische Form der der komplexen Zahl z = p(cos ip + i sin ip) A 132b) Man bezeichnet \z\=p @<p<oo) A 132c) als Absolutbetrag oder Modul und &rgz = tp + 2k7r (-7T<v?< -Kr, fc = 0,±l,±2, ) A.132d) als Argument der komplexen Zahl z Der Winkel ip heißt Hauptwert des Argumentes der komplexen Zahlz{l 132b) Der Zusammenhang zwischen p, ip und a , b für einen Punkt ist derselbe wie der zwischen den kartesi- schen Koordinaten und den Polarkoordinaten dieses Punktes (s. 3.5.2.2,3., S 196). = p cos 99, A 133a) - p sin Lp, A133b) p=y/aTT¥, A.133c)
36 1. Arithmetik für b > 0, p > 0, für b < 0, p > 0 , l unbestimmt für p = 0 A.133d) arctan - c TT + 2 7T ~2 i arctan - arctan tt a für a > 0, für a = 0, 6 > 0, für a = 0, 6 < 0, + 7T für a < 0 , 6 > 0, für a < 0, b < 0. A.133e) Die komplexe Zahl z = 0 hat den Modul Null, während das Argument arg 0 unbestimmt ist 1.5.2.4 Exponentialform einer komplexen Zahl Exponentialform einer komplexen Zahl wird die Darstellung z = pel* A.134a) genannt, wobei p der Modul und <p das Argument sind. Es gilt die EuLERsche Relation eitp = cos<£ + i sin<£. A134b) ¦ Darstellung einer komplexen Zahl in drei Formen: a) z = 1 -|- i \/3 (algebraische Form), b) z = 2 ( cos — + i sin — ) (trigonometrische Form), c) z = 2el% (Exponentialform), mit Beschränkung auf den Hauptwert Ohne Beschränkung auf den Hauptwert gilt die Darstellung z = 1 + i y/S = 2exp |i f ^ + 2kn J1 = 2 [cos ( ^ + 2/ctt J + i sin ( ^ + 2A:tt J | (fc = 0, ±1, ±2, ..). 1.5.2.5 Konj ugiert komplexe Zahlen Konjugiert komplexe Zahlen werden zwei komplexe Zahlen z und z* genannt, wenn ihre Realteile gleich sind, ihre Imaginärteile sich aber durch das Vorzeichen unterscheiden: Re(z*) = Re{z), Im(z*) = -lm(z). A.135a) Geometrisch interpretiert liegen Punkte, die konjugiert komplexen Zahlen entsprechen, symmetrisch zur reellen Achse. Die Moduln konjugiert komplexer Zahlen sind einander gleich, während sich ihre Argumente nur durch das Vorzeichen unterscheiden: z = a + i b = p(cos (p + i sin ip) = pe1(p , A.135b) z* — a — i 6 = p(cos </? — i sin (/?) = pe~llf . A.135c) An Stelle von z* verwendet man auch die Bezeichnung ~z für die zu z konjugiert komplexe Zahl. 1.5.3 Rechnen mit komplexen Zahlen 1.5.3.1 Addition und Subtraktion Addition und Subtraktion zweier oder mehrerer komplexer Zahlen sind in der algebraischen Schreibweise durch die Formel z\ + z2 - z3 H = (ai + i 6i) + (a2 + i b2) - (a3 + i 63) H = (ai + a2 - a3 + • • •) + i (h + b2 - b3 + • • •) A.136) definiert. In der geometrischen Interpretation werden zur Summen- bzw. Differenzbildung die Vektoren der betreffenden komplexen Zahlen addiert bzw. subtrahiert (Abb. 1.8). Dabei werden die üblichen Regeln der Vektorrechnung angewendet (s 3 5.1.1, S. 185).
1 5 Komplexe Zahlen 37 Im. Achse y< 0 Im. AchseyZjZj /4 JsfZl 1 R. Achse x Abbildung 1 Abbildung 1 9 Im. Achse 0 IR. Achse x Abbildung 1 10 1.5.3.2 Multiplikation Die Multiplikation zweier komplexer Zahlen Z\ und z2 in der algebraischen Schreibweise ist definiert durch die Formel z\z2 = (ai + ibi)(a2 + ib2) = {a\a2 - hb2) + i(ai62 + b\a2). A.137a) In der trigonometrischen Schreibweise gilt z\z2 = [p!(cos</?i + i sin^i)][/o2(cosv?2 + i sin(p2)} = pip2[cos((pi + (p2) + i sin(<pi +(p2)},(l.l37b) d.h., der Betrag des Produkts ist gleich dem Produkt der Beträge der Faktoren, während das Argument des Produkts gleich der Summe der Argumente der Faktoren ist In der Exponentialform erhält man ziz2 = plP2e[^+^ A 137c) In der geometrischen Interpretation wird der Produktvektor, der das Produkt von Z\ und z2 darstellt, durch Drehung des Vektors z\ im entgegengesetzten Uhrzeigersinn um den Winkel, der dem Argument von z2 entspricht, gedreht und durch Multiplikation dieses Vektors mit dem Faktor \z2\ gestreckt. Das Produkt Z\Z2 kann auch durch Konstruktion eines ähnlichen Dreiecks gewonnen werden (Abb.1.9) Die Multiplikation einer komplexen Zahl z mit i bedeutet eine Drehung ihres Vektors um den Winkel 7r/2 , während der Modul konstant bleibt (Abb. 1.10) 1.5.3.3 Division Die Division zweier komplexer Zahlen wird als die zur Multiplikation inverse Operation definiert. In algebraischer Schreibweise ergibt sich zi ai+ifci aia2 + blb2 . a2bx - axb2 ,. 100 , — = 7- = —* 5- + 1 « 5-• A.138a) z2 0,2 + 162 a22 + b2 a22 + b2 Die trigonometrische Schreibweise lautet Zl /Pi(cos¥?i + isiny?i) P\< , w • • / m n iqou — = —( -T-. r = — cos(y?i - ip2) + 1 sm((^i - (p2)\, A.138b) z2 p2(cos ip2 + 1 sin (p2) p2 d h , der Betrag des Quotienten ist gleich dem Quotienten aus den Beträgen des Dividenden und des Divisors, während das Argument des Quotienten gleich der Differenz der beiden Argumente ist In der Exponentialform erhält man £l = £LeK<Pi-<P2) m z2 p2 In der geometrischen Definition ergibt sich der Vektor, der den Quotienten Z\jz2 darstellt, durch Drehung des die Zahl z\ darstellenden Vektors um den Winkel arg z2 im Uhrzeigersinn sowie durch Kontraktion dieses Vektors mit dem Faktor \z2\ A 138c)
38 1. Arithmetik Hinweis: Eine Division durch Null ist nicht möglich. 1.5.3.4 Allgemeine Regeln für die vier Grundrechenarten Formal betrachtet wird mit komplexen Zahlen z = a + i b in der gleichen Weise gerechnet wie mit gewöhnlichen Binomen, nur daß i2 = —1 zu berücksichtigen ist. Bei Divisionen komplexer Zahlen durch eine andere komplexe Zahl wird zuerst der Imaginärteil des Nenners beseitigt, indem Zähler und Nenner mit der konjugiert komplexen Zahl des Nenners multipliziert werden. Das ist möglich, weil (a + i6)(a-ifc) = a2 + b2 eine reelle Zahl liefert C-4i)(-l + 5iJ 10 + 7i _ C - 4i)(l - 10i - 25) A0 + 7i)i -2C A 139) -4i)A2 + 5i) 1 + 3i 5i 7-10i _ —2E6 — 33i)A — 3i) 5 ~ (l + 3i)(l-3i) 7-10i l + 3i -2(-43-201i) 5ii 7-10i l + 3i E0+191i) = 10+38,2i 1.5.3.5 Potenzieren einer komplexen Zahl Das Potenzieren einer komplexen Zahl in die n-te Potenz wird mit Hilfe der Formel von Moivre ausgeführt- [p(cos (p + i sin (p)]n = pn(cos rup + i sin rup), A.140a) d.h., der Betrag wird in die n-te Potenz erhoben, während das Argument mit n multipliziert wird Besonders zu berücksichtigen ist, daß gilt* ;2 - -i ; 3 - -i, i4 = +1 A 140b) und allgemein i4n+fc = ik . A 140c) = -1, 1.5.3.6 Radizieren oder Ziehen der n-ten Wurzel aus einer komplexen Zahl Das Radizieren oder Ziehen der n-ten Wurzel ist eine zum Potenzieren inverse Operation. Für z = p(cos (p + i sin (p) ist z1/n = <fz mit n > 0, ganz, A 141a) die abkürzende Bezeichnung für die n Werte _ / <p + 2kiv . . u) + 2/c7T ^k = \[p cos h l sin v \ n n (k = 0,1,2, ..,n-l) A.141b) Während Addition, Subtraktion, Multiplikation, Division und Potenzieren mit ganzzahligen Exponenten zu eindeutigen Ergebnissen führen, liefert das Ziehen der n-ten Wurzel stets n verschiedene Lösungen u>k. Geometrisch interpretiert sind die Punkte Uk die Eckpunkte eines regelmäßigen n-Ecks mit dem Mittelpunkt im Koordinatenursprung. In Abb. 1.11 sind die 6 Werte für fß dargestellt Abbildung 111 co2 r-"Y / \ co34 ° co4 Imag. Achse ,^i „„->föH R. ^chse x ,..--* ®5 1.6 Algebraische und transzendente Gleichungen 1.6.1 Umformung algebraischer Gleichungen auf die Normalform 1.6.1.1 Definitionen Die in der Gleichung F(x) = f(x) A 142)
1.6 Algebraische und transzendente Gleichungen 39 enthaltene Veränderliche x wird Unbekannte genannt, die speziellen Werte X\,x2, • •, xn der Veränderlichen, für die die Gleichung erfüllt wird, sind die Wurzeln oder Lösungen der Gleichung Zwei Gleichungen sind äquivalent, wenn sie genau die gleichen Wurzeln besitzen. Eine algebraische Gleichung liegt vor, wenn jede der darin enthaltenen Funktionen F(x) und f(x) algebraisch, d.h rational oder irrational ist; eine von ihnen kann auch eine Konstante sein Jede algebraische Gleichung kann durch algebraische Umformungen auf die Normalform P(x) = anxn + an-Xxn~l + • • +ai:r + ao = 0 A143) gebracht werden, die die gleichen Wurzeln wie die Ausgangsform besitzt, aber unter Umständen einige überzählige. Der Koeffizient an wird oft auf den Wert 1 gebracht; im übrigen werden die Koeffizienten an, ., a0 hier und im weiteren als reell vorausgesetzt, anderenfalls wird besonders darauf aufmerksam gemacht. Der Exponent n wird der Grad der Gleichung genannt. rp 1 I */rpZ £\ qf* Q ¦ Gesucht Normalform der Gleichung = H . Schrittweise Umformungen* S[x — 2) x x{x - 1 + y/öF^G) = 3x{x - 2) + 3(x - 2)(x - 3), x2 - x + xy/x2^ = 3x2 - 6x + 3x2 - 15z + 18, xy/x^G = 5x2 - 20rc + 18, x2(x2 - 6) = 25x4 - 200z3 + 580x2 - 720x + 324, 24x4 - 200:r3 + 586x2 — 720:r + 324 — 0. Das Ergebnis ist eine Gleichung vierten Grades in der Normalform 1.6.1.2 Systeme aus n algebraischen Gleichungen Jedes algebraische Gleichungssystem kann auf die Normalform, d.h. auf eine polynormale Darstellung gebracht werden Pi(x,3/,2,.. ) = 0, P2{x1yizi . ) = 0, .. , Pn(x,y,z,. ) = 0. A144) Die Pi (i = 1,2, ., n) sind Polynome in x, y, z, . . ¦ Gesucht Normalform des Systems der Gleichungen 1 — = - , 2 = J~z , 3 xy = z yjy z y-\ Die Normalform lautet 1. x2z2 — y = 0 , 2 x2 — 2x + 1 - y2z + 2yz -2 = 0, 3 xy - z = 0 . 1.6.1.3 Scheinbare Wurzeln Nach der Umformung einer algebraischen Gleichung auf die Normalform A 143) kann es vorkommen, daß P(x) = 0 Lösungen besitzt, die keine Lösungen der Ausgangsgleichung A 142) sind. Daher ist eine Probe notwendig. Durch Einsetzen der Wurzeln von P(x) = 0 in die Ausgangsgleichung ist zu prüfen, ob diese auch Lösungen von A.142) sind oder nicht x3 1 ¦ A: = Die zugehörige Normalform lautet x4 — x3 — x + 1 = 0 X\ = 1 ist Lösung der x — 1 x — 1 Normalform, aber nicht Lösung der Ausgangsgleichung, da diese für x = 1 nicht .definiert ist. ¦ B: \/x + 7+1 = 2x oder y/x + 7 = 2x — \ Durch Quadrieren erhält man die Normalform Ax2 — hx — 6 = 0 mit den Wurzeln x\=2 und x2 — —3/4. Die Wurzel x\ = 2 ist Lösung der Ausgangsgleichung, die Wurzel x2 aber nicht 1.6.2 Gleichungen 1. bis 4. Grades 1.6.2.1 Gleichungen 1. Grades (lineare Gleichungen) 1. Normalform ax + b = 0. A145) 2. Anzahl der Lösungen Es existiert stets eine reelle Lösung xi = --. A146) a
40 1. Arithmetik 1.6.2.2 Gleichungen 2. Grades (quadratische Gleichungen) 1. Normalform ax2 + bx + c = 0. oder nach Division durch a: x2 4- px 4- q = 0 . 2. Anzahl der reellen Lösungen In Abhängigkeit vom Vorzeichen der Diskriminante D = 4ac — b oder D = q - PI 4 ergibt sich: • für D < 0 gibt es 2 reelle Lösungen B reelle Wurzeln), • für D = 0 gibt es 1 reelle Lösung B zusammenfallende Wurzeln), • für D > 0 gibt es keine reelle Lösung B komplexe Wurzeln) 3. Eigenschaften der Wurzeln der quadratischen Gleichung Sind X\ und X2 die Wurzeln der quadratischen Gleichung A.147a) oder A 147b), dann gilt. x\ +x2 = — = -p, a xi • x2 — - ¦¦ a 4. Lösung quadratischer Gleichungen Methode 1: Faktorenzerlegung führt von ax2 + bx + c = a(x — a)(x — ß) A.150a) falls sie gelingt, direkt auf die Wurzeln x\ = a , x2 = ß. Mx2 + x-6 = 0, x2 + x-6 = (x + 3){x - 2), xi Methode 2: Anwendung von Lösungsformeln führt a) für die Form A 147a) auf die Lösungen Zl,2 : )± Vb2 — 4ac 2Ö A 152a) oder wobei die zweite Formel bei geradzahligem b vorteilhaft ist, b) für die Form A.147b) auf die Lösungen #1,2 : P , \Pl 1.6.2.3 Gleichungen 3. Grades (kubische Gleichungen) 1. Normalform ax3 + bx2 + ex + d = 0 A.147a) A 147b) A 148) A 149) oder x2 + px + q = (x -a)(x-ß), = -3, x2 = 2 >\ A) ~aC A.150b) A151) C\ I^OK^ A.153) A.154a) oder nach Division durch a und Substitution von y = x + 3a y3 + 3p?/ + 2o = 0 bzw in reduzierter Form ?/3 + p*y + ö* = 0 mit 2b3 bc d , , :3P^ 3ac - 62 3a2 ' A.154b) A 154c)
1.6 Algebraische und transzendente Gleichungen 41 2. Anzahl der reellen Lösungen In Abhängigkeit vom Vorzeichen der Diskriminante D = q2+p3 A155) ergibt sich- • für D > 0 eine reelle Lösung (eine reelle und zwei komplexe Wurzeln), • für D < 0 drei reelle Lösungen (drei verschiedene reelle Wurzeln), • für D = 0 eine reelle Lösung (eine dreifache reelle Wurzel) im Falle p = q = 0 oder zwei reelle Lösungen (eine einfache reelle Wurzel und eine zweifache reelle Wurzel) im Falle ps = — q2 ^ 0 3. Eigenschaften der Wurzeln der kubischen Gleichung Sind x\, x2 und x3 die Wurzeln der kubischen Gleichung A 154a), dann gilt 6 111c d Xi+x2 + x3 = — , 1 1 = —;, xix2x3 = — A156) a x\ x2 x3 d a 4. Lösung kubischer Gleichungen Methode 1: Faktorenzerlegung auf der linken Seite der Gleichung führt, falls sie gelingt, direkt von ax3 + bx2 + ex + d = a(x - a)(x - ß)(x - 7) A 157a) auf die Wurzeln der Gleichung X\ = a, x2 = ß, £3 = 7 A157b) ¦ xs + x2 - 6x = 0, xs + x2 - 6x = x(x + 3)(x - 2); xx = 0 , x2 = -3 , x3 = 2 Methode 2: Anwendung der Formel von Cardano Durch die Substitution y = u + v geht A.154b) in u3 + v3 + (u + v){3uv + 3p) + 2<? = 0 A 158a) über. Diese Gleichungen sind sicher dann erfüllt, wenn u3 + v3 = -2q und uv = -p A 158b) gilt. Schreibt man A.158b) in der Form u3 + v3 = -2q, u3v3 = -p3, A.158c) dann sind von den beiden unbekannten Größen u3 und v3 Summe und Produkt bekannt, so daß sie auf Grund des VlETAschen Wurzelsatzes (s. 1.6.2.3,3., S 44) als Lösungen der quadratischen Gleichung w2 - (u3 + v3)w + u3v3 = w2 + 2qw - p3 = 0 A.158d) aufgefaßt werden können. Man erhält W\ = u3 = -q + \Jq2 + p3 , w2 = v3 = -q - \Jq2 + p3 , A.158e) so daß sich für die Lösungen y der Gleichung A 154b) die CARDANOsc/ie Formel y = u + v= tf-q+ VV +p3 + fj-q - ^q2+p3 A.158f) ergibt. Wegen der Dreideutigkeit jeder 3. Wurzel (s. A.141b), S 38) wären neun verschiedene Fälle möglich, die sich wegen uv = —p auf die folgenden drei Lösungen reduzieren- 2/1 — ui + v\ (möglichst die reellen kubischen Wurzeln u\ und v\ mit u\V\ = —p), A 158g) V2 = ">(-5 + H+^(-H^)' A158h) (-H^HD+H (i-i58i) V3 = Ui ¦ y3 + 6y + 2 = 0mitp = 2, q= 1 und q2 +p3 = 9 und u = ^-1 + 3= \/2 = 1,2599, v = v/-l -3 = ^4 = -1,5874 . Die reelle Wurzel istyi=u + v = -0,3275, die komplexen Wurzeln
42 1. Arithmetik Tabelle 1.2 Lösung kubischer Gleichungen mit Hilfsgrößen q2 + p3 < 0 q COSif=- 2/i = -2rcos- y2 = +2rcosF0° ys = +2r cos f 60° p<0 -i) 2/i = 2/2 = 2/3 = g2 + p3 > 0 cosh cp = — = — 2rcosh — <p> i— ip = r cosh — + i v 3 r sinh — (p f— ip = r cosh — — i v 3 r sinh — 2/1 = 2/2 = 2/3 = p>0 sinh ip = — 0? = — 2rsinh — 3 = r sinh — + i v 3 r cosh — o o tp /— <p = r sinh — — i v 3 r cosh — 1 \/3 sind 2/2,3 = --{u + v)± i^-(u - v) = 0,1638 ± i • 2,4659. Methode 3: Verwendung von Hilfsgrößen, wie sie in Tabelle 1.2 angegeben sind Mit p aus Gleichung A.154b) wird :±V^ A.159) gesetzt, wobei das Vorzeichen von r mit dem von q übereinstimmen muß Daraufhin werden die Hilfsgröße <p und mit ihrer Hilfe die Wurzeln y\, yi und 2/3 in Abhängigkeit von den Vorzeichen von p und D = q2 + p3 aus der Tabelle bestimmt 2 y" -92/ + 4 = 0.p=-3, q = 2, q2 + p3 < 0, r = y/3, cos<p ¦¦ 3V3 = 0,3849, ip = 67°22r yi = -2v/3cos22°27/ = -3,201, 2/2 = 2\/3cosF0o - 22027') = 2,747,2/3 = 2v/3cosF0° + 22°27') = 0,455 Probe: 2/1 + 2/2 + 2/3 = 0) 001 im Rahmen der Rechengenauigkeit, anstelle von 0 Methode 4: Numerische Näherungslösung s. 19.1 2, S. 914, Näherungslösung mit Hilfe eines Nomo- gramms s 2 19 3 3, S 130 1.6.2.4 Gleichungen 4. Grades 1. Normalform ax4 + bx3 + ex2 + dx + e = 0. Sind alle Koeffizienten dieser Gleichung reell, dann hat sie 0 oder 2 oder 4 reelle Lösungen 2. Spezielle Formen Wenn b = d = 0 ist, dann können die Wurzeln von ax4 + ex2 + e = 0 mit Hilfe der Formeln -c± \/c2 — Aae xh2,3A = ±y/y, y = - 2a berechnet werden Für a = e und 6 = d werden die Wurzeln der Gleichung ax4 + bx3 + ex2 + bx + a = 0 mit Hilfe der folgenden Formeln berechnet: y ± V2/2 - 4 #1,2,3,4 — - -6 ± Vfr2 - Aac + 8a2 2Ö " A 160) A 161a) A 161b) A.161c) A.161d)
1.6 Algebraische und transzendente Gleichungen 43 3. Lösung der allgemeinen Gleichung 4. Grades Methode 1: Faktorenzerlegung der linken Seite von axA + bx3 + ex2 + dx + e = 0 = a(x - a)(x - ß)(x - *y)(x - S) A.162a) führt, falls das gelingt, direkt auf die Wurzeln Xi=a, X2 = ß, £3 = 7, X4 = 5. A.162b) ¦ x4 - 2x3 - x2 + 2x = 0, x(x2 - l)(x -2) = x(x - l)(x + l)(x - 2), £l=0, £2 = 1 , X3 = — 1 , £4 = 2 Methode 2: Die Wurzeln der Gleichung A 162a) stimmen für a = 1 mit den Wurzeln der Gleichung x2 + F + A)| + (y + ^-jr) = ° (L163a) überein, wobei .4 = ±\/8y + b'2 — 4c und y irgendeine reelle Wurzel der kubischen Gleichung Sy3 - 4cy2 + {2bd - Se)y + eDc - b2) - d2 = 0 A.163b) ist Methode 3: Näherungslösung s. 19.1.2, S 914. 1.6.2.5 Gleichungen 5. und höheren Grades Gleichungen 5. und höheren Grades lassen sich im allgemeinen nicht mehr mit Hilfe von Wurzeln lösen. Es sind Näherungsverfahren anzuwenden (s 19.1 2, S. 914). 1.6.3 Gleichungen n—ten Grades 1.6.3.1 Allgemeine Eigenschaften der algebraischen Gleichungen 1. Wurzeln Die linke Seite der Gleichung xn + an_ixn_1 + ... + a0 = 0 A 164a) wird Polynom Pn(x) vom Grade n genannt, eine Lösung von A.164a) eine Wurzel des Polynoms Pn(x). Wenn a eine Wurzel des Polynoms ist, dann ist Pn(x) durch (x — a) teilbar. Im allgemeinen Falle gilt Pn(x) = (x- a)Pn.x{x) + Pn(a) A.164b) Dabei ist Pn_i(x) ein Polynom vom Grade n — 1. Wenn Pn(x) durch (x — a)k , aber nicht mehr durch (x—a)k+l teilbar ist, dann wird a eine k-fache Wurzelder Gleichung Pn(x) = 0 genannt. In diesem Falle ist a gemeinsame Wurzel des Polynoms Pn(x) und seiner Ableitungen bis einschließlich der (k — l)-ten Ordnung 2. Fundamentalsatz der Algebra Jede Gleichung n-ten Grades, deren Koeffizienten reelle oder komplexe Zahlen sind, besitzt n reelle oder komplexe Wurzeln, wobei die fc-fachen Wurzeln fc-mal gezählt werden. Wenn die Wurzeln von P(x) mit a, ß, 7, bezeichnet werden und diese jeweils die Vielfachheiten k,l,m,.. besitzen, dann gilt die Darstellung in Faktoren (Produktdarstellung) P(x) = (x- a)k(x - ß)\x - 7)m ... A.165a) Die Lösung einer Gleichung P(x) = 0 kann stets durch Zurückführen auf eine Gleichung vereinfacht werden, die die gleichen Wurzeln wie die Ausgangsgleichung hat, aber jeweils nur noch mit der Vielfachheit 1 Dazu wird das Polynom in zwei Faktoren derart zerlegt, so daß P{x) = Q{x)T(x), A 165b) T{x) = {x- a^-'ix - ßI-1..., Q(x) = {x- a){x - ß) . A 165c) gilt. Man kann T(x) als größten gemeinsamen Teiler (s. 1.1.6.5, S.14) des Polynoms P(x) und dessen Ableitung P'(x) bestimmen, da die mehrfachen Wurzeln von P(x) auch Wurzeln von P'{x) sind. Das
44 1 Arithmetik Polynom Q{x) erhält man dann durch Division von P(x) durch T(x); Q(x) hat dieselben Nullstellen wieP(x), aber mit der Vielfachlieit 1 3. Wurzelsatz von Vieta Der Zusammenhang zwischen den n Wurzeln x\, x2, • , xn und den Koeffizienten der Gleichung A.164a) ist gegeben durch. n xi+x2+ +xn = ^Tzi =-an_i , *=i XXX2 + X1X3 + + Xn-iXn = ^ XiXJ = Qn-2 , i<3 n XiX2Xs + Xi.r2X4 + . . + Xn-2Xn-lXn = 5Z XiX3Xk = ~«n-3 , A.166) ij,k = \ i<j<A. xi^2 #n = (-l)na0 1.6.3.2 Gleichungen mit reellen Koeffizienten 1. Komplexe Wurzeln können auch als Lösungen von Polynomgleichungcn mit reellen Koeffizienten auftreten, aber nur paarweise konjugiert komplex, d h , wenn a = a + ib eine Wurzel ist, dann ist auch ß = a — i b eine, und zwar mit der gleichen Vielfachheit. Mit p = — (q + ß) = -2a und q = aß = a2 + b2 , woraus ( - ) - q < 0 folgt, gilt (x-a){x-ß) = x2+px + q , A.167) Wird in A.165a) das Produkt eines jeden Paares derartiger Faktoren gemäß A 167) ersetzt, dann ergibt sich eine Zerlegung des Polynoms mit reellen Koeffizienten in reelle Faktoren gemäß kU<r - n,n\k* . . . (r - n,,\ki P{x) = (x-a1)ki(x-a2)k2---{x OLl) (x2 + Pix + qi)mi {x2 4- p2x + q2)rn2 ¦ ¦ • (x2 + prx + qr)mr A 168) Dabei sind ai, a^ •, cti die / reellen Wurzeln des Polynoms P(x). Es hat außerdem r Paare konjugiert komplexe Wurzeln, die man als Nullstellen der quadratischen Faktoren x2 + Pix + q{ (i = 1,2, , r) erhält Die Zahlen (Xj (j = 1,2, . ,1), Pi und ^ (z = 1,2, . r) sind reell, und es gilt f -^ 1 - ^ < 0. 2. Anzahl der Wurzeln einer Gleichung mit reellen Koeffizienten Aus den Darlegungen im voranstehenden Abschnitt folgt, daß jede Gleichung ungeraden Grades mindestens eine reelle Wurzel besitzt. Die Anzahl weiterer reeller Wurzeln der Gleichung A.164a) zwischen zwei beliebigen reellen Zahlen a und b, wobei a < b ist, kann folgendermaßen bestimmt werden: a) Abspalten der mehrfachen Wurzeln: Zuerst werden die mehrfachen Wurzeln von P(x) = 0 abgespaltet, so daß sich eine Gleichung ergibt, die alle Wurzeln, aber nur noch mit der Vielfachheit 1 enthält Dazu kann, wie beim Fundamentalsatz der Anlgebra erläutert, verfahren werden Praktischer ist es jedoch, gleich nach der STURMsc/ien Methode mit der Bestimmung der STURMsc/ien Kette (der STURMschen Funktionen gemäß A 169)) zu beginnen Wenn der letzte von Null verschiedene Rest Pm keine Konstante ist, dann besitzt P(x) mehrfache Wurzeln, die abzuspalten sind Deshalb kann P(x) — 0 in den folgenden Abschnitten b), c), d) als Gleichung ohne Mein fachwurzeln vorausgesetzt werden. b) Bildung der Folge der Sturnischen Funktionen: P(x).P'(x),Pl{x),P2(x), ,Pm = const A 169)
1.6 Algebraische und transzendente Gleichungen 45 Hier ist P(x) die linke Seite der gegebenen Funktion, P'(x) ist die erste Ableitung von P(x), P\(x) der Rest der Division von P(x) durch P'(x), aber genommen mit entgegengesetztem Vorzeichen, P2OO der ebenfalls mit entgegengesetztem Vorzeichen genommene Rest der Division von P'(x) durch P\(x) usw , Pm = const ^ 0 ist der letzte, aber konstante Rest Zur Vereinfachung der Rechnung kann man die gefundenen Reste mit konstanten positiven Faktoren multiplizieren, ohne daß sich das Ergebnis ändert. c) Theorem von Sturm: Wenn A die Anzahl der Vorzeichenwechsel, d h die Anzahl der Übergänge von „+" nach „—" und umgekehrt in der Folge A.169) für x = a ist und B die Anzahl der Vorzeichenwechsel in der Folge A.169) für x = b, dann ist die Differenz A — B gleich der Anzahl der reellen Wurzeln der Gleichung P(x) = 0 im Intervall [a, b]. Sind in der Zahlenfolge einige Zahlen gleich Null, dann werden diese bei der Abzählung der Vorzeichenwechsel ausgelassen. ¦ Für die Gleichung x4 — bx2 + Sx — 8 = 0 ist die Anzahl der Wurzeln im Intervall [0,2] zu bestimmen. Die Berechnung der STURMschen Funktion ergibt- P(x) — xA — 5x2 + Sx — 8 , P'(x) = 4x3 — 10x + 8, Pi(x) = 5x2 - 12z + 16; P2(x) = -Sx + 284, P3 = -1 Einsetzen von x = 0 liefert die Folge -8, +8, +16, +284, -1 mit zwei Wechseln, Einsetzen von x = 2 liefert +4, +20, +12, +278, -1 mit einem Wechsel, so daß A — B = 2 — 1 = 1, d.h., zwischen 0 und 2 liegt eine Wurzel d) Descartessche Regel: Die Anzahl der positiven Wurzeln der Gleichung P(x) = 0 ist nicht größer als die Anzahl der Vorzeichenwechsel in der Koeffizientenfolge des Polynoms P(x) und kann sich von dieser nur um eine gerade Zahl unterscheiden. ¦ Was kann über die Wurzeln der Gleichung x4 + 2x3 — x2 + 5.t — 1 = 0 ausgesagt werden7 Die Koeffizienten der Gleichung haben nacheinander die Vorzeichen + , + , — , + , — , d.h., das Vorzeichen wechselt dreimal. Die Gleichung besitzt in Übereinstimmung mit der Regel von Descartes entweder eine oder drei positive Wurzeln. Da beim Ersetzen von x durch — x die Wurzeln der Gleichung ihre Vorzeichen ändern, sich aber bei der Substitution von x durch x + h um h verringern, kann gemäß der Regel von Descartes auch die Anzahl der negativen Wurzeln sowie die Anzahl der Wurzeln, die größer sind als h, abgeschätzt werden. Im vorliegenden Beispiel führt das Ersetzen von x durch — x auf die Gleichung x'4 — 2x3 — x2 — 5x — 1 = 0 , d h , die Gleichung besitzt eine negative Wurzel Substituiert man x durch x + 1, dann ergibt sich x4 + 6x3 + llx2 + 13x + 6 = 0 , d h , alle positiven Wurzeln der Gleichung (eine oder drei) sind kleiner als 1. 3. Lösung von Gleichungen n-ten Grades Im allgemeinen sind Gleichungen mit n > 4 nur noch näherungsweise lösbar. In der Praxis werden aber auch schon zur Lösung von Gleichungen 3. und 4. Grades Näherungsmethoden angewendet Eine näherungsweise Lösung von Gleichungen n-ten Grades zur Ermittlung aller Wurzeln einer algebraischen Gleichung n-ten Grades, einschließlich der komplexen, ist mit der Methode von Brodetsky- Smeal möglich (s. [1.7], [19.37]) Die Berechnung einzelner reeller Wurzeln algebraischer Gleichungen kann auch mit Hilfe der allgemeinen Näherungsmethoden zur Lösung nichtlinearer Gleichungen erfolgen (s 19 1, S 911). Zur Bestimmung komplexer Nullstellen algebraischer Gleichungen wird das Bairstow-Verfahren angewendet (s. [19 21]). 1.6.4 Rückführung transzendenter Gleichungen auf algebraische Gleichungen 1.6.4.1 Definition Eine Gleichung F(x) = f(x) ist transzendent, wenn wenigstens eine der Funktionen F(x) oder f(x) nicht algebraisch ist. ¦ A: 3X = Ax~2 ¦ 2X , ¦ B: 21og5 {3x - 1) - log5 A2z + 1) = 0 , ¦ C: 3coshz - sinhx + 9 , ¦ D: 2X~1 = 8X~2 - 4X~2 , ¦ E: sin x = cos2 x - - , ¦ F: x cos x = sin x. 4 In manchen Fällen kann die Lösung transzendenter Gleichungen z B durch geeignete Substitutionen
46 1 Arithmetik auf die Lösung algebraischer Gleichungen zurückgeführt werden Im allgemeinen können transzendente Gleichungen jedoch nur näherungsweise gelöst werden Im folgenden werden einige Fälle betrachtet, die sich auf algebraische Gleichungen zurückführen lassen. 1.6.4.2 Exponentialgleichungen Exponentialgleichungen können in den folgenden zwei Fällen auf algebraische Gleichungen zurückgeführt werden, wenn die Unbekannte x oder ein Polynom P{x) nur im Exponenten einiger Größen a, 6, c, .. steht. a) Sind die Potenzen aPl^ , bP2^ , nicht durch Additionen oder Subtraktionen miteinander verbunden, dann wird die Gleichung zu beliebiger Basis logarithmiert. 2 log 4 3* = 4*-2.2*jxlog3 = (x-2)log4 + xlog2,x: log4-log3 + log2 b) Sind a, 6, c, ganze oder gebrochene Potenzen ein und derselben Zahl k , d.h., ist a = kn,b = km, c = k\ ..., dann kann unter Umständen mit Hilfe des Ansatzes y = kx eine algebraische Gleichung in log y y erhalten werden, nach deren Lösung x aus dem Verhältnis x — -—- zahlenmäßig zu bestimmen ist log/c <yx o3x o2x ¦ 2X~1 = Sx~2 - 4X~2 — = —---- Substitution von y = T liefert ys - 4y2 - 32y = 0 und y1 = 8 , 2 64 16 y2 = -4 , y3 = 0 ; 2Xl = 8, 2X2 = — 4 , 2Xi = 0 , so daß daraus folgt xi = 3. Weitere reelle Wurzeln gibt es nicht. 1.6.4.3 Logarithmische Gleichungen Logarithmische Gleichungen können in den folgenden zwei Fällen auf algebraische Gleichungen zurückgeführt werden, wenn die Unbekannte x oder ein Polynom P(x) nur unter dem Logarithmuszeichen vorkommt- a) Ist in der Gleichung nur der Logarithmus ein und desselben Ausdrucks enthalten, dann kann dieser als neue Unbekannte eingeführt und die Gleichung nach ihr aufgelöst werden. Die ursprüngliche Unbekannte wird über den Logarithmus berechnet ¦ ra[loga P(x)}2 + n = aJ[\oga P(x)]2 + b. Die Substitution y = \ogaP(x) liefert die Gleichung my2 + n = ay/y2 + b. Nach der Bestimmung von y erhält man für x die Gleichung P(x) = av b) Liegt die Gleichung in der Form einer Linearkombination von Logarithmen mit ganzzahligen Koeffizienten m, 77., . . zur gleichen Basis a von Ausdrücken vor, die ihrerseits Polynome von x sind, also in der Form m loga P\(x) + n loga P2(x) + . . = 0, dann können beide Seiten der Gleichung, jede für sich, auf den Logarithmus ein und desselben Ausdrucks zurückgeführt werden ¦ 21og5 Ci - 1) - log5A2x + 1) = 0, log5 ^"^r = kB*1 • (Ss~+ir = ! • *i = °. *" = 2 Für x\ = 0 ergibt sich beim Einsetzen in die Ausgangsgleichung der Logarithmus einer negativen Zahl, d h eine komplexe Größe, so daß x\ = 0 als Lösung entfällt 1.6.4.4 Trigonometrische Gleichungen Trigonometrische Gleichungen können auf algebraische Gleichungen zurückgeführt werden, wenn die Unbekannte x oder der Ausdruck nx + a mit ganzzahligem n nur im Argument der trigonometrischen Funktionen steht Unter Verwendung der trigonometrischen Formeln wird die Gleichung so umgeformt, daß sie nur noch eine einzige Funktion von x enthält, die gleich y gesetzt wird Nach der Lösung der so erhaltenen Gleichung wird x bestimmt. Zu beachten ist hierbei die Mehrdeutigkeit der Lösungen 11 3 ¦ sinx = cos2 x—- oder sin x = 1—sin2x—- . Substitution von y — sin x liefert y2-\-y—- = 0und?/i =
1.6 Algebraische und transzendente Gleichungen 47 1 3 - , 2/2 — —7: Die Lösung 2/2 ergibt wegen | sinx| < 1 keine reellen Lösungen der Ausgangsgleichung; 2/1 = 7: ergibt x = — 4- 2/c7T und x = —- + 2kn mit A; = 1,2,3, 2 6 6 1.6.4.5 Gleichungen mit Hyperbelfunktionen Gleichungen mit Hyperbelfunktionen können auf algebraische Gleichungen zurückgeführt werden, wenn die Unbekannte x nur im Argument der Hyperbelfunktionen steht. Dazu werden die Hyperbelfunktionen durch Exponentialausdrücke ersetzt und y — ex und - = e~x substituiert, so daß sich eine alge- y braische Gleichung für y ergibt Nach deren Lösung ist noch x = In y zu berechnen 2>(ex 4- e~x) ex — e~x 2 ¦ 3coshz = sinha; + 9, —— = + 9, ex + 2e~x -9 = 0 , y-\-- -9 = 0, y2 -9y + 2 = 0; 2 2 2/ 9±\/73 , 9 + x/73 n „„ , 9-v/73 , _ 2/1,2 = i— ; X! = In ^— « 2,1716, x2 = In ^— « -1,4784
48 2 Funktionen und ihre Darstellung 2 Funktionen und ihre Darstellung 2.1 Funkt ionsbegriff 2.1.1 Definition der Funktion 2.1.1.1 Funktion Wenn x und y zwei variable Größen sind und wenn sich einem gegebenen x'-Wert genau ein y-Wert zuordnen läßt, dann nennt man y eine Funktion von x und schreibt V = /(*) B 1) Die veränderliche Größe x heißt unabhängige Variable oder Argument der Funktion y Alle x-Werte, denen sich j/-Werte zuordnen lassen, bilden den Definitionsbereich D der Funktion f(x) Die veränderliche Größe y heißt abhängige Variable, alle y-Werte bilden den Wertebereich W der Funktion f(x) Funktionen können graphisch durch Punkte (x, y) als Kurven oder Funktionsgraphen dargestellt werden (Abb.2.1, Abb.2.2) 2.1.1.2 Reelle Funktion Wenn Definitions- und Wertebereich nur reelle Zahlen enthalten, dann nennt man y = f(x) eine reelle Funktion einer reellen Veränderlichen. ¦ A: y = x2 mit D — oo < x < oo, W . 0 < y < oo ¦ B: y = y/x mit £> 0 < x < oo, VK . 0 < ?/ < oo. 2.1.1.3 Funktion von mehreren Veränderlichen Hängt die Variable y von mehreren unabhängigen Variablen X\,xi, .,xn ab, dann bezeichnet man y = f(xux2, . ,xn) B 2) als Funktion von mehreren Veränderlichen (s 2 18, S. 120). 2.1.1.4 Komplexe Funktion Wenn die unabhängige Variable eine komplexe Zahlzist, dann wird durch w = f(z) eine komplexe Funktion einer komplexen Veränderlichen beschrieben, zu deren Behandlung die Funktionentheorie (s 14 1, S 693) benötigt wird Zu den komplexen Funktionen gehören auch die komplexwertigen Funktionen, die für reelle Argumente x definiert sind, aber komplexe Funktionswerte f(x) besitzen 2.1.1.5 Weitere Funktionen In verschiedenen Anwendungsgebieten, z.B. in der Vektoranalysis und Feldtheorie (s 13 1, S 663), werden Funktionen verwendet, bei denen Argument und Funktionswerte beispielsweise wie folgt definiert sind 1. Argument reell - Funktionswerte Vektoren ¦ A: Vektorfunktion (s. 13 1, S 663) ¦ B: Parameterdarstellung von Kurven (s. 3 6 2 1, S 245) 2. Argumentwerte Vektoren - Funktion reell ¦ Skalarfeld (s 13 1 2, S 664). 3. Argumentwerte Vektoren - Funktionswerte Vektoren. ¦ A: Vektorfeld (s 13 1 3, S 665) ¦ B: Parameterdarstellung oder Vektorform von Flächen (s 3 6 3. S 251) 2.1.1.6 Funktionale Wird jeder Funktion x = x(t) aus einer bestimmten Funktionenklasse eine reelle Zahl zugeordnet, dann spricht man von einem Funktional rb ¦ A: Ist x(t) eine gebene, über [a, b] integrierbare Funktion, dann ist f(x) = / x(t) dt ein lineares Funktional bezüglich aller über [o, b] stetigen Funktionen x (s 12 5, S 639)
2.1 Funktionsbegriff 49 ¦ B: Integralausdrücke bei Variationsaufgaben (s. 10.1, S. 572). 2.1.1.7 Funktion und Abbildung Gegeben sind zwei nichtleere Menge X und Y Unter einer Abbildung, die durch f'X^Y B.3) beschrieben wird, versteht man eine Vorschrift, die jedem Element x von X ein eindeutig bestimmtes Element y von Y zuordnet. Das Element y heißt Bild von x, und man schreibt auch y = f(x). Die Menge Y heißt Bildbereich oder Wertebereich von /, die Menge X heißt Originalbreich, Urbildbereich oder Definitionsbreich von / ¦ A: Sind Original- und Bildbereich Teilmengen der reellen Zahlen, d.h. gilt X = D C R und Y = W C R, dann wird durch B.3) eine reelle Funktion y = f(x) einer reellen Veränderlichen x beschrieben. ¦ B: Ist / eine Matrix A = (tZy) (i = 1,2,..., m; j = 1,2, .., n) vom Typ (m, n) und gilt X = Rn sowie Y = Rm , dann wird durch B.3) eine Abbildung des Rn in den Rm beschrieben. Die Vorschrift B.3) stellt dann das folgende System von m linearen Gleichungen dar: 2/i = CLnXi + öi2^2 + • • • + ainxn v = Ax bzw V2 = a2lXl + a22X2 + ' " + a2nXn Vm = amiXi + am2X2 + ' ' ' + amnXn d.h. Ax bedeutet das Produkt der Matrix A mit dem Vektor x. Hinweise: 1. Durch den Begriff der Abbildung wird der Funktionsbegriff verallgemeinert. Deshalb werden Abbildungen auch als Funktionen bezeichnet. 2. Wichtige Eigenschaften von Abbildungen findet man in 5.2.3,5., 305,306. 3. Eine Abbildung, die jedem Element eines abstrakten Raumes X eindeutig ein Element eines eventuellen anderen abstrakten Raumes Y zuordnet, wird Operator genannt. Dabei versteht man unter einem abstrakten Raum in der Regel einen Funktionenraum, da die Elemente der Räume, die für Anwendungen wichtig sind, meist Funktionen sind. Abstrakte Räume sind z B. die linearen Räume (s. Vektorräume 5.3.7, S 327), die metrischen Räume (s. 12.2, S 624) und die normierten Räume (s 12.3.1.1, S. 631). 2.1.2 Methoden zur Definition einer reellen Funktion 2.1.2.1 Angabe einer Funktion Man kann eine Funktion auf unterschiedliche Weise angeben oder definieren, z.B. durch eine Wertetabelle, eine graphische Darstellung oder Kurve, eine Formel, auch analytischer Ausdruck genannt, oder abschnittsweise durch verschiedene Formeln. In den Definitionsbereich eines analytischen Ausdrucks können nur solche Werte des Arguments einbezogen werden, für die die Funktion einen Sinn ergibt, d h. eindeutig bestimmte endliche reelle Werte annimmt. 2.1.2.2 Analytische Darstellung reeller Funktionen In der Regel werden die folgenden drei Formen genutzt 1. Explizite Darstellung: y = f(x). B.4) ¦ y = y/\ - x2, — 1 < x < 1, 0 < 3/ < 1. Hierbei handelt es sich um die obere Hälfte des Einheitskreises mit dem Mittelpunkt im Koordinatenursprung. 2. Implizite Darstellung: F(x, y) = 0, B.5) falls sich diese Gleichung eindeutig nach y auflösen läßt. ¦ x2 + 2/2-l = 0, — 1 < a; < +1, 0 < y < 1. Hierbei handelt es sich ebenfalls um die obere Hälfte des Einheitskreises. Man beachte, daß mit x2 4- y2 + 1 = 0 keine reelle Funktion definiert wird.
50 2. Funktionen und ihre Darstellung 3. Parameterdarstellung: x = <p(t), y = ip(t). B.6) Die Werte von x und y werden als Funktion einer Hilfsveränderlichen t angegeben, die Parameter genannt wird Die Funktionen ip(t) und tp(t) müssen denselben Definitionsbereich haben, und zu x = ip(t) muß die Umkehrfunktion existieren. ¦ x — ip(t), y = ip(t) mit (p(t) = cost und ip(t) = sint, 0 < t < tt Hierbei handelt es sich abermals um die Darstellung der oberen Hälfte des Einheitskreises mit dem Mittelpunkt im Koordinatenursprung. Hinweis: Nicht jede Funktion mit einer Parameterdarstellung hat eine explizite oder implizite parameterfreie Funktionsgleichung. ¦ x = t + 2sint = <p(t), y = t — cost — ip(t) ¦ A: y = E(x) = int(z) = [x] = n für n < x < n+1, nganz Die Funktion E(x) bzw int(x) wird „entierxu bzw „integer part of abgelesen und gibt die größte ganze Zahl kleiner gleich x an (Abb.2.1a) Die Pfeilspitzen in Abb.2.1a,b sollen darauf hinweisen, daß die Endpunkte nicht zum Kurvenbild gehören. ¦ B: Die Funktion y = frac(x) = x — [x] heißt Restfunktion und wird „fractional part of x" gelesen Sie gibt die Differenz zwischen x und [x] an (Abb.2.1b). ¦C: y=\^furx>0] (Abb'2-2a) {-1 für x < 0, 0 für x = 0 , + 1 für x > 0. (Abb.2.2b). Mit sign(z), lies „Signums", ist die Vorzeichenfunktion bezeichnet. Abbildung 2 2 2.1.3 Einige Funktionstypen 2.1.3.1 Monotone Funktionen Genügt eine Funktion im Definitionsbereich für beliebige Argumente X\ und x2 mit x2 > x\ der Bedingung f(x2)>f(xi) bzw. f(x2)<f(xl): B.7a) dann wird sie monoton wachsende Funktion bzw. monoton fallende Funktion genannt (Abb.2.3a,b). Wenn eine der Bedingungen B.7a) nicht für alle x-Werte erfüllt ist, die dem Definitionsbereich angehören, sondern lediglich in einem Teil desselben, z B in einem Intervall oder auf einer Halbachse, dann nennt man die Funktion monoton in diesem Gebiet. Funktionen, die der Bedingung f{x2)>f{x1) bzw f(x2)<f(Xl) B 7b) genügen, d.h., das Gleichheitszeichen in B 7a) ist nicht zugelassen, nennt man eigentlich oder streng monoton wachsendbzw fallend In Abb.2.3a ist eine eigentlich monoton wachsende Funktion dargestellt, in Abb.2.3b eine monoton fallende Funktion, die zwischen x\ und x2 konstant ist. Beispiele abschnittsweise gegebener Funktionen: 5t 4J 3J 2t l| y=x-E(x) y=E(x) _ 1 2 3 4 5 6 x yt i 0' i X -1 a) b)
2 1 Funktionsbegriff 51 ÖT a) Ol b) Abbildung 2.3 ¦ y = e x ist streng monoton fallend, y = In x ist streng monoton wachsend 2.1.3.2 Beschränkte Funktionen Funktionen heißen nach oben beschränkt, wenn ihre Werte eine bestimmte Zahl {obere Schranke) nicht übertreffen, und nach unten beschränkt, wenn ihre Werte nicht kleiner als eine bestimmte Zahl [untere Schranke) sind Ist eine Funktion nach oben und nach unten beschränkt, dann nennt man sie schlechthin beschränkt ¦ A: y = 1 — x2 ist nach oben beschränkt (y < 1). ¦ B: y = ex ist nach unten beschränkt (y > 0). 4 ¦ C: y = sina: ist beschränkt (—1 < y < +1) BD: y = ist beschränkt @ < y < 4). 1 + x2 2.1.3.3 Extremwerte von Funktionen Die Funktion f(x) mit dem Definitionsbereich D hat an der Stelle a ein absolutes oder globales Maximum, wenn für alle x 6 D gilt: /(«) > /(*) B 8a) Die Funktion /(x) hat an der Stelle a ein relatives oder lokales Maximum, wenn die Ungleichung B 8a) nur in einer Umgebung von a gilt, d h. für alle x mit a — £<x<a + e,£>0,x€D. Die Definition für ein absolutes oder globales Minimum sowie für ein relatives oder lokales Minimum lauten analog, es ist nur die Ungleichung B 8a) zu ersetzen durch f(a) < /(*) B 8b) Hinweise: a) Die Begriffe Maximum und Minimum, zusammenfassend als Extremwerte bezeichnet, sind nicht an die Differenzierbarkeit von Funktionen gebunden, gelten also auch für Funktionen, die an einzelnen Stellen nicht differenzierbar sind. Beispiele dafür sind die Spitzen von Kurven (s. Abbn.6.10b,c, S 406) b) Kriterien zur Bestimmung von Extremwerten bei differenzierbaren Funktionen findet man in 6 1 5, S 405ff. 2.1.3.4 Gerade Funktionen Gerade Funktionen (Abb.2.4a) genügen der Bedingung f(-x) = f(x) B.9a) Ist D der Definitionsbereich von / , dann gilt (xeD)=> {-x e D) B 9b) ¦ A: y = cosx , ¦ B: y = xA — 3x2 + 1 2.1.3.5 Ungerade Funkt ionen Ungerade Funktionen (Abb.2.4b) genügen der Bedingung /(-*) = -/(*). B 10a) Ist D der Definitionsbereich von / , dann gilt (xeD)^(-xeD). B.10b)
52 2. Funktionen und ihre Darstellung b) Abbildung 2 5 Abbildung 2.4 ¦ A: y = sin x , ¦ B: y = x3 — x. 2.1.3.6 Darstellung mit Hilfe gerader und ungerader Funktionen Genügt der Definitionsbereich D einer Funktion / der Bedingung „aus x G D folgt — x G D", dann ist / als Summe einer geraden Funktion g und einer ungeraden Funktion u darstellbar f(x) = g{x) + u{x) mit g{x) = ~[f{x) + f(-x)} u(x) = \[f{x)-f(-x). B.11) f(x) = e* = i (ex + e"x) + i (e* - e"*) = coshz + sinhx (s 2 9.1, S B.12) 2.1.3.7 Periodische Funktionen Periodische Funktionen genügen der Bedingung f{x + T) = f(x), T = const, T ^ 0. Die kleinste positive Zahl T, die dieser Bedingung genügt, heißt Periode (Abb.2.5) 2.1.3.8 Inverse oder Umkehrfunktionen Die Funktion y = f(x) mit dem Definitionsbereich D und dem Wertebereich W ordnet jedem x G D eindeutig y G W zu. Kann umgekehrt auch jedem y G W eindeutig ein x G D zugeordnet werden, so entsteht die Umkehrfunktion oder inverse Funktion von /. Sie wird mit </? oder auch /_1 bezeichnet. Das Zeichen /_1 stellt in diesem Fall ein Funktionssymbol dar, keine Potenz. Um von einer Funktion y = f(x) zur Umkehrfunktion zu gelangen, werden x und y vertauscht, und die Gleichung x = f(y) wird nach y aufgelöst, so daß sich y = ip(x) ergibt. Die Darstellungen y = f(x) und x = (p(y) sind äquivalent. Daraus folgen die beiden wichtigen Formeln f(<p(y)) = y und <p(f(x)) = x. B.13) ¦ Die Funktion y = f(x) = ex (D . —oo < x < oo, W : y > 0) ist äquivalent mit x = ip(y) = \ny Esgiltelny = y,\nex = x Das Kurvenbild der inversen Funktion y = (p(x) entsteht durch Spiegelung der Kurve von y = f(x) an der Geraden y = x (Abb.2.6). Beispiele für Umkehrfunktionen: B: y = f(x) = x2 y = <p(x) = yfx y = f{x) = ex y = if(x) = \nx y = f(x) = sinx y = ip(x) = aresin x mit£>: mit/? mit D. mit D: mit D: mit D: x >0, x>0, — 00 < X < OO, x >0, -tt/2 < x < tt/2, -1 <x< 1, W: H^ iy. V^: Py. H^- 2/>0; y>0 2/>0; —oo < y < oo. -l < y < l; -tt/2 <y<n/2 C: Hinweise: 1. Ist eine Funktion / in einem Intervall ICD streng monoton, dann existiert für dieses Intervall die
2 1 Funktionsbegriff 53 y< /ö ii/ J"y^& X /' /^ X y=arcsin x a) b) Abbildung 2.6 Umkehrfunktion / 1 2. Läßt sich eine nichtmonotone Funktion in streng monotone Teilstücke zerlegen, dann existieren für diese Teilstücke die jeweiligen Umkehrfunktionen 2.1.4 Grenzwert von Funktionen 2.1.4.1 Definition des Grenzwertes einer Funktion Die Funktion y = f(x) sei in einer Umgebung von a, eventuell mit Ausnahme von a, definiert. Die Funktion besitzt an der Stelle x ¦ lim f(x) = A oder f(x) a den Grenzwert oder Limes A , in Zeichen A für B.14) wenn sich die Funktion f(x) bei unbegrenzter Annäherung von x an a unbegrenzt an A nähert Die :unktion f(x) braucht an der Stelle x — a den Wert A nicht anzunehmen und braucht an dieser Stelle luch nicht definiert zu sein. Exakte Formulierung: Der Grenzwert B.14) existiert, wenn sich nach Vorgabe einer beliebig kleinen positiven Zahl e eine zweite positive Zahl n derart finden läßt, daß für alle x mit \x-a\<n gilt \f{x)-A\<e, B15) eventuell mit Ausnahme des Punktes a (Abb.2.7). , A+£ A A-e 0 \Y —? a-r ~A / \ 1 a a- ^ Hl X Abbildung 2.7 Abbildung 2 8 Wenn a Randpunkt eines zusammenhängenden Gebietes ist, reduziert sich die Ungleichung \x — a\ < rj zu einer der beiden einfachen Ungleichungen a — rj,<x oder x < a + r\. 2.1.4.2 Zurückführung auf den Grenzwert einer Folge (s. 7.1.2, S. 421) Eine Funktion f(x) besitzt an der Stelle x — a den Grenzwert A , wenn für jede Folge von x-Werten ii, x2, ., xn, ., die innerhalb des Definitionsbereiches liegen und gegen a konvergieren, die zugehörige Folge der Funktionswerte /(xi), f{x2), . , f{xn), gegen A konvergiert 2.1.4.3 Konvergenzkriterium von Cauchy Damit eine Funktion f(x) an der Stelle x = a einen Grenzwert besitzt, ist es notwendig und hinreichend, daß sich die Funktionswerte f(x\) und f(x2) für zwei beliebige Werte x\ und x2 der unabhängigen
54 2. Funktionen und ihre Darstellung Variablen, die zum Definitionsbereich gehören und in hinreichender Nähe von a liegen, beliebig wenig voneinander unterscheiden Exakte Formulierung: Damit eine Funktion/(x) an der Stelle x = a einen Grenzwert besitzt, ist es notwendig und hinreichend, daß sich nach Vorgabe einer beliebig kleinen positiven Zahl e eine zweite positive Zahl 77 angeben läßt, so daß für zwei beliebige Werte x\ und x<i aus dem Definitionsbereich, die den Bedingungen \x\ — a\ < 77 und \xi — a\ < rj B.16a) genügen, die folgende Ungleichung erfüllt ist- |/(*i)-/(*2)|<e. B 16b) 2.1.4.4 Unendlicher Grenzwert einer Funktion Das Symbol lim|/(x)| = 00 B 17) bezeichnet den Fall, daß bei Annäherung von x an die Stelle o die Funktion f(x) betragsmäßig über alle Grenzen wächst. Exakte Formulierung: Die Gleichung B.17) gilt, wenn sich nach Vorgabe einer beliebig großen positiven Zahl K eine positive Zahl rj derart angeben läßt, daß für beliebige x-Werte im Intervall a — rj < x < a + r) B 18a) der entsprechende Wert von \f(x)\ größer ist als K: |/(x)| > K. B.18b) Wenn dabei alle Werte von f(x) im Intervall a-r) < x < a + r] B 18c) positiv sind, dann schreibt man lim/(a;) = +00, B.18d) sind sie negativ, dann gilt lim/(z) = -00. B.18e) 2.1.4.5 Linksseitiger und rechtsseitiger Grenzwert einer Funktion Eine Funktion f(x) hat an der Stelle x = a einen linksseitigen Grenzwert A~ , wenn sie sich bei zunehmenden unbegrenzt der Zahl a nähernden x-Werten unbegrenzt dem Wert A~ nähert: A- = lim f{x) = f(a - 0). B.19a) x—>a—0 In Analogie dazu besitzt eine Funktion einen rechtsseitigen Grenzwert A+, wenn sie sich bei abnehmenden, sich unbegrenzt der Zahl a nähernden x-Werten unbegrenzt dem Wert A+ nähert: A+ = lim f(x) = f(a + 0) . B 19b) x—»a+0 Die Schreibweise lim f(x) = A verlangt, daß der links- und rechtsseitige Grenzwert übereinstimmen: A+ = A~ = A B.19c) ¦ Die Funktion f(x) = — geht für x —> 1 gegen verschiedene Grenzwerte von links und von l + e^i rechts: /(l - 0) = 1, /(l + 0) = 0 (Abb.2.8) 2.1.4.6 Grenzwert einer Funktion für x gegen unendlich Der Definitionsbereich D einer Funktion y = f(x) sei unbeschränkt nach oben bzw. nach unten. Fall a) Eine Zahl A= lim f{x) B.20a) x—>+oo
2 1 Funktionsbegriff 55 wird Grenzwert einer Funktion f(x) für x —> +oo genannt, wenn sich nach Vorgabe einer positiven Zahl e eine Zahl N > 0 derart angeben läßt, daß für beliebige x > N und x G D die zugehörigen Werte von f(x) im Intervall A — e < f(x) < A + e liegen. In Analogie dazu ist A= lim f(x) B 20b) der Grenzwert einer Funktion f(x) für x —? — oo , wenn sich nach Vorgabe einer beliebig kleinen Zahl s eine Zahl —N < 0 und x e D angeben läßt, derart, daß für beliebige x < — N und x G D die zugehörigen Werte von f(x) im Intervall A — s < f(x) < A + e liegen ¦ A: lim ^±1 = i |B: lim ^±1 = 1, ¦ C: lim ex = 0. x—++oo x x—?—oo j; x—»—oo Fall b) Wenn allerdings bei unbegrenztem Wachsen oder unbegrenztem Abnehmen von x die Funktion absolut genommen über alle Grenzen wächst, dann schreibt man lim |/(x)|=oo oder lim |/(ar)| = oo B.20c) x—>+oo x—>—oo X3 - 1 X3 - 1 ¦ A: lim r— = +oo , ¦ B: lim — = —oo , x—++oo x x—>—oo x 1- X3 l- X3 * ¦ C: lim — = —oo , ¦ D: lim — = +oo x—>+oo x x—>-oo x 2.1.4.7 Sätze über Grenzwerte von Funktionen 1. Grenzwert einer konstanten Größe Der Grenzwert einer konstanten Größe ist dieser Größe selbst gleich Iimi4 = i4 B.21) x—+a 2. Grenzwert einer Summe oder Differenz Der Grenzwert einer Summe oder Differenz endlich vieler Funktionen ist gleich der Summe bzw. Differenz der entsprechenden Grenzwerte dieser Funktionen, falls die Einzelgrenzwerte existieren. lim [f{x) + <p{x) - ip(x)] = lim f(x) + lim <p(x) - lim ip(x) B.22) 3. Grenzwert eines Produktes Der Grenzwert eines Produktes aus endlich vielen Funktionen ist gleich dem Produkt der Grenzwerte dieser Funktionen, falls die Einzelgrenzwerte existieren: lim a [f(x) <p(x) *l>(x)\ = [lim /(x)] [lim <p(x)\ [lim ^(x)] B 23) 4. Grenzwert eines Quotienten Der Grenzwert des Quotienten zweier Funktionen ist gleich dem Quotienten der Grenzwerte dieser Funktionen: x~*a ip(x) hm ip(x) wenn die Einzelgrenz werte existieren und lim ip(x) ^ 0 ist. x—>a 5. Einschließung Wenn die Werte einer Funktion f(x) zwischen den Werten zweier anderer Funktionen tp(x) und iß(x) eingeschlossen sind, wenn also <p(x) < f(x) < iß(x) ist, und wenn lim <p{x) = A sowie lim ip(x) = A gilt, dann ist auch lim/(j;) = i4. B.25) 2.1.4.8 Berechnung von Grenzwerten Zur Berechnung von Grenzwerten werden die aufgeführten 5 Sätze sowie eine Reihe von Umformungen benutzt
56 2. Funktionen und ihre Darstellung 1. Geeignete Umformung Die Funktion wird auf eine für die Grenzwertberechnung geeignete Form gebracht. x3 - 1 ¦ A: lim = lim (x2 + x + 1) = 3 x-+i x - 1 s-iv ' *-0 X x^O x(y/l -\-X-\- l) *-0 «yi + x + 1 2 _ _ ,. sin 2a; .. 2(sin2x) rt ,. sin 2x ¦ C: lim = lim -^— - = 2 lim —— = 2. x-*o x x^o 2x 2x-^o 2a: 2. Bernoulli-l'Hospitalsche Regel Treten unbestimmte Ausdrücke der Form - , — , 0 • oo . oo - 0 oo oo , 0° , oo° , 1°° auf, dann wird die BERNOULLi-L'HosPiTALsc/ie Regel verwendet (kurz L'Hospital- sche Regel). Fall a) Unbestimmte Ausdrücke der Form -oder —: Wenn für f(x) = —7—(¦ folgendes gilt: 0 00 ip(x) • lim (p(x) = 0 und lim ip(x) = 0 (unbestimmter Ausdruck -) oder 00 lim ip(x) = 00 und lim ib(x) = 00 (unbestimmter Ausdruck —), x—>a v ' x-*a v ' v qq • die Funktionen tp(x) und ^(aj) sind in einem Intervall, das den Punkt a enthält, definiert (im Punkt a selbst brauchen diese Funktionen nicht definiert zu sein) und differenzierbar mit i//(x) ^ 0. Dann gilt: lim/(x) = lim ^ = lim ^4, B.26) x^a x^a \jj[x) x~*a 1pf(X) (fi'(x) falls dieser Grenzwert existiert (Reqel von Bernoulli-l'Hospital) Ergibt der Ausdruck lim , . . wieder einen unbestimmten Ausdruck der Form - oder — , dann wird das Verfahren wiederholt 0 oo 2 cos 2a: 2 _ .. In sin 2a: .. ^n o~ .. 2tana: .. Pnc,2^ .. cos22a: ¦ hm = hm srm«ffi = hm — = hm co% x = hm — = 1. x^o In sin x x^o cuax x^o tan 2a: x-^o l x->o cos2a: • skia: cos22a: Fall b) Unbestimmte Ausdrücke der Form 0 • oo: Wenn unter ähnlichen Bedingungen wie im Falle a) gilt f(x) = <p(x) iß(x) und lim ip(x) = 0 sowie lim ip(x) = oo , dann wird der Grenzwert lim f(x) io(x) ib(x) auf die Form lim —*— oder lim —;— gebracht, so daß die Berechnung des Grenzwertes auf den Fall x—*a 1 x—>a 1 ip{x) <p(x) - oder — zurückgeführt ist. 0 oo _ .. , _ . .. 7T — 2a: —2 ¦ hm [TT — 2x) tana: = hm = hm ^— = 2 x->7r/2 x-^tt/2 COta: x^tt/2 1 sin2a: Fall c) Unbestimmte Ausdrücke der Form oo — oo: Wenn unter den ähnlichen Bedingungen wie im Falle a) gilt f(x) = ip(x) — ip(x) und lim tp(x) = 00 sowie lim ijj(x) = 00 , dann wird zur Berechnung des Grenzwertes lim fix) die Differenz auf die Form - oder — gebracht, was auf verschiedene Weise *-+«JK J 0 oo &
2 1 Funktionsbegriff 57 erreicht werden kann, z.B ist w — ip = \ — I / —- \i> <pj I (ftp (x 1 \ (x\wx — x -\- \\ 0 —'¦ — ) = lim —¦ - = „-'' Zweimalige Anwendung der L'HosPiTALschen x — 1 mxj z—i \ xInx — Inx J 0 Regel führt auf lim — I = lim =- = lim z—i \ xlnx — lnx J x->i | i x | x-»i x . 1 X' ^X Xz I Fall d) Unbestimmte Ausdrücke der Form 0° , oo° , 1°°: Für f(x) = y(x)^x) mit lim ip(x) = 0 sowie lim ip(x) = 0 wird zunächst der Grenzwert A des Ausdrucks ln/(x) = iß(x) ki(p(x) berechnet, der die Form 0 • oo hat (Fall b)), und dann eA . Analog wird in den Fällen oo° und 1°° verfahren ¦ lim xx = X , In xx = x In x , lim x In x = lim —r- = lim(—x) = 0 , d.h , A = In X = 0 , x—0 x-*0 z—0 1 2—0V ' x also X — 1, und somit lim a:x = 1 x-^0 3. Taylor-Entwicklung Neben der l'HosPiTALschen Regel wird zur Berechnung von Grenzwerten unbestimmter Ausdrücke auch die Entwicklung in eine TAYLOR-Reihe verwendet (s. 7.3.3.3, S. 434) . ,. x-sinx ,. X r 3' + 5! '") ,. (I x2 \ 1 ¦ hm - = hm ^ - '- = hm —- — + •••=- . x-o x3 *-o x3 *-o \3' 5! / 6 2.1.4.9 Größenordnung von Funktionen und Landau-Symbole Beim Vergleich zweier Funktionen kommt es häufig auf ihr gegenseitiges Verhalten für bestimmte Argumente x = a an. Das hat zur Einführung der folgenden Größenordnungsbeziehungen gefuhrt. 1. Eine Funktion f(x) wird von höherer Ordnung unendlich groß als eine Funktion g(x), wenn beim /(X) I über alle 9{x) Grenzübergang x —> a ihre Absolutbeträge sowie der Absolutbetrag des Quotienten Grenzen wachsen 2. Eine Funktion f(x) wird von höherer Ordnung unendlich klein als eine Funktion g(x), d h , sie verschwindet von höherer Ordnung, wenn beim Grenzübergang x —? a ihre Absolutbeträge sowie der f(x) Quotient —— gegen null gehen 9{x) 3. Zwei Funktionen f(x) und g(x) streben gegen null oder unendlich von der gleichen Größenordnung, wenn der Absolutbetrag des Quotienten 9(x) beim Grenzübergang x —> a beschränkt bleibt, d h.. fix) wenn 0 < m < l^^-l < M < oo (m, Mconst) gilt. 9W 4. Landau-Symbole Das gegenseitige Verhalten zweier Funktionen bezüglich einer beliebigen Stelle x = a wird durch die LANDAU -Symbole O („groß O"), bzw. o („klein ou) wie folgt beschrieben Es bedeutet für x —> a f(x) = 0{g{x)) • lim ^p| = A^0, A = const, B 27a)
58 2. Funktionen und ihre Darstellung und f(X) = o(g(x)): k|=0, B 27b) wobei a = oo zugelassen ist. Die LANDAU-Symbole haben nur Sinn bei gleichzeitiger Vorgabe der Bewegungsrichtung x —? a. ¦ A: sinx = 0{x) für x —*• 0 , denn mit f(x) = sinx und #(x verhält sich in der Umgebung von x — 0 wie x. ¦ B: /(x) verschwindet von höherer Ordnung als g(x) für f(x) = 1 — cosx, g(x .... sinx ., . n , . x gilt: lim = 1 =fc 0 , d.h , sm x x-,0 x lim a:->0 /(*) PfaO = lim x-+0 1 - cos x I = 0, d.h., 1 — cos x = o(sinx) für x —* 0. C: /(#) und 51 (x) verschwinden von gleicher Ordnung für f(x) = 1 — cosx , p(x) = x2 lim x->0 /W ^W = lim x->0 1 — cos x I - , d.h., 1 — cosx = 0(x2) für x ¦ ?0 5. Polynome Die Größenordnung von ganzrationalen Funktionen kann durch den Grad der Funktion ausgedrückt werden. So hat die Funktion /(x) = x die Größenordnung 1, ein Polynom mit dem Grad n +1 hat eine um 1 höhere Ordnung als ein Polynom mit dem Grade n Allerdings gilt diese Regel nicht für alle elementaren Funktionen 6. Exponentialfunktion Die Exponentialfunktion wird stärker unendlich als jede noch so hohe Potenz xn (n eine feste natürliche Zahl). lim — = 00 . x—>oo I xn I Durch Anwendung der L'HoSPlTALschen Regel ergibt sich nämlich lim — x—>oo xn lim x^°° nxn~Y lim —r x-00 n\ B.28a) B.28b) 7. Logarithmusfunktion Der Logarithmus wird schwächer unendlich als jede noch so niedrige positive Potenz x1//n (n eine feste natürliche Zahl): lim 1-+00 logx El/n = 0 Der Beweis wird ebenfalls mit der Regel von l'Hospital gefuhrt. 2.1.5 Stetigkeit einer Punktion 2.1.5.1 Stetigkeit und Unstetigkeitsstelle Die meisten Funktionen die in den Anwendungen vorkommen, sind stetig, d.h., bei kleinen Änderungen des Arguments x einer stetigen Funktion y(x) ändert sich diese auch nur geringfügig. Die graphische Darstellung einer solchen Funktion ergibt eine zusammenhängende Kurve. Ist dagegen die Kurve an verschiedenen Stellen unterbrochen, dann heißt die zugehörige Funktion unstetig, und die Werte des Arguments, an denen die Unterbrechung auftritt, heißen Unstetigkeits- stellen In Abb.2.9 ist das Kurvenbild einer Funktion dargestellt, die stückweise stetig ist Die Unstetigkeitsstellen befinden sich bei A, B, C, D, E, F und G. Die Pfeile stehen für die Aussage, daß ihre Endpunkte nicht mehr zur Kurve gehören. B 29) Abbildung 2.9
2.1 Funktionsbegriff 59 2.1.5.2 Definition der Stetigkeit Eine Funktion y = f(x) heißt an der Stelle x = a stetig, wenn 1. f(x) an der Stelle a definiert ist und 2. der Grenzwert lim f(x) existiert und gleich f(a) ist Das ist genau dann der Fall, wenn es zu jedem vorgegebenen e > 0 ein ö(e) > 0 gibt, so daß gilt. \f(x)-f(a)\<£ für alle x mit \x - a\ < 6. B.30) Man spricht von einseitiger (links- oder rechtsseitiger) Stetigkeit, wenn anstelle von lim f(x) = f(a) nur einer der beiden Grenzwerte lim f(x) oder lim f(x) existiert und gleich f(a) ist x—>a—0 x—>a+0 Wenn eine Funktion für alle Werte x in einem gegebenen Intervall von a bis b stetig ist, dann wird die Funktion stetig in diesem Intervall genannt, das offen, halboffen oder abgeschlossen sein kann (s. 1.1 1.3, 3., S 2) Ist eine Funktion für alle Punkte der Zahlengeraden definiert und stetig, dann heißt sie überall stetig Eine Funktion besitzt für den Wert x = a , der sich im Inneren oder auf dem Rande des Definitionsbereiches befindet, eine Unstetigkeitsstelle, wenn dort die Funktion nicht definiert ist oder wenn f(a) nicht mit dem Grenzwert lim fix) übereinstimmt bzw dieser Grenzwert nicht existiert. Wenn die Funktion x-+a J v ' nur auf einer Seite von x — a definiert ist, z.B. y/x für x = 0 und arccosa: für x = 1, dann wird nicht von einer Unstetigkeitsstelle, sondern von einem Abbrechen der Funktion gesprochen. Eine Funktion f(x) wird stückweise stetig genannt, wenn sie in allen Punkten eines Intervalls mit Ausnahme endlich vieler einzelner Punkte stetig ist und in ihren Unstetigkeitsstellen endliche Sprünge besitzt 2.1.5.3 Häufig auftretende Arten von Unstetigkeiten 1. Funktionsverlauf ins Unendliche Der Funktionsverlauf ins Unendliche ist die am häufigsten auftretende Unstetigkeit (Punkte B, C und E in Abb.2.9) ¦ A: f(x) = tanx , / (f - o) = +oo , / (f + o) = -oo Die Kurve ist in Abb.2.34, S. 77 dargestellt, die Unstetigkeit ist von der Art des Punktes E in Abb.2.9. Die symbolische Bezeichnung f(a—0) bzw f(a + 0) ist in 2 1.4.5, S 54 erklärt. ¦ B: f(x) = -. —t. , /(l — 0) = +oo , /(l + 0) = +oo Die Unstetigkeitsstelle ist von der Art des [x — \y Punktes B in Abb.2.9. i ¦ C: f(x) = e*-i , /(l - 0) = 0 , /(l + 0) = oo . Die Unstetigkeitsstelle ist von der Art des Punktes C in Abb.2.9, aber mit dem Unterschied, daß die Funktion f(x) im Punkt x = 1 nicht definiert ist 2. Endlicher Sprung Die Funktion f(x) springt beim Durchlaufen des Punktes x = a von einem endlichen auf einen anderen endlichen Wert (Punkte A, F, G in Abb.2.9): Der Wert der Funktion f(x) für x = a braucht dabei nicht definiert zu sein, wie es für den Punkt G der Fall ist; er kann auch mit dem Wert f(a — Ö) oder f(a + 0) übereinstimmen (Punkt F) oder aber sowohl von f(a — 0) und f(a + 0) verschieden sein (Punkt A). ¦ A: f(x) = ^-, /(l - 0) = 1, /(l + 0) = 0 (Abb.2.8). 1 + es-i ¦ B: f(x) = E(x) (Abb.2.1c) f(n - 0) = n - 1, f{n + 0) = n (n ganz). ¦ C:/(x)=^mr^>/(l-0) = l,/(l + 0) = 0,/(l) = i. 3. Hebbare Unstetigkeit Es existiert der lim f(x), d.h., es ist f(a — 0) = f(a + 0), aber die Funktion ist für x = a entweder nicht definiert oder es ist f(a) =£ lim f(x) (Punkt D in Abb.2.9).
60 2 Funktionen und ihre Darstellung Diese Unstetigkeit wird hebbar genannt, weil in dem Moment, da f(a) den Wert lim f(x) zugeordnet bekommt, die Funktion f(x) für x = a wieder stetig wird Dem Kurvenbild wird gewissermaßen ein Punkt hinzugefügt, oder der „abgesprungene" Punkt D wird wieder auf die Kurve gebracht Die verschiedenen unbestimmten Ausdrücke, die mit der Regel von l'Hospital oder mit anderen Methoden untersucht werden können und endliche Grenzwerte liefern, sind Beispiele für hebbare Unstetigkeiten. ¦ fix) = , für x = 0 ergibt sich der unbestimmte Ausdruck - , aber lim fix) = - , durch Jy ' x 0 s-o v J 2 die Festlegung f(x) = für x ^ 0 und f(x) = - für x = 0 wird f(x) stetig. 2.1.5.4 Stetigkeit und Unstetigkeitspunkte elementarer Funktionen Die elementaren Funktionen sind in ihrem Definitionsbereich stetig, Unstetigkeitsstellen gehören nicht zum Definitionsbereich Es können die folgenden allgemeinen Aussagen gemacht werden* 1. Ganzrationale Funktionen oder Polynome sind auf der gesamten Zahlengerade stetig. P(x) 2. Gebrochenrationale Funktionen ——— mit den Polynomen P(x) und Q(x) sind überall stetig, Q(x) ausgenommen die x-Werte, für die Q(x) = 0 ist. An Stellen x = a, für die Q(x) = 0 aber P(x) ^ 0 gilt, besitzt die Funktion eine Unstetigkeitsstelle mit einem Verlauf ins Unendliche, die Pol genannt wird Ist der Wert a sowohl Nullstelle des Nenners als auch des Zählers, dann gibt es nur dann einen Pol, wenn die Vielfachheit (s 1 6 3.1, S. 43) der Nullstelle des Nenners größer ist als die des Zählers. Anderenfalls ist die Unstetigkeit hebbar. 3. Irrationale Funktionen Wurzeln (mit ganzzahligen Wurzelexponenten) aus Polynomen sind für alle x-Werte, die zum Definitionsbereich gehören, stetige Funktionen. Auf dem Rande der Definitionsbereiche können sie mit einem endlichen Wert abbrechen, wenn der Radikand von positiven zu negativen Werten überwechselt Wurzeln aus gebrochenrationalen Funktionen sind für solche x-Werte unstetig, für die der Radikand eine Unstetigkeitsstelle besitzt. 4. Trigonometrische Funktionen Die Funktionen sinx und cosx sind überall stetig; tanx und sec x besitzen an den Stellen x — unendliche Sprünge; cot x und cosec x besitzen bei x = 7T.7T (n ganz) unendliche Sprünge 5. Inverse trigonometrische Funktionen Die Funktionen arctan x und arccot x sind überall stetig, aresin x und arecosx brechen an den Grenzen ihres Definitionsbereiches wegen — 1 < x < +1 ab 6. Exponentialfunktion ex oder ax mit a > 0 Sie ist überall stetig 7. Logarithmische Funktion log x mit beliebiger positiver Basis Die Funktion ist für alle positiven x-Werte stetig und bricht an der Stelle x = 0 wegen lim loga: = —oo ab. 8. Zusammengesetzte elementare Funktionen Die Stetigkeit muß für alle x-Werte der einzelnen elementaren Funktionen, die in dem zusammengesetzten Ausdruck enthalten sind, entsprechend den oben angeführten Fällen untersucht werden (s auch Mittelbare Funktionen auf S. 61) i gx-2 1 ¦ Es sind die Unstetigkeitsstellen der Funktion y = . zu ermitteln. Der Exponent x sin vi - x x-2 i besitzt an der Stelle x = 2 einen unendlichen Sprung, für x = 2 hat auch ex~2 einen unendlichen Sprung (ex~2 ) = 0, ( ex~2 ) = oo . Die Funktion y hat bei x = 2 einen endlichen Nenner Folglich gibt es für x = 2 einen unendlichen Sprung vom gleichen Typ, wie im Punkt C der Abb.2.9 Für x = 0 wird der Nenner zu null, ebenso für die x-Werte, für die sin \/\ — x zu null wird. Letztere
2.1 Funktionsbegriff 61 entsprechen den Wurzeln der Gleichung y/1 — x = nir oder x — 1 — raV, wobei n eine beliebige ganze Zahl ist Der Zähler wird für keinen dieser Werte zu null, so daß die Funktion an den Stellen x = 0, x = 1, sc = l±7r3,x= 1 ± 87T3, x = 1 ± 277T3, Unstetigkeitsstellen der gleichen Art hat wie der Punkt E in Abb.2.9 2.1.5.5 Eigenschaften stetiger Funktionen 1. Stetigkeit von Summe, Differenz, Produkt und Quotient stetiger Funktionen Sind f(x) f(x\ und g(x) auf einem Intervall [a, b] stetig, dann sind dort auch f(x) ± g(x), f(x) • g(x) und ——¦ stetige Funktionen, wobei im Falle des Quotienten noch g(x) ^ 0 vorausgesetzt werden muß. 2. Stetigkeit mittelbarer Funktionen y = f(u(x)) Wenn f(u) eine stetige Funktion bezuglich u ist und u(x) eine stetige Funktion bezüglich x und der Wertebereich von u(x) im Definitionsbereich von f(u) enthalten ist, dann ist auch die mittelbare Funktion y = f(u(x)) stetig bezüglich x, und es gilt hm f{u(x)) = / (lim u(x)\ = f(u(a)). B 31) Das bedeutet, daß jede stetige Funktion von einer stetigen Funktion einer Variablen wieder stetig ist. 3. Satz von Bolzano Wenn eine Funktion f(x) in einem abgeschlossenen Intervall [a, b] definiert und stetig ist und die Funktionswerte in den Endpunkten des Intervalls /(o) und f(b) verschiedene Vorzeichen besitzen, dann existiert mindestens ein Wert c, für den f(x) zu null wird: /(c) = 0 mit a<c<b. - B.32) Geometrisch gedeutet, schneidet die Kurve einer stetigen Funktion beim Übergang von der einen Seite der x-Achse auf die andere dabei wenigstens einmal die z-Achse. 4. Zwischenwertsatz Wenn eine Funktion f(x) in einem Intervall definiert und stetig ist und in zwei Punkten a und b dieses Intervalles, wobei a < b ist, verschiedene Werte A und B annimmt, d.h. f(a) = A, f(b) = B, A^B, B.33a) dann existiert zu jeder zwischen A und B gelegenen Zahl C wenigstens ein Punkt c zwischen a und b, für den f(c) = C {a<c<b, A<C< B oder A>C> B) B.33b) gilt Anders ausgedrückt: Die Funktion f(x) nimmt jeden Wert zwischen A und B wenigstens einmal an. 5. Existenz einer inversen Funktion Wenn eine Funktion f(x) in einem zusammenhängenden Gebiet I definiert und stetig ist und in diesem Gebiet streng monoton wächst oder fällt, dann existiert eine zu dieser Funktion stetige, ebenfalls streng monoton wachsende bzw. fallende inverse Funktion ip(x) (s. auch 2 1.3.8, S 52), die im Gebiet II für die Werte, die von der Funktion f(x) angenommen werden, definiert ist (Abb.2.10). y< 0 i ii x b) Abbildung 2.10
62 2 Funktionen und ihre Darstellung 6. Satz über die Beschränktheit einer Funktion Wenn eine Funktion f(x) in einem abgeschlossenen Intervall [a, b] definiert und stetig ist, dann ist sie in diesem Intervall auch beschränkt, d.h , es lassen sich zwei Zahlen rn und M finden, für die m < f(x) <M für a<x<b B 34) ist. 7. Satz von Weierstrass Wenn eine Funktion f(x) auf einem abgeschlossenen Intervall [a, b] definiert und stetig ist, dann besitzt f(x) dort ein absolutes Maximum M und ein absolutes Minimum m , d.h., es existiert in diesem Intervall wenigstens ein Punkt c und wenigstens ein Punkt d, so daß für alle x mit a < x < b gilt. m = f(d)<f(x)<f(c) = M. B 35) Die Differenz zwischen dem kleinsten und dem größten Wert einer stetigen Funktion wird ihre Schwankung in dem gegebenen Intervall genannt. Der Begriff der Schwankung einer Funktion kann auch auf Funktionen ausgedehnt werden, die keinen größten oder kleinsten Funktionswert besitzen (s. [22.17], Band 3). 2.2 Elementare Funktionen Elementare Funktionen sind durch Formeln definiert, die nur endlich viele Operationen mit der unabhängigen Variablen sowie mit Konstanten vorschreiben. Unter Operationen versteht man hier die vier Grundrechenarten, das Potenzieren und Radizieren, das Aufsuchen einer Exponential- oder Log- arithmusfunktion sowie das Aufsuchen trigonometrischer oder invers trigonometrischer Funktionen Man teilt die elementaren Funktionen im wesentlichen in algebraische und transzendente ein. Im Unterschied zu den elementaren können auch nichtelementare Funktionen definiert werden (s z B 8.2.5, S. 477) 2.2.1 Algebraische Funktionen Algebraische Funktionen zeichnen sich durch eine Verknüpfung des Arguments x mit der Funktion y über eine algebraische Gleichung der Form Po(x) + Pi(x)y + p2(x)y2 + . + pn(x)yn = 0 B 36) aus, wobei p0, Pi, • , Pn Polynome in x sind ¦ 3xy3 - 4xy + x's - 1 = 0 , d.h. po(x) = x3 - 1, p\{x) = —Ax , P2(x) = 0 , P3{x) = 3x Wenn es gelingt, eine algebraische Gleichung B.36) algebraisch nach y aufzulösen, dann liegt einer der folgenden Typen der einfachsten algebraischen Funktionen vor 2.2.1.1 Ganzrationale Funktionen (Polynome) Das Argument x wird nur den Operationen Addition, Subtraktion und Multiplikation unterworfen y = anxn + an-ixn~l + ... + a0 . B 37) Insbesondere bezeichnet man y — a als Konstante, y = ax + b als lineare Funktion und y = ax2 + bx + c als quadratische Funktion. 2.2.1.2 Gebrochenrationale Funktionen Die gebrochenrationale Funktion kann immer als Quotient zweier ganzrationaler Funktionen dargestellt werden anxnan-ixn-1 + + a0 fooo \ V = i ; ; r- B 38a) bmxm + bm.lxm-l+ +fco Insbesondere bezeichnet man y=a-^ B.38b) cx + d
2.2 Elementare Funktionen 63 als gebrochenlineare Funktion. 2.2.1.3 Irrationale Funktionen Außer den bei den gebrochenrationalen Funktionen genannten Operationen tritt hier das Argument x zusätzlich unter dem Wurzelzeichen auf. ¦ A: y = V2x~+3, ¦ B: y= $j(x2-l)yß. 2.2.2 Transzendente Funktionen Transzendente Funktionen können nicht durch eine algebraische Gleichung vom Typ B 36) beschrieben werden. Die einfachsten elementaren transzendenten Funktionen werden im folgenden aufgeführt. 2.2.2.1 Exponentialfunktionen Das Argument x der Exponentialfunktionen (s 2.6.1, S. 72) oder eine algebraische Funktion von x befindet sich im Exponenten ¦ A: y = ex , ¦ B: y = ax , ¦ C: y = 23x2~5x . 2.2.2.2 Logarithmische Funktionen Das Argument x der logarithmischen Funktionen (s 2.6 2, S 73) oder eine algebraische Funktion von x befindet sich unter dem Logarithmuszeichen. ¦ A: y = In x, ¦ B: y = lg x , ¦ C: y = log2Ea:2 — 3a:). 2.2.2.3 Trigonometrische Funktionen Das Argument x der trigonometrischen Funktionen (s. 2.7, S. 76) oder eine algebraische Funktion von x befinden sich hinter dem Zeichen sin, cos, tan, cot, sec, cosec. ¦ A: y = sin x , ¦ B: y — cosBx 4- 3), ¦ C: y = tan y/x Dabei ist zu beachten, daß man allgemein betrachtet unter dem Argument einer trigonometrischen Funktion nicht unmittelbar einen Winkel oder einen Kreisbogen, wie bei der geometrischen Definition, sondern eine beliebige Größe versteht Die trigonometrischen Funktionen können auch ohne Heranziehen geometrischer Vorstellungen rein analytisch definiert werden Das wird z.B bei der Darstellung dieser Funktionen mit Hilfe einer Reihenentwicklung deutlich oder bei der Lösung der Differentialglei- d xi dxj chung —— + y = 0 mit den Anfangsbedingungen y = 0 und — = 1 an der Stelle x = 0. Das Argument dxl ax der trigonometrischen Funktionen ist bei dieser Deutung zahlenmäßig gleich dem Bogen in Einheiten des Radianten. Daher kann man bei der Berechnung der trigonometrischen Funktionen vom Argument im Bogenmaß ausgehen 2.2.2.4 Inverse trigonometrische Funktionen Die Variable x oder eine algebraische Funktion von x befindet sich im Argument der inversen trigonometrischen Funktionen (s. 2.8, S. 85) aresin, arecos usw. ¦ A: y = aresinx , ¦ B: y = arecos \/l — x 2.2.2.5 Hyperbelfunktionen (s. 2.9, S. 88) 2.2.2.6 Inverse Hyperbelfunktionen (s. 2.10, S. 92) 2.2.3 Zusammengesetzte Funktionen Zusammengesetzte Funktionen entstehen durch alle möglichen Kombinationen der aufgeführten algebraischen und transzendenten Funktionen, wenn eine Funktion als Argument einer anderen dient. . . _ _ In x + \/arcsin x A:y = \nsmx, ¦ B: y = ^-^
64 2 Funktionen und ihre Darstellung Solche Kombinationen elementarer Funktionen ergeben, endlich oft angewandt, wieder elementare Funktionen 2.3 Polynome 2.3.1 Lineare Funktion Die lineare Funktion y = ax + b B.39) ergibt graphisch dargestellt eine Gerade (Abb.2.IIa). Der konstante Faktor a heißt Proportionalitäts- faktor Für a > 0 wächst die Funktion monoton an, für a < 0 nimmt sie monoton ab, für a = 0 ist sie konstant Die Achsenschnitte liegen bei A(—b/a, 0) und B@,b) (ausführlicher s 3 5 2 6,1., S 199) Mit 6 = 0 ergibt sich die direkte Proportionalität y = ax, graphisch eine Gerade durch den Koordinatenursprung (Abb.2.IIb). ? \y B 40) A~ x Abbildung 2 11 2.3.2 Quadratisches Polynom Die ganzrationale Funktion 2 Grades y - ax + bx + c B 41) liefert graphisch dargestellt als Kurve eine Parabel mit einer vertikalen Symmetrieachse bei x = —b/2a (Abb 2.12) Die Funktion nimmt für a > 0 zunächst ab, erreicht ein Minimum und nimmt dann wieder zu Für a < 0 steigt sie an, erreicht ein Maximum und fällt danach wieder ab Die Schnittpunkte Ai,A2 der x-Achse bei Extremum liegt bei C -b ± Vb2 - b 2a 2a 4ac- 4a - 4ac *) ) , 0 J , der Schnittpunkt B mit der ?/-Achse liegt bei @, c) Das (ausführlicher über die Parabel s. 3.5.2 10, S. 208) 2.3.3 Polynom 3. Grades Die ganzrationale Funktion 3 Grades y — ax +bx -f ex + ( B.42) beschreibt in der graphischen Darstellung eine kubische Parabel (Abb.2.13a,b,c). Das Verhalten der Funktion hängt von a und der Diskriminante A = 3ac — b2 ab Wenn A > 0 ist (Abb.2.13a,b), dann nimmt die Funktion für a > 0 monoton zu, für a < 0 monoton ab Die Funktion besitzt ein Maximum und ein Minimum, wenn A < 0 ist (Abb.2.13c) Für a > 0 nimmt sie von —oo bis zum Maximum zu, dann fällt sie bis zum Minimum ab, um danach bis +oo anzusteigen, für
2.3 Polynome 65 a < 0 nimmt sie von +oo bis zum Minimum ab, steigt danach bis zum Maximum an, um schließlich bis —oo abzufallen. Die Schnittpunkte mit der x-Achse lassen sich als reelle Wurzeln von B.42) für y = 0 berechnen. Es kann eine reelle Wurzel geben, zwei (dann gibt es in einem Punkt eine Berührung mit der x-Achse) oder drei- Ai,A2 und A3 . Der Schnittpunkt mit der y-Achse liegt bei B@, d), die Extre- b±y/^Ä d + 2fr3 - 9abc ± Fac - 2fr2) x/=^ ma C und D bei 3a Symmetriepunkt der Kurve ist, liegt bei E 27a2 b_ 2b3 - 9abc ~3a' Punkt den Richtungskoeffizienten tan (p - \dx)l 27a2 3a Der Wendepunkt, der zugleich + d I . Die Tangente besitzt in diesem 2.3.4 Polynom n—ten Grades Die ganzrationale Funktion n-ten Grades y = anxn + an_ixn_1 + ... + a\X + ao B.43) beschreibt eine Kurve n-ter Ordnung (s. 3.5.2.3,3.5.2.5, S 199) vom parabolischen' Typ (Abb.2.14). Fall 1: n ungerade Für an > 0 verläuft y stetig von — oo bis +oo und für an < 0 von +oo bis —oo Die x-Achse kann von der Kurve bis zu n mal geschnitten bzw. berührt werden (zur Lösung einer Gleichung n-ten Grades s. 1.6.3.1, S. 43ff. und 19.1.2, S. 914). Die Funktion B.43) besitzt entweder keine oder eine gerade Anzahl von bis zun-1 Extremwerten, wobei Minima und Maxima einander abwechseln, die Zahl der Wendepunkte ist ungerade und liegt zwischen 1 und n — 2. Asymptoten oder singulare Punkte gibt es nicht. y< 0 i B / A^Aa- y| — n ungerade •• n gerade Abbildung 2.14 Abbildung 2.15
66 2. Funktionen und ihre Darstellung Fall 2: n gerade Für an > 0 hat y einen stetigen Verlauf von +oo über ein Minimum bis +oo und für an < 0 von — oo über ein Maximum nach — oo . Die Kurve schneidet oder berührt die x-Achse entweder nicht oder 1 bis n mal; Maxima und Minima wechseln einander ab; die Anzahl der Wendepunkte ist gerade Asymptoten oder singulare Punkte existieren nicht Vor dem Zeichnen der Kurven empfiehlt es sich, zuerst Extremwerte, Wendepunkte und die Werte der ersten Ableitung in diesen Punkten zu bestimmen, dann die Kurventangenten einzuzeichnen, um schließlich alle diese Punkte stetig miteinander zu verbinden 2.3.5 Parabel n—ter Ordnung Die Funktion y = axn B.44) mit n > 0, ganzzahlig, liefert als Kurve eine Parabel n-ter Ordnung (Abb.2.15) 1. Spezialfall o = 1: Die Kurve y = xn geht durch die Punkte @,0) und A,1) und berührt oder schneidet die x -Achse im Koordinatenursprung. Für gerades n ergibt sich eine zur ?/-Achse symmetrische Kurve mit einem Minimum im Koordinatenursprung Für ungerades n ergibt sich eine zentralsymmetrische Kurve zum Koordinatenursprung, der zugleich Wendepunkt ist Asymptoten gibt es keine 2. Allgemeiner Fall a ^ 0: Man erhält die Kurve y = axn aus der zu y = xn gehörenden Kurve durch Streckung der Abszissen mit dem Faktor \a\ Für a < 0 spiegelt man y = \a\xn an der x-Achse. 2.4 Gebrochenrationale Funktionen 2.4.1 Spezielle gebrochen lineare Funktion Die Funktion B 45) auch umgekehrte Proportionalität genannt, liefert eine gleichseitige Hyperbel, deren Asymptoten die Koordinatenachsen sind (Abb.2.16) Die Unstetigkeitsstelle mit y = ±oo liegt bei x = 0 Wenn a > 0 ist, dann nimmt die Funktion von 0 bis —oo und von +oo bis 0 ab (ausgezogene Kurve im 1. und 3. Quadranten) Ist a < 0, dann wächst die Funktion von 0 bis +oo und von — oo bis 0 (gestrichelte Kurve im 2. und 4. Quadranten) Die Scheitelpunkte A und B liegen bei (y/ä, y/a) und {—y/ä, —y/a) im Falle a > 0 und bei ( — J\a\, y |a|J und ly \a\, — y |a|J im Falle a < 0 Extrema gibt es keine (ausführlicher über die Hyperbel s 3 5.2 9, S 206) A'/ • *B' y< ^s i o k c ^— i X Abbildung 2.16 Abbildung 2.17 2.4.2 Gebrochenlineare Funktion a\x + b\ Die Funktion y = r" a2x + o2 beschreibt eine gleichseitige Hyperbel, deren Asymptoten parallel zu den Koordinatenachsen verlaufen B 46)
2 4 Gebrochenrationale Funktionen 67 (Abb. 2.17) Der Mittelpunkt liegt bei C [ —- — I Dem Parameter a in Gleichung B 45) entspricht Ö2 ' «2 / A . A -mitA ¦¦ a22 «2^2 . b2±J\K\ ax + J\K\\ Die Scheitelpunkte A und B der Hyperbel liegen bei ' a2 a2 / b2±J\Ä\ ai-J\K\\ und , , wobei für A < 0 gleiche Vorzeichen genommen werden, für A > 0 \ a2 a2 ) verschiedene Die Unstetigkeitsstelle liegt bei x = . Die Funktion nimmt für A < 0 von — bis — oo a2 a2 und von +oo bis — ab Für A > 0 wächst die Funktion von — bis +oo und von — oo bis — . Extrema a2 a2 a2 gibt es keine 2.4.3 Kurve 3. Ordnung, Typ I b c ( ax2 + bx + c\ /7 . n , nS /rt ,„, Die Funktion y = a+- + — = - F^0, c ^ 0) B 47) X X1 \ X1 j (Abb.2.18) beschreibt eine Kurve 3 Ordnung (Typ I) Sie hat die beiden Asymptoten x = 0 und y = a und besteht aus zwei Asten, von denen der eine einer monotonen Änderung von y zwischen a und +oo bzw —oo entspricht, während der andere drei charakteristische Punkte durchläuft: einen Schnittpunkt / c \ ( 2c b2\ mit der Asymptote bei A f — - , a ), ein Extremum bei B I — — , a — — I und einen Wendepunkt bei / 3C 2b2 \ C — — , a — —— Für die Lage dieser Aste gibt es vier Fälle die von den Vorzeichen von b und c V b 9c I (—b± \/b2 — Aac ö '^ ihre Anzahl kann zwei, eins (Berührung) oder null betragen, je nachdem, ob für b2 — Aac > 0 , = 0 oder < 0 gilt Q Die Funktion B 47) geht für b = 0 in die Funktion y = a-\—- (s (Abb.2.21) der reziproken Potenz) x2 und für c = 0 in die gebrochenlineare Funktion y = , einen Spezialfall von B.46), über x 2.4.4 Kurve 3. Ordnung, Typ II Die Funktion y = —0—: B 48) ax2 + bx + c boschreibt eine Kurve 3 Ordnung (Typ II), die symmetrisch zu der vertikalen Geraden x = — — verläuft und die die x-Achse zur Asymptote hat (Abb.2.19). Ihr Verhalten hängt von den Vorzeichen von a und A = Aac — b2 ab Von den zwei Fällen a > 0 und o < 0 wird hier nur der erste betrachtet, da der zweite durch Spiegelung von y = —— an der x-Achse erhalten werden kann. (—a)xz — bx — c Fall a) A > 0: Die Funktion ist für beliebiges x positiv und stetig und wächst von 0 bis zürn Maximum, um dann wieder gegen 0 zu fallen Das Maximum A liegt bei I ——,— ), die Wendepunkte B
68 2 Funktionen und ihre Darstellung yf \ X . AL ^ft c>0,b<0 yt c>0,b>0 b) ^v c<0,b>0 A D k V~~'. h x c<0,b<0 c) d) Abbildung 2.18 V 2a ± -—7= , — I ; die zugehörigen Tangentensteigungen {Richtungskoeffizienten) und C liegen bei ¦ — — _i_ ^ , — 6 l °~ 2av/3 A /3\3/2 berechnen sich zu tan (p = =fa2 f — J (Abb.2.19a). Fall b) A = 0: Die Funktion ist für beliebiges x positiv, wächst von 0 bis +oo, besitzt bei x = — — eine Unstetigkeitsstelle mit y = +oo und nimmt von hier wieder auf 0 ab (Abb.2.19b). Fall c) A < 0- Die Funktion wächst von 0 bis +oo , springt an der Unstetigkeitsstelle auf -oo , um von hier über ein Maximum wieder nach —oo zu verlaufen, von wo es einen zweiten Sprung nach +oo gibt, auf den schließlich ein Abfall gegen 0 folgt. Das Maximum A liegt bei I ——, — ), die Unstetig- 2a' A keitsstellen liegen bei x = (Abb.2.19c). A=0 b) yf pj A<0 c) Abbildung 2.19
2.4 Gebrochenrationale Funktionen 69 2.4.5 Kurve 3. Ordnung, Typ III Die Funktion y- ax2 + bx + c B 49) beschreibt eine Kurve 3 Ordnung (Typ III) durch den Koordinatenursprung mit der x-Achse als Asymptote (Abb.2.20) Der Verlauf der Funktion hängt von den Vorzeichen von a und von A = Aac — b2 sowie von den Vorzeichen der Wurzeln a und ß der Gleichung ax2 + bx 4- c = 0 ab, wenn A < 0 ist, vom Vorzeichen von b. wenn A = 0 ist. Von den zwei Fällen a > 0 und a < 0 wird hier nur der erste betrachtet, da sich der zweite durch Spiegelung der Kurve für y = ^—^—; an der x-Achse ergibt (—a)x2 — bx — c A>0 a) ty A=0,b>0 bi) A<0,aund ß negativ c2) Abbildung 2.20 A <0, a und ß positiv C3) Fall a) A > 0 Die Funktion verläuft stetig, nimmt von 0 bis zum Minimum ab, steigt dann bis zum Maximum an, um danach wieder auf 0 abzufallen -b±2yfäc\ Die Extremwerte A und B liegen bei ( ± -s ; es gibt drei Wendepunkte (Abb.2.20a) Fall b) A = 0: Der Verlauf hängt vom Vorzeichen von b ab- • b > 0. Die Funktion nimmt von 0 bis —oo ab, hat eine Unstetigkeitsstelle, nach der sie von —oo bis zum Maximum anwächst, um danach gegen 0 zu streben (Abb.2.20bi) Das Maximum A liegt bei +A; 1 a ' 2y/äc + b) • b < 0 Die Funktion fällt von 0 bis zum Minimum ab, durchläuft danach den Koordinatenursprung, steigt dann von 0 bis +oo, hat eine Unstetigkeitsstelle und fällt dann wieder von +oo auf 0 ab (Abb.
70 2. Funktionen und ihre Darstellung 2.20b2). Das Minimum A liegt bei A (-/!• 2y/äc-b Die Unstetigkeitsstellen liegen in beiden Fällen bei x = — — ; beide Kurven besitzen je einen Wendepunkt Fall c) A < 0- Die Funktion besitzt zwei Unstetigkeitsstellen und zwar bei x = a und x = ß, ihr Verlauf hängt von den Vorzeichen von a und ß ab. • Die Vorzeichen von a und ß sind verschieden: Die Funktion nimmt von 0 bis —oo ab, springt auf +oo, nimmt wieder von +oo bis — oo ab, wobei sie durch den Koordinatenursprung verläuft, erfährt einen zweiten Sprung nach +oo , von wo sie gegen 0 abfällt (Abb.2.20ci) Extremwerte treten nicht auf • Die Vorzeichen von a und ß sind beide negativ: Die Funktion nimmt von 0 bis —oo ab, springt auf +oo , läuft von hier über ein Minimum wieder bis auf +oo , springt abermals auf — oo , steigt dann bis zum Maximum an, um danach asymptotisch gegen 0 abzufallen (Abb.2.20c2) Die Extremwerte A und B werden nach den gleichen Formeln wie im Fall a) berechnet. • Die Vorzeichen von a und ß sind beide positiv: Die Funktion nimmt von 0 bis zum Minimum ab, wächst dann auf +oo an, springt auf —oo, durchläuft ein Maximum, um wieder -oo zu erreichen, springt auf +oo und verläuft von hier gegen 0 (Abb.2.20c3). Die Extremwerte A und B werden mit den gleichen Formeln wie im Fall a) berechnet. In allen drei Fällen besitzt die Kurve einen Wendepunkt y=l/ax+b ' y=--Vax+b' Abbildung 2 21 2.4.6 Reziproke Potenz Abbildung 2.22 Die Funktion y = - (n > 0, ganzzahlig) B.50) beschreibt eine Kurve vom hyperbolischen Typ mit den Koordinatenachsen als Asymptoten Die Un- stetigkeitsstelle liegt bei x = 0 (Abb.2.21) Fall a) Für a > 0 wächst die Funktion bei geradem n von 0 bis +oo, um dann auf 0 abzufallen, wobei sie stets positiv bleibt. Bei ungeradem n fällt sie von 0 auf — oo ab, springt auf -t-oo , um dann wieder gegen 0 hin abzunehmen. Fall b) Für a < 0 fällt die Funktion bei geradem n von 0 auf -oo ab, um von hier gegen 0 zu streben, wobei sie stets negativ bleibt. Bei ungeradem n wächst sie von 0 bis +oo , springt auf — oo , um danach bis 0 anzusteigen. Extrema hat die Funktion keine. Die Kurve nähert sich um so schneller asymptotisch der x-Achse und um so langsamer der y-Achse, je größer n ist. Für gerades n ist sie symmetrisch zur y-Achse, für ungerades n zentralsymmetrisch zum Koordinatenursprung. Abb.2.21 zeigt die Fälle a=l,n = 2,n = 3.
2 5 Irrationale Funktionen 71 2.5 Irrationale Funktionen 2.5.1 Quadratwurzel aus einem linearen Binom Die zwei Funktionen y = ±Vax + b B.51) ,0j ,der . Definitionsbereich und Verlauf der Kurve hängen vom beschreiben eine Parabel mit der x- Achse als Symmetrieachse Der Scheitel A liegt bei a 2 Halbparameter (s 3 5 2.10, S. 208) ist p Vorzeichen von a ab (Abb.2.22) (ausführlicher über die Parabel s 3 5 2 10, S 208) 2.5.2 Quadratwurzel aus einem quadratischen Polynom Die zwei Funktionen y = ±Vax2 + bx + c B 52) beschreiben für a < 0 eine Ellipse, für a > 0 eine Hyperbel (Abb.2.23). Von den zwei Achsen stimmt eine mit der x -Achse überein, die andere ist die Gerade x = 2a Die Scheitel A, C und B, D liegen bei fy b 0 und 2a ,±i , wobei A = 4ac — b2 . a>0,A<0 b) Abbildung 2.23 c) Definitionsbereich und Verlauf der Funktionen hängen von den Vorzeichen von a und A ab (Abb.2.23) Für a < 0 und A > 0 besitzen die Funktionen nur imaginäre Werte, so daß hier keine Kurven existieren (ausführlich über Ellipse und Hyperbel s. 3.5.2 8, S 204 und 3.5 2 9, 206) 2.5.3 Potenzfunktion Die Potenzfunktion y = axk = ax±m^n m , n ganzzahlig, positiv, teilerfremd , B 53) ist für k > 0 und k < 0 getrennt zu betrachten (Abb.2.24). Dabei reicht eine Beschränkung auf den Fall a = 1 aus, weil die Kurven für a ^ 1 gegenüber den von y = xk in Richtung der y-Achse mit dem Faktor a gestreckt und bei negativem a an der x-Achse zu spiegeln sind. Fall a) k > 0 , y = xm/n- Der Kurvenverlauf ist für vier charakteristische Fälle der Größen m und n in Abb.2.24 dargestellt Die Kurve verläuft durch die Punkte @,0) und A,1) Für k > 1 berührt sie die x-Achse im Koordinatenursprung (Abb.2.24d), für k < 1 ebenfalls im Koordinatenursprung die y- Achse (Abb.2.24a,b,c). Für n gerade gibt es zwei zitEÄ-Achse symmetrische Zweige (Abb.2.24a,d),
72 2. Funktionen und ihre Darstellung y> i 0 t kA 1/2 y=x^ X a) y=-x yj i -N? i \ -1/3 Vy=x ^ 1 X yt i y=x Na 0 1 X c) Abbildung 2.24 y< i 0 k , -3/2 V, \f~ x 1 -3/2 ly=-x b) Abbildung 2.25 «0 yt S\ 0 \ -2/3 W=x i x für m gerade zwei zur y-Achse symmetrische Zweige (Abb.2.24c). Für m und n ungerade ist die Kurve zentralsymmetrisch zum Koordinatenursprung (Abb.2.24b). Die Kurve kann somit im Koordinatenursprung einen Scheitel, einen Wendepunkt oder einen Rückkehrpunkt besitzen (Abb.2.24). Asymptoten hat sie keine Fall b) k < 0, y = sc-m/n: Der Kurvenverlauf ist für drei charakteristische Fälle der Größen m und n Abb.2.25 dargestellt Die Kurve ist vom hyperbolischen Typ, wobei die Asymptoten mit den Koordinatenachsen zusammenfallen (Abb.2.25). Die Unstetigkeitsstelle befindet sich bei x = 0. Die Kurve nähert sich der x-Achse asymptotisch um so schneller und der y-Achse um so langsamer, je größer \k\ ist Der Kurvenverlauf und die Symmetrie hinsichtlich der Koordinatenachsen bzw. des Koordinatenursprungs hängen wie im Falle k > 0 davon ab, ob m und n gerade oder ungerade sind Extrema gibt es keine. . 2.6 Exponentialfunktionen und logarithmische Funktionen 2.6.1 Exponentialfunktion Die Funktion y = ax = ebx (a > 0 , b = In a) B 54) liefert das graphische Bild der Exponentialkurve (Abb.2.26) Für a = e ergibt sich die natürliche Exponentialkurve y = ex. B.55) Die Funktion besitzt nur positive Werte. Für a > 1, d.h. für b > 0 , steigt sie monoton von 0 bis oo an Für a < 1, d.h. für b < 0, nimmt sie um so schneller monoton von oo bis 0 ab, je größer |6| ist Die Kurve verläuft durch den Punkt @,1) und nähert sich asymptotisch der x-Achse für b > 0 nach rechts und für b < 0 nach links, und zwar um so schneller, je größer \b\ ist. Die Funktion y = a~x = f - ] wächst für a < 1 und fällt für a > 1.
2 6 Exponentialfunktionen und logarithmische Funktionen 73 Abbildung 2 26 2.6.2 Logarithmische Funktionen y=log2x=lb x y=logex=ln x y=l°g10x=lgx x - y=iogjx i 10 - y=lo^x y=lo^x Abbildung 2 27 Die Funktion ' = logax (a > 0, a^l) B.56) beschreibt die logarithmische Kurve (Abb.2.27); sie stellt die an der Geraden y = x gespiegelte Exponentialkurve dar. Für a = e ergibt sich das Kurvenbild des natürlichen Logarithmus y = In x B 57) Die logarithmische Funktion ist im Reellen nur für x > 0 definiert Für a > 1 wächst sie von — oo bis +co monoton an, für a < 1 fällt sie von +oo auf — oo monoton ab, und zwar beide Male um so schneller, je kleiner | lna| ist Die Kurve geht durch den Punkt A,0) und nähert sich asymptotisch der ?/-Achse für a > 1 unten, für a < 1 oben, und das wieder um so schneller, je größer | In a\ ist 2.6.3 Gaußsche Glockenkurve Die Funktion -{axf B.58) beschreibt die GAUSSsche Glockenkurve (Abb.2.28). Sie hat die t/-Achse zur Symmetrieachse und nähert sich der x-Achse asymptotisch um so schneller, je größer \a\ ist Das Maximum A liegt bei @,1), die Wendepunkte B, C liegen bei I ±—y= , —p ) . Die zugehörigen Tangentensteigungen ergeben sich zu tany? = =pay 2/e . Eine wichtige Anwendung der GAUSS sehen Glockenkurve B 58) ist die Beschreibung des Normalverteilungsgesetzes der Beobachtungsfehler (s Graphische Darstellung und Anwendungen in der Wahrscheinlichkeitsrechnung 16, S 768ff und bei den Wavelets 15 5, S 763ff ) 1 _^_ y = y(x) = ——e 2*2 B 59) c/ ^™ 3M /k 0 i \B (P*^ X ay/27r Abbildung 2.28 2.6.4 Exponentialsumme Die Funktion ist in (Abb.2.29) für charakteristische Vorzeichenrelationen dargestellt. Die Konstruktion erfolgt über die Addition der Ordinaten der Kurven der Summanden y\ — aebi B.60) und Die Funktion ist stetig Wenn keine der Zahlen a,b,c,d gleich 0 ist, besitzt die Kurve eine der
74 2. Funktionen und ihre Darstellung ' y1 \ \ ,d<& V. 0 ,b,d>0 1 \ J! /j/yi X sign a=sign c sign b=sign d . o| .—x sign a = sign c sien b =1= sien d Signa sign b =1= sign d sign b = sign d a) b) sign a* sign c sign b=}= sign d c) Abbildung 2 29 d) vier in Abb.2.29 dargestellten Formen. Die Kurvenbilder können in Abhängigkeit von den Vorzeichen der Parameter an den Koordinatenachsen gespiegelt sein. Die Schnittpunkte A und B der y-Achse bzw x-Achse liegen bei @, a + c) bzw. x = -—- In (— ) , d — b \ cJ - In [ ; 1 und der Wendepunkt D bei x = -—T In das Extremum C bei x = (- a62\ ^ ,sowe,t -b \ cd) *"~ " d — b~ diese Punkte vorhanden sind Fall a) Die Parameter a und c bzw b und d besitzen gleiches Vorzeichen Die Funktion erfährt keinen Vorzeichenwechsel, sie ändert sich von 0 bis +00 bzw. —00 oder von +00 bzw. —00 bis 0 . Wendepunkte gibt es keine; Asymptote ist die rr-Achse (Abb.2.29a). Fall b) Die Parameter a und c haben gleiche, b und d verschiedene Vorzeichen Die Funktion ändert sich ohne Vorzeichenwechsel von +00 bis +00, wobei sie ein Minimum durchläuft, bzw. von —00 bis -00 , dabei ein Maximum durchlaufend. Wendepunkte gibt es keine (Abb.2.29b). Fall c) Die Parameter a und c haben verschiedene, b und d gleiche Vorzeichen: Die Funktion ändert sich von 0 bis +00 bzw. —00 oder von +00 bzw —00 bis 0, wobei sie einmal ihr Vorzeichen wechselt und ein Extremum C und einen Wendepunkt D durchläuft. Die x-Achse ist Asymptote (Abb.2.29c) Fall d) Die Parameter o und c und auch b und d besitzen unterschiedliche Vorzeichen: Die Funktion ändert sich monoton zwischen —00 und +00 bzw. zwischen +00 und —00. Sie besitzt keine Extrema, aber einen Wendepunkt D (Abb.2.29d). 2.6.5 Verallgemeinerte Gaußsche Glockenkurve Die Kurve der Funktion y = ae ,bx + ex2 :ae-(£)V(*+£J B.61) kann als Verallgemeinerung der GAUSSsc/ien Glockenkurve B.58) aufgefaßt werden; sie stellt eine symmetrische Kurve zur vertikalen Geraden x = — — dar, wobei die x-Achse nicht geschnitten wird und der Schnittpunkt D mit der y-Achse bei @, a) liegt (Abb.2.30a,b) Der Verlauf der Funktion hängt von den Vorzeichen von a und c ab. Hier wird nur der Fall a > 0 betrachtet, da die Kurve zu a < 0 durch Spiegelung an der x-Achse erhalten werden kann. Fall a) c > 0: Die Funktion nimmt von +00 bis zum Minimum ab, um dann wieder bis +00 anzu- / b -(M2 wachsen. Dabei bleibt sie stets positiv Das Minimum A liegt bei I — —, ae ^2«^ 2c ; Wendepunkte und Asymptoten gibt es nicht (Abb.2.30a).
2.6 Exponentialfunktionen und logarithmische Funktionen 75 c<0 b) Abbildung 2.30 ( b -£\ Fall b) c < 0: Die x-Achse ist Asymptote. Das Maximum A liegt bei I — — ,ae 4c j , die Wendepunkte B und C liegen bei c>0, b>l D/A\C 0 c<0,b>l x 2c -(b2+2c)\ ,ae 4c (Abb 2.30b). yf c>0, b<0 d) yt c<0,b=l °c<0,0<b<lx g) Abbildung 2.31 0 c<0,b<0 X h) B 62) 2.6.6 Produkt aus Potenz- und Exponentialfunktion Die Funktion y = ax ecx wird hier nur für den Fall a > 0 betrachtet, da sich ihre Kurve zu a < 0 durch Spiegelung an der x- Achse ergibt, und nur für den Fall positiver x-Werte, so daß sie stets positiv bleibt (Abb.2.31). Die (Abb.2.31) zeigt, daß durch geeignete Kombination der Parameter die unterschiedlichsten Kurvenverläufe erzeugt werden können. Für b > 0 verläuft die Kurve durch den Koordinatenursprung. Tangente ist in diesem Punkt für b > 1 die x-Achse, für b = 1 die Winkelhalbierende y = x des ersten Quadranten und für 0 < b < 1 die y-Achse Für b < 0 ist die y-Achse Asymptote. Für c > 0 steigt die Funktion mit x über alle Grenzen, für c < 0 geht sie asymptotisch gegen 0. Für verschiedene Vorzeichen von b und c besitzt die Funktion
76 2 Funktionen und ihre Darstellung ein Extremum A bei I x — — ] . Die Kurve besitzt entweder keinen, einen oder zwei Wendepunkte C b±Vb\ und D bei \x = — (Abb.2.31c,e,f,g). 2.7 Trigonometrische Funktionen (Winkelfunktionen) 2.7.1 Grundlagen 2.7.1.1 Definition und Darstellung 1. Definition Die trigonometrischen Funktionen (äqivivalente Bezeichnungen sind Winkelfunktion und goniometri- sche Funktion) werden über geometrische Betrachtungen hergeleitet Daher wird ihre Definition sowie die Angabe des Arguments im Grad- oder Bogenmaß auf 3.1.1 5, S. 133 besprochen 2. Sinus Die gewöhnliche Sinusfunktion y = sinx B.63) ist in Abb.2.32a dargestellt Es ist eine stetige Kurve mit der Periode T = 2tt. Abbildung 2 32 Die Schnittpunkte B0, Bi, B-U B2i B_2, mit Bk = (kir, 0) (k = 0, ±1, ±2, ) der gewöhnlichen Sinuskurve mit der x-Achse sind zugleich die Wendepunkte der Kurve Der Neigungswinkel der Kur- TT ventangenten gegenüber der x-Achse beträgt hier ±— TT TT Die Maxima liegerf bei xmax^ = r- + 2kn (k = 0,±1,±2, .), die Minima bei xmm^ = —— + 2/c7r (k = 0, ±1, ±2, ) Für jeden Funktionswert y gilt -1 < y < 1. Die allgemeine Sinusfunktion y = Asm(üüx + </?o) B 64) mit der Amplitude \A\, der Frequenz u und der Anfangsphase ip0 ist in Abb.2.32b dargestellt Gegenüber der gewöhnlichen ist die allgemeine Sinuskurve (Abb.2.32b) in y-Richtung um den Faktor \A\ gedehnt, in ^-Richtung um den Faktor — zusammengedrückt und um die Strecke — nach links ver- schoben. Die Periode ist T - 2tt Die Schnittpunkte mit der rc-Achse liegen bei B^ kn — <po ,0 die Maxima bei xmax,k tt/2 - ifQ 4- 2kTT und die Minima bei xm\n<k -tt/2 - ip0 + 2kn (k = 0, ±1,±2,...). Für jeden Funktionswert y gilt- -|i4| < y < \A\ 3. Kosinus Die Kurve der gewöhnlichen Kosinusfunktion y = cos x = sin ( x + B.65)
2 7 Trigonometrische Funktionen (Winkelfunktionen) 77 hat ihre Schnittpunkte mit der x-Achse bei So, Bu £_!, B2, ...,Bk= [(* + ^)*.o] (k = 0,±1,±2,. .), sie sind zugleich die Wendepunkte mit dem Tangentenneigungswinkel ±j (Abb.2.33). Die Extrema liegen bei Co, Ci, C_i, C2,... mit Cjb = [Ajtt, (-l)fc] für jfc = 0, ±1, ±2, Abbildung 2 33 Die allgemeine Kosinusfunktion y = Acos(ux + (p0) läßt sich auch in der Form y = A sin ( lux + cp0 + - J , d h. als allgemeine Sinusfunktion mit der Phasenverschiebung <p = 90° schreiben . 4. Tangens Die Tangensfunktion y = tan x B.66) B.67) B.68) hat die Periode T = n und die Asymptoten x = f fc + - J tt (fc = 0, ±1, ±2,.. ) (Abb.2.34). Die Verlauf (fc7T,0) 7T 7T Funktion wächst für x im Intervall von —— bis +— monoton zwischen —oo"bis +00; dieser Verlauf wiederholt sich periodisch Die Schnittpunkte mit der x-Achse bei 0, Au j4_i, A2, A_2, • • • , Ak 7T sind zugleich Wendepunkte mit dem Tangentenneigungswinkel Abbildung 2.34 Abbildung 2 35 5. Kotangens Die Kotangensfunktion y = cot x = — tan f x + — ) B.69) ergibt eine an der x-Achse gespiegelte und um die Strecke — nach links verschobene Tangenskurve (Abb.2.35). Die Asymptoten liegen bei x = kir (k = 0, ±1, ±2,...). Wenn x von 0 bis 7r läuft, fällt y monoton von +00 bis —00; dieser Verlauf wiederholt sich periodisch Die Schnittpunkte mit der x-Achse bei Ai, A_u A2, A_2,. . mit Ak Tangentenneigungswinkel — — [(*+*H sind zugleich Wendepunkte mit dem
78 2 Funktionen und ihre Darstellung 6. Sekans Die Sekansfunktion hat die Periode T = 1 cosx 27r, die Asymptoten sind x — ( k + - ) 7r, stets gilt |2/| > 1 Die Maxima liegen bei A\, A2,. [Bk + lOr, -1], die Minima bei #i, B2,... mit Bk (Abb.2.36) ,y Abbildung 2 36 7. Kosekans Die Kosekansfunktion y = cosec x ¦ Abbildung 2.37 90 180 270 360 Abbildung 2 38 sinx TT B 71) stellt graphisch eine um die Strecke x — — nach rechts verschobene Sekanskurve dar Die Asymptoten sind x = kn. Die Maxima liegen bei A\, A2,. . mit Ak 4/c + l 4/c + 3 7T, — 1 I und die Minima bei B\, B' . mit Bf, 7T,+1 (Abb.2.37) Hinweis: Trigonometrische Funktionen mit komplexen Argumenten z sind in 14 5 2, S 721 dargestellt 2.7.1.2 Wertebereiche und Funktionsverlaufe 1. Winkelbereich 0 < x < 360° Die sechs trigonometrischen Funktionen sind in Abb.2.38 in allen vier Quadranten für einen vollen Winkelbereich von 0° bis 360° bzw einen vollen Bogenbereich von 0 bis 2n gemeinsam dargestellt In Tabelle 2.1 ist ein Überblick über die Definitions- und Wertebereiche der Funktionen gegeben. Das Funktionsvorzeichen, das vom Quadranten abhängt, in dem das Funktionsargument liegt, kann aus Tabelle 2.2 entnommen werden Tabelle 2 1 Definitions- und Wertebereich der trigonometrischen Funktionen Definitionsbereich —00 < x < 00 < Wertebereich — 1 < sinx < 1 — 1 < cosx < 1 Definitionsbereich x* {2k+ 1I X 7^ klT (ifc = 0,±l,±2, ) Wertebereich —00 < tanx < 00 —00 < cot x < 00
2 7 Trigonometrische Funktionen (Winkelfunktionen) 79 Tabelle 2.2 Vorzeichen der trigonometrischen Funktionen Quadrant I II III IV Größe des Winkels von 0°bis 90° von 90° bis 180° von 180° bis 270° von 270° bis 360° sin 1 1 + + cos + 11 + tan + 1 + 1 cot + 1 + 1 sec + 11 + CSC + + 1 1 2. Funktionswerte für ausgewählte Winkelargumente Tabelle 2.3 Werte der trigonometrischen Funktionen für 0°, 30°, 45°, 60° und 90° Winkel 0° 30° 45° 60° 90° Bogen 0 1 1 r i i sin 0 1 2 y/2 2 2 1 cos 1 2 2 1 2 0 tan 0 3 1 Vs ±co cot +oo y/S 1 3 0 sec 1 2^3 3 V2 2 ±oo CSC +00 2 V2 2^3 3 1 3. Beliebige Winkel Da die trigonometrischen Punktionen periodisch sind (Periode 2tt bzw. 7r), kann die Ermittlung der Punktionswerte für beliebige Argumente x nach den folgenden Regeln vereinfacht werden. Argument x > 360° bzw. x > 180°: Wenn der Winkel größer als 360° (bzw größer als 180°) ist, dann werden die Werte der trigonometrischen Punktionen auf Funktionswerte für Winkel a mit 0 < a < 360° (bzw < 180°) nach folgenden Regeln zurückgeführt (n ganzzahlig): sinC60° n + a) = sin a, B.72) tanA80° • n + a) = tana, B.74) cosC60° • n + a) = cos a, B 73) cotA80° • n + a) = cot et. B.75) Argument x < 0: Wenn das Argument negativ ist (x = —a), dann werden die Funktionen mit den folgenden Formeln auf Funktionen mit positivem Argument zurückgeführt: sin(—a) = — sina, B.76) cos(—a) = cosa, B 77) tan(-a) = - tan a , B.78) cot(-a) = - cot a . B 79) Tabelle 2.4 Reduktionsformeln oder Quadrantenrelationen der trigonometrischen Funktionen Funktion sinx cosx tanz cotx x = 90° ± a + cosa + sina + cota + tana x = 180° ± öl + sina — cosa itana icota x = 270° ± a — cosa ±sina + cota + tana x = 360° — a — sina + cosa — tana — cota
80 2 Funktionen und ihre Darstellung Argument x mit 90° < x < 360°: Wenn 90° < x < 360° ist, dann werden die Funktionen mit Hilfe der Reduktionsformeln in Tabelle 2.4 auf Funktionen eines spitzen Winkels a zurückgeführt Man nennt die Beziehungen zwischen Funktionswerten von Winkeln, die sich um 90°, 180° oder 270° unterscheiden bzw. zu 90°, 180° oder 270° ergänzen, Quadrantenrelahonen Aus der 1 und 2. Spalte von Tabelle 2.4 ergeben sich die Formeln der Komplementsätze, aus der 1 und 3. die Formeln der Supplementsätze Dai = 90° — a der Komplementwinkel (s. 3.1.1.3, S. 132) oder das Komplement von a ist, nennt man Beziehungen der Art cos a = sin x = sin(90° — a), B 80a) sin a = cos x = cos(90° — a) B 80b) Komplementsätze Die Beziehungen zwischen den trigonometrischen Funktionen für Supplementwinkel (s 3 1 1 3, S 132) der Art sina = sinx = sinA80° — a), B 81a) -cosa = cosx = cos( 180° - a) B 81b) werden wegen a + x = 180° Supplementsätze genannt Argument x mit 0° < x < 90°: Wenn ein spitzer Winkel @° < x < 90°) vorliegt, dann wurden die Funktionswerte früher Tabellen entnommen, heute werden sie vom Rechner abgefragt ¦ sin(-1000°) - -sin 1000° = - sinC60° • 2 + 280°) = - sin 280° = + cos 10° - +0,9848 4. Winkel im Bogenmaß Funktionswerte im Bogenmaß, d h. in der Einheit Radiant, können mit Hilfe von C 2) umgerechnet werden (s 3.1.1.5, S. 133) 2.7.2 Wichtige Formeln für trigonometrische Funktionen 2.7.2.1 Beziehungen zwischen den trigonometrischen Funktionen sin2 a + cos2 a = 1, sec2 öl — tan2 a = 1, cosec2 a — cot2 a = 1, sina = tan a, cosa B.82) B 83) B.84) B.88) sina • coseca = 1, cosa seca = 1, tan a • cot a = 1, cosa = cot a sina B 85) B 86) B 87) B 89) Weitere Formeln sind der Ubersichlichkeit wegen in Tabelle 2.5 zusammengefaßt In ihnen ist voi dem Wurzelzeichen ein positives oder negatives Vorzeichen zu setzen, je nachdem, in welchem Quadranten sich der Winkel befindet 2.7.2.2 Trigonometrische Funktionen der Summe und der Differenz zweier Winkel (Additionstheoreme) sin(a±ß) = sin a cos ß±cos a sin ß, B.90) cos(a±ß) = cosa cos /3=Fsina sin ß, B 91) , _.. tana±tan/3 /rt nn. , , ^N cotacot/?=fl . _, tan(a±0) = - ^, B.92) cot a ± ß) = „ , , 2 93 v ' l=Ftanatan/T y ' v ; cot/?±cota v ' sin(a + ß + 7) = sin a cos ß cos 7 + cos a sin ß cos 7 + cos a cos ß sin 7 — sin a sin ß sin 7, B 94) cos(a + ß + 7) = cos a cos ß cos 7 — sin a sin ß cos 7 — sin a cos /? sin 7 — cos a sin /? sin 7 B 95)
2.7 Trigonometrische Funktionen (Winkelfunktionen) 81 Tabelle 2.5 Beziehungen zwischen den trigonometrischen Funktionen gleichen Arguments im Intervall 0 < a < 7r/2 a sina cosa tana cota sina - Vi — sin2 a sina Vi — sin2 a Vi — sin2 a sina cosa Vi — cos2 a Vi — cos2 a cosa cosa Vi — cos2 a tana tana Vi + tan2 a 1 Vi + tan2 a 1 tana cota 1 Vi + cot2 a cota %/l 4- cot2 a 1 cota 2.7.2.3 Trigonometrische Funktionen für Winkelvielfache B.96) B.97) sin 2a = 2 sin a cos a, sin 3a = 3 sin a — 4 sin3 a, sin 4ä = 8 cos3 a sin a — 4 cos a sin a , B.100) 2 tana cos 2a = cos2 a — sin2 a, B.98) B.99) tan 2a = tan 3a = tan 4a = 1 — tan2 a' 3 tan a — tan3 a l-3tan2a ' 4 tan a — 4 tan3 a 1—6 tan2 a + tan4 a, B.102) B.103) B.104) cos 3a = 4 cos3 a — 3 cos a, cos4a = 8cos4a - 8cos2a 4- 1, B 101) cot2a= T "~x, B.105) cot3a = — ^-^^ ^ p l0^ cot 4a cot2 a — 1 2 cot a cot3 a — 3 cot a 3cot2a-l ' cot4 a — 6 cot2 a + 1 4 cot3 a — 4 cot a . B.107) Für große Werte von n ermittelt man sin na und cos na vorteilhafterweise mit der Formel von M Ol VRE. Unter Benutzung der Binomialkoeffizienten ( ) (s. 1.1.6.4, S. 12) ergibt sich: ¦ (cos a + i sin a)n = Y[ ) i cos na + i sin na n-1 /n\ n-7 ¦ 1 • cos a-\-\n cos a sin a — II cos a sin a -G cosn 3 a sin3 a + ( I cosn 4 a sin4 a + B.108) woraus folgt cos na = cosn a - n , cosn 2 a sin2 a 4- I , I cosn 4 a sin4 a 2/ \4/ cosn 6 a sin6 a + ..., sin na = n cos" x a sin a - I I cos a sin a + I 1 cos" u a sin" a — . B.109) B.110)
82 2 Funktionen und ihre Darstellung 2.7'.2.4 Trigonometrische Funktionen des halben Winkels In den folgenden Formeln (Halbwinkelsätze), ist vor dem Wurzelzeichen ein positives oder negatives Vorzeichen zu setzen, je nachdem, in welchem Quadranten sich der Winkel befindet sin| = ji(l-cosa), B 111) cos | = Al + cos«), B.112) a /1 — cos a 1 — cos a sin a , tan- = W- = : = , 2 113 2 V 1 4- cos öl sin a 1 + cos a a /1 + cos a 1 + cos a sin a , cot - = x = : = . B 114 2 V 1 ~ cos a sin a 1 — cos a 2.7.2.5 Summen und Differenzen zweier trigonometrischer Funktionen • r> ^ • ct + ß ot — ß ,_ --_v . . ~ _ oi + ß a — ß . . sin a + sin p = 2 sin—-—cos—-—,B.115) sina - sin/3 = 2 cos—-—sin—-—, B 116) cosQ+cosß = 2cos—-—cos—-—,B.117) cosa — cos/3 = — 2sin—-—sin—-—, B 118) tana± tan/3-—^ ^, 2 119 cota ± cot/3 = ±-^—r^f, 2 120 cos Ol cos ß sin a sm p tana + cot/3=COs((WiJ, B 121) cota - tan/3 = C°s(a + ^ B 122) cos Ol sm ß sin a cos ß 2.7.2.6 Produkte trigonometrischer Funktionen sin öl sin /? = ~[cos(a-/3) - cos(<* +/?)], B.123) cos Ol cos ß = - [cos(a - /5) + cos(a + /?)], B.124) sina cos/3 ='-[sin(a - ß) 4- sin(a + /?)], B.125) sin a sin ß sin 7 = - [sin(a 4- ß — 7) 4 sin(/3 4- 7 — a) + sinG + a - ß) - sin(a + ß + 7)], B 126) -[sin(a + ß — 7) — sin(/? + 7 — 0;) + sinG + a - /?) + sin(a + /3 + 7)], B 127) -[— cos(a + /? — 7) 4- cos(/3 + 7 — 0;) + cosG + a-ß)- cos(a + /? + 7)], B 128) - [cos(a + ß — 7) 4- cos(/3 + 7 — 0) + cosG + OL-ß)+ cos(a + ß + 7)] B 129) sin a cos ß cos 7 = — [sin(üf + /? — 7) — sin(ß + 7 — 0;) sin öl sin /? cos 7 = - [— cos(a + /? — 7) 4- cos(/3 + 7 — a) cos a cos /? cos 7 = - [cos(a + /3 — 7) 4- cos(/3 + 7 — 0)
2 7 Trigonometrische Funktionen (Winkelfunktionen) 83 2.7.2.7 Potenzen trigonometrischer Funktionen sin2a = -A — cos2a), sin3 a = -C sin a — sin 3a), 4 1 B 130) B.132) cos2 a = -A + cos 2a), B 131) sin4 a = - (cos 4a - 4 cos 2a + 3), B 134) cos3 a = - (cos 3a 4- 3 cos a), B 133) cos4a- -(cos4a + 4cos2a + 3). B.135) Für große Werte von n ermittelt man sinn a und cosn a, indem die Formeln für cos na und sin na in 2 7 2 3. S. 81 nacheinander angewendet werden 2.7.3 Beschreibung von Schwingungen 2.7.3.1 Problemstellung In der Technik und der Physik kommen oft zeitabhängige Größen der Form u = Asin(ujt + ip) B 136) vor Sie werden manchmal auch sinusoidale Größen genannt Ihre zeitabhängige Änderung beschreibt eine harmonische Schwingung. Die graphische Darstellung von B 136) liefert eine allgemeine Sinuskurve, wie sie Abb.2.39 zeigt Abbildung 2 39 Abbildung 2 40 Die allgemeine Sinuskurve unterscheidet sich von der gewöhnlichen y = sin x a) durch die Amplitude A, d.h. ihre größte Auslenkung von der Zeitachse t, b) durch die Periode T ¦ 2tt , die der Wellenlänge entspricht (mit u als Schwingungsfrequenz, die- in der Schwingungslehre Kreisfrequenz genannt wird), c) duich die Anfangsphase oder Phasenverschiebung mit dem Anfangswinkel <p ^ 0 Die Größe u(t) kann auch in der Form u = a sin ut + b cos ut B 137) dargestellt werden Dabei ist A = Va2 + b2 und tan <p = - . Die Größen a, 6, A und ip lassen sich gemäß a Abb.2.40 als Bestimmungsstücke eines rechtwinkligen Dreiecks darstellen 2.7.3.2 Superposition oder Überlagerung von Schwingungen Superposition oder Überlagerung von Schwingungen nennt man im einfachsten Falle die Addition zweier Schwingungen mit gleicher Frequenz. Sie führt wieder auf eine harmonische Schwingung mit derselben Frequenz Ai siii((jt + ip\) + A2 sm(ut + ^2) — Asin(u)t + (p) B 138a)
84 2 Funktionen und ihre Darstellung V E 9- sin <\ i 0 i 1 a fA^A/ Ap2 / U ]£1\\\ '<P1 'Al b X a) Dabei bedeuten ,4 = \JA^+.A22 + 2j4i A2 cos(<p2 - <Pi), Ai sin y?i + A2 sin <p2 tan</? = B 138b) Abbildung 2.41 Ai COS (fi + A2 COS y>2 ' Auch eine Linearkombination mehrerer allgemeiner Sinusfunktionen gleicher Frequenz führt wieder auf eine allgemeine Sinusfunktion (harmonische Schwingung) mit derselben Frequenz: ^2 CiAi sin(ut + (fi) = A sm(ut + <p) B 138c) Die Größen A und tp können mit Hilfe eines Vektordiagramms (Abb.2.41a) bestimmt werden 2.7.3.3 Vektordiagramm für Schwingungen Die allgemeine Sinusfunktion B 136, 2 137) kann bequem mit den Polarkoordinaten p = A, (p und den kartesischen Koordinaten x = a ,y = b(s S 196) in einer Ebene dargestellt werden. Die Summe zweier solcher Größen ergibt sich dann als Summe der zwei Summandenvektoren (Abb.2.41a). Entsprechend liefert die Summe mehrerer solcher Vektoren die Linearkombination mehrerer allgemeiner Sinusfunktionen Diese Darstellung wird Vektordiagramm genannt. Die Größe u kann im Vektordiagramm für einen gegebenen Zeitpunkt t an Hand der Abb.2.41a bestimmt werden: Zuerst legt man durch den Koordinatenursprung O die Zeitachse OP(t), die mit konstanter Winkelgeschwindigkeit u um O im Uhrzeigersinn rotiert Zum Anfangszeitpunkt t = 0 fallen y- und £-Achse zusammen Danach ist in jedem Zeitpunkt t die Projektion ON des Vektors auf die Zeitachse gleich dem Betrag der allgemeinen Sinusfunktion u = A sm(ujt + ip). Zur Zeit t = 0 ist w0 = A. sin ip die Projektion auf die y-Achse (Abb.2.41b) 2.7.3.4 Dämpfung von Schwingungen Die Funktion y = Ae~ax sin(^x + <p0) (a > 0, x > 0) B 139) yt V Bf 0 \ - ukJ^ <^:% * / U2 Abbildung 2.42 liefert für x > 0 die Kurve einer gedämpften Schwingung (Abb.2.42) Die Schwingung erfolgt um die x-Achse, wobei sich die Kurve asymptotisch der x- Achse nähert. Dabei wird die Sinuskurve von den beiden Exponentialkurven y = ±Ae~ax eingehüllt, indem sie diese in den folgenden Punkten berüren: j4i,j42,...,j4j ((»*)- <A) ( (-l)kA exp [k-\--J ir - tpo^ \ Die Schnittpunkte mit den Koordinatenachsen sind B = @, A sin </?0), C\, C% ,. .,ck=( kir — (po .0
2.8 Zyklometrische Funktionen (Arkusfunktionen) 85 Die Extrema Di, D2, kir - ifo + 2a mit tan a = Defi a befinden sich bei x — kir — ifo + öl Als logarithmisches Dekrement der Dämpfung wird 8 — In Ordinaten zweier benachbarter Extrema 2/t+i die Wendepunkte E\, E2,... bei x = a— bezeichnet; yi und yi+i sind die 2.8 Zyklometrische Funktionen (Arkusfunktionen) Die zyklornetrischen Funktionen sind die Umkehrfunktionen der trigonometrischen Funktionen Sie werden auch inverse trigonometrische oder Arkusfunktionen genannt Zu ihrer eindeutigen Definition wird der Definitionsbereich der trigonometrischen Funktionen in Monotonieintervalle zerlegt, so daß für jedes Monotonieintervall eine Umkehrfunktion erhalten wird Diese wird entsprechend dem zugehörigen Monotonieintervall mit dem Index k gekennzeichnet yf i 1 71 ^/ -K y jfW* 0 x Y- K i 0<pN x Abbildung 2 43 Abbildung 2.44 Abbildung 2 45 Abbildung 2.46 2.8.1 Definition der zyklornetrischen Funktionen Die Vorgehensweise wird am Beispiel der Arkussinusfunktion gezeigt (s. Abb.2.43). Der Definitions- bereich von y = sinx wird in die Monotonieintervalle kn — — < x < kir + — mit k = 0, ±1, ±2, — < x < kix -\— mit k 2 ~ ~ 2 zerlegt. Spiegelung von y ~ sinx an der Winkelhalbierenden y = x liefert die Umkehrfunktionen y — arcfc sm x mit den Definitions- und Wertebereichen — 1<£<+1 bzw kit - -<y<kir + -, wobei fc = 0,±l,±2,. B.140a) B.140b) Die Schreibweise y — arc^ sin x ist gleichbedeutend mit x = sin y Analog erhält man die übrigen Arkusfunktionen, die in den Abb.2.44 bis Abb.2.46 dargestellt sind Die Definitions- und Wertebereiche dei Arkusfunktionen und die gleichbedeutenden trigonometrischen Funktionen sind in Tabelle 2.6 aufgeführt. 2.8.2 Zurückführung auf die Hauptwerte Die Arkusfunktionen haben in den Definitions- und Wertebereichen für k - wert, der ohne den Index k geschrieben wird, z.B. aresin x = arc0 sin x . 0 ihren sogenannten Haupt-
86 2. Funktionen und ihre Darstellung arccot """"¦*- -1 arctan^^ i V ^ K \ 2 7i 4° V — 0 -7t " 2 ^^~~ arctan 1 X In Abb.2.47 sind die Hauptwerte der Arkusfunktionen eingezeichnet Hinweis: Taschenrechner geben die Hauptwerte an. Die Zurückführung auf den Hauptwert erfolgt mit Hilfe der folgenden Formeln: arcfcsina: = kn + (-l)fc arcsin x, B.141) arrrnt f (/c + lOr — arecos a? (k ungerade), /01/l0x fiiccoi arcfccosx=^) , ; ), 6, x y B.142) ^ [ kir + arecosx {k gerade), v ' Abbildung 2.47 arefc tan x = kn + arctan x , arefc cot x = kir + arccot x. ¦ A: aresin 0 = 0, arc^ sin 0 = kir. 7T 7T ¦ B: arccot 1 = — , arc^ cot 1 = —h kir. 4 4 B.143) B.144) _ 1 TT 1 C: arecos - = —, arc^ cos - 2 3 2 ¦ + (k + l)ir (k ungerade) - + tor (* Tabelle 2 6 Definitions- und Wertebereiche der zyklometrischen Funktionen Arkusfunktion Arkussinus 1 y = arcfc sin x j Arkuskosinus 1 y = arefc cos x j Arkustangens 1 ?/ = arefc tan a: J Arkuskotangens 1 y = arefc cot x J Definitionsbereich -1 <x< 1 -1 <x< 1 —oo < x < oo —oo < x < oo Wertebereich ^tt— — <?/<A:7r-|- — /ctt < 2/ < {k + l)?r . TT 7T ktt--<?/< fcTr-l-- &7T < 7/ < (fc + 1OT Gleichbedeutende trigonometrische Funktion x = sin y x = cos y x = tan y x = coty A; = 0, ±1, ±2,. . Für k = 0 erhält man den Hauptwert der jeweiligen zyklometrischen Funktion, der ohne Index geschrieben wird (z.B. aresin x = arcosinx). 2.8.3 Beziehungen zwischen den Hauptwerten arcsin x = — — arecos x = arctan . 2 y/T^X2 — arecos Vi — x2 (—1 < x < 0), arecos \/l - £2 @ < x < 1), B.145) arecos x = arcsin x = arccot , 2 y/T^x2 7T — arcsin y/1 — x2 (tt — 1 < x < 0), arcsin \/l — x2 @ < x < 1), B.146) arctan a; = — — arccot x = arcsin , 2 VTTx2 B.147)
2 8 Zyklometrische Funktionen (Arkusfunktionen) 87 ( arccot - - TT (x < 0) I - arccos /—-^ (x < 0), arctana;=^ * =1 Y B.148) arccot - (x > 0) arccos ¦. (x > 0), TT X arccot x = arctan x = arccos . , B 149) I arctan - + tt (x < 0) [ *" - arcsin /t—~2 ^x - °)' * = ^ ^vi + x B150) arctan - (x > 0) arcsin , (x > 0) x l Vi + ^ 2.8.4 Formeln für negative Argumente arcsin(—x) = — arcsin x , B.151) arccos(—x) = n — arccos x , B 153) arctan(—x) = — arctan x, B 152) arccot(—x) = tt — arccot x B 154) 2.8.5 Summe und Differenz von arcsin x und arcsin y arcsin x + arcsin y = arcsin ( xy 1 — y2 + yVl — x2 J (xy < 0 oder a;2 + y2 < 1), B.155a) tt - arcsin (x^/l - y2 + y\/l -x2) (x > 0, y > 0, x2 + y2 > 1), B 155b) = -7T - arcsin (xy/l - y2 + yy/l - xA (x < 0, y < 0, x2 + y2 > 1) B 155c) arcsinx — arcsin?/ = arcsin (xyl — y2 — yVl — x2 ) (xy > 0 oder x2 + y2 < 1), B.156a) l (xyjl -y2- yVT^x2) (x>0, y <0, x2 + 2/2> 1), B 156b) l (xyjl -y2- yy/l - x2) {x < 0, y > 0, x2 + y2 > 1). B.156c) 2.8.6 Summe und Differenz von arccos x und arccos y = tt — arcsm = — 7T — arcsin arccosx + arccos?/ = arccos f xy — Vi — x2y 1 — ?/2 J (a; + ?/ > 0), B.157a) = 27T — arccos ( a:?/ — VT^yi - y2) (x + j/<0). B.157b) arccosa; — arccosy — — arccos (xy + \/l — x2yj 1 — ?/2 ) (a; > ?/), B 158a) = arccos f a;?/ + VT^2 ^1 - y2) {x<y). B 158b) 2.8.7 Summe und Differenz von arctan x und arctan y arctan x + arctan y = arctan (xy < 1), B 159a) l-xy = tt + arctan X + V (x > 0, xy > 1), B.159b)
88 2. Funktionen und ihre Darstellung = -TT + arctan -^—— (x < 0, xy > 1). B.159c) 1-xy arctan a; — arctan y — arctan (xy > — 1), B.160a) 1 + xy = n + arctan ^ ~ V (x > 0, xy < -1), B.160b) = -TT + arctan g ~ V (x <Q,xy <-l). B.160c) l+xy v * » > v / 2.8.8 Spezielle Beziehungen für aresin x, arccos x, arctan x 2 aresinx = aresin BaVl — x2) I |x| < -t= ) , B 161a) = n - aresin BaVl - z2) (-4= < x < 1) , B 161b) = -TT - aresin BaVl - z2) f-l<z<—^=) B.161c) 2 arccos z = arccosBx2 - 1) @ < x < 1), B 162a) = 2tt - arccosBx2 - 1) (-1 < x < 0) B.162b) 2x l-x2 2arctana; = arctan- (\x\ < 1), B.163a) 2x = ir + arctan (x>l), B.163b) 1 — xl 2x l-x2 cos(n arccosx) = Tn(x) (n > 1), B.164) wobei n > 1 auch gebrochene Werte annehmen kann und Tn(x) über die Gleichung : -TT + arctan (x < -1). B 163c) (x + Vx2^!O1 +(x- y/x^^lf Tn(x) = ± '—^ '- B 165) bestimmt ist. Für ganzzahliges n ist Tn(x) ein Polynom in x (ein TsCHEBYSCHEFFsc/ies Polynom). Wegen der Eigenschaften der TsCHEBYSCHEFFschen Polynome s. 19 6 3.2, S 951 2.9 Hyperbelfunktionen 2.9.1 Definition der Hyperbelfunktionen Hyperbelsinus, Hyperbelkosinus und Hyperbeltangens sind durch die folgenden Formeln definiert: ex — 6_ x sinhx = (Sinus hyperbolicus) , B 166) ßx _|_ ß~x coshz = (Kosinus hyperbolicus), B.167) ex — e~x tanh x = — (Tangens hyperbolicus) B 168)
2 9 Hyperbelfunktionen 89 Die geometrische Definition im Kapitel Geometrie (s. 3.1 2 2, S 134) ist eine Analogie zu den trigonometrischen Funktionen Hyperbelkotangens, Hyperbelsekans und Hyperbelkosekans sind als reziproke Werte der vorstehenden drei Hyperbelfunktionen definiert* cothx = sech x = cosech x 1 tanhx 1 coshx 1 ex ex ex + e~x — e~x 2 + e~x 2 (Kotangens hyperbolicus), (Sekans hyperbolicus), (Kosekans hyperbolicus). sinh x ex — e~x Den Verlauf der Hyperbelfunktionen zeigen die Abb.2.48 bis Abb.2.52 B.169) B.170) B.171) \cosh 3{ coshu ;COth \ cos \ 2 \^1 ,--''sech ^\cosech/ tanh .. \ / _i coth / \ sinh / \\- -2 ech^, \ 0 yysinh s\ / ^iSN tanh secfi***—* 1 2 x y\ 4 3 2 1 i_K // _2- /  ' A\ i L A. s?\ » Ol 2 x \ 6T / \ 5I / \\ 4I // \\ 3| 1/ —i—i——i—i—*- -2 -1 I 1 2 x Abbildung 2.48 Abbildung 2.49 Abbildung 2 50 2.9.2 Graphische Darstellung der Hyperbelfunktionen 2.9.2.1 Hyperbelsinus y = sinh x B 166) ist eine ungerade, zwischen —oo und +oo monoton wachsende Funktion (Abb.2.49). Der Koordinatenursprung ist zugleich Symmetriemittelpunkt und Wendepunkt mit dem Tangenten- neigungswinkel ip = — . Asymptoten gibt es nicht. 2.9.2.2 Hyperbelkosinus y = coshx B.167) ist eine gerade Funktion, die für x < 0 von +oo auf 1 monoton fällt und für x > 0 von 1 bis +oo monoton wächst (Abb.2.50). Das Minimum liegt bei j4@, 1); Asymptoten gibt es keine Die Kurve verläuft symmetrisch bezüglich der 7/-Achse und bleibt mit ihren Werten oberhalb der ^.2 quadratischen Parabel y ¦ 1 + — (gestrichelt gezeichnete Kurve) Da die Funktion eine Kettenlinie
90 2. Funktionen und ihre Darstellung beschreibt, nennt man die Kurve auch Katenoide (s. 2 15 1, S. 108). 2.9.2.3 Hyperbeltangens y = tanhx B.168) ist eine ungerade, für x von —oo bis +oo monoton von —1 auf +1 anwachsende Funktion (Abb.2.51). Der Koordinatenursprung ist zugleich Symmetriemittel- und Wendepunkt mit 7T dem Tangentenneigungswinkel <p = — . Die Asymptoten liegen bei y = ±1 4| 3 + 2 -1 -4 -3 -2 -1 2 3 4 x Abbildung 2 51 Pi1- -2 -3 -4 Abbildung 2 52 2.9.2.4 Hyperbelkotangens y = cotha; B 169) ist eine ungerade Funktion mit einer Unstetigkeit bei x = 0 (Abb.2.52). Für —oo < x < 0 fällt sie monoton von —1 auf —oo , für 0 < x < +oo von +oo auf +1. Extremwerte und Wendepunkte gibt es nicht. Die Asymptoten liegen bei x = 0 und y = ±1 2.9.3 Wichtige Formeln für Hyperbelfunktionen Hyperbelfunktionen sind durch Formeln miteinander verknüpft, deren Analogon von den trigonometrischen Funktionen bekannt ist. Daher lassen sie sich aus den entsprechenden trigonometrischen Formeln mit Hilfe der Zusammenhänge B.199) bis B.206) herleiten 2.9.3.1 Hyperbelfunktionen einer Variablen cosh2 x - sinh2 x = 1, B.172) Coth2 x - cosech2 x = 1, B 174) sech2 x + tann2 x = 1, B.173) tanh x • coth x = 1, B 175) sinhx coshrr = tanh x, B.176) coshx sinhx = coth x. B 177) 2.9.3.2 Darstellung einer Hyperbelfunktion durch eine andere gleichen Argumentes Die entsprechenden Formeln sind in Tabelle2.7 zusammengestellt. 2.9.3.3 Formeln für negative Argumente sinh(-x) = -sinhz, B 178) cosh(-x) = coshx, B.180) tanh(-x) = -tanhx, B 179) coth(-x) = -cothx. B.181)
2 9 Hyperbelfunktionen 91 Tabelle 2 7 Beziehungen zwischen den Hyperbelfunktionen gleichen Arguments für x > 0 sinha; cosha; tanha; cotha; sinha; - Y sinh2 x + 1 sinha; Y sinh2 x +1 Y sinh2 x + 1 sinha; cosha; Ycosh2 x — 1 Y cosh2 x — 1 cosha; cosha; Y cosh2 x — 1 tanha; tanha; Y1 — tanh2 x 1 Y1 — tanh2 x 1 tanha; cotha; 1 Y coth2 x — 1 cotha; Y' coth2 x — 1 1 cotha; 2.9.3.4 Hyperbelfunktionen der Summe und der Differenz zweier Argumente (Additionstheoreme) sinh(a; ± y) = sinh x cosh y ± cosh x sinh y, cosh(a; ± y) = cosh x cosh ?/ ± sinh x sinh y , , , , v tanhx ± tanhy A. , . 1 ± cotha;coth v tanh(a;±y)^ '°1°^ ^^^.u^ i ..\ 1 ± tanh a; tanh y , B.184) coth(x±2/) coth x ± coth y 2.9.3.5 Hyperbelfunktionen des doppelten Arguments 2 tanh x sinh 2a; = 2 sinh x cosh x , B.186) — 1 + tanh2 x '' cosh 2a; = sinh2 x + cosh2 x , B.187) coth 2a; = 1 + coth2 x 2 coth x 2.9.3.6 Formel von Moivre für Hyperbelfunktionen (cosh x ± sinh x)n = cosh nx ± sinh nx. 2.9.3.7 Hyperbelfunktionen des halben Arguments X 1 sinh — = ±y -(cosha; — 1), cosh — -(coshx + 1), B.182) B.183) B.185) B.188) B.189) B.190) B.191) Das Vorzeichen vor der Wurzel in B 191) ist positiv für x > 0 und negativ für x < 0 zu nehmen, cosha;-! sinha; /rt „««v , x sinha; cosha; + l B.192) tanh — = sinha; cosh x + 1 B 193) coth ¦ cosh x — 1 sinha; 2.9.3.8 Summen und Differenzen von Hyperbelfunktionen sinh x ± sinh y = 2 sinh cosh x + cosh y = 2 cosh x ±i  x + y cosh x + \ cosh : B.194) B.195) B.196)
92 2 Funktionen und ihre Darstellung cosh x — cosh y = 2 sinh —-— sinh —-— , tanh x ± tanh y = sinh(aj ± y) cosh x cosh y B 197) B 198) sin z = — i sinh Lz , cos z = cosh \z , tan z = —itanhiz , cot z = i coth \z , B.199) B 200) B 201) B 202) sinh z = —isiniz , cosh z = cos \z , tanh z = —itaniz, coth z = icotiz 2.9.3.9 Zusammenhang zwischen den Hyperbel- und den trigonometrischen Funktionen mit Hilfe komplexer Argumente B.203) B 204) B.205) B 206) Jede Formel, die Hypeibelfunktionen von x oder ax , nicht aber von ax + b miteinander verbindet, läßt sich aus der entsprechenden Formel, die die trigonometrischen Funktionen von a miteinander verbindet, herleiten, indem sin a durch i sinh x und cos a durch cosh x ersetzt wird. ¦ A: cos2 Q. + sin2 a = 1 Daraus folgt cosh2 x + i2 sinh2 x = 1 oder cosh2 x — sinh2 x = 1. ¦ B: sin 2a = 2 sin a cos et Daraus folgt i sinh 2x = 2i sinh x cosh x oder sinh 2x — 2 sinh x cosh x y=Arcosh x +-2 Abbildung 2.53 Abbildung 2 54 2.10 Areafunkt ionen 2.10.1 Definitionen Die Areafunktionen sind die Umkehrfunktionen der Hyperbelfunktionen, also die inversen Hyperbelfunktionen Die Funktionen sinhrc , tanhx und cothx sind streng monoton, so daß jede von ihnen genau eine Umkehrfunktion besitzt; anders die Funktion cosh x , die zwei Monotonieintervalle besitzt und deshalb auch zwei Umkehrfunktionen. Die Bezeichnung area (Fläche) hängt mit der geometrischen Definition der Funktion als Fläche eines Hyperbelsektors zusammen (s 3 1 2 2, S 134) 2.10.1.1 Areasinus Die Funktion = Arsinh x B 207) (Abb.2.53) ist eine ungerade, streng monoton wachsende Funktion mit den in Tabelle 2.8 angegebenen Definitions- und Wertebereichen Die Schreibweise ist gleichbedeutend mit x = sinh y . Die Funk- 7T tion besitzt im Koordinatenursprung einen Wendepunkt mit dem Tangentensteigungswinkel <p = — 2.10.1.2 Areakosinus Die Funktionen y = Arcosh x und ' = — Arcosh x B.208)
2.10 Areafunktionen 93 (Abb.2.54) oder x = cosh y besitzen die in Tabelle 2.8 angegebenen Definitions- und Wertebereiche und sind nur für x > 1 definiert. Der Funktionsverlauf beginnt im Punkt j4A,0) mit einer senkrechten Tangente und wächst bzw fällt dann streng monoton. 2.10.1.3 Areatangens Die Funktion y = Artanh x B.209) (Abb.2.55) oder x = tanhy ist eine ungerade und nur für |x| < 1 definierte Funktion mit den in Tabelle 2.8 angegebenen Definitions- und Wertebereichen. Der Koordinatenursprung ist gleichzeitig Wendepunkt mit dem Tangentenneigungswinkel ip = — . Die Asymptoten liegen bei x = ±1. 2.10.1.4 Areakotangens DieFunktion y = Arcoth x B.210) (Abb.2.56) oder x = coth?/ ist eine ungerade und nur für \x\ > 1 definierte Funktion mit den in Tabelle 2.8 angegebenen Definitions-und Wertebereichen. Für — oo < x < -1 fällt sie streng monoton von 0 bis —oo , für 1 < x < +oo fällt sie streng monoton von +oo auf 0 ab. Sie besitzt drei Asymptoten, und zwar bei y = 0 und x = ±1 Tabelle 2 8 Definitions- und Wertebereiche der Areafunktionen Areafunktion Areasinus y = Arsinh x Areakosinus y = Arcosh x y = — Arcosh x Areatangens y = Artanh x Areakotangens y = Arcoth x Definitionsbereich — 00 < X < 00 1 < X < 00 |x|<l Wertebereich —oo < y < oo 0 < y < oo —oo < y < 0 —oo < y < oo —oo < y < 0 0 < y < oo Gleichbedeutende Hyperbelfunktion x = sinh y x = cosh y x = tanh y x = coth y 2.10.2 Darstellung der Areafunktionen durch den natürlichen Logarithmus Mit Hilfe der Definition der Hyperbelfunktionen (B.166) bis B.171), s S. 88) können die Areafunktionen über die Logarithmusfunktion ausgedrückt werden: B 211) B.212) Arsinh x = In (x + y/x2 + 1), Arcosh x = In (x + Vx2 — 1) = In I . I (x > 1), Artanhz = ]- In ii^ (\x\ < 1), B.213) Arcoth x = i In ^1 (|x| > 1). B.214) 2 x — 1
94 2. Funktionen und ihre Darstellung y\ i 4 J3J i V -4 -3 -2 -l1" ~^\! ¦ V 1. 1 \ v_ ?lj 2 3 4 x -2J —o -4 Abbildung 2 55 Abbildung 2.56 2.10.3 Beziehungen zwischen den verschiedenen Areafunktionen jri _i_ i : Arcoth -—— , B 215) Arsinh x = (sign x) Arcosh Vx2 + 1 = Artanh V^TI Arcosh x = (sign x) Arsinh Vx2 — 1 = (sign x) Artanh = (sign x) Arcoth y/W^l Artanh x = (sign x) Arsinh = (sign x) Arcosh y/x2^!' X vr^ic2 i vT^2 = (sign x) Arcoth (N<i), i Arcoth a; = Artanh - = (sign x) Arsinh . x y/x2 - 1 (sign x) Arcosh - x (\x\>l). Vx2^! 2.10.4 Summen und Differenzen von Areafunktionen Arsinh x ± Arsinh y = Arsinh ( xy 1 + y2 ± y\/l + x2 1 , Arcoshx ± Arcoshy = Arcosh l xy ± y(x2 — l)(y2 — 1)) , Artanh x ± Artanh y = Artanh x ± i 1 ± xy 2.10.5 Formeln für negative Argumente Arsinh(-x) = - Arsinh x , B.222) Artanh(-x) = - Artanh x , B 223) Arcoth(-:r) = - Arcoth x B.216) B 217) B.218) B 219) B.220) B 221) B 224)
2.11 Kurven dritter Ordnung 95 Während Arsinh, Artanh und Arcoth ungerade Funktionen sind, ist Arcosh B.212) für negative Argumente x nicht definiert. 2.11 Kurven dritter Ordnung Eine ebene Kurve heißt algebraische Kurve der Ordnung n, wenn sie durch eine Polynomgleichung der Form F(x, y) = 0 in zwei Variablen vom Gesamtgrad n beschrieben werden kann. ¦ Die Kardioide mit der Gleichung (x2 + y2)(x2 + y2 - 2ax) - a2y2 = 0, (a > 0) (s. 2.12.2, S. 98), ist eine Kurve 4. Ordnung. Die bekannten Kegelschnitte (s. 3.5.2 11, S. 210) stellen Kurven 2. Ordnung dar 2.11.1 Semikubische Parabel Die Gleichung y = ±ax3/2 (a > 0 , x > 0) *2 „, _ „+s B.225a) oder in Parameterform x = t2, y = at3 (a > 0, —oo < t < oo) B.225b) liefert die semikubische Parabel (Abb.2.57). Im Koordinatenursprung gibt es einen Rückkehrpunkt, 6a ¦ durchläuft alle Werte von oo bis 0. Asymptoten gibt es keine Die Krümmung K = - _ 2 /2 Der Kurvenbogen hat zwischen dem Koordinatenursprung und einem Kurvenpunkt P(x, y) die Länge a>0 y\ s ^/£ —7V$i ' \ -^ a\ (P^ 0 X a>0 -a\s 0 -ä \^-\A Pr. X Abbildung 2.57 Abbildung 2.58 Abbildung 2.59 2.11.2 Versiera der Agnesi Die Gleichung a2 + xl (a > 0, —oo < x < oo) B 226a) liefert die in Abb.2.58 dargestellte Versiera der Agnesi Sie besitzt eine Asymptote mit der Gleichung y = 0, bei j4@, a) ein Maximum, der dazugehörige Krümmungsradius beträgt r = - Die Wendepunkte / _o_ 3a\ die Tangentensteigungen sind dort gegeben durch tan </? B und C befinden sich bei =F—— . Die Fläche zwischen der Kurve und der Asymptote beträgt S = iva2 . Die Versiera der Agnesi 8 B.226a) ist ein Spezialfall der Lorentz- oder BREiT-WiGNER-Kurve b2 + (x - cJ (a > 0). B.226b)
96 2 Funktionen und ihre Darstellung ¦ Die Bildfunktion bezüglich der FOURIER-Transformation der gedämpften Schwingung ist die Lo- RENTZ- oder BREiT-WiGNER-Kurve (s 15 3 1 4, S 754). 2.11.3 Kartesisches Blatt Die Gleichung x3 + ys = Saxy {a > 0) oder B 227a) 3at 3at2 in Parameterlorm x = , y = mit l + t3 l + t3 t = tan £ POx (a > 0 , -oo < t < -1 und - 1 < * < oo) B 227b) ergibt graphisch dargestellt das kartesische Blatt (Abb.2.59) Dabei wird mit P dei Kuivenpunkt bezeichnet, der zum Parameterwert t gehört, und mit •£ POx der Winkel, den die positivee x -Achse mit 0P bildet. Der Koordinatcnuisprung ist infolge zweier ihn durchlaufender Kurvenzweige ein Doppelpunkt, in dem beide Koordinatenachsen Tangenten sind Der Krümmungsradius ist füi beide Kurvenzweige im Koordinatenursprung r = — Die Asymptote berechnet sich aus x + y + a = 0 , der Scheitelpunkt hat die Koordinaten A {la>h) 3a2 Der Flächeninhalt der Schleife ist S\ = —- Der Flächeninhalt S2 zwischen der Kurve und der Asymptote hat den gleichen Wert. 2.11.4 Zissoide X3 Die Gleichung y2 = (a > 0), B.228a) a — x at2 at3 in Parameterform x = 5 V — \ 2 m^ * = ^an ^ ^®x (a > ^ " —°° < * < °°) B.228b) . 2 und in Polarkoordinaten p = (a > 0) B 228c) cos v? (Abb.2.60) beschreibt den geometrischen Ort aller Punkte P mit der Eigenschaft* P liegt auf einem Strahl durch 0 , und es gilt ÖP = MQ B 229) Dabei ist M der zweite Schnittpunkt des Strahles 0P mit dem ei zeugenden Kreis um I -, 0) mit dem Radius — und Q der Schnittpunkt des Strahles 0P mit der Asymptote x = a Der Flächeninhalt zwi- 3 sehen der Kurve und der Asymptote berechnet sich zu S = -na2 • 2.11.5 Strophoide Strophoide heißt der geometrische Ort aller Punkte P\ und P2 , die auf einem beliebigen Strahl durch den Punkt A liegen (A befindet sich auf der negativen £-Achse) und für die gilt ~MFX = MPo~ = ÖM B 230) Dabei ist M der Schnittpunkt des Strahles mit dei y-Achse (Abb.2.61) Die Gleichung dei Strophoide in kartesischen und Polarkoordinaten sowie in Parameterform lautet/
2.12 Kurven vierter Ordnung 97 Abbildung 2.60 ! (—) (a > 0), B.231a) \a — xj Abbildung 2.61 cos2(/? P = COSif (a > 0), t2-l - at- t2-l mit t = tan £ POx (a > 0, -oo < £ < oo) B.231b) B 231c) *2 + 1' * *2 + 1 Der Koordinatenursprung ist ein Doppelpunkt mit den Tangenten y = ±x. Die Asymptote hat die Gleichung x = a. Der Scheitel ist A(—a, 0). Der Flächeninhalt der Schleife beträgt Si = 2a2 — -na2 , der Flächeninhalt zwischen der Kurve und der Asymptote 52 = 2a2 + -na2 . 2.12 Kurven vierter Ordnung 2.12.1 Konchoide des Nikomedes Konchoide des Nikomedes (Abb.2.62) nennt man den geometrischen Ort aller Punkte P, für die mit M als Schnittpunkt der Verbindungslinie zwischen OPi und OP2 mit der Asymptote x = a die Bedingung WF = ÖM±l B 232) erfüllt ist, wobei das Vorzeichen „+" für den äußeren und „—" für den inneren Kurvenzweig gilt. Die Gleichung der Konchoide des NIKOMEDES lautet in kartesischen Koordinaten, in Parameterform und in Polarkoordinaten (x- (x2 + y2)-l2x2 = 0 (o>0,/>0), x = a + l cos (p, y = a tan ip + / sin ip COS(£ ¦±l /1 n ft ^t-ii-t-71" ^TT (rechter Zweig — — < ip < — , linker Zweig — < ip < —), (Vorzeichen „+": rechter Zweig, Vorzeichen „-"• linker Zweig). B.233a) B.233b) B.233c) 1. Rechter Zweig: Die Asymptote ist x = a. Der Scheitelpunkt A liegt bei (a + l, 0), die Wendepunkte B, C haben als £-Wert die größte Wurzel der Gleichung x3 — 3a2x + 2a(a2 — l2) = 0 Die Fläche zwischen dem rechten Zweig und der Asymptote ist S = 00. 2. Linker Zweig: Die Asymptote ist x = a Der Scheitelpunkt D liegt bei (a — /, 0). Der Ursprung ist ein singulärer Punkt, dessen Charakter von a und / abhängt- Fall a) Für / < a ist es ein isolierter Punkt (Abb.2.62a) Die Kurve hat dann zwei weitere Wendepunkte E und F, deren Abszisse sich als zweitgrößte Wurzel der Gleichung x3 — 3a2x + 2a(a2 — l2) = 0
98 2 Funktionen und ihre Darstellung yt / Do "P2 / .' \° «-av-* \ V i .1-1 X t l>a b) Abbildung 2 62 ergibt. Fall b) Für / > a ist der Koordinatenursprung ein Doppelpunkt (Abb.2.62b) Die Kurve besitzt ein Maximum und ein Minimum an der Stelle x = a — va/2 Der Tangentenneigungswinkel beträgt im Koordinatenursprung tan a - ±VJ? «2 ^ „ v • , • IVP- — Der Krümmungsradius ist hier r0 = a 2o Fall c) Für / = a wird der Koordinatenursprung zum Rückkehrpunkt (Abb.2.62c) 2.12.2 Allgemeine Konchoide Die Konchoide des Nikomedes ist ein Spezialfall der allgemeinen Konchoide Die Konchoide zu einer gegebenen Kurve ergibt sich, wenn man den Radiusvektor zu jedem Punkt der gegebenen Kurve um eine konstante Strecke ±1 verlängert. Wenn die Gleichung der Kurve in Polarkoordinaten p = /((/?) lautet, dann ist die Gleichung ihrer Konchoide P = /(¥>) ± l B 234) Die Konchoide des JNTlKOMEDES ist dann die Konchoide der Geraden. 2.12.3 Pascalsche Schnecke PASCALsc/ie Schnecke (Abb.2.63) nennt man die Konchoide des Kreises, einen weiteien Spezialfall der allgemeinen Konchoide (s. 2 12.2, S. 98) mit der Bedingung B.232), wobei der Koordinatenursprung auf dem Kreis liegt Die Gleichung lautet in kartesischen und Polarkoordinaten sowie in Parameterform (s auch 2.13 5, S 105): (x2 + y2- axf = l2(x2 + y2) (a > 0, l > 0), B.235a) p = acos(p + l (a>0,/>0), B235b) x = a cos2 <p + / cos </?, y = a cos (p sin (p + / sin ip (a>0,/>0,0<</?< 2n) B 235c) mit a als Durchmesser des Kreises. Der Scheitel A, B liegen bei (a ± l, 0). Die Form der Kurve hängt von den Größen a und / ab, wie man aus Abb.2.63 und Abb.2.64 erkennen kann a) Extremwerte und Wendepunkte: Für a > l hat die Kurve vier Extremwerte C. D, E, F, für a < l zwei; sie liegen bei I cos ip -l ± y/l2 + 8a2 4a , Für a < l < 2a existieren zwei Wendepunkte G
2 12 Kurven vierter Ordnung 99 l>2a jEU Kv $B) Al *—a*- +s*M X a) a<l<2a b) Abbildung 2 63 a>l c) und H bei cos ip = — 2a2 + l2 3a/ / /2 /V4a2 - J2\ b) Doppeltangenten: Für / < 2a gibt es in den Punkten / und K bei I —-— , ± eine \ 4a 4a J gemeinsame Tangente c) Singulare Punkte: Der Koordinatermrsprung ist ein singulärer Punkt Für a < l ist er ein iso- lierter Punkt, für a > l ein Doppelpunkt mit den Tangentenrichtungen tana; = ± und dem Krümmungsradius r0 = -\/a2 — l2 Für a = l handelt es sich um einen Rückkehrpunkt; die Kurve nennt man dann Kardioide. Der Flächeninhalt der Schnecke beträgt S = —z-+Trl2, wobei im Falle a > l (Abb.2.63c) der Flächeninhalt der inneren Schleife nach dieser Formel doppelt gezählt wird y< y< i{ K\ / <'/' N\ A] K_J «—a-n D X a=l Abbildung 2 64 2.12.4 Kardioide Die Kardioide (Abb.2.64) kann auf zweierlei Weise definiert werden, und zwar als:
100 2 Funktionen und ihre Darstellung 1. Spezialfall der PASCALschen Schnecke mit ÖP = ÖM±a, B.236) wobei a der Durchmesser des Kreises ist 2. Spezialfall der Epizykloide mit gleich großem Durchmesser a des festen und des beweglichen Kreises Die Gleichung lautet {x2 + y2J - 2ax(x2 + y2) = a2y2 {a > 0) und in Parameterform sowie in Polarkoordinaten. B.237a) x = acos(p(l 4- cosif), y = asin</?(l + cosy?) (a > 0, 0 < ip < 2ir), p = a(l 4- cos v?) (o > 0). B 237b) B 237c) & U^ c) Abbildung 2.65 Der Koordinatenursprung ist ein Rückkehrpunkt Der Scheitel A liegt bei Ba, 0); Maximum C und Minimum Z) liegen bei cos</? = - mit den Koordinaten j -a,±——a I . Der Flächeninhalt beträgt 3 S = -na2 (die sechsfache Fläche des Kreises mit dem Durchmesser a) Die Kurvenlänge ist L = Sa 2.12.5 Cassinische Kurven CASSlNisc/ie Kurven (Abb.2.65) nennt man den geometrischen Ort aller Punkte P, für die das Produkt der Abstände von zwei festen Punkten Fi und F2 , den Fixpunkten bei (c, 0) bzw. (—c, 0), konstant gleich a2 ist. B.238) B 239a) B.239b) F1P-F2P = a2. Die Gleichung lautet in kartesischen und Polarkoordinaten: (x2 + y2J - 2c2(x2 -y2) = aA-c4, (a > 0, c> 0), p2 = c2 cos 2(p ± yjc4 cos2 2(p + (a4 - c4) (a > 0, c> 0). Die Form der Kurve hängt von den Größen a und c ab: 1. Fall a > cy/2: Für a > c\/2 ist die Kurve ein ellipsenförmiges Oval (Abb.2.65a) Die Schnittpunkte A, C mit der x-Achse liegen bei ( ± \/a2 + c2 ,0), die Schnittpunkte B, D mit der y-Achse bei @, ±Va2 - c2) 2. Fall a = cy/2\ Für a = cy/2 ergibt sich eine Kurve des gleichen Typs mit A, C bei ( ± c\/3 , 0) und B, D bei @, ±c), wobei die Krümmung in den Punkten B und D gleich 0 ist, d h., es gibt eine enge Berührung mit den Geraden y = ±c
2.13 Zykloiden 101 3. Fall c < a < cy/2: Für c < a < c\[2 ist die Kurve ein eingedrücktes Oval (Abb.2.65b). Die Achsenschnitte sind dieselben wie im Falle a > c^/2 , ebenso das Maximum und das Minimum B, D, ( y/4c4 - a4 a2\ während die weiteren Extrema E,G, K, I bei I ± , ±— 1 liegen und die vier Wendepunkte bei P, L, M, N bei ( ±\j~(m - n), ±J-(m + n) I mit n = — und m = 4. Fall a = c: Für a = c ergibt sich die Lemniskate. 5. Fall a < c: Für a < c ergeben sich zwei Ovale (Abb.2.65c) Die Schnittpunkte A, C bzw. P,Q mit der x-Achse liegen bei ( ± \/a2 + c2 , 0) bzw. ( ± v/c2~^ö2,0), die Maxima und Minima £, G, i^, ^2\ / bei ± V4c4 - a4 , ±-— Der Krümmungsradius beträgt r = — 2c 2c) c4 2aV - a4 + 3p4 , wobei p der Polarko- ordinatendarstellung genügt. 2.12.6 Lemniskate Lemniskate (Abb.2.66) nennt man den Spezialfall a = c der CASSiNisc/ien Kurven, die der Bedingung genügen F1P-F2P = F^Fo B.240) wobei die Fixpunkte Fi, F2 bei (±a, 0) liegen. Die Gleichung lautet in kartesischen Koordinaten {x2 + y2J - 2a2(x2 - y2) = 0 (a > 0) B 241a) und in Polarkoordinaten B.241b) Der Koordinatenursprung ist Doppelpunkt und Wendepunkt zugleich, wobei die Tangenten y = ±x sind p = ay2cos2(p (a > 0). K -' N^ I Abbildung 2 66 Die Schnittpunkte A und C mit der x-Achse liegen bei (± a\/2,0), die Maxima und Minima F, G, K TT ±:- . Der Krümmungsradius / bei I ±—— , ±- I Der Polarwinkel beträgt in diesem Punkten ip 2a2 ergibt sich zur = —— und der Flächeninhalt jeder Schleife zu S = a2 . 3p 2.13 Zykloiden 2.13.1 Gewöhnliche Zykloide Gewöhnliche Zykloide wird eine Kurve genannt, die von einem Peripheriepunkt eines Kreises beschrieben wird, der auf einer Geraden abrollt, ohne zu gleiten (Abb.2.67) Die Gleichung der gewöhnlichen Zykloide lautet in Parameterform x = a(t - sin£), y = a(l — cosi) mit a > 0 , — oo < t < oo , B 242a) wobei a der Radius des Kreises und t der Wälzwinkel £ PC\B sind, und in kartesischen Koordinaten x + JyBa - y) = a arccos ^—- (a > 0) B 242b)
102 2. Funktionen und ihre Darstellung Abbildung 2 67 Die Kurve ist periodisch mit der Periode (Basis der Zykloide) OOi = 2ira. Sie hat Spitzen bei 0, 0\, 02,. ., Ok = Bkira, 0), die Scheitelpunkte liegen bei Ak = [Bk + lOra, 2a] Die Länge des Bogens 0P ist L = Sa sin2 (t/4), die Länge eines Zweiges LqaiOi — 8a Der Flächeninhalt beträgt S = Sna2. Der Krümmungsradius ist r = 4a sin \t, in den Scheiteln rA — 4a Die Evolute einer Zykloide (s. 3.6 1 5, S. 244) ist eine kongruente Zykloide, die in der Abb.2.67 gestrichelt gezeichnet ist 2.13.2 Verlängerte und verkürzte Zykloiden oder Trochoiden Verlängerte und verkürzte Zykloiden oder Trochoiden werden von einem Punkt beschrieben, der sich entweder außerhalb oder innerhalb eines Kreises auf einem vom Kreismittelpunkt ausgehenden und mit dem Kreis fest verbundenen Strahl befindet, während der Kreis, ohne zu gleiten, auf einer Geraden abrollt (Abb.2.68). Die Gleichung der Trochoiden in Parameterform lautet mit a als Radius des Kreises x = a(t- Xsint), B.243a) y = a(l-Xcost), B.243b) wobei t der Winkel £ PCiM ist. Wegen Xa = C\P bestimmt A > 1 die verlängerte Zykloide und A < 1 die verkürzte Zykloide. Die Periode der Kurven ist OOi = 27ra, die Maxima Au A2,.. , Ak = [BA; + l)na, A + X)a], die Minima B0, Bi, B2,..., Bk = [2kira, A - A)o] y< V'- i c) Bo 1 P ^1 ""/\)K n\ PoKuVq) fÖ m mmß j^ Ar2 V02x B2 X>1 a) Abbildung 2.68 Die verlängerte Zykloide besitzt bei Dq, D\, D2, ,Dk = 2kna ,a(l-y/x2-t02^ Doppelpunkte, wobei to die kleinste positive Wurzel der Gleichung t = X sin t ist Die verkürzte Zykloide besitzt Wendepunkte bei Ei, E2,..., Ek = \a (arccos A — AVl — A2J , a(l — A2)] ' Die Länge eines Bogens zwischen Bk und Bk+i berechnet sich zu L = a / Vi + A2 - 2A cos t dt. Der Jo Inhalt der in Abb.2.68 schraffiert gezeichneten Fläche beträgt S = na2B + A2). Für den Krümmungsradius erhält man r = a (l + A2-2Acos*K/2 . A(cos£ — A) , in den Maxima r^ = — a (l+AJ
2.13 Zykloiden 103 und in den Minima Vß = a A-AJ 2.13.3 Epizykloide fjpizyloide wird eine Kurve genannt, die von einem Peripheriepunkt eines Kreises beschrieben wird, wenn dieser, ohne zu gleiten, auf der Außenseite eines anderen Kreises abrollt (Abb.2.69) Die Gleichung der Epizykloide lautet in Parameterform mit A als Radius des festen und a als Radius des rollenden Kreises A + et A -\- gl x — (A + d) cos ip - a cos ip, y = (A + a) sin ip - a sin </? (—oo < (p < oo) , B.244) wobei ip = $. COx gilt Die Form der Kurve hängt vom Quotienten m = — ab Für ra = 1 erhält man die Kardioide Vf* X ' o °3 ' fT^r\ -y._-\'k\ .AaVv m , ^1=| b) Abbildung 2.69 yi A2— - / B2 \ A3 0 ------ i —-.^ .-tofSkj^A, m=3 a) Abbildung 2 70 1. Fall m ganzzahlig: Für m ganzzahlig besteht die Kurve aus m , den feststehenden Kreis umgebenden Kurvenzweigen (Abb.2.69a) Die Spitzen Ax, A2,..., Am liegen bei I p = A, (p = (fc = 0,1, , ra — 1) , die Scheitelpunkte Bi, B2, , -ßm bei p = A + 2a, tp= — (k+-) m \ 2/
104 2 Funktionen und ihre Darstellung 2. Fall m gebrochenrational: Für m gebrochenrational überdecken sich die Zweige gegenseitig, der sich bewegende Punkt P kehrt aber nach einer endlichen Zahl von Durchläufen in die Anfangslage zurück (Abb.2.69b) 3. Fall m irrational: Für m irrational ist die Anzahl der Durchläufe unendlich, und der Punkt P kehrt nicht in die Anfangslage zurück. Die Länge eines Zweiges beträgt LAiBia2 = Bei ganzzahligem m ist die Länge der gesamten Kurve Lgesamt = S(A + a). Die Fläche des Sektors AiBiA2Ai beträgt (ohne den Sektor des festen Kreises) S = ira2 ( j . Der Krümmungsradius ist r — Aa(A + a) rB Aa(A + a) . Aip . , n . . l — sin — , in den Scheiteln 2a + A 2a 2a+ A a) X>\, a>0 \<l, a>0 b) Abbildung 2 71 2.13.4 Hypqzykloide und Astroide Hypozykloide wird eine Kurve genannt, die von einem Peripheriepunkt eines Kreises beschrieben wird, wenn dieser, ohne zu gleiten, auf der Innenseite eines anderen Kreises abrollt (Abb.2.70) Die Gleichung der Hypozykloide, die Koordinaten der Scheitelpunkte und Spitzen, die Formeln für die Bogenlängen, die Flächeninhalte und die Krümmungsradien entsprechen denen der Epizykloide; es ist jedoch ,,+a" durch „—a" zu ersetzen. Die Anzahl der Spitzen entspricht für m ganzzahlig, rational oder irrational (stets ist m > 1) der von der Epizykloide bekannten 1. Fall m = 2: Für m = 2 entartet die Kurve in den Durchmesser des unbeweglichen Kreises 2. Fall m = 3: Für m = 3 besitzt die Hypozykloide drei Zweige (Abb.2.70a) mit der Gleichung. x = oB cos <p + cos 2ip), y = aBsüup — sin2<^). B 245a) Es gilt Lgesamt = 16o , ^gesamt = 27Ta2 . 3. Fall m = 4: Für m = 4 (Abb.2.70b) besitzt die Hypozykloide vier Zweige und wird Astroide genannt. Ihre Gleichung lautet in kartesischen Koordinaten und in Parameterform• : A2/s , B 245b) x = A cos3 <p, y = A sin3 ip @ < <p < 2tt) B 245c) x2'* + y2'*- Es gilt Lgesamt = 24a = 6A , 5geSamt : 3 A2
2.14 Spiralen 105 a) / / 1 y/^ \ ^V V\ y< ,— 0 , — r r ,<p\ ^ -fC J\ >v x /X1 \ / /' x y \>l, a<0 b) Abbildung 2.72 >,<l,a<0 2.13.5 Verlängerte und verkürzte Epizykloide und Hypozykloide Die verlängerte und verkürzte Epizykloide und die verlängerte und verkürzte Hypozykloide, auch Epitro- choide bzw Uypotiochoide genannt, sind Kurven (Abb.2.71 bzw. Abb.2.72), die von einem entweder außerhalb oder innerhalb eines Kreises befindlichen Punkt beschrieben werden, der sich auf einem vom Kreismittelpunkt ausgehenden und mit dem Kreis fest verbundenen Strahl befindet, während der Kreis an einem anderen Kreis entweder außen (Epitrochoide) oder innen (Hypotrochoide) abrollt, ohne dabei zu gleiten. Die Gleichung der Epitrochoide lautet in Parameterform / , n x (A + a \ , * s . ^ . (A + a \ [A + a) cos if — Xa cos ( ip 1 , y = (A + a) sin <p — Xa sm I ip 1 B.246a) wobei A der Radius des festen Kreises ist und a der des rollenden. Für die Hypozykloide ist ,,+a" durch „—a" zu ersetzen. Über Xa = CP wird mit A > 1 bzw. A < 1 bestimmt, ob es sich um die verkürzte oder verlängerte Kurve handelt. Für A = 2a, A ^ 1 wird die Hypozykloide mit der Gleichung oj = a(l + A)cos</?, y = a{l-X)sinip @ < (p < 2n) B.246b) zur Ellipse mit den Halbachsen a(l + A) und a(l — A) A = a liefert die PASCALsc/ie Schnecke (s. auch 2.12 3, S 98) x = aBcos(p — Xcos2tp), y = aB sin ip — X sin 2<p). B.246c) Hinweis: Bei der Behandlung der PASCALschen Schnecke in 2 12.3, S. 98 wurde mit a eine Größe bezeichnet, die hier 2Aa heißt und mit / der Durchmesser 2a Außerdem ist das Koordinatensystem geändert. 2.14 Spiralen 2.14.1 Archimedische Spirale Archimedische Spirale heißt eine Kurve (Abb.2.73), die durch Bewegung eines Punktes mit konstanter Geschwindigkeit v auf einem Strahl entsteht, der seinerseits mit konstanter Winkelgeschwindigkeit
106 2 Funktionen und ihre Darstellung lü den Koordinatenursprung umkreist. Die Gleichung der ARCHlMEDischen Spirale lautet in Polarko- ordinaten = aip, a—— (a > 0, —oo < ip < oo). B 247) Abbildung 2 73 Abbildung 2 74 Die Kurve besitzt zwei Zweige, die symmetrisch zur y-Achse verlaufen. Jeder Strahl OK schneidet jeden der beiden Zweige in je einer Folge von Punkten 0, Ai, A2, . . ,j4„,. , die voneinander den Abstand AiAi+i = 2ira haben. Die Länge des Bogens OP ist L = - (ipy ip2 + 1 + Arsinh ip) , wobei für große (p 2L a2 der Ausdruck —- gegen 1 geht. Der Flächeninhalt des Sektors PiOP2 beträgt S = — (</?23 — ^l3) • Der aipz 6 (ip2 + lK/2 a Krümmungsradius ist r = a ^—-— und im Koordinatenursprung r0 = - 2.14.2 Hyperbolische Spirale In Polarkoordinaten lautet die Gleichung der hyperbolischen Spirale p=— {a > 0, -oo < cp < 0, 0 < ip < oo). B 248) Die Kurve der hyperbolischen Spirale (Abb.2.74) besteht aus zwei Zweigen, die symmetrisch zur y- Achse verlaufen. Für beide Zweige ist die Gerade y = a Asymptote und der Koordinatenursprung asymptotischer Punkt. Der Flächeninhalt des Sektors P1OP2 beträgt S = —- I , wobei gilt 2 \<pi V2J .. _ a2 Tr a 1 vT hm b = . Der Krümmungsradius ist r = — I — </?2--00 2(p\ ip \ <p 2.14.3 Logarithmische Spirale Logarithmische Spirale heißt eine Kurve (Abb.2.75), die alle Strahlen, die vom Koordinatenursprung 0 ausgehen, unter dem gleichen Winkel a schneidet Die Gleichung der logarithmischen Spirale lautet in Polarkoordinaten p = aek<p {a > 0, -00 < ip < 00), B.249) wobei k = cota. Der Nullpunkt ist asymptotischer Punkt der Kurve Die Länge des Bogens PiP2 beträgt L = ; (p2 — p\), der Grenzwert des Bogens 0P, berechnet vom Koordinatenursprung k aus, Lq = p. Der Krümmungsradius ist r = Vi + k2p = Lok Spezialfall Kreis: Für a — — ist k = 0 , und die Kurve wird zum Kreis
2.14 Spiralen 107 Abbildung 2.75 Abbildung 2.76 Abbildung 2 77 2.14.4 Evolvente des Kreises Evolvente des Kreises heißt eine Kurve (Abb.2.76), die vom Endpunkt eines fest gespannten Fadens beschrieben wird, wenn dieser von einem Kreis abgewickelt wird, so daß AB = BP. Die Gleichung der Evolvente des Kreises lautet in Parameterform x = a cos ip + (Mf sin ip, y = a sin ip — a<p cos tp, B.250) wobei a der Radius des Kreises ist und ip = £ BOx. Die Kurve besitzt zwei Zweige symmetrisch zur x-Achse. Die Spitze liegt bei A(a, 0), die Schnittpunkte mit der x-Achse liegen bei x = , wobei COS(/?o y?o die Wurzeln der Gleichung tan^? = ip sind Die Länge des Bogens AP beträgt L = -aip2. Der Krümmungsradius ist r = cup = y/2a~L , der Krümmungskreismittelpunkt B liegt auf dem Kreis 2.14.5 Klothoide Klothoide (auch CORNUsche Spirale) heißt eine Kurve (Abb.2.77), die sich aus der umgekehrten Proportionalität ihres Krümmungsradius zur Länge des Bogens ergibt: r = — (a > 0) s Die Gleichung der Klothoide lautet in Parameterform B.251a) /7tt r irt s '~s cos -— dt, y = dy/n / sin —— dt mit t = —= , s = 0P 2 7 2 a^/TT B.251b) Die Integrale können nicht durch elementare Funktionen ausgedrückt werden; sie lassen sich aber für jeden Parameter t = i0, £i, • • • durch numerische Integration (s. 19 3, S. 925) berechnen, so daß die Klothoide punktweise gezeichnet werden kann. Wegen der Berechnung am Computer s. [3 12]. Die Kurve ist zentralsymmetrisch zum Koordinatenursprung, der gleichzeitig Wendepunkt ist. Im Wendepunkt ist die x-Achse Tangente Bei A und B hat die Kurve je einen asymptotischen Punkt mit den Koordinaten ( H—^— , +—w— bzw. ^— , Die Klothoide findet z.B. beim Straßenbau Anwendung, wo der Übergang von einer Geraden in eine Kreiskurve durch einen Klothoidenabschnitt vermittelt wird (s. [3.12]).
108 2 Funktionen und ihre Darstellung 2.15 Verschiedene andere Kurven 2.15.1 Kettenlinie oder Katenoide Kettenlinie oder Katenoide nennt man eine Kurve, in (Abb.2.78) durchgehend gezeichnet, die von einem homogenen, nicht dehnbaren und an beiden Enden aufgehängten Faden gebildet wird Die Gleichung der Katenoide lautet x ex/a , e-x/o y = a cosh - = a (a > 0). B.252) Der Parameter a bestimmt den Scheitelpunkt A bei @, a) Die Kurve verläuft symmetrisch zur y- x2 Achse, und zwar höher als die Parabel y = a + — , die in der Abb.2.78 gestrichelt dargestellt ist Die 2a •~v x ßX/a _ g-x/o Länge L =AP des Bogens L beträgt L = asinh — = a Die Fläche OAPM hat den Wert a 2 S = aL = a2 sinh - . Der Krümmungsradius beträgt r = — = a cosh2 - = a + - a " 0 M x Abbildung 2 78 Abbildung 2 79 Die Katenoide ist die Evolute (s. 3.6.1.5,1., S 244) der Traktrix Die Traktrix ist ihrerseits die Evolvente (s 3 6.1 5,2., S 244) der Katenoide mit dem Scheitelpunkt A bei @, a) (s. 3.6.1.5,2., S 244) 2.15.2 Schleppkurve oder Traktrix Die Schleppkurve oder Traktrix (in Abb.2.79 durchgehend gezeichnet) nennt man den geometrischen Ort aller Punkte mit der Eigenschaft, daß das Tangentenstück PM einer Kurve zwischen Berührungspunkt P und Schnittpunkt der Tangente mit einer Leitlinie, hier mit der x -Achse, die konstante Länge a besitzt. Die Traktrix wird von einem Punkt P, Schleppunkt genannt, beschrieben, der an einem Ende eines nicht dehnbaren Fadens mit der Länge a befestigt ist, wenn das andere Ende M entlang der Leitlinie, hier entlang der x- Achse, bewegt wird. Die Gleichung der Traktrix lautet a ± yja2 - - a Arcosh - ± Ja2 — y2 = a In - y ¦ y/a2 - y2 (a > 0) B 253) Die x-Achse ist Asymptote. Der Punkt A bei @, a) ist eine Spitze. Die Kurve verläuft symmetrisch zur y -Achse Die Länge des Bogens AP ist L = a In - Bei wachsender Länge des Bogens L nähert y sich die Differenz L — x dem Wert a(l — In 2) « 0,307 a, wobei x hier die Abszisse des Punktes P ist Der Krümmungsradius ist r = a cot - . Krümmungsradius PC und Normalenabschnitt PE = b sind y zueinander umgekehrt proportional* rb = a2 Die Evolute (s. 3.6.1.5,1., S. 244) der Traktrix, d h., der geometrische Ort ihrer Krümmungskreismit- telpunkte C , in Abb.2.79 gestrichelt dargestellt, ist die Katenoide B 252)
2 16 Aufstellung empirischer Kurven 109 2.16 Aufstellung empirischer Kurven 2.16.1 Verfahrensweise 2.16.1.1 Kurvenbilder vergleiche Die Aufstellung einer Näherungsformel für eine Funktion y = f(x), für die nur empirisch ermittelte Daten vorliegen, kann in zwei Schritte eingeteilt werden Zuerst wird die Art der Näherungsformel ausgewählt, die in der Regel einige freie Parameter enthält. Danach erfolgt die numerische Bestimmung der Parameterwerte Wenn es für die Wahl der Formel keine theoretischen Überlegungen gibt, dann wird unter den einfachsten dafür in Frage kommenden Funktionen eine Näherungsformel ausgesucht, indem ihre Kurvenbilder mit der Kurve der empirischen Daten verglichen werden. Die Entscheidung über die Ähnlichkeit der Kurvenbilder nach Augenmaß kann trügerisch sein. Daher ist nach der Wahl einer Näherungsfunktion vor der Bestimmung der Parameterwerte durch Rektifizierung zu prüfen, ob die gewählte Formel anwendbar ist 2.16.1.2 Rektifizierung Vorausgesetzt, zwischen x und y besteht eine bestimmte Abhängigkeit, dann werden in der gewählten Näherungsformel zwei Funktionen X = (f(x,y) und Y = ip(x,y) derart substituiert, daß eine lineare Beziehung der Form Y = AX + B B.254) entsteht, wobei A und B Konstanten sind Werden für die angegebenen x- und y-Werte die zugehörigen X- und Y-Werte berechnet und graphisch dargestellt, dann kann leicht erkannt werden, ob die zugehörigen Punkte annähernd auf einer Geraden liegen. Danach ist zu entscheiden, ob die gewählte Formel geeignet ist oder nicht ¦ A: Lautet die Näherungsformel y = , dann kann X = x, Y = - gesetzt werden, und man ax + b y erhält Y = aX + b. Es wäre auch die Substitution X = - , Y = - möglich. Dann erhielte man x y Y = a + bX. ¦ B: S. Abschnitt Einfach-logarithmische Darstellung 2.17 2 1, S. 118. ¦ C: S. Abschnitt Doppelt-logarithmische Darstellung 2.17.2.2, S. 118. Zur Entscheidung^ ob empirische Daten einer linearen Beziehung Y = AX + B genügen, kann die lineare Regression und Korrelation (s 16.3.4, S 802) herangezogen werden. Die Zurückführung eines funktionalen Zusammenhangs auf eine lineare Beziehung wird Rektifizierung genannt. Beispiele für die Rektifizierung einiger Formeln werden in 2 16 2, S. 110) gegeben, ein vollständig durchgerechnetes Beispiels. 2 16 2.12, S. 115. 2.16.1.3 Parameterbestimmung Die wichtigste Methode zur Bestimmung der Parameterwerte ist die Methode der kleinsten Quadrate (Fehlerquadratmethode) (s. 16.3.4.2, S. 804). In vielen Fällen können jedoch noch einfachere Methoden mit Erfolg eingesetzt werden, z.B. die Mittelwertmethode. 1. Mittelwertmethode Bei der Mittelwertmethode wird die lineare Abhängigkeit der „rektifizierten" Variablen X und Y , d h Y = AX + B wie folgt ausgenutzt Die Bedingungsgleichungen Yi = AXi + B für die vorliegenden Wertepaare Y^ Xi werden in zwei gleich große bzw. nahezu gleich große Gruppen eingeteilt und nach zunehmenden Werten Yi und Xi geordnet. Durch Addition der Gleichungen jeder der beiden Gruppen ergeben sich zwei Gleichungen, aus denen A und B bestimmt werden können. Wenn nun X und Y wieder durch die Ausgangsvariablen x und y ausgedrückt werden, dann ist die gesuchte Abhängigkeit zwischen x und y gefunden Sollten noch nicht alle Parameter bestimmt worden sein, dann ist die Mittelwertmethode erneut anzu-
110 2. Funktionen und ihre Darstellung wenden, wobei jetzt die Rektifizierung mit anderen Größen X und Y durchzufuhren ist (s. z B 2 16 2 11, S. 114) Rektifizierung und Mittelwertmethode werden vor allem dann angewendet, wenn in der Näherungsformel gewisse Parameter nichtlinear auftreten, wie z.B. in den Formeln B.256a, 2.258a). 2. Fehlerquadratmethode Die Fehlerquadratmethode führt in den Fällen, in denen in der Näherungsformel gewisse Parameter nichtlinear auftreten, auf nichtlineare Ausgleichsauf gaben Ihre Lösung erfordert einen erhöhten numerischen Aufwand sowie gute Startnäherungen Letztere können durch Rektifizierung und Mittelwertmethode bestimmt werden 2.16.2 Gebräuchlichste empirische Formeln In diesem Abschnitt werden einige der einfachsten Formeln für die Anpassung an empirische funktionelle Abhängigkeiten aufgeführt und die dazugehörigen Kurvenbilder dargestellt Auf jeder der Abbildungen sind mehrere Kurven für verschiedene Werte der in die Formeln eingehenden Parameter eingezeichnet worden. Der Einfluß der Parameterwerte auf die Form der Kurven wird in den folgenden Abschnitten untersucht. Bei der Auswahl einer geeigneten Funktion ist zu berücksichtigen, daß meist nur ein Teil der dazugehörigen Kurve zur Reproduktion der empirischen Daten benötigt wird, und zwar meist beschränkt auf ein bestimmtes Intervall der unabhängigen Variablen Daher wäre es z B falsch anzunehmen, die Formel y = ax2 + bx + c ist nur dann gut geeignet, wenn die Kurve der empirischen Daten ein Maximum oder Minimum besitzt 2.16.2.1 Potenzfunktionen 1. Typ y = axb: Typische Kurvenverläufe für unterschiedliche Varianten des Exponenten b von y = axb B 255a) zeigt die Abb.2.80. In Abb.2.15, S 65, Abb.2.21, S. 70, Abb.2.24, S 72, Abb.2.25, S 72 und Abb.2.26, S. 73 sind die Kurven für verschiedenen Varianten des Exponenten dargestellt Die Funktionen werden an Hand der Formel B.44) als Parabel n-ter Ordnung, der Formel B 45) als umgekehrte Proportionalität und der Formel B 50) als reziproke Potenzfunktion auf den Seiten 66, 70 und 71 diskutiert. Rektifiziert wird durch Logarithmieren gemäß X = loga;, Y = \ogy. Y = \oga + bX. B 255b) 2. Typ y = axb + c: Die Formel y = axb + c B.256a) liefert die gleichen Kurven wie B.255a), aber in ^/-Richtung um c verschoben (Abb.2.82). Wenn b gegeben ist, dann wird rektifiziert gemäß X = x\ Y = y. Y = aX + c B.256b) Ist b unbekannt, dann wird zunächst c bestimmt und danach gemäß X = log:r, Y = \og(y-c) Y = \oga + bX B 256c) rektifiziert Zur Bestimmung von c werden drei Punkte mit den Abszissen- und Ordinatenwerten x\, X2 2 beliebig, x$ = Jx\X2 und 2/1,2/2,2/3 gewählt, so daß c = — gilt Nachdem a und b bestimmt 2/1 + 2/2 - 22/3 worden sind, kann c korrigiert und zwar als Mittelwert der Größen y — axb gewählt werden 2.16.2.2 Exponentialfunktionen 1. Typ y = a e6*: Typische Kurvenverlaufe der Funktion 2/ = aebx B 257a) zeigt die Abb.2.81. Die Diskussion der Exponentialfunktion B.54), S 72 und ihrer Kurvenverläufe (Abb.2.26) erfolgt auf S 72. Rektifiziert wird durch Logarithmieren gemäß X = x, Y = \ogy: Y = \oga + Möge • X. B.257b)
2.16 Aufstellung empirischer Kurven 111 2. Typ y — a e*™ + c: Die Formel y = aebx + c B.258a) liefert die gleichen Kurven wie B.257a), aber in y-Richtung um c verschoben (Abb.2.83). Es wird c bestimmt und durch Logarithmieren rektifiziert gemäß Y = \og(y-c), X = x: Y = loga + Möge • X. B.258b) Zur Bestimmung von c werden drei Punkte mit den Abszissen- und Ordinatenwerten x\, x2 beliebig, x3 Xi +X2 und ?/i, ?/25 2/3 gewählt, so daß c = 2/12/2- 2/i + 2/2 - 2y3 kann c nachträglich als Mittelwert der Größen y — ae6* erneut bestimmt werden yf y gilt Nach der Bestimmung von a und b Abbildung 2.80 Abbildung 2.81 Abbildung 2.82 Abbildung 2.83 Abbildung 2.84 2.16.2.3 Quadratisches Polynom Mögliche Kurvenverlaufe des quadratischen Polynoms y = ax2 + bx + c B 259a) zeigt die Abb.2.84. Die Diskussion des quadratischen Polynoms B.41) und seiner Kurven (Abb.2.12), S 64 Die Koeffizienten a, b und c werden in der Regel nach der Fehlerquadrat methode bestimmt, aber auch hier ist eine Rektifizierung möglich Nach der Wahl irgendeines Datenpunktes (xi, y\) wird rektifiziert gemäß '-2/1 , X ¦ Y = ¦ x — Xi Y = (b + axi) + aX. B 259b)
112 2 Funktionen und ihre Darstellung Bilden die gegebenen x-Werte eine arithmetische Folge mit der Differenz /i, so rektifiziert man gemäß Y = Ay, X = x Y = {bh + ah2) + 2ahX B 259c) In beiden Fällen wird nach der Ermittlung von a und b aus der Gleichung 5> = aX>2 + &X> + nc B 259d) c berechnet, wobei n die Anzahl der gegebenen x-Werte ist, über die summiert wird 2.16.2.4 Gebrochenlineare Funktion Die gebrochenlineare Funktion wird in 2.4, S 66 auf der Grundlage von Gleichung B 46) und an Hand der Abb.2.17, S 66 besprochen Nach der Wahl irgendeines Datenpunktes (xi,y\) wird gemäß Y = x — x\ X = x Y = A + BX B 260b) 2/-2/1 rektifiziert. Nach der Bestimmung von A und B wiid die gewonnene Formel in der Form B 260c) hingeschrieben. Manchmal reicht anstelle von B.260a) auch die Form B 260d) 1 ' = 2/i + ¦Xi A + Bx B.260c) ex + d oder ex + d B 260d) 11 x Dann wird X = - und Y — - rektifiziert oder X = x und Y — — im ersten Falle und X = x sowie x y y Y — - im zweiten. 2/ 2.16.2.5 Quadratwurzel aus einem quadratischen Polynom Mehrere mögliche Kurvenverlaufe der Gleichung y2 = ax2 + bx + c B 261) sind in Abb.2.85 dargestellt Die Diskussion der Funktion B 52) und ihrer Kurvenverläufe (Abb.2.23) erfolgt auf S 71 Wenn die neue Variable Y = y2 eingeführt wird, dann läßt sich die weitere Rechnung auf den Fall 2 16 2 3, S 111 des quadratischen Polynoms zurückführen Abbildung 2.85 Abbildung 2 86
2.16 Aufstellung empirischer Kurven 113 2.16.2.6 Verallgemeinerte Gaußsche Glockenkurve Typische Kurvenverläufe der Funktion dieses Typs y = aebx+cx2 oder log y = log a + bx log e + ex2 log e B.262) sind in Abb.2.86 dargestellt. Die Diskussion erfolgt auf der Grundlage von Gleichung von B.61) und an Hand der Abb.2.31, S. 75. Die Bestimmung der Parameter kann durch Einführung der neuen Variablen Y = logy auf den Fall 2.16 2.3 des quadratischen Polynoms zurückgeführt werden. 2.16.2.7 Kurve 3. Ordnung, Typ II Mögliche Kurvenverläufe der Funktion dieses Typs V = o \ B-263) ax2 + bx + c v ; sind in Abb.2.87 dargestellt. Die Diskussion erfolgt auf der Grundlage von Gleichung B.48) und an HandvonAbb.2.19, S. 67. Durch Einführung einer neuen Veränderlichen Y = - kann die Aufgabe auf den Fall 2 16.2.3 des qua- y dratischen Polynoms zurückgeführt werden. Abbildung 2.87 Abbildung 2.88 2.16.2.8 Kurve 3. Ordnung, Typ III Typische Kurvenverläufe der Funktion dieses Typs V = -^-4 B-264) y ax2 + bx + c K J sind in Abb.2.88 dargestellt. Die Diskussion erfolgt auf der Grundlage von Gleichung B.49) und an Hand von Abb.2.20, S. 69. Durch Einführung der neuen Variablen Y = — kann die Aufgabe auf den Fall 2.16.2.3 des quadratischen y Polynoms zurückgeführt werden. 2.16.2.9 Kurve 3. Ordnung, Typ I Typische Kurvenverläufe der Funktion dieses Typs b c ¦a+ - + — x x2 B.265)
114 2. Funktionen und ihre Darstellung sind in Abb.2.89 dargestellt. Die Diskussion erfolgt auf der Grundlage von Gleichung B.47) und an HandvonAbb.2.18, S. 67. Durch Einführung der neuen Variablen X = — kann die Aufgabe auf den Fall des quadratischen Poly- x noms 2 16 2 3, S. 111 zurückgeführt werden Abbildung 2 89 Abbildung 2.90 2.16.2.10 Produkt aus Potenz- und Exponentialfunktion Typische Kurvenverläufe der Funktion dieses Typs y = axbecx B 266a) sind in Abb.2.90 dargestellt. Die Diskussion erfolgt auf der Grundlage von Gleichung B.62) und an Hand von (Abb.2.31), S 75 Wenn die empirischen x-Werte eine arithmetische Folge mit der Differenz h bilden, dann wird gemäß Y = A\ogy, X = Alogx: Y = hc\oge + bX B.266b) rektifiziert Dabei wird mit A log y bzw. A log x die Differenz zweier aufeinanderfolgender Werte von log y bzw log x bezeichnet Bilden jedoch die x-Werte eine geometrische Folge mit dem Quotienten q, dann erfolgt die Rektifizierung gemäß X = x, Y = Alogy Y = b\ogq + c(q-l)X\oge B 266c) Nachdem b und c bestimmt sind, wird die gegebene Gleichung logarithmiert, um loga ebenso zu bestimmen wie in B 259d) Wenn die gegebenen x-Werte keine geometrische Folge bilden, sich aber jeweils zwei x-Werte so auswählen lassen, daß ihr Quotient den konstanten Wert q ergibt, dann gilt für die Rektifizierung die gleiche Formel wie im Falle einer geometrischen Folge der x-Werte, wenn Y = Ai logy gesetzt wird. Dabei ist mit Ai log y die Differenz zweier Werte von log y bezeichnet, deren zugehörige a;-Werte den konstanten Quotienten q ergeben (s vollständig durchgerechnetes Beispiel in 2.16.2.12) 2.16.2.11 Exponent ialsumme Typische Kurvenverläufe der Exponentialsumme y = aebx + cedx B 267a) sind in Abb.2.91 dargestellt Die Diskussion erfolgt auf der Grundlage von Gleichung B.60) und an Hand von Abb.2.29, S. 73. Wenn die x-Werte eine arithmetische Folge mit der Differenz h bilden und y. yu y2 irgend drei aufeinanderfolgende Werte der gegebenen Funktion sind, dann rektifiziert man gemäß * = £¦ y y y = ¦ Y = (ebh + edh)X ¦ B 267b)
2.16 Aufstellung empirischer Kurven 115 Nachdem b und d mit Hilfe dieser Gleichung bestimmt sind, wird wieder rektifiziert gemäß Y = ye-dx, X = e{b-d)x: Y = aX + c B 267c) 2.16.2.12 Vollständig durchgerechnetes Beispiel Es ist eine empirische Formel für die in der folgenden Tabelle vorgegebene Abhängigkeit zwischen x und y zu suchen. Tabelle: Zur genäherten Darstellung eines empirisch ermittelten funktionellen Zusammenhanges X 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 y 1,78 3,18 3,19 2,54 1,77 1,14 0,69 0,40 0,23 0.13 0,07 0,04 X y 0,056 0,063 0,094 0,157 0,282 0,526 1,014 2,000 3,913 7,69 15,71 30,0 AX- y 0,007 0,031 0,063 0,125 0,244 0,488 0,986 1.913 3,78 8,02 14,29 - \gx -1,000 -0,699 -0,523 -0,398 -0,301 -0,222 -0,155 -0,097 -0,046 0,000 0,041 0,079 igy 0.250 0,502 0,504 0,405 0,248 0,057 -0,161 -0,398 -0,638 -0,886 -1,155 -1,398 Algx 0,301 0,176 0,125 0,097 0,079 0,067 0,058 0,051 0,046 0,041 0,038 - Alg2/ 0,252 +0,002 -0,099 -0,157 -0,191 -0,218 -0,237 -0,240 -0,248 -0,269 -0,243 - Al lg2/ 0,252 -0,097 -0,447 -0,803 -1,134 -1,455 - - - - - - Verr 1,78 3,15 3,16 2,52 1,76 1,14 0,70 0,41 0,23 0,13 0,07 0,04 Auswahl der Näherungsfunktion: Ein Vergleich der Kurve, die auf der Grundlage der Daten in der Abb.2.92 erhalten wurde, mit bisher betrachteten Kurven zeigt, daß die Formeln B 264) oder B.266a) mit den Kurvenverläufen in Abb.2.88 und Abb.2.90 geeignet sein könnten 01 0203 04 050607 0809 1011 12 Abbildung 2 91 Abbildung 2.92 Parameterbestimmung: Nimmt man Formel B.264), dann sind A- und x zu rektifizieren Die Rech- y nung zeigt aber, daß die Abhängigkeit zwischen x und A- weit entfernt von Linearität ist. Zur Uber- y prüfung der Eignung von Formel B 266a) wird die Kurve der Abhängigkeit Alogx und Alogy für h = 0,1 erzeugt (Abb.2.93) sowie die für Ai log y und x für q = 2 (Abb.2.94) In beiden Fällen ist die Übereinstimmung mit einer Geraden ausreichend, so daß die Formel y = axbecx für die Näherung geeignet ist
116 2. Funktionen und ihre Darstellung -o,aJ Abbildung 2.93 Abbildung 2.94 Zur Bestimmung der Konstanten a, b und c wird eine lineare Abhängigkeit zwischen x und Ai log y mit der Mittelwertmethode gesucht Addition der Bedingungsgleichungen Ai log?/ = 6log 2 + ex löge in zwei Gruppen zu je drei Gleichungen führt auf -0,292 = 0,9036 + 0,2606c, -3,392 = 0,9036 + 0,6514c, woraus sich 6=1,966 und c = —7,932 ergibt. Zur Bestimmung von a werden alle Gleichungen vom Typ log y = log a+b log x+c log e-x addiert, was —2,670 = 12 log a—6,529—26,87 ergibt, so daß aus log a = 2,561 folgt a = 364. Die mit der Formel y = 364x1'966e~7'032x berechneten j/-Werte sind in der letzten Spalte der obigen Tabelle zur genäherten Darstellung als yerr angegeben. Die Fehlerquadratsumme beträgt 0,0024. Benutzt man die durch Rektifizierung gewonnenen Parameter als Startwerte zur iterativen Lösung der nichtlinearen Quadratmittelaufgabe (s. 19.6.2 4, S. 950) EiVi - ax^e0**]2 = min, dann erhält man a = 396,601 986,6 = 1,998 098, c = -8,000 0916 mit der minimalen Fehlerquadratsumme 0,000 0916. 2.17 Skalen und Funktionspapiere 2.17.1 Skalen Grundlage einer Skala ist eine Funktion y = f(x). Zu dieser Funktion konstruiert man eine Skala, indem man auf einer Kurve, z.B. einer Geraden, die Funktionswerte y als Längen abträgt, aber mit dem Argument x beziffert. Man kann somit eine Skala als eindimensionale Darstellung der Wertetabelle einer Funktion auffassen Die Skalengleichung zur Funktion y = f(x) lautet: V = l[f(x) - /(so)] • B 268) Durch xo wird der Anfangspunkt der Skala festgelegt Mit dem Maßstabsfaktor l wird berücksichtigt, daß für eine konkrete Skala nur eine bestimmte Länge zur Verfugung steht ¦ Logarithmische Skala: Für / = 10 cm und x0 = 1 lautet ihre Skalengleichung y = 10[lgx — lg 1] = lOlgx (in cm) Zur Wertetabelle 1 y = lg x | 0 I 0,30 | 0,48 | 0,60 erhält man die in der Abb.2.95 gezeigte Skala. 5 I 6 1 7 I 8 I 9 I 10 0,70 | 0,78 I 0,85 | 0,90 | 0,95 | 1
2 17 Skalen und Funktionspapiere 117 1 2 I 1 3 4 5 6789 10 1 1 1 1 1 1 1 1 Abbildung 2 95 ¦ Rechenschieber: Ihre wichtigste Anwendung, historisch gesehen, fand die logarithmische Skala beim logaiithmischen Rechenschieber Bei diesem werden z B Multiplikation und Division mit Hilfe zweier logarithmischer Skalen, die den gleichen Maßstabsfaktor haben und gegeneinander verschiebbar angebracht sind, durchgeführt. Aus Abb.2.96 liest man ab y3 = yi + y2 , d h lgx3 = \gx\ + lg#2 = lg^1^2 , also X3 = x\ • £2 ; Vi — 2/3-2/2, dh lgxi =lgx3- ¦ lg #2 = lg — , also £1 Z2 £3 £2 10 yi -'t :¦*•¦; r| 1 1; , • 1, ,.v,...,. T..T._iS.,1P v s y2 TT^hsriii:.!^ x2 } ¦' l (i .,,;..ki::.i: sattes 10 •;.'Srrf <,'i" ^ ¦*' r^fW'; >^>^ff-fnr'"T1 y3 Abbildung 2 96 ¦ Volumenskala aufeinem kegelförmigen Meßbecher Auf dem Mantel eines Trichters ist eine Skala zum Ablesen des Volumens anzubringen. Die Maße des Trichters seien Höhe H = 15 cm, Durchmesser D = 10 cm Mit Hilfe der Abb.2.97a läßt sich die Skalengleichung wie folgt herleiten: Volumen V = r2irh, Mantellinie s = sjh2 + r2 , tan a r _ D/2 h " IT >/lÖ3/; Daraus folgt /i = 3r, 5 = r\/lÖ, V = .— , so daß sich die Skalengleichung s = -^=- \/V « 2, löv^ ergibt Mit Hilfe der Wertetabelle (>/IÖK ^F V I 0 I 50 100 150 I 200 I 250 I 300 350 sJO [7,96 I 10,03 I 11,48 | 12,63 | 13,61 | 14,46 erhält man dann die Markierung auf dem Trichter gemäß Abb.2.97b D ^ " -300 15,22 y< 40 30 20 10 4 3 2 k 0 . 5 1 0 1 5 2 0 2 5 x i b) Abbildung 2.97 Abbildung 2.98
118 2. Funktionen und ihre Darstellung 2.17.2 Funktionspapiere Die gebräuchlichsten Funktionspapiere entstehen dadurch, daß die Achsen eines rechtwinkligen Koordinatensystems Skalen sind mit den Skalengleichungen x = l1[f(u)-f(u0)]1 y = h[f{v)-f(yQ)\ B 269) Dabei sind l\ und I2 Maßstabsfaktoren; uq und vq sind die Anfangspunkte der Skalen. 2.17.2.1 Einfach-logarithmisches Funktionspapier Ist die x-Achse gleichabständig unterteilt, die y-Achse jedoch logarithmisch, dann spricht man vom einfach-logarithmischen Funktionspapier oder vom einfach-logarithmischen Koordinatensystem. 1. Skalengleichungen x = li[u — uo] (lineare Skala), y = l2[\gv — \gv0] (logaritmische Skala). B.270) Die Abb.2.98 zeigt ein Beispiel für einfach-logarithmisches Papier. 2. Darstellung von Exponentialfunktionen Auf einfach-logarithmischem Papier werden Exponentialfunktionen der Form y = aeßx (a, ß const) B 271a) als Geraden dargestellt (s Rektifizierung, 2.16.2.2, S 110). Diese Eigenschaft wird wie folgt ausgenutzt Liegen Meßpunkte, wenn sie in einfach-logarithmischem Papier eingetragen worden sind, annähernd auf einer Geraden, dann kann zwischen den Variablen ein Zusammenhang der Form B 271a) angenommen werden. Mit Hilfe dieser Geraden, die nach Augenmaß durch die Meßpunkte gelegt wird, kann man Näherungswerte für die Parameter a undß bestimmen: Liest man zwei Punkte P\(x\, y{) und P2(^2,2/2) auf dieser Geraden ab, dann erhält man lnK-lnyx ^ ^ ß q = ßxi X2-X1 2.17.2.2 Doppelt—logarithmisches Funktionspapier Wenn beide Achsen eines rechtwinkligen x, y-Koordinatensystems logarithmisch unterteilt sind, dann spricht man vom doppelt-logarithmischen Funktionspapier oder vom doppelt-logarithmischen Koordinatensystem. 1. Skalengleichungen Die Skalengleichungen lauten x = h[\gu- lg wo], y = fepg v - lg vo], B.272) wobei liJ2 Maßstabsfaktoren sind und uQ, v0 Anfangspunkte. 2. Darstellung von Potenzfunktionen (s 2 5.3, S. 71) In doppelt-logarithmischem Papaier, das analog zum einfach-logarithmischen Papier aufgebaut ist, aber eine logarithmisch unterteilte x-Achse hat, werden Potenzfunktionen der Form y = axß (a, ß const) B 273) als Geraden dargestellt (s. Rektifizierung einer Potenzfunktion, 2.16.2 1, S. 110) Diese Eigenschaft wird in der gleichen Weise wie beim einfach-logarithmischen Papier genutzt. 2.17.2.3 Funktionspapier mit einer reziproken Skala Die Unterteilung der zu skalierenden Koordinatenachse erfolgt mit Hilfe der Gleichung B.45) für die Funktion Umgekehrte Proportionalität (s. 2.4 1, S 66). Skalengleichung Es gilt x = li[u-uo], y = k\ (a const), B 274) IV Vo] wobei /1 und I2 Maßstabsfaktoren sind und u0 und t>o Anfangspunkte ¦ Konzentration in einer chemischen Reaktion: Bei einer chemischen Reaktion wurden für die Konzentration c = c(t), wobei mit t die Zeit bezeichnet ist, die folgenden Werte gemessen*
2.17 Skalen und Funktionspapiere 119 t/min c • 107mol/l 15,53 10 20 I 40 11,26 7,27 4,25 Es wird angenommen, daß eine Reaktion 2. Ordnung vorliegt, d.h , es soll der folgende Zusammenhang gelten: Co c(t) = 1 + c0kt (coyk const). B 275) Geht man zum Kehrwert dieser Gleichung über, dann erhält man - = —\-kt, d.h., der Zusammenhang c Co B 275) wird durch eine Gerade beschrieben, wenn in dem zugehörigen Funktionspapier die y-Achse reziprok und die x-Achse linear unterteilt ist Die Skalengleichung für die y-Achse lautet z.B.: y = 10 • — cm. v Aus der zugehörigen Abb.2.99 ist zu erkennen, daß die Meßpunkte annähernd auf einer Geraden liegen, d.h., der Zusammenhang B.275) kann bestätigt werden. Darüber hinaus kann man mit Hilfe zweier Punkte der Geraden, z.B liest man PiA0,10) und P2C0,5) ab, Näherungswerte für die beiden Parameter k (Reak- tionsgeschwindigkeits-Konstante) und cq (Anfangskonzentration) ermitteln: / 1 / 2 ~ M M..R Cq , 10 20 30 40 Abbildung 2 99 50 k = t2-tl i 0.005, t 20 • 1(T 2.17.2.4 Hinweis Es gibt noch viele andere Möglichkeiten, Funktionspapiere zu konstruieren und anzuwenden. Obwohl heute in den meisten Fällen leistungsfähige Computer zur Auswertung von Meßergebnissen zur Verfügung stehen, werden in der Laborpraxis häufig noch Funktionspapiere verwendet, um mit deren Hilfe aus einigen wenigen Meßwerten eine Aussage über funktionelle Zusammenhänge zu bekommen oder Näherungswerte für Parameter zu erhalten, die beim Einsatz von numerischen Verfahren (s nichtlineare Quadratmittelaufgaben, 19.6 2 4, S 950) als Startwerte benötigt werden
120 2 Funktionen und ihre Darstellung 2.18 Funktionen von mehreren Veränderlichen 2.18.1 Definition und Darstellung 2.18.1.1 Darstellung von Funktionen mehrerer Veränderlicher Eine veränderliche Größe u wird eine Funktion von n unabhängigen Variablen xi, x2, . ,xn genannt, wenn u für gegebene Werte der unabhängigen Veränderlichen einen eindeutig bestimmten Wert annimmt. Je nachdem, ob es sich um eine Funktion von zwei, drei oder n veränderlichen Größen handelt, schreibt man u = f{x,y), u = f(x,y,z), u = f{xux2, . ,z„) B 276) Setzt man für die n unabhängigen Variablen feste Zahlen ein, dann entsteht ein Wertesystem der Variablen, das als Punkt des n-dimensionalen Raumes (auch mehrdimensionaler Raum) interpretiert werden kann Die einzelnen unabhängigen Variablen werden auch Argumente genannt; manchmal nennt man zusammenfassend das gesamte n-Tupel der unabhängigen Variablen das Argument der Funktion Beispiele für Funktionswerte: ¦ A: u = f(x, y) = xy2 besitzt für das Wertesystem x = 2, y = 3 den Wert /B,3) = 2 • 32 = 18. ¦ B: u = /(#, y, z,t) = x \n(y — zt) nimmt für das Wertesystem x = 3, y = A, 2 = 3, t = 1 den Wert /C,4,3,l) = 31nD-3-l) = 0an 2.18.1.2 Geometrische Darstellung von Funktionen mehrerer Veränderlicher 1. Darstellung des Wertesystems der Variablen Das Wertesystem eines Arguments aus zwei Variablen x und y kann als Punkt der Ebene mit den kartesischen Koordinaten x und y dargestellt werden, einem Wertesystem aus drei Variablen x.y, z entspricht ein Punkt mit drei kartesischen Koordinaten x, y, z im dreidimensionalen Raum. Systeme aus vier und mehr Koordinaten kann man sich nicht mehr anschaulich vorstellen In Analogie zum dreidimensionalen Raum spricht man aber bei Systemen aus n Variablen x\, x2,... ,xn von einem Punkt im n-dimensionalen Raum mit den kartesischen Koordinaten X\, x2,. ,xn Im oben betrachteten Beispiel B mit vier Variablen ist das Wertesystem ein Punkt im vierdimensionalen Raum mit den Koordinaten x = 3,y = 4, z = 3 und t = 1. „, 2. Darstellung der Funktion u = f(x, y) zweier Variabler *x J a) Eine Funktion von zwei unabhängigen Veränderlichen läßt sich in Abbildung 2.100 Analogie zum ebenen Kurvenbild einer Funktion von einer unabhängigen Veränderlichen als Fläche im Raum darstellen (Abb.2.100, s auch 3 6 3 1, S 251) Dazu wird der Funktionswert u = /(x, y) senkrecht über dem Punkt (x, y) des Definitionsbereiches abgetragen. Die Endpunkte dieser Strecken bilden eine Fläche im dreidimensionalen Raum. Beispiele für Raumflächen von Funktionen: ¦ A:w=l-^-| Darstellung durch eine Ebene (Abb.2.101a, s. auch 3 5 3.6, S. 220). i i x y ¦ B: u = — + — Darstellung durch ein elliptisches Paraboloid (Abb.2.101b, s auch 3 5 3 6,5., S. 228). ¦ C: u — y 16 — x2 — y2 Darstellung durch eine Halbkugel mit dem Radius r = 4 (Abb.2.101c). b) Das Bild der Funktion u = f(x, y) kann auch mit Hilfe von Schnittkurven ermittelt werden, die durch Schnitte parallel zu den Koordinatenebenen entstehen. Die Schnittkurven u = const werden
2 18 Funktionen von mehreren Veränderlichen 121 auch Höhenlinie oder Niveaulinien genannt ¦ In den Abb.2.101b,c sind die Höhenlinien konzentrische Kreise (nicht eingezeichnet). Hinweis: Funktionen mit Argumenten aus drei oder mehr Variablen können nicht mehr im dreidimensionalen Raum dargestellt werden. Ausgehend von der Fläche im dreidimensionalen Raum wird in Analogie dazu der Begriff der Hyperfläche im n-dimensionalen Raum gebraucht U4 Abbildung 2 101 2.18.2 Verschiedene ebene Definitionsbereiche 2.18.2.1 Definitionsbereich einer durch eine Menge gegebenen Funktion De finitionsbereich einer Funktion wird die Menge der Wertesysteme oder Punkte genannt, die bei der betrachteten Funktion von den Variablen des Arguments durchlaufen werden können Die sich so ergebenden Definitionsbereiche können sehr unterschiedlich sein. Meistens treten beschränkte oder unbeschränkte zusammenhängende Punktmengen auf In Abhängigkeit davon, ob der Rand mit zum Definitionsbereich gehört oder nicht, ist dieser abgeschlossen oder offen Eine offene zusammenhängende Punktmenge wird Gebiet genannt. Wenn der Rand in ein Gebiet einbezogen ist, dann handelt es sich um ein abgeschlossenes Gebiet, ist dies nicht der Fall, und soll der Anschluß des Randes besonders betont werden, dann wird vom offenen Gebiet gesprochen 2.18.2.2 Zweidimensionale Gebiete Die Abb.2.102 zeigt die einfachsten Fälle zusammenhängender Punktmengen mit zwei Veränderlichen und deren Bezeichnung. Gebiete sind hier schraffiert dargestellt, abgeschlossene Gebiete, also Gebiete, deren Rand in die Punktmenge des Definitionsbereiches einbezogen ist, sind durch ausgezogene Kurven um das Gebiet gekennzeichnet, offene Gebiete durch gestrichelt gezeichnete Kurven. Einschließlich der gesamten Ebene handelt es sich in allen Fällen der Abb.2.102 um einfach zusammenhängende Gebiete 2.18.2.3 Drei- und mehrdimensionale Gebiete werden analog zum zweidimensionalen Fall behandelt. Das betrifft auch die Unterscheidung zwischen einfach und mehrfach zusammenhängenden Gebieten Funktionen von mehr als drei Veränderlichen werden in den entsprechenden n-dimensionalen Räumen geometrisch gedeutet 2.18.2.4 Methoden zur Definition einer Funktion 1. Definition mittels Tabelle Funktionen von mehreren Veränderlichen können mit Hilfe von Wertetabellen definiert werden. Ein Beispiel für Funktionen von zwei unabhängigen Veränderlichen sind die Wertetabellen der elliptischen Integrale (s. 21 9, S. 1091). Dort sind die Werte der unabhängigen Variablen am oberen und linken Rand der Tabelle eingetragen. Ein gesuchter Funktionswert kann als Schnittpunkt der zugehörigen Zeilen und Spalten aufgesucht werden. Man spricht von Tabellen mit doppeltem Eingang 2. Definition mittels Formeln Funktionen von mehreren Veränderlichen lassen sich auch durch eine oder mehrere Formeln definieren ( x + v für ic > 0 y > 0 ¦ A: u = xy2 , = I x _ y für x > 0 \ y < 0 ' ¦ B: u = x \n{y - zt), : W | -x + ^ für x < 0 , y > 0 , l —x — y für x < 0 , y < 0.
122 2. Funktionen und ihre Darstellung gesamte Ebene unbeschränktes abgeschlossenes iet beschränktes abgeschlossenes Gebiet unbeschränktes offenes Gebiet Abbildung 2 102 3. Definitionsbereich einer durch eine Formel gegebenen Funktion In der Analysis werden meistens Funktionen betrachtet, die mit Hilfe von Formeln definiert sind Dabei werden alle die Wertesysteme der unabhängigen Variablen in den Definitionsbereich einbezogen, für die der analytische Ausdruck der Funktion Sinn hat, d.h. für die er eindeutig bestimmte endliche und reelle Werte annimmt. Beispiele für Definitionsbereiche: Abbildung 2.103 A: u - xz + B: u = y2 Der Definitionsbereich ist die gesamte Ebene, 1 y/W- Den Definitionsbereich bilden alle Wertesysteme x, y, die die Ungleichung x2 + y2 < 16 erfüllen. Geometrisch betrachtet stellt dieser Definitionsbereich das in Abb.2.103a dargestellte offene Gebiet im Innern eines Kreises dar. ¦ C: u = arcsin(x + y): Den Definitionsbereich bilden alle Wertesysteme x, y, die die Ungleichung — 1 < x + y < +1 erfüllen, d h , der Definitionsbereich ist ein abgeschlossenes Gebiet, das aus einem Streifen zwischen zwei parallelen Geraden besteht (Abb.2.103b) ¦ D: u = aresinBx — 1) + y/l — y'2 + y/y + In z. Der Definitionsbereich besteht aus allen Wertesystemen, die die Ungleichungen 0 < x < 1, 0 < y < 1,2;>0 erfüllen, d.h., er besteht aus allen Punkten, die über einem Quadrat mit der Seitenlänge 1 gelegen sind (Abb.2.103c)
2 18 Funktionen von mehreren Veränderlichen 123 gesamte Ebene mit Ausnahme des Punktes A, unbeschränktes Y zweifach zusam menhängend( Gebiet beschränktes zweifach zusammenhängendes Gebiet Abbildung 2 104 dreifach zusam- Y| menhängendes Gebiet vierfach zusammenhängendes Gebiet mehrfach sammenhängendes Gebiet 01 Abbildung 2.105 Wenn im Innern eines betrachteten Ebenenstücks ein Punkt oder eine beschränkte, einfach zusammenhängende Punktmenge aus dem Definitionsbereich ausgeschlossen ist, wie es die Abb.2.104 zeigt, dann wird von einem zweifach zusammenhängenden Gebiet gesprochen Mehrfach zusammenhängende Gebiete sind in Abb.2.105 dargestellt. Ein nicht zusammenhängendes Gebiet zeigt die Abb.2.106. Abbildung 2 106 2.18.2.5 Formen der analytischen Darstellung einer Funktion Funktionen von mehreren Veränderlichen können ebenso wie Funktionen von einer Veränderlichen auf verschiedene Weise angegeben werden 1. Explizite Darstellung Eine Funktion ist explizit dargestellt oder definiert, wenn sie durch ihre unabhängigen Variablen ausgedrückt werden kann u = f{xux2i ,i„) B.277) 2. Implizite Darstellung Eine Funktion ist implizit dargestellt oder definiert, wenn die Argumente und die Funktion durch eine Gleichung der folgenden Art miteinander verknüpft sind: F(xi,X2,. . ,£n,it) = 0. Dabei wird vorausgesetzt, daß es zu jedem Wertesystem X\, x2, B 278) gilt. 3. Parameterdar Stellung Eine Funktion ist in Parameterform dargestellt, wenn die n Argumente und die Funktion durch n neue Veränderliche, die Parameter, explizit ausgedrückt sind, so daß für eine Funktion zweier Veränderlicher gilt x = <p(r,s), y = ip(r,s), u = x(r, s), B.279a) für eine Funktion dreier Veränderlicher x = (p(r,s,t), y = ip(r,s,t), z = x(r, <M), u = K,(r,s,t) B.279b) B.278) , xn genau einen u-Wert gibt, so daß
124 2. Funktionen und ihre Darstellung usw. 4. Homogene Funktion Eine Funktion /(xi, X2,. , xn) von mehreren Veränderlichen wird homogene Funktion genannt, wenn sie die Bedingung f{\xu\x2,..-., Xxn) = Am/(xi, x2, , xn) B 280) für beliebige A erfüllt Die Zahl m wird Homogenitätsgrad genannt ¦ A: u(x, y) — x2 — 3xy + y + x\jxy H , d h., der Homogenitätsgrad ist m = 2 x -\- z ¦ B: u(x,y) = — , d h , der Homogenitätsgrad ist m = 0 2x — oy 2.18.2.6 Abhängigkeit von Funktionen 1. Spezieller Fall zweier Funktionen Zwei Funktionen zweier Veränderlicher u = f(x,y) und v = ip(x,y), die beide in demselben Gebiet definiert sind, werden als abhängige Funktionen bezeichnet, wenn die eine durch die andere gemäß u = F(v) ausgedrückt werden kann. Für jeden Punkt des Definitionsbereiches gilt dann die Identität f{x,y) = F{tp(x,y)) oder $(/>¥>) = 0. B 281) Existiert keine solche Funktion F(<p) oder $(/, ip), dann spricht man von unabhängigen Funktionen. ¦ u(x,y) = (x2 + y2J , v = y/x2 + y2 , definiert im Gebiet x2 -\-y2 > 0 , sind abhängige Funktionen, da u — vA gilt. 2. Allgemeiner Fall mehrerer Funktionen In Analogie zum Fall zweier Funktionen gilt, daß m Funktionen wl5 ii2,... ,um von ™ Veränderlichen Xi, X2, ,xn in einem gemeinsamen Definitionsbereich abhängig sind, wenn irgendeine von ihnen als Funktion der übrigen ausdrückbar ist, d.h , wenn es für jeden Punkt des Gebietes eine Identität der Art U{ = f(ui,U2,. . ,iii_i,iij+i,..., um) oder $(ui,ti2,- ,um) = 0 B 282) gibt. Wenn keine solche Funktion existiert, dann spricht man von unabhängigen Funktionen ¦ Die Funktionen u = X\ + x2 + • • • + xn, v = X\2 + X22 + • • • + xn2 und w = X\X2 + X1X3 + • • • + Xixn + x2x3 + • • • + xn_ixn sind abhängig, da v = u2 — 2w gilt. 3. Analytische.Bedingung für die Unabhängigkeit Im Falle zweier Funktionen u = /(x, y) und v = <p(x, y) darf ihre Funktionaldetermmante abgekürzt ^4 oder ^4, B.283a) in dem betrachteten Gebiet nicht identisch verschwinden Analog gilt im Fall von n Funktionen mit n ££t":£)*°- B-283b) df dx dtp dx df dy dtp dy Veränderlichen u\ dh dx\ dh dx\ dfn dxi dh dx2 dh dx2 dfn dx2 = /i(^i, dh dxn dh_ dxn dfn dxn
2.18 Funktionen von mehreren Veränderlichen 125 Wenn die Anzahl m der Funktionen u\, u2, .,«m kleiner ist als die Anzahl n der Veränderlichen x\, x2, ..., xn, dann sind diese Funktionen unabhängig, sofern wenigstens eine Unterdeterminante m-ter Ordnung der Matrix B.283c) nicht verschwindet dxi du2 dx\ dui dx2 du2 dx2 OUi dxn du2 dxn B.283c) dum dum dun, \ dxi dx2 dxn ) Die Anzahl der unabhängigen Funktionen ist gleich dem Rang r der Matrix B.283c), (s 4 1 4,7., S. 264). Hierbei werden diejenigen Funktionen unabhängig sein, deren Ableitung als Elemente in der nicht identisch verschwindenden Unterdeterminante r-ter Ordnung stehen Wenn m > n ist, dann können von den gegebenen m Funktionen höchstens n unabhängig sein. 2.18.3 Grenzwerte 2.18.3.1 Definition Eine Funktion von zwei Veränderlichen u = f(x,y) besitzt einen Grenzwert A für das Wertesystem x = a,y = b, wenn sich die Funktion f(x, y) bei beliebiger Annäherung von x gegen a und von y gegen b dem Wert A beliebig nähert. Man schreibt dann: Kmf(x,y) = A. B.284) a-r| a a+rj Abbildung 2 107 Dabei braucht die Funktion für das Wertesystem x = a, y = 6, d h. im Punkt (a, b) selbst, den Wert A weder anzunehmen noch definiert zu sein. 2.18.3.2 Exakte Formulierung Eine Funktion von zwei Veränderlichen u = f(x,y) besitzt einen Grenzwert A = lim f(x,y), wenn sich nach Vorgabe einer beliebig kleinen positiven Zahl s eine zweite positive Zahl rj angeben läßt (Abb.2.107),sodaßgilt \f(x,y)-A\<e B.285a) für alle Punkte (x, y) des Quadrates |z-a|<77, \y-b\<n. B.285b) 2.18.3.3 Verallgemeinerung auf mehrere Veränderliche a) Der Begriff des Grenzwertes einer Funktion von mehreren Veränderlichen wird analog zum Fall der Funktion von zwei Veränderlichen definiert. b) Kriterien für die Existenz eines Grenzwertes einer Funktion von mehreren Veränderlichen erhält man durch Verallgemeinerung der Kriterien, die für Funktionen von einer Veränderlichen gelten, d h durch Zurückführung auf den Grenzwert einer Folge sowie über das Konvergenzkriterium von CAUCHY (s 2 1 4 3, S 53) 2.18.3.4 Iterierte Grenzwerte Wenn für eine Funktion zweier Veränderlicher /(x, y) zuerst der Grenzwert für x —> a, d.h. lim /(x, y) für konstantes y bestimmt wird und darauf von der so gewonnenen Funktion, die dann nur noch von y abhängt, der Grenzwert y —* b gebildet wird, dann heißt die gefundene Zahl ß = lim[lim/(x,j/)] B.286a)
126 2 Funktionen und ihre Darstellung ein iterierter Grenzwert. Eine Änderung der Reihenfolge liefert in der Regel einen anderen Grenzwert C= lim [lim f{x,y)]. B 286b) x—+a y—tb Im allgemeinen ist D ^ C, auch wenn beide Grenzwerte existieren. ¦ Die Funktion fix, y) = X ~ V0 + Xn + y liefert für z -> 0, y -? 0 die Werte B = -1 und C = +1. xl + 2/ Wenn jedoch die Funktion f(x, y) einen Grenzwert A = lim f(x, y) besitzt und die Grenzwerte B und C existieren, dann ist B = C = A Aus der Gleichheit der Grenzwerte B = C folgt aber noch nicht die Existenz des Grenzwertes A . 2.18.4 Stetigkeit Eine Funktion von zwei Veränderlichen f(x, y) wird an der Stelle x = a, y = b, d h. im Punkt (a, b), stetig genannt, wenn 1. der Punkt (a, b) dem Definitionsbereich der Funktion angehört und wenn 2 der Grenzwert für x —? a, y —> 6 existiert und lim/(a;>i/) = /(a,&) B 287) ist. Anderenfalls besitzt die Funktion an der Stelle x = a,y = b eine Unstet igkeit Wenn eine Funktion in allen Punkten eines zusammenhängenden Gebietes definiert und stetig ist, dann wird sie stetig in diesem Gebiet genannt. In Analogie dazu wird die Stetigkeit einer Funktion von mehr als zwei Veränderlichen definiert 2.18.5 Eigenschaften stetiger Funktionen 2.18.5.1 Nullstellensatz von Bolzano Wenn eine Funktion f(x,y) in einem zusammenhängenden Gebiet definiert und stetig ist und wenn in zwei verschiedenen Punkten (x\,yi) und (#2,2/2) dieses Gebietes die zugehörigen Funktionswerte unterschiedliche Vorzeichen besitzen, dann existiert mindestens ein Punkt (£3,2/3) in diesem Gebiet, für den f(x,y) Null wird /(*3,2/3) = 0, wenn f(xuVl)>0 und f(x2,y2)<0 B 288) 2.18.5.2 Zwischenwertsatz Wenn eine Funktion f(x,y) in einem zusammenhängenden Gebiet definiert und stetig ist und wenn sie in zwei Punkten (xj,2/i) und (#2,2/2) verschiedene Werte A = /(#i,2/i) und B = /(x2,2/2) annimmt, dann gibt es für jede Zahl C, die zwischen A und B liegt, einen Punkt (x3,2/3) derart, daß gilt: f(x3l 2/3) = C, A < C < B oder B < C < A B 289) 2.18.5.3 Satz über die Beschränktheit einer Funktion Wenn eine Funktion f(x,y) in einem abgeschlossenen beschränkten Gebiet stetig ist, dann ist sie in diesem Gebiet auch beschränkt, d h , es existieren zwei Zahlen m und M derart, daß für jeden Punkt (aj, y) in diesem Gebiet gilt m<f(x,y) < M. B.290) 2.18.5.4 Satz von Weierstrass über die Existenz des größten und kleinsten Funkt ions wert es Wenn eine Funktion /(#, y) in einem abgeschlossenen und beschränkten Gebiet stetig ist, dann existiert in diesem Gebiet mindestens ein Punkt (x',yr) derart, daß der Wert f{x',y') größer als alle übrigen Werte von f(x, y) in diesem Gebiet ist. Außerdem existiert dann mindestens ein Punkt (x", y"), für den der Wert f(x", y") kleiner als alle übrigen Werte von /(x, y) in diesem Gebiet ist Für einen beliebigen Punkt (x, y) dieses Gebietes gilt f(x',y')>f(x,y)>f(x",y"). B.291)
2.19 Nomographie 127 2.19 Nomographie 2.19.1 Nomogramme Nomogramme oder Rechenblätter sind graphische Darstellungen für einen funktionalen Zusammenhang zwischen drei oder auch mehr Variablen. Aus einem Nomogramm lassen sich für einen bestimmten Formeltyp, der in der Regel in Form einer Gleichung, der sogenannten Schlüsselgleichung, vorliegt, die fertigen Resultate für einen bestimmten Bereich der Veränderlichen ablesen. Wichtige Beispiele für Nomogramme sind Netztafeln und Fluchtlinientafeln. Nomogramme werden auch im Zeitalter der Computer in der Labor- und Ingenieurpraxis verwendet, z B zur Gewinnung von Näherungswerten, die für den Start genauerer Rechnungen benötigt werden. 2.19.2 Netztafeln Soll ein Zusammenhang dargestellt werden, der sich durch die Gleichung F(x,y,z) = Q B.292) (in vielen Fällen auch explizit durch z = f(x, y)) beschreiben läßt, so kann man die Variablen als Koordinaten im Raum ansehen. Durch B.292) wird dann eine Fläche beschrieben, die durch ihre Höhenoder Niveaulinien (s. 2.18 1.2, S. 121) anschaulich dargestellt werden kann. Jeder der drei Variablen entspricht dann eine Kurvenschar, die zusammen ein Netz bilden: die Variablen x und y werden durch achsenparallele Geraden, die Variable z wird durch die Schar der Höhenlinien dargestellt. ¦ Das Ohmsche Gesetz lautet U = R-I Die Spannung U läßt sich als Funktion von zwei Variablen mit Hilfe ihrer Niveaulinien darstellen. Wählt man R und / als kartesische Koordinaten, dann entspricht jedem Wert U = const eine Hyperbel (Abb.2.108). Aus der Abbildung kann man zu jedem Wertepaar R, I das zugehörige U ablesen, aber auch zu jedem R, U ein / und zu jedem /, U ein R Dabei ist stets der Bereich der einzelnen Variablen zu beachten In Abb. 2.108 gilt 0<JR<10,0</<10 und 0 < U < 100 Abbildung 2.108 Abbildung 2.109 Hinweise: 1. Durch Änderung der Bezifferung kann ein Nomogramm auch für andere Bereiche benutzt werden. Soll z B. in Abb.2.108 der Bereich 0 < I < 1 dargestellt werden, aber R seine Bezifferung behalten, dann sind die Hyperbeln anstelle von U mit U/10 zu beziffern. 2. Durch Anwendung von Skalen (s. 2.17.1, S. 116) gelingt es häufig, Nomogramme mit schwierig zu
128 2. Funktionen und ihre Darstellung zeichnenden Kurven in sogenannte geradlinige Netzetafeln umzuwandeln. Bei Benutzung gleichmäßiger Skalen auf der x- und y-Achse läßt sich jede Gleichung der Form x<p{z) + yip{z) + x(z) = 0 B 293) durch ein Nomogramm mit Geraden darstellen. Verwendet man Funktionsskalen x = ffa) y — 9(^2), dann wird jede Gleichung der Form /B2M21) + g(z2)'ip(z1) + xizi) = 0 B 294) für die Variablen z\, 22 und z% durch zwei Scharen achsenparalleler Geraden und durch eine beliebige Geradenschar wiedergegeben ¦ Durch Anwendung von logarithmischen Skalen (s 2 17 1, S 116) läßt sich das OHMsche Gesetz durch ein geradliniges Nomogramm wiedergeben. Durch Logarithmieren von R • I = U erhält man log R + log / = log U . Setzt man x = log R und y = log / , dann ergibt sich x + y = log U, d h eine spezielle Form von B 294) Das dazugehörige Nomogramm zeigt die Abb.2.109 2.19.3 Fluchtlinientafeln Eine Möglichkeit, eine Beziehung zwischen den drei Variablen z\, z2 und z3 zu vertäfeln, besteht darin, für jede der drei Vriablen eine Skala (s. 2.17.1, S 116) herzustellen Die 2^-Skala habe die Gleichung xx = tpiizi^yi = 4>i(zi) (i = 1,2,3) B 295) Die Funktionen ipi und ^ werden so gewählt, daß die Werte der drei Variablen Z\,z2 und z3, die die Nomogrammgleichung erfüllen, auf einer Geraden liegen, also fiuchtrechte Punkte sind Die Bedingung dafür ist, daß das von den drei Punkten (xi, 2/1), (x2, #2) und (#3,2/3) aufgespannte Dreieck den Flächeninhalt Null hat (s. C 300),S 199), dh es muß gelten xi Vi 1 X2 V2 1 £3 V3 1 = <Pi(zi) il>i(zi) 1 ^2(^2) ^2(^2) 1 ^3B3) ^3(^3) 1 : 0 B.296) Jede Beziehung zwischen drei Variablen zi, Z2 und 23 , die sich auf die Form B 296) bringen läßt, kann durch ein Fluchtlinien-Nomogramm dargestellt werden. Im folgenden werden einige wichtige Spezialfälle von B.296) beschrieben 2.19.3.1 Fluchtlinientafein mit drei geraden Skalen durch einen Punkt Wählt man den Nullpunkt als gemeinsamen Punkt der drei Geraden, die die drei Skalen füi z\, z2 bzw. 23 tragen, dann geht B 296) in \<Pi(zi) mi<pi(zi) II ^2B2) m2(f2{z2) 1 |</?3B3) ^3^3B3) l| über, da die Gleichung einer Geraden durch den Nullpunkt mit y = mx beschrieben werden kann. Rechnet man die Determinante in B 297) aus, dann erhält man m2-m3 + m3-m1+m1-m2=0 B ^ : 0 B 297) oder <Pi(zi) ^2(^2) ^3B3) C\ 02 C'K = 0 mit Cx + C2 + C3 = 0 . B 298b) <Pi{zi) ^2(^2) ^3(^3) Dabei sind die Größen Ci, C2 und C3 Konstanten. 112 ¦ Die Gleichung - + - = — stellt einen Spezialfall von B.298b) dar und kommt z.B in der Optik oder a b f beim Parallelschalten von Widerständen vor Das zugehörige Fluchtlinien-Nomogramm würde dann aus drei gleichmäßig unterteilten Skalen bestehen.
2.19 Nomographie 129 : 0 B.299) 2.19.3.2 Fluchtlinientafeln mit zwei parallelen und einer dazu geneigten geradlinigen Skala Eine der parallelen Skalen wird auf die y-Achse gelegt, die andere auf eine Parallele dazu im Abstand d Die dritte Skala wird auf der Geraden y = mx angebracht In diesem Fall geht B.296) in 0 W*i)l| d i>2(z2) 1 |y>3B3) rn(p3{z3) l| über. Entwicklung der Determinante nach der ersten Spalte ergibt d[m<p3(zs) - ViBi)] + <pM)[M*i) ~ M^)] =0- B.300a) Daraus folgt W*i) ^lt~) d - I^fe) -md]=0 oder f(Zl) • g(z3) - h(z2) = 0 B.300b) Häufig ist es zweckmäßig Maßstäbe Ei und E2 in der Form £i/(*i)|?0(*3) - E2h(z2) = 0. , B.300c) einzuführen Es gilt dann ^>3{z3) = g? . Das Verhältnis E2 : Ei kann man so wählen, daß die dritte Skala an einer bestimmten Stelle auseinandergezogen oder zusammengedrängt wird Setzt man m = 0, dann gilt E2h(z2) = ip2{z2), und der Träger der dritten Skala geht in diesem Fall nicht nur durch den Anfangspunkt der ersten, sondern auch durch den der zweiten Demzufolge muß man diese beiden so legen, daß sie in entgegengesetzter Richtung laufen, wenn man die dritte im wesentlichen zwischen den beiden Parallelen haben will. ¦ Der Zusammenhang der kartesischen Koordinaten x und y eines Punktes in der x, y-Ebene und seines Winkels <p in Polarkoordinaten ist gegeben durch 2/2 = x2tanV B-301) Für das zugehörige Nomogramm in Abb.2.110 sind die Maßstäbe für die beiden parallelen Skalen x und y gleich gewählt worden, aber beide Skalen laufen entgegengesetzt. Um gute Schnitte der Fluchtlinien zu erhalten, sind ihre Anfangspunkte geeignet gegeneinander verschoben worden. Die Schnittpunkte der dritten Skala mit denen der ersten bzw. zweiten sind mit cp = 0 bzw. tp = 90° zu beziffern. ¦ Ablesebeispiel- x — 3, y = 3,5 liefert <p « 49,5° 2.19.3.3 Fluchtlinientafein mit zwei parallelen, geradlinigen Skalen und einer Kurvenskala Legt man eine der geraden Skalen auf die y-Achse, die andere auf eine Parallele dazu im Abstand d, dann hat die Gleichung B 296) die Form 0 M*i)l| d ^J{z2) 1=0 B.302) l</>3B3) ^3B3) l| Daraus folgt *(*.) + U^)-P^-, - d-^~, = 0 B.303a) d-(p3(z3) d-y3(z3) Wenn man für die erste Skala den Maßstab E\ und für die zweite den Maßstab E2 wählt, dann geht B 303a) in £1/B1) + E2g(z2)^-h(z3) + Exk{z3) = 0 B.303b) Ej2
130 2. Funktionen und ihre Darstellung 5- 4-: x -_ 2-i 1J 2°y / 30° /4O0 F 7-1 fl 6- E2 - ^3 ^ : 1- =^ 0- : -1- -4 -2- 1 -3- : -6- t-5 -7- Abbildung 2.110 über, wobei ipi(z\) = Eif(zi), ip2(z2) = E2g(z2) sowie ^3B3) = -j dEihfa) h + EMzs) Un >* ( z/2 X £3 rl -6 -5 -4 -3 -2 -1 -0 --1 --2 --3 --4 s-5 --7 Abbildung 2 111 ^) = -E2 + EMz.s) B 303c) gilt ¦ Die reduzierte Gleichung 3. Grades z3+p*z+q* = 0 (s 1 6 2 3, S 40) ist von der Form B 303b) Setzt man E\ = E2 = \ und f(z\) = q*, g(z2) = p*, ^B3) = z , so lauten die Formeln für die Berechnung d- z z3 der Koordinaten der Kurvenskala x = u>z(z) = und y = ib*(z) = . r l + z y w 1 + 2 In Abb.2.111 ist die Kurvenskala nur für positive z-Werte gezeichnet worden Die negativen Wurzeln erhält man, wenn man z durch —z ersetzt und dann die positiven Wurzeln der Gleichung z3+p*z — q* = 0 bestimmt. Auch die komplexen Wurzeln u 4- iv lassen sich aus dem Nomogramm bestimmen Bezeichnet man die stets existierende reelle Wurzel mit z\, dann ist der Realteil der komplexen Wurzel u = —z\/2, und 3 der Imaginärteil v kann aus der Gleichung 3u2 — v2 + p* -v+p* = 0 ermittelt werden. ¦ Ablesebeispiel y3 + 2y - 5 = 0 , d.h p* = 2 , q* = -5 Man liest z\ = 1,3 ab 2.19.4 Netztafeln für mehr als drei Veränderliche Handelt es sich um die Vertafelung von Formeln, die mehr als drei Variable enthalten, dann teilt man die Gleichung durch die Einführung von Hilfsvariablen in mehrere Formeln auf, die jeweils nur drei Variable enthalten. Dabei haben jeweils zwei dieser Gleichungen stets eine der Hilfsvariablen gemeinsam Jede dieser Gleichungen wird durch eine Fluchtlinientafel dargestellt, die so entworfen werden, daß sie dieselbe Skala für die gemeinsame Hilfsvariable haben
131 3 Geometrie 3.1 Planimetrie 3.1.1 Grundbegriffe 3.1.1.1 Punkt, Gerade, Strahl, Strecke 1. Punkt und Gerade Punkt und Gerade werden in der modernen Mathematik nicht definiert Man legt lediglich die Beziehungen zwischen ihnen durch Axiome fest Anschaulich kann die Gerade als Spur eines Punktes erklärt werden, der sich in einer Ebene auf dem kürzesten Verbindungsweg zwischen zwei anderen Punkten bewegt und dabei nie die Richtung ändert Unter einem Punkt versteht man die Schnittstelle zweier Geraden. 2. Strahl und Strecke Ein Strahl enthält genau die und nur die Menge aller der Punkte einer Geraden, die auf der gleichen Seite eines Punktes O dieser Geraden liegen, den Punkt O inbegriffen Man kann sich den Strahl durch die Bewegung eines Punktes vorstellen, die im Punkt O beginnt und ohne Richtungsänderung auf der Geraden erfolgt, ähnlich wie ein Lichtstrahl nach seiner Emission, solange dieser nicht abgelenkt wird Eine Strecke AB enthält genau die Menge aller Punkte einer Geraden, die zwischen zwei Punkten A und B dieser Geraden liegen, die Punkte A und B inbegriffen Die Strecke ist die kürzeste Verbindung der beiden Ebenenpunkte A und B . Der Durchlaufsinn einer Strecke wird mit Hilfe eines Pfeiles gemäß AB gekennzeichnet oder als Richtung vom erstgenannten Punkt A nach dem zweitgenannten Punkt B verstanden 3. Parallele und orthogonale Geraden Parallele Geraden verlaufen in die gleiche Richtung, besitzen aber keinen gemeinsamen Punkt, d.h., sie nähern und entfernen sich nicht voneinander und schneiden sich nicht Die Parallelität wird für zwei parallele Geraden g und g' in Zeichen dargestellt durch g\\g'. Orthogonale Geraden bilden beim Schnitt miteinander rechte Winkel, d h , sie stehen senkrecht aufeinander Die Orthogonalität zweier Geraden ist wie die Parallelität eine Lagebeziehung zweier Geraden zueinander 1. Winkelbegriff Ein Winkel ist durch zwei von einem gemeinsamen Punkt S ausgehende Strahlen a und b festgelegt, die durch eine Drehung ineinander überführt werden können (Abb.3.1) Ist auf dem Strahl a der Punkt A und auf dem Strahl b der Punkt B ausgezeichnet, dann wird der Winkel bei der in Abb.3.1 angegebenen Drehrichtung durch die Symbolik (a, b) oder durch die Symbolik ^ ASB oder durch einen griechischen Buchstaben bezeichnet Der Punkt S wird Scheitelpunkt genannt, die Strahlen a und b heißen Schenkel des Winkels. In der Mathematik heißt ein Winkel positiv bzw. negativ, wenn die Drehung im Gegenuhrzeigersinn bzw im Uhrzeigersinn erfolgt Es ist also grundsätzlich zwischen dem Winkel ^ ASB und dem Winkel $BSA zu unterscheiden Es gilt $ASB = -$BSA @ < $ASB < 180°) und $ ASB = 360° - $BSA A80° < $ASB < 360°). Hinweis: In der Geodäsie wird ein positiver Winkel durch Drehung im Uhrzeigersinn festgelegt (s. 32 2 1,S 148) 3.1.1.2 Winkel By a A Abbildung 3.1
132 3. Geometrie 2. Winkelbezeichnungen Winkel werden nach dem Richtungsunterschied ihrer Schenkel bezeichnet Für Winkel a im Intervall 0 < a. < 360° sind die in s. Tabelle 3.1 angegebenen Bezeichnungen gebräuchlich (s. auch Abb.3.2) Tabelle 3 1 Winkelbezeichnungen im Grad- und im Bogenmaß Winkelbezeichnung Vollwinkel Uberstumpfer Winkel Gestreckter Winkel Gradmaß a° = 360° a° > 180° öl = 180° Bogenmaß a = 2-7T TT < a < 2tt a = tt Winkelbezeichnung Rechter Winkel Spitzer Winkel Stumpfer Winkel Gradmaß a° = 90° 0° < a° < 90° 90° < a < 180° Bogenmaß a = Tr/2 0° < OL < TT 12 TT/2 < OL < TT ¦ & spitzer Winkel rechter stumpfer gestreckter überstumpfer Winkel Winkel Winkel Winkel Vollwinkel Abbildung 3.2 3.1.1.3 Winkel an zwei sich schneidenden Geraden Beim Schnitt zweier Geraden #i,#2 einer Ebene treten vier verschiedene Winkel a,/?,7,<5 auf (Abb. 3.3). Man unterscheidet Nebenwinkel und Scheitelwinkel, außerdem Komplementwinkel und Supplementwinkel 1. Nebenwinkel sind benachbarte Winkel an zwei sich schneidenden Geraden mit einem gemeinsamen Scheitel S und einem gemeinsamen Schenkel; die beiden nicht zusammenfallenden Schenkel liegen auf ein und derselben Geraden, jedoch auf verschiedenen von S ausgehenden Strahlen, so daß sich die Nebenwinkel zu 180° ergänzen ¦ In Abb.3.3 sind es die Winkelpaare (a, /?), (/?, 7), G,6) und (a, S). 2. Scheitelwinkel sind an zwei sich schneidenden Geraden gegenüberliegende gleich große Winkel mit gemeinsamem Scheitel S, aber ohne gemeinsamen Schenkel. Sie werden durch einen gleich großen Nebenwinkel zu 180° ergänzt. ¦ In Abb.3.3 sind (a, 7) und (/?, S) Scheitelwinkel 3. Komplementwinkel sind zwei sich zu 90° ergänzende Winkel. 4. Supplementwinkel sind zwei sich zu 180° ergänzende Winkel. ¦ In Abb.3.3 sind die Winkelpaare (a, ß) oder G,6) Supplementwinkel Abbildung 3 3 3.1.1.4 Winkelpaare an geschnittenen Parallelen Beim Schnitt zweier paralleler Geraden pi, p2 durch eine dritte Gerade g (Abb. 3.4) treten acht Winkel auf Neben Scheitelwinkel und Nebenwinkel für Winkel mit gemeinsamem Scheitelpunkt S sind für Winkel mit verschiedenen Scheitelpunkten Wechselwinkel, Stufenwinkel und entgegengesetzt liegende Winkel zu unterscheiden 1. Wechselwinkel sind gleich große, auf verschiedenen Seiten der Schnittgeraden und der Parallelen liegende Winkel. Die Schenkel von Wechselwinkeln sind paarweise entgegengesetzt gerichtet. ¦ In Abb.3.4 sind die Winkelpaare @11,72), (A,<y, G1^2) und F1, ß2) Wechsel winkel. Abbildung 3 4 2. Stufenwinkel oder Gegenwinkel sind gleich große, auf der gleichen Seite der Schnittgeraden und auf den gleichen Seiten der Parallelen liegende Winkel. Die Schenkel von Stufenwinkeln sind paarweise gleichgerichtet
31 Planimetrie 133 1 rad 1° V 1" = 57°17'44,,8" = = 0,017453 rad, = 0,000291 rad, = 0, 000005 rad 57,2958°, ¦ In Abb.3.4 sind die Winkelpaare (a\, a2), (ßi, /%), G1,72) und (S1.Ö2) Stufenwinkel 3. Entgegengesetzte Winkel sind auf der gleichen Seite der Schnittgeraden g, aber auf verschiedenen Seiten der Parallelen gelegene Winkel, die sich zu 180° ergänzen Ein Schenkelpaar ist gleichgerichtet, das andere entgegengesetzt gerichtet ¦ Die Winkelpaare (ai, S2), {ßi, 72), G1, #2) und (<5i, a2) in Abb.3.4 sind entgegengesetzte Winkel. 3.1.1.5 Winkel im Gradmaß und im Bogenmaß Das in der Geometrie verwendete Gradmaß zur Messung von Winkeln beruht auf der Einteilung des ebenen Vollwinkels in 360 gleiche Teile oder 360° (Grad) Das ist die sogenannte Altgradeinteilung Die weitere Unterteilung erfolgt häufig nicht dezimal sondern sexagesimal 1° = 60' (Minuten), V = 60" (Sekunden). Man spricht auch von Sexagesimaleinteilung Wegen dei Neugradeiriteilung s. 3 2 2 2,1., S 149 Neben dem Gradmaß wird auch das Bogenmaß zur quantitativen Angabe von Winkeln verwendet. Die Größe des Mittelpunkts- oder Zentriwinkels a in einem beliebigen Kreis wird hierbei durch das Veihältnis des zugehöligen Kreisbogens l zum Radius r des Kreises angegeben Die Einheit des Bogenmaßes ist der Radiant (rad), d h der Zentriwinkel, dessen Bogen gleich dem Radius ist Es gilt Ist a° der in Grad und a der in Radiant gemessene Winkel, dann gilt für die Umrechnung von einer Maßeinheit in die andere a° = ga = 180°— , a — — = —— a° mit g = C.2) TT g 180° TT Insbesondere ist 360° = 2tt, 180° = tt , 90° = tt/2 , 270° = 3?r/2 usw Mit C 2) erhält man ein de- zimalisiertes Ergebnis, wählend die folgenden Beispiele eine Umrechnung unter Berücksichtigung von Minuten und Sekunden zeigen. ¦ A: Umrechnung eines Winkels im Giadmaß in das Bogenmaß rad 52° 37' 23" = 52-0,017453 + 37 • 0,000291 + 23-0,000005 = 0,918447 rad ¦ B: Umrechnung eines Winkels im Bogenmaß in einen Winkel im Gradmaß. 5.645 rad = 323 • 0,017453 + 26 0,000291 + 5-0,000005 = 323° 26' 05" , entstanden aus 5,645 0,017453=323+0 007611 0.007611 0,000291 = 26+0,000025 0.000025 0,000005 = 5 . Die Bezeichnung iad wird in der Regel weggelassen, wenn aus dem Zusammenhang hervorgeht, daß es sich um das Bogenmaß eines Winkels handelt Hinweis: In der Geodäsie wiid der Vollwinkel in 400 gleiche Teile oder 400 gon (Gon) eingeteilt. Das ist die sogenannte Neugradeinteilung Ein rechter Winkel entspricht dann 100 gon. Das gon wird in 1000 mgon unterteilt Auf Taschenrechnern findet man die Bezeichnungen DEG für Grad (Altgrad), GRAD für Gon (Neu- giad) und RAD für Radiant (Bogenmaß) Zur Umrechnung s. Tabelle 3 5, S 149 3.1.2 Geometrische Definition der Kreis- und Hyperbel- Funktionen 3.1.2.1 Definition der Kreis- oder trigonometrischen Funktionen 1. Definition am Einheitskreis Die trigonometrischen Funktionen eines Winkels a werden entweder am Einheitskreis mit dem Radius R = 1 oder für spitze Winkel am rechtwinkligen Dreieck (Abb.3.5a,b) mit Hilfe der Bestimmungsstücke Ankathete b. Gegenkathete a und Hypotenuse c defi-
134 3. Geometrie niert. Am Einheitskreis erfolgt die Messung des Winkels von einem festen Radius OA der Länge 1 bis zu einem beweglichen Radius OC im entgegengesetzten Drehsinn des Uhrzeigers (positive Richtung): Sinus : BC = C-3) Kosinus : cos a = OB = - , c C.4) Tangens . tan a = AD - Sekans . sec a = OD -¦ C.5) C.7) 2. Vorzeichen der trigonometrischen Funktionen Je nachdem, in welchem Quadranten des Einheitskreises (Abb.3.5a) der bewegliche Radius OC liegt, haben die Funktionen ein ganz bestimmtes Vorzeichen, das aus Tabelle 2.2, S 79) entnommen werden kann. 3. Definition der trigonometrischen Funktionen mit Hilfe einer Kreissektorfläche Die Funktionen sina, cosa, tan a sind über die Strecken BC, OB, AD am Einheitskreis mit R = 1 definiert (Abb.3.6), wobei als Argument der Zentriwinkel a = £ AOC dient Zu dieser Definition hätte auch die Fläche x des Sektors COK benutzt werden können, die in Abb.3.6 schraffiert gezeichnet ist. Mit dem Zentriwinkel 2a, gemessen in Radianten, ergibt sich für R = 1 gerade x = \R22oc = a. Somit ergeben sich die gleichen Definitionsgleichungen wie in C.3), C.4), C.5) zu sin # = 5C, cos x = ÜB, tan x = ~ÄD Kotangens : cot a = EF = Kosekans . :ÖF=C-. a C 6) C.8) Abbildung 3.5 Abbildung 3.6 Abbildung 3.7 3.1.2.2 Geometrische Definition der Hyperbelfunktionen In Analogie zur Definition der trigonometrischen Funktionen mit Hilfe der Kreissektorfläche gemäß C 3), C 4), C 5) wird anstelle der Sektorfläche des Kreises mit der Gleichung x2 + y2 — 1 die entsprechende Sektorfläche der Hyperbel mit der Gleichung x2—y2 = 1 (rechter Zweig in Abb.3.7) betrachtet Mit der Bezeichnung x für diese Fläche COK, die in Abb.3.7 schraffiert gezeichnet ist, lauten die Definitionsgleichungen der Hyperbelfunktionen: sinhx = ßC, C.9) coshx = Ö]3, C.10) tanhx = ÄD C.11) Berechnung der Fläche x durch Integration und Ausdrucken des Ergebnisses mit BC, OB und AD lie- fer^ x = ]n(BC+ \IWr+l) = ln(ÖB + yfÜ¥^\) = ]- In l+_ ^R , C 12) so daß die Hyperbelfunktionen nunmehr mit Hilfe von Exponentialfunktionen darstellbar sind. BC = = sinh x, C.13a) OB = ex + e = cosh x, C 13b) AD- ex + e~ = tanh x C.13c)
3 1 Planimetrie 135 Das sind die Definitionsgleichungen der Hyperbelfunktionen, so daß die Bezeichnung Hyperbelfunktionen offenkundig ist 3.1.3 Ebene Dreiecke 3.1.3.1 Aussagen zu ebenen Dreiecken 1. Die Summe zweier Seiten ist im ebenen Dreieck stets größer als die dritte Seite (Abb.3.8) • b + c>a. C 14) 2. Die Summe der Winkel beträgt im ebenen Dreieck a + /? + 7 = 180° C.15) Weitere Formeln zum Dreieck s. Abschnitt 3.2.1 und Tabelle 3.2. 3. Vollständige Bestimmung des Dreiecks Ein Dreieck ist durch die folgenden Bestimmungsstücke vollständig bestimmt • durch drei Seiten oder • durch zwei Seiten und den zwischen ihnen eingeschlossenen Winkel bzw. • durch eine Seite und die beiden anliegenden Winkel Wenn zwei Seiten gegeben sind sowie der einer Seite gegenüberliegende Winkel, dann können mittels dieser Bestimmungsstücke entweder zwei, ein oder kein Dreieck konstruiert werden (s 3. Grundaufgabe in Tabelle 3.4, S 147). Abbildung 3 8 Abbildung 3.9 Abbildung 3.10 4. Seitenhalbierende des Dreiecks wird die Gerade genannt, die einen Eckpunkt des Dreiecks mit dem Mittelpunkt der gegenüberliegenden Dreieckseite verbindet. Die Seitenhalbierenden des Dreiecks schneiden sich in einem Punkt, dem Schwerpunkt des Dreiecks (Abb.3.9), der sie vom Scheitel des Winkels aus gerechnet im Verhältnis 2 : 1 teilt 5. Winkelhalbierende des Dreiecks wird die Gerade genannt, die einen der drei inneren Winkel des Dreiecks in zwei gleiche Teile teilt. 6. Inkreis wird der in das Dreieck einbeschriebene Kreis genannt Sein Mittelpunkt ist der gemeinsame Schnittpunkt der Winkelhalbierenden des Dreiecks (Abb.3.10) 7. Umkreis wird der das Dreieck umschreibende Kreis genannt (Abb.3.11). Sein Mittelpunkt ist der gemeinsame Schnittpunkt der drei Mittelsenkrechten des Dreiecks. 8. Höhe des Dreiecks wird das Lot genannt, das vom Scheitelpunkt eines der drei Dreieckwinkel auf die gegenüberliegende Seite gefällt wird (Abb.3.8). Die Höhen des Dreiecks schneiden sich im sogenannten Or- thozentrum 9. Gleichschenkliges Dreieck Im gleichschenkligen Dreieck sind zwei Dreieckseiten gleich lang Höhe, Seiten- und Winkelhalbierende der dritten Seite sind identisch. Für die Gleichschenkligkeit des Dreiecks ist die Gleichheit je zweier dieser Seiten eine hinreichende Bedingung Abbildung 3 11 10. Gleichseitiges Dreieck Im gleichseitigen Dreieck mit a — h = c fallen die Mittelpunkte des In- und des Umkreises mit dem Schwerpunkt und dem Orthozentrum zusammen
136 3. Geometrie 11. Mittellinie wird eine Gerade genannt, die die Mittelpunkte zweier Dreiecksseiten verbindet; sie liegt parallel zur dritten Seite und ist halb so lang wie diese. 12. Rechtwinkliges Dreieck wird ein Dreieck genannt, das sich durch einen Winkel von 90° in einer der Dreiecksecken auszeichnet (Abb.3.31, S. 145). 3.1.3.2 Symmetrie 1. Zentrale Symmetrie Ebene Figuren heißen zentralsymmetrisch, wenn deren Punkte durch eine ebene Drehung von 180° um den Zentralpunkt oder das Symmetriezentrum S zur Deckung gebracht werden können (Abb.3.12). Da Größe und Gestalt der Figuren bei dieser Transformation erhalten bleiben, spricht man von Kongruenztransformation Auch der Umlaufsinn der ebenen Figuren bleibt bei dieser Transformation erhalten (Abb.3.12). Wegen des gleichen Umlaufsinnes nennt man die Figuren gleichsinnig kongruent Unter dem Umlaufsinn einer Figur versteht man das Durchlaufen des Randes einer Figur in einem Drehsinn positiv im mathematischen Drehsinn, also im Gegenuhrzeigersinn, negativ im Uhrzeigersinn Abb.3.12, Abb.3.13. Abbildung 3 12 Abbildung 3.13 2. Axiale Symmetrie oder Spiegelsymmetrie Ebene Figuren heißen axialsymmetrisch oder spiegelsymmetrisch, wenn einander entsprechende Punkte durch eine räumliche Drehung von 180° um eine Gerade g zur Deckung gebracht werden können (Abb.3.13). Die senkrechten Abstände einander zugeordneter Punkte von der Symmetrieachse, der Geraden g, sind gleich groß. Der Umlaufsinn der gedrehten Figur wird bei der Spiegelung an der Geraden g umgekehrt' Daher heißen die Figuren nichtgleichsinnig kongruent Man nennt diese Transformation Umklappung. Da Größe und Gestalt der Figuren dabei erhalten bleiben, spricht man auch vonnichtgleichsinniger Kongruenztransformation Der Umlaufsinn der ebenen Figuren wird bei dieser Transformation umgekehrt (Abb.3.13). Hinweis: Für räumliche Figuren gelten analoge Aussagen. 3. Kongruente Dreiecke, Kongruenzsätze 1. Kongruenz Unter Kongruenz ebener Figuren versteht man allgemein ihre Deckungsgleichheit, d.h die völlige Übereinstimmung in Größe und Gestalt. Kongruente Figuren können durch drei geometrische Transformationen ineinander überführt werden, durch Schiebung, Drehung und Spiegelung bzw. durch ihre Kombination. Man unterscheidet gleichsinnig kongruente Figuren und nichtgleichsinnig kongruente Figuren (s 3.1.3.2, 2., S. 136). Gleichsinnig kongruente Figuren lassen sich durch Schiebung oder Drehung sowie durch ihre Kombination ineinander überführen. Da sich nichtgleichsinnig kongruente Figuren durch entgegengesetzten Umlaufsinn (s. 3.1.3.2,2., S. 136) auszeichnen, ist zu ihrer Überführung zusätzlich noch die Spiegelung an einer Geraden erforderlich ¦ Spiegelsymmetrische Figuren sind nichtgleichsinnig kongruent Zu ihrer Überfuhrung ineinander sind alle drei Transformationen erforderlich
3.1 Planimetrie 137 2. Kongruenzsätze Die Bedingungen für die Kongruenz von Dreiecken sind in den Kongruenzsätzen festgehalten Zwei Dreiecke sind kongruent, wenn sie übereinstimmen in. • drei Seiten (SSS) oder • zwei Seiten und dem von ihnen eingeschlossenen Innenwinkel (SWS) oder • einer Seite und den beiden anliegenden Innenwinkeln (WSW) oder • zwei Seiten und dem der größeren Seite gegenüberliegenden Innenwinkel (SSW) 4. Ähnliche Dreiecke, Ähnlichkeitssätze Unter Ähnlichkeit versteht man allgemein die völlige Übereinstimmung der Gestalt ebener Figuren, ohne daß ihre Größe übereinstimmt Ahnliche Figuren können durch geometrische Transformationen ineinander überführt werden, derart, daß die Punkte der einen Figur umkehrbar eindeutig so auf die Punkte der anderen abgebildet werden, daß jedem Winkel der einen Figur ein gleicher Winkel der anderen Figur entspricht Gleichwertig mit dieser Erklärung ist die Aussage In ähnlichen Figuren sind einander entsprechende Strecken zueinander proportional 1. Ähnlichkeit von Figuren erfordert entweder die Übereinstimmung aller Winkel oder die Übereinstimmung aller entsprechenden Streckenverhältnisse. 2. Flächeninhalte ähnlicher ebener Figuren sind proportional zueinander. Der Proportionalitätsfaktor ist gleich dem Quadrat des Verhältnisses zweier zueinander entsprechender'linearer Elemente, wie Seiten, Höhen, Diagonalen usw. 3. Ähnlichkeitssätze Für das Dreieck gelten die folgenden Ahnlichkeitssätze Dreiecke sind ähnlich, wenn sie übereinstimmen in • zwei Seitenverhältnissen, • zwei gleichliegenden Innenwinkeln, • im Verhältnis zweier Seiten und in dem von diesen Seiten gebildeten Innenwinkel, • im Verhältnis zweier Seiten und dem der größeren dieser Seiten gegenüberliegenden Innenwinkel Da bei der Ähnlichkeit nur Seitenverhältnisse, nicht aber wie bei der Kongruenz Seitenlängen eine Rolle spielen, enthalten die Ahnlichkeitssätze je ein Bestimmungsstück weniger als die entsprechenden Kongruenzsätze. 5. Strahlensätze Die Strahlensätze, auch zentrische Streckung genannt, folgen aus den Ahnlichkeitssätzen für Dreiecke 1. Strahlensatz Werden zwei von einem gemeinsamen Scheitel S ausgehende Strahlen von zwei Parallelen pi,p2 geschnitten, so verhalten sich die Abschnitte auf einem der Strahlen (Abb.3.14a) wie die entsprechenden Abschnitte auf dem anderen Strahl* SPi SQi = SP2 SQ~2 C 16) Daraus folgt auch, daß jeder beliebige Abschnitt auf einem Strahl zu dem entsprechenden auf dem anderen Strahl ins Verhältnis gesetzt werden kann. Abbildung 3.14 2. Strahlensatz Werden zwei von einem gemeinsamen Scheitel S ausgehende Strahlen von zwei Parallelen p!, p2 geschnitten, so verhalten sich die Parallelenabschnitte wie die zugehörigen Abschnitte auf einem der Strahlen (Abb.3.14a)- SPi SQi = P1P2 Q1Q2 bzw SP2 = P1P2 Q1Q2 C 17) Die Strahlensätze gelten auch, wenn der Scheitel S zwischen den Parallelen liegt (Abb.3.14b)
138 3. Geometrie 3.1.4 Ebene Vierecke 3.1.4.1 Parallelogramm Parallelogramm wird ein Viereck genannt (Abb.3.15), das die folgenden Haupteigenschaften besitzt: • die einander gegenüberliegenden Seiten sind gleich lang, • die einander gegenüberliegenden Seiten sind parallel, • die Diagonalen halbieren einander, • einander gegenüberliegende Winkel sind gleich groß. Bei einem Viereck folgen aus dem Vorhandensein einer dieser Eigenschaften oder aus der Gleichheit und Parallelität eines Paares gegenüberliegender Seiten alle anderen Eigenschaften. Für den Zusammenhang zwischen Seiten, Diagonalen, Höhe und Flächeninhalt gilt + d2 = 2{a2 + b2), C.18) h = bsina, C.19) S = ah C.20) Abbildung 3.15 Abbildung 3.16 Abbildung 3 17 3.1.4.2 Rechteck und Quadrat Ein Parallelogramm ist ein Rechteck (Abb.3.16), wenn es • nur rechte Winkel enthält oder • zwei gleich lange Diagonalen besitzt, wobei die eine Eigenschaft die andere zur Folge hat. Umfang und Flächeninhalt betragen: U = 2(a + b), C.21) S = ab. C 22) Wenn a = b ist (Abb.3.17), wird ein Rechteck Quadrat genannt, und es gelten dann die Formeln d = ay/2& 1,414a, C 23) a = d-^-«0,707d, C.24) S = a2 = ¦ C 25) 3.1.4.3 Rhombus oder Raute Ein Rhombus (Abb.3.18) ist ein Parallelogramm, in dem • alle Seiten gleich lang sind, • die Diagonalen senkrecht aufeinander stehen und • die Winkel des Parallelogramms von den Diagonalen halbiert werden. Das Vorhandensein einer dieser Eigenschaften hat die zwei anderen zur Folge. Es gilt: di = 2a cos - S = ah-- C.26) _ d\d2 d2 = 2a sin 2' C.27) d\ + d\ = Aa2 C.28) C 29) 3.1.4.4 Trapez Trapez wird ein Viereck genannt, bei dem zwei Seiten zueinander parallel sind (Abb.3.19). Mit den Bezeichnungen a und b für die beiden Grundlinien des Trapezes, h für die Höhe und m für die Mittellinie, die die Mittelpunkte der beiden nicht parallelen Seiten miteinander verbindet, ergibt sich:
3.1 Planimetrie 139 a + b 2 ' C.30) S = ^ = mh, C 31) /* = h(a + 26) 3(a + 6) " C.32) Der Schwerpunkt liegt auf der Verbindungslinie der Mitten der parallelen Grundlinien a und b im Abstand hs C 32) von der Grundlinie a. Die Berechnung der Schwerpunktkoordinaten erfolgt durch Integration (s. 8.2.2.3,5., S. 470). Im gleichschenkligen Trapez mit d = c gilt: S = (a — c cos 7H sin 7 = F + ccos7)csin7 ^ C.33) *x&/4 m Abbildung 3.18 Abbildung 3.19 Abbildung 3.20 3.1.4.5 Allgemeines Viereck Im allgemeinen Viereck gibt es keine parallelen Seiten, d h., alle vier Seiten sind verschieden lang. Verlaufen die Diagonalen vollständig im Innern des Vierecks, dann ist es ein konvexes Viereck, anderenfalls ein konkaves Das allgemeine Viereck kann durch jeweils eine Diagonale in zwei Dreiecke zerlegt werden (di,d2 in Abb.3.20) Daher beträgt in jedem Viereck die Summe der Innenwinkel 2 • 180° = 360° • 5^ = 360° Der Flächeninhalt des allgemeinen Vierecks beträgt S = -d^sina C.34) C 35) Die Strecke m, die die Mittelpunkte der beiden Diagonalen miteinander verbindet (Abb.3.20), berechnet sich aus a2 + b2 + c2 + d2 = d\ + d22 + 4m2 . C.36) 3.1.4.6 Sehnenviereck Ein Viereck, das mit einem Umkreis umbeschrieben werden kann (Abb.3.21a), heißt Sehnenviereck, weil die Seiten dieses Vierecks Sehnen des Umkreises sind. Ein Sehnenviereck liegt dann und nur dann vor, wenn die Summe zweier Gegenwinkel 180° beträgt- a + 7 = /? + <5 = 180° Der Umkreisradius des Sehnenvierecks beträgt R= — yj{ab + cd)(ac + bd)(ad + cb). Die Diagonalen berechnen sich gemäß (ac + bd)(ab + cd) b) Abbildung 3 21 ad + bc d2 = (ac + bd)(ad-\- bc) ab-\- cd Für das Sehnenviereck gilt der Satz des PTOLEMÄUS: ac-\- bd = d\d2 . C.37) C 38) C.39a) C 39b) C.40)
140 3 Geometrie Mit dem halben Umfang des Sehnenvierecks s = -(a + b + c + d) gilt für den Flächeninhalt 5 - y/(s-a)(s-b)(s-c)(s-d) C.41) Ist das Sehnenviereck gleichzeitig ein Tangentenviereck, dann gilt S = Väbcl C 42) 3.1.4.7 Tangentenviereck Ein Viereck, in das ein Inkreis einbeschrieben werden kann (Abb.3.21b), heißt Tangentenviereck, weil die Seiten dieses Vierecks Tangenten des Inkreises sind Diese Bedingung ist dann und nur dann erfüllt, wenn die Summe der Strecken zweier Gegenseiten gleich groß und gleich dem halben Umfang sind- U C 43) >-r Der Flächeninhalt des Tangentenvierecks beträgt (a + c)r = (b + d)r - C.44) Dabei ist r der Radius des Inkreises 3.1.5 Ebene Vielecke oder Polygone 3.1.5.1 Allgemeines Vieleck Eine geschlossene ebene Figure mit geradlinigen Begrenzungsstrecken, den Seiten, heißt Vieleck oder Polygon Ein Vieleck mit n Seiten läßt sich in n — 2 Teildreiecke zerlegen (Abb.3.22). Die Summe der Außenwinkel ßt, der Innenwinkel 7; und die Anzahl D der Diagonalen betragen £ä = 360° :2tt, C.45) X> = 180°(n-2) = (n-2Or, C<46) D = <n 3) ^^ Abbildung 3.22 a) b) Abbildung 3 23 3.1.5.2 Regelmäßige konvexe Vielecke Regelmäßige konvexe Vielecke (Abb.3.23) haben n gleiche Seiten und n gleiche Innenwinkel. Der Schnittpunkt der Mittellote der Seiten des Vielecks ist der Mittelpunkt M des einbeschriebenen und des umbeschriebenen Kreises mit den Radien r bzw R Die Seiten des n-Ecks sind Tangenten des Inkreises und Sehnen des Umkreises. Sie bilden um den Inkreis das Tangentenvieleck, im Umkreis das Sehnenvieleck. Die Zerlegung eines regelmäßigen konvexen n-Ecks ergibt n gleichschenklige kongruente Dreiecke um den Mittelpunkt M , die Bestimmungsdreiecke. Die Elemente des n-Ecks werden im folgenden durch den Index n, die des 2n-Ecks mit dem Index 2n gekennzeichnet
3.1 Planimetrie 141 360° / 2\ Zentriwinkel (pn = , C.48) Basiswinkel an = f 1 J • 90°, 360° Außenwinkel ßn = , C.50) Innenwinkel jn = 180° - ßn, n Umkreisradius Inkreisradius Seitenlänge f> a" p2 2 ^ - 180° ' ^ ~ r 2 sin n an 180° 1 r = — cot = ix cos - 2 n o„ = 2>/Ä2-r2 = 2Äsin- 1 2 80° n £ = 2rtan!£, 2 2 Umfang U = nan , Flächeninhalt S = -nanr = nr2 tan -^ = -nR2 sin pn = -na2n cot -^ , Beziehungen zwischen Seitenlängen und Flächeninhalten von n-Eck und 2n-Eck: «2n = R\ 2- q nR2 -2V1-(SJ' a" = a2^ R*j- i-\f1^' ^W^- C 49) C.51) C.52) C 53) C.54) C.55) C.56) C.57) C 58) 3.1.5.3 Einige regelmäßige konvexe Vielecke Die Eigenschaften einiger ausgewählter regelmäßiger konvexer Vielecke sind in Tabelle 3.2 zusammengefaßt. Im folgenden Beispiel erfahren das Fünfeck und das Pentagramm eine spezielle Betrachtung, weil vermutlich an ihnen durch HiPPASOS von Metapont um 400 v. u. Z. die irrationalen Zahlen (s. 1.1 1.2, S 1) entdeckt wurden. ¦ Die Diagonalen des regelmäßigen Fünfecks Abb.3.24 bilden einen Stern, das Pentagramm, dessen Inneres wieder ein regelmäßiges Fünfeck bildet Im regelmäßigen konvexen Fünfeck verhalten sich die Diagonale zur Seite wie sich die Seite zu Diagonale - Seite verhalten: ao : a\ = öi : (ao — öi) = öi : a2 j wobei a2 = ao — a\ ist. ß Geht man analog zu immer kleineren eingeschachtelten Fünfecken mit ö3 = a\ — a2, a4 = a2 — a3, . und a2 < ai,a3 < a2, a4 < a3 .. über, so gilt a0 . a\ = a\ : a2 = a2 . a3 = a3 . a4 = • • • Der Euklidische Algorithmus für a0 und Oi bricht wegen a0 = 1 • a\ + a2, a\ = 1 • a2 + a3, a2 = 1 • a3 + a4,.. , also nicht ab. Die Seite a\ und die Diagonale ao des Pentagons sind somit inkommensurabel Der sich für ao . a\ ergebenende Kettenbruch ist identisch mit dem des Goldenen Schnittes in 1.1 1.4,3., ¦ B, S 4, d h. es ergibt sich eine irrationale Zahl C D^ Abbildung 3.24
142 3. Geometrie 3.1.6 Ebene Kreisfiguren 3.1.6.1 Kreis 1. Definitionen Der Kreis ist der geometrische Ort aller Punkte einer Ebene, die von einem festen Punkt dieser Ebene, dem Mittelpunkt des Kreises, einen konstanten Abstand, den Radius des Kreises, haben. Zum Unterschied von der durch einen Kreis in der Ebene begrenzten Kreisfläche wird der Kreis selbst auch als Kreislinie oder Kreisperipherie bezeichnet 3-Eck 5-Eck 6-Eck 8-Eck 10-Eck Tabelle 3 2 Eigenschaften einiger regelmäßiger Vielecke Seitenlänge a = RVZ = 2rv/3 = |VlO-2\/5 = 2ry/5 - 2^ 4V3 = Ry/2 - V2 = 2r{y/2-l) = f(v/5-l) = ^25-10y/E 5 Umkreisradius R = Io^50 + 10v/^ = r(v/5-l) -b* = ^4 + 2^2 = ry/i - 2V2 = f(^+D = VöO-Wo 5 Inkreisradius r -l^-T-5* = ^25 + 10^5 = f(V5 + D -^ = f(V2 + l) = ^2 + V2 = ^/s + 2>/5 = |VlO + 2^5 Flächeninhalt S 4 4 = 3r2V3 ,:, = ^V25 + 10\/5 4 O = 5r2^5 - 2^5 = 3a|v3 = — V3 = 2r2v/3 = 2al(\/2 + l) = 2Ä2>/2 = 8r2(>/2-l) 0 = 5|o^/5 + 2V5 = 2r2^25 - 10V5 Jede Gerade durch zwei Punkte der Kreisperipherie heißt Sekante, die auf ihr im Kreisinnern gelegene Strecke heißt Sehne Geraden, die einen und nur einen Punkt mit dem Kreis gemeinsam haben, heißen Tangenten des Kreises 2. Sätze, Strecken, Fläche Sehnensatz (Abb.3.26) ÄC -~KD = AB .~ÄE = r2 - m2 . C.59) Sekantensatz (Abb.3.27) C.60)
3.1 Planimetrie 143 Sekantentangentensatz (Abb.3.27) AT2 = ~ÄB • ÄE = ÄC • ÄD = m2 - r2 . Umfang tf = 27rr » 6,283r, U = ird « 3,142 d, £/ = 2 v^S « 3,545 \/S Flächeninhalt S = 7rr2^3,142r2, S = ^f«0,785d2, 5=^. 4 4 Radius und Durchmesser U r = —«0,15917, 27T C.64) d = 2J-«l,128>/5. C.61) C.62) C.63) C.65) Abbildung 3.25 Abbildung 3.26 Abbildung 3.27 ¦ Berechnung der Entfernung des Horizontes x auf der Erde als Funktion von der Höhe h über der Erdoberfläche Gemäß Sekantentangentensatz C.61) erhält man mit AT = x und m = h + r die Formel x = sj{h + rJ - r2 = y/hFT~2rh Einsetzen des Erdradius r = 6371,11 km gemäß KRASSOWSKI (s 3.4.1.1,4., ¦ B, S 164) ergibt für h und x: h/km 1 0,002 I 0,01 I 0,05 1 0,1 I 0,5 I 1 I 5 I 10 I 50 I 100 I 500 x/km | 5,05 | 11,29 | 25,24 | 35,69 | 79,81 | 112,88 | 252,41 | 356,96 | 798,2 | 1128,8 | 2524,1 3. Winkel im Kreis Peripheriewinkel (Abb.3.25) a = - BC= - £ B0C = -<p (<p Zentriwinkel), Speziell gilt der Satz des Thaies (s. 3.2.1,1., S. 145) Aus (p = 180° folgt a = 90° Sehnentangentenwinkel Sehnenwinkel (Abb.3.26) ß=\AC=±*CQA. 7 = UcB + ED) = h$B0C + $E0D). Sekantenwinkel (Abb.3.27) a = ]-{DE - BC) = U$ E0C - $ C0B). Sekantentangentenwinkel ß = ]-{TE -TB) = h$T0E - £ BOT). Tangentenwinkel (Abb.3.28) a = hßDC - BEC) = \{mC - C0B) = iC60° - £ C0B - £ C0B) = 180° - $ C0B. C.66a) C.66b) C.67) C.68) C.69) C.70) C.71)
144 3. Geometrie In C 71) sind D und E beliebige Punkte auf dem linken bzw. rechten Kreisbogen Wegen der Winkel in den Formeln C 66a) bis C.71) s. Definition des Winkels in 3 1 1 2,1., S. 131 3.1.6.2 Kreisabschnitt (Kreissegment) und Kreisausschnitt (Kreissektor) Kenngrößen Radius r und Zentriwinkel ip (Abb.3.29) Zu berechnende Größen sind. Sehne Zentriwinkel . a = 2y/2hr - h2 = 2r sin |, • a . ^ i ip = 2 arcsin — , gemessen in Grad, a ( (f\ a <p Höhe des Kreisabschnitts h = r — \ r2 = r 1 — cos — 1 = - tan — , V 4 V 2/24' 2irr(p Länge des Bogens und näherungsweise 360 t 0,01745/ <p, 8b -a l w —-— oder Abbildung 3.28 Flächeninhalt des Sektors Abbildung 3.29 Abbildung 3 30 S-=£«0,00873rV T ( 7TU) Flächeninhalt des Kreisabschnitts S\ = — ( sin ip lr — a(r — h)\, und näherungsweise Si~— Fa+ 86) 15 C 72) C 73) C 74) C 75a) C 75b) C 76) C.77a) C 77b) 3.1.6.3 Kreisring Kenngrößen des Kreisringes: Äußerer Radius R, innerer Radius r und Zentriwinkel p> (Abb.3.30) Äußerer Durchmesser D = 2R, C 78) R + r Mittlerer Radius p - C 80) Innerer Durchmesser d = 2r , Breite des Ringes ö = R — r , Flächeninhalt des Ringes S = tt(R2 - r2) = -AD2 - d2) = 2npö, Flächeninhalt eines Ringteiles über <p (in Abb.3.30 schraffiert dargestellt) ^_ (R2 _r2) = H (D2 _ J 360 \n r ) 1440 V^ 360 180 pö. C 79) C 81) C 82) C 83)
3.2 Ebene Trigonometrie 145 3.2 Ebene Trigonometrie 3.2.1 Dreiecksberechnungen 3.2.1.1 Berechnungen in rechtwinkligen ebenen Dreiecken 1. Grundformeln Verwendete Bezeichnungen (Abb.3.31)- a, b Katheten, c Hypotenuse; a bzw. ß die den Seiten a bzw. b gegenüberliegenden Winkel; h Höhe; p, q Hypotenusenabschnitte, S Flächeninhalt. Winkelsumme a + ß + 7 = 180° mit 7 = 90°.C.84) Seitenberechnung Satz des Pythagoras a = csina = ccosß = bta.ua = bcotß. C 85) a2 + b2 = c2 . C.86) Satz des Thaies Im rechtwinkligen Dreieck liegt der Scheitel des rechten Winkels auf dem Halbkreis über der Hypotenuse, d.h , alle Peripheriewinkel bezüglich des Durchmessers eines Kreises sind rechte Winkel (s. Abb.3.32) und C.66b). a/<90 Sft h ', P ' c q • Abbildung 3.31 Sätze des Euklid Flächeninhalt h2=pq, ¦ pc, — = — tan ß - 2 2 H = qc. - sin 2ß. Abbildung 3.32 2. Berechnung von Seiten und Winkeln im ebenen rechtwinkligen Dreieck Im rechtwinkligen Dreieck ist von 6 Bestimmungsgrößen C Winkel a, ß, 7 und die ihnen gegenüberliegenden Seiten a, 6, c) ein Winkel, in Abb.3.31 der Winkel 7 , zu 90° fest- TaDelle 3-3 Bestimmungsgrößen ebener rechtwinkliger Dreiecke gelegt Ein ebenes Dreieck ist durch drei Bestimmungsstucke festgelegt, die aber nicht beliebig vorgegeben werden können (s Vollständige Bestimmung des Dreiecks 3.1.3.1, S 135) Somit können nur noch zwei Stücke vorgegeben werden Die übrigen drei lassen sich mit Hilfe der Gleichungen in Tabelle 3.3 sowie C 15) bzw C 84) berechnen. 3.2.1.2 Berechnungen in ebenen schiefwinkligen Dreiecken 1. Grundformeln Es werden die folgenden Bezeichnungen verwendet a, 6, c Seiten; a, ß, 7 die ihnen gegenüberliegenden Winkel, S Flächeninhalt, R Radius des Umkreises; r Radius des Inkreises, s = halber Dreiecksumfang (Abb.3.33) Zyklische Vertauschungen Da im schiefwinkligen Dreieck alle Seiten gleichberechtigt sind, ebenso alle Winkel, können aus jeder für bestimmte Seiten und Winkel bewiesenen Formel zwei weitere gewonnen werden, wenn Seiten und Gegeben z.B a, a z.B b,a z.B. c, a z B. a, b Formeln zur Ermittlung der übrigen Größen ß = 90° - a ß = 90° - a ß = 90° - a a - = tan a 0 b = a cot a a = b tan a a = c sin a a sina a sina b cosa b = c cos a ß = 90°-a
146 3 Geometrie Abbildung 3 33 Abbildung 3 34 Winkel gemäß Abb.3.34 zyklisch vertauscht werden Abbildung 3.35 b sin/3 c sin 7 Aus - = (Siniussatz) erhält man durch zyklische Vertauschung - = b sinp c sin 7 a sina Sinussatz ¦-2R. a b c sin a sin ß sin 7 Projektionssatz (s. Abb.3.35) c = a cos ß + bcos a Kosinussatz oder Satz des Pythagoras im schiefwinkligen Dreieck c2 = a2 + b2 — 2ab cos 7 Mollweidesche Gleichungen ( , M • 1 (Oi-ß [a + 0) sin — = ccos I —-— C.92a) / m 7 . fa-ß (a — b) cos - = csm I —-— Tangenssatz a + b tan a + ß tan a-ß ' 2 asin/? C 93) Halbwinkelsatz tan — = *. 2 ^ s(s-a) (s-b)(s-c) asin7 Tangensformeln tan a -- c — a cos ß b — a cos 7 Zusätzliche Beziehungen für halbe Winkel . a (s — b)(s — c) sin — = \ ; . 2 V bc C1 cosi: s(s — a) bc C 89) C 90) C 91) C 92b) C 94) C 95) C 96b) Höhe der Seite a ha = b sin 7 = c sin ß Seitenhalbierende der Seite a ma = - \/fr2 + c2 + 2&c cos a Winkelhalbierende des Winkels a Radius des Umkreises R = 2bc cos - ^ b + c 2 sin a 2 sin ß 2 sin 7 ^ ,. , T , . (s - a)(s - b)(s — c) a ß 7 Radius des Inkreises r = \ = 5 tan — tan — tan - s 2 2 2 C 97) C 98) C.99) C 100) C 101)
3 2 Ebene Trigonometrie 147 AT) • a • ^ • 7 ¦ \R sin — sin — sin — 2 2 2 Flächeninhalt S = -absin7 = 2i?2sinasin/?sin7 = rs = y.s(s — a)(s — ft)(s — c) Die Formel S = Js(s — a)(s — b)(s — c) wird YLERONische Flächenformel genannt. C 102) C.103) 2. Berechnung von Seiten, Winkeln und Flächen im schiefwinkligen Dreieck In Übereinstimmung mit den Kongruenzsätzen (s 3 1 3.2,3.S. 136) ist ein Dreieck durch drei voneinander unabhängige Stücke bestimmt, unter denen sich mindestens eine Seite befinden muß. Tabelle 3.4 Bestimmungsgrößen ebener schiefwinkliger Dreiecke, Grundaufgaben Gegeben 1 1 Seite und 2 Winkel (a, a, ß) 2 2 Seiten und der eingeschlossene Winkel (a, 6,7) 3 2 Seiten und der einer von ihnen gegenüberliegende Winkel (a, b, a) 4. 3 Seiten (a, b, c) Formeln zur Berechnung der übrigen Größen *««« n , asinß 7-180°-q-A b-——-, . sma ' asm7 1 c= , 6 = -aosin7 sin a 2 a-ß a-b 7 a+ß 1 tan —-— = cot -, —-— = 90 — - 7, 2 a + 6 2 2 2 ' a und ß werden aus a + ß und a — ß berechnet, asin7 1 c = , ö = - a b sin 7 sincn 2 . . 6sina sin p = , a Für a > b ist ß < 90° und eindeutig bestimmt Für a < b sind folgende Fälle möglich. 1. ß hat für bsma < a zwei Werte (ß2 = 180° - ft). 2. ß hat genau einen Wert (90°) für bsina = a. 3 Für b sin a > a ist eine Dreieckskonstruktion unmöglich: « « ^x asin7 ^ 1 7 . 7= 180°-(a + /3), c=^ -, 5=-afesin7 sma 2 /(s — a)E — b)(s — c) ü; r ß r 7 r tan — = , tan — = -, tan — = , 2 s — a 2 s — b 2 s — c S = rs = Js (s — d)(s — b)(s — c) Daraus leiten sich die vier sogenannten Grundaufgaben ab. Sind von 6 Bestimmungsgrößen eines schiefwinkligen Dreieckes C Winkel a, ß, 7 und die ihnen gegenüberliegenden Seiten a, b, c) 3 gegeben, dann lassen sich die übrigen drei Bestimmungsgrößen mit Hilfe der Gleichungen in Tabelle 3.4 berechnen Im Unterschied zur sphärischen Trigonometrie (s 2. Grundaufgabe, Tabelle 3.9, S 175) läßt sich für das ebene schiefwinklige Dreieck aus der Kenntnis dreier gegebener Winkel keine der Seiten berechnen
148 3 Geometrie 3.2.2 Geodätische Anwendungen 3.2.2.1 Geodätische Koordinaten Zur Bestimmung von Punkten werden in der Geometrie gewöhnlich rechtshändige Koordinatensysteme verwendet (Abb.3.170). Im Unterschied dazu sind in der Geodäsie linkshändige Koordinatensysteme üblich. 1. Geodätische rechtwinklige Koordinaten Im ebenen linkshändigen rechtwinkligen Koordinatensystem (Abb.3.37) ist die x-Achse die nach oben weisende Abszisse, die y-Achse die nach rechts weisende Ordinate. Ein Punkt P besitzt die Koordinaten yp, xp Die Ausrichtung der x-Achse erfolgt nach praktischen Erwägungen Bei Messungen über größere Distanzen, für die meist das SOLDNER- oder das GAUSS-KRÜGER-Koordinatensystem verwendet wird (s 3 4 1.2,2. bzw 3., S 165, bzw S. 166), zeigt die positive x-Achse nach Gitter-Nord, die nach rechts weisende y-Achse nach Osten Die Zählung der Quadranten erfolgt im Gegensatz zu der in der Geometrie sonst üblichen Praxis im Uhrzeigersinn (Abb.3.37, Abb.3.38) Wenn neben der Punktlage in der Ebene auch Höhen anzugeben sind, kann ein dreidimensionales linkshändiges rechtwinkliges Koordinatensystem (y,x,z) verwendet werden, in dem die z-Achse in den Zenit zeigt (Abb.3.36) i «*r N(a P X* Abbildung 3 36 Abbildung 3 37 Abbildung 3.38 2. Geodätische Polarkoordinaten Im linkshändigen System ebener Polarkoordinaten der Geodäsie (Abb.3.38) wird ein Punkt P durch den Richtungswinkel t zwischen der Abszisse und der Strecke s sowie durch die Länge der Strecke s zwischen dem Punkt und dem Koordinatenursprung, Pol genannt, festgelegt. Die positive Richtung der Winkelangabe ist in der Geodäsie der Uhrzeigersinn Zur Bestimmung von Höhen werden der Zenitwinkel £ oder der Höhenwinkel bzw. der Neigungswinkel a verwendet Die Darstellung im rechtwinkligen dreidimensionalen linkshändigen Koordinatensystem (Abb.3.36) zeigt (s auch Rechts- und linkshändige Koordinatensysteme 3.5.3.1,2., S 213), daß der Zenitwinkel zwischen der Zenitachse z und der Strecke s gemessen wird, der Neigungswinkel zwischen der Strecke s und ihrer senkrechten Projektion auf die y, a;-Ebene. 3. Maßstab Maßstab M nennt man im Karten- und Zeichenwesen das Verhältnis von Strecken sk\ in einem Koordinatensystem K\ relativ zu einer Strecke s#2 in einem anderen Koordinatensystem Ki 1. Maßstabsumrechnung für Strecken Mit m als Modul oder Maßzahl und N als Index für Natur und K als Index für Karte gilt. M = l-m = sK sN. C.104a) Für zwei Strecken Ski, sk2 mit verschiedenen Modulen rai, m2 gilt: Ski ' Sr2 = m2 : rrii. 2. Maßstabsumrechnung für Flächen Wenn die Flächen gemäß FK = axbK, rechnet werden, gilt* FN = FKm2. C 104b) F/v = a^N be- C.105a)
3 2 Ebene Trigonometrie 149 Für zwei Flächen Fi, F2 mit verschiedenen Modulen mi, rri2 gilt: FK\ :FK2=m\.m\. C.105b) 3.2.2.2 Winkel in der Geodäsie 1. Neugradeinteilung In der Geodäsie wird im Unterschied zur Mathematik (s. 3 1.1 5, S. 133) die Neugradeinteilung verwendet Der Vollwinkel entspricht hier 400 gon (Gon). Die Umrechnung zwischen Graden und Gon kann gemäß Tabelle 3.5 erfolgen. Tabelle 3 5 Umrechnung zwischen Grad und Gon 1 Vollwinkel 1 rechter Winkel lgon = 360° = 90° = 27T rad = —rad 2 = —— rad 200 = 400 gon = 100 gon = 1000 mgon 2. Richtungswinkel Der Richtungswinkel t in einem Punkt P gibt die Richtung einer orientierten Strecke bezüglich einer durch den Punkt P verlaufenden Parallelen zur x-Achse an. In Abb.3.39 ist tAB der Richtungswinkel zum Punkt A Da die Messung des Winkels in der Geodäsie im Uhrzeigersinn erfolgt (Abb.3.37, Abb.3.38), sind die Quadranten in umgekehrter Reihenfolge numeriert als im rechtshändigen karte- sischen Koordinatensystem der ebenen Trigonometrie (Tabelle 3.6). Die Formeln der ebenen Trigonometrie können aber ohne Änderung verwendet werden Tabelle 3.6 Richtungswinkel bei vorzeichentreuer Streckeneingabe über arctan Ay_ A.T Quadrant Anzeige im Rechner Richtungswinkel t + I tan > 0 t0 gon - II tan < 0 t0 + 200 gon - III tan > 0 t0 + 200 gon + IV tan < 0 t0 + 400 gon 3. Koordinatentransformationen 1. Berechnung von Polarkoordinaten aus rechtwinkligen Koordinaten Für zwei Punkte A(yA, %a) und B(yß, %b) in einem rechtwinkligen Koordinatensystem (Abb.3.39) mit der von A nach B orientierten Strecke sab und den Richtungswinkeln tAB, tßc gut sab = y/AyAB + Ax\B , C.106b) tBA = tAB ± 200 gon C 106d) Der Quadrant des Winkels t hängt von den Vorzeichen von Ai/ab und Axab ab. Wird bei Rechnungen Ay mit dem Taschenrechner —— mit vorzeichentreuen Werten Ay und Ax eingegeben, dann erhält man Ax mit der Taste arctan einen Winkel t0 , zu dem je nach Quadrant die in der Tabelle 3.6 angegebenen Gon-Werte zu addieren sind Vb -Va = &Vab xB - xA Axab tan tAB ¦¦ &VAB Axab ' C 106a) C.106c)
150 3 Geometrie yA y Abbildung 3.39 Abbildung 3.40 2. Berechnung von rechtwinkligen aus polaren Koordinaten beim polaren Anhängen eines Punktes Im rechtwinkligen Koordinatensystem sind die Koordinaten eines Neupunktes C durch Messungen im polaren örtlichen System zu ermitteln (Abb.3.40) Gegeben: yA,XA',yB,xB. Gemessen: a, sbc Gesucht: yc, xc Lösung: tan^ß = AxAE Vc = yß + SßcsintßC, C.107a) C 107c) tBc = tAB + a± 200 gon, C 107b) Xc = Xß + SBC COS tBC . C 107d) Sollte auch sab gemessen worden sein, dann wird der Unterschied zwischen der örtlich gemessenen Strecke und der aus den Koordinaten berechneten Strecke mit dem Maßstabsfaktor q berücksichtigt Q = berechnete Strecke 'AB + ^XAB gemessene Strecke sab C 108a) yc = VB + SbcQ sin tBC , C.108b) xc = xB + sBcq cos tBC . C.108c) 3. Koordinatentransformation zwischen zwei rechtwinkligen Koordinatensystemen Bei der Einbindung örtlich bestimmter Punkte in eine Landeskarte ist die Transformation des örtlichen Systems yf, x' in das Landessystem y, x erforderlich (Abb.3.41). Das System y', x' ist gegen das System y, x um den Winkel </? gedreht und um y0> ^o parallel verschoben. Die Richtungswinkel im System y', x' sind mit $ bezeichnet Gegeben sind die Koordinaten von A und B in beiden Systemen und die Koordinaten eines Punktes C im i', ^/-System. Die Transformation erfolgt mit den folgenden Beziehungen- sab = yfAyAB + Ax\B, C.109a) s'ab = M + Ax% , C.109b) q = sab sab tantab z AyA AxA C 109c) C.109e) V = *AB ~ $AB , tan dA Wai C.109d) C 109f) yo = yA~ qxA sin (p - qyA cos ip , C.109g) yc = yA + q sin <p(x'c - x'A) + q cos <p(y'c - y'A), xc = xA + q cos ip(x'c - x'a) - q sin ip(y'c - y'A) Xq ¦¦ &x'ab ' = XA+qyAsinp — qxACOSip, C.109h) C.1091) C 109j)
3 2 Ebene Trigonometrie 151 Hinweis: Die folgenden zwei Formeln können zur Probe verwendet werden. Vc = yA+qs'AC sm{(p+fiAC), C.109k) xc = xA+qs'AC cos^+tf^c) Wenn die Strecke AB auf der x'-Achse liegt, vereinfachen sich die Formeln zu &VAB . fo 1in v a = —-— = qsimp, M 110a) Vb Vc = Va + ax'c + by'c , C.110c) y'c = AyACb - AxACa, C 110e) , AxAB o = —-— = q cos ip, xB xc = xA + bx'c - ay'c , x'c = AxACb + AyACa C.1091) C.110b) C 110d) C.110f) Abbildung 3 41 Abbildung 3.42 3.2.2.3 Vermessungstechnische Anwendungen In der Geodäsie ist die Ermittlung der Koordinaten eines Neupunktes N im Rahmen der Triangulierung eine oft auftretende vermessungstechnische Aufgabe Verfahren zu ihrer Lösung sind Vorwärtseinschneiden, Rückwärtseinschneiden, Bogenschnitt, freie Stationierung und Polygomerung. Auf die letzten beiden Verfahren wird hier nicht eingegangen 1. Vorwärtseinschneiden 1. Vorwärtseinschneiden durch zwei Strahlen oder 1. Hauptaufgabe der Triangulierung. Bestimmung eines Neupunktes N von zwei gegebenen Punkten A und B mit Hilfe eines Dreiecks ABN (Abb.3.42) Gegeben: yA,xA,yB,xB. Gemessen: a,ß, möglichst auch 7 oder 7 = 200 gon—a — ß Gesucht: yN,%N Lösung: AyAB tan tAB = AxAB ' sab = yAy2AB + &xab = \AyABsmtAB\ + \AxABcostAB\ sina sina sbn = sAB-—sAB^————¦, C 111c) sin 7 sin (a + p) tAN = tAB-a, C.llle) sin/? sin/? sAn = sab-— = sab- . , , ^ sin 7 sin (a + p) C.111a) C.111b) C llld) tBN = tBA + ß = tAB + ß± 200gon,C Ulf)
152 3. Geometrie Vn = Va + San sin tAN = Vb + $bn sin tBN , Vn = xA + San cos t^iv = xB + sbn cos tßw . C.111g) C.111h) Abbildung 3 43 Abbildung 3 44 2. Vorwärtseinschneiden ohne Visier Wenn Punkt B nicht von Punkt A eingesehen werden kann, bestimmt man die Richtungswinkel tAN und tßN über Anschlußrichtungen zu anderen sichtbaren und koordinierten Punkten D und E (Abb.3.43). Gegeben: y^, xa\ Vb, xb; Vd, %d, Ve, xe> Gemessen: S in A, e in £?, möglichst auch 7 Gesucht: Vn^n Lösung: Zurückfuhrung auf die 1. Hauptaufgabe, Berechnung von tan^ß , gemäß C.111a) und: tont ad — Axad ' tAN = tAD + 8 , & = tAB — tAN , tan tAN &VNA C.112a) C.112c) C 112e) C.H2g) Aj/e xN ¦¦ AxNA &VBA + xA sin ^at - xB tan ^ßN ,C.112i) Ax£ß tßN = tßE + £ , ß = tßN - tßA , , , &VNB tan tBN = , AxNB = Vb + (xn ~ xB) tan tBN C 112d) C.112f) C 112h) C.112J) tan tAN — tan tBN 2. Rückwärtseinschneiden 1. Snelliussche Aufgabe des Rückwärtseinschneidens oder Rückwärtseinschneiden einesNeu- punktes N über drei gegebene Punkte A,B,C, auch 2. Hauptaufgabe der Triangulierung genannt (Abb.3.44): Gegeben: yA,XA',yB,xB,yc,xc Gemessen: SuS2 in N. Gesucht: yN,xN. Lösung: tan tAc &VA &XAC AyAc _ Axac sin^c cos tAc C.113a) C.113c) tan tßC = &VB Axßc ' AyBC AxBc sintBc sin tBC ' C.113b) C.113d)
3.2 Ebene Trigonometrie 153 7 = tCA ~ tCB = tAC - tßC ,C 113e) ^±l = 180o_l±^iC.ll3f) tanA = ^, C.113g) 2 2 v ; bsmSi tan^^-tan^y^cotD5° + A), C.113h) San = ^- sin(^ + <p), .C 1131) sbn = -—rsin(^2 + V;M C 113j) scn = -—r-sinv?=-—rsin^, C.113k) sinö2 sin öi sinö2 xN = xA + Saat cos £aat = £ß + sBn cos *bjv , C.1131) Vn = Va + San sin t^ = yB + sßjv sin £ßAr • C 113m) 2. Rückwärtseinschneiden nach Cassini Gegeben: yA,XA,yB,XB,yc,xc- Gemessen: ö?£2 in JV. Gesucht: yN,x^. , Bei diesem Rechenverfahren werden zwei Hilfspunkte P und Q verwendet, die je auf einem Hilfskreis durch A}C,P bzw. B,C,Q sowie beide auf einer Geraden durch N liegen (Abb.3.45). Die Kreismittelpunkte Hi bzw. H2 sind die Schnittpunkte der Mittelsenkrechten von AC bzw. BC mit den Verbindungslinien PC bzw. QC. Die in Af gemessenen Winkel d~i,d~2 erscheinen wieder in P bzw. Q (Peripheriewinkel). Lösung: yp = VA + {xc - xa) cot ö~i , C 114a) xP = xA + (t/c - 2M) cot 6X, C 114b) Vq = Vb + (xb - xc) cot £2 , C 114c) xQ = xB + (vb - Vc) cot 62 , C 114d) tpQ = P&, C H4e) XN = XP+ yc ~ VP + bc-xP) cot tPQ w Axpq ' N ttmtpQ + cottpQ y ' Vn = Vp + (xn - xp) ttmtpQ {tsmtPQ < cottPQ), C 114g) Vn = Vc ~ (x.n ~ xc) cot tPQ (cottPQ < ta,ntPQ), C 114h) Gefahrlicher Kreis: Bei der Punktauswahl ist dafür zu sorgen, daß die vier betrachteten Punkte nicht auf einem Kreis liegen, weil es dann keine Lösung gibt, man spricht vom gefährlichen Kreis. In dem Maße, in dem die Punkte in die Nähe eines gefährlichen Kreises zu liegen kommen, nimmt die Genauigkeit des Verfahrens ab. 3. Bogenschnitt Der Neupunkt N ergibt sich als Schnittpunkt zweier Bögen mit den gemessenen Radien San und sbn um die zwei Punkte A und B mit bekannten Koordinaten (Abb.3.46). Berechnet werden die unbekannte Länge sab und aus den nun bekannten drei Seiten im Dreieck ABN die Winkel Eine zweite hier nicht betrachtete Lösung geht von einer Zerlegung des schiefwinkligen Dreieckes in zwei rechtwinklige Dreiecke aus. Gegeben: yA,%A • yß,Xß- Gemessen: San', Sbn Gesucht: sab, 2/at, xn Lösung: sab = y/Ay2AB + ^ab , C.115a) tan^ß==Ä^f' C 115b) tßA = tAB + 200 gon, C 115c)
154 3 Geometrie A. p\ \ .'' • \.v x ........ vVbl''' 2 \ A ^—-^ y. Abbildung 3 45 «2 -4- «2 c2 cosa=SAC+ AB BN , *ac = ^ß - a, yc = VA + San sin £Ac > yc = VB + sbn sin tßAr, C.115d) C.115f) C.115h) C 115j) Abbildung 3.46 cog/3=4£+4ß_^Aiv) C115e) tBc = tBA-ß, C 115g) .T/v = £\4 + SAC COS ^at , C 115i) XN = XB + SßTV COS tBN C H5k) 3.3 Stereometrie 3.3.1 Geraden und Ebenen im Raum 1. Zwei Geraden Zwei Geraden in ein und derselben Ebene haben entweder einen oder keinen gemeinsamen Punkt. Im letzteren Falle sind sie parallel. Wenn sich durch zwei Geraden keine Ebene legen läßt, wird von windschiefen oder kreuzenden Geraden gesprochen Als Winkel zwischen zwei windschiefen Geraden wird der Winkel zwischen zwei zu ihnen parallelen Geraden bezeichnet, die durch einen Punkt gehen (Abb.3.47). Der Abstand zweier windschiefer Geraden voneinander ist definiert als die Strecke, die auf beiden Geraden senkrecht steht 2. Zwei Ebenen Zwei Ebenen können sich entweder in einer Geraden schneiden, oder sie haben keinen gemeinsamen Punkt. Im letzteren Falle sind sie parallel Wenn zwei Ebenen senkrecht auf ein und derselben Geraden stehen, oder wenn es auf jeder von ihnen je zwei sich schneidende Geraden gibt, die ihrerseits parallel zueinander sind, dann sind die Ebenen parallel zueinander. f Abbildung 3.47 Abbildung 3.48 Abbildung 3.49 3. Gerade und Ebene Eine Gerade kann gänzlich in einer gegebenen Ebene liegen, sie kann mit ihr einen gemeinsamen Punkt haben oder gar keinen Im letzten Fall ist die Gerade parallel zur Ebene
3.3 Stereometrie 155 Der Winkel zwischen einer Geraden und einer Ebene wird zwischen der Geraden und ihrer Orthogonalprojektion auf die Ebene gemessen (Abb.3.48). Wenn eine Gerade senkrecht auf zwei in einer Ebene liegenden und sich schneidenden Geraden verläuft, dann steht sie auf jeder beliebigen Geraden in dieser Ebene senkrecht, d.h , sie steht senkrecht zur Ebene. 3.3.2 Kanten, Ecken, Raumwinkel 1. Kante (Zweiflach) wird eine Figur genannt, die aus zwei, einer Geraden entspringenden Halbebenen gebildet wird (Abb.3.49) Im täglichen Sprachgebrauch versteht man im Unterschied zu dieser Definition unter einer Kante die Schnittgerade zweier Halbebenen. Als Kantenmaß dient der ebene Kantenwinkel ABC, den zwei im Innern der Ebenen senkrecht auf die Schnittgerade DE in den Punkt B gefällte Lote miteinander bilden. 2. Ecke (Vielflach) O ABC DE (Abb.3.50) ist eine Figur, die von mehreren Ebenen, den Seitenflächen, gebildet wird, die ihrerseits einen gemeinsamen Punkt, die Spitze O, haben und sich von hier ausgehend in den Geraden OA, OB, . schneiden. Zwei Geraden, die eine Seitenfläche der Ecke begrenzen, schließen einen ebenen Winkel ein, während zwei benachbarte Seitenflächen eine Kante bilden Ecken sind einander gleich, d.h , sie sind kongruent, wenn sie sich zur Deckung bringen lassen Dazu müssen die einander entsprechenden Elemente, d.h. die Kanten und ebenen Winkel der Ecken, gleich sein Wenn die einander entsprechenden Elemente von Ecken gleich, aber in umgekehrter Reihenfolge angeordnet sind, dann lassen sich die Ecken zwar nicht zur Deckung bringen, sie werden aber symmetrische Ecken genannt, weil sie in die in Abb.3.51 eingezeichnete symmetrische gegenseitige Lage zueinander gebracht werden können Eine konvexe Ecke liegt vollständig auf einer Seite jeder ihrer Kanten. Die Summe der ebenen Winkel AOB + BOC 4- .. + EOA (Abb.3.50) jeder beliebigen konvexen Ecke ist kleiner als 360° . 3. Dreiseitige Ecken sind kongruent, wenn sie in den folgenden Elementen übereinstimmen: • in zwei Seiten und dem zugehörigen Kantenwinkel, • in einer Seite und den beiden anliegenden Kantenwinkeln, • in drei einander entsprechenden und in der gleichen Reihenfolge angeordneten Seiten, • in drei einander entsprechenden und in der gleichen Reihenfolge angeordneten Kantenwinkeln Abbildung 3 50 Abbildung 3.51 Abbildung 3.52 Abbildung 3.53 4. Raumwinkel Im Raum bildet ein von einem Punkt ausgehendes Strahlenbüschel einen Raumwinkel (Abb.3.52). Dieser wird mit Q bezeichnet und gemäß ft=4> C.116a) berechnet. Dabei bedeutet S das Oberflächenstück, das der Raumwinkel aus einer Kugel ausschneidet, die den Radius r hat und deren Mittelpunkt mit der Spitze des Strahlenbüschels zusammenfällt. Die Einheit des Raumwinkels ist der Steradiant (sr). Es gilt: Im2 lsr=—, C.116b) Im2
156 3 Geometrie d.h., ein Raumwinkel von 1 sr schneidet auf der Einheitskugel (r = 1 m) eine Fläche der Größe 1 m2 aus ¦ A: Der volle Raumwinkel beträgt Vi = 4irr2/r2 = 4-zr. ¦ B: Ein Kegel mit dem Offnungswinkel a = 120° beschreibt den RaumwinkeK2 = 27rr2(l —cos(a/2)/r = TT, wobei die Formel für den Kugelabschnitt C 164) berücksichtigt wurde 3.3.3 Polyeder In diesem Abschnitt werden die folgenden Bezeichnungen benutzt V - Volumen, S - Gesamtoberfläche, M - Mantelfläche, h - Höhe, AG Grundfläche 1. Polyeder wird ein Körper genannt, der von Ebenen begrenzt wird 2. Prisma (Abb.3.53) ist ein Polyeder, das gleiche Grundflächen und Parallelogramme als Seitenflächen besitzt. Ein gerades Prisma zeichnet sich durch senkrecht auf der Grundfläche stehende Kanten aus, ein reguläres Prisma dadurch, daß es gerade ist und ein regelmäßiges Vieleck zur Grundfläche hat Für das Polyeder gilt V = AGh, C.117) M=pl: C.118) S = M + 2AG C119) Dabei sind p der Umfang eines zu den Kanten senkrechten ebenen Schnittes und / die Kantenlänge Für ein dreiseitiges Prisma, dessen Grundflächen nicht parallel zueinander liegen (Abb.3.54), gilt- V=(a + fc3+c)Q. C120) wobei Q ein senkrechter Querschnitt, a, b und c die Längen der parallelen Kanten sind. Für ein n-seitiges Prisma mit nicht parallel zur Grundfläche abgeschnittener Deckfläche ist V = IQ, C121) wobei / die Länge der Geraden DC ist, die die Schwerpunkte der Grundflächen miteinander verbindet und Q der zu dieser Linie senkrechte Querschnitt. Abbildung 3 54 Abbildung 3 55 Abbildung 3 56 3. Parallelepiped (Abb.3.55) werden Prismen mit Parallelogrammen als Grundfläche genannt In einem Parallelepiped schneiden sich alle vier Raumdiagonalen in einem Punkt und halbieren einander. 4. Quader sind gerade Parallelepipede mit rechteckigen Grundflächen Im Quader (Abb.3.56) sind die Raumdiagonalen gleich lang Wenn a, b und c die Kantenlängen des Quaders sind und d die Diagonallänge, dann gilt d2 = a2 + fe2 + c2 ,C.122). V = abc, C.123) S = 2(ab + bc + ca) C.124) 5. Würfel sind Quader mit gleichen Kantenlängen a = b = c, d2 = 3a2, C 125) V = a3, C126) S = 6a2. C127)
3 3 Stereometrie 157 6. Pyramide (Abb.3.57) wird ein Polyeder genannt, dessen Grundfläche ein Vieleck ist und dessen Seitenflächen Dreiecke sind, die in einem Punkt, der Spitze, zusammenlaufen. Pyramiden heißen gerade, wenn der Fußpunkt des Lotes von der Spitze auf die Grundfläche Aq deren Mittelpunkt ist, regulär, wenn die Grundfläche ein regelmäßiges Vieleck ist (Abb.3.58) und n-seitig, wenn die Grundfläche ein n-Eck ist. Zusammen mit der Grundfläche hat die Pyramide (n + 1) Flächen. Es gilt- Ach 3 Für die reguläre Pyramide ist V ¦ C.128) M = -phs mit p als Umfang der Grundfläche und hs als Höhe einer Seitenfläche. S C.129) 1 \\l s 1 ^ Abbildung 3 57 Abbildung 3.58 Abbildung 3 59 7. Pyramidenstumpf wird eine Pyramide genannt, deren Spitze durch eine Ebene parallel zur Grundfläche abgeschnitten ist (Abb.3.57, Abb.3.59). Mit SO als Höhe der Pyramide, d h. als Lot von der Spitze auf die Grundfläche, gilt ~SÄL_ 5ß1_ ~SC±_ _ 5Ö! ~P^Ä~ ~B^B~ C^C~ '"~ ÖiÜ' Fläche ABCDEF _ ( £Ö_X 2 C.130) C 131) Fläche AxBxdD^^ Wenn AD und Aq die obere und untere Grundfläche sind, h die Höhe des Pyramidenstumpfes, also dei Abstand zwischen den Grundflächen, ap und ac die einander entsprechenden Seiten der Grundflächen, dann gilt V -- -h |AG + AD + V^g^d] = 2hAc 3 L v J 3 Die Mantelfläche des regulären Pyramidenstumpfes ist i+^+(>y aG \aGJ C.132) C 133) wobei po und pc die Umfange der Grundflächen sind und hs die Höhe der Seitenflächen 8. Tetraeder wird eine dreieckige Pyramide genannt (Abb.3.60). Mit den Bezeichnungen ÜÄ = a,ÜB = b,77C = c,ÜÄ = q, ~BC = p und~ÄB = r gilt: 1 288 0 r2 q2 a1 1 r2 0 v2 ti2 1 q2 v2 0 c2 1 a2 b2 c2 0 1 1 1 1 1 0 C 134)
158 3. Geometrie Abbildung 3.60 Abbildung 3 61 Abbildung 3 62 9. Obelisk wird ein Polyeder genannt, dessen Seitenflächen sämtlich Trapeze sind In dem hier betrachteten Spezialfall sind die parallelen Grundflächen Rechtecke (Abb.3.61). einander gegenüberliegende Kanten haben die gleiche Neigung gegenüber der Grundfläche, laufen aber nicht in einem Punkt zusammen Wenn a, b und oi, b\ die Seiten der Grundflächen sind und h die Höhe des Obelisken, dann gilt- V = - [Ba + ai) b + Bai + a) bi] = - [ab + (a + ax) {b + 6i) + axbi 6 o C 135) 10. Keil wird ein Polyeder genannt, dessen Grundfläche ein Rechteck, dessen Seitenflächen je zwei gegenüberliegende gleichschenklige Dreiecke bzw Trapeze sind (Abb.3.62). Für das Volumen gilt V = -Ba + ai)bh. 6 C 136) Abbildung 3 63 11. Reguläre Polyeder zeichnen sich durch kongruente reguläre Vielecke als Begrenzungsflächen und kongruente reguläre Ecken aus. Die fünf möglichen regulären Polyeder sind in Abb.3.63 dargestellt; in Tabelle 3.7 sind Angaben dazu aufgeführt Tabelle 3 7 Elemente der regulären Polyeder mit der Kantenlänge a Bezeichnung Begrenzungsflächen Kanten Ecken Gesamtfläche S/a2 Volumen V/a3 72 Tetraeder Würfel Oktaeder Dodekaeder Ikosaeder 4 Dreiecke 6 Quadrate 8 Dreiecke 12 Fünfecke 20 Dreiecke 6 12 12 30 30 6 20 12 >/3 = 1,7321 6 = 6,0 2^ = 3,4641 3^/5E + 2\/5) =20,6457 5\/3 =8,6603 12 1 x/2 15 + 7V5 = 0,1179 = 1,0 = 0,4714 = 7,6631 5C + VE) 12 = 2,1817
3 3 Stereometrie 159 12. Eulerscher Polyedersatz Wenn e die Anzahl der Ecken, / die Anzahl der Flächen und k die Anzahl der Kanten sind, dann ist e-fc + / = 2 C.137) für ein konvexes Polyeder oder ein Polyeder, das sich durch stetige Deformation in ein konvexes Polyeder überführen läßt Beispiele sind in Tabelle 3.7 angegeben. 3.3.4 Körper, die durch gekrümmte Flächen begrenzt sind In diesem Abschnitt werden die folgenden Bezeichnungen benutzt: V - Volumen, S - Gesamtoberfläche, M - Manteloberfläche, h - Höhe, Aq - Grundfläche. 1. Zylinderfläche wird eine gekrümmte Fläche genannt, die durch Parallel Verschiebung einer Geraden, der Erzeugenden, längs einer Kurve, der Leitkurve, entsteht (Abb.3.64). 2. Zylinder wird ein Körper genannt, der von einer Zylinderfläche mit geschlossener Leitkurve umgrenzt wird sowie von zwei parallelen Grundflächen, die die Zylinderfläche aus zwei parallelen Ebenen ausschneidet Für jeden beliebigen Zylinder (Abb.3.65) mit dem Grundflächenumfang p, dem Umfang des zur Erzeugenden senkrechten Querschnitts s, dessen Flächeninhalt Q und der Länge / der Erzeugenden gilt V = AGh = Ql, C 138) M = ph = sl C.139) 3. Gerade Kreiszylinder zeichnen sich durch einen Kreis als Grundfläche und senkrecht auf der Kreisebene stehende Erzeugende aus (Abb.3.66) Mit R als Grundflächenradius gilt: V = 7rR2h, C.140) M = 2nRh, C.141) S = 27rR(R + h) C 142) 4. Schräg abgeschnittener Kreiszylinder (Abb.3.67) --7TR2 C.143) M = nR(hi + h2) C.144) S = ttR hl + h2 + R+ ¦ R? + hx C.145) Erzeugende Leitkurve Abbildung 3.64 Abbildung 3.65 Abbildung 3 66 Abbildung 3.67 5. Zylinderabschnitt, auch Zylinderhuf Mit den Bezeichnungen von Abb.3.68 sowie a = (p/2 in rad gilt V = A [aC#2 - a2) + 3R2(b - R)a] = ^ Lina - *-^ - acosa) , C 146) 3b I M = ^A [F _ R)a + a] C 147)
160 3 Geometrie wobei die Formeln auch im Falle b > R, tp > tt ihre Gültigkeit behalten 6. Hohlzylinder Mit den Bezeichnungen R für den äußeren Radius und r für den inneren, 6 — R — r R + r für die Radiendifferenz und q = —-— für den mittleren Radius (Abb.3.69) gilt- V = irh(R2 - r2) = 7ThS{2R -6) = irhöBr + 6) = 27rhSg C 148) Abbildung 3.68 Abbildung 3.69 7. Kegelflächen entstehen durch die Bewegung einer Geraden, der Erzeugenden, die durch einen festen Punkt, die Spitze, geht und längs einer Kurve, der Leitkurve, geführt wird (Abb.3.70). 8. Kegel (Abb.3.71) werden von einer Kegelfläche mit geschlossener Leitkurve und einer ebenen Grundfläche, die von der Kegelfläche ausgeschnitten wird, begrenzt Für beliebige Kegel gilt hAG V = C 149) Leitkurve Spitze Abbildung 3 70 Abbildung 3.71 Abbildung 3.72 Abbildung 3 73 Abbildung 3 74 9. Gerade Kreiskegel zeichnen sich durch einen Kreis als Grundfläche und eine Spitze über dem Kreismittelpunkt aus (Abb.3.72). Mit / als Länge der Mantellinie und R als Grundflächenradius gilt* V = -Tri?2/*, C.150) M = ttRI = ttRVR2 + h2 , C151) S = ttR{R + 1). C.152) 10. Gerader Kreiskegelstumpf (Abb.3.73)
3 3 Stereometrie 161 l = y/h2 + (R- rf, 7rh C.153) C.155) M = 7rl(R + r), hr R-r' C 154) C.156) V = y (Ä2 + r2 + Ar) , C.155) H = h + 11. Kegelschnitte s. 3.5 2.11, S. 210 12. Kugel (Abb.3.74) mit dem Radius R und dem Durchmesser D = 2R Jeder ebene Kugelschnitt ergibt einen Kreis. Ein ebener Schnitt durch den Kugelmittelpunkt ergibt einen Großkreis (s. 3.4.1.1,1., S 163) mit dem Radius R. Durch je zwei nicht diametral gegenüberliegende Kugeloberflächenpunkte kann immer nur ein Großkreis gelegt werden Die kürzeste Verbindungslinie zwischen zwei Kugeloberflächenpunkten auf der Kugeloberfläche ist der Bogen des Großkreises (s. 3.4.1.1,1., S. 163). Formeln für die Kugeloberfläche und das Kugelvolumen: S = ttD2 « 3,142£>2 , C 157b) 4 S = 47nR2«12,57i?2, C 157a) S = \/36nV2 « 4,836 vV2 , C.157c) ttD3 V = -ttR3 » 4,189i?3 V = '—r- » 0,5236£>3 6 C.158b) C.158a) l r& V = -J— » 0,09403\/53 , C.158c) #= i*/-»0,2821>/5, C.159a) 13. Kugelausschnitt (Abb.3.75) 5 = 7TÄB/i + a), C.160) 14. Kugelabschnitt (Abb.3.76) a2 = h{2R -h), C 162) M = 2nRh = TT (a2 + /i2) , C.164) 15. Kugelschicht (Abb.3.77) (a2-b2-h2^2 R = ; 0,6204^/7. C.159b) V = 2nR2h V = Kh Ca2 + h2) = ^7rh2(SR - h), S = TT BRh + a2) = TT (V + 2a2) C.161) C.163) C.165) -a2+(° M = 27ri?/i, 2h C 166) C 168) V = jU/i Ca2 + 362 + h2) , C.167) S = TT B/tt + a2 + 62) C.169) Wenn Vi das Volumen eines Kegelstumpfes ist, der in eine Kugelschicht einbeschrieben ist (Abb.3.78) und / die Länge seiner Mantellinie ist, dann gilt 1 V-Vl = -nhl2 6 C 170) 16. Torus oder Kreisring (Abb.3.79) wird ein Körper genannt, der durch die Drehung eines Kreises um eine in der Kreisebene, aber außerhalb des Kreises liegende Achse entsteht. S = 4ir2Rr «39,48#r, C.171a) S = ir2Dd& 9,870£>d, V = 2n2Rr2 « 19,74#r2, C.172a) C 171b) 1 V=-TT2Dd2&2,mDd2 C.172b)
162 3. Geometrie Abbildung 3.75 Abbildung 3.78 fv ^3 -2a- Abbildung 3.76 Abbildung 3 79 Abbildung 3 77 -d- Abbildung 3 80 17. Tonnenkörper (Abb.3.80) enstehen durch Drehung einer Erzeugenden mit entsprechender Krümmung; Kreistonnenkörper durch Drehung eines Kreissegments, parabolische Tonnenkörper durch Drehung eines Parabelausschnittes Für den Kreistonnenkörper gilt näherungsweise V « 0,262/i BD2 + d2) C.173a) oder für den parabolischen Tonnenkörper gilt i 0,05236/i (SD2 + 4Dd + Sd2) . V=^BD2 + Dd+-a 15 V 4 V « 0,0873/*B£> + dJ , C 173b) C 174)
3 4 Sphärische Trigonometrie 163 3.4 Sphärische Trigonometrie Bei geodätischen Messungen, die sich über größere Entfernungen erstrecken, muß die Kugelgestalt der Erde berücksichtigt werden Dazu ist eine Geometrie auf der Kugel erforderlich. Insbesondere werden Formeln zur Berechnung sphärischer Dreiecke benötigt, also für Dreiecke, die auf einer Kugel liegen Das wurde schon im alten Griechenland erkannt, und so kam es neben der Entwicklung der ebenen Trigonometrie zur Entwicklung der sphärischen Trigonometrie, als deren Begründer HiPPARCH (um 150 v. u Zeit) anzusehen ist 3.4.1 Grundbegriffe der Geometrie auf der Kugel 3.4.1.1 Kurven, Bogen und Winkel auf der Kugel 1. Sphärische Kurven, Großkreis und Kleinkreis Kurven auf der Kugeloberfläche heißen sphärische Kurven Wichtige sphärische Kurven sind Großkreise oder Orthodromen und Kleinkreise Sie entstehen als Schnittkreis einer durch eine Kugel verlaufenden Ebene, Schnittebene genannt (Abb.3.81) Wird eine Kugel mit dem Radius R von einer Ebene K geschnitten, die vom Kugelmittelpunkt O den Abstand h hat, dann gilt für den Radius r des Schnittkreises r = VR2 - h2 @<h<R). C 175) Für h — 0 verläuft die Schnittebene durch den Kugelmittelpunkt, und r nimmt den größten Wert an Der so entstehende Schnittkreis g in der Ebene T heißt Großkreis Jeder andere Schnittkreis, für den dann 0 < h < R gilt, wird Kleinkreis genannt, z B der Kreis k in Abb.3.81 Für h = R berührt die Ebene K die Kugel in einem Punkt. Sie wird zu einer sogenannten Tangentialebene Abbildung 3 81 Abbildung 3 82 Abbildung 3.83 ¦ Auf der Erdkugel stellen der Äquator und die Meridiane mit ihren Gegenmeridianen - das sind ihre Spiegelungen an der Erdachse - Großkreise dar. Die Breitenkreise sind Kleinkreise (s. 3.4.1 2,1. S 165) 2. Sphärischer Abstand Durch zwei Punkte A und D der Kugeloberfläche, die keine Gegenpunkte, d.h. keine Endpunkte eines Durchmessers sind, lassen sich unendlich viele Kleinkreise, aber nur ein Großkreis (mit der Großkreisebene von g) legen Durch A und B seien zwei Kleinkreisc ki,k2 gelegt und in die Ebene des durch A, B gehenden Großkreises geklappt (Abb.3.82). Der Großkreis hat den größten Radius und damit die kleinste Krümmung, daher stellt der kleinere der beiden Großkreisbögen durch A und B die kürzeste Verbindung beider Punkte dar Er ist die kürzeste Verbindung zwischen den Punkten A und B auf der Kugeloberfläche und wird sphärischer Abstand genannt 3. Geodätische Linien Geodätische Linien heißen diejenigen Kurven auf einer beliebigen Fläche, auf denen die kürzeste Verbindung zwischen zwei Punkten der Fläche liegt (s 3 6 3 6,1., S 258).
164 3. Geometrie ¦ In der Ebene sind die Geraden, auf der Kugel die Großkreise die geodätischen Linien (s auch 3.4 1.2,1. S. 165) 4. Messung des sphärischen Abstandes Der sphärische Abstand zweier Punkte kann im Längenmaß oder im Winkelmaß ausgedrückt werden (Abb.3.83). 1. Sphärischer Abstand im Winkelmaß ist der Winkel zwischen den Radien OA und OB , gemessen im Kugelmittelpunkt 0 . Dieser Winkel ist dem sphärischen Abstand eindeutig zugeordnet und wird im folgenden mit kleinen lateinischen Buchstaben bezeichnet. Die Bezeichnung kann am Kugelmittelpunkt oder auf dem Großkreisbogen angegeben werden 2. Sphärischer Abstand im Längenmaß ist die Länge des Großkreisbogens zwischen A und B Sie wird im folgenden mit AB (Bogen AB) bezeichnet. 3. Umrechnungen von Winkelmaß in Längenmaß und umgekehrt erfolgen gemäß AB= R&rce = R-, C.176a) e =AB -^ C 176b) Q R Dabei ist e der in Grad und arc e der in Radiant (s Bogenmaß 3 1 1 5, S 133) gemessene Winkel Für den Umrechnungsfaktor g gilt: 180° g = lrad = = 57,2958° = 3438' = 206265". C.176c) 7T Die Angaben im Längen- oder Winkelmaß sind gleichwertig, aber in der sphärischen Trigonometrie werden die sphärischen Abstände in der Regel im Winkelmaß angegeben. ¦ A: Bei sphärischen Berechnungen auf der Erdoberfläche wird von einer Kugel ausgegangen, die das gleiche Volumen wie das zweiachsige Referenzellipsoid von Krassowski hat Dieser Erdkugelradius beträgt R = 6371,110 km, woraus folgt 1° = 111,2 km, 1' = 1853,3 m = 1 alte Seemeile Heute gilt 1 Seemeile = 1852 m. ¦ B: Der sphärische Abstand zwischen Dresden und St. Petersburg beträgt AB= 1433 km oder e = Abbildung 3 84 5. Schnittwinkel, Kurswinkel und Azimut Unter dem Schnittwinkel zweier sphärischer Kurven versteht man den Winkel, den ihre Tangenten im Kurvenschnittpunkt P\ bilden Ist eine der beiden Kurven ein Meridian, dann wird der Schnittwinkel der nördlich von P\ gelegenen Kurvenabschnitte in der Navigation Kurswinkel a genannt Zur Beschreibung der östlichen und westlichen Neigung der Kurve ordnet man dem Kurswinkel gemäß (Abb.3.84a,b) ein Vorzeichen zu und beschränkt ihn auf das Intervall —90° < a < 90° . Der Kurswinkel ist damit ein orientierter, d h. mit einem Vorzeichen versehener Winkel Er ist unabhängig von der Orientierung der Kurve - das ist ihr Durchlaufsinn. Die Orientierung der Kurve von P\ nach P2 gemäß Abb.3.84c wird durch das Azimut S beschrieben Es ist der Schnittwinkel zwischen dem durch den Kurvenschnittpunkt P\ verlaufenden und nach Norden weisenden Meridian und dem von P\ nach P2 verlaufenden Kurvenabschnitt Man beschränkt das
3.4 Sphärische Trigonometrie 165 Azimut auf das Intervall 0° < S < 360°. Hinweis: In der Navigation werden die Ortskoordinaten meist in sexagesimalen Altgraden, sphärische Abstände sowie Kurswinkel und Azimute dagegen in dezimalen Altgraden angegeben. 3.4.1.2 Spezielle Koordinatensysteme 1. Geographische Koordinaten Zur Bestimmung von Punkten P auf der Erdoberfläche werden geographische Koordinaten benutzt (Abb.3.85), d.h Kugelkoordinaten mit dem Radius der Erdkugel, der geographischen Länge X und der geographischen Breite (p Zur Längengradzählung ist die Erdoberfläche in halbe, vom Nordpol zum Südpol verlaufende Großkreise, die Meridiane, eingeteilt. Der Nullmeridian verläuft durch die Sternwarte Greenwich. Von ihm aus erfolgt die Zählung mit Hilfe von 180 ganzzahligen Meridianen östlicher Länge (ö. L ) und 180 ganzzahligen Meridianen westlicher Länge (w L ), die am Äquator einen gegenseitigen Abstand von 111 km haben Ostliche Längen werden positiv, westliche Längen negativ angegeben. Somit gilt-180° < A< +180° Null] Geogr< Länge Geographische •eitecp Abbildung 3.85 Zur Breitengradzählung ist die Erdoberfläche in parallel zum Äquator verlaufende Kleinkreise, die Breitengrade, eingeteilt Vom Äquator aus, einem Großkreis, zählt man 90 ganzzahlige Breitengrade nördlicher Breite (n. Br ) und 90 südlicher Breite (s Br ). Nördliche Breiten werden positiv, südliche Breiten negativ angegeben Somit gilt —90° < (p < 90° 2. Soldner-Koordinaten Für großräumige Vermessungen sind die rechtwinkligen SÖLDNER- Koordinaten und G AUSS-KrÜGER -Koordinaten von Bedeutung Um Teile der gekrümmten Erdoberfläche in Ordinatenrichtung längentreu auf ein ebenes rechtwinkliges Koordinatensystem abzubilden, legt man nach Söldner die a;-Achse auf einen Meridian und den Koordinatenursprung in einen gut vermessenen Zentralpunkt (Abb.3.86a). Die Ordinate y und die Abszisse x eines Punktes P sind durch die Strecken von den Fußpunkten der sphärischen Lote auf den durch den Zentralpunkt verlaufenden Hauptmeridian und auf den durch den Zentralpunkt verlaufenden Hauptbreitenkreis gegeben (Abb,3.86b) rallele Kreise Nullmeri- idian durch Zentralpunkt +X' +x2 +*1 -y o -X l Ax Pj !Ax p2 +y b) Abbildung 3.86 Bei der Übertragung der sphärischen Abszissen und Ordinaten in das ebene Koordinatensystem werden Strecken Ax gedehnt und Richtungen verschwenkt. Der Dehnungsfaktor a in der Abszissenrichtung
166 3. Geometrie beträgt Ax y2 R = 6371 km. C 177) Zur Begrenzung der Dehnung des Systems darf die Ausdehnung zu beiden Seiten des Hauptmeridians nicht größer als 64 km betragen Eine 1 km lange Strecke besitzt dann bei y = 64 km eine Dehnung von 0,05 m 3. Gauß-Krüger-Koordinaten Um Teile der gekrümmten Erdoberfläche winkeltreu (konform) auf eine Ebene abzubilden, geht man beim GausS-KrÜGER-System von einer Einteilung in Meridianstreifen aus. Für Deutschland liegen die Mittelmeridiane bei 6°, 9°, 12° und 15° ö L. (Abb.3.87a) Der Koordinatenursprung jedes Meridianstreifensystems ist der Schnittpunkt des Meridians mit dem Äquator In der Nord-Süd-Richtung gehen die Systeme über das gesamte Gebiet hinweg, in der Ost-West-Richtung sind die Gebiete beidseitig auf 1°40/ begrenzt In Deutschland sind das etwa ±100 km. Die Überlappung von etwa 20' entspricht hier ca. 20 km. Der Dehnungsfaktor a in der Abszissenrichtung (Abb.3.87b) ist der gleiche wie im SOLDNER-System C 177). Damit die Abbildung winkeltreu bleibt, sind die Ordinaten an den Lotenden durch Addition eines Betrages b zu verlängern. y° 6R2' C 178) i ' i Rechtswert Hochwert y - Dehnung 7° 8° 9p\10°ll° Äquator -50km-J a) Abbildung 3.87 3.4.1.3 Sphärisches Zweieck Durch die Endpunkte A und B eines Kugeldurchmessers sollen zwei Ebenen Ti und T2 verlaufen, die den Winkel a miteinander einschließen (Abb.3.88) und zwei Großkreishälften gi und g2 definieren Der von zwei Großkreishälften begrenzte Teil der Kugeloberfläche wird sphärisches Zweieck oder Kugelzweieck genannt. Als Seiten des sphärischen Zweiecks werden die sphärischen Abstände zwischen den Punkten A und B auf den Großkreisen definiert Jede Seite beträgt daher 180° Als Winkel des sphärischen Zweiecks werden die Winkel zwischen den Tangenten an die Großkreise gi und g2 in den Punkten A und B definiert. Sie sind gleich und stimmen mit dem sogenannten Keilwinkel a zwischen den Ebenen Ti und T2 überein Sind C und D die Halbierungspunkte der beiden Großkreisbogen durch A und B, dann kann der Winkel a auch als sphärischer Abstand der Punkte C und D aufgefaßt werden Die Fläche Az des Kugelzweiecks verhält sich zur Kugelfläche wie der Winkel a zu 360°. Daraus folgt Az = = = 2R2 arca mit dem Umrechnungsfaktor g gemäß C 176c) C.179) 3.4.1.4 Sphärisches Dreieck Es seien A, B und C drei Punkte auf einer Kugelfläche, die nicht auf einem Großkreis liegen Werden jeweils zwei dieser Punkte durch einen Großkreis verbunden (Abb.3.89), so entsteht das sphärische Dreieck ABC.
3 4 Sphärische Trigonometrie 167 Abbildung 3 88 Abbildung 3.89 Abbildung 3 90 Als Seiten des sphärischen Dreiecks werden die sphärischen Abstände der Dreieckspunkte definiert, d h , sie stellen die im Kugelmittelpunkt gemessenen Winkel zwischen je zwei Radien OA, OB und OC dar Sie werden mit a, b und c bezeichnet und im folgenden im Winkelmaß angegeben, unabhängig davon, ob sie in der Zeichnung als Winkel im Kugelmittelpunkt oder als Großkreisbogen auf der Kugelfläche eingetragen sind Die Winkel des sphärischen Dreiecks sind die Winkel zwischen je zwei der drei Großkreisebenen. Sie werden mit a, ß und 7 bezeichnet Die Reihenfolge der Bezeichnung der Punkte, Seiten und Winkel des sphärischen Dreiecks erfolgt in Analogie zum ebenen Dreieck Ein sphärisches Dreieck, bei dem mindestens eine Seite 90° beträgt, heißt rechtsseitiges Dreieck Es stellt eine Analogie zum rechtwinkligen Dreieck der Planimetrie dar Abbildung 3.91 Abbildung 3.92 3.4.1.5 Polardreieck 1. Pole und Polare Die Endpunkte P\ und P<i eines Kugeldurchmessers, der senkrecht zur Ebene eines Großkreises g, Polare genannt, errichtet ist (Abb.3.90), werden Pole genannt. Der sphärische Abstand von einem Pol bis zu einem beliebigen Punkt des Großkreises g beträgt stets 90° Die Richtung der Polaren wird von außen festgelegt- Beim Durchlaufen der Polaren in der gewählten Richtung heißt der links liegende Pol Linkspol, der rechts liegende Rechtspol 2. Polardreieck A'B'C zu einem gegebenen sphärischen Dreieck A, B, C heißt ein sphärisches Dreieck, für dessen Seiten die Eckpunkte des gegebenen Dreiecks Pole sind (Abb.3.91) Zu jedem sphärischen Dreieck ABC existiert ein Polardreieck A'B'C Ist das Dreieck A'B'C das Polardreieck des sphärischen Dreiecks ABC, dann ist auch das Dreieck ABC das Polardreieck des Dreiecks A'B'C. Die Winkel eines sphärischen Dreiecks und die entsprechenden Seiten seines Polardreiecks sind Supplementwinkel, und die Seiten des sphärischen Dreiecks und die Winkel des Polardreiecks sind Supplementwinkel a' = 180° - a, b' = 180° - ß, c' = 180° - 7, C 180a)
168 3. Geometrie 180° - a, ß' = 180° - b, 7 180° C.180b) 3.4.1.6 Eulersche und Nicht—Eulersche Dreiecke Die Eckpunkte A, B, C des sphärischen Dreiecks teilen jeden Großkreis durch zwei Eckpunkte im allgemeinen in zwei ungleiche Teile. Dadurch entstehen mehrere verschiedene sphärische Dreiecke, z.B. auch das sphärische Dreieck mit den Seiten af, 6, c und der in Abb.3.92a schattierten Fläche. Gemäß einer Festsetzung von Euler werden für die Seiten des sphärischen Dreiecks nur die Großkreisbogen gewählt, die kleiner als 180° sind Das entspricht der Definition der Seiten als sphärische Abstände zwischen den Dreieckspunkten. In diesem Zusammenhang bezeichnet man sphärische Dreiecke, bei denen jede Seite und jeder Winkel kleiner als 180° ist, als EuLERsche Dreiecke, anderenfalls als Nicht- EULERsche Dreiecke Die Abb.3.92b zeigt ein EuLERsches und ein Nicht-EuLERsches Dreieck. 3.4.1.7 Dreikant oder Triederecke wird eine dreiseitige körperliche Ecke genannt, die von drei, von einem Scheitelpunkt O ausgehenden Strahlen sa, s&, sc (Abb.3.93a), den Kanten, gebildet wird Als Seiten des Dreikants definiert man die Winkel a, b und c, die von je zwei der Kanten eingeschlossen sind Die Gebiete zwischen zwei Kanten heißen Seitenflächen des Dreikants Die Winkel des Dreikants sind die Keilwinkel a, ß und 7, die von je zwei der drei Seitenflächen eingeschlossen werden Ein Dreikant schneidet aus einer Kugel um den Scheitelpunkt O ein sphärisches Dreieck aus (Abb.3.93b). Die Seiten und Winkel des sphärischen Dreiecks und des zu ihm gehörenden Dreikants sind einander gleich Deshalb gelten Sätze, die für den Dreikant hergeleitet wurden, auch für das zugehörige sphärische Dreieck und umgekehrt a) b) Abbildung 3.93 3.4.2 Haupteigenschaften sphärischer Dreiecke 3.4.2.1 Allgemeine Aussagen Für ein EuLERsches Dreieck mit den Seiten a, b und c, denen die Winkel a, ß und 7 gegenüberliegen, gilt 1. Summe der Seiten Die Summe der Seiten liegt zwischen 0° und 360° 0°<a + b + c< 360° C 181) 2. Summe zweier Seiten Die Summe zweier Seiten ist größer als die dritte, z.B. a + b>c C.182) 3. Differenz zweier Seiten Die Differenz zweier Seiten ist kleiner als die dritte Seite, z B. \a - b\ < c C 183) 4. Summe der Winkel Die Summe der Winkel liegt zwischen 180° und 540°: 180° < a + ß + 7 < 540° . C 184) 5. Sphärischer Exzeß Die Differenz C.185) wird sphärischer Exzeß genannt e = a + ß + 7 - 180° C 185)
3.4 Sphärische Trigonometrie 169 6. Summe zweier Winkel Die Summe zweier Winkel ist kleiner als der um 180° vergrößerte dritte Winkel, z.B. a + /?<7+180°. C.186) 7. Gegenüberliegende Seite und Winkel Der größeren Seite liegt der größere Winkel gegenüber und umgekehrt 8. Flächeninhalt Der Flächeninhalt Ad eines sphärischen Dreieckes kann mit Hilfe des sphärischen Exzesses e und dem Kugelradius R gemäß AD = eR2 ¦ — = — = R2 arce C.187a) 180° q K ' berechnet werden, wobei q der Umrechnungsfaktor C 176c) ist Nach dem Satz von GiRARD gilt mit AK als Kugeloberfläche AD = 4^e C 187b) 720° v Ist nicht der Exzeß, sondern sind die Seiten bekannt, dann kann e mit Hilfe der Formel von L'HuiLlER C.202) berechnet werden. 3.4.2.2 Grundformeln und Anwendungen Die Bezeichnungen der Größen dieses Abschnittes entsprechen denen von Abb.3.89 1. Sinussatz 2££ = 5E£ C 188a) «£6 = «E£i C188b) sinc = sin7 C 18gc) sino smp sine sin 7 sina sina Die Gleichungen C 188a) bis C 188c) lassen sich auch als fortlaufende Proportionen schreiben, d.h., im sphärischen Dreieck verhalten sich die Sinus der Seiten wie die Sinus der Gegenwinkel- sina = sinfc sine sin öl sin ß sin 7 Der Sinussatz der sphärischen Trigonometrie entspricht dem Sinussatz der ebenen Trigonometrie. 2. Kosinussatz oder Seitenkosinussatz cos a = cos 6 cos c + sin 6 sin c cos a , C.189a) cos 6 = cos c cos a + sine sina cos ß, C.189b) cos c = cos a cos b + sin a sin b cos 7 C 189c) Der Seitenkosinussatz der sphärischen Trigonometrie entspricht dem Kosinussatz der ebenen Trigonometrie Die Bezeichnung Seitenkosinussatz bringt zum Ausdruck, daß dieser Satz die drei Seiten des sphärischen Dreiecks enthält. 3. Sinus-Kosinussatz sin a cos ß = cos b sin c — sin b cos c cos a , C.190a) sin a cos 7 = cos c sin b — sin c cos b cos a C.190b) Vier weitere Gleichungen können durch zyklische Vertauschung gewonnen werden (Abb.3.34) Der Sinus- Kosinussatz entspricht dem Projektionssatz der ebenen Trigonometrie. Da er fünf Größen des sphärischen Dreiecks enthält, wird er nicht unmittelbar zur Berechnung sphärischer Dreiecke benutzt, sondern hauptsächlich zur Ableitung weiterer Gleichungen. 4. Winkelkosinussatz oder polarer Kosinussatz cosa = — cos ß cos 7 + sin ß sin 7 cos a , C.191a) cos/? = — cos 7 cos öl + sin 7 sin a cos b, C.191b) cos 7 — - cos öl cos ß + sin a sin ß cos c C 191c)
170 3. Geometrie Der Winkelkosinussatz enthält die drei Winkel des sphärischen Dreiecks und jeweils eine der drei Seiten Mit ihm können aus einer Seite und den beiden anliegenden Winkeln der dritte Winkel bzw. aus den drei Winkeln eine Seite des Dreiecks oder alle drei Seiten berechnet werden Im Unterschied dazu ergibt sich beim ebenen Dreieck der dritte Winkel aus der Winkelsumme von 180° Hinweis: Aus drei gegebenen Winkeln läßt sich beim ebenen Dreieck keine Seite berechnen, da sich damit unendlich viele, einander ähnliche Dreiecke ergeben. 5. Polarer Sinus-Kosinussatz sin a cos b — cos ß sin 7 + sin ß cos 7 cos a , C 192a) sin a cos c = cos 7 sin ß + sin 7 cos ß cos a. C 192b) Vier weitere Gleichungen können durch zyklische Vertauschung gewonnen werden (Abb.3.34) Wie der Winkel-Kosinussatz werden auch die Formeln des Polaren Sinus-Kosinussatzes weniger zur unmnittelbaren Dreiecksberechnung verwendet, als vielmehr zur Herleitung weiterer Formeln 6. Halbwinkelsatz Zur Berechnung eines Winkels eines sphärischen Dreiecks aus seinen drei Seiten kann der Seiten-Kosinussatz verwendet werden. Der Halbwinkelsatz bietet in Analogie zum Halbwinkelsatz der ebenen Trigonometrie die Möglichkeit, den Winkel aus der numerisch günstigeren Tangensfunktion zu berechnen OL tan — 2 tan- = \ sin(s — b) sin(s — c) sinssin(s — a) sin(s — a) sin(s — b) sin s sin(s — c) C.193a) C.193c) sin(s — c) sin(s — a) f ß tan — = a 1 : 7—, Tv- 2 \\ smssin(s — b) C 193b) ^a + b + c Cl93d) Wenn aus drei Seiten eines sphärischen Dreiecks alle drei Winkel zu berechnen sind, kann die folgende Berechnung günstiger sein: tan — 2 sin(s — a) C.194a) f ß tan — 2 sin(s — b) ' tan — 2 sin(s — c) mit C 194b) C 194c) k = sin(s — a) sin(s — b) sin(s — c) C 194d) a + b + c C.194e) 7. Halbseitensatz Mit dem Halbseitensatz kann die Aufgabe, aus den drei Winkeln des sphärischen Dreiecks eine Seite oder alle drei Seiten zu berechnen, gelöst werden. a cot- cos(cr — ß) cos(cr — 7) 2 V — coscrcos(cr — a) COt2^\\ cos((T — a) cos(cr — ß) - cos a cos(cr — 7) , C 195a) , C 195c) oder cot k' 2 cos(cr — a) ,C 196a) cot- k' cot cos(cr — 7) cos(cr — a) 2 ^ — cos a cos [g — ß) a + ß + 7 2 cos (o- - ß) , C 196b) cot - = k' 2 cos(cr — 7) C 195b) C 195d) C.196c)
3 4 Sphärische Trigonometrie 171 mit k,_lco8(*-a)co8(*-ß)<X*(°-y)i C196d) ^a+l+j ^^ Für die Winkelsumme des sphärischen Dreiecks gilt gemäß C.184) 180° <2a < 540° oder 90° < a < 270° , C.197) so daß stets cos er < 0 sein muß. Außerdem sind wegen der Festlegungen über EuLERsche Dreiecke alle vorkommenden Wurzeln reell. Abbildung 3 94 Abbildung 3.95 8. Anwendungen der Grundformeln der sphärischen Geometrie Mit Hilfe der angegebenen Grundformeln können z.B. Entfernungen und Azimute bzw Kurswinkel auf der Erde bestimmt werden. ¦ A: Es ist die kürzeste Entfernung zwischen Dresden (Ai = 13°46',(^i = 51°16') und Alma Ata (A2 = 76°55/, (p2 = 43°18/) zu berechnen. Lösung: Die geographischen Koordinaten (Ai,<pi), (A2,</?2) und der Nordpol N (Abb.3.94) liefern zwei auf Meridianen liegende Seiten a = 90° - ip2 und b = 90° — ipi des Dreiecks P\P2N sowie den eingeschlossenen Winkel 7 = A2 — Ai. Für c = e folgt aus dem Kosinussatz C.189a) cos c = (cos a cos b + sin a sin 6 cos c), cos e = cos(90° — (fi) cos(90° — </?2) + sin(90° — (fi) sin(90° — </?2) cos(A2 — Ai) = sin (fi sin ip2 + cos ipi cos </?2 cos(A2 — Ai), C.198) also cose = 0,53498 + 0,20567 = 0,74065, e = 42,213° Der Großkreisabschnitt PXP2 hat gemäß C.176a) die Länge 4694 km. ¦ B: Es sind die Kurswinkel 8\ und S2 bei Abfahrt und Ankunft sowie die Entfernung in Seemeilen für eine Schiffsreise auf einem Großkreis von Bombay (Ai = 72°48', tpi = 19°00') nach Dar es Saalam (A2 = 39° 28', if2 = -6°49') zu berechnen. Lösung: Die Berechnung der zwei Seiten o = 90° — (fi = 71°00', b = 90° — (p2 = 96049' sowie des eingeschlossenen Winkels 7 = Ai — A2 = 33°20' im spärischen Dreieck P\P2N aus den geographischen Koordinaten (Ai, <pi), (A2, (f2) (Abb.3.95) mit Hilfe des Kosinussatzes C.189c) cosc = cose = cos a cos b + sin a sin bcos 7 liefert P\P2= e = 41,777°, und wegen V « 1 sm ergibt sich PiP2~ 2507 sm. ... . n • 1 • ii cosa — cos6cosc _., rt,o0 , Mit dem beitenkosmussatz erhält man a = arecos = 51,248 und sin 0 sin c cos b cos cl cos c ß = arecos : : - 125,018° . Somit ist 5X = 360° - ß = 234,982° und S2 = 180° + a = sm a sin c 231,248°.
172 3 Geometrie Hinweis: Die Verwendung des Sinussatzes zur Berechnung von Seiten und Winkeln ist nur dann sinnvoll, wenn aus der Aufgabenstellung ersichtlich ist, ob diese spitz oder stumpf sind 3.4.2.3 Weitere Formeln 1. Delambresche Gleichungen In Analogie zu den MOLLWEiDEschen Formeln der ebenen Trigonometrie sind von Delambre die entsprechenden Formeln für sphärische Dreiecke angegeben worden a — ß a + b . a—ß . a—b cos sin —-— sin —-— sin —-— r^— = §— . C 199a) \- = ——2— , C 199b) sin — sin - cos — sin - 2 2 2 2 a+ß a+b . a+ß a-b cos cos sin cos —-— i;— = g— , C 199c) 2_ = 2_ C 199d) sin — cos - cos — cos - 2 2 2 2 Da bei Anwendung der zyklischen Vertauschung jede Gleichung zwei weitere ergibt,- sind insgesamt 12 DELAMBREsche Gleichungen möglich 2. Nepersche Gleichungen und Tangenssatz a—b a—b a_ß sin—— 7 a + ß cos—— tan - = f-r cot j-, C 200a) tan —-- = f-r cot ^ , C 200b) 2 . a + b ^ 2 2 a+b 2 sin —-— cos —-— 2 2 . a-ß a-ß a-b sin-—— c a>b cos c tan = f-j tan - , C 200c) tan —— = f-j tan - C 200d) 2 . a + ß 2 2 a + ß 2 v ' sin cos 2 2 Diese Gleichungen heißen auch NEPERsche Analogien Aus ihnen werden die zum Tangenssatz der ebenen Trigonometrie analogen Formeln hergeleitet a — b a — ß b — c ß- 7 tan tan —-— tan ——— tan —-— TT = ~ T-ö. C 201a) rr- = ^T" , C 201b) A a+b ^ a+ß v ' ^ b+c ß+l tan tan tan tan 2 2 2 2 c — a 7 — a tan —-— tan —-— 2 = 2 ' c + a 7 + a tan —-— tan - C 201c) 2 2 3. l'Huiliersche Gleichungen Die Berechnung der Fläche eines sphärischen Dreiecks kann mit Hilfe des Exzesses e erfolgen. Dieser kann gemäß C 187a) aus den bekannten Winkeln a, ß, 7 berechnet werden oder, wenn die drei Seiten a, b. c bekannt sind, gemäß C 194a) bis C.194e) über die berechenbaren Winkel Die L'HuiLiERsche Gleichung ermöglicht jedoch die unmittelbare Berechnung von e aus den Seiten f ss a s — b s — c tan - = Wtan - tan —-— tan —-— tan —-— . C.202) 4 V 2 2 2 2 v ' Die Gleichung entspricht der HERONischen Flächenformel C 103), S 147 der ebenen Trigonometrie.
3.4 Sphärische Trigonometrie 173 3.4.3 Berechnung sphärischer Dreiecke 3.4.3.1 Grundaufgaben, Genauigkeitsbetrachtungen Die verschiedenen Fälle, die bei der Berechnung sphärischer Dreiecke auftreten können, werden in sogenannte Grundaufgaben eingeordnet. Für jede Grundaufgabe des schiefwinklig sphärischen Dreiecks sind mehrere Lösungswege möglich, je nachdem, ob die Lösung nur mit den Grundformeln C 188a) bis C.192b) oder auch mit den Formeln C.193a) bis C.202) erfolgt und ob nur eine Größe im Dreieck oder mehrere Größen gesucht sind. Formeln, die die Tangensfunktion enthalten, liefern numerisch genauere Ergebnisse, besonders im Vergleich zur Berechnung eines Bestimmungsstückes aus der Sinusfunktion, wenn dessen Wert in der Nähe von 90° liegt, und aus der Kosinusfunktion, wenn der Wert des Bestimmungsstückes in der Nähe von 0° oder 180° liegt. Für EuLERsche Dreiecke ergeben sich außerdem die aus der Sinusfunktion berechneten Stucke zweideutig, da die Sinusfunktion in den beiden ersten Quadranten positiv ist, während die aus den übrigen Funktionen berechneten Stücke eindeutig erhalten werden. 3.4.3.2 Rechtwinklig sphärisches Dreieck 1. Spezielle Formeln Im rechtwinklig sphärischen Dreieck ist einer der drei Winkel gleich 90° Die Seiten lind Winkel werden analog zum ebenen rechtwinkligen Dreieck bezeichnet. Wenn wie in Abb.3.96 7 ein rechter Winkel ist, dann heißt die Seite c Hypotenuse, a und b heißen Katheten und a und ß sind die Kathetenwinkel Aus den Gleichungen C.188a) bis C 202) folgt für 7 = 90°: sin a = sin a sin c, cos c = cos a cos b, tan a = cos ß tan c, tan b = sin a tan ß, cos öl = sin ß cos a , C 203a) C 203c) C 203e) C.203g) C 203i) TVeten bei bestimmten Aufgaben andere Seiten und Winkel auf, sin 6 = sin ß sin c, cos c = cot öl cot ß, tan b = cos a tan c, tan a = sin b tan a , cos ß = sin öl cos b z B anstelle von a, /?, C 203b) C 203d) C 203f) C 203h) C.203J) 7 die Größen Abbildung 3 96 Abbildung 3.97 6,7, a , dann können die erforderlichen Gleichungen durch zyklische Vertauschung gewonnen werden. Für Berechnungen in rechtwinklig sphärischen Dreiecken geht man im allgemeinen von 3 gegebenen Größen aus, dem Winkel 7 = 90° und zwei weiteren Stücken. Es ergeben sich dann 6 Grundaufgaben, die in Tabelle 3.8 zusammengestellt sind. 2. Nepersche Regel Die NEPERsche Regel faßt die Gleichungen C.203a) bis C 203j) zusammen. Wenn die 5 Bestimmungsstücke eines rechtwinklig sphärischen Dreiecks ohne Berücksichtigung des rechten Winkels in einem Kreis in der gleichen Reihenfolge angeordnet werden wie im Dreieck und wenn dabei die Katheten a, b durch ihre Komplementwinkel 90° — a und 90° — b ersetzt werden (Abb.3.97), dann gilt: 1. Der Kosinus jedes Bestimmungsstücks ist gleich dem Produkt der Kotangensfunktionen seiner beiden anliegenden Bestimmungsstücke. 2. Der Kosinus jedes Bestimmungsstücks ist gleich dem Produkt aus den Sinus der nicht anliegenden Bestimmungsstücke
174 3. Geometrie Tabelle 3.8 Bestimmungsgrößen sphärischer rechtwinkliger Dreiecke Grundaufgabe 1. 2. 3 4 5 6 Gegebene Bestimmungsgrößen Hypotenuse und eine Kathete c, a Zwei Katheten a, b Hypotenuse und ein Winkel c, a Kathete und der anliegende Winkel a, ß Kathete und der gegenüberliegende Winkel a, a Zwei Winkel a, ß Nummern der Formeln zur Bestimmung der übrigen Größen a C 203a), ß C 203e), b C 203c) öl C 203h), ß C 203g), c C 203c) a C 203a), b C 203f), /? C 203d) c C.203e), 6 C.203J), a C 203i) 6 C 203h), c C.203a), ß C.203i) aC.203i),6C.203j),cC.203d) X N" y »Geogr >nord y \ '" Gitter- /nord k' P' \m' y —\ ? b) Abbildung 3.98 A: cosa = cot(90° - b) cotc= -^- (s. C 203f). Abbildung 3 99 ¦ B: cos(90° - a) = sine sin a = sina (s C 203a)) ¦ C: Das Gradnetz einer Kugel ist auf einen Zylinder abzubilden, der die Kugel in einem Meridian berührt. Der Beruhrungsmeridian und der Äquator bilden die Achsen eines GAUSS-KRÜGER-Systems (Abb.3.98a,b). Lösung: Ein Punkt P der Kugeloberfläche wird zu P' der Ebene. Der Großkreis g durch P senkrecht zum Berührungsmeridian bildet sich als Gerade g' senkrecht zur x -Achse und der Kleinkreis k durch P parallel zum Berührungsmeridian als Gerade k' parallel zur x-Achse ab. Der Meridian m durch P hat als Bild keine Gerade, sondern eine Kurve m'. Die nach oben zeigende Richtung der Tangente von m' in P' gibt die geographische Nordrichtung an, die nach oben zeigende Richtung von k' die geodätische Nordrichtung Der Winkel 7 zwischen beiden Nordrichtungen heißt Meridiankonvergenz Im rechtwinklig sphärischen Dreieck QPN mit c = 90° — (p, und b = rj ergibt sich 7 aus a — 90° — 7. tvt , , , ^ tan b . .nn x tan r? Nach der NEPERschen Regel ist cosa = oder cos(90 — 7) = ; - tanc v ' tan(90°-</?) , sin 7 = tan 77 tan <p
3.4 Sphärische Trigonometrie 175 Da 7 und 77 meist klein sind, folgt mit sin 7 « 7, tan 77 « 77 daraus 7 = 77 tan <p. Die Längenverzerrung y 7 dieses Zylinderentwurfes ist bei kleinen Abständen 77 gering, und es kann 77 = — gesetzt werden, H y wobei y der Rechtswert von P ist Man erhält 7 = — tan (p. Die Umrechnung von 7 aus dem Bogen- R ins Gradmaß ergibt für ip = 50°, y = 100 km eine Meridiankonvergenz von 7 = 0,018706 bzw 7 = 1°04'19" Tabelle 3.9 Grundaufgaben 1 und 2 für sphärische schiefwinklige Dreiecke 1. Grundaufgabe Geg.- 3 Seiten a, 6, c Bedingungen 0°<a + 6 + c< 360°, a + b > c, a + c> b, b + c> a 1. Lösung. Gesucht a cos a — cos b cos c cos a = ; oder sin b sin c a sm(s — b) sm(s — c) tan — = \ : 7—, v— ¦ 2 V sinssin(s — a) s = ¦ a + b + c 2 Lösung- Gesucht a, ff, 7 fc = a tan — sin(s — a) sin(s — b) sin(s — c) sin 5 k 0 k tan — = 2 sin(s — a) ' 2 sin(s — 6) ' 7 A: tan- = -7-7 r 2 sin(s — c) Proben- (s — a) + (s — b) + (s — c) = s, a /? 7 . tan — tan — tan — sin s = A; 2 2 2 2. Grundaufgabe Geg 3 Winkel q, ff, 7 WWW Bedingungen: 180° < öl + ff + 7 < 540° , a + ff < 180° + 7, a + 7 < 180° + ff, ff + 7 < 180° + a. 1. Lösung: Gesucht a cos a + cos ff cos 7 cos a = :—— oder sin ff sin 7 a /cos(cr — ff) cos(cr — 7) 2 V ~ cos a cos(cr — a) a + ff + 7 2. Lösung: Gesucht a, 6, c cos(cr — a) cos(cr — ff) cos(cr — 7) k' ¦¦ — cos er a k' b k' COt — = ; , COt — = —r , 2 cos(cr — a) 2 cos(cr — ff) c k' cot - = - 2 cos(cr — 7) Proben: (er — a) + (a — ff) + (a — 7) = a, cot - cot - cot -(— cos g) = K 3.4.3.3 Schiefwinklig sphärisches Dreieck Bei 3 gegebenen Stücken unterscheidet man wie im Falle der rechtwinkligen sphärischen Dreiecke 6 Grundaufgaben Die Bezeichnungen für die Winkel sind a, ff, 7 und a, 6, c für die ihnen gegenüberliegenden Seiten (Abb.3.99) In den Tabellen 3.9, 3.10, 3.11 und 3.12 ist zusammenfassend dargestellt, mit welchen Formeln welche Bestimmungsstücke im Rahmen der 6 Grundaufgaben über verschiedene Lösungswege bestimmt werden können. Die Lösung der 3., 4., 5. und 6. Grundaufgabe kann auch durch Zerlegung des vorliegenden schiefwinklig sphärischen Dreiecks in zwei rechtwinklig sphärische Dreiecke herbeigeführt werden. Dazu wird für die 3. und 4 Grundaufgabe (Abb.3.100, Abb.3.101) von B das sphärische Lot auf AC bis D gefällt und für die 5 und 6 Grundaufgabe (Abb.3.102) von C auf AB bis D. Im Spaltenkopf der Tabellen 3.9, 3.10, 3.11 und 3.12 sind die für die jeweilige Grundaufgabe gegebenen Seiten und Winkel mit S bzw. W gekennzeichnet. So bedeutet z.B. SWS Zwei Seiten und der eingeschlossene Winkel sind gegeben. ¦ A: Eine dreiseitige Pyramide hat die Grundfläche ABC und die Spitze S (Abb.3.103) Die Seitenflächen ABS und BCS schneiden sich unter 74°18', BCS und CAS unter 63°40' und CAS und ABS unter 80°00' Wie groß sind die Winkel, unter denen sich je zwei der Kanten AS, BS und CS schneiden?
176 3 Geometrie Tabelle 3 10 Grundaufgabe 3 für sphärische schiefwinklige Dreiecke 3. Grundaufgabe geg : 2 Seiten und der eingeschlossene Winkel, z.B. a, 6, 7 SWS Bedingungen Keine 1 Lösung- Gesucht c bzw. c und a . cos c = cos a cos b + sin a sin b cos 7 , sin a sin 7 sm a = sine a kann im I. oder IL Quadranten liegen Entscheidung durch Satz: Der größeren Seite liegt der größere Winkel gegenüber oder Kontrollrechnung- > öl im I. Q cos a — cos b cos c < 0 —> a -im jj q 2.Lösung Gesucht a bzw. a und c. tan u = tan a cos 7 tan 7 sin u tana = sinF — u) tanF — w) tanc = cos a 3 Lösung- Gesucht a und (oder) /?. a — b a + ß cos^~ 7 tan —-— = 7-7- cot — 2 a + 6 2 tan —tt^- = fr cot ^ 2 . a+b 2 sin^- a -/? (-90° < —-^ < 90°) a + /? a - /? /? = a + /3 a-/? 2 2 ' " 2 4. Lösung: Gesucht a, ß, c. a — b 7 a + /?_cos — cos- ^ z 2 ~ a + & . 7 ~ N ' cos sin - .a — b 7 a-0 sin-T~C0S2 Z' tan tan 2 . a + 6 . 7 N' sin sin — 2 2 (-90° < ^^ < 90°) a + ß a-ß q + /? QL-ß . c Z' sin « = ö 2 . a-/? cos t: — r~ö > 2 . üf+ /? ' sin —-— sin —— 2 2 Probe- Doppelte Berechnung von c Abbildung 3 100 Abbildung 3 101 Abbildung 3 102 Lösung: Aus einer Kugelfläche um die Spitze S der Pyramide schneidet das Dreikant (Abb.3.103) ein sphärisches Dreieck mit den Seiten a, 6, c aus Die Winkel zwischen den Seitenflächen sind die Winkel des sphärischen Dreiecks, die gesuchten Winkel zwischen den Kanten sind seine Seiten Die Bestimmung der Winkel a, b, c entspricht der 2. Grundaufgabe. Die 2. Lösung in Tabelle 3.9 liefert: a = 108°59', o - Ol = 28°59', o - ß = 34°41', a - 7 = 45°19', k' 1,425514, cot \ = 1,516440, cot £ = 1,773328. 2 2 1,246983, cot-
3.4 Sphärische Trigonometrie 177 Tabelle 3.11 Grundaufgabe 4 für sphärisch schiefwinklige Dreiecke 4 Grundaufgabe geg. 1 Seite und die zwei anliegenden Winkel, z.B. a, ß, c WSW Bedingungen- Keine 1. Lösung: Gesucht 7 bzw. 7 und a cos 7 = — cos a cos ß 4- sin a sin /? cos c, sin 7 a kann im I. oder IL Quadranten liegen. Entscheidung durch Satz: Dem größeren Winkel liegt die größere Seite gegenüber oder Kontrollrechnung- > öl im I Q cos öl + cos ß cos 7 £ 0 —? a im n Q 2 Lösung: Gesucht a bzw. a und 7 . tan c cos a cot /i = tan a cos c, tan a = ¦ cos(/? — fi) ' tan 7 = COt(ß — jl) cosa 3. Lösung Gesucht a und (oder) 6. a-ß a + b cos^— c tan ——- = ^—n tan - , 2 OL + ß 2 tan- a — b a-ß a + ß -—tan- (-90° < ^ < 90°), a + b a-b , a + b 4. Lösung. Gesucht a, b, 7. a-0 . a — b 2 tan- a + 6 TV' a-< Q + /? C cos —-— cos - 2 n 2 . OL — ß , C sin —-— sin - 7/ 2 2 _'z tan —-— — —ö — TT, 2 . a + ß c Nf sin —-— cos - 2 2 (90° < ^— < 90°), a+b a—b a+b a—l fl = —+ —' b=~2 2" . 7 Z 7 Z' sin — = —T-, cos - = r . 2 .a+o 2 .a—b sin sin —-— 2 2 Probe. Doppelte Berechnung von 7. Abbildung 3.103 Abbildung 3 104 ¦ B Funkpeilung: Durch Funkpeilung von zwei festen Stationen Pi{\i,(pi) und P2(^2, ^2) wurden die Azimute 81 und 52 der von einem Schiff ausgesandten Funkwellen gepeilt (Abb.3.104). Gesucht sind die geographischen Koordinaten des Standortes P0 des Schiffes. Die in der Nautikuntei dem Namen Fremdpeilung bekannte Aufgabe stellt einen Vorwärtseinschnitt auf der Kugel dar und wird ähnlich dem
178 3 Geometrie Tabelle 3.12 Grundaufgaben 5 und 6 für sphärische schiefwinklige Dreiecke 5. Grundaufgabe SSW Geg . 2 Seiten und der einer Seite gegenüberliegende Winkel, z.B. a, 6, a 6 Grundaufgabe wws Geg.: 2 Winkel und die einem Winkel gegenüberliegende Seite, z.B. a, a, ß Bedingungen: Siehe Fallunterscheidungen Bedingungen Siehe Fallunterscheidungen. Lösung- Gesucht beliebige fehlende Größe. . sin b sin a rt __r _ _ ... sm ß = 2 Werte ß\, ß2 möglich sino Es sei ßi spitz und ß2 Fallunterscheidung. _ sin b sin a > 1 Lösung. Gesucht beliebige fehlende Größe . sinasin/? ^ TT7 sm o = : 2 Werte Oi, 02 möglich. 180° sina sin b sin a sina sin b sin a ßi stumpf. 0 Lösungen. 1 Lösung ß = 90° sina Es sei 61 spitz und b2 Fallunterscheidung: n sin a sin ß < 1 3.1 1. 3.1.2 3.2. 3 2.1 3.2.2 1 Lösung ß\. 1 Lösung ß2 sina sin a > sin b b <90° b >90° sin a < sin b a < 90°, a < 90° a > 90°, öl > 90° a < 90° , a > 90° 1 n T .. a>90o,a<90oHLoSungen Weitere Berechnung mit einem Winkel oder 2 Winkeln ß. ' 1 2 Lösungen 7 Ä,Ä. 3 31 3 1.1, 312 3 2. sina sin a sin ß sina sin a sin ß 180° - ßi stumpf 0 Lösungen. 1 Lösung b = 90°. < 1 sma sina > sin/3 ß <90° 1 Lösung 61. /? > 90° 1 Lösung b2 sina < sin/3 3.2.1 322 a > 90°, a > 90° a < 90°, a > 90° a > 90°, a < 90° Weitere Berechnung mit einer Seite oder 2 Seiten b: , > 0 Lösungen 1. Weg tan u = tan b cos a , tan v = tan a cos /?, c = n + v , cot (p — cos 6 tan a, cot ^ = cos a tan /3, 7 =(p + ip. 2. Weg- c a + frc tan - = tan —-— 2 2 a + /3 a-/3 ' cos—— . a + ß \sm —^— = tan- 2 . OL - sin — a — b 7 a + /3cos"^ tan - = cot — - 2 2 = COt . a + b sin— . a — b a-/?sin — 2 . a + 6 sm 2 c 7 Probe: Doppelte Berechnung von - und - U ü— Vorwärtseinschnitt in der Ebene gelöst (s. 3.2,2 3,1., S. 151). 1. Berechnung im Dreieck PiP2N: Im Dreieck PiP2N sind die Seiten PXN = 90° - tpu P2N = 90° — cp2 und der Winkel <^ P\NP2 = \2 — Ai = AA gegeben Berechnung der Winkel £ £1, e2 und der Strecke P\P2 = e gemäß 3. Grundaufgabe. 2. Berechnung im Dreieck PiP2Po: Da £1 = 8\ — £1} £2 = 360° — (£2 + ^2), sind in P1P0P2 die Seite e und die anliegenden Winkel £1 und £2 bekannt. Berechnung der Seiten e\ und e2 gemäß 4. Grundaufgabe, 3. Lösung. Die Koordinaten des Punktes P0 sind aus dem Azimut und der Entfernung gegen P\ oder P2, also doppelt berechenbar. 3. Berechnung im Dreieck NPxPq\ Im Dreieck NP1P0 sind die zwei Seiten NPX = 90° -(pu PiP0 = ei und der eingeschlossene Winkel 5\ gegeben. Nach der 3. Grundaufgabe, 1. Lösung, werden die Seiten
3 4 Sphärische Trigonometrie 179 TV Po = 90° — <po und der Winkel AAi berechnet. Zur Kontrolle werden im Dreieck NP0P2 ein zweites Mal NP0 = 90° — </?o und der Winkel AA2 berechnet. Damit sind die Länge Ao = Ai + AAi = A2 — AA2 und die Breite ip0 des Punktes Po bekannt 3.4.3.4 Sphärische Kurven Ein wichtiges Einsatzgebiet der sphärischen Trigonometrie ist die Navigation. Eine ihrer Aufgaben besteht in der Wahl von Kurswinkeln, die optimale Wegstrecken ermöglichen. Andere Anwendungsgebiete sind das geodätische Vermessungswesen (s. z.B. [3.12], Programme und Rechenbeispiele) sowie Roboter-Bewegungsabläufe. 1. Orthodrome 1. Begriffsbestimmung Die Geodätischen der Kugeloberfläche - das sind Kurven, die zwei Punkte A und B auf dem kürzesten Weg miteinander verbinden - heißen Orthodromen oder Großkreise (s. 3.4.1,3., S. 163). Abbildung 3 105 Abbildung 3 106 2. Gleichung der Orthodrome Bewegungen auf Orthodromen - die Meridiane und der Äquator ausgenommen - sind mit der Notwendigkeit einer ständigen Kursänderung verbunden. Solche Orthodromen mit ortsabhängigen Kurswinkeln a können eindeutig unter Zuhilfenahme ihres nordpolnächsten Punktes Pn(An,</?n) beschrieben werden, wobei (pu > 0° ist. Im nordpolnächsten Punkt hat die Orthodrome den Kurswinkel «n = 90°. Die Gleichung der Orthodrome durch Pn und den laufenden Punkt Q(Aq, ipo), dessen relative Lage zu Pn beliebig ist, ergibt sich nach der NEPERschen Regel gemäß Abb.3.105als: tan <£N cos(A — An) = tan <$ C.204) Nordpolnächster Punkt: Die Koordinaten des nordpolnächsten Punktes Pn(An, ^n) einer Orthodrome mit dem Kurswinkel a^ (gla ^ 0°) durch den Punkt A(\A, <pa) (va ^ 90°) ergeben sich unter Berücksichtigung seiner relativen Lage zu Pn sowie des Vorzeichens von c*a nach der NEPERschen Regel gemäß Abb.3.106 als- </?n = arccos(sin \aA\ cos<pa) C.205a) und An = A^ + sign(a^) tan ifA tan<y?N C 205b) Hinweis: Liegt eine berechnete geographische Länge A nicht im Definitionsbereich —180° < A < 180°, dann ergibt sich für A ^ ±k • 180° {k € IN) die reduzierte geographische Länge Ared zu Ared = 2 arctan (tan - ] . C 206) Man spricht in diesem Zusammenhang von Rückversetzung des Winkels in den Definitionsbereich Äquatorschnittpunkte: Die Aquatorschnittpunkte Pai(^Ai>0°) un<^ ^a2(^A2^°) ^er Orthodrome ergeben sich gemäß C.204) wegen tan</?N cos(AA^ — An) = 0 (v = 1,2) zu AAiy = ANT90° (i/ = 1,2) C.207)
180 3. Geometrie Hinweis: Unter Umständen ist gemäß C 206) eine Ruckversetzung der Winkel erforderlich 3. Bogenlänge Verläuft die Orthodrome durch die Punkte A(Xa,<Pa) und B(\b,(Pb), dann liefert der Seitenkosinussatz für den sphärischen Abstand d oder die Bogenlänge zwischen den beiden Punkten. d = arccos[sin ipA sin ipß + cos ifA cos <pB cos (Aß — A^)] C.208a) Unter Berücksichtigung des Erdradius R läßt sich dieser Mittelpunktwinkel in eine Länge umrechnen. d = arccos[sin ipA sin tps + cos ipA cos ipB cos(A# — Xa)] • —— . C 208b) 4. Kurswinkel Setzt man den Sinus- und Seitenkosinussatz zur Berechnung von sin ola und cos c*a ein, so ergibt eine Division der Ergebnisse und anschließende Auflösung nach dem Kurswinkel ola'- , cos ifA cos ifB sin(AB - XA) ola = arctan : : :— . C.209) sin <pb — sin ipA cos d Hinweis: Mit den Formeln C.208a), C.209), C.205a) und C 205b) lassen sich die Koordinaten des nordpolnächsten Punktes P^ einer durch zwei Punkte A und B festgelegten Orthodrome berechnen 5. Schnittpunkte mit einem Breitenkreis Für die Schnittpunkte Xi(Xxx, <Px) und X2{XX2> <Px) einer Orthodrome mit dem Breitenkreis ip = (px ergibt sich gemäß C.204): \Xv = AN =f arccos i^f2L (j/= 1,2) C 210) tan(/?N Nach der NEPERschen Regel gilt für die beiden Schnittwinkel axx und ax2, unter denen eine Orthodrome mit dem nordpolnächsten Punkt Pn(An, </>n) den Breitenkreis tp = (px schneidet: KJ = aresin ^^1 (i/= 1,2). C.211) COS (pX Für den minimalen Kurswinkel |amin| muß das Argument in der Arkussinusfunktion hinsichtlich der Variablen (fx extremal sein Man erhält: sin (px — 0 =$¦ (px = 0, d h., in den Schnittpunkten mit dem Äquator ist der Betrag des Kurswinkels minimal \<*xmin\ = 90°-ipN C 212) Hinweis 1: Lösungen von C.210) ergeben sich nur für \ipx\ < </?n • Hinweis 2: Unter Umständen ist gemäß C.206) eine Rückversetzung der Winkel erforderlich. 6. Schnittpunkt mit einem Meridian Für den Schnittpunkt Y"(Ay,</?y) einer Orthodrome mit dem Meridian A = Xy ergibt sich gemäß C.204): <Py = arctan[tan<^NCOs(Ay — An)] . C.213) 2. Kleinkreis 1. Begriffsbestimmung Die Definition von Kleinkreisen auf der Kugeloberfläche erfordert eine im Vergleich zur Begriffsbildung in 3.4 1,1., S 163 detailliertere Fassung: Danach ist ein Kleinkreis der geometrische Ort aller Punkte, die von einem festen Punkt M(Am, <£m) auf der Kugeloberfläche den sphärischen Abstand r (r < 90°) haben (Abb. 3.107). Mit M wird der sphärische Mittelpunkt bezeichnet, r heißt spärischer Kleinkreisradius. Die Kleinkreisebene ist die Grundfläche eines Kugelabschnitts mit der Höhe h (s. 3.3 4,14., S. 161) Der sphärische Mittelpunkt M liegt oberhalb des Kleinkreismittelpunktes in der Kleinkreisebene. Dort hat der Kreis den ebenen Kleinkreisradius r$ (Abb.3.108). Breitenkreise sind damit spezielle Kleinkreise mit ipM = ±90° . ¦ Für r —? 90° geht der Kleinkreis in eine Orthodrome über. 2. Kleinkreisgleichungen Als Beschreibungsparameter lassen sich entweder M und r oder der nordpolnächste Kleinkreispunkt Pn(An, Vn) und r verwenden. Ist der laufende Punkt auf dem Kleinkreis Q(A, ip), so ergibt sich nach dem Seitenkosinussatz gemäß Abb.3.107 die Kleinkreisgleichung cos r = sin (p sin ipM + cos ip cos (pM cos(A — A^) • C.214a)
3 4 Sphärische Trigonometrie 181 Kleinkreisebene Abbildung 3 107 Abbildung 3 108 Daraus erhält man wegen ipM = <Pn — r und Am = An : cos r = sirup sin(</?N ~~ r) + cos <P cos(<^n — r) cos(A — An) • C.214b) ¦ A: Für </?m = 90° ergeben sich aus C.214a) wegen cosr = sin<p =>¦ sin(90° — r) = sincp =*> ip = const Breitenkreise ¦ B: Für r —> 90° ergeben sich aus C.214b) Orthodromen. 3. Bogenlänge Die Bogenlänge s zwischen zwei Punkten A(\a,<Pa) und B{\b,Vb) auf einem Kleinkreis k läßt sich gemäß Abb.3.108 aus den Beziehungen - = ——, cosd = cos2 r + sin2 r cosa und a 360° r0 = Rs'mr gewinnen: cos d — cos2 r itR s = sin r arccos - 180° C.215) ¦ Für r —? 90° wird der Kleinkreis zur Orthodrome, und aus C 215) und C 208b) folgt s = d. 4. Kurswinkel Gemäß Abb.3.109 schneidet die Orthodrome durch A(\a, (pA) undM(AM, Vm) den Kleinkreis mit dem Radius r senkrecht Für den Kurswinkel aorth der Orthodrome gilt nach C 209): cos <pa cos ipM sin (Am — A^) aorth — arctan - sin (Pm — sin ipA cos r Damit ergibt sich für den gesuchten Kurswinkel ola des Kleinkreises im Punkt A: ctA = (l^orthl'- 90°)sign(aOrth) • C.216a) C.216b) Abbildung 3 109 Abbildung 3 110 5. Schnittpunkte mit einem Breitenkreis Für die geographischen Längen der Schnittpunkte -Xi(A*i, tpx) und X2(\x2i <Px) des Kleinkreises mit dem Breitenkreis ip = tpx ergibt sich aus C.214a). ^xu — Am =F arccos cos r — sin ipx sin <Pm cos (px cos ipM ("=1,2) C 217)
182 3. Geometrie Hinweis: Unter Umständen ist gemäß C.206) eine Ruckversetzung der Winkel erforderlich 6. Tangier punkte Der Kleinkreis wird von zwei Meridianen, den Tangiermeridianen, in den Tangierpunkten Ti^Tnipr) und T2(\t2,1Pt) berührt (Abb.3.110). Aus der Forderung, daß für sie das Argument des Arkuskosinus in C 217) hinsichtlich der Variablen ipx extremal sein muß, erhält man* VT = axaän^EtLi C.218a) Ar, = XM =F arccos C°ST ~ SinVxSi"v» („ = 1,2) C 218b) cosr v cos (fX cos <pM Hinweis: Unter Umständen ist gemäß C 206) eine Rückversetzung der Winkel erforderlich 7. Schnittpunkte mit einem Meridian Die Berechnung der geographischen Breiten der Schnittpunkte Yi(Ay, (fYi) und l2(Ay, (fYz) des Kleinkreises mit dem Meridian A = Ay erfolgt gemäß C 214a) mit den Gleichungen . -AC ± BVA2 + B2-C2 , , rtX ,nrt^x <pYv = arcsm _,9 (i/ = 1,2), C 219a) A* + i?z wobei gilt: ;4 = siny?M, 5 = cos<^MCOs(Ay — Am), C = —cosr. C.219b) Für ^42 + £?2 > C2 gibt es im allgemeinen zwei verschiedene Lösungen, von denen jedoch eine entfällt, wenn ein Pol auf dem Kleinkreis liegt. Gilt A2 + B2 = C2 und liegt keiner der Pole auf dem Kleinkreis, dann berührt der Meridian den Kleinkreis in einem Tangierpunkt mit der geographischen Breite (fYl = Py2 = V?t • 3. Loxodrome 1. Begriffsbestimmung Eine sphärische Kurve, die alle Meridiane unter konstantem Kurswinkel schneidet, heißt Loxodrome oder Kursgleiche Breitenkreise (a = 90°) und Meridiane (a = 0°) sind damit spezielle Loxodromen. 2. Gleichung der Loxodrome Die Abb.3.111 zeigt eine Loxodrome mit dem Kurswinkel a durch den laufenden Punkt Q(A, ip) und den infinitesimal benachbarten Punkt P(\ + dA, <p + dip) Das rechtwinklige sphärische Dreieck QCP kann wegen seiner differentiellen Ausmaße als ebenes Dreieck angesehen werden Dann gilt: Rcos(fd\ ,. tan ade? . nnn . tana = ——~— => d\ = C.220a) Rdip cos (p Unter Berücksichtigung des Umstandes, daß die Loxodrome durch den Punkt A{\a, Wa) verlaufen soll, ergibt sich daraus durch Integration die Gleichung der Loxodrome. tan D5° + ^) 180o A - A* = tan a In f -£Ar (a ^ 90°). C.220b) tanU5° + ^M n Ist A speziell der Schnittpunkt -PA(AA, 0°) der Loxodrome mit dem Äquator, so folgt daraus: (p\ 180° = tan a In tan 45' D5°+ 2) " n (a ^ 9°0) C'220C) Hinweis: Die Berechnung von AA kann mit C.225) erfolgen. 3. Bogenlänge Aus Abb.3.111 erkennt man den differentiellen Zusammenhang cosa=™t^ds=™fL C 221a) ds cos a
3.4 Sphärische Trigonometrie 183 .N N P(A,+dÄ,,(p+d(p) Abbildung 3 111 P(q>=0,A,=0) Abbildung 3.112 Integration über (p liefert für die Bogenlänge s des Bogenstücks mit den Endpunkten A(\a,<Pa) und B{\b,Vb)' cosa 180° v T } C 221b) Ist A der Abfahrtsort und B der Zielort {gegißter Ort), so lassen sich bei Vorgabe von A, a und s schrittweise aus C 221b) zuerst </?# und danach gemäß C.220b) Aß berechnen. Näherungsformel: Gemäß Abb.3.111 erhält man mit Q = A und P = B nach einer Mittelung der geographischen Breiten den Ansatz C.222a) für eine Näherungsformel zur Berechnung der angenäherten Bogenlänge / gemäß C 222b). cos 2 (As ~ A^0 ttR l 180° yA + WB -(Aß - \a) irR 180° C.222a) C.222b) 4. Kurswinkel Für den Kurswinkel a der Loxodrome durch die Punkte A(\a, <Pa) und B(Xb, <Pb) bzw durch A{\A, Va) und ihren Aquatorschnittpunkt PA(AA, 0°) folgt gemäß C 220b) und C 220c)- = arctaii - (Ab - \A) tan In öl — arctan tan ^45° + y ) (Aa~Aa) In tan ^45° + ^] TT 180° 180° C.223a) C.223b) 5. Schnittpunkt mit einem Breitenkreis Der Schnittpunkt X(Xx, Vx) einer Loxodrome mit dem Kurswinkel a durch den Punkt A(\a, ¥>a) mit dem Breitenkreis cp = (fx berechnet sich gemäß C.220b) zu ¥x^ Ax = A^ + tan a • In - tan 45° + - 180° tan 45° + Va ) • {a ^ 90°). C.224)
184 3. Geometrie Mit C.224) läßt sich speziell der Aquatorschnittpunkt PA(AA, 0°) berechnen <Pa\ 180° AA = A^ — tan a • In tan D5° + ¦ 1D5» + ?). {a ± 90°) C.225) Hinweis: Unter Umständen ist gemäß C.206) eine Rückversetzung der Winkel erforderlich. 6. Schnittpunkte mit einem Meridian Loxodromen - ausgenommen Breitenkreise und Meridiane - wickeln sich spiralförmig-asymptotisch um die Pole (Abb.3.112). Die unendlich vielen Schnittpunkte Yu(\y, <pyv) {v € Z) der durch A(Xa, Wa) mit dem Kurswinkel a verlaufenden Loxodrome mit dem Meridian A = Xy berechnen sich gemäß C.220b) zu XY - XA + V • 360° TT 180° <£>Y„ — 2 arctan < exp tan («+*)}- 90° tana Ist A der Aquatorschnittpunkt -PA(AA, 0°) °^er Loxodrome, dann ergibt sich vereinfacht \XY - AA + v • 360° TT 180 (i/GZ). C.226a) ifYv — 2 arctan exp tana ¦90° (i/GZ). C 226b) 4. Schnittpunkte sphärischer Kurven 1. Schnittpunkte zweier Orthodromen Die betrachteten Orthodromen sollen die nordpolnächsten Punkte Pni (Ani , V^Nx) und Pn2(An2,<£n2) besitzen, wobei P^x ^ Pn2 gilt Einsetzen des Schnittpunktes S(Xs, ips) in beide Orthodromengleichungen führt auf das Gleichungssystem tan <pNl cos(As - X^1 ) = tan ifs , C 227a) tan y?Na cos(As - ANa) = tan ips . C.227b) Elimination von (p§ und die Anwendung der Additionstheoreme auf die Kosinusfunktionen ergeben: tan y?Nj cos X^1 — tan <^n2 cos ^n2 tan Xs = — - C.228) tan </?Ni sin X^1 — tan </?n2 sin An2 Die Gleichung C.228) liefert im Definitionsbereich —180° < A < 180° der geographischen Längen zwei Lösungen A^ und Xs2. Die dazugehörigen geographischen Breiten ergeben sich aus C.227a). ifsu = arctan [tan v?Ni cos(As„ - AnJ] (v = 1,2) C.229) Die Schnittpunkte S\ und 52 sind Gegenpunkte, d.h., sie gehen durch eine Spiegelung am Kugelmittelpunkt auseinander hervor. 2. Schnittpunkte zweier Loxodromen Die betrachteten Loxodromen sollen die Aquatorschnitt- punkte PAi (AAi, 0°),und Pk2 (AA2,0°) sowie die Kurswinkel ol\ und a2 (ct\ ^ a2) haben. Einsetzen des Schnittpunktes S(Xs, <ps) in beide Loxodromengleichungen führt auf das Gleichungssystem 180° Xs- XA ¦ tan ai • In tan Ub° + ^ V — (an + 90°), C.230a) ('¦fs 45 H——- 180° 7T (aa ± 90°) C.230b) Elimination von Xs und Auflösung nach (p$ ergibt eine Gleichung mit unendlich vielen Lösungen 7T (psu = 2 arctan exp AAl-AÄ2 + ^360° - 90° (v e Z) tan a2 — tan a\ Die dazugehörigen geographischen Längen Xsu ergeben sich durch Einsetzen von (pSu in C 230a) 180' C 231) A5„ = A, Li + tanai In tan D5° + ^\ ¦ — («i ^ 90°), (i/ G Z). C.232) Hinweis: Unter Umständen ist gemäß C 206) eine Rückversetzung der Winkel erforderlich.
3 5 Vektoralgebra und analytische Geometrie 185 3.5 Vektoralgebra und analytische Geometrie 3.5.1 Vektoralgebra 3.5.1.1 Definition des Vektors 1. Skalare und Vektoren Größen, deren Werte reelle Zahlen sind, werden Skalare genannt Beispiele sind Masse, Temperatur, Energie und Arbeit (wegen der skalaren Invarianz s. 3 5.1.3,3., S 190, 3.5 3 2,5., S. 218 und 4.3.5 2,2., S. 278). Im Unterschied dazu werden Größen, zu deren vollständiger Charakterisierung sowohl eine Maßzahl als auch eine Richtung und manchmal ein Drehsinn im Raum erforderlich sind, Vektoren genannt. Beispiele sind Kraft, Geschwindigkeit, Beschleunigung, Winkelgeschwindigkeit, Winkelbeschleunigung sowie elektrische und magnetische Feldstärke. Zur Darstellung von Vektoren werden gerichtete Strecken im Raum verwendet In diesem Buch werden Vektoren im dreidimensionalen EuKLiDischen Raum durch a gekennzeichnet, im Rahmen der Matrizenrechnung durch a. 2. Polare und axiale Vektoren Polare Vektoren dienen der Darstellung von Größen mit Maßzahl und Raumrichtung, wie Geschwindigkeit und Beschleunigung, axiale Vektoren dagegen der Darstellung von Größen mit Maßzahl, Raumrichtung und Drehsinn, wie Winkelgeschwindigkeit und Winkelbeschleunigung In der zeichnerischen Wiedergabe werden sie durch einen polaren bzw axialen Pfeil unterschieden (Abb.3.113) In der mathematischen Behandlung besteht zwischen ihnen kein Unterschied 3. Modul und Raumrichtung Zur quantitativen Beschreibung von Vektoren a oder a als Strecke zwischen Anfangs- und Endpunkt A bzw B dienen der Modul, d h. der Absolutbetrag |a|, der die Länge der Strecke angibt, sowie die Raumrichtung, die durch einen Satz von Winkeln angegeben wird 4. Gleichheit von Vektoren Zwei Vektoren a und b gelten als gleich, wenn ihre Beträge gleich sind und ihre Richtungen übereinstimmen, d h , wenn sie parallel und gleich orientiert sind Entgegengesetzt gleiche Vektoren zeichnen sich durch gleiche Beträge, aber entgegengesetzte Richtungen aus AB = ä, BÄ = -ä aber \AB\ = \BA\. C 233) Axiale Vektoren besitzen in diesem Falle entgegengesetzt gleichen Drehsinn Abbildung 3 113 Abbildung 3 114 Abbildung 3.115 5. Freie, gebundene und linienflüchtige Vektoren Ein freier Vektor ändert seine Eigenschaften Modul und Richtung nicht, wenn er parallel zu sich selbst derart verschoben wird, daß sein Anfangspunkt in einem beliebigen Raumpunkt fällt Wenn die Eigenschaften eines Vektors an einen bestimmten Anfangspunkt gebunden sind, dann spricht man von einem gebundenem Vektor Ein linienflüchtiger Vektor darf nur längs der Geraden verschoben werden, in die er weist.
186 3. Geometrie 6. Spezielle Vektoren a) Einheitsvektor a° = e wird ein Vektor genannt, dessen Länge oder Absolutbetrag gleich 1 ist. Mit seiner Hilfe kann ein Vektor a durch das Produkt aus Einheitsvektor und Modul gemäß ä = e|ä| C 234) angegeben werden. Zur Beschreibung der drei Koordinatenachsen in Richtung wachsender Koordinatenwerte werden oft die Einheitsvektoren i, j , k oder e», e,-, e^ verwendet (Abb.3.114). In der (Abb.3.114) bilden die durch die drei Einheitsvektoren festgelegten Richtungen ein senkrechtes Richtungstripel. Außerdem bilden sie ein orthogonales Koordinatensystem, denn es gilt: eiej = ele"k = ejäk = 0. C.235) Zudem gilt elej = eje] = e^elc = 1, C 236) so daß man von einem orthonormierten Koordinatensystem spricht b) Nullvektor heißt ein Vektor mit dem Absolutbetrag 0, also mit zusammenfallendem Anfangsund Endpunkt sowie mit unbestimmter Richtung im Raum. c) Radiusvektor r eines Punktes P wird ein Vektor OP genannt, dessen Anfangspunkt sich im Koordinatenursprung befindet (Abb.3.114). In diesem Falle heißt der Koordinatehursprung Pol Der Punkt P ist durch seinen Radiusvektor eindeutig bestimmt d) Kollineare Vektoren verlaufen parallel zu ein und derselben Geraden. e) Komplanare Vektoren verlaufen parallel zu ein und derselben Ebene. Für sie gilt C.260). 3.5.1.2 Rechenregeln 1. Multiplikation eines Vektors mit einem Skalar Die Produkte aa und aa sind gleich und kollinear zum Vektor a Die Länge des Produktvektors, sein Betrag, ist |a||a|, seine Richtung stimmt für a > 0 mit der von a überein, für a < 0 ist sie entgegengesetzt. Die wichtigsten Eigenschaften des Produkts eines Skalars mit einem Vektor sind aa = aa, aßa = ßaä, (a + /?)a = aa + /?ä, a(a + b) = aa + ab C 237a) Eine Linearkombination der Vektoren a, b, c,..., d mit den Skalaren a, ß, .., S ist ein Vektor der Form k = aa + /3b + .-- + £d. C 237b) 2. Linearkombinationen von Vektoren a) Die Summe zweier Vektoren AB = a und AD = b (Abb.3.115a) ist ein Vektor AC = c, der die Diagonale AC des Parallelogramms ABCD bildet. Die wichtigsten Eigenschaften der Summe zweier Vektoren sind das Kommutativgesetz der Addition und die Dreiecksungleichung ä + b = b + a, |a + b| < |a| + |b|. C.238a) b) Die Summe mehrerer Vektoren a, b, c, . ,e ist ein Vektor f = AF, der den Polygonzug schließt, den die Vektoren a bis e bilden (Abb.3.115b). Für n Vektoren äj gilt n ]Tai = f. C 238b) i=i Zu den Eigenschaften der Summe mehrerer Vektoren gehören das Kommutativgesetz der Addition und das Assoziativgesetz der Addition Für drei Vektoren z.B. gilt: ä + b + c = c + b + a, (a + b) + c = ä+(b + c) C 238c) c) Die Differenz zweier Vektoren a — b kann als Summe der Vektoren a und —b aufgefaßt werden, so daß ä-b = a+(-b) = d C.238d)
3.5 Vektoralgebra und analytische Geometrie 187 die Diagonale DB in Abb.3.115a ergibt. Die wichtigsten Eigenschaften der Differenz zweier Vektoren sind a - a = Ö (Nullvektor), |a-b|>|a|-|b|. C 238e) Abbildung 3.116 3. Zerlegung von Vektoren Jeder beliebige Vektor a kann eindeutig in eine Summe aus drei Vektoren zerlegt werden, die parallel zu drei gegebenen nichtkomplanaren Vektoren ü, v, w sind (Abb.3.116a,b)* a = aü + /?v + 7w. ' C.239a) Die Summanden aü, ßv und 7 w werden die Komponenten der Vektorzerlegung genannt, die skalaren Faktoren a , ß und 7 die Koeffizienten Vektoren, die parallel zu einer Ebene liegen, können durch zwei nichtkollineare Vektoren ü und v in die Form ä = aü + ßv C.239b) gebracht werden (Abb.3.116c,d) 4. Koordinaten eines Vektors 1. Kartesische Koordinaten Gemäß C.239a) kann jeder Vektor AB = a eindeutig in eine Summe von Vektoren zerlegt werden, die parallel zu den Grundvektoren des Koordinatensystems i,j,k oder ei,ej,ek stehen: a = ax\ + oyj + azk = axei + ayej + azek , C.240a) wobei die Skalare aXi ay und az die kartesischen Koordinaten des Vektors a im System mit den Einheitsvektoren des Koordinatensystems e*, e; und e^ sind. Man schreibt dafür auch äi= {ax,ay,az} oder a(ax,ay,az) . C.240b) Die durch die drei Einheitsvektoren festgelegten Richtungen bilden ein senkrechtes Richtungstripel. Die kartesischen Koordinaten eines Vektors sind die Projektionen dieses Vektors auf die Koordinatenachsen (Abb.3.117). Wird ein Vektor parallel zu oder entlang einer der Koordinatenachsen verschoben, dann ändern sich seine Koordinaten in den anderen beiden Richtungen nicht. Die Koordinaten einer Linearkombination mehrerer Vektoren ergeben sich als gleichgestaltete Linearkombination der Koordinaten dieser Vektoren, so daß die Vektorgleichung C.237b) drei skalaren Komponentengleichungen entspricht: kx = aax+ ßbx-\ \-6dx, ky = aay + ßby + --- + ödy, C.241) kz = aaz + ßbz+ .. + 8dz. Für die Koordinaten der Summe und der Differenz zweier Vektoren c = a ± b C.242a) gilt insbesondere cx = ax ± bx , cy = ay ± by , cz = az db az . C.242b) Der Radiusvektor r eines Punktes P(x, y, z) hat die kartesischen Koordinaten dieses Punktes. 'x — "E1 1 'y — y ) rz ¦¦ r = xi + 2/j + zk. C.243)
188 3 Geometrie 2. Affine Koordinaten sind eine Verallgemeinerung der kartesischen Koordinaten auf ein System aus drei linear unabhängigen, also auch nicht mehr zwingend rechtwinklig aufeinander stehenden nicht- komplanaren Grundvektoren ei,e2,e3 mit drei Koeffizienten a^a2^3, wobei die oberen Indizes keinesfalls als Exponenten aufzufassen sind In Analogie zu C.240a,b) ergibt sich a zu ä = a1ei + a2e2 + a3e3 C.244a) oder a = {a1 , a2 ,a3} oder a (a1^2,^) . C 244b) Diese Schreibweise ist insofern vorteilhaft, als die Skalare a1,a2,a:i die kontravarianten Koordinaten (s 3.5 1 6, S. 193) eines Vektors sind. Für ei = i, e2 = j , e3 = k gehen die Formeln C 244a,b) in C.240a,c) über Für die Linearkombination der Vektoren C.237b) sowie für die Summe und die Differenz zweier Vektoren C.242a,b) gelten in Analogie zu C 241) die Komponentengleichungen Abbildung 3 117 Abbildung 3.118 Abbildung 3 119 5. Richtungskoeffizient oder Entwicklungskoeffizient Der Richtungskoeffizient eines Vektors a entlang eines Vektors b ist das Skalarprodukt ab = ab0 = |a| cos ip mit b° = — , C.247) wobei b° der Einheitsvektor in die Richtung von b ist und y? der Winkel zwischen a und b Der Rich- tungskoeffiziwent stellt die Projektion von a auf b dar ¦ Im kartesischen Koordinatensystem sind die Richtungskoeffizienten des Vektors a die Komponenten entlang der x—,y—, z—Achse In einem nichtorthonormierten Koordinatensystem gilt diese Aussage nicht 3.5.1.3 Skalarprodukt und Vektorprodukt 1. Skalare Multiplikation Das Skalarprodukt zweier Vektoren a und b, auch Punktprodukt genannt, ist durch die Gleichung ä.b = ab= (ab) = (a,b) = |ä||b|cos<p C.248) definiert, wobei (p der zwischen a und b eingeschlossene Winkel, bezogen auf den gemeinsamen Anfangspunkt, ist (Abb.3.118) Das Skalarprodukt ergibt einen Skalar 2. Vektorielle Multiplikation ist eine Operation, die zum Vektorprodukt zweier Vektoren a und b , auch Kreuzprodukt genannt, führt Dieses ergibt einen Vektor c, der auf a und b senkrecht steht, derart, daß die Vektoren a, b und c
3.5 Vektoralgebra und analytische Geometrie 189 ein Rechtssystem bilden (Abb.3.119). Vorausgesetzt, die Anfangspunkte der drei Vektoren sind in einem Punkt zusammengeführt, dann ist das der Fall, wenn ein Beobachter, der auf die durch a und b aufgespannte Ebene und gleichzeitig in die Richtung von c blickt, a durch die kürzeste Drehung im Uhrzeigersinn nach b überführen kann. Die Vektoren a, b und c haben dann die gleiche Orientierung, wie Daumen, Zeigefinger und Mittelfinger der rechten Hand. Daraus leitet sich der Begriff Rechte- Hand-Regel ab. Quantitativ liefert das Vektorprodukt a x b = [ab] = [a, b] = c C.249a) einen Vektor der Länge |c| = |a||b| sint/?, C.249b) wobei (p der zwischen a und b eingeschlossene Winkel ist. Zahlenmäßig ist die Länge von c gleich dem Flächeninhalt des von a und b aufgespannten Parallelogramms 3. Eigenschaften der Produkte von Vektoren a) Das Skalarprodukt genügt dem Kommutativgesetz : äb = ba. ' C.250) b) Das Vektorprodukt ändert beim Vertauschen der Faktoren das Vorzeichen. axb = -(bxä). C.251) c) Die Multiplikation mit einem Skalar genügt dem Assoziativgesetz . a(äb) = (aä)b, C.252a) ö(äxb) = (aä)xb C.252b) d) Das Assoziativgesetz gilt nicht für das doppelte Skalar- und Vektorprodukt: a(bc) ± (ab)c, C 253a) äx(bxc)^(axb)xc. C 253b) e) Das Distributivgesetz gilt: a(b + c) = ab + äc, C.254a) ax(b + c) = äxb + äxc. C.254b) f) Orthogonalität zweier Vektoren liegt vor (a_Lb), wenn gilt: ab = 0 , und weder a noch b gleich dem Nullvektor sind. C.255) g) Kollinearität zweier Vektoren (a || b) liegt vor, wenn gilt: a x b = Ö C.256) h) Multiplikation gleicher Vektoren: aä = a2 = a2, jedoch axa = Ö. C.257) i) Linearkombinationen von Vektoren können auf die gleiche Art multipliziert werden wie bei ska- laren Polynomen, allerdings ist dabei zu beachten, daß bei der vektoriellen Multiplikation Faktoren- vertauschungen, z B. beim Zusammenziehen gleichnamiger Glieder, Vorzeichenänderungen zur Folge haben. ¦ A: Ca + 5b - 2c) (a - 2b - 4c) = 3a2 + 5ba - 2ca - 6ab - 10b2 + 4cb - 12ac - 20bc + 8c2 = 3a2 - 10b2 + 8c2 - ab - 14ac - 16bc. ¦ B: Ca + 5b - 2c) x (a - 2b - 4c) = 3a x a + 5b x a - 2c x a - 6a x b - 10b x b + 4cxb-12axc- 20b xc + 8cxc = 0-5axb + 2äxc-6äxb + 0-4bxc-12axc- 20b xc + 0 = -IIa x b - 10a x c - 24b x c = IIb x a + 10c x a 4- 24c x b
190 3. Geometrie j) Skalare Invariante heißt ein Skalar, der bei Verschiebung und Drehung des Koordinatensystems den gleichen Wert behält Das skalare Produkt zweier Vektoren ist eine skalare Invariante ¦ A: Die Komponenten eines Vektors a = {ai, 02, a3} , sind keine skalaren Invarianten, da sie in verschiedenen Koordinatensystemen unterschiedliche Werte annehmen können. ¦ B: Die Länge eines Vektors a = {ai, a2, a3} , d h. die Größe Ja\ + a\ + a\, ist eine skalare Invariante, da sie in verschiedenen Koordinatensystemen den gleichen Wert besitzt. ¦ C: Das Skalarprodukt eines Vektors mit sich selbst ist eine skalare Invariante, dh aa = a a = |a|2 cos<£ = |a|2 , da ip = 0 3.5.1.4 Mehrfache multiplikative Verknüpfungen 1. Doppeltes Vektorprodukt Das doppelte Vektorprodukt a x (b x c) ergibt einen neuen, zu b und c komplanaren Vektor ax(bxc) = b(ac)-c(äb). C.258) 2. Gemischtes Produkt ^ Das gemischte Produkt (a x b)c, auch Spatprodukt genannt, ergibt einen Skalar, der zahlenmäßig gleich dem Volumen des von den drei Vektoren gebildeten Parallelepipeds ist; das Ergebnis ist positiv, wenn a, b und c ein Rechtssystem bilden, negativ im entgegengesetzten Falle Die Klammern und das Multiplikationskreuz können beim gemischten Produkt weggelassen werden. (a x b)c = äbc = bcä = cäb = -acb = -bac = —cba C 259) Im Unterschied zu einer zyklischen Vertauschung aller drei Faktoren im gemischten Produkt führt eine Vertauschung zweier Faktoren zu seiner Vor Zeichenänderung. Für komplanare Vektoren, d h Vektoren a, die parallel zu einer von den Vektoren b und c definierten Ebene orientiert sind, gilt a(b x c) = 0 3. Formeln für mehrfache Produkte a) Lagrangesche Identität: (a x b)(c xd) = (ac) (bd) — (bc) (ad), b) abcefg: ae af ag be bf bg ce cf cg 4. Formeln für Produkte in kartesischen Koordinaten Wenn die Vektoren a, b, c in kartesischen Koordinaten gemäß &= {ax,ay,az} , b = {bx,by,bz} , c = {cx:cy,cz} gegeben sind, dann werden die Produkte nach den folgenden Formeln berechnet. 1. Skalarprodukt: ab = (a, b) = axbx + ayby + azbz. 2. Vektorprodukt: axb= [a, b] = (aybz — azby) i + (azbx - axbz) j + {axby — aybx) k 3. Spatprodukt: abc: i &x bx \ax bx \cx j ay by ay by Cy k az\ bz\ az bz Cz C.260) C 261) C 262) C 263) C 264) C 265) C 266)
3.5 Vektoralgebra und analytische Geometrie 191 C.267) 5. Formeln für Produkte in affinen Koordinaten 1. Metrische Koeffizienten und reziproke Grundvektoren Wenn die affinen Koordinaten zweier Vektoren a und b im System ei, e*2, e3 bekannt sind, so daß a = a1 ei 4- a2 e2 4- a3 e3 , b = b1 e2 4- b2 e2 4- b3 e3 gegeben sind, dann müssen zur Berechnung des skalaren Produkts ab = albl ei ei 4- a2 b2 e2 e2 + a3 b3 e3 e3 4- (a1 b2 4- a2 61)*e*i e2 4- (a2 b3 + a3 b2) e2 e3 + (a3 bl + a1 63) e3 ei oder des Vektorprodukts 2) e2 x e3 4- (a3 b1 - a1 63) e3 x ei 4- (a1 b2 - a2 61) ex x e2 , C.268) C.269a) C.269b) a x b = [a2 b3 - letzteres mit ei x ei = e2 x e2 = e3 x e3 = Ö, die paarweisen Produkte der Koordinatenvektoren bekannt sein. Für das skalare Produkt sind das die sechs metrischen Koeffizienten (Zahlen) / 0ii = ei ei, g22 = e2 e2 , ^33 = e3 e3 , 9i2 = ei e2 = e2ei, ^23 = e2e3 = e3e2 , g3i =e3$i= ex e3 C.270) und für das Vektorprodukt die drei Vektoren e1 = Q (e2 x e3) , e2 = ü (e3 x ex) , e3 = ü (ei x e2) , C.271a) genauer die drei reziproken Vektoren bezüglich e^., e2 , e3 , wobei der Koeffizient 1 Q: C.271b) ei e2 e3 der gleich dem gemischten Produkt der Koordinatenvektoren ist, lediglich einer kürzeren Schreibweise in weiteren Formeln dient Mit Hilfe der Multiplikationstabellen 3.13 und 3.14 für die Grundvektoren wird das Arbeiten mit den Koeffizienten übersichtlicher. Tabelle 3.13 Skalare Multiplikation von Grundvektoren ei e2 e3 ei 9n 921 931 e2 9l2 922 932 e3 913 923 933 (9ki = 9ik) Tabelle 3 14 Vektorielle Multiplikation von Grundvektoren Multiplikatoren ei e2 e3 ei 0 e3 Q e2 Q e2 e3 Ü 0 e1 Q e3 e2 Q e1 Q 0 2. Anwendung auf kartesische Koordinaten Die kartesischen Koordinaten sind ein Spezialfall der affinen Koordinaten. Aus den Tabellen 3.15 und 3.16 ergeben sich für die Grundvektoren ei = i, e*2 = j , e3 = k, die metrischen Koeffizienten gn = g22 = 933 = 1, #12 = P23 : : #31 : C.272a) : 0, Sl = i = 1 C.272b) ijk
192 3. Geometrie und die reziproken Grundvektoren e1 = i, e2 = j, e3 = k. C.272c) Somit stimmen die reziproken Grundvektoren mit den Grundvektoren des Koordinatensystems überein, oder anders ausgedrückt, in kartesischen Koordinaten sind die Grundvektorensysteme zu sich selbst reziprok. Tabelle 3.15 Skalare Multiplikation von reziproken Grundvektoren Tabelle 3 16 Vektorielle Multiplikation von reziproken Grundvektoren Multiplikatoren f J k f 1 0 0 J 0 1 0 k 0 0 1 Ö o 'U i iph 3 S i J k i ü -k J j k ü —l k -J i 0 3. Skalarprodukt in Koordinatendarstellung 3 3 äb=J2Y,9mnambn = gaßa(» C.273) Für kartesische Koordinaten geht C 273) in C.264) über Nach dem zweiten Gleichheitszeichen in C 273) wurde die in der Tensorrechnung übliche abkürzende Schreibweise für Summen verwendet (s 4.3 1,2., S 270) Anstelle der gesamten Summe wird nur ein typisches Glied hingeschrieben, so daß über alle doppelt auftretenden Indizes dieses Gliedes zu summieren ist, d.h über alle einmal unten und einmal oben auftretenden Indizes. Manchmal werden die Summationsindizes mit griechischen Buchstaben bezeichnet; hier durchlaufen sie die Zahlen 1 bis 3 Es gilt also gaßaQ ti3 = gual b1 + gl2al b2 + gl3al b3 + g2la2bl + g22a2 b2 + g23a2 b3 + g3la3bl + 932a3 b2 + g33a3 b3 C.274) 4. Vektorprodukt in Koordinatendarstellung In Übereinstimmung mit C 269a) gilt a x b = ei 62^3 I bl b2 b3 = ei e2 e3 [(a2 b3 a3 b2)e' + (a3 b1 - a1 b3) e2 + (a1 b2 - a2 b^e3] Für kartesische Koordinaten geht C 275) in C.265) über C 275) 5. Spatprodukt in Koordinatendarstellung In Übereinstimmung mit C 269a) ergibt sich I a1 a2 a3 I abc^eieseg U1 b2 b3 . C 276) I c1 c2 c3 I Für rechtwinklige kartesische Koordinaten geht C 276) in C.266) über. 3.5.1.5 Vektorielle Gleichungen Die Tabelle 3.17 enthält eine Zusammenstellung der einfachen vektoriellen Gleichungen Darin sind a, b , c die bekannten Vektoren, x der gesuchte Vektor, a , ß, 7 die bekannten Skalare und x , y, z die gesuchten Skalare
3.5 Vektoralgebra und analytische Geometrie 193 Tabelle 3.17 Vektorielle Gleichungen x unbekannter Vektor; a, b, c, d bekannte Vektoren x ,y , z unbekannte Skalare; a , ß, 7 bekannte Skalare Gleichung 1. x + a = b 2. ax = a 3. xa = a 4. x x a = b (b _L a) (xa = a ' | x x a = b (b _L a) ( xa = a 6. lxb = ß [xc = 7 _, __, 7. d = xä + yb + zc 8. d = x(b x c) +2/ (c x a) + z (a x b) Lösung x = b - a x = — et Die Gleichung ist unbestimmt; trägt man alle Vektoren x, die dieser Gleichung genügen, von einem Punkt aus ab, so liegen ihre Endpunkte auf einer Ebene, die auf dem Vektor a senkrecht steht. Die Gleichung C) nennt man die vektorielle Gleichung dieser Ebene. Die Gleichung ist unbestimmt; trägt man alle Vektoren x, die dieser Gleichung genügen, von einem Punkt aus ab, so liegen ihre Endpunkte auf einer dem Vektor a parallelen Geraden Die Gleichung D) nennt man die vektorielle Gleichung dieser Geraden. aa + ä x b x= 2 a2 _ a(bxc)+/3(cxä)+7(axb) ~ £ ~ x = — ^5— = aa + pb + 7C, abc wobei a, b, c die zu a, b, c reziproken Vektoren sind (vgl. S. 191)._ dbc ade abd ab c abc ab c da db de abc abc abc 3.5.1.6 Kovariante und kontravariante Koordinaten eines Vektors 1. Definitionen Die affinen Koordinaten al,a2, a3 eines Vektors a in einem System mit den Grundvektoren ei, e2 , e3 , definiert durch die Formel a = a1 ei + a2 e2 + a? e3 = aa ea , C.277) werden auch kontravariante Koordinaten dieses Vektors genannt. Im Gegensatz dazu entsprechen seine kovarianten Koordinaten den Koeffizienten einer Vektorzerlegung zu den Grundvektoren e1, e2 , e3 , d.h zu den reziproken Grundvektoren von ei, e2 , e3 (s [22.19], Bd. 11). Mit den kovarianten Koordinaten ai, o2, a3 des Vektors a ergibt sich a = a1e1 + a2e2 + a3e3 = aaea C.278) Im System der kartesischen Koordinaten stimmen die kovarianten Koordinaten eines Vektors mit seinen kontravarianten Koordinaten uberein. 2. Darstellung der Koordinaten mit Hilfe von Skalarprodukten Die kovariante Koordinate eines Vektors a ist gleich dem skalaren Produkt dieses Vektors mit dem zugehörigen Grundvektor des Koordinatensystems ai = aei, a2 = ae2 , a3 = ae3 . C.279)
194 3 Geometrie Die kontravariante Koordinate eines Vektors a ist gleich dem skalaren Produkt dieses Vektors mit dem zugehörigen reziproken Grundvektor: a1=ae\ a2 = ae2, a3 = ae3 C.280) In kartesischen Koordinaten stimmen die Formeln C.279) und C 280) überein: ax = sii, ay = aj , az = ak C.281) 3. Darstellung des Skalarprodukts mit Hilfe von Koordinaten Die Darstellung eines skalaren Piodukts zweier Vektoren durch seine kontravarianten Koordinaten liefert Formel C.273). Die entsprechende Formel für kovariante Koordinaten lautet ab = gaßaabß, C 282) wobei gmn = em en die metrischen Koeffizienten im System mit den reziproken Vektoren sind Ihr Zusammenhang mit den Koeffizienten gmn lautet / i \m+n Amn C 283) 011 012 013 021 022 023 I 031 032 033 I wobei Amn die Unterdeterminante der im Nenner stehenden Determinante ist, sie entsteht durch Streichen der Zeile und Spalte des Elements gmn . Wenn der Vektor a durch kovariante Koordinaten gegeben ist, der Vektor b dagegen durch kontravariante Koordinaten, dann ist ihr Skalarprodukt gleich ab = al bi + a2 b2 + a3 b3 = aa ba , C.284) und analog gilt ab = aa ba C 285) 3.5.1.7 Geometrische Anwendungen der Vektoralgebra In Tabelle 3.18 sind einige geometrische Anwendungen der Vektoralgebra aufgeführt Andere Anwendungen aus der analytischen Geometrie wie die Vektorgleichungen der Ebene und der Geraden werden in 3 5 1 5, S 193 und 3 5.3.6, 220ff. behandelt. Tabelle 3 18 Geometrische Anwendungen der Vektoralgebra Bezeichnung Länge des Vektors a Flächeninhalt des von den Vektoren a und b aufgespannten Parallelogramms Volumen des_yon den Vektoren a, b, c aufgespannten Parallelepipeds Winkel zwischenjien Vektoren a und b Vektorielle Formel a = Va^ s= äxb V = |abc| ab cos <p = , VäPb2 Koordinatenformel (in rechtwinkligen kartesischen Koordinaten) a=y/al + al + a\ s = \ i2 i i2 i i2 \ay az\ \az ax\ \ax ay\ \by bz\ \bz bx\ \bx by\ V = COS if C^x ^y ^z bx by bz CX Cy CZ _ axbx + ayby + azbz fä + di + alfä + b' + b*
3 5 Vektoralgebra und analytische Geometrie 195 3.5.2 Analytische Geometrie der Ebene 3.5.2.1 Ebene Koordinatensysteme 1. Ebene Koordinaten und ebene Koordinatensysteme Die Lage jedes Punktes P einer Ebene kann mit Hilfe beliebiger Koordinatensysteme beschrieben werden Die Zahlen, die die Lage des Punktes bestimmen, heißen die Koordinaten. Meistens werden die kartesischen Koordinaten und die Polarkoordinaten benutzt 1. Kartesische oder Descartessche Koordinaten eines Punktes P sind die mit einem bestimmten Vorzeichen behafteten und in einem bestimmten Maßstab angegebenen Entfernungen dieses Punktes von zwei senkrecht aufeinander stehenden Koordinatenachsen (Abb.3.120). Der Schnittpunkt 0 der Koordinatenachsen wird Koordinatenursprung oder Koordinatenanfangspunkt genannt. Die horizontale Koordinatenachse, meist die x-Achse, wird gewöhnlich Abszissenachse genannt, die vertikale Koordinatenachse, meist die y-Achse: Ordmatenachse. Auf diesen Achsen wird die positive Richtung festgelegt, für die x-Achse gewöhnlich nach rechts weisend, für die y-Achse nach oben. Die Koordinaten eines Punktes P sind dann positiv oder negativ, je nachdem, auf welche Halbachse die Projektion des Punktes fällt (Abb.3.121) Die Koordinaten x bzw y werden die Abszisse bzw. die Ordinate des Punktes P genannt Mit der Schreibweise P(a, b) wird ein Punkt mit der Abszisse ö und der Ordinate b angegeben Durch die Koordinatenachsen wird die x, y-Ebene in vier Quadranten I, II, III und IV zerlegt Abb.C.121,a). T - 0 III _ + I + + X _ IV X y I II III IV + - - + + + Abbildung 3.120 Abbildung 3 121 2. Polarkoordinaten eines Punktes P (Abb.3.122) bestehen aus dem Radius p, d.h dem Abstand des Punktes von einem gegebenen Nullpunkt, dem Pol 0, und dem Polarwinkel <p, d.h. dem Winkel zwischen der Geraden OP und einem gegebenen, durch den Pol hindurchgehenden orientierten Strahl, der Polarachse. Der Nullpunkt kann auch Koordinatenursprung genannt werden Der Polarwinkel ist positiv, wenn er im entgegengesetzten Drehsinn des Uhrzeigers von der Polarachse aus gemessen wird; im entgegengesetzten Falle ist er negativ. .iL 3#~ Abbildung 3 122 Abbildung 3 123 3. Krummlinige Koordinaten bestehen aus zwei einparametrigen Kurvenscharen in der Ebene, den Koordinatenlinien-Scharen (Abb.3.123) Durch jeden Punkt der Ebene geht dabei jeweils nur eine Kurve jeder Schar hindurch, die sich in diesem Punkt schneiden Die Parameter, die diesem Punkt entsprechen, sind seine krummlinigen Koordinaten. In Abb.3.123 besitzt der Punkt P die krummlinigen Koordinaten u = a\ und v = 63 . Im Unterschied zu den krummlinigen Koordinaten sind im kartesischen Koordinatensystem die Koordinatenlinien Geraden, die parallel zu den Koordinatenachsen
196 3. Geometrie yf y \ ^ AdP^ 4r™ F-x^ *^x X Abbildung 3.124 Abbildung 3 125 liegen, im Polarkoordinatensystem sind es konzentrische Kreise um den Pol und die vom Pol ausgehenden Strahlen. 3.5.2.2 Koordinatentransformationen Beim Übergang von einem kartesischen Koordinatensystem zu einem anderen ändern sich die Koordinaten nach den folgenden Regeln: 1. Parallelverschiebung der Koordinatenachsen um den Abszissen- bzw. Ordinatenabschnitt a bzw. b (Abb.3.124), so daß für die Koordinaten x, y vor der Verschiebung, rr', y' nach der Verschiebung und für die Koordinaten a, b des neuen Koordinatenursprungs 0' im alten Koordinatensystem vor der Verschiebung gilt. x = x' + a, y = y' + b, C.286a) x' = x — a, y' = y — b C.286b) y- 2. Drehung der Koordinatenachsen um den Winkel </? (Abb.3.125), so daß gilt. x = x' cos ip — y' sin ip, y = x' sin <p + 2/ cos (/?, x' — x cos y? + y sin y?, 2/ = —£ sin <p + y cos y? Die zum System C.287a) gehörende Koeffizientenmatrix D = (COS^ "Sin^ mit (X) = d(X') bzw. (X') = D-*(* \sillip COSip ) \y) \y'J \y>) \y wird Drehungsmatrix genannt. Allgemein betrachtet läßt sich ein Übergang von einem Koordinatensystem in ein anderes durch eine Transformation durchführen, die aus einer Translation und einer Rotation, d h. einer Drehung der Koordinatenachsen besteht. 3. Übergang von kartesischen Koordinaten zu Polarkoordinaten und umgekehrt Er wird mit den folgenden Formeln vollzogen, wobei Koordinatenursprung und Pol sowie Abszissenachse und Polarachse zusammenfallen sollen (Abb.3.126): C 287a) C.287b) C.287c) x = r(ip)cos<p y = r(tp)siiup (—n < ip < 7r, p > 0), C 288a) > = yjX2 + 1 C.288b) arctan —h n für x < 0, x y arctan - für x > 0 , x {P= \- fürx = 0und?/>0, ¦ — für x = 0 und y < 0, [ unbestimmt für x = y — 0 . C 288c)
3 5 Vektoralgebra und analytische Geometrie 197 y- öl p h x * X P2(x2,y2) Abbildung 3.126 Ol x Abbildung 3.127 xfor'frS Abbildung 3 128 3.5.2.3 Spezielle Punkte in der Ebene 1. Abstand zwischen zwei Punkten Sind die Punkte in kartesischen Koordinaten P\ (£1,2/1) und P2 {x2,y2) gegeben (Abb.3.127), dann ist C 289) C.290) d= \J{x2-xiJ + (y2-yif, sind sie als P\ (pi, v?i) und P2 (p2, ^2) in Polarkoordinaten gegeben (Abb.3.128), dann gilt d= yjpl + p\ - <2p\P2 cos (y?2 - <£i) 2. Koordinaten des Massenmittelpunktes (Schwerpunktes) Die Koordinaten (x, y) des Massenmittelpunktes eines Systems materieller Punkte Mi B^, y^ mit den Massen m^ (i = 1,2,. , n) werden mit den folgenden Formeln berechnet. Die Berechnung durch Integration s. 8.2.2.3,5., S 469. 3. Teilung einer Strecke 1. Teilung im gegebenen Verhältnis Die Koordinaten C.291) P\P m des Punktes P mit dem Teilungsverhältnis —— = — : Strecke P\P2 (Abb.3.129a) werden berechnet gemäß nx\ 4- mx2 Xi + Xx2 A der y- n + m nyi + my2 n + m 1 + A Vi + Ay2 1 + A ' C 292a) C 292b) r ö" P2(x2.y2)/g /^(xi/yi) X Für den Mittelpunkt M der Strecke P1P2 erhält man wegen A = .-*±*. y-*+*. C292c) Wenn den Strecken P^P und PP2 ein positives oder negatives Vorzeichen in Abhängigkeit davon zugeordnet wird, ob ihre Richtung mit der von P1P2 übereinstimmt oder nicht, dann können die Formeln C.292a,b,c,d) für A < 0 zur Bestimmung eines Punktes dienen, der die Strecke P\P2 im vorgegebenen Verhältnis äußerlich teilt {äußere Teilung), d h außerhalb der b) X' 1 ,0 -1 » -2 ' 1 ¦ Pi/i !p2 P ^LMj2 j3 x4 j L^~ \ j /! Abbildung 3 129
198 3. Geometrie Strecke P\P2 liegt. Liegt P innerhalb der Strecke PiP2, dann spricht man von innerer Teilung Man definiert: a) A = 0, wenn P = Px, b) A = oo, wenn P = P2 und c) A = -1, wenn P Fernpunkt oder uneigentlicher Punkt der Geraden g ist, d.h. wenn sich P unendlich weit von PiP2 auf g befindet Den Verlauf von A zeigt die Abb.3.129b. ¦ Für einen Punkt P, für den P2 in der Mitte der Strecke 7\P liegt, ist A = 7\P : ~PF2 = -2 2. Harmonische Teilung liegt vor, wenn innere und äußere Teilung einer Strecke P\P2 mit demselben Absolutbetrag |A| erfolgen. Mit P; und Pa als innerer bzw äußerer Teilungspunkt sowie Aj bzw Aa für innere und äußere Teilung gilt Pi M PlPi _ , _ PlPa _ , m-K~m-~Xa oder C.293a) C.293b) Pi Abbildung 3.130 Führt man den Abstand b des Mittelpunktes M der Strecke P\P2 vom Punkt P\ ein, und werden wie in Abb.3.130 die Abstände der Punkte Pi bzw. Pa von M mit Xi bzw. xa bezeichnet, dann gilt b + Xi _ xa + b Xi b — = — bzw X\J->(l ¦ -b2 C 294) Abbildung 3.131 Abbildung 3.132 Die Bezeichnung harmonische Teilung ergibt sich auch aus dem Zusammenhang mit dem harmonischen Mittel. In Abb.3.131 ist die harmonische Teilung (für A = 5 • 1) in Analogie zu Abb.3.14 dargestellt Das harmonische Mittel r der Strecken P\Pi = p und P\Pa — q ergibt sich in Übereinstimmung mit A.67b) zu p + q d h P\P2 ist das harmonische Mittel von P\Pi und P\Pa 3. Goldener Schnitt oder stetige Teilung einer Strecke a wird ihre Zerlegung in zwei Teilstrecken x und a — x genannt, wenn sich die Teilstrecke x zur Gesamtstrecke a verhält wie die Teilstrecke a — x zur Teilstrecke x Die Teilstrecke x ergibt sich als Lösung einer quadratischen Gleichung (s 1.1 1.2, ¦, S. 2): x a — x = 26, C 295) £i^= d.h. x + ax — a =0 mit a(y/E-l) « 0,618-o. Abbildung 3.133 In diesem Falle ist x das geometrische Mittel von a und a - gilt: : = y a(a — x). C 296) C 297) , denn es C.298) Die Teilstrecke x kann auch geometrisch mit Hilfe der in Abb.3.133 angegebenen Konstruktion ermittelt werden. Die Strecke x ist gleichzeitig die Seitenlänge eines regelmäßigen Zehnecks mit einem
3 5 Vektoralgebra und analytische Geometrie 199 Umkreis vom Radius a Auf die Gleichung des Goldenen Schnittes führt auch die Aufgabe, von einem Rechteck mit dem Seitenverhältnis gemäß C 296) ein Quadrat derart abzutrennen, daß auch für das verbleibende Rechteck C 296) gilt. 3.5.2.4 Flächeninhalte 1. Flächeninhalt eines Dreiecks Sind die Eckpunkte durch P\(xi,y\), P2(x2,y2) und Ps(xs,ys) (Abb.3.134) gegeben, dann ergibt sich der Flächeninhalt gemäß I xi 2/1 11 p3(x3 >y3) Pi(xi,yi) p2(x2 >y2) Abbildung 3 134 H X2 2/2 1 £3 2/3 1 1 [x\ B/2 - 2/3) + x2 B/3 - 2/1) + xs B/1 - 2/2)] - [{xi - x2) B/1 + 2/2) + (x2 - x3) B/2 + 2/3) + {X3-Xi) B/3 + 2/l)] Drei Punkte liegen auf einer Geraden, wenn gilt., C.299) x\ 2/1 1 X2 2/2 1 xz 2/3 1 2. Flächeninhalt eines Vielecks Sind die Eckpunkte durch P\ (xi, 2/1), P2 {x2, y2), 1 , s = 5 ^Xl ~ ^ ^yi + ^ + ^2 ~ X3^ ^2 + ^3^ + , Pn (xn, yn) gegeben, dann ist + (xn ~ xi) {yn + yi)] C 300) C 301) Die Formeln C.299) und C 301) liefern einen positiven Flächeninhalt, wenn die Eckpunkte in einer Reihenfolge durchnumeriert sind, die dem entgegengesetzten Drehsinn des Uhrzeigers entspricht. Anderenfalls ist der Flächeninhalt negativ. 3.5.2.5 Gleichung einer Kurve Jeder Gleichung F(x, y) — 0 für die Koordinaten x und y entspricht eine Kurve, die die Eigenschaft hat, daß die Koordinaten jedes beliebigen Kurvenpunktes P der Gleichung genügen und daß umgekehrt jeder Punkt, dessen Koordinaten diese Gleichung erfüllen, auf der Kurve liegt Die Menge dieser Punkte wird auch geometrischer Ort genannt Wenn die Gleichung F(x,y) = 0 von keinem reellen Punkt der Ebene erfüllt wird, dann gibt es keine reelle Kurve; man spricht von einer imaginären Kurve. ¦ A: x2 + y2 + 1 = 0 , ¦ B: 2/ = In fl — x2 — cosh xj . Man spricht von einer algebraischen Kurve F(x,y) = 0, wenn F(x,y) ein Polynom ist, und nennt seinen Grad die Ordnung der Kurve (s 2 3 4, S 65) Wenn die Gleichung der Kurve nicht auf die Form F(x< y) = 0 mit F(x, y) als Polynom gebracht werden kann, dann spricht man von einer transzendenten Kurve Die Gleichungen von Kurven in anderen Koordinatensystemen können in analoger Weise betrachtet werden. Im weiteren werden aber, falls nicht ausdrücklich daraufhingewiesen wird, nur die kartesischen Koordinaten verwendet 3.5.2.6 Gerade 1. Gleichung der Geraden Jede in den Koordinaten lineare Gleichung definiert eine Gerade, und umgekehrt ist die Gleichung jeder beliebigen Geraden eine lineare Gleichung ersten Grades.
200 3. Geometrie C 302) 0 eine Parallele zur y- 1. Allgemeine Geradengleichung Ax + By + C = 0 (A,B,C const). Für yl = 0 (Abb.3.135) ist die Gerade eine Parallele zur x-Achse, für B Achse, für C = 0 verläuft die Gerade durch den Koordinatenursprung 2. Geradengleichung mit Richtungskoeffizient Jede Gerade, die nicht parallel zur y-Achse verläuft, kann durch eine Gleichung der Form y = kx + b {k,b const) C 303) dargestellt werden. Die Größe k wird Richtungskoeffizient der Geraden genannt; er ist gleich dem Tangens des Winkels, den die Gerade mit der positiven Richtung der x-Achse einschließt (Abb.3.136). Die Strecke b wird von der Geraden auf der y-kch.se abgeschnitten. Sie kann ebenso wie der Tangens je nach Lage unterschiedliches Vorzeichen besitzen. 3. Geradengleichung durch einen vorgegebenen Punkt Die Gleichung einer Geraden, welche durch einen vorgegebenen Punkt Pi (x\, y\) in vorgegebener Richtung verläuft (Abb.3.137), lautet y — y\ = k (x — x\) , mit k = tanö C.304) y< ^\ s o i ./"PiK-yi) X Abbildung 3.135 Abbildung 3 136 Abbildung 3 137 4. Geradengleichung für zwei vorgegebene Punkte Sind zwei Geradenpunkte P\ (x1} y\), B2 (^2,2/2) vorgegeben (Abb.3.138), dann lautet die Geradengleichung y^L = l^lL. C.305) Vi -Vi x2- xi 5. Geradengleichung in Achsenabschnittsform Wenn eine Gerade auf den Achsen jeweils die Strecken a und b abschneidet, wobei die Vorzeichen zu berücksichtigen sind, dann lautet ihre Gleichung (Abb.3.139) C.306) Pifritfi) <x2 >y2) Abbildung 3.138 Abbildung 3.139 Abbildung 3.140 6. Normalform der Geradengleichung (auch HESSEsche Normalform) Mit p als Abstand der Geraden vom Koordinatenursprung und a als der Winkel, den die x-Achse und die vom Koordinatenursprung auf die Gerade gefällte Normale einschließen (Abb.3.140), mit p > 0 und 0 < a < 2tt , lautet die HESSEsche Normalform xcosa +ysina — p = 0. C.307)
3 5 Vektoralgebra und analytische Geometrie 201 Man kann die HESSEsche Normalform aus der allgemeinen Geradengleichung durch Multiplikation mit dem Normierungsfaktor fi = ±—=L= C.308) P VA2 + B2 K ' herleiten Das Vorzeichen von /i muß entgegengesetzt zu dem von C gewählt werden 7. Geradengleichung in Polarkoordinaten (Abb.3.141) Mit p als Abstand vom Pol zur Geraden (Normalenstrecke vom Pol zur Geraden) und a als Winkel zwischen Polarachse und der vom Pol auf die Gerade gefällten Normalen gilt C 309) cos (ip — a) 2. Abstand eines Punktes von einer Geraden Man erhält den Abstand d eines Punktes Pi (xi.yi) von einer Geraden (Abb.3.140) aus der Hesse- schen Normalform durch Einsetzen der Koordinaten des gegebenen Punktes in C 307). d = x\ cosq + y\ sina — p. C.310) Wenn P\ und der Koordinatenursprung auf verschiedenen Seiten der Geraden liegen, ist d > 0 , anderenfalls ist d < 0 Abbildung 3.141 Abbildung 3 142 Abbildung 3 143 3. Schnittpunkt von Geraden 1. Schnittpunkt zweier Geraden Um die Koordinaten (xo, yo) des Schnittpunktes zweier Geraden zu berechnen, ist die Lösung des aus ihren Gleichungen zu bildenden Gleichungssystems zu berechnen Wenn die Geraden durch die Gleichungen Axx + B^ + Cx = 0, A2x + B2y + C2 = 0 C 311a) gegeben sind, dann gilt x0 = I Bx Cx I I B2 C21 \a2 b2 I 2/o = I Ci AYI \C2A2\ I Al B, I \A2B2\ \AlBl \A2 B2 | zusammen Wenn \J^L Dl | = 0 ist, dann sind die Geraden parallel. Ist A2 ?1 B2 9i c2 C 311b) dann fallen die Geraden 2. Geradenbüschel Wenn eine dritte Gerade mit der Gleichung A3x + Bsy + C3 = 0 C.312a) durch den Schnittpunkt der ersten beiden Geraden gehen soll (Abb.3.142), dann muß die Bedingung Al A2 A, B^ B2 B, Ci c2 c,, = 0 C 312b)
202 3 Geometrie erfüllt sein. Die Gleichung {Aix + Biy + Ci) + A (A2x + B2y + C2) = 0 (-00 < A < +oo) C.312c) beschreibt alle Geraden die durch den Schnittpunkt Po(x0, y0) der beiden Geraden C.311a) hindurchgehen. Durch C.312c) wird ein Geradenbuschel mit dem Träger Po(x0, y0) definiert Wenn die Gleichungen der ersten beiden Geraden in Normalform gegeben sind, dann erhält man für A = ±1 die Gleichungen der Winkelhalbierenden der von den beiden Geraden eingeschlossenen Winkel (Abb.3.143) Abbildung 3 144 x 0 b) Abbildung 3.145 4. Winkel zwischen zwei Geraden Die sich kreuzenden Geraden sind in Abb.3.144 dargestellt. Wenn die beiden Geradengleichungen in der allgemeinen Form : 0 und A2x + B2y + C2 = 0 Aix + Bxy + Ci = gegeben sind, dann gilt AXB2 - A2BX tan</? = cos</? - AXA2 + BXB2 ' AXA2 + BXB2 C 313c) y/Al + B^Al + Bf Mit den Richtungskoeffizienten k\ und k2 ergibt sich k2 - ki sm ip - AXB2 - A2BX sJA\ + B\^A\ + Bl tany? = COS(^ = 1 + hk2 ' l'+fcifc2 ^/l + /c^H-/c22' C.313f) sinv? = ¦h y/^T^^T^ C 313a) C 313b) C.313d) C 313e) C.313g) Dabei wird der Winkel (p von einer Geraden zur zweiten im entgegengesetzten Drehsinn des Uhrzeigers gemessen. Für parallele Geraden (Abb.3.145a) ist — A2 -Ai Bx B2 oder k\ = k2 Für senkrechte Geraden (Abb.3.145b) ist AiA2 + BiB2 = 0 oder k2 = —l/k\. 3.5.2.7 Kreis 1. Definition Der Kreis ist der geometrische Ort aller Punkte einer Ebene, die von einem festen Punkt dieser Ebene, dem Mittelpunkt des Kreises, einen konstanten Abstand, den Radius des Kreises, haben (s. auch 3.1.6.1, S 142). 2. Gleichung des Kreises in kartesischen Koordinaten Die Gleichung des Kreises lautet in kar- tesischen Koordinaten für den Fall (Abb.3.146a), daß der Kreismittelpunkt im Koordinatenursprung liegt, x2 + y2 = R2 C.314a)
3.5 Vektoralgebra und analytische Geometrie 203 C.314b) Liegt der Mittelpunkt im Punkt C(x0, y0) Abb.3.146b, dann ergibt sich (x - x0J + (y - y0J = R2. Die allgemeine Gleichung zweiten Grades ax2 + 2bxy + cy2 + 2dx + 2ey + / = 0 C.315a) liefert dann und nur dann einen Kreis, wenn 6 = 0 und a = c Für diesen Fall kann die Gleichung stets auf die Form x2 + y2 + 2mx + 2ny + q = 0 gebracht werden. Für den Radius und die Koordinaten des Mittelpunktes gilt dann C 316a) R= y/m2 + n2 - 4, Xq = —m, Vo- C.315b) C 316b) Für q > m2 + n2 liefert die Gleichung keine reelle Kurve, für q = m2 + n2 ergibt sich ein einziger Punkt P(x0,yo). b) 0 yo P(x,y) Abbildung 3 147 Abbildung 3.146 3. Parameterdarstellung des Kreises x = xq + Rcost, y — yo + Rsin£, C.317) wobei t der Winkel zwischen dem beweglichen Radius und der positiven Richtung der x-Achse ist (Abb.3.147). P (^ P/\ 0^ " ,<frw\ Abbildung 3 148 Abbildung 3.149 Abbildung 3.150 4. Kreisgleichung in Polarkoordinaten ganz allgemein gemäß Abb.3.148: p2 - 2pp0 cos ((p - (fo) + p2 = R2. C.318a) Wenn der Kreismittelpunkt auf der Polarachse liegt und der Kreis durch den Koordinatenursprung verläuft (Abb.3.149), dann vereinfacht sich die Gleichung zu p = 2Rcosy>. C.318b) 5. Tangente an den Kreis Die Tangente an den Kreis mit der Gleichung C.314a) im Punkt P(x0,yo) (s. Abb.3.150) beschreibt die Gleichung xx0 + yyo = R2. C.319)
204 3 Geometrie 3.5.2.8 Ellipse 1. Elemente der Ellipse Achse, A, B, C, D die Scheitel, Fi, F2 die Brennpunkte mit dem Abstand c = y/ä? Es sind in Abb.3.151 AB = 2a die große Achse, CD = 2b die kleine b2 auf beiden Seiten des Mittelpunktes, e = c/a < 1 die numerische Exzentrizität und p = b2/a der Halbparameter, d h die halbe Länge der durch einen Brennpunkt parallel zur kleinen Achse gezogenen Sehne. ^ —1 T (a -f ^F2V «« y< ^ D ^0 2 T^l c JFa J .a ? X Abbildung 3 151 Abbildung 3 152 2. Gleichung der Ellipse Die Ellipsengleichung lautet in der Normalform, d h für zusammenfallende Koordinaten- und Ellipsenachsen sowie in der Parameterform a2 + b2 ' C 320a) = acos t, 2/: = bsint C 320b) Die Ellipsengleichung in Polarkoordinaten s. 3.5.2 11,6., S 213 3. Brennpunktseigenschaften der Ellipse, Definition der Ellipse Die Ellipse ist der geometrische Ort aller Punkte, für die die Summe der Abstände von zwei gegebenen festen Punkten, den Brennpunkten, konstant gleich 2a ist. Jeder dieser Abstände, die auch Brennpunktradien eines Ellipsenpunktes genannt werden, berechnet sich als Funktion von der Abszissenkoordinate x gemäß rl=TVl = a-ex, r2 = ~PF~2 = a + ex , rx+r2 = 2a. C.321) In dieser und in den weiteren Formeln mit kartesischen Koordinaten wird angenommen, daß die Ellipse in der Normalform gegeben ist 4. Leitlinien der Ellipse sind Geraden parallel zur kleinen Achse im Abstand d = a/e (Abb. 3.152). Jeder beliebige Ellipsenpunkt P(x,y) unterliegt der Leitlinieneigenschaft (s 3 5 2 11,4., S. 213) der Ellipse ' d2 C 322) 5. Durchmesser der Ellipse werden die Sehnen genannt, die durch den Ellipsenmittelpunkt gehen und von diesem halbiert werden (Abb.3.153) Der geometrische Ort der Mittelpunkte aller Sehnen, die zu einem Ellipsendurchmesser parallel sind, ist wieder ein Durchmesser, ein konjugierter Durchmesser zum ersten Für k und k' als Richtungskoeffizienten zweier konjugierter Durchmesser gilt kk' = ¦ C 323) Wenn 2a\ und 2b\ die Längen zweier konjugierter Durchmesser sind und a sowie ß die spitzen Winkel zwischen den Durchmessern und der großen Achse, wobei k = — tan a und k' = tan ß ist, dann gilt der Satz des APOLLONIUS in der Form a\b\ sin(a + ß) = ab, a? + < ! + 62 C 324) 6. Tangente an die Ellipse Die Tangente an die Ellipse im Punkt P(xq, yo) beschreibt die Gleichung XXq um b2 + ^ = 1. C 325)
3 5 Vektoralgebra und analytische Geometrie 205 /a y< 0 i —^xt'v) jy Üjb , W x N(x,-y) Abbildung 3.153 Abbildung 3.154 Abbildung 3 155 Normale und Tangente an die Ellipse (Abb.3.154) sind jeweils Winkelhalbierende des inneren Winkels und dessen Supplementwinkels zwischen den von den Brennpunkten zum Berührungspunkt P weisenden Radien Die Gerade Ax + By + C = 0 ist eine Tangente an die Ellipse, wenn die Gleichung A2a2 + B2b2 - C2 = 0 ' C.326) erfüllt ist 7. Krümmungskreisradius der Ellipse (Abb.3.154) Mit u als Winkel zwischen Tangente und Radiusvektor von einem der Brennpunkte zum Berührungspunkt P(xq, yo) gilt: Ä = aVH? + bA 3 (nr2J ab C.327) b2 a2 In den Scheiteln A und B (Abb.3.151) sowie C und D ist Ra = Rb = — = V und Rc = Rd = ~r ¦ 8. Flächeninhalte der Ellipse (Abb.3.155) a) Ellipse: S = irab. C.328a) b) Ellipsensektor BOP: c) Ellipsenabschnitt PBN: 0 ab x obop — ^r arccos - . 2 a C.328b) Spbn — ab arccos - ¦xy. C 328c) 9. Ellipsenbogen und Ellipsenumfang Die Bogenlänge zwischen zwei Punkten A und B der Ellipse läßt sich nicht elementar berechnen, wie es für die Parabel möglich ist, sondern, mit Hilfe eines unvollständigen elliptischen Integrals 2 Gattung E(h, (p) (s. 8.2.2.2,2., S. 466). Den Umfang der Ellipse (s. auch 8.2.5,7., 479) berechnet man daher mit Hilfe des vollständigen elliptischen Integral 2. Gattung E(e) = E l e, — ) mit der numerischen Exzentrizität e = \Ja2 — b2/a und ;es) zu -©¦'-(M^-G*!)"?---!- mit ip = — (für ein Viertel des Umfanges) zu L = 4aE(e) = 2ira betzt man A = —, dann ist (o + 6) : ?r(a + b) 25A8 + 4 + 64 + 256 + 16384 C.329b)
206 3 Geometrie und in Näherung L«7r[l,5(a + 6)- Vabl , L « n{a + b) 64 - 3A4 64 - 16A2 ' C 329c) P(x,y) ¦ Für a = 1, 5, b = 1 liefert C 329c) den Wert 7,93, während die genauere Rechnung mit Hilfe des vollständigen elliptischen Integrals 2 Gattung (s 8.1.4.3, ¦, S. 454) den Wert 7,98 ergibt 3.5.2.9 Hyperbel 1. Elemente der Hyperbel In Abb.3.156 sind AB = 2a die reelle Achse, A, B die Scheitel; 0 der Mittelpunkt; Fi und F2 die Brennpunkte im Abstand c > a auf der reellen Achse zu beiden Seiten vom Mittelpunkt, CD = 2b = 2y/c2 - a2 die imaginäre Achse; p = b2/a der Halbparameter der Hyperbel, d h. die halbe Länge der durch einen der Brennpunkte senkrecht zur rellen Achse gelegten Sehne; e = c/a > 1 die numerische Exzentrizität. 2. Gleichung der Hyperbel Die Hyperbelgleichung lautet in der Normalform, d.h. für zusammenfallende x- und reelle Achse sowie in der Parameterform Abbildung 3 156 ^-£ = 1, C.330a) = a cosh t, y = b sinh t; C.330b) x = , y = bttmt. C.330c) cost In Polarkoordinaten s. 3.5.2.11,6., S. 213. 3. Brennpunktseigenschaften der Hyperbel, Definition der Hyperbel Die Hyperbel ist der geometrische Ort aller Punkte, für die die Differenz der Abstände von zwei gegebenen festen Punkten, den Brennpunkten, konstant gleich 2a ist. Punkte, mit r\ — r2 = 2a gehören einem Zweig an (in Abb.3.156 dem linken), andere mit r2 — r\ = 2a dem zweiten (in Abb.3.156 dem rechten). Jeder dieser Abstände, die auch Brennpunktradien genannt werden, berechnet sich aus ri = ±(ex — a), r2 = ±(esc + a), r2 — ri = ±2o, C.331) wobei das obere Vorzeichen für den rechten, das untere für den linken Zweig gilt. In diesen und den folgenden Hyperbelformeln, mit kartesischen Koordinaten, wird angenommen, daß die Hyperbel in der Normalform angegeben ist. ¥y ) A y 0 bU X Abbildung 3 157 Abbildung 3 158 4. Leitlinien der Hyperbel sind senkrecht auf der reellen Achse im Abstand d = a/c vom Mittelpunkt stehende Geraden (Abb.3.157). Jeder beliebige Hyperbelpunkt F(x, y) unterliegt der Leitlinieneigenschaft der Hyperbel (s 3 5 2 11,4., S 213) do C 332)
3 5 Vektoralgebra und analytische Geometrie 207 C.333) 5. Tangente an die Hyperbel Die Tangente an die Hyperbel im Punkt P(xo,y0) beschreibt die Gleichung xxp yy0 = Normale und Tangente an die Hyperbel (Abb.3.158) sind jeweils Winkelhalbierende des inneren Winkels und dessen Supplementwinkels zwischen den von den Brennpunkten zum Berührungspunkt P weisenden Radien. Die Gerade Ax + By + C = 0 ist eine Tangente, wenn die folgende Gleichung erfüllt ist: C.334) ^ N / //>. yf , . >v A / \ / V "v.^V f X ^ Abbildung 3 159 Abbildung 3 160 6. Asymptoten der Hyperbel sind Geraden (Abb.3.159), die sich den Hyperbelzweigen für \x\ —> 00 unbegrenzt nähern (Definition der Asymptoten s 3.6.1.3,4., S. 241). Der Richtungskoeffizient der Asymptoten ist k — ± tan 5 = ±b/a . Die Gleichungen der Asymptoten lauten y = ± C.335) Die Asymptoten bilden gemeinsam mit der Tangente an die Hyperbel in einem Punkt P das Tangentenstück der Hyperbel, d.h die Strecke TT\ (Abb.3.159) Das Tangentenstück wird durch den Berührungspunkt P halbiert, so daß TP = T\P ist Der Flächeninhalt des Dreiecks TOT\ zwischen der Tangente und beiden Asymptoten beträgt für jeden Berührungspunkt P SD = ab C 336) Der Flächeninhalt des Parallelogramms OFPG, das von den Asymptoten und zwei zu ihnen vom Punkt P ausgehenden Parallelen gebildet wird, beträgt (a2 +_^) _ £_ ~ 4 * SP = ¦ C.337) 7. Konjugierte Hyperbeln (Abb.3.160) haben die Gleichungen v x < W - - — K2 2 " - C'338) az b2 b2 a? wobei die zweite in Abb.3.160 gestrichelt dargestellt ist Sie besitzen gemeinsame Asymptoten derart, daß die reelle Achse der einen die imaginäre Achse der anderen ist und umgekehrt. 8. Durchmesser der Hyperbel (Abb.3.161) werden diejenigen Sehnen zwischen den zwei Asten einer Hyperbel genannt, die durch den gemeinsamen Mittelpunkt verlaufen, der sie halbiert. Zwei Durchmesser mit den Riehtungskoeffizienten k und k', die zu einer Hyperbel und ihrer konjugierten Hyperbel gehören, werden konjugiert genannt, wenn kk' = b2/a2 ist. Von jedem der beiden konjugierten Durchmesser werden die Sehnen der gegebenen bzw der zu ihr konjugierten Hyperbel, die parallel zu dem anderen Durchmesser verlaufen, in zwei gleiche Teile geteilt (Abb.3.161). Von zwei konjugierten Durchmessern schneidet nur der mit \k\ < b/a die Hyperbel. Die dabei entstehende Sehne,
208 3 Geometrie Abbildung 3.161 Abbildung 3.162 ein Durchmesser im engeren Sinne des Wortes, wird im Hyperbelmittelpunkt halbiert. Wenn 2a\ bzw 2&i die Längen zweier konjugierter Durchmesser sind und a bzw. ß < a die spitzen Winkel, die diese Durchmesser mit der reellen Achse bilden, dann gilt a\ - b\ = a2 - b2 ; ab = axbi sin(a - ß) C 339) 9. Krümmungskreisradius der Hyperbel Im Punkt P(x0,yo) (Abb.3.158) hat die Hyperbel den Krümmungskreisradius R-- y2oY/2 =(nr2K/2 = v i i ab C 340a) wobei u der Winkel zwischen Tangente und Radiusvektor von einem der Brennpunkte zum Berührungspunkt ist In den Scheiteln A und B gilt b2 RA = RB=p=- C.340b) 10. Flächeninhalte in der Hyperbel (Abb.3.162) a) Hyperbelsegment APN: Sapn = xy — ab In (H) xy — ab Arcosh — . a b) Fläche OAPG: JOAPG z ab ab, 2d C.341a) C.341b) Die Strecke PG verläuft parallel zur unteren Asymptote, c ist der Brennpunktsabstand und d = 0G 11. Hyperbelbogen Die Bogenlänge zwischen zwei Punkten A und B der Hyperbel läßt sich nicht elementar berechnen, wie es für die Parabel möglich ist, sondern mit Hilfe eines unvollständigen elliptischen Integrals 2 Gattung E(k,ip) (s. 8.1 4.3, S. 466) in Analogie zur Bogenlänge der Ellipse (s 3 5 2 8,9. S 205) 12. Gleichseitige Hyperbeln zeichnen sich durch gleich große Achsen a = b aus, so daß ihre Gleichung lautet x2 -y2 = a2 C 342a) Die Asymptoten der gleichseitigen Hyperbel stehen senkrecht aufeinander. Wenn die Asymptoten mit den Koordinatenachsen zusammenfallen (Abb.3.163), dann lautet die Gleichung „2 xy=-. C 342b) 3.5.2.10 Parabel 1. Elemente der Parabel In Abb.3.164 ist die x-Achse mit der Parabelachse identisch, 0 ist der Scheitel der Parabel, F der Brennpunkt der Parabel, der sich im Abstand p/2 vom Koordinatenursprung
3 5 Vektoralgebra und analytische Geometrie 209 Ni I ty 1 ^ ^^ \kf^] °K? x N'1 \  ^^* Abbildung 3 163 Abbildung 3 164 Abbildung 3.165 auf der x-Achse befindet, wobei p Halbparameter der Parabel genannt wird. Mit NN' ist die Leitlinie bezeichnet, d.h. eine Gerade, die senkrecht auf der Parabelachse steht und diese im Abstand p/2 auf der dem Brennpunkt entgegengesetzten Seite schneidet. Somit ist der Halbparameter auch gleich der halben Länge der Sehne, die im Brennpunkt senkrecht auf der Achse steht Die numerische Exzentrizität der Parabel ist gleich eins (s 3.5 2 11,4., S 213) 2. Gleichung der Parabel Wenn der Koordinatenursprung in den Scheitel cler Parabel gelegt wird, die x-Achse mit der Parabelachse zusammenfällt und der Parabelscheitel nach links weisen soll, dann lautet die Normalform der Parabelgleichung y2 = 2px. C.343) Die Gleichung der Parabel in Polarkoordinaten s. 3.5.2.11,6., S. 213. Für Parabeln mit vertikaler Achse (Abb. 3.165) lautet die Parabelgleichung y = ax2 + bx + c C.344a) Der Halbparameter dieser so gegebenen Parabel ist p - 1 2\a~\- C.344b) Ist o > 0, so ist die Parabel nach oben geöffnet, für a < 0 ist sie nach unten geöffnet. Die Koordinaten des Scheitels sind b Aac-b2 xo = -— > Vo =—-. • C.344c) 2a' 4a 3. Haupteigenschaft der Parabel (Definition der Parabel) Die Parabel ist der geometrische Ort aller Punkte P(x, y), die von einem festen Punkt, dem Brennpunkt, und einer festen Geraden, der Leitlinie, gleich große Entfernung besitzen (Abb.3.164). Hier und in den folgenden Formeln in kartesischen Koordinaten wird die Normalform der Parabelgleichung angenommen Dann ist PF = PK = x + '¦ C.345) wobei PF der vom Brennpunkt ausgehende Radius des Parabelpunktes ist. 4. Durchmesser der Parabel wird eine Gerade genannt, die parallel zur Parabelachse liegt (Abb. 3.166) Ein Parabeldurchmesser halbiert die Sehnen, die zur Tangente im Endpunkt des Durchmessers parallel liegen (Abb.3.166). Mit dem Richtungskoeffizienten k der Sehnen lautet die Gleichung des Durchmessers V = l C.346) 5. Tangente an die Parabel (Abb.3.167) Die Gleichung der Tangente an die Parabel im Punkt P(xo,yo) lautet yy0=p(x + x0) C.347) Tangente und Normale der Parabel sind Winkelhalbierende für die Winkel zwischen dem vom Brennpunkt ausgehenden Radiusvektor und dem Durchmesser des Berührungspunktes. Die Strecke auf der
210 3. Geometrie Parabeltangente zwischen dem Berührungspunkt und dem Schnittpunkt mit der Paiabelachse auf der x-Achse wird durch die Tangente im Parabelscheitel, d h durch die y-Achse halbiert- TS = ~SP, TÖ = ÖM = x0, TF = ¥P C 348) Eine Gerade mit der Gleichung y = kx + b ist eine Tangente an die Parabel, wenn p = 2bk C 349) y< "s ^j 0 Q^tCn lFM\ X Abbildung 3 166 Abbildung 3.167 Abbildung 3.168 6. Krümmungskreisradius der Parabel im Punkt P(x\,y\) mit ln als Normalenlänge PN und u als Winkel zwischen Tangente und Radiusvektor (Abb.3.167) gilt allgemein bzw im Scheitel 0 R- ) + 2xi): 3/2 Vp sin3w p2 ' C 350a) 7. Flächeninhalte in der Parabel (Abb.3.168) a) Parabelsegment PON: 2 Sopn = -^Smqnp (MQNP ist das Parabelparallelogramm). b) Parabelfläche OPR: Q 2xy OQPR = -r- 8. Länge des Parabelbogens vom Scheitel 0 bis zum Punkt P(x,% \2x~ 2x f 2x , . ..— 1 + —1+ln \ p V p ( P\ P k • , 2x ; X + S +£ArsinhW — V 2/ 2 \ p Für kleine Werte von - gilt näherungsweise ,1 2x + W1 + — PVP ~2x lop~y 1 + 2/x\2 2/xx4 3V?/ 5 W C.350b) C 351a) C 351b) C 352a) C 352b) C.352c) 3.5.2.11 Kurven 2. Ordnung (Kegelschnitte) 1. Allgemeine Gleichung der Kurven 2. Ordnung Mit der allgemeinen Gleichung der Kurven 2 Ordnung ax2 + 2bxy + cy2 + 2dx + 2ey + / = 0 C 353a)
3.5 Vektoralgebra und analytische Geometrie 211 werden die Ellipse, ihr Spezialfall der Kreis, die Hyperbel, die Parabel oder ein Geradenpaar (als zerfallende Kurve 2. Ordnung) definiert Die Ruckführung auf die Normalform kann mit Hilfe der in Tabelle 3.19 und Tabelle 3.20 angegebenen Koordinatentransformationen erreicht werden. Hinweis: Die Koeffizienten in C 353a) sind nicht identisch mit den Parametern der speziellen Kegelschnitte in den Gleichungen für Ellipse, Hyperbel und Parabel. Tabelle 3.18 Kurvengleichungen 2 Ordnung Mittelpunktskurven E ^ 0)* Größen 5 und A Gestalt der Kurve Ellipse a) für A • S < 0 reell, b) für A • S > 0' imaginär*2^ Mittelpunktskurven 5^0 6>0 5<0 A^O A^O "A^Ö" Ein Paar imaginärer*2) Geraden mit reellem gemein- samen Punkt Hyperbel Ein Paar schneidender Geraden Notwendige Koordinatentransformation Normalform der Gleichung nach Transformation 1 Verschiebung des Koordinatenursprungs in den Kurvenmittelpunkt, dessen Koordinaten be — cd bd — ae . , xo = —^—' y°= —§— smd 2. Drehung der Koordinatenachsen um den TTT. 1 ! ^ 26 Winkel a mit tan 2a = a — c Das Vorzeichen von sin 2a muß mit dem Vorzeichen von 26 übereinstimmen. Hierbei ist der Richtungskoeffizient der neuen x'-Achse a'x'2 + c'y'2 + - = 0 n' rJ a + c-f- a + c- V(a- 2 y/(a- -cf -cf + 462 + 462 -a+yj(c- af + 462 26 (a' und d sind Wurzeln der quadratischen Gleichung u2 - Su + 5 = 0). * V A, ö und S sind gemäß C.353b) Zahlen. *2) Der Kurvengleichung entspricht eine imaginäre Kurve. Hinweis: Sind zwei Koeffizienten (a und 6 oder 6 und c) = 0, so reduzieren sich die notwendigen Koordinatentransformationen auf eine Verschiebung der Koordinatenachsen Die Gleichung cy2 + 2dx 4- 2ey + / = 0 erhält die Form (y — y0) = 2p(x — x0), die Gleichung ax2 + 2dx + 2ey + / = 0 erhält die Form (x — xo) = 2p(y — y0) 2. Invariante einer Kurve 2. Ordnung Invariante einer Kurve 2. Ordnung sind die drei Größen \a b d S=\ao\: S = a + c C 353b) A = b c e def
212 3 Geometrie Tabelle 3 20 Kurvengleichungen 2. Ordnung. Parabolische Kurven (S = 0) Größen S und A Parabolische Kurvenl, S = 0 A^O A = 0 Gestalt der Kurve Parabel Geradenpaar- Parallele Geraden für gP - af > 0, Doppelgerade für d2 — af = 0, Imaginäre*2) Geraden für d2 — af < 0 Notwendige Koordinatentransformation 1 Verschiebung des Koordinatenursprungs in den Scheitel der Parabel, dessen Koordinaten x0 und y0 durch die Gleichungen ad + be ax0 + by0 H — = 0 und /, de — be\ ( ae-bd\ \d + —— 1 x0 + 1 e + s 1 yo + / = 0 definiert werden. 2 Drehung der Koordinatenachsen um den Winkel a mit tana = — - , b das Vorzeichen von sin a muß dem Vorzeichen von a entgegengesetzt sein. Drehung der Koordinatenachsen um den Winkel a mit tana = — - , b das Vorzeichen von sin a muß dem Vorzeichen von a entgegengesetzt sein Normalform der Gleichung nach Transformation y'2 = 2px' ae — bd v — Sy/a2 + b2 Sy'2 + 2 a. o+ ev' + / = 0 ist auf die Form Va2 + b2 (yf - y'0) (yf — y[) = 0 transformierbar. *!) Im Falle S = 0 wird vorausgesetzt, daß keiner der Koeffizienten a, 6, c verschwindet *2) Der Kurvengleichung entspricht eine imaginäre Kurve Bei Drehungen des Koordinatensystems bleiben sie erhalten, d.h., wenn nach einer Koordinatentransformation die Kurvengleichung die Form a'x'2 + 2b'x'y' + c'y'2 + 2d'x' + 2e'y' + /' = 0 C.353c) hat, dann liefert die Berechnung dieser drei Größen A, S und S aus den neuen Konstanten die ursprünglichen Werte 3. Gestalt der Kurven 2. Ordnung (Kegelschnitte) Wenn ein gerader Kreiskegel von einer Ebene geschnitten wird, dann entsteht auf ihr ein Kegelschnitt Geht die schneidende Ebene nicht durch die Spitze, dann ergibt sich eine Hyperbel, Parabel oder Ellipse in Abhängigkeit davon, ob die Ebene parallel zu zwei, nur zu einer oder zu keiner Erzeugenden des Kegels verläuft Geht die schneidende Ebene durch die Kegelspitze, dann entstehen zerfallende Kegelschnitte mit A = 0. Als Kegelschnitt eines in einen Zylinder entarteten Kegels, dessen Spitze sich im Unendlichen befindet, ergeben sich zwei parallele Geraden Der Bestimmung der Gestalt der Kegelschnitte dienen die Tabelle 3.19 und die Tabelle 3.20.
3 5 Vektoralgebra und analytische Geometrie 213 4. Leitlinieneigenschaft der Kurven 2. Ordnung Der geometrische Ort aller Punkte P (Abb.3.169) mit einem konstanten Verhältnis e der Abstände zu einem festen Punkt F, dem Brennpunkt, und zu einer gegebenen Geraden, der Leitlinie, ist eine Kurve zweiter Ordnung mit der numerischen Exzentrizität e. Für e < 1 ergibt sich eine Ellipse, für e = 1 eine Parabel und für e > 1 eine Hyperbel. 5. Bestimmung der Kurve durch fünf Punkte Durch fünf vorgegebene Punkte kann eine und nur eine Kurve 2. Ordnung gehen. Wenn drei dieser Punkte auf einer Geraden liegen, dann ergibt sich ein zerfallender Kegelschnitt. 6. Polargleichung der Kurven zweiter Ordnung Alle Kurven 2 Ordnung werden mit der einen Polargleichung P = i C 354) 1 + e cos tp beschrieben, wobei p der Halbparameter und e die Exzentrizität sind. Dabei liegt *der Pol im Brennpunkt, während die Polarachse vom Brennpunkt nach dem nächstgelegenen Scheitelpunkt hin gerichtet ist Für die Hyperbel definiert diese Gleichung nur einen Ast 3.5.3 Analytische Geometrie des Raumes 3.5.3.1 Grundlagen, räumliche Koordinatensysteme 1. Koordinaten und Koordinatensysteme Jeder beliebige Punkt P im Raum kann mit Hilfe eines Koordinatensystems festgelegt werden Die Richtungen der Koordinatenlinien sind durch die Richtungen der Einheitsvektoren festgelegt. In Abb. 3.170a sind die Verhältnisse für ein kartesisches Koordinatensystem dargestellt. Man unterscheidet rechtwinklige und schiefwinklige Koordinatensysteme In ihnen stehen die Einheitsvektoren der Koordinatenlinien senkrecht bzw. schiefwinklig aufeinander Eine andere wichtige Unterscheidung ist die Rechts- oder Linkshändigkeit eines Koordinatensystems Die gebräuchlichsten räumlichen Koordinatensysteme sind kartesische Koordinaten, Zylinderkoordinaten und Kugelkoordinaten. 2. Rechts- und Linkssysteme In Abhängigkeit von der gegenseitigen Aufeinanderfolge der positiven Koordinatenrichtungen unterscheidet man Rechtssysteme und Linkssysteme oder rechtshändige bzw linkshändige Koordinatensysteme. Ein Rechtssystem besitze z.B. drei in der alphabetischen Reihenfolge genommene und nicht in einer Ebenen liegende Einheitsvektoren e», e^, e^ Die Rechtshändigkeit kommt dann dadurch zum Ausdruck, daß eine Drehung eines der Vektoren um den gemeinsamen Koordinatenursprung auf den nächsten in der alphabetischen Reihenfolge bis zur Überdeckung auf dem kürzesten Wege im Gegenuhrzeigersinn ausgeführt werden kann Symbolisch stellt man diesen Sachverhalt mit Hilfe der Abb.3.34 dar; die dort eingezeichneten Seiten a, 6, c sind durch die Indizes i,j, k zu ersetzen Ein Linkssystem erfordert Drehungen dieser Art im Uhrzeigersinn. Rechts- und Linkssysteme können durch Vertauschung der Einheitsvektoren ineinander überführt werden Die Vertauschung zweier Einheitsvektoren ändert die Händigkeit des Systems, d.h. seine Orientierung: Aus einem Rechtssystem wird ein Linkssystem und umgekehrt aus einem Linkssystem ein Rechtssystem. Eine wichtige Art der Vektorvertauschung ist die zyklische Vertauschung, bei der die Orientierung erhalten bleibt Gemäß Abb.3.34 erfolgt die Vertauschung der Vektoren im Rechtssystem im Gegenuhrzeigersinn, d h nach dem Schema (i —> j; —> k —? z, j —> k —* i —? j, k —> i —> j —? k). Im Linkssystem erfolgt die Vertauschung der Vektoren im Uhrzeigersinn, d.h. nach dem Schema (i —> k —> j —> i,k ^ j^i-*k,j^i^k-^j) Abbildung 3.169
214 3. Geometrie P(x,y,z) P(y,x,z) a) /x y b) /y Abbildung 3.170 Ein Rechtssystem kann mit keinem Linkssystem zur Deckung gebracht werden Die Spiegelung eines Rechtssystems am Koordinatenursprung fuhrt auf ein Linkssystem (s 4.3.5.1,2., S. 277) ¦ A: Das kartesische Koordinatensystem mit den Koordinatenachsen x, y, z ist ein Rechtssystem (Abb.3.170a) ¦ B: Das kartesische Koordinatensystem mit den Koordinatenachsen a;, z, y ist ein Linkssystem (Abb.3.170b). ¦ C: Aus dem Rechtssystem e*, e^, ejt wird durch Vertauschung der Einheitsvektoren e, und e^ das Linkssystem e*, e^, e,-. ¦ D: Durch zyklische Vertauschung erhält man aus dem Rechtssystem e;,ej,efc das Rechtssystem e,-, e*, ei und aus diesem wieder das Rechtssystem e^, e^, e,- 3. Kartesische Koordinaten eines Punktes P werden die mit einem bestimmten Vorzeichen versehenen und in einer bestimmten Maßeinheit angegebenen Abstände von drei rechtwinklig aufeinanderstellenden Koordinatenebenen genannt. Sie stellen die Projektionen des Radiusvektors r zum Punkt P (s 3 5 1.1,6., S 186) auf drei rechtwinklig aufeinanderstellende Koordinatenachsen (Abb.3.170) dar. Der Schnittpunkt O der Koordinatenachsen wird Koordinatenursprung oder Koordinatenanfangspunkt genannt Die Koordinaten x, y und z heißen Abszisse, Ordinate und Applikate. Die Schreibweise P(a, 6, c) bedeutet, daß der Punkt P die Koordinaten x = a, y = b, z = c hat. Die Vorzeichen der Koordinaten richten sich nach dem Ok- tanten (Abb.3.171), in dem sich der Punkt P befindet (Tabelle 3.21) Abbildung 3 171 Tabelle 3.21 Koordinatenvorzeichen in den Oktanten Oktant X y z I + + + II — + + III — - + IV + - + V + + - VI — + - VII - - - VIII + - - Im rechtshändigen kartesischen Koordinatensystem (Abb.3.170a) gilt für die senkrecht aufeinanderstellenden und in der Reihenfolge e», e^, e^ genommenen Einheitsvektoren e*j x e*j = efc , e^ x e^ = ^, ek x e* = e^ , C.355a)
3.5 Vektoralgebra und analytische Geometrie 215 d h., es gilt die Rechte-Hand-Regel (s 3 5 1 3,2., S. 188). Die drei Formeln gehen durch zyklische Vertauschung der Einheitsvektoren auseinander hervor Im linkshändigen kartesischen Koordinatensystem (Abb.3.170b) gilt e* x ej = —ek , e,- x e^ = — e», e^ x et = —e*j . C 355b) Das negative Vorzeichen der Vektorprodukte ergibt sich aus der linkshändigen Reihenfolge der Einheitsvektoren s Abb.3.170b, d.h ihrer Anordnung im Uhrzeigersinn. Es ist zu beachten, daß in beiden Fällen gilt" e» x e* = e*j xej = ejtxefc = 0. C.355c) Gewöhnlich werden rechtshändige Koordinatensysteme verwendet; die Formeln sind allerdings nicht von dieser Wahl abhängig. In der Geodäsie benutzt man gewöhnlich linkshändige Koordinatensysteme (s. 3 2.2 1, S. 148). 4. Koordinatenflächen und Koordinatenlinien Koordinaten flächen zeichnen sich durch eine konstant gehaltene Koordinate aus, so daß sie im System der rechtwinkligen kartesischen Koordinaten parallel zu der von den zwei anderen Koordinatenachsen aufgespannten Ebene liegen Durch die drei Koordinatenflächen x = 0, y = 0 bzw z = 0 wird der dreidimensionale Raum in 8 Oktanten zerlegt (Abb.3.171). Koordinatenlinien sind Kurven, auf denen sich nur eine Koordinate ändert, in kartesischen Koordinatensystemen also Geraden, die parallel zu den Koordinatenachsen verlaufen. Die Koordinatenflächen schneiden einander in den Koordinatenlinien. 5. Krummlinige dreidimensionale Koordinaten entstehen, wenn drei Scharen irgendwelcher Flächen derart vorgegeben werden, daß durch jeden Raumpunkt genau eine Fläche jeder der drei Scharen verläuft Die Position eines Punktes wird in solchen Koordinatensystemen durch die Parameterwerte der drei durch diesen Punkt hindurchgehenden Koordinatenflächen bestimmt. Zu den gebräuchlichsten krummlinigen Koordinatensystemen gehören die Zylinder- und die Kugelkoordinaten. 6. Zylinderkoordinaten (Abb.3.172) bestehen aus • den Polarkoordinaten p und ip der Projektion des Punktes P auf die x, y-Ebene und • der Applikate z des Punktes P Die Koordinatenflächen des Zylinderkoordinatensystems sind • die Zylinderflächen mit dem Radius p — const, • die von der z-Achse ausgehenden Halbebenen mit tp = const und • die zur z-Achse senkrechten Ebenen mit z = const. Die Schnittlinien dieser Koordinatenebenen sind die Koordinatenlinien. Den Übergang zwischen den Zylinderkoordinaten und den rechtwinkligen kartesischen Koordinaten vermitteln die folgenden Formeln (s auch Tabelle 3.22): x = pcos(p, y = psimp, z — z\ C.356a) p = Jx2 + y2 , (p = arctan - = aresin - für x > 0 . C 356b) v x p Die notwendige Fallunterscheidung bezüglich (p s. C.288c) 7. Kugel- oder räumliche Polarkoordinaten (Abb.3.173) bestehen aus • der Länge r des Radius- oder Aufpunktvektors r, • dem Winkel d zwischen der z-Achse und dem Aufpunktvektor r sowie • dem Winkel (p zwischen der x-Achse und der Projektion von r auf die x, y-Ebene Die positiven Richtungen (Abb.3.173) weisen hier für r vom Koordinatenursprung zum Punkt P, für d von der z-Achse nach r und für (p von der x-Achse zur Projektion von r auf die x, y-Ebene. Mit den Wertebereichen 0<r<oo,0<$<7r und — tt < (p < ir werden alle Punkte des Raumes eindeutig erfaßt
216 S. Geometrie Abbildung 3.172 Abbildung 3 173 Die Koordinatenflächen des Kugelkoordinatensystems sind • die Kugeln mit dem Pol 0 als Koordinatenursprung und dem Radius r = const, • die Kegel mit d = const, der Spitze im Koordinatenursprung und der z-Achse als Achse sowie • die von der z-Achse ausgehenden Halbebenen mit ip = const Die Schnittlinien dieser Flächen sind die Koordinatenlinien. Den Übergang zwischen den Kugelkoordinaten und den kartesischen Koordinaten liefern die folgenden Formeln (s. auch Tabelle 3.22): x = r sin d cos (p, y = r sin d sin ip , z = r cos tf , C.357a) r = Jx2 + y2 + z2, 0 = arctan vx +V = arctan 1 > C.357b) v z x Die notwendige Fallunterscheidung bezüglich (p s. C.288c). Analoges gilt bezüglich $ . Tabelle 3.22 Zusammenhang zwischen kartesischen, Kreiszylinder und Kugelkoordinaten Kartesische Koordinaten x = y = z = y/x'2 + y2 arctan -r X = z y/x2 + y2 + z2 y/x2 + y2 arctan y z arctan - X Zylinderkoordinaten = QCOSip = gsimp = z = Q = <p = z = Vq2 + z2 = arctan - z = ip Kugelkoordinaten = r sin d cos (p = r sin d sin ip = r cos d — r sin d = <P = r cos d = r = $ 8. Richtung im Raum Eine Richtung im Raum wird mit Hilfe eines Einheitsvektors t° festgelegt (s 3.5.1.1,6., S 186), dessen Koordinaten die Richtungskosinusse sind, d.h die Kosinusse der Winkel zwischen der zu beschreibenden Richtung und den positiven Koordinatenachsen (Abb.3.174) / = cos a , m = cos ß, n = cos 7, l2 + m2 + n2 = 1. C 358a) Der Winkel ip zwischen zwei durch ihre Richtungskosinusse Zi, rai, n\ und /2, m2, n2 bestimmte Richtungen berechnet sich gemäß cos (p = lil2 + raim2 + n\n2 C.358b)
3 5 Vektoralgebra und analytische Geometrie 217 Zwei Richtungen stehen aufeinander senkrecht, wenn gilt lik 4- mim2 4- n\U2 = 0 C.358c) Abbildung 3.174 Abbildung 3.175 3.5.3.2 Transformation rechtwinkliger Koordinaten 1. Parallelverschiebung Wenn die ursprünglichen Koordinaten x, y, z sind und die neuen x', y'', z' und <2, b, c die Koordinaten des neuen Koordinatenursprungs im ursprünglichen Koordinatensystem (Abb.3.175), dann gilt x = x' + a, y = y' + b, z = z' 4- c, #' = £ — a , y' = y — b, z' = z — c C.359) 2. Drehung der Koordinatenachsen Wenn die Richtungskosinusse der neuen Achsen in Übereinstimmung mit den Angaben in Tabelle 3.23 bezeichnet sind (Abb.3.176), dann gilt x' = lix + miy 4- n\z, y' = kx 4- m2y + n22;, 2 = n\x' + 712?/' + riß^'; C.360a) z' — l$x 4- m^y + 7232 C.360b) Die Koeffizientenmatrix des Systems C 360a), Drehungsmatrix D genannt, und die Transformationsdeterminante A ergeben sich zu x = lix' + l2y' + hz', y = 7YI\X' 4" 77122/' + ^32' D = /l TTii 77i k 7772 ^2 fe m3 773 C.360c) detD = A = h h h m\ 7772 7773 77l 772 773 C.360d) Tabelle 3.23 Bezeichnungen der Richtungskosinusse bei Koordinatentransformation In bezug auf die alten Achsen X y z Richtungskosinus der neuen Achsen x' h TOi 77l y' k 7772 772 z' h 7773 773 3. Eigenschaften der Transformationsdeterminante a) A = ±1, mit positivem Vorzeichen, wenn die Links- bzw. Rechtshändigkeit erhalten bleibt, mit negativem Vorzeichen, wenn sich die Händigkeit ändert. b) Die Summe der Quadrate der Elemente einer Zeile oder einer Spalte ist immer gleich eins. c) Die Summe der Produkte der entsprechenden Elemente zweier verschiedener Zeilen oder Spalten ist
218 3 Geometrie Abbildung 3.176 Abbildung 3 177 gleich Null (s 4.1 4,9., S. 265) d) Jedes Element ergibt sich als Produkt aus A = ±1 und seiner Adjunkte (s. 4 1.4, S. 267). 4. Eulersche Winkel Die Lage des neuen Koordinatensystems relativ zum alten kann mit Hilfe von drei Winkeln, die Euler eingeführt hat, vollständig bestimmt werden (Abb.3.176). a) Nutationswinkel d wird der Winkel zwischen den positiven Richtungen der z- und der 2/-Achse genannt; es gilt 0 < $ < 7T. b) Präzessionswmkel t/j wird der Winkel zwischen der positiven Richtung der x-Achse und der Schnittgeraden K zwischen der x,y- und x',y'- Ebene genannt Die positive Richtung von K wird derart gewählt, daß die z-Achse, die z'-Achse sowie K ein Richtungstripel (s 3 5 1 1,4., S. 188) mit der gleichen Orientierung bilden wie die Koordinatenachsen. Die Messung von ip erfolgt von der x Achse aus in Richtung y-Achse; es gilt 0 < ip < tt . c) Drehungswinkel (p wird der Winkel zwischen der positiven sc'-Richtung und der Schnittgeraden K genannt, es gilt 0 < ip < 2tt . Wenn anstelle der Winkelfunktionen zur Abkürzung gesetzt wird COS fl = C\ , COS ift = C2 , COS 9? = C3 , sini9 = 5i, sin^ = s2, sin ip = s3, C 361a) dann gilt h = c2Ci - cipss , rai = s2c3 + Cic2s3 , n\ = sis3 ; k = -C2S3 - cis2c3 , m2 = -s2s3 + Cic2c3 , n2 = sic3 , C 361b) ^3 = sis2 , m3 = -S1C2 , n3 = ci. 5. Skalare Invariante heißt ein Skalar, der bei Verschiebung und Drehung des Koordinatensystems den gleichen Wert behält. Das skalare Produkt zweier Vektoren ist eine skalare Invariante (s 3 5 1 1,3., S. 190). ¦ A: Die Komponenten eines Vektors a = {ai, a2, a3} sind keine skalaren Invarianten, da sie bei Verschiebung und Drehung des Koordinatensystems unterschiedliche Werte annehmen. ¦ B: Die Länge des Vektors a = {ai, a2, a3} , d.h. die Größe y a\ + a\ + a3 , ist eine skalare Invariante ¦ C: Das Skalarprodukt eines Vektors mit sich selbst ist eine skalare Invariante äa = a2 = |a|2 cos(p = |a2|, da ip = 0 1. Abstand zwischen zwei Punkten Zwischen den Punkten Px (#i, yu z\) und P2 (x2, y2, z2) in Abb.3.177 beträgt der Abstand d = yj{x2 - Xlf + (y2 -yif + (z2 - zxf . C.362a)
3.5 Vektoralgebra und analytische Geometrie 219 Die Richtungskosinusse der Strecke zwischen beiden Punkten berechnen sich gemäß Z2 -Z\ X2-X1 j/2 - 2/i cos a = ;— , cos p = — . cos 7 = C.362b) 3.5.3.3 Teilung einer Strecke Die Koordinaten eines Punktes P(x,y,z), der eine Strecke zwischen den Punkten Fi (#1,2/1,2:1) und P2 (#2» 2/2 > 22) im vorgegebenen Verhältnis PiP _ m _ W2~~n~~ teilen soll, werden mit den Formeln = nyi + my2 = 2/1 + \y2 V n + m 1 + A ' nx\ + mx2 x\ + \x2 C.364b) n + m nz\ + mz2 n + m 1 + A Z\ + \Z2 1 + A ' bestimmt (s. auch 3 5.2.3,3., S. 197) Der Mittelpunkt der Strecke ergibt sich aus 2/1+2/2 zx + z2 C.363) C.364a) C.364c) 2 , *„. 2 , ~n 2 C-365) Die Koordinaten des Massenmittelpunktes (oft unkorrekterweise Schwerpunkt genannt) eines Systems aus n materiellen Punkten mit den Massen m* werden mit den folgenden Formeln berechnet, wobei die Summation über alle i von 1 bis n zu erfolgen hat. 3.5.3.4 System aus vier Punkten Vier Punkte P(x,y,z), P\ (xi,yi,z\), P2(x2,y2yz2) und P3 (^3,2/3323) können entweder einen Tetraeder (Abb.3.178) bilden oder in einer Ebene liegen. Der Rauminhalt eines Tetraeders kann über X\ +X2 y = ErriiVi Em C.366) "-! Abbildung 3.178 x y z 1 Xi 2/1 Zi 1 £2 2/2 £2 1 £3 2/3 £3 1 1 6 x-xxy-yi z- zi x-x2y-y2 z-z2 x-x3y-ys z- 23 C.367) berechnet werden, wobei sich nur dann ein positiver Wert V > 0 ergibt, wenn die Orientierung des Vektorentripels PP\, PP2 , PP3 mit der des Koordinatensystems übereinstimmt (s. 3.5.1.1,4., S. 188). Im entgegengesetzten Falle ergibt sich ein negativer Wert. In einer Ebene liegen die vier Punkte genau dann, wenn die Bedingung x y z xi 2/1 zx x2 2/2 z2 £3 2/3 z3 1 1 1 1 = 0 erfüllt ist. C.368) 3.5.3.5 Gleichung einer Fläche Jeder Gleichung F(x, y, z) = 0 C.369) entspricht eine Fläche, deren Eigenschaft es ist, daß die Koordinaten jedes beliebigen ihrer Punkte P dieser Gleichung genügen. Umgekehrt ist jeder Punkt, dessen Koordinaten der Gleichung genügen, ein Punkt auf dieser Fläche. Die Gleichung C.369) wird die Gleichung dieser Fläche genannt.
220 3 Geometrie 1. Die Gleichung einer Zylinderfläche (s. 3 3 4,1., S. 159), deren Erzeugende parallel zur x-Achse verlaufen, enthält keine x- Koordinate F(y,z) = 0 Entsprechend enthalten die Gleichungen von Zylinderflächen, deren Erzeugende parallel zur y- bzw zur z- Achse verlaufen, keine y- bzw z-Koordinate: F(x, z) = 0 bzw. F(x, y) = 0 Die Gleichung F(x, y) = 0 beschreibt die Schnittkurve zwischen der Zylinderfläche und der x, y -Ebene Wenn die Richtungskosinus oder ihnen proportionale Größen /, ra, n der Erzeugenden einer Zylinderfläche gegeben sind, dann hat die Gleichung die Form F(nx - lz, ny - mz) = 0 C 370) 2. Die Gleichung einer Rotationsfläche, d.h einer Fläche, die durch Rotation einer gegebenen Kurve in der x, 2-Ebene mit der Gleichung z = f(x) erzeugt wird (Abb.3.179), ergibt sich allgemein zu z = /(yz2 + S/2) C 371) In Analogie dazu werden die Gleichungen von Flächen erhalten, die durch Rotation einer gegebenen Kurve um eine andere Koordinate entstehen Die Gleichung einer Kegelfläche, deren Spitze im Koordinatenursprung liegt (s 3.3.4,7., S 160), ist von der Gestalt F{x, y, z) = 0 , wobei F eine homogene Funktion der Koordinaten ist (s 2 18 2 5,4., S 124). 3. Gleichung einer Raumkurve y <x Abbildung 3 179 Eine Raumkurve kann durch drei Parametergleichungen x = ipi(t), y = Mt), z = w(t) C.372) festgelegt werden. Jedem Wert des Parameters t, dem nicht immer eine unmittelbare geometrische Bedeutung zugemessen werden kann, entspricht ein bestimmter Punkt der Kurve. Eine andere Methode der Festlegung einer Raumkurve geht von der Angabe zweier Gleichungen F1{x,yiz) = 0t F2(x,y,z)=0 C 373) aus. Jede von ihnen definiert eine Fläche Eine Raumkurve ergibt sich für alle die Punkte, die beiden Gleichungen genügen, d h , die Raumkurve ist die Schnittkurve der beiden Flächen. Allgemein liefert jede Gleichung der Form Fi + XF2 = 0 C 374) für beliebiges A eine Fläche, die durch die betrachtete Kurve hindurchgeht, so daß sie eine der beiden Gleichungen in C.373) ersetzen kann. 3.5.3.6 Ebenen im Raum 1. Ebenengleichungen Jede in den Koordinaten lineare Gleichung definiert eine Ebene, und umgekehrt ist die Gleichung jeder Ebene vom ersten Grade 1. Allgemeine Ebenengleichung a) in Komponentenschreibweise: Ax + By + Cz + D = 0, C 375a) b) in Vektorschreibweise: rN + D = 0*, C.375b) wobei der Vektor N(A, B, C) senkrecht auf der Ebene steht. In (Abb.3.180) sind die Achsenabschnitte a, b und c der Ebene eingezeichnet. Man spricht vom Normalenvektor der Ebene Seine Richtungskosinusse sind ABC cos a = . , cos 3 = . n , cos 7 = . C 375c) VA2 + B2 + C2 VA2 + B2 + C2 1 VA2 + B2 + C2 V ; *Zum Skalarprodukt zweier Vektoren s Skalarprodukt 3 5 1 3,1., S 188 und zum Skalarprodukt in affinen Koordinaten 3 5 1 2,4., S 191, zur Ebenengleichung in Vektorschreibweise s Vektorielle Gleichungen 3 5 1 5, S 193
3 5 Vektoralgebra und analytische Geometrie 221 Wenn D = 0 , dann geht die Ebene durch den Koordinatenursprung, für A = 0 bzw B = 0 oder C = 0 ist die Ebene parallel zur x-Achse, bzw zur y- oder z-Achse. Wenn A = B = 0, bzw. A = C = 0 oder B = C = 0 , dann liegt die Ebene parallel zur x, y-Ebene, bzw zur x, 2- oder y, £-Ebene. 2. Hessesche Normalform der Ebenengleichung a) in Komponentenschreibweise: x cos a + y cos /? + 2 cos 7 — p = 0, C.376a) FN°- b) in Vektorschreibweise: - P = 0*, C.376b) wobei N° der Normaleneinheitsvektor der Ebene ist und p der Abstand der Ebene vom Koordinatenursprung. Die HESSEsche Normalform geht aus der allgemeinen Gleichung C.375a) durch Multiplikation mit dem Normierungsfaktor ±ß=^-= 1 = mit N = INI C.376c) hervor. Dabei muß das Vorzeichen von /x entgegengesetzt zu dem von D gewählt werden 3. Achsenabschnittsform der Ebenengleichung Mit den Strecken a, 6, c, die unter Berücksichtigung des Vorzeichens von der Ebene auf den Koordiantenachsen abgeschnitten werden (Abb.3.180), gilt- x y z - + T + - = 1. a 0 c 4. Gleichung einer Ebene durch drei Punkte Sind Pi (xi, 2/1, zi), P2 (x2,3/2,22), ^3 (^3,2/3, 23), dann gilt: a) in Komponentenschreibweise: b) in Vektorschreibweise: x-xi y-yi z-zi x2 -xiy2- yi z2 - zx X3 - xi y3 - 2/1 z3 - zi = 0, (F-Fi)(?2-?i)(if3-i?i) = 0t C.377) C 378a) C 378b) 5. Gleichung einer Ebene durch zwei Punkte und parallel zu einer Geraden Die Gleichung einer Ebene, die durch zwei Punkte P\ (#1,2/1,21), P2 (x2,y2,z2) geht und parallel zu einer Geraden mit dem Richtungsvektor R(Z, m, n) liegt, lautet x-xi y-yi z-zi | x2 - xi 2/2 - 2/1 z2 - zi I = 0, / m n a) in Komponentenschreibweise: b) in Vektorschreibweise: (r-ri)(r2-ri)R = 0* C.379a) C.379b) 6. Gleichung einer Ebene durch einen Punkt und parallel zu zwei Geraden Sind die Richtungsvektoren der beiden Geraden Ri (Zi, rai, ni) und R2 (l2, m2, n2), dann gilt- a) in Komponentenschreibweise: x-xiy-yiz-zi li m\ n\ l2 m2 n2 = 0, b) in Vektorschreibweise: (r — Fi) R1R2 = 0^. 7. Gleichung einer Ebene durch einen Punkt und senkrecht zu einer Geraden Sind P\ (#1,2/1, z\) der Punkt und N(j4, B, C) der Richtungsvektor der Geraden, dann gilt a) in Komponentenschreibweise: A (x — x\) + B (y — 2/1) + C (z — z{) = 0, tZum gemischten Produkt dreier Vektoren s 3 5 1 4,2., S 190 *Zum Skalarprodukt zweier Vektoren s Skalarprodukt 3 5 1 3,1., S 188 C 380a) C 380b) C 381a)
222 3. Geometrie b) in Vektorschreibweise: (r-?i)N = 0* C 381b) 8. Abstand eines Punktes von einer Ebene Einsetzen der Koordinaten des Punktes P(a, b, c) in die HESSEsche Normalform der Ebenengleichung C 376a) liefert ö = acosa + bcosß + ccos7 — p. C.382) Wenn P und der Koordinatenursprung auf verschiedenen Seiten der Ebene liegen, ist S > 0, im entgegengesetzten Falle ist 5 < 0 9. Gleichung einer Ebene durch die Schnittlinie zweier Ebenen Die Gleichung einer Ebene, die durch die Schnittlinie zweier Ebenen mit den Gleichungen A\x + B\y + C\z + D\ = 0 und A2x + B2y + C2z + D2 = 0 verläuft, lautet a) in Komponentenschreibweise: Aix+Biy+Ciz+D\+\ {A2x + B2y + C2z + D2) = 0 .C 383a) b) in Vektorschreibweise: r Ni + Dx + A(r N2 + D2) = 0. C 383b) Dabei ist A ein reeller Parameter, so daß durch die Gleichungen C 383a) und C.383b) ein ganzes Ebenenbüschel beschrieben wird. Die Abb.3.181 zeigt den Fall eines Ebenenbüschels mit drei Ebenen. Wenn A in den Gleichungen C 383a) und C 383b) die Werte zwischen —00 und +00 durchläuft, erhält man alle Ebenen des Büschels. Für A = ±1 erhält man die Gleichungen der Ebenen, die die Winkel zwischen den beiden gegebenen Ebenen halbieren, wenn deren Gleichungen in der Normalform gegeben sind*. Abbildung 3 180 Abbildung 3.181 Abbildung 3 182 2. Zwei und mehr Ebenen im Raum 1. Winkel zwischen zwei Ebenen, allgemeiner Fall Die Winkel zwischen zwei Ebenen, gegeben durch die zwei Gleichungen A\x + B\y + C\z + D\ = 0 und A2x + B2y + C2z + D2 = 0 , werden berechnet nach der Formel AXA2 + BXB2 + dC2 cosip - C 384a) Sind die Ebenen durch die Vektorgleichungen r Ni + Di = 0 und r N2 + D2 = 0 gegeben, dann gilt NiN2 cos ip - N,N2 mitWi = INilundA^ |N2| C.384b) 2. Schnittpunkt dreier Ebenen Die Koordinaten des Schnittpunktes dreier Ebenen, gegeben durch die drei Gleichungen Aix + Bxy + Ciz + Di = 0, A2x + B2y + C2z + D2 = 0 und A3x + B3y + C3z + D3 = 0 werden berechnet nach den Formeln -Ar A -Az mit C.385a) *Zum Skalarprodukt zweier Vektoren s Skalarprodukt 3 5 1 3,1., S 188 und Skalarprodukt in affinen Koordinaten 3 5 1 4,5., S 191, zur Ebenengleichung in Vektorschreibweise s Vektorielle Gleichungen 3 5 1 5, S 193
3.5 Vektoralgebra und analytische Geometrie 223 A = Al Bx d A2 B2 C2 ^3 B3 C3 , &x = DY Bx d D2 B2 C2 D3 B3 C3 , Ay = Ä! Di d A2 D2 C2 A3 D3 C3 , Az = Ai Bx Di A2 B2 D2 A3 B3 D3 C.385b) oder N, x N2 = Öf. C.386) Drei Ebenen schneiden sich in einem Punkt, wenn A 7^ 0 ist Ist A = 0 und wenigstens eine Unterdeterminante 2 Ordnung ^ 0, dann sind die Ebenen einer Geraden parallel, sind alle Unterdeterminanten = 0 , dann gehen die Ebenen durch eine Gerade hindurch. 3. Parallelitäts- und Orthogonalitätsbedingung für Ebenen a) Parallelitätsbedingung: Zwei Ebenen sind parallel, wenn gilt Ai = B1 = C1 A2 B2 C2 b) Orthogonalitätsbedingung: Zwei Ebenen stehen senkrecht aufeinander, wenn gilt AXA2 + BiB2 + CiC2 = 0 oder NiN2 = 0+ C.387) 4. Schnittpunkt von vier Ebenen Die Koordinaten des Schnittpunktes von vier Ebenen, gegeben durch die vier Gleichungen Aix + Biy + Ciz + Di = 0, A2x + B2y + C2z + D2 = 0, A3x + B3y + C3z + D3 = 0 und A4x + B4y + C4Z + D4 = 0 , werden berechnet, indem zuerst der Schnittpunkt dreier beliebiger Ebenen (s. S 222) bestimmt wird. In diesem Falle (S = 0) ist die vierte Gleichung eine Folge der übrigen drei Gleichungen Vier Ebenen gehen dann und nur dann durch einen Punkt, wenn gilt. \AiBiCiDi\ = 0 . C.388) A2 B2 C2 D2 A3 B3 C3 D3 A4 B4 C4 D4 5. Abstand zweier paralleler Ebenen Wenn die Parallelitätsbedingung (s S 223) erfüllt ist und die Gleichungen der Ebenen gegeben sind durch die Gleichungen Ax + By + Cz + Di = 0 und Ax + By + Cz + D2 = 0, C.389) dann beträgt der Abstand d= 'f1"^1 9. C.390) VA2 + B2 + C2 X } 3.5.3.7 Geraden im Raum 1. Geradengleichungen 1. Gleichung einer Geraden im Raum, allgemeiner Fall Da eine Gerade im Raum als Schnitt zweier Ebenen definiert werden kann, ist sie analytisch durch ein System zweier linearer Gleichungen darstellbar a) In Komponentenschreibweise: Aix + Biy + Ciz + Di = 0, A2x + B2y + C2z + D2 = 0. C.391a) b) In Vektorschreibweise: rNi+A=0, rN2 + £>2 = 0. C 391b) 2. Gleichung der Geraden in zwei projizierenden Ebenen Die zwei Gleichungen y = kx + a, z — hx + b C.392) definieren je eine Ebene, die durch die Gerade hindurchgehen und auf der x, y- bzw. x, z-Ebene senkrecht stehen (Abb.3.182) Man nennt sie projizierende Ebenen Auf Geraden, die parallel zur y, z- fProdukte von Vektoren s 3 5 1 3,2., S 188
224 3 Geometrie Ebene verlaufen, ist diese Form der Darstellung nicht anwendbar, so daß hier die Projektionen auf ein anderes Koordinatenebenenpaar zu beziehen sind. 3. Gleichung einer Geraden durch einen Punkt und parallel zum Riehtungsvektor Die Gleichung einer Geraden durch einen Punkt P\ (xi,t/i,2i) und parallel zu einem Richtungsvektor R (l,m,n) (Abb.3.183) ergibt sich a) in Komponentendarstellung und in Vektor Schreibweise: l m n b) in Parameter form und Vektor Schreibweise: x = xi + lt, y = y\ + mt, z = z\ + nt, C 393c) Die Darstellung C.393a) ergibt sich aus C.391a) mit Hilfe von , = |ßiCi| m = \CiM n=\A^BA I B2 &2 I ' I C*2 ^2 I ' I ^2 B2 I ' oder in Vektorschreibweise R = Ni x N2 , wobei die Zahlen x\,yi, Z\ so gewählt werden, daß die Gleichungen C 391a) erfüllt werden (r-ri) xR = 0*, r = f 1 + Rt C 393b) C.393d) C.394a) C.394b) Abbildung 3.183 z, _0 1 P2(x2 ,y2 ,z2) i pi(xi /Yi /zji) /~v \r A bbildung 3.184 Abbildung 3.185 4. Gleichung einer Geraden durch zwei Punkte Die Gleichung einer Geraden durch die zwei Punkte P\ (zi, 2/1,21) und P2 (x2,2/2,22) (Abb.3.184) lautet in Komponenten- und Vektorschreibweise: x-xi y-yi z- zi a) C 395a) b) (r-ri) x (r-r2) 0* C.395b) x2 -xi y2- yi z2 - zx 5. Gleichung einer Geraden durch einen Punkt und senkrecht zu einer Ebene Der Punkt sei durch Pi {x\,y\,Z\), die Ebene durch die Gleichung Ax+By+Cz+D = OoderrN+1} = 0 gegeben (Abb.3.185). Die Gleichung der Geraden lautet dann in Komponenten- und in Vektorschreibweise a) x-xi y-yi ¦ zi C.396a) b) (r-ri)xN = 0 C 396b) A B C ' 2. Abstand eines Punktes von einer in Komponentendarstellung gegebenen Geraden Der Abstand d des Punktes M(a, b, c) von einer Geraden, die gemäß C.393a) gegeben ist, ergibt sich zu 2 _ [(o -xi)m-(b- 2/1) lf + [{b - 2/1) n - (c - zx) m]2 + [(c - zl)l-{a- xx) 1 l2 + m2 + n2 C.397) *Produkte von Vektoren s 3 5 1 3,2., S 188
3.5 Vektoralgebra und analytische Geometrie 225 3. Kürzester Abstand zwischen zwei in Komponentendarstellung gegebenen Geraden Wenn die Geraden die gemäß C 393a) gegeben sind, beträgt ihr Abstand xi -x2y\- y2 zi - z2 li rai n\ l2 m2 n2 h mi I I rai ni I I U\ l\ I l2m2\ \m2n2\ \ n2 l2 \ C.398) Verschwindet die im Zähler stehende Determinante, dann ist die Bedingung dafür erfüllt, daß sich die beiden Geraden im Raum schneiden. 3.5.3.8 Schnittpunkte und Winkel von Ebenen und Geraden 1. Schnittpunkte von Ebenen und Geraden 1. Geradengleichung in Komponentenform Die Schnittpunkte einer Ebene, gegeben durch X — Xi XI — Xl\ Z — Z\ Ax + By + Cz + D = 0, und einer Geraden, gegeben durch —-— = = , ergeben sich zu. / m n x = xi — lp, y = yl — mp, z = z\ — np C 399a) mit A +By+C^+D H Al + Bm + Cn v ' Ist Al + Bm + Cn = 0, dann ist die Gerade parallel zur der Ebene Wenn außerdem Ax\ + Byi + Cz\ + D = 0, dann liegt die Gerade in der Ebene. 2. Geradengleichung in zwei projizierenden Ebenen Die Schnittpunkte einer Ebene, gegeben durch Ax + By + Cz + D = 0, und einer Geraden, gegeben durch y = kx + a und z = hx + b, ergeben sich zu * = -BAa++BCkb++cDh' y = ks+a' * = h*+b C-40°) lstA + Bk + Ch = 0, dann ist die Gerade parallel zur Ebene. Wenn außerdem Ba + Cb + D = 0, dann liegt die Gerade in der Ebene 3. Schnittpunkt zweier Geraden Die Geraden seien gegeben durch y = k\X + a\, z — h\x + b\ und y = k2x + a2 , z — h2x + b2 . Der Schnittpunkt der Geraden wird mit den folgenden Formeln berechnet- a2 -ai b2-bi _ kxa2 - k2ax _ hib2 - h2bi ( . x = I r = u r ' y = ~T 1— ' z = ~^ Z— • C.401a) ki — k2 h\ — h2 k\ — k2 h\ — h2 Einen Schnittpunkt liefern diese Formeln nur unter der Bedingung (ai - a2){hx - h2) = (bx - 62)(fci - k2). C.401b) Im entgegengesetzten Falle schneiden die Geraden einander nicht. 2. Winkel zwischen Ebenen und Geraden 1. Winkel zwischen zwei Geraden a) Allgemeiner Fall: Sind die Geraden durch die Gleichungen x-xi y-yi z-zi Ax-x2 y-y2 z - z2 . —; = = und — = = oder vektonell durch ti mi ni l2 m2 n2 (r - Fi) x R,! = 0 und (r — r2) x R2 = 0 gegeben, dann wird der Winkel gemäß hl2 + mlm2 + nxn2 RiR2 . . cos ip = . = oder cos ip = C 402) yj{l\ + m\ + n\) {11 + m\ + n22) RiR2
226 3 Geometrie mit R\ = |Ri| und R2 = IR2I berechnet. b) Parallelitätsbedingung: Die Parallelitätsbedingung für zwei Geraden lautet: Zi=mi=ni Qder ^lXlg2 = S*. C 403) l2 m2 n2 c) Orthogonalitätsbedingung: Die Orthogonalitätsbedingung für zwei Geraden lautet. hl2 + raim2 + nin2 = 0 oder RiR2 = 0. C 402) 2. Winkel zwischen einer Geraden und einer Ebene <j* — %-. y y, a) Gleichungen: Sind die Gerade und die Ebene gegeben durch die Gleichungen —-— = = / m bzw Ax + By + Cz + D = 0 oder vektoriell durch (r - Fi) x R = 0 bzw. FN + D = 0 , dann n wird der Winkel zu Al + Bm + Cn , . RN sino? = , = bzw smo9 = ——— C 403) <J{A2 4- B2 + C2) (/2 + m2 + n2) ^^ mit Ä = |R| und TV = |N| berechnet. b) Parallelitätsbedingung: Die Parallelitätsbedingung für eine Gerade und eine Ebene lautet. Al + Bm + Cn = 0 oder RN = 0. C 404) c) Orthogonalitätsbedingung: Die Ortogonalitätsbedingung für eine Gerade und eine Ebene lautet: 4 = — = - oder R x N = Ö. C 405) / m n 3.5.3.9 Flächen 2. Ordnung, Gleichungen in Normalform 1. Mittelpunktsflächen Die im folgenden angegebenen Gleichungen, auch Normalform der Gleichungen für die Flächen 2. Ordnung genannt, ergeben sich aus der allgemeinen Gleichung der Flächen 2 Ordnung (s. 3.5.3.10, S 230) für den Fall, daß Mittelpunkt- und Koordinatenursprung zusammenfallen Dabei halbiert der Mittelpunkt die durch ihn verlaufenden Sehnen. Die Koordinatenachsen liegen in den Symmetrieachsen der Flächen, so daß die Koordinatenebenen gleichzeitig Symmetrieebenen sind. 2. Ellipsoide Mit den Halbachsen a, b, c (Abb.3.186) lautet die Gleichung T 11 Z ? + & + ?-l. C.406) Es werden die folgenden Spezialfälle unterschieden. a) a = b > c: zusammengedrücktes Rotationsellipsoid (Linsenform) (Abb.3.187). b) a = b < c langgestrecktes Rotationsellipsoid (Zigarrenform) (Abb.3.188) c) a — b — c Kugel mit der Gleichung x2 + y2 + z2 = a2 Die zwei Formen des Rotationsellipsoids entstehen durch Rotation einer Ellipse in der x, z-Ebene mit den Achsen a und c um die z-Achse, die Kugel durch Rotation eines Kreises um eine der Achsen. Die Schnittfigur einer durch ein Ellipsoid gehenden Ebene ist eine Ellipse, im Spezialfall ein Kreis Der Rauminhalt des Ellipsoids beträgt V-*fZ. C407) 3. Hyperboloide a) Einschaliges Hyperboloid: (Abb.3.189) Mit a und b als reelle und c als imaginäre Halbachsen "Produkte von Vektoren s 3 5 1 3,2., S 188
3 5 Vektoralgebra und analytische Geometrie 227 gilt. a2 b2 Abbildung 3.186 = 1. Abbildung 3 187 (Zur geradlinigen Erzeugenden s. S 229) C.408) b) Zweischaliges Hyperboloid: (Abb.3.190) Mit c als reeller und a, b als imaginäre Halbachsen gilt: a2 b2 c2 Die Schnittfiguren von Ebenen parallel zur z-Achse sind für beide Hyperboloide Hyperbeln. Im Falle des einschaligen Hyperboloids können es auch zwei einander schneidende Geraden sein Ebenenschnitte parallel zur x, y-Ebene sind Ellipsen. Für a = b kann das Hyperboloid durch Rotation einer Hyperbel mit den Halbachsen a und c um die Achse 2c erzeugt werden Diese ist im Falle des einschaligen Hyperboloids imaginär, im Falle des zwei- schaligen reell. Abbildung 3 188 Abbildung 3.189 Abbildung 3 190 4. Kegel (Abb.3.191) Liegt die Spitze im Koordinatenursprung, dann gilt: a2 b2 = 0 C.410) a2 ' b2 c2 Als Leitkurve kommt eine Ellipse mit den Halbachsen a und b in Betracht, deren Ebene senkrecht zur z-Achse in einer Entfernung c vom Koordinatenursprung liegt. Der Kegel kann in dieser Darstellung als Asymptotenkegel der beiden Hyperboloide mit den Gleichungen % = ±1 C.411) 2 2 x y ~2 + &2 " tt
228 3 Geometrie Abbildung 3.191 Abbildung 3.192 aufgefaßt werden, dessen Erzeugende sich beiden Hyperboloiden im Unendlichen unbegrenzt nähert (Abb.3.192). Für a = b ergibt sich ein gerader Kreiskegel (s. 3.3.4,9., S 160). 5. Paraboloide Da Paraboloide keinen Mittelpunkt besitzen, wird in den folgenden Gleichungen davon ausgegangen, daß der Scheitel des Paraboloids im Koordinatenursprung liegt, die z-Achse zur Symmetrieachse wird und die x, z- sowie die y, z-Ebenen Symmetrieebenen sind.' a) Elliptisches Paraboloid: (Abb.3.193) 1 1 z = - + V- C 412) Ebenenschnitte parallel zur z-Achse liefern als Schnittfiguren Parabeln, parallel zur x, y-Ebene Ellipsen. Der Rauminhalt einer Paraboloidschale, die von einer Ebene senkrecht zur z-Achse in der Höhe h abgeschnitten wird, ist V=^7räbh, C.413) wobei in dieser Formel die Parameter U und b die Halbachsen der Querschnittsellipse des elliptischen Paraboloids C 412) in der Höhe h darstellen, d.h., es gilt ä = ay/h, b = b\fh. Der Rauminhalt der Paraboloidschale ist halb so groß wie der des elliptischen Zylinders mit der gleichen Deckfläche und Höhe. b) Rotationsparaboloid: Für a = b erhält man ein Rotationsparaboloid, das man sich durch Rotation einer Parabel mit z = x2/a2 um ihre in der x, z-Ebene liegende Achse entstanden denken kann. c) Hyperbolisches Paraboloid: (Abb.3.194) Schnitte parallel zur y, z-Ebene und zur x, z-Ebene liefern kongruente Parabeln als Schnittfiguren, Schnitte parallel zur x, y-Ebene Hyperbeln sowie ein Paar einander schneidender Geraden. aVh-z* Abbildung 3.193 Abbildung 3.194
3 5 Vektoralgebra und analytische Geometrie 229 6. Geradlinige Erzeugende einer Fläche sind Geraden, die ganz in dieser Fläche liegen. Beispiele sind die Erzeugenden der Kegel- und der Zylinderfläche a) Einschaliges Hyperboloid: (Abb.3.195) ül . ^! _ f! = i a2 b2 c2~ C.415) Das einschalige Hyperboloid besitzt zwei Scharen geradliniger Erzeugender mit den Gleichungen l + i = J1 + r\t J*_l) = 1V C.416a) a c \ b) \a cj b ? + £ = „(!_?), „(£_£) = ! + » C.416b) a c \ bj \a cj b wobei u und v beliebige Größen sind. b) Hyperbolisches Paraboloid: (Abb.3.196) x2 y2 C.417) Das hyperbolische Paraboloid besitzt ebenfalls zwei Scharen von Erzeugenden mit den Gleichungen - - 1 a b Wieder sind u und v beliebige Größen In beiden Fällen gehen durch jeden Flächenpunkt zwei Geraden, und zwar von jeder Schar je eine Erzeugende. In den Abb.3.195, 3.196 ist jeweils nur eine Geradenschar eingezeichnet - + ? = w, u(--f)=*,C 418a) ab \a bj ="¦ «(H)-*-C418b) Abbildung 3 195 Abbildung 3.196 Abbildung 3.197 Abbildung 3.198 Abbildung 3.199
230 3 Geometrie 7. Zylinder a) Elliptischer Zylinder: (Abb.3.197) — + f- = az bz 2 2 b) Hyperbolischer Zylinder: (Abb.3.198) %:-%; az bz c) Parabolischer Zylinder: (Abb.3.199) y2 = 2px = 1 C 419) C 420) C 421) 3.5.3.10 Flächen 2. Ordnung, allgemeine Theorie 1. Allgemeine Gleichung einer Fläche 2. Ordnung anx2 + a22y2 + a33z2 4- 2anxy 4- 2a23yz + 2a3izx + 2aux + 2a24?/ + 2aMz + a44 = 0 C 422) 2. Gestalt der Fläche 2. Ordnung aufgrund ihrer Gleichung Man ermittelt die Gestalt einer Fläche 2 Ordnung bei bekannter Gleichung nach dem Vorzeichen ihrer Invarianten A, ö, S und T aus den Tabellen 3.24 und 3.25. Hier steht neben der Bezeichnung der Fläche ihre Gleichung in der Normalform, auf die sich eine gegebene Gleichung umformen läßt. Mit den Gleichungen der sogenannten imaginären Flächen können für keinen reellen Punkt die Koordinaten berechnet werden, mit Ausnahme der Spitze des imaginären Kegels und der Schnitt geraden zweier imaginärer Ebenen. Tabelle 3.24 Gestalt der Flächen 2. Ordnung mit ö ^ 0 (Mittelpunktsflächen) A<0 A>0 A = 0 S-5>0, T>0 Ellipsoid x2 y2 z2 h — H = 1 a2 b2 c2 Imaginäres Ellipsoid x2 y2 z2 a2 b2 c2 Imaginärer Kegel (mit reeller Spitze) x2 y2 z2 a2 b2 c2 S • 6 und T nicht beide > 0 Zweischaliges Hyperboloid x2 y2 z2 a2 b2 c2 Einschaliges Hyperboloid 2 2 2 X y 2 a2 b2 c2 Kegel x2 y2 z2 \- = 0 a2 b2 c2 Tabelle 3.25 Gestalt der Flächen 2. Ordnung mit 6 = 0 (Paraboloide, Zylinder und Ebenenpaare) A < 0 (hierbei ist T > 0) A > 0 (hierbei istT < 0) A^0 Elliptisches Paraboloid a2 b2 Hyperbolisches Paraboloid a? b2 ~ ±Z A = 0 Zylinderfläche mit einer Kurve 2 Ordnung als Leitkurve, deren Gestalt verschiedene Zylinder nach sich zieht. Für T > 0 imaginäre elliptische, für T < 0 hyperbolische und für T = 0 parabolische Zylinder, wenn die Fläche nicht in zwei reelle, imaginäre oder zusammenfallende Ebenen zerfällt. Die Bedingung für das Zerfallen lauteten fli2 au Ü21 Ö22 «24 CI41 Ö42 Ö44 «11 «13 «14 Ö31 ^33 Ö34 Ö41 Ö43 Ö44 + «22 Ö23 Ö24 ^32 Ö33 Ö34 &42 &43 ö44 = 0
3 5 Vektoralgebra und analytische Geometrie 231 3. Invariante einer Fläche 2. Ordnung Setzt man die a^ = ßfci, dann gilt C.423a) an ßi2 ai3 au B21 Ö22 Ö23 Ü24 &31 Ö32 &33 Ö34 a41 a42 a43 a44 an ai2 ai3 a2i Ö22 Ö23 ^31 &32 Ö33 C.423b) S = an+ a22 + &33 , C.423c) T = a22ß33 + ^33^11 + 011^22 - 023 - a3i "~ an C.423d) Bei einer Verschiebung oder Drehung der Koordinatenachsen ändern sich diese Größen nicht.
232 3. Geometrie 3.6 Differentialgeometrie In der Differentialgeometrie werden ebene und räumliche Kurven und Flächen mit den Methoden der Differentialrechnung untersucht. Daher wird von den Funktionen, die in die Kurven- bzw Flächengleichungen eingehen, vorausgesetzt, daß sie stetig sind und stetige Ableitungen bis zu der Ordnung besitzen, die gemäß dem Charakter des zu untersuchenden Problems erforderlich ist. Nur in einzelnen Punkten der Kurve oder Fläche darf diese Bedingung gestört sein Man spricht dann von singulären Punkten. Bei der Untersuchung geometrischer Gebilde auf der Grundlage ihrer Gleichungen wird zwischen solchen Eigenschaften unterschieden, die von der Wahl des Koordinatensystems abhängen, wie Schnittpunkte von Kurven oder Flächen mit den Koordinatenachsen, Tangentensteigungen, Maxima und Minima, und solchen invarianten Eigenschaften, die unabhängig sind von Koordinatentransformationen, wie Wendepunkte, Scheitel, Krümmungen. Außerdem werden noch lokale Eigenschaften, die nur für sehr kleine Teile der Kurven oder Flächen zutreffen, wie Krümmung und Linienelement von Flächen, von Eigenschaften unterschieden, die Kurven und Flächen im Ganzen betreffen, wie die Anzahl der Scheitel oder die Länge einer geschlossenen Kurve 3.6.1 Ebene Kurven 3.6.1.1 Definitionen ebener Kurven 1. Koordinatengleichungen Eine ebene Kurve kann analytisch auf eine der folgenden Arten definiert werden 1. In kartesischen Koordinaten a) implizit: 0 = F(x, y), C 424) b) explizit: y = f(x), C.425) c) in Parameterform: x = x(t), y = y(t). C 426) 2. In Polarkoordinaten: p = f(tp). C 427) 2. Positive Richtung auf einer Kurve Wenn eine Kurve in der Form C.426) gegeben ist, dann wird auf ihr als positiv die Richtung definiert, in der sich ein Kurvenpunkt P(x(t), y(t)) für zunehmende Werte des Parameters t bewegt. Ist die Kurve in der Form C.425) gegeben, dann kann die Abszisse als Parameter aufgefaßt werden (x = x, y = f(x)), so daß die positive Richtung die mit wachsender Abszisse ist Für die Form C.427) dient der Winkel <p (x = f(<p) cos ip, y = f(<p) sirap) als Parameter, so daß die positive Richtung der Zunahme von ip entspricht, d.h. entgegengesetzt zum Drehsinn des Uhrzeigers Abbildung 3.200 ¦ S Abb.3.200a, b, c: A: x = t2 , y = t3 ; B: y = sin x ; C: p = a<p . 3.6.1.2 Lokale Elemente einer Kurve In Abhängigkeit davon, ob ein variabler Punkt P auf der Kurve in der Form C.425), C.426) oder C.427) gegeben ist, wird seine Position durch x, t oder ip bestimmt. Mit N sei ein beliebig nahe bei P gelegener Punkt mit den Parameterwerten x 4- dx, t + dt oder <p + d<p bezeichnet
3.6 Differentialgeometrie 233 1. Bogenelement Wenn s die Länge der Kurve von einem festen Punkt A bis zum Punkt P ist, dann kann der infinitesimale Zuwachs As =PN angenähert durch das Differential ds der Bogenlänge, das Bogenelement, ausgedrückt werden- ' As £3 ds < ~\ = V = V ds 1+U ) dx fürdieForm C425)> lx'2 + y'2dt fürdieForm C.426), lp2 + p'2d<p fürdieForm C.427). = y/1 + cos2xdx MB: x = t2, y = i6, ds = W± + 9t2 dt. C 428) C.429) C 430) C: p = cup, ds = ay/1 + ip2 dtp. Abbildung 3 201 Abbildung 3 202 Abbildung 3.203 2. Tangente und Normale 1. Tangente im Punkt P wird die Sekante PN in ihrer Grenzlage für TV —> P genannt, Normale eine Gerade, die im Punkt P senkrecht auf der Tangente steht (Abb.3.201). 2. Die Gleichungen der Tangente und der Normalen sind in Tabelle 3.26 für die drei Fälle C 424), C 425) und C.426) angegeben. Dabei sind x, y die Koordinaten des Punktes P und X, Y die Koordinaten der Tangenten- und Normalenpunkte. Die Werte der Ableitungen sind für den Punkt P zu berechnen. Beispiele zur Bestimmung der Tangente und der Normalen: ¦ A: Kreis mit x2 + y2 = 25 und Punkt PC,4). a) Tangentengleichung: 2x(X — x) + 2y(Y — y) = 0 oder unter Berücksichtigung der Kreisgleichung: Xx + Yy = 25 , d h , SX + 4K - 25 . b) Normalengleichung. X-x_ Y-y 2y 2x oder Y ¦ V-X ; im Punkt P:Y=-X x 3 ¦ B: Sinuslinie y = sin x im Punkt 0@,0): a) Tangentengleichung Y — sinx = cosx(X — x) oder Y = Xcosa: + sinx — xcosx; im Punkt 0: Y = X b) Normalengleichung Y — sin x = (X — x) oder Y = —X sec x + sin x + x sec x ; im Punkt 0: cosx Y = -X C: Kurve mit x = t2 , y = t3 im Punkt PD, ,t = -2. a) Tangentengleichung- Y-e +3 X — t2 —— - — oder Y = UX- ^t3 , im Punkt P: Y = -SX + 4 b) Normalengleichung- 2t (X - t2) + 3t2 {Y - t3) = 0 oder 2X + 3*F = t2 B + 3£2); im Punkt P: X - ZY = 28.
234 3. Geometrie Tabelle 3 26 Tangenten- und Normalengleichungen Art der Gleichung Gleichung der Tangente Gleichung der Normale C 424) C 425) C.426) dF dF Y-y_ X-x y' x' X-x Y-i Y - x\X dF dx -y = " dF dy dx - x) + y'(Y -y) = 0 3. Positive Richtung von Kurventangente und Kurvennormale Wenn die Kurve in einer der Formen C 425), C 426), C 427) gegeben ist, dann sind die positiven Richtungen auf der Tangente und der Normalen wie folgt festgelegt: Die positive Richtung auf der Tangente stimmt mit der positiven Richtung der Kurve im Berührungspunkt überein, während sich die positive Richtung auf der Normalen aus der positiven Richtung der Tangente durch deren Drehung um den Punkt P um 90° im entgegengesetzten Drehsinn des Uhrzeigers ergibt (Abb.3.202) Die Tangente und die Normale werden durch den Punkt P jeweils in eine positive und eine negative Halbgerade geteilt 4. Die Steigung der Tangente wird bestimmt a) durch den Tangentenneigungswinkel a zwischen den positiven Richtungen der Abszissenachse und der Tangente oder b) wenn die Kurve in Polarkoordinaten gegeben ist, durch den Winkel p zwischen der Richtung des Radiusvektors OP @P = p) und der positiven Richtung der Tangente (Abb.3.203) Für die Winkel a und p gelten die folgenden Formeln, wobei ds gemäß C 428) bis C.430) berechnet wird* dy dx . dy tan a = — , cos a = — , sino = dx ds dp ds ' d(p tan/x = -j— , cos u =-j-, smu = p-^- dp_ ds ds d(f C.431a) C.431b) A: y = sin x , B: x = t2 , y = t3 , C: p = cap, tan a = cos x , 3t tan öl = —•, tan p = ip, vm cosp - V4 + 9t2 ' 1 a/TTI 3t smp = V4 + 9t2 ' 5. Abschnitte der Tangente und Normale, Subtangente und Subnormale (Abb.3.204) a) In kartesischen Koordinaten für eine Definition gemäß C.425). PT-- w (Tangentenabschnitt}, C.432a) PN - \yyfi'- (Normalenabschnitt), C.432b)
3 6 Differentialgeometrie 235 P'T=\-\ (Subtangente), C.432c) b) In Polarköordinaten für eine Definition gemäß C.427): PT' — \ — \P2 + p'\ [Abschnitt der Polartangente) , + p'2\ [Abschnitt der Polarnormalen) , P'N = \yy'\ [Subnormale) C 432d) C 433a) C 433b) OV [Polarsubtangente), C.433c) OJV' = \p'\ [Polarsubnormale). C.433d) ¦ A: y = coshx, y' = sinhx, y 1 + y'2 = coshx, PT = |coshxcothx|, PN = |cosh2x|, P'T ¦ | coth x\, P'N = | sinh x cosh x\ ¦ B: p = cup, p' = o, yfp2 + pf2 = ay/l + <p2; PT7 = L^l + ^2| , R/V7 = la^/l + v?2! , ÖT7 = \atp2\ ,ÖN = a. Abbildung 3.204 Abbildung 3.205 6. Winkel zwischen zwei Kurven Unter dem Winkel ß zwischen zwei Kurven A und T2 , die sich im Punkt P schneiden, wird der Winkel zwischen den Tangenten an diese Kurven im Punkt P verstanden (Abb.3.205). Die Berechnung des Winkels ß ist damit auf die Berechnung des Winkels zwischen zwei Geraden mit den Richtungskoeffizienten fdfi ki = tan öi = I — C.434a) = tan a2 : C.434b) zurückgeführt, wobei y = fi[x) die Gleichung von Ti und y — f2[x) die Gleichung von r2 ist und die Ableitungen für den Punkt P zu berechnen sind. Man erhält dann ß mit Hilfe der Formel tan a2 — tan a\ tan/? = tan(cü2 — a.\) = ¦ 1 + tan ai tan a2 Es ist der Winkel zwischen den Parabeln y = y/x und y = x2 im Punkt P(l, 1) zu bestimmen: C 434c) (dyß\ 1 tanai = —-— = - tana2 =(- dx = 2, tan/? = tan a2 — tan ol\ 1 + tan ol\ tan a2 4 3. Konvexe und konkave Seite einer Kurve Wenn eine Kurve in der expliziten Form y = f[x) gegeben ist, dann kann für einen kleinen Teil der Kurve, der den Punkt P enthält, angegeben werden, ob die Kurve mit ihrer konkaven Seite nach oben oder nach unten zeigt. Ausgenommen ist der Fall, daß P ein Wendepunkt oder ein singulärer Punkt ist
236 3 Geometrie (s 3 6 1 3, S 238) Ist die zweite Ableitung f"(x) > 0, dann zeigt die Kurve mit ihrer konkaven Seite nach oben, d.h nach der positiven ^/-Richtung (Punkt P2 in Abb.3.206). Ist f"(x) < 0 (Punkt Px), dann ist die Kurve nach unten konkav Im Falle f"(x) = 0 ist das Problem bei der Betrachtung des Wendepunktes eingehender zu untersuchen. ¦ y — x3 (Abb.2.15b), y" = 6x, für x > 0 ist die Kurve konkav nach oben, für x < 0 konkav nach unten Abbildung 3 206 Abbildung 3 207 4. Krümmung und Krümmungskreisradius 1. Krümmung einer Kurve Die Krümmung K einer Kurve im Punkt P ist der Grenzwert des Verhältnisses des Winkels 5 zwischen den positiven Tangentenrichtungen in den Punkten P und TV (Abb.3.207) zur Bogenlänge PN für PN^ 0 K = Jlim 4=r C 435) piv-oPN Das Vorzeichen der Krümmung K gibt an, ob die Kurve mit ihrer konkaven Seite nach der positiven (K > 0) oder negativen (K < 0) Seite der Kurvennormalen zeigt (s 3 6.1 2,2., S 234) Anders ausgedrückt liegt der Krümmungsmittelpunkt für K > 0 auf der positiven Seite der Kurvennormalen, für K < 0 auf der negativen Manchmal wird die Krümmung K prinzipiell als positive Größe aufgefaßt Dann ist immer der Absolutbetrag des Grenzwertes zu nehmen. 2. Krümmungskreisradius einer Kurve Der Krümmungskreisradius R einer Kurve im Punkt P ist der reziproke Wert des Betrags der Krümmung. R=\l/K\. C436) Die Krümmung K ist in einem Punkt P um so größer, je kleiner der Krümmungskreisradius R ist. ¦ A: Für einen Kreis mit dem Radius a sind Krümmung K = 1/a und Krümmungskreisradius R = a für alle Punkte konstant. ¦ B: Für die Gerade ist K = 0 und R = oo 3. Formeln für Krümmung und Krümmungskreisradius Mit S = da und PN= ds (Abb. 3.207) gilt allgemein * = ?. R ds da C.437) Daraus ergeben sich für die unterschiedlichen Definitionsformen der Kurvengleichungen aufs. 3.6 1 1, S 232 verschiedene Ausdrücke für K und R Definition gemäß C 425) K = dx2 1 + '? dx 3/2 ' R = 1 + i? dx dx2 3/2 C 438)
3.6 Differentialgeometrie 237 Definition gemäß C.426): K = Definition gemäß C.424): K = Definition gemäß C.427): K = x- y \x"y" (*'2 + </2) 3/2 ' (x'2 + y> ,2\3/2 x y 3/2 ' (^2 + Fy2) \J?x ~r ry J 3/2 (P2 + //2)' /2\3/2 R = F F F ¦*¦ xx 1 xy ¦L x F F F ryx ryy ry Fx Fy 0 (P2+P'2f2 p2 + 2p'2 - pp" C 439) C.440) C.441) C:y2 ¦ cosh x, K - cosh2 x ' K -- t{4 + 9t2) 3/2 ' K ¦- Y>: p = a(f , K=l- y2 + 2 a (<p2 + lK/2 ' (X2 + 2/2K/2 ' 5. Krümmungskreis und Krümmungskreismittelpunkt 1. Krümmungskreis im Punkt P wird die Grenzlage eines Kreises genannt, der durch P und zwei benachbarte Punkte N und M der Kurve geht, wenn N —> P und M —> P gehen (Abb.3.208). Er verläuft durch den betreffenden Kurvenpunkt und hat dort dieselbe 1. und 2. Ableitung wie die Kurve. Demgemäß schmiegt er sich der Kurve im Berührungspunkt besonders gut an. Er wird Schmiegkreis oder Krummungskreis genannt. Sein Radius heißt Krümmungskreisradius. Es zeigt sich, daß er der Kehrwert des Absolutbetrages der Kurvenkrümmung ist 2. Krümmungskreismittelpunkt Der Mittelpunkt C des Krümmungskreises ist der Krümmungsmittelpunkt des Punktes P. Er liegt auf der konkaven Seite der Kurve und auf der zugehörigen Kurvennormalen 3. Koordinaten des Krümmungskreismittelpunktes Die Berechnung der Koordinaten (xc,yc) des Krümmungskreismittelpunktes kann je nach der Definitionsform der Kurvengleichung in 3.6 1 1, S. 232 mit Hilfe der folgenden Formeln erfolgen. ,dx) | 1+ [fa Definition gemäß C.425): Xc : Definition gemäß C 426)' xq = x ¦ dy^ dx £y dx2 y'{x'2 + y'2) \x y \x" v" yc = \ yc = y + dx2 x'{x'2 + y12) Definition gemäß C.427) xc — pcosip — yc = psm<p- ¦ (p2 + p'2) (p cos <p + p' sin </?) p2 + 2p'2 - pp" : (p2 + p/2)(psin cp — p' cos <p) p2 + 2p'2 - pp" Definition gemäß C.424): xq = x -f F*{n+n) Fx Fv 0 Vc = y = y+ it. r,—ttt- p ± XX p 1 yx Fx p 1 xy P ryy K Fx Fy 0 C.442) C.443) C.444) C.445)
238 3. Geometrie Diese Formeln können auch in der Form xc = x — R sin a , yc = y + R cos a , r.dx xc = x - H— , yc ¦¦ as hingeschrieben werden (Abb.3.209), wobei R gemäß C 438) bis C.441) berechnet wird C(xc/Yc) C 446) C 447) Abbildung 3.208 Ol ' x Abbildung 3.209 Abbildung 3.210 3.6.1.3 Ausgezeichnete Kurvenpunkte und Asymptoten Es werden nur Punkte betrachtet, die invariant sind gegenüber Koordinatentransformationen Zur Bestimmung von Maxima und Minima s. 6.1.5.3, S. 406. 1. Wendepunkte und Regeln zu ihrer Bestimmung Wendepunkte sind Kurvenpunkte, in denen die Krümmung der Kurve das Vorzeichen ändert (Abb. 3.210). Dabei liegt die Kurve in einer kleinen Umgebung des Punktes nicht auf einer Seite der Tangente, sondern wird von dieser durchsetzt. Im Wendepunkt ist K = 0 und R = oo 1. Explizite Definitionsform C.425) der Kurve y — f(x) a) Notwendige Bedingung für die Existenz eines Wendepunktes ist das Verschwinden der 2 Ableitung f"(x) = 0 C 448) im Wendepunkt, falls sie existiert (den Fall nicht existierender 2. Ableitung s. b)). Die Bestimmung der Wendepunkte für den Fall existierender 2. Ableitungen erfordert das Aufsuchen aller Lösungen der Gleichung f"{x) = 0 mit den Werten £1,2:2, • , sc», . ,xn , wobei jeder Wert x{ nacheinander in die darauffolgenden Ableitungen einzusetzen ist Ein Wendepunkt liegt vor, wenn die erste an der Stelle Xi nicht verschwindende Ableitung von ungerader Ordnung ist. Wenn der betrachtete Punkt kein Wendepunkt ist, weil sich die erste nicht verschwindende Ableitung A:-ter Ordnung für geradzahliges k ergibt, dann weist die Kurve für f^k\x) < 0 mit der konkaven Seite nach oben, für f^k\x) > 0 nach unten b) Hinreichende Bedingung für die Existenz eines Wendepunktes ist die Änderung des Vorzeichens der 2. Ableitung f"(x) beim Übergang von der links- zur rechtsseitigen Umgebung des Punktes x\ Daher kann die Frage, ob ein gefundener x^-Wert Abszisse eines Wendepunktes ist, aus der Betrachtung des Vorzeichens der 2 Ableitung beim Durchgang durch den zugehörigen Punkt ermittelt werden: Wenn sich das Vorzeichen bei diesem Durchgang ändert, liegt ein Wendepunkt vor Dieses Verfahren ist auch für den Fall y" — 00 anwendbar. A: y = 1 1 + x2 ¦ B: y = x punkte sind nicht vorhanden f"(x) =  f(x) = 12x2 Wendepunkte. A -r= , - , B —-= , - l-3x2 A+x2K 1 73 0 ^ = ±4=, f"'(x) = 24x 1- -y/S A + x2L rw/o, Xl f"(x) = 24x, f"{xx) = 0, fIV(x) = 24, Wende-
3.6 Differentialgeometrie 239 C: y. 5 ¦ xs . , 5 2 y 10 _I Jx3> für x = 0 ist 2/" = oo Beim Übergang von negativen zu positiven x-Werten wechselt die 2 Ableitung das Vorzeichen von „ — " zu „+", so daß die Kurve bei x = 0 einen Wendepunkt besitzt. Hinweis: Wenn in der Praxis aus dem Kurvenverlauf folgt, daß ein Wendepunkt vorhanden sein muß, z.B beim Übergang von einem Minimum zu einem Maximum bei einer Kurve mit stetiger Ableitung, dann beschränkt man sich auf die Bestimmung der Xi und läßt die Untersuchung der höheren Ableitungen weg 2. Andere Definitionsformen Die notwendige Bedingung C.448) für die Existenz eines Wendepunktes im Falle der Kurvenvorgabe über die Definitionsform C 425) wird bei Vorgaben mit den anderen Formen durch die folgenden analytischen Formulierungen der notwendigen Bedingung ersetzt: a) Definition in Parameterform gemäß C.426): b) Definition als Polargleichung gemäß C.427) c) Definition in impliziter Form gemäß C 424). \x" y"\ :0, p2 + 2p'2 - pp" = 0, F(x,y) = 0 und Fx Fv 0 C 449) C.450) : 0.C.451) In diesen Fällen liefert das Lösungssystem die Koordinaten der möglichen Wendepunkte. ¦ A: x = a (t - - sintj , y = a(l--costj (verkürzte Zykloide (Abb.2.68b, 2.13.2, S. 102) \x' y'\ a2|2-cos£ sin£| a2 ,n , „x . 1 2 ¦ cos t sin 11 Q? tn . . x = — Bcos£-l) a 2 \x" y"\~ 41 sint cos£| 4 viele Wendepunkte für die Parameterwerte tk ¦ B: p = 4= ; P2 + 2p'2 - pp" l 1 , tk = ±— + 2kir. Die Kurve hat unendlich _ 1_ (p 2(p3 3 = J_ 2 4(^3 4(/?3 ^ 1). Der Wendepunkt liegt bei dem Winkel (p = 1/2 . I 2 0 2x 0 -2 -2y\ \2x -2y 0 y2) = 0 widersprechen einander, so daß die Hyperbel keinen Wendepunkt besitzt. = a2 (Hyperbel) : Sx2 - Sy2. Die Gleichungen x2 - y2 = a2 undl b) Abbildung 3.211 2. Scheitel sind Kurvenpunkte, in denen die Krümmung ein Maximum oder ein Minimum besitzt Die Ellipse hat z B die vier Scheitel A, B, C, D, die Kurve des Logarithmus nur einen bei E (l/>/2, — In 2/2) (Abb.3.211). Die Ermittlung der Scheitelpunkte wird auf die Bestimmung der Extremwerte von K oder, wenn das einfacher ist, auf die von R zurückgeführt, die mit den Formeln C.438) bis C 441) berechnet werden können.
240 3 Geometrie 3. Singulare Punkte Singulärer Punkt ist der allgemeine Begriff für verschiedene spezielle Kurvenpunkte h) .V.* Abbildung 3 212 1. Arten singulärer Punkte Die Gliederungspunkte a), b) usw bis j) entsprechen der Darstellung in Abb.3.212. a) Doppelpunkte: In Doppelpunkten schneidet sich die Kurve selbst (Abb.3.212a) b) Isolierte Punkte: Isolierte Punkte genügen der Kurvengleichung; sie befinden sich aber außerhalb der Kurve (Abb.3.212b). c), d) Rückkehr punkte: In Rückkehrpunkten ändert sich der Durchlaufsinn; man unterscheidet je nach der Lage der Tangente zu den Kurvenzweigen Rückkehrpunkte 1. und 2 Art (Abb.3.212c,d) e) Selbstberührungspunkte: In Selbstberührungspunkten berührt sich die Kurve selbst (Abb. 3.212e) f) Knickpunkte: In Knickpunkten ändert die Kurve sprunghaft ihre Richtung, aber im Unterschied zum Rückkehrpunkt gibt es zwei verschiedene Tangenten für die zwei Kurvenzweige (Abb.3.212f) g) Abbrechpunkte: In Abbrechpunkten bricht die Kurve ab (Abb.3.212g). h) Asymptotische Punkte: Um asymptotische Punkte windet sich die Kurve unendliche Male herum, wobei sie sich ihm beliebig nähert (Abb.3.212h). i), j) Mehrere Singularitäten: Es können auch zwei oder drei derartige Singularitäten in einem Punkt auftreten (Abb.3.212i,j). 2. Bestimmung von Selbstberührungs-, Knick-, Abbrech- und asymptotischen Punkten Singularitäten dieser Art treten nur bei Kurven transzendenter Funktionen auf (s. 3.5.2.3,3.5.2.5, S 199) Den Knickpunkten entspricht ein endlicher Sprung der Ableitung dx Punkten, in denen die Kurve abbricht, entsprechen Unstetigkeitsstellen der Funktion y = f(x) mit endlichem Sprung oder ein direkter Abbruch. Asymptotische Punkte lassen sich am einfachsten für Kurven bestimmen, die in Polarkoordinaten gemäß p = f((p) gegeben sind. Wenn für (p —> oo oder (p —> —oo der Grenzwert limp = 0 wird, ist der Pol ein asymptotischer Punkt ¦ A: Der Koordinatenursprung ist für die Kurve y = j- (Abb.6.2c) ein Knickpunkt 1 + e* 1 B: Die Punkte A,0) und A,1) der Funktion y = C: Die logarithmische Spirale p = aekif (Abb.2.75) besitzt einen asymptotischen Punkt. — (Abb.2.8) sind Unstetigkeitsstellen. l + e^i
3.6 Differentialgeometrie 241 3. Bestimmung von Mehrfaehpunkten (Fälle a) bis e) sowie i)und j)) Doppelpunkte, Dreifachpunkte usw werden unter der Bezeichnung Mehrfachpunkte zusammengefaßt. Zu ihrer Bestimmung wird die Kurve ausgehend von der •Gleichungsform F(x,y) = 0 untersucht. Ein Punkt A mit den Koordinaten (xi, y\), die gleichzeitig die drei Gleichungen F = 0, Fx = 0 und Fy = 0 erfüllen, ist ein Doppelpunkt, wenn von den drei Ableitungen 2. Ordnung Fxx, Fxy und Fyy wenigstens eine nicht verschwindet Im entgegengesetzten Falle ist A ein Dreifachpunkt oder ein Punkt mit höherer Mehrfachheit. Die Eigenschaften eines Doppelpunktes hängen vom Vorzeichen der Funktionaldeterminante ab: Hi^iH/x-xA- C'452) \ryx ryy\l x Xl j V y=yi J 1. A < 0: Für A < 0 schneidet sich die Kurve selbst im Punkt A\ die Richtungskoeffizienten der Tangenten in A ergeben sich als Wurzeln der Gleichung Fyyk2 + 2Fxyk + FXX = 0. C.453) 2. A > 0: Für A > 0 ist A ein isolierter Punkt. 3. A = 0: Für A = 0 ist A entweder ein Rückkehr- oder ein Selbstberührungspunkt; der Richtungskoeffizient der Tangente ist tana = -^. C.454) ^yy Zur genaueren Untersuchung des Mehrfachpunktes empfiehlt es sich, das Koordinatensystem in den Punkt A zu verlegen und so zu drehen, daß die x-Achse zur Kurventangente im Punkt A wird. Aus der Gestalt der Gleichung kann dann erkannt werden, ob es sich um einen Rückkehrpunkt 1. oder 2. Art handelt oder um einen Selbstberührungspunkt ¦ A: F(x,y) = (x2 + y2J -2a2(x2 -y2) = 0 (Lemniskate, Abb.2.66); Fx = 4x{x2 + y2 -a2), Fy = Ay{x2 + y2 + a2); das Gleichungssystem Fx = 0, Fy = 0 liefert die drei Lösungen @,0), (±a, 0), von denen nur die erste der Bedingung F = 0 genügt Einsetzen von @,0) in die 2. Ableitungen ergibt Fxx = —4a2, Fxy = 0, Fyy = +4a2 , A = —16a4 < 0, d.h., im Koordinatenursprung schneidet sich die Kurve selbst; die Richtungskoeffizienten der Tangenten ergeben sich zu tana = ±1, ihre Gleichungen lauten y = ±x . ¦ B: F(x, y) = xs + y3 - x2 - y2 = 0, Fx = x(Sx - 2), Fy = yCy - 2); von den Punkten @,0), f 0, - ), ( -, 0 J und f -, - J liegt nur der erste auf der Kurve; weiter ist Fxx = —2, Fxy = 0, Fyy = —2, A = 4 > 0, d.h , der Koordinatenursprung ist ein isolierter Punkt. ¦ C: F(x, y) = (y — x2J — x5 = 0. Die Gleichungen Fx = 0, Fy = 0 liefern nur die eine Lösung @,0), die auch die Gleichung F = 0 erfüllt. Außerdem ist A = 0 und tana = 0, so daß der Koordinatenursprung ein Rückkehrpunkt 2 Art ist, was auch aus der expliziten Form der Gleichung y = x2(l ± y/x) erkannt werden kann. Für x < 0 ist y nicht definiert, während für 0 < x < 1 beide y-Werte positiv sind; im Koordinatenursprung verläuft die Tangente horizontal. 4. Algebraische Kurven vom Typ F(x, y) = 0 (F(x, y) Polynom in x und y) Wenn die Gleichung keine konstanten Glieder und keine Glieder ersten Grades enthält, dann ist der Koordinatenursprung ein Doppelpunkt. Die Gleichung zur Bestimmung der zugehörigen Tangenten erhält man durch Nullsetzen der Summe der Glieder 2. Grades. ¦ Für die Lemniskate (Abb.2.66) ergibt sich die Gleichung y = ±x aus x2 — y2 = 0. Wenn die Gleichung auch keine quadratischen Glieder enthält, dann ist der Koordinatenursprung ein Dreifachpunkt. 4. Asymptoten 1. Definition Eine Asymptote ist eine Gerade, der sich eine Kurve bei deren immer größer werdender Entfernung vom Koordinatenursprung unbegrenzt nähert (Abb.3.213)
242 3. Geometrie Dabei kann die Annäherung von einer Seite her erfolgen (Abb.3.213a), oder die Kurve schneidet die Gerade dauernd (Abb.3.213b). Nicht jede sich unbegrenzt vom Koordinatenursprung entfernende Kurve (unendlicher Kurvenzweig) muß eine Asym- Abbildung 3.213 ptote besitzen. So bezeichnet man z.B. bei unecht- gebrochenrationalen Funktionen den ganzrationalen Anteil als asymptotische Näherung (s. 1.1.7 2, S. 15). 2. Vorgabe der Funktion in Parameterform x = x(t), y = y(t) Zur Bestimmung der Asymptotengleichung sind die Werte zu ermitteln, für die bei t —> U entweder x(t) —? ±oo oder y(t) —? ±oo geht. Folgende Fälle sind zu unterscheiden. a) x(U) —? oo , aber y(ti) = a ^ oo • y = a. Die Asymptote ist eine horizontale Gerade. C.455a) b) y(U) —> oo , aber x(U) = a ^ oo. x = a. Die Asymptote ist eine vertikale Gerade C.455b) c) Wenn sowohl y(ti) als auch x(U) gegen unendlich gehen, dann sind die Grenzwerte k = lim —)-!- und t-+U x(t) b = \im[y(t) — kx(t)] zu bilden. Existieren sie beide, dann liefern sie die Konstanten für die Geradengleichung der Asymptote: y(ti) —> oo und x(U) —> oo. y = kx + b. C.455c) 771 7T 7T ¦ x = , y = n(ta,nt — t), t\ = — , ^2 = — 7: usw Aufsuchen der Asymptote bei t\ cos t 2 2 x(h) = y(ti) = 00, k= lim — (sin* - tcost) = — , T / . n m 1 b= hm \n(t&nt — t) = n hm *-»?r/2 L mcos^J <-+tt/: sin * — t cos t — 1 ri7r n -x - «-7T/2 cos* 2 m 2 _ . . . .Al-, n n^ Für die zweite Asymptote usw erhält man in Analogie dazu y = — x —— . m 2 3. Vorgabe der Funktion in expliziter Form y = f(x) Die vertikalen Asymptoten werden als Unstetigkeitspunkte beim unendlichem Sprung der Funktion f(x) ermittelt (s. 2.1.5 3, S 59), die horizontalen und geneigten Asymptoten als Gerade mit den entsprechenden Grenzwerten fix) x = a; y = kx + b, k = lim J-^-L , b = lim \f(x) - kx]. C.456) x—»oo x x—»ooL v ' J v ' 4. Vorgabe der Funktion in algebraischer impliziter Form F(x, y) = 0 Die Funktion F(x,y) ist ein Polynom in x und y . 1. Zur Bestimmung der horizontalen und vertikalen Asymptoten werden von dem vorliegenden Polynom in x und y die Glieder mit dem höchsten Grad m ausgewählt, und als implizite Funktion <P(x, y) abgespalten. Die Gleichung $(x, y) = 0 wird nach x und y aufgelöst: #(x, y) = 0 liefert x = <p(y), y = ip(x). C.457) Die Werte 7/1 = a für x —> 00 ergeben die horizontalen Asymptoten y — a, die Werte zi = 6 für ?/ —? 00 die vertikalen x = b. 2. Zur Bestimmung der geneigten Asymptoten wird in F(x, y) die Geradengleichung y = kx -\-b eingesetzt und das so gewonnene Polynom nach Potenzen von x geordnet: F{x, kx + b) = /i(/c, b)xm + f2{k, b)xm-1 + • • • C.458) Die Parameter k und b ergeben sich, falls sie existieren, aus den Gleichungen /i(M) = 0, /2(M) = 0 C.459)
3 6 Differentialgeometrie 243 ¦ x3 + y3 - 3axy = 0 (Kartesisches Blatt Abb.2.59, S. 95). Aus den Gleichungen F(x, kx + b) = A + k3)x3 + 3(k2b - ka)x2 + • • •, 1 + k3 = 0 und k2b — ka = 0 ergeben sich die Lösungen k = — 1, b = — a, so daß sich die Gleichung der Asymptote zuy = — x — a ergibt 3.6.1.4 Allgemeine Untersuchung einer Kurve nach ihrer Gleichung Kurven, gegeben durch eine der Gleichungen C 424) bis C 427), werden meist mit dem Ziel untersucht, ihr Verhalten oder ihre Gestalt kennenzulernen. 1. Kurvenkonstruktion von explizit gegebenen Funktionen y = f(x) a) Ermittlung des Definitionsbereiches (s. 2 1.1, S. 48). b) Ermittlung der Symmetrie der Kurve hinsichtlich des Koordinatenursprungs und der y-Achse aus der Geradheit oder Ungeradheit der Funktion (s. 2.1.3.4, S. 51) c) Ermittlung des Verhaltens der Funktion im Unendlichen durch Bestimmung der Grenzwerte lim fix) und lim fix) (s. 2.1.4.7, S. 55) x—?—oo x—»+00 d) Bestimmung der Unstetigkeitsstellen (s 2 1 5.3, S. 59). e) Bestimmung der Schnittpunkte mit der y—Achse bzw. mit der cc-Achse durch Berechnung von /(O) bzw. von f(x) = 0. f) Bestimmung der Maxima und Minima und Ermittlung der Monotonieintervalle mit Zu- bzw Abnahme der Funktion. g) Bestimmung der Wendepunkte und ihrer Tangentengleichungen (s. 3.6.1 3, S. 238). Mit den so gefundenen Angaben kann die Kurve skizziert und, wo es nötig ist, durch Berechnung einzelner Punkte präzisiert werden 2x2 + 3x — 4 ¦ Es ist die Kurve der Funktion y = — - zu konstruieren- xl a) Die Funktion ist für alle z-Werte außer für x = 0 definiert. b) Es gibt keinerlei Symmetrie. c) Für x —> — oo strebt y —*¦ 2, so daß y = 2 — 0 Annäherung von unten bedeutet, während sich für x —? oo zwar ebenfalls y —> 2 ergibt, aber y = 2 + 0 Annäherung von oben bedeutet d) Bei x = 0 gibt es eine Unstetigkeitsstelle derart, daß die Kurve von links und von rechts nach — oo verläuft, da y für kleine x-Werte negativ ist. e) Da /(O) = oo ist, gibt es keinen Schnittpunkt mit der ?/-Achse, während f(x) = 2x2 + Sx — 4 = 0 die Schnittpunkte mit der x-Achse bei x\ ~ 0,85 und x2 ~ —2,35 liefert f) Ein Maximum liegt bei x = 8/3 w 2,66 und y « 2,56. g) Ein Wendepunkt befindet sich bei x = 4, y = 2,5 mit tan a = —1/16 . h) Nach der Skizzierung der Funktion auf Grund der gewonnenen Daten (Abb.3.214) wird der Schnittpunkt der Kurve mit der Asymptote bei x — 4/3 « 1,33 und y = 2 berechnet. 2. Kurvenkonstruktion von implizit gegebenen Funktionen F(x, y) = 0 Die Angabe allgemeiner Regeln ist nicht zu empfehlen, da sich damit oft umständliche Rechnungen ergeben. Nach Möglichkeit sollten die folgenden Elemente ermittelt werden* a) Bestimmung aller Schnittpunkte mit den Koordinatenachsen b) Ermittlung der Symmetrien der Kurven, indem x durch — x und y durch —y ersetzt wird. c) Bestimmung der Maxima und Minima bezüglich der x-Achse und nach Vertauschen von x und y auch bezüglich der y-Achse (s. 6 1 5.3, S 406). d) Bestimmung der Wendepunkte und der Tangentenneigungen (s. 3.6 1 3, S. 238) e) Bestimmung der singulären Punkte (s 3 6.1.3,3., S 240). f) Bestimmung der Scheitelpunkte (s. 3 6.1.3,2., S. 239) und der zuhörigen Krümmungskreise (s 3.6.1.1, 5., S 237). Die Kurvenbogenstücke sind oft auf einem relativ großen Abschnitt nur schwer
244 3. Geometrie von den Krümmungskreisabschnitten zu unterscheiden. g) Bestimmung der Asymptotengleichungen (s. 3.6.1.3,4., S. 241) und der Lage der Kurvenzweige relativ zu den Asymptoten. 4 -2 -1 0 1 2 x Abbildung 3.214 Abbildung 3.215 Abbildung 3 216 3.6.1.5 Evoluten und Evolventen 1. Evolute einer gegebenen Kurve wird eine zweite Kurve genannt, die aus den Krummungsmittelpunkten der ersten Kurve besteht (s 3.6.1 1,5., S 237); sie ist gleichzeitig Einhüllende der Normalen dieser ersten Kurve. Die Einhüllende wird auch Enveloppe genannt (s. auch 3.6 1.6, S 244. Die Parameterform der Evolute erhält man aus der Gleichung C.444) für die Krümmungsmittelpunkte, wenn xc und yc als laufende Koordinaten aufgefaßt werden. Wenn es gelingt, aus diesen Gleichungen den Parameter (x, t oder (p) zu eliminieren, dann kann die Evolutengleichung in kartesischen Koordinaten hingeschrieben werden. ¦ Es ist die Evolute der Parabel y = x2 (Abb.3.215) zu bestimmen. Aus 2z(l + 4x2) A 3 X = x ^-— = -Ax6, 1 + Ax2 1 + 6x2 folgt mit X und Y als laufende /X\2/s Koordinaten der Evolute Y = - + 3 ( — l 2 '22 2. Evolvente oder Involute einer Kurve T2 heißt eine Kurve 7~i, die für r2 eine Evolute ist. Daher ist jede Normale PC der Evolvente eine Tangente an die Evolute (Abb.3.215), und die Bogenlänge CC\ der Evolute ist gleich dem Zuwachs des Krümmungsradius der Evolvente: CC1=7\Ci-~PC. C.460) Diese Eigenschaften berechtigen für die Evolvente zu der Bezeichnung Abwickelkurve der Kurve T2 , da sie aus T2 durch Abwickeln eines gespannten Fadens erhalten werden kann Einer gegebenen Evolute entspricht eine Schar von Evolventen, die jeweils durch die ursprüngliche Länge des gespannten Fadens bestimmt werden (Abb.3.216). Die Gleichung der Evolute ergibt sich durch Integration eines Systems von Differentialgleichungen, das die Gleichung der Evolute darstellt Die Gleichung der Kreisevolvente s. 2 14.4, S. 107. ¦ Die Katenoide ist die Evolute der Traktrix, die Traktrix die Evolvente der Katenoide (s. 2.15.1, S. 108). 3.6.1.6 Einhüllende von Kurvenscharen 1. Charakteristische Punkte Es sei eine einparametrige Kurvenschar durch die Gleichung F(x,j/,a) = 0 C.461)
3.6 Differentialgeometrie 245 gegeben. Dann besitzen zwei unendlich benachbarte Kurven dieser Schar mit den Parameterwerten a und a 4- Aa Punkte K der größten Annäherung. Dabei handelt es sich entweder um Schnittpunkte der Kurven (a) und (a + Aa) oder um Punkte auf (a), deren Abstand zu (a + Aa), gemessen auf der Normalen, eine infinitesimale Größe höherer Ordnung von Aa ist (Abb.3.217a,b). Für Aa —* 0 strebt die Kurve (a + Aa) gegen die Kurve (a), wobei sich in manchen Fällen der Punkt K einer Grenzlage, dem Grenzpunkt, nähern kann. a) Abbildung 3.217 Abbildung 3.218 2. Geometrischer Ort der charakteristischen Punkte einer Kurvenschar mit der Gleichung C 461) können eine oder mehrere Kurven sein. Sie bestehen entweder aus den Punkten der größten Annäherung bzw aus den Grenzpunkten der Schar (Abb.3.218a), oder sie bilden die Einhüllende (Enveloppe) der Schar, d.h. eine Kurve, die jede Kurve der Schar berührt (Abb.3.218b). Auch Kombinationen beider Arten sind möglich (Abb.3.218c,d) 3. Gleichung der Einhüllenden Die Gleichung der Einhüllenden wird aus C.461) berechnet, indem a aus dem folgenden Gleichungssystem eliminiert wird* dF F = 0, — = 0. C 462) da ¦ Es ist die Gleichung der Geradenschar zu bestimmen, die dadurch entsteht, daß die Enden einer Strecke AB = l entlang der Koordinatenachsen gleiten (Abb.3.219a). Die Gleichung x , y der Kurvenschar lautet , Z sin a l cos a F = x cos a -|- y sin a — / sin a cos a = 1 oder ' da — xsma + ycosa — lcosa + lsm a = 0 . Durch Eliminierung von a ergibt sich mit x2^ + y2^3 = Z2/3 als Einhüllende eine Astroide (Abb.3.219b, s. auch 2.13.4, S 104). B x Abbildung 3.219 3.6.2 Raumkurven 3.6.2.1 Definitionen für Raumkurven 1. Koordinatengleichungen Zur Definition einer Raumkurve gibt es die folgenden Möglichkeiten. 1 Schnitt zweier Flächen F(x, y, z) = 0 , $(x, y, z) = 0. 2 Parameterform x = x(t), y = y(t), z = z(t) mit t als beliebigem Parameter, wobei t = x ,y oder z sein kann. 3 Parameterform. x = x(s), y = y(s), z = z(s) mit der Bogenlänge s zwischen einem festen Punkt A und dem laufenden Punkt P C.463) C.464) C 465a) -/¦ dt. C.465b)
246 3. Geometrie 2. Vektorgleichungen Mit? als Radiusvektor eines beliebigen Kur venpunktes(s 3.5.1.1,6., S 186) kann die Gleichung C 464) in der Form r = r(t) mit f{t) = x{t)i + y(t)J+ z(t)k C 466) geschrieben werden und die Gleichung C.465a) in der Form r = r(s) mit r(s) = x(s)i + y(s)j + z(s)k. C.467) 3. Positive Richtung ist bei Angabe einer Kurve in der Schreibweise C.464) und C 466) die Richtung wachsender Parameterwerte t, bei C.465a) und C.467) die Richtung, in der die Bogenlängenmessung erfolgt. Binormale Rektifizierende Ebene Tangente Schmiegungs- Ebene Hauptnormale -Normal ebene Abbildung 3.221 Abbildung 3 220 3.6.2.2 Begleitendes Dreibein 1. Definitionen In jedem Punkt P einer Raumkurve, mit Ausnahme der singulären Punkte, können drei Geraden und drei Ebenen definiert werden, die sich im Punkt P schneiden und senkrecht aufeinander stehen (Abb.3.220) 1. Tangente ist die Grenzlage der Sekante PN fürN^P (Abb.3.221). 2. Normalebene ist eine Ebene, die senkrecht auf der Tangente steht (Abb.3.220). Alle durch P verlaufenden und in dieser Ebene liegenden Geraden werden die Normalen der Kurve im Punkt P genannt. 3. Schmiegungsebene wird die Grenzlage einer Ebene genannt, die durch drei benachbarte Kurvenpunkte M, P und N verläuft, für die N —> P und M —*¦ P geht In der Schmiegungsebene befindet sich die Kurventangente. 4. Hauptnormale nennt man die Schnittgerade von Normalen- und Schmiegungsebene, d.h., es ist die Normale, die in der Schmiegungsebene liegt. 5. Binormale wird die Senkrechte auf die Schmiegungsebene genannt 6. Rektifizierende Ebene heißt die von der Tangente und der Binormalen aufgespannte Ebene. Die positiven Richtungen werden auf den drei Geraden Hauptnormale, Hauptnormale und Binormale folgendermaßen festgelegt a) Auf der Tangente ist es die positive Richtung der Kurve, die durch den Tangenteneinheitsvektor t festliegt b) Auf der Hauptnormalen ist es die Richtung der Kurvenkrummung, festgelegt durch den Normaleneinheitsvektor n. c) Auf der Binormalen ist sie durch den Einheitsvektor = t x n C.468)
3.6 Differentialgeometrie 247 definiert, wobei die drei Vektoren t, n und b ein rechtshändiges Koordinatensystem bilden, das begleitendes Dreibein der Raumkurve genannt wird. 2. Lage der Kurve relativ zum begleitenden Dreibein Für die gewöhnlichen Kurvenpunkte liegt die Raumkurve in der Umgebung des Punktes P auf einer Seite der Rektifizierungsebene und schneidet sowohl die Normal- als auch die Schmiegungsebene (Abb.3.222a) Die Projektionen eines kleinen Kurvenabschnitts um den Punkt P auf die drei Ebenen haben dabei näherungsweise die folgende Gestalt. 1. auf die Schmiegungsebene die einer quadratischen Parabel (Abb.3.222b); 2. auf die Rektifizierungsebene die einer kubischen Parabel (Abb.3.222c), 3. auf die Normalebene die einer semikubischen Parabel (Abb.3.222d) Wenn die Krümmung oder die Windung der Kurve im Punkt P gleich 0 sind oder wenn P ein singulärer Punkt ist, also wenn x'(t) = y'(t) = z'(t) = 0 ist, dann kann die Kurve auch eine andere Gestalt haben (s [22 2], Band 2, Teil 7). a) b) c) Abbildung 3.222 3. Gleichungen der Elemente des begleitenden Dreibeins 1. Definition der Kurve als Schnitt zweier Flächen gemäß C.463) . m X-x Y-y Z-z 1 Tangente — — dF dF dy dz d$ d$ dy dz dF dF dz dx d$ d<P dz dx dF dF dx dy d<P d$ dx dy C.469) X-x dF dx d<P dx Y-y dF dy d<P dy Z-z dF dz d$ dz = 0. C 470) Dabei sind x, y, z die Koordinaten des Kurvenpunktes P und X, Y, Z die laufenden Koordinaten der Tangente bzw der Normalebene; die partiellen Ableitungen beziehen sich auf den Punkt P. 2. Definition der Kurve als Funktion eines Parameters t in der Parameterform und als Vektorgleichung gemäß C.464) und C.466) In der Tabelle 3.27 sind die Koordinaten- und Radiusvektorgleichungen des Punktes P mit :r,y, z sowie r angegeben Mit X, Y, Z und R sind die laufenden Koordinaten und der Radiusvektor eines Dreibeinelements bezeichnet. Die Ableitungen nach dem Parameter t beziehen sich auf den Punkt P. 3. Definition der Kurve in der Form C.465a, 3.467) Wenn als Parameter die Bogenlänge s gewählt wird, dann gelten für die Tangente und die Binormale sowie für die Normal- und Schmiegungsebene dieselben Gleichungen wie in Fall 2, es ist lediglich t durch s zu ersetzen. Die Gleichungen der Hauptnormalen und der rektifizierenden Ebene werden einfacher (Tabelle 3.28).
248 3. Geometrie Tabelle 3.27 Vektor- und Koordinatengleichungen von Raumkurvengrößen Vektorgleichung Koordinatengleichung Tangente: R = r + A dr dt X-x Y-y Z-z <*-*>§-» Normalebene: | x'{X - x) + y'(Y -y) + z'(Z - z) = 0 Schmiegungsebene: - _ , (dr d2i Binormale: X-xY-y Z-z x' y' z' | = 0 x" y" z" X-x Y-y Z-, \y z' x' y \x"y" Rektifizierende Ebene: /¦ä -A dr (dr d2r\ „,n R-r)— — x — = 0*1} ^ Jdt\dt dt2 X-xY-y Z-z x' y' z' l m n mit Hauptnormale. I = y'z" - y"z', m = z'x" — z"x', n = x'y" — x"y' - ^ , dr (dr d2f R = r + A— x — x -— dt \ dt dt2 X-x Y-y y' z' m n z' x' n l Z-z x' y' l m r-Ortsvektor der Raumkurve, R-Ortsvektor der Raumkurvengröße *1) Zum Spatprodukt dreier Vektoren s. 3.5.1.4,2., S 190 Tabelle 3.28 Vektor- und Koordinatengleichungen von Raumkurvengrößen als Funktion der Bogenlänge Element des Dreibeins Hauptnormale Rektifizierende Ebene Vektorgleichung ^ - x d2r d2r Koordinatengleichung X-x Y-y Z-z x" y" z" x"{X -x)+ y"{Y -y) + z"{Z - z) = 0 r-Ortsvektor der Raumkurve, R-Ortsvektor der Raumkurvengröße 3.6.2.3 Krümmung und Windung 1. Krümmung einer Kurve Krümmung einer Kurve im Punkt P wird eine Zahl genannt, die die Abweichung der Kurve in der unmittelbaren Umgebung dieses Punktes von einer Geraden angibt.
3 6 Differentialgeometrie 249 Die exakte Definition lautet (Abb.3.223) At K = hm PN C.471) 1. Krümmungskreisradius Der Krümmungskreisradius ist der Kehrwert der Krümmung. p=l C472) 2. Formeln zur Berechnung von K und p a) Bei Definition der Kurve gemäß C.465a). \d2v\ K = ds2 yjx + y + z, C.473) wobei es sich um Ableitungen nach s handelt. b) Bei Definition der Kurve gemäß C 464) K2 dt dt2 r ~dt~d^ d^2 dt {x'2 + y'2 + z'2){x + y + z) - (x'x" + y'y" + z'z"J C.474) {x'2 + y'2 + z'2f Die Ableitungen sind hier nach t vorzunehmen. 3. Schraubenlinie Die Gleichungen x = a cos t, y = a sin t, z = bt C 475) beschreiben die sogenannte Schraubenlinie (Abb.3.224) als Rechtsschraube Wenn ein Beobachter in die positive Richtung der z-Achse blickt, die gleichzeitig Schraubenachse sein soll, dann windet sich die Schraube beim Steigen im Drehsinn des Uhrzeigers Eine Schraubenlinie, die sich im entgegengesetzten Drehsinn windet, wird Linksschraube genannt. Abbildung 3 223 Abbildung 3 224 Abbildung 3 225 Es ist die Krümmung der Schraubenlinie C.475) zu bestimmen Wird der Parameter t durch s bs s = ty/a2 + b2 ersetzt, dann ergibt sich x = acos v/a2 + 62' vV + b2' und gemäß C.473) K az + / a2 + 62' Va2 + b2 Beide Größen K und p sind konstant. Ein anderer Weg
250 3. Geometrie ohne Parametertransformation über C.474) hätte zu dem gleichen Ergebnis gefuhrt 2. Windung einer Kurve Windung einer Kurve im Punkt P wird eine Zahl genannt, die die Abweichung der Kurve in der unmittelbaren Nähe dieses Punktes von einer ebenen Kurve angibt. Die exakte Definition lautet (Abb.3.225). T= Jim PN^O Ab PN Der Windungsradius ist r = \jT. 1. Formeln zur Berechnung von T und r a) bei Definition der Kurve gemäß C.465a). T=1-: T drd2rd3r, P [ds"d?d? y (x + y + z) ' wobei die Ableitungen nach s vorzunehmen sind. b) bei Definition der Kurve gemäß C.464): C 476) C.477) C.478) T=1-: drd2rd3r „2~dt~dt2~di? . y' x" y" z" x'" y'" z'" df 2 dt {x12 + y'2 + z'2f ' C 479) wobei p gemäß C.472) und C.473) zu berechnen ist. Die mit C.478, 3.479) berechnete Windung kann positiv oder negativ sein. Im Falle T > 0 sieht ein Beobachter, der auf der Hauptnormalen parallel zur Binormalen steht, die Windung der Kurve im Rechtsdrehsinn, im Falle T < 0 im Linksdrehsinn. ¦ Die Windung einer Schraubenlinie sei konstant Für die Rechtsschraube R bzw. Linksschraube L ist sie dann -asint acost b\ TR = ! + 62 -acos£ —asint 0 asint —acost 0 b - + b2 a2 + b2 ' TL. a2 + b2 a J [(-asintJ + (acostJ + b2}3 3. Prenetsche Formeln Man kann die Ableitungen der Vektoren t, n und b mit Hilfe der FRENETschen Formeln ausdrücken dt _ n dn _ t b db _ n ds p ' ds p t ' ds t Dabei ist p der Krümmungs- und r der Windungsradius 4. Darbouxscher Vektor Die FRENETschen Formeln C.480) können auch in der einprägsamen Form C.480) dt -? -* dn -j _ db -* — = dxt, — = dxn, — = d x b ds ds ds geschrieben werden Dabei ist d der DARBOUXsche Vektor mit der Gestalt d = it + itb T p C.481) C.482)
3 6 Differentialgeometrie 251 Hinweise: 1. Die FRENETschen Formeln können mit Hilfe des DARBOUXschen Vektors auch kinematisch interpretiert werden (s. [3 18]). 2. Der Betrag des DARBOUXschen Vektors ist gleich der sogenannten Totalkrümmung X einer Raumkurve. Es gilt A = 1 1 .-?. ^ + ^2= d • C.483) 3.6.3 Flächen 3.6.3.1 Definitionen für Flächen 1. Gleichung einer Fläche Flächen können unterschiedlich definiert werden a) Implizite Form: F(x, y,z) = 0 C.484) b) Explizite Form: z = f(x, y) C 485) c) Parameterform: x = x(u, v), y = y(u, v), z = z(u, v). C.486) d) Vektorform: r = r(u,v) mit r = x{u,vji + y(u,v)i + z(u,v)Ü. C.487) Wenn die Parameter u und v alle erlaubten Werte durchlaufen, ergeben sich über C 486) und C.487) Koordinaten und Radiusvektoren aller Flächenpunkte Elimination von u und v aus der Parameterform der Definition C.486) liefert die implizite Form C.484). Die explizite Form C.485) ist ein Spezialfall der Parameterform für u = x und v = y ¦ Gleichung der Kugel in kartesischen Koordinaten, Parameterform und Vektorform (Abb.3.227) 2 , 2,2 x +y + z ¦ ¦ acoswsinv, = 0; = a sin u sin v, z = a cos v , r = a(cos u sin vi + sin u sin vj + cos vi) C.488a) C.488b) C.488c) Normale -Linie Abbildung 3.226 Abbildung 3.227 Abbildung 3 228 2. Krummlinige Koordinaten auf einer Fläche Für eine in der Form C.486) oder C.487) gegebene Fläche erhält man durch Variieren des Parameters u bei gleichzeitigem Festhalten von v = Vq die Punkte r(x, y, z) einer Kurve f = r(u, Vq) auf der Fläche. Werden für v nacheinander verschiedene, aber feste Werte v = v 1} v — v2, .., v = vn eingesetzt, dann ergibt sich eine Kurvenschar auf der Fläche. Da bei der Bewegung längs einer solchen Kurve mit v = const nur u geändert wird, nennt man diese Kurven die u-Linien (Abb.3.226). In Analogie dazu erhält man beim Variieren von v und gleichzeitigem Festhalten von u = const für ui, it2, •.., un eine zweite Kurvenschar und spricht von
252 3 Geometrie v-Linien. Auf diese Weise kann man auf der Fläche C.486) ein Netz von Koordinatenlinien entstehen lassen, in dem zwei feste Zahlen u = Ui und v = vk die krummlinigen oder GAUSSsc/ien Koordinaten des Flächenpunktes P sind. Wenn eine Fläche in der Form C.485) gegeben ist, stellen die Koordinatenlinien Schnitte der Fläche mit den Ebenen x = const und y = const dar Mit Gleichungen der impliziten Form F(w, v) = 0 oder mit den Parametergleichungen u = u(t) und v = v(t) zwischen diesen Koordinaten werden Kurven auf der Fläche beschrieben. ¦ Die Parametergleichungen der Kugel C 488b,c) ergeben für u die geographische Länge eines Punktes P und v seinen Polabstand, das Komplement zu seiner geographischen Breite. Die f-Linien sind hier die Meridiane APB, die w-Linien die Breitenkreise CPD (Abb.3.227). 3.6.3.2 Tangentialebene und Flächennormale 1. Definitionen 1. Tangentialebene Wenn durch einen Flächenpunkt P(x,y,z) alle auf dieser Fläche möglichen Flächenkurven hindurchlaufen, dann liegen in der Regel alle zugehörigen Kurventangenten im Punkt P in ein und derselben Ebene, der Tangentialebene der Fläche des Punktes P. Ausgenommem davon sind die sogenannten Kegelpunkte (s 3 6 3 2,3., S. 252) 2. Flächennormale Eine Gerade, die senkrecht auf der Tangentialebene steht und durch den Punkt P verläuft, heißt Flächennormale im Punkt P (Abb.3.228). 3. Normalenvektor Die Tangentialebene wird von zwei Vektoren aufgespannt, den Tangentenvektoren dv dv ?u = du ' ?v = du C 489a) der u- und der v-Linien. Das Vektorprodukt ru x rv der beiden Tangentenvektoren ist ein Vektor, der in die Richtung der Flächennormalen weist. Sein Einheitsvektor *°=^fr C489b) wird Normalenvektor genannt Seine Richtung nach der einen oder anderen Seite der Fläche ist dadurch festgelegt, ob u oder v erste oder zweite Koordinate ist. 2. Gleichungen der Tangentialebene und der Flächennormalen (s. Tabelle 3.29) ¦ A: Für die Kugel mit der Gleichung C.488a) ergibt sich 1 als Tangentialebene 2x{X -x) + 2y(Y - y) + 2z(Z - z) = 0 oder xX + yY + zZ - a2 = 0 , C 490a) « ' i ™ i i X -x Y -y Z-z , X Y Z 2 als Flächennormale = = oder — = — = —. C 490b) 2x 2y 2z x y z v ' ¦ B: Für die Kugel mit der Gleichung C 488b) ergibt sich 1. als Tangentialebene X cos u sin v + Y sin u sin v + Z cos v = a, C 490c) X Y Z 2 als Flächennormale. = = . C.490d) cos u sin v sin u sin v cos v 3. Singulare Flächenpunkte (Kegelpunkte) Wenn für einen Flächenpunkt mit den Koordinaten x — X\, y = y\, z = z\ und der Gleichung C.484) gleichzeitig die Beziehungen erfüllt sind, d h wenn die Ableitungen 1 Ordnung verschwinden, dann ist der Punkt P{x\,y\,Z\) ein singulärer Punkt oder Kegelpunkt. Alle Tangenten, die durch ihn verlaufen, liegen nicht in einer Ebene,
3.6 Differentialgeometrie 253 Tabelle 3.29 Gleichungen der Tangentialebene und der Flächennormalen Art der Gleichung Tangentialebene Flächennormale C 484) C.485) C 486) C.487) £•*-¦>?£<"-.» dF +-(Z-z) = 0 Z-z=p(X-x)+q(Y-y) X-x Y-y Z-x dx dy dz du du du dx dy dz dv dv dv (R - rjrlra = 0*1} oder (R - r)N = 0 X-x ~dF^~ dx X-x Y-y ' dF ~ dy _Y-y Z-z ~ dF dz _ Z-z X-x dy dz du du dy dz 1 dv dv Y-y dz dx du du dz dx dv dv Z-z dx dy 1 du du 1 dx dy 1 dv dv 1 R = r + A(rl x r^) oder R = r + AN x, y, z und r sind in dieser Tabelle die Koordinaten und der Radiusvektor der Punkte der Tangentialebene oder der Flächennormalen; X, Y, Z und R sind die laufenden Koordinaten und der Radiusvektor des Punktes der Tangentialebene oder der Flächennormalen dz dz - . im Punkt P; außerdem ist p - dx' , N ist der Normalenvektor *1) Zum Spatprodukt dreier Vektoren s. 3.5.1 4,2., S. 190 sondern bilden einen Kegel 2. Ordnung mit der Gleichung !?<* - -I + w{Y -yi?+^{z-2lJ+W* -Xl){Y -yi) +2H(r-^-zi)+2S(z-^(x-ii)=°' C492) in der die Ableitungen im Punkt P zu bilden sind. Wenn auch alle Ableitungen 2. Ordnung verschwinden, dann handelt es sich um einen singulären Punkt von komplizierterer Art. Es liegt also ein Kegel dritter oder höherer Ordnung vor 3.6.3.3 Linienelement auf einer Fläche 1. Differential des Bogens Eine Fläche sei in der Form C.486) oder C.487) gegeben Auf der Fläche seien P(u, v) ein beliebiger Punkt und N(u + du, v + dv) ein in der Nähe von P liegender zweiter Punkt. Die Länge des Bogens PN auf der Fläche läßt sich dann angenähert durch das Differential des Bogens oder das Linienelement der Fläche mit der Formel ds2 = Edu2 + 2Fdudv + Gdv2 C.493a) berechnen, wobei die drei Koeffizienten E = r2 = du) \du) \du _^ dxdx dydy dz dz tn AM. , F = rur„ = —— + -^/ + —— , 3.493b du dv du dv du dv
254 3 Geometrie dx r: = (— i +1 ^ dy ,dv C.493c) für den Punkt P zu bilden sind Die rechte Seite von C.493a) wird erste quadratische Fundamentalfoim der Fläche genannt ¦ A: Für die Kugel gemäß C 488c) ergibt sich: E = a2 sin2 v , F = 0 , ds2 = a2(sin2vdu2 + dv2). B: Für eine gemäß C.485) gegebene Fläche ergibt sich l+p2 ¦pq, G=l + q2 dz dz mit V=T^ q=d~y C 494) C.495) 2. Messungen auf der Fläche 1. Die Länge des Bogens einer Kurve u = u(t), v = v(t) auf der Fläche wird für t0 < t < t\ über r i / nni \ nii ni) i nii \ dt C 496) «-1 i-i to to E\—\2 + 2F—— + g(—^2 dt) dt dt [dt, berechnet 2. Der Winkel zwischen zwei Kurven, r~i(£) = r(ui(t),vi(t)) und r(t) = r(u2(t),V2{t)) auf der Fläche r = r(n, v), d.h. zwischen ihren Tangenten, die sich im Punkt P schneiden und in diesem Punkt die durch die Vektoren fi und r2 vorgegebene Richtung haben (Abb.3.229), wird mit der Formel rir2 v-Linie E üiü2 + F (üiv2 + Viü2) + G Viv2 sJEu\ + 2FÜXVX +Gvl^Eü22 4- 2Fü2v2 + Gi)\ C.497) berechnet. Die Koeffizienten E, F und G sind für den Punkt P zu bestimmen, und ^l, ü2 , ^i, v2 stellen die ersten Ableitungen von U\{t), u2(t), Vi(t) und Abbildung 3.229 v2(t) für den dem Punkt P entsprechenden Parameterwert dar. Wenn der Zähler von C 497) verschwindet, stehen beide Kurven senkrecht aufeinander. Die Orthogo- nalitätsbedingung für die Koordinatenlinien v = const und u = const lautet F = 0. 3. Der Flächeninhalt eines Flächenstücks S , das von einer beliebigen, auf der Fläche liegenden Kurve begrenzt wird, kann über das Doppelintegral (S) dS C mit dS=VEG-F2dudv C.498b) berechnet werden. Man nennt dS Flächenelement. Die Berechnung von Längen, Winkeln und Flächeninhalten auf Flächen ist mit Hilfe der Formeln C.496, 3.497, 3.498a,b) möglich, wenn die Koeffizienten E, F und G der ersten quadratischen Fundamental- form bekannt sind. Somit definiert die erste quadratische Fundamentalform die Metrik auf der Fläche 3. Übereinanderlegen von Flächen bei Verbiegung Wenn eine Fläche ohne Zerrung oder Einschnitt verbogen wird, ändert sich ihre Gleichung, aber ihre Metrik bleibt erhalten Mit anderen Worten, die erste quadratische Fundamentalform ist bei solchen reinen Verbiegungen eine Invariante. Daher können zwei unterschiedliche Flächen mit gleicher erster quadratischer Fundamentalform aufeinander abgewickelt werden.
3.6 Differentialgeometrie 255 Abbildung 3.230 3.6.3.4 Krümmung einer Fläche 1. Krümmung von Kurven auf einer Fläche Wenn durch einen Flächenpunkt P verschiedene Kurven r auf dieser Fläche gezogen werden (Abb. 3.230a), dann stehen ihre Krümmungskreisradien p im Punkt P in den folgenden drei Beziehungen zueinander: 1. Krümmungskreisradius Der Krümmungskreisradius p einer Kurve r im Punkt P ist gleich dem Krümmungskreisradius der Kurve C, die sich als Schnitt der Fläche mit der Schmiegungsebene der Kurve T im Punkt N ergibt (Abb. 3.230a). 2. Satz von Meusnier Für jeden ebenen Schnitt C durch eine Fläche (Abb.3.230b) berechnet man den Krümmungskreisradius p gemäß p = Äcos(n,N) C.499) Dabei ist R der Krummungskreisradius des Normalschnittes Cnorm, der durch die gleiche Tangente NQ geht wie C sowie durch den Einheitsvektor N der Flächennormalen; £(n, N) ist der Winkel zwischen dem Einheitsvektor n der Hauptnormalen der Kurve C und dem Einheitsvektor N der Flächennormalen. Das Vorzeichen von p in C.499) ist positiv, wenn N auf der konkaven Seite der Kurve Cnorm liegt und negativ im umgekehrten Falle. 3. Euler sehe Formel Die Krümmung eines jeden Normalschnittes Cnorm kann mit der Formel von Euler i«p + sjp C500) berechnet werden, wobei R\ und R2 die Hauptkrümmungskreisradien sind (s. C.502a)), und a ist der Winkel zwischen den Ebenen der Schnitte C und C\ (Abb.3.230c). 2. Hauptkrümmungsrichtungen und Hauptkrümmungskreisradien Die Krummungskreisradien R von Normalschnitten Cnorm hängen von den Tangentenrichtungen im dy du Punkt P ab (Abb.3.230c), die durch die Werte — bestimmt sind. Die Ableitungen — genügen der dx dx Gleichung [tpq-s(l + q2)[ \dxj Ux + [*A + P2) - r(l + ?2)]/ + [s(l + p2) - rpq] = 0. C.501) Die Lösungen von C 501) bestimmen diejenigen Tangentenrichtungen, die zu den Extremwerten R\ (Minimalwert) und R2 (Maximalwert) von R gehören. Diese Tangentenrichtungen stehen senkrecht aufeinander und werden als Hauptkrümmungsrichtungen im Punkt P bezeichnet. Die Krümmungsradien der zugehörigen Normalschnitte C\ und C2 , d.h. R\ und R2 sind die Hauptkrümmungskreisradien
256 3 Geometrie Wenn die Fläche in der expliziten Form C 485) gegeben ist, dann lassen sich R\ und R2 als Wurzeln der quadratischen Gleichung (rt - s2)R2 + h[2pqs - A + p2)t - A + q2)r]R + h4 = 0 mit C 502a) dz dz P==d~x' q=di> -% s = Srr t = % und h = fi^* C502b) berechnen. Die Vorzeichen von R, Ri und R2 werden nach der gleichen Regel wie in C.499) bestimmt Wenn die Fläche in der Vektorform C.487) gegeben ist, dann treten an die Stelle von C.501) und C.502a) entsprechend die Gleichungen {GM - FN) + {GL- ¦EN)— + (FL- du ¦ EM) = 0, C 503a) (LN - M2)R2 - (EN - 2FM + GL)R + (EG - F2) = 0, C.503b) mit den Koeffizienten L, M, N der zweiten quadratischen Fundamentalform, die über die Gleichungen d' ,R: VEG - F2 ' M ¦- vuvK- N : u Rz s/EG - F2 C.503c) berechnet werden. Dabei sind die Vektoren ru Radiusvektors r nach den Parametern u und v d = d' = C 503d) VEG - F2 ' , ruv und rvv die partiellen Ableitungen 2. Ordnung des In den Zählern stehen die Determinanten d2x d2y d2z |dudv dudv dudv| dx dy dz du du du dx dy dz -dv dv dv Als zweite quadratische Fundamentalform, die die Krümmungseigenschaften der Fläche enthält, bezeichnet man den Ausdruck Ldu2 + 2Mdudv + Ndv2 C 503e) Krümmungslinien nennt man die Linien auf der Fläche, die in jedem Punkt die Richtung der Hauptnormalschnitte haben. Ihre Gleichungen ergeben sich durch Integration von C.501) oder C.503a). d2x du2 dx du dx c§ d2y d2z du2 du2 dy dz du du dy dz dv dv d2x dv2 dx du dx c§ d2y dv2 dy du dy c§ d2z dv2 dz du dz dv Abbildung 3 231 3. Klassifizierung der Flächenpunkte 1. Elliptischer und Kreis-Flächenpunkt Besitzen die Hauptkrümmungskreisradien Ri und R2 im Flächenpunkt P gleiches Vorzeichen, dann liegen in der Umgebung von P alle Flächenpunkte auf einer Seite der Tangentialebene, und man spricht vom elliptischen Flächenpunkt (Abb.3.231a). Sein analytisches Merkmal ist die Bedingung LN - M2 > 0 C.504a)
3.6 Differentialgeometrie 257 2. Kreis- oder Nabelpunkt wird ein Flächenpunkt P genannt, wenn die Hauptkrümmungskreis- radien in diesem Punkt die Bedingung fli - R2 C.504b) erfüllen Seine Normalschnitte zeichnen sich durch R = const aus. 3. Hyperbolischer Flächenpunkt Im Falle unterschiedlicher Vorzeichen der Hauptkrummungs- kreisradien Ri und R2 weisen die konkaven Seiten der Hauptnormalenschnitte nach entgegengesetzten Richtungen Die Tangentialebene durchsetzt dann die Fläche, so daß diese in der Nähe des Punktes P sattelartig geformt ist P wird hyperbolischer Punkt genannt (Abb.3.231b); sein analytisches Merkmal ist die Bedingung LN - M2 < 0. C.504c) 4. Parabolischer Flächenpunkt Ist einer der beiden Hauptkrümmungskreisradien i?i oder R2 gleich oo, dann besitzt der eine Hauptnormalenschnitt entweder einen Wendepunkt oder er ist eine Gerade. Bei P handelt es sich dann um einen parabolischen Flächenpunkt (Abb. 3.231c) mit dem analytischen Merkmal LN - M2 = 0 * C.504d) ¦ Alle Punkte eines EUipsoids sind elliptisch, eines einschaligen Hyperboloids hyperbolisch und eines Zylinders parabolisch 4. Krümmung einer Fläche Zur numerischen Charakterisierung der Krümmung einer Fläche werden hauptsächlich zwei Größen benutzt 1. Mittlere Krümmung einer Fläche im Punkt P H = - ( — + — ) , C.505a) 2 \R\ R2J 2. Gaußsche Krümmung einer Fläche im Punkt P K = . C.505b) RiR2 ¦ A: Für den Kreiszylinder mit dem Radius a ist H = l/2a und K = 0. ¦ B: Für elliptische Punkte ist K > 0 , für hyperbolische K < 0 und für parabolische K = 0. 3. Berechnung von H und K, wenn die Fläche gemäß z = f(x, y) vorgegeben ist. 2A +p2 + g2K/2 (l+p2 + g2J Die Bedeutung von p, q, r, 5, t siehe C.502b). 5. Klassifizierung der Flächen nach ihrer Krümmung Minimalflächen sind Flächen, deren mittlere Krümmung H in allen Punkten Null ist, d h für die Ri = —R2 gilt. Flächen konstanter Krümmung zeichnen sich durch konstante GAUSSsche Krümmung K = const aus ¦ A: K > 0, z.B. die Kugel ¦ B: K < 0 , z.B. die Pseudosphäre (Abb.3.232), d.h. die Rotationsfläche der Traktrix (Abb.2.79) bei Rotation um Abbildung 3.232 die Symmetrieachse. 3.6.3.5 Regelflächen und abwickelbare Flächen 1. Regelfläche Eine Fläche heißt regelmäßig, geradlinig oder Regelfläche, wenn sie durch Bewegung einer Geraden im Raum erzeugt werden kann.
258 3 Geometrie 2. Abwickelbare Fläche Wenn eine Regelfläche auf eine Ebene abgewickelt werden kann, nennt man sie abwickelbare Fläche Nicht jede Regelfläche ist abwickelbar. Charakteristisch für abwickelbare Flächen ist, daß a) für alle Punkte die GAUSSsche Krümmung verschwinden muß und b) bei Vorgabe der Fläche in der expliziten Form z = f(x,y) die Abwickelbarkeitsbedingung erfüllt ist* a) K = 0, b) rt - s2 = 0. C.507) Die Bedeutung von r, t und s siehe Gleichungen C 502b). ¦ A: Kegel (Abb.3.191) und Zylinder (Abb.3.197) sind abwickelbare Flächen. ¦ B: Einschaliges Hyperboloid (Abb.3.195) und hyperbolisches Paraboloid (Abb.3.196) sind zwar Regelflächen, können aber nicht auf eine Ebene abgewickelt werden. 3.6.3.6 Geodätische Linien auf einer Fläche 1. Begriff der geodätischen Linien (s auch 3.4.1,3., S. 163). Durch jeden Punkt P(u,v) einer Fläche kann in jeder durch den Differentialquotienten — bestimmten Richtung auf der Fläche eine gedachte Kurve verlaufen, die geodätische du Linie genannt wird. Sie spielt auf der Fläche die gleiche Rolle wie die Gerade auf der Ebene und zeichnet sich durch die folgenden Eigenschaften aus: 1. Die geodätischen Linien sind die Linien der kürzesten Entfernung zwischen zwei Punkten auf einer Fläche 2. Wenn ein materieller Punkt, der gezwungen ist, auf einer vorgegebenen Fläche zu bleiben, von einem anderen auf der gleichen Fläche befindlichen materiellen Punkt angezogen wird, dann bewegt er sich in Abwesenheit anderer äußerer Kräfte auf einer geodätischen Linie. 3. Wird ein elastischer Faden über eine vorgegebene Fläche gespannt, dann nimmt er die Form einer geodätischen Linie an 2. Definition Eine geodätische Linie ist eine Kurve auf einer Fläche, deren Hauptnormale in jedem Flächenpunkt in die Richtung der Flächennormalen fällt ¦ Auf einem Kreiszylinder sind die geodätischen Linien Schraubenlinien. 3. Gleichung der geodätischen Linie Wenn eine Fläche in der expliziten Form z = f{x,y) vorgegeben ist, dann lautet die Differentialgleichung der geodätischen Linien A + i + <?)% = Vi (|K + BPs - qt) (|J + <pr - 29S)| - qr. C.508) Ist die Fläche in der Parameterform C.486) vorgegeben, dann ist die Differentialgleichung der geodätischen Linien von komplizierterer Art. Die Bedeutung von p, q: r, s und t siehe Gleichungen C.502b)
259 4 Lineare Algebra 4.1 Matrizen 4.1.1 Begriff der Matrix 1. Matrizen A vom Typ (m, n) oder kurz A(m,n) nennt man Systeme von m mal n Elementen, z B. Zahlen, darunter auch komplexe Zahlen, oder Funktionen, Differentialquotienten, Vektoren, die in m Zeilen und n Spalten angeordnet sind: A = (aßU) = I «11 Gl2 Ö21 «22 \flml öm2 ' «In \ • «2n T 1. Zeile 2 Zeile ra-te Zeile D 1) n-te Spalte Mit dem Begriff Typ einer Matrix werden die Matrizen entsprechend ihrer Zeilenzahl m und ihrer Spaltenzahl n klassifiziert Eine erste Einteilung in quadratische und rechteckige Matrizen ergibt sich, je nachdem, ob die Zahl der Zeilen und Spalten gleich groß ist oder nicht. 2. Reelle und komplexe Matrizen Reelle Matrizen bestehen aus reellen Elementen, komplexe Matrizen aus komplexen Elementen. Man kann eine Matrix, die aus den komplexen Elementen <V + 'lbiw D.2a) besteht, in zwei Matrizen A und B der Form A + iB D.2b) aufspalten, die beide nur reelle Zahlen enthalten. Zwischen den Elementen einer komplexen Matrix A und der zu ihr konjugiert komplexen Matrix A* besteht die Beziehung a*„ = Re{aßU) -ilm(a^) D.2c) 3. Transponierte oder gestürzte Matrizen AT Aus der Matrix A vom Typ (m, n) entsteht durch Vertauschen der Zeilen und Spalten die transponierte Matrix AT Sie ist vom Typ (n, m) Für sie gilt. KM)T = Ku) ¦ D.3) 4. Adjungierte Matrizen Zu einer komplexen Matrix A erhält man die adjungierte Matrix AH , indem man die zugehörige konjugiert komplexe Matrix A* transponiert (s. auch 4 2.2,2., S. 268)' AH = (A*)T . D.4) 5. Nullmatrix 0 wird eine Matrix genannt, deren sämtliche Elemente gleich Null sind: °\ 0 0 = I ... I D5) /00 ' 00 \00 ••• 0/
260 4 Lineare Algebra 4.1.2 Quadratische Matrizen 1. Definition Quadratische Matrizen besitzen die gleiche Anzahl von Zeilen und Spalten, d.h m = n: (du • • ain\ A = A(n,n) = : • : . D.6) \an\ -" ann] Die Elemente a^u der Matrix A , die sich in der Diagonalen von links oben nach rechts unten befinden, werden Hauptdiagonalelemente genannt. Sie tragen die Bezeichnung an,o22,..., ann , d.h., es sind alle Elemente aßl/ mit fi = v 2. Diagonalmatrizen sind quadratische Matrizen D , in denen alle außerhalb der Hauptdiagonale liegenden Elemente gleich Null sind- <fyiv = 0 für (j, 7^ v: D = [an 0 0 a22 \ 0 0 0 \ fan 0 122 \ o ° \ Q"nn / D 7) 3. Skalarmatrix S wird eine spezielle Diagonalmatrix genannt, in der alle Diagonalelemente gleich einer reellen oder komplexen Konstanten c sind /cO ••• 0\ a^ = 0 für fi ^ v, aßß = c, S -- Oc ••• 0 VOO ••• c) (U 4. Spur einer Matrix Für eine quadratische Matrix wird der Begriff der Spur als Summe ihrer Hauptdiagonalelemente definiert. Sp (A) = an + a22 + + ann = Ylaw 5. Symmetrische Matrizen sind quadratische Matrizen A , die gleich ihrer transponierten Matrix sind A = AT. Für Elemente, die spiegelbildlich zur Hauptdiagonale liegen, gilt 6. Normale Matrizen genügen der Gleichung ATA = AAT Wegen der Multiplikation zweier Matrzen s. 4.1.4,5., S 262. 7. Antisymmetrische oder schiefsymmetrische Matrizen sind quadratische Matrizen A mit der Eigenschaft: A = -AT. Für die Elemente aßU einer antisymmetrischen Matrix gilt D.9) D.10) D.11) D.12) D 13a) D 13b)
4 1 Matrizen 261 so daß die Spur einer antisymmetrischen Matrix verschwindet: Sp(A) = 0 D.13c) Elemente, die spiegelbildlich zur Hauptdiagonale liegen, unterscheiden sich nur durch ihr Vorzeichen Jede quadratische Matrix A kann in eine Summe aus einer symmetrischen Matrix As und einer antisymmetrischen Matrix A^ zerlegt werden: A = AS + Aas mit As = i(A + AT), Aas = ^(A-AT). D.13d) 8. Hermitesche Matrizen oder selbstadjungierte Matrizen sind quadratische Matrizen A, die gleich ihrer Adjungierten sind: A=(A*)T = AH. D.14) Im Reellen fallen die Begriffe symmetrische und hermitesche Matrix zusammen. Die Determinante einer hermiteschen Matrix ist reell. 9. Antihermitesche oder schiefhermitesche Matrix wird eine quadratische Matrix genannt, die gleich ihrer negativen Adjungierten ist: A = -(A*)T = -AH D.15a) Für die Elemente aßU und die Spur einer schiefhermiteschen Matrix gilt <V = -*%,, <W = 0 > Sp (A) = 0 D.15b) Man kann jede quadratische Matrix A als Summe aus einer hermiteschen Matrix Ah und einer anti- hermiteschen Matrix Aah darstellen. A = Ah + Aah mit Ah = -(A + AH), Aah =-(A - AH) D 15c) 10. Einheitsmatrix E heißt eine quadratische Matrix, in der jedes Haupt diagonalelement den Wert Eins besitzt, während alle anderen Elemente den Wert Null haben: °!7: =(w mit ^={!2r£^: D-16) Voo-i i) Das Zeichen 6^ wird KRONECKER-5?/rak>/ genannt 11. Dreiecksmatrix 1. Rechte oder obere Dreiecksmatrix R (im Englischen U von upper) ist eine Matrix, in der alle Elemente unterhalb der Hauptdiagonale den Wert Null besitzen: R = (ffiu) mit rßl/ = 0 für alle [i > v. D-17) 2. Linke oder untere Dreiecksmatrix L (im Englischen L von lower) ist eine Matrix, in der alle Elemente oberhalb der Hauptdiagonale den Wert Null besitzen: L = (Ipv) mit Ipv = 0 für alle n<v D.18) 4.1.3 Vektoren Matrizen vom Typ (n, 1) heißen einspaltige Matrizen oder Spaltenvektoren der Dimension n ; Matrizen vom Typ A, n) heißen einzeilige Matrizen oder Zeilenvektoren der Dimension n: E- Spaltenvektor: a = \anJ D 19a) Zeilenvektor: aT = (a!? o2,..., an) D.19b)
262 4 Lineare Algebra Mit Hilfe der Transponierung kann ein Spaltenvektor in einen Zeilenvektor umgewandelt werden und umgekehrt Durch einen Zeilen- bzw Spaltenvektor der Dimension n kann ein Punkt im n-dimensiona- len euklidischen Raum Rn beschrieben werden Der Nullvektor wird durch 0 bzw. 0T gekennzeichnet. 4.1.4 Rechenoperationen mit Matrizen 1. Gleichheit von Matrizen Zwei Matrizen A = (a^) und B = (bßU) sind gleich, wenn sie vom gleichen Typ sind und wenn ihre gleichgestellten Elemente einander gleich sind: A = B, wenn aßl/ = bßU für /x = 1,.. ,ra;i/ = l,.. ,ra. D.20) 2. Addition und Subtraktion von Matrizen ist möglich, wenn sie vom gleichen Typ sind. Die Addition bzw. Subtraktion erfolgt elementweise für jeweils gleichgestellte Elemente: A ± B = (aßU) ± (b^) = (v, ± bfj). D 21a) /l 3 7\ /3-5 0W4-2 7\ " \2 -1 4) + \2 14; ~ V4 OSj' Es gelten Kommutativ- und Assoziativgesetz der Matrizenaddition: Kommutativgesetz: A + B = B + A. D 21b) Assoziativgesetz: (A + B) + C = A + (B + C). D.21c) 3. Multiplikation einer Matrix mit einer Zahl Eine Matrix A vom Typ (m, n) wird mit einer reellen oder komplexen Zahl a multipliziert, indem jedes Element von A mit a multipliziert wird: aA = a (aßV) = (aaßl/). D.22a) Jl 37\_/3 9 21\ ^0-14J _ ^0-3 12;- Mit D 22a) wird auch ausgesagt, daß ein konstanter Faktor, der in allen Elementen einer Matrix enthalten ist, ausgeklammert werden kann. Es gelten das Kommutativ-, Assoziativ- und Distributivgesetz der Multiplikation einer Matrix mit einem Skalar: Kommutativgesetz: aA = Aa; D.22b) Assoziativgesetz: a(ßA) = (aß)A ; D.22c) Distributivgesetz: (a ± ß)A = aA±ßA, a(A ±B) = aA±ctB. D 22d) 4. Division einer Matrix durch einen Skalar Die Division einer Matrix durch einen Skalar wird als Multiplikation mit 0 = 1/7 durchgeführt, wobei 7^0 sein muß 5. Multiplikation zweier Matrizen 1. Das Produkt AB zweier Matrizen A und B, auch skalares Matrixprodukt genannt, läßt sich nur bilden, wenn die Spaltenanzahl des linken Faktors A gleich der Zeilenanzahl des rechten Faktors B ist. Wenn A eine Matrix vom Typ (m, n) ist, dann muß die Matrix B vom Typ (n, p) sein, und das Produkt AB ist eine Matrix C = (cma) vom Typ (m,p). Hierbei ist (cß\) gleich dem Skalarprodukt der yu-ten Zeile des linken Faktors A mit der A-ten Spalte des rechten Faktors B: AB = £o^W = (CmA) = C (/x = 1,2, ..,m,A = l,2,. .,p) D 23)
4.1 Matrizen 263 2. Ungleichheit der Produktmatrizen Falls die beiden Produkte AB und BA gebildet werden können, ist im allgemeinen AB 7^ BA, d h., das Kommutativgesetz der Multiplikation gilt im allgemeinen nicht. Gilt aber AB = BA, dann heißen A und B miteinander vertauschbar 3. Falksches Schema Für die praktische Durchführung der Matrixmultiplikation gemäß AB = C verwendet man der größeren Übersichtlichkeit halber das FALKsche Schema (Abb.4.1). Das Element cßx der Produktmatrix C erscheint genau im Kreuzungspunkt der //-ten Zeile von A mit der A- ten Spalte von B. ¦ Multiplikation zweier Matrizen ACK) und BCJ) in Abb.4.2 mit Hilfe des FALKschen Schemas. B AB 1 3 7 ^O -1 0 1 3 -5 0 2 1 3 -12 26 B 11 QU AB -3 1 Abbildung 4.2 Abbildung 4.1 4. Multiplikation zweier Matrizen Ki und K2 mit komplexen Elementen Bei der Multiplikation zweier Matrizen mit komplexen Elementen kann die Möglichkeit der Aufspaltung in Real- und Imaginärteil gemäß D 2b) genutzt werden. Ki = Ai + iBl, K2 = A2 + iB2 . Dabei sind Ax, A2, Bl5 B2 reelle Matrizen Nach der Zerlegung liefert die Multiplikation eine Summe, deren Glieder als Produkte von Matrizen mit reellen Elementen berechnet werden können. ¦ (A + i B)(A - i B) = A2 4- B2 + i (BA - AB). Auch bei der Multiplikation derart zerlegter Matrizen ist zu berücksichtigen, daß das Kommutativgesetz der Multiplikation im allgemeinen nicht gilt, d h , daß A und B nicht vertauschbar sind. 6. Skalares und dyadisches Produkt zweier Vektoren Für zwei Vektoren a und b, die als einspaltige bzw einzeilige Matrizen dargestellt werden können, gibt es bei der Matrizenmultiplikation die folgenden zwei Möglichkeiten der Produktbildung: Ist a vom Typ A, n) und b vom Typ (n, 1), dann ist das Produkt vom Typ A,1), also eine Zahl. Man spricht dann vom Skalarprodukt zweier Vektoren Ist dagegen a vom Typ (n, 1) und b vom Typ A, m), dann ist das Produkt vom Typ (n, m), also eine Matrix. Man spricht in diesem Falle vom dyadischen Produkt zweier Vektoren. 1. Skalarprodukt zweier Vektoren Unter dem Skalarprodukt eines Zeilenvektors aT = (ai,a2, die Zahl , an) mit einem Spaltenvektor b = F1,b2, • • > bn)T von je n Elementen versteht man aTb = bTa = axbx + a2b2 + • • • + anbn = ]jT aßbß . D.24) /x=i Das Kommutativgesetz der Multiplikation gilt hier im allgemeinen nicht Daher ist die Reihenfolge von aT und b exakt einzuhalten Bei Vertauschung der Reihenfolge, also baT würde sich ein dyadisches Produkt ergeben 2. Dyadisches Produkt oder Tensorprodukt zweier Vektoren Unter dem dyadischen Produkt eines Spaltenvektors a = (a\, a2, ., an)T der Dimension n mit einem Zeilenvektor bT = F1,62,. ., bm) der Dimension m versteht man die Matrix /aibi abT a2°2 axbni Ö2&rr \ D.25) \anöi anb2 n^rn I vom Typ (n, m). Auch hier gilt das Kommutativgesetz der Multiplikation im allgemeinen nicht.
264 4 Lineare Algebra 3. Hinweis zum Begriff des Vektorprodukts zweier Vektoren Im Bereich der Multivektoren oder vollständig alternierenden Tensoren, die hier nicht vorgestellt werden können, gibt es das sogenannte progressive, alternierende oder äußere Produkt, das im klassischen dreidimensionalen Falle das bekannte Vektorprodukt (s 3 5.1.3,2., S. 188ff) darstellt 7. Rang einer Matrix 1. Definition In einer Matrix A ist die größte Anzahl r der linear unabhängigen Spaltenvektoren stets gleich der größten Anzahl der linear unabhängigen Zeilenvektoren (s 5.3 7 2, 327) Diese Zahl r heißt Rang der Matrix, auch mit Rg (A) = r bezeichnet. 2. Aussagen zum Rang von Matrizen a) Da im Vektorraum der Dimension m mehr als m Zeilenvektoren oder Spaltenvektoren der Dimension m linear abhängig sind (s. 5.3.7.2, S. 327), ist der Rang r in einer Matrix A vom Typ (m, n) höchstens gleich der kleineren der Zahlen m und n- Rg (A(m>n)) = r < min (m, n). D 26a) b) Für den Rang einer regulären quadratischen Matrix A(nn), d h. det A/0, gilt Rg(A(n,n)) =r = n D.26b) Eine quadratische Matrix vom Typ (n, n) heißt eine reguläre Matrix, wenn ihr Rang gleich n ist Das ist genau dann der Fall, wenn ihre Determinante det A (s 4 2.2,3., S 268) von Null verschieden ist Anderenfalls ist es eine singulare Matrix. c) Für den Rang einer singulären quadratischen Matrix A(niTl), d.h det A = 0, gilt Rg(A(n,n)) = r<n. D 26c) d) Der Rang der Nullmatrix 0 ist Rg @) = r = 0 D 26d) e) Der Rang von Summen und Produkten von Matrizen genügt den Beziehungen |rank(A) - rank(B)| < rank(A + B) < rank(A) + rank(B), D 26e) rank(AB) < min(rank(A), rank(B)). D.26f) 3. Regel zur Ermittlung des Ranges Bei elementaren Umformungen ändert sich der Rang von Matrizen nicht. Elementare Umformungen in diesem Zusammenhange sind: a) Vertauschung zweier Zeilen miteinander oder zweier Spalten miteinander. b) Multiplikation einer Zeile oder Spalte mit einer Zahl ^ 0. c) Addition einer Zeile zu einer Zeile oder einer Spalte zu einer Spalte Zur Bestimmung ihres Ranges kann man daher jede Matrix durch geeignete Linearkombinationen der Zeilen so umformen, daß in der /i-ten Zeile (/z = 2,3,.. , m) mindestens die ersten /i—1 Elemente gleich Null werden (Prinzip des GAUSSschen Algorithmus, s 4 4.2.4, S. 284). Die Anzahl der vom Nullvektor verschiedenen Zeilenvektoren in der so umgeformten Matrix ist dann gleich ihrem Rang r. 8. Inverse oder reziproke Matrix Zu einer regulären Matrix A = (a^) gibt es immer eine inverse Matrix A_1, d.h., die Multiplikation einer Matrix mit ihrer inversen Matrix ergibt immer die Einheitsmatrix- AA_1 = A_1A = E. D 27a) Die Elemente von A-1 = {ßpv) sind 4"-äh' D27b) wobei AVp die zum Element aVß der Matrix A gehörende Adjunkte (s. 4 2 1,1., S. 267) ist. Für die praktische Berechnung von A sollte das in 4.2 2,2., S 268 angegebene Verfahren benutzt werden. Im Falle einer quadratischen Matrix vom Typ B, 2) gilt:
4 1 Matrizen 265 Hinweis: Warum in der Matrizenrechnung keine Division von Matrizen eingeführt wurde, sondern mit inversen Matrizen gerechnet wird, hängt damit zusammen, daß die Division nicht eindeutig erklärbar ist Die Lösungen der Gleichungen Sil <b— )-dh £:££ ^ sind im allgemeinen verschieden. 9. Orthogonale Matrizen Gilt für eine quadratische Matrix A die Beziehung PJ = A.~1 oder AAT = ATA = E, D 30) d h . die Skalarprodukte je zweier verschiedener Spalten oder Zeilen sind gleich null und die Skalarpro- dukte jeder Zeile oder Spalte mit sich selbst gleich eins, dann nennt man sie eine orthogonale Matrix. Orthogonale Matrizen haben folgende Eigenschaften: 1. Die transponierte und die inverse Matrix einer orthogonalen Matrix A sind auch orthogonal; weiterhin gilt detA = ±l. D.31) 2. Produkte orthogonaler Matrizen sind wieder orthogonal ¦ Die bei der Drehung eines Koordinatensystems verwendete Drehungsmatrix D mit den Richtungskosinus der neuen Achsenrichtungen (s. 3.5.3 1,8., S 217) ist orthogonal. 10. Unitäre Matrix Gilt für eine Matrix A mit komplexen Elementen (A*)T = A-1 oder A(A*)T = (A*)TA = E, D.32) dann heißt sie eine unitäre Matrix. Im Reellen fallen die Begriffe unitär und orthogonal zusammen 4.1.5 Rechenregeln für Matrizen Die folgenden Regeln können nur angewendet werden, wenn die darin auftretenden Rechenoperationen durchführbar sind 1. Multiplikation einer Matrix mit der Einheitsmatrix, auch identische Abbildung genannt: AE - EA - A D 33) 2. Multiplikationen einer Matrix A mit der Skalarmatrix S oder mit der Einheitsmatrix E sind kommutativ: AS = SA = cA mit S gemäß D 8), D.34a) AE = EA = A D 34b) 3. Multiplikation einer Matrix A mit der Nullmatrix 0 ergibt die Nullmatrix. A0 = 0 und OA = 0 D 35) Die Umkehrung dieser Regel gilt im allgemeinen nicht, d h , aus AB = 0 folgt nicht notwendig A = 0 oder B = 0 4. Verschwindendes Produkt zweier Matrizen Auch wenn weder A noch B Nullmatrizen sind, kann ihr Produkt eine Nullmatrix ergeben AB = 0 und BA = 0 , obgleich A ^ 0, B ^ 0 D 36) 5. Multiplikation dreier Matrizen (AB)C = A(BC). D.37) 0 1 0 1 1 0 0 0 1 0 0 0
266 4 Lineare Algebra 6. Transposition von Summe und Produkt zweier Matrizen (A + B)T = AT + BT, (AB)T = BTAT, (AT)T = A D.38a) Für quadratische, invertierbare Matrizen A(n>n) gilt außerdem- (AT)~1 = (A-1I,. D.38b) 7. Inverse eines Produkts aus zwei Matrizen (AB) = B^A1 D.39) 8. Potenzieren von Matrizen Ap = AA. ,A mit p > 0, ganz, D.40a) p Faktoren A° = E (detA^O), D.40b) A~p = (A_1)p (p > 0 , ganz ; det A ^ 0), D.40c) Ap+q = APAa (p? q ganz) < D<40d) 9. Kronecker-Produkt Als KRONECKER-Produkt zweier Matrizen A= (a^) und B= (bßl/) bezeichnet man die Vorschrift A (g) B = (<vB). D.41) Bezüglich Transposition und Spur gelten die Regeln (A <g> B)T = AT <g> BT, D.42) Sp (A <8> B) = Sp (A) • Sp(B). D 43) 4.1.6 Vektor- und Matrizennorm Einem Vektor x und einer Matrix A kann man jeweils eine Zahl \\x\\ (Norm x) bzw. ||A|| (Norm A) zuordnen Diese Zahlen müssen die Normaxiome (s. 12.3.1.1, S. 631) erfüllen Für Vektoren x € Rn lauten diese 1- | |x| | > 0 für alle x; | |x| | = 0 genau dann, wenn x = 0. D 44) 2. ||Ax|| = |A| ||x|| für alle x und alle reellen A. D.45) 3. ||x + y|| < ||x|| + ||y|| für alle x und y (Dreiecksungleichung) (s 3 5.1.2,2., S 186) D.46) Normen für Vektoren und Matrizen können auf sehr verschiedene Art und Weise eingeführt werden Es ist jedoch zweckmäßig, zu einer Vektornorm ||x|| die Matrizennorm ||A|| so zu definieren, daß die Ungleichung ||Ax||<||A|| Hxll D 47) gilt. Diese Ungleichung ist für Fehlerabschätzungen sehr nützlich. Vektor- und Matrizennormen, die diese Ungleichung erfüllen, werden als zueinander passend bezeichnet. Gibt es darüber hinaus zu jeder Matrix A einen Nichtnullvektor x, so daß das Gleichheitszeichen gilt, dann heißt die Matrizennorm \\A\\ der Vektornorm ||x|| zugeordnet 4.1.6.1 Vektornormen Ist x = (xi,X2,. • • ,£n)T ein n-dimensionaler Vektor, d.h. x G Rn , dann sind die gebräuchlichen Vektor normen: 1. Euklidische Norm: INI = IW|2.= JX>?. D.48)
4-2 Determinanten 267 2. Maximumnorm: ||x|| = ||x||oo := max \xi\. D.49) l<i<n 3. Betragssummennorm: IWI = IWIi:=E|Jb|. D 50) i=l ¦ Im R3, in der elementaren Vektorrechnung, wird ||x||2 als Betrag des Vektors x bezeichnet. Der Betrag des Vektors \x\ = ||x||2 gibt die Länge des Vektors x an. 4.1.6.2 Matrizennormen 1. Spektralnorm: ||A|| = ||A||2 = VwÄrXj. D.51) Dabei wird mit Amax(ATA) der größte Eigenwert (s. 4.5, S. 286) der Matrix ATA bezeichnet. 2. Zeilensummennorm: ||A|| = ||A|U •= ma* £|ay|. D.52) l<i<n -=1 3. Spaltensummennorm: ||A|| = ||A||i:= max £M • D-53) l<j<n i=1 Es läßt sich zeigen, daß die Matrizennorm D 51) der Vektornorm D 48) zugeordnet ist. Das gleiche gilt für D.52) und D.49) sowie D.53) und D.50) 4.2 Determinanten 4.2.1 Definitionen 1. Determinanten sind reelle oder komplexe Zahlen, die eindeutig quadratischen Matrizen zugeordnet werden. Eine Determinante n-ter Ordnung, die der Matrix A = (cl^) vom Typ (n, n) zugeordnet ist, D = det A = det (aß„) = All «12 ''• Öln a2l a22 • • • CL2n D.54) I «nl «n2 ' ' ' ttn: wird mit Hilfe des LAPLACEsc/ien Entwicklungssatzes rekursiv definiert: det A = ^2 apvAßU (fi fest, Entwicklung nach Elementen der /z-ten Zeile) , D.55a) n det A = ^2 aiivA\iv [y fest, Entwicklung nach Elementen der z^-ten Spalte) . D.55b) n=i Hierbei ist Aßl/ die mit dem Vorzeichenfaktor (—l)fx+u multiplizierte Unterdeterminante des Elements Man nennt AßU Adjunkte oder algebraisches Komplement. 2. Unterdeterminanten Eine Unterdeterminante (n— l)-ter Ordnung des Elements aßl/ einer Determinante n-ter Ordnung heißt diejenige Determinante, die sich aus der gegebenen Determinante durch Streichen der /x-ten Zeile und ly-ten. Spalte ergibt.
268 4 Lineare Algebra Entwicklung einer Determinante 4 Ordnung nach den Elementen der 3 Zeile: Oll Ö12 Ö13 Ö14 | | 2 3 4 | | 1 3 4 | + «33 Ö21 a22 «23 a24 Ö31 &32 Ö33 Ö34 Ö41 Ö42 ^43 Ö44 : Ö31 ai2 Ö13 «14 ^22 Ö23 Ö24 a42 a43 Ö44 -Ö32 Öll Ö13 ß14 «21 Ö23 Ö24 Ö41 Ö43 fl44 an ai2 an «21 Ö22 Ö24 ö41 ö42 fl44 ^34 an ai2 ai3 «21 «22 Ö23 Ö41 Ö42 Ö43 4.2.2 Rechenregeln für Determinanten Wegen des LAPLACEschen Entwicklungssatzes gelten die im folgenden für Zeilen formulierten Aussagen in gleicher Weise für Spalten 1. Unabhängigkeit des Wertes einer Determinante Der Wert einer Determinante ist unabhängig von der Auswahl der Entwicklungszeile 2. Ersetzen von Adjunkten Ersetzt man bei der Entwicklung einer Determinante nach einer ihrer Zeilen die zugehörigen Adjunkten durch die Adjunkten einer anderen Zeile, so ergibt sich Null. ^2 a^vA\v = 0 (/i, A fest, A ^ /i) D 56) Diese Beziehung und der Entwicklungssatz von Laplace (s. 4.2 1,1., S 267) ergeben zusammengefaßt Aadj A - A Aadj = (det A) E. D.57) Daraus erhält man für die inverse Matrix A~1 = diÄA^ D58) wobei als adjungierte Matrix Aadj der Matrix A die aus den Adjunkten der Elemente von A gebildete und anschließend transponierte Matrix bezeichnet wird Diese Matrix Aadj darf nicht mit der zu einer komplexen Matrix adjungierten Matrix AH D.4) verwechselt werden 3. Nullwerden einer Determinante Eine Determinante ist gleich Null, wenn a) eine Zeile aus lauter Nullen besteht oder b) zwei Zeilen einander gleich sind oder c) eine Zeile eine Linearkombination anderer Zeilen ist 4. Vertauschungen und Additionen Eine Determinante ändert ihren Wert nicht, wenn a) in ihr die Zeilen mit den Spalten vertauscht werden. Man spricht dann von Spiegelung an der Hauptdiagonale, d.h , es gilt detA = detAT, D.59) b) zu irgendeiner Zeile eine andere Zeile addiert bzw. subtrahiert wird, c) zu irgendeiner Zeile ein Vielfaches einer anderen Zeile addiert bzw. subtrahiert wird oder d) zu irgendeiner Zeile eine Linearkombination anderer Zeilen addiert bzw. subtrahiert wird. 5. Vorzeichen bei Zeilenvertauschung Bei Vertauschung zweier Zeilen ändert sich das Vorzeichen einer Determinante 6. Multiplikation einer Determinante mit einer Zahl Eine Determinante wird mit einer Zahl a multipliziert, indem die Elemente einer einzigen Zeile mit dieser Zahl multipliziert werden. Der Unterschied gegenüber der Multiplikation einer Matrix A vom Typ (ra, n) mit einer Zahl a kommt in der folgenden Formel zum Ausdruck- det (aA) = andet A . D.60)
4-2 Determinanten 269 7. Multiplikation zweier Determinanten Die Multiplikation zweier Determinanten wird auf die Multiplikation ihrer Matrizen zurückgeführt: (det A)(det B) = det (AB). D 61) Wegen det A = det AT (s. D.59)) gilt (det A)(det B) = det (AB) = det (ABT) = det (ATB) = det (ATBT), D.62) d.h., es können entweder Zeilen mit Spalten oder Zeilen mit Zeilen oder Spalten mit Zeilen oder Spalten mit Spalten skalar multipliziert werden 8. Differentiation einer Determinante Eine Determinante n-ter Ordnung, deren Elemente differenzierbare Funktionen eines Parameters t sind, d.h. aßU = aßU(t), wird nach t differenziert, indem man jeweils eine Zeile differenziert und die so entstehenden n Determinanten addiert. ¦ Für eine Determinante vom Typ C,3) erhält man- M an a\2 ßi3 «21 Ö22 «23 Ö31 a32 Ö33 «21 Ö22 Ö23 ^31 a32 «33 an oi2 ai3 fl21 Ö22 Ö23 Ö31 Ö32 fl33 + flu Q>i2 ßi3 Ö21 «22 «23 a31 ö32 ö33 4.2.3 Berechnung von Determinanten 1. Wert einer Determinante 2. Ordnung All 0-12 \ I 021 a22 I = 011^22 — «21^12 • D.63) 2. Wert einer Determinante 3. Ordnung Nach der Regel von Sarrus, die nur für Determinanten 3 Ordnung gilt, erfolgt die Berechnung mit Hilfe des Schemas Oll\ a12v ß13^ fl22\Ö23> ^32 «33 Ö21 «31 vOll «12 021^^22 — Oll022033 + 012023031 + Ol302l032 «31 032 -@3l0220l3 + 032023Ö11 + O33O21O12). Die ersten beiden Spalten werden rechts von der Determinante noch einmal hingeschrieben Dann wird die Summe der Produkte aller auf den ausgezogenen Schrägzeilen stehenden Elemente gebildet. Davon wird die Summe der Produkte aller auf den gestrichelten Schrägzeilen stehenden Elemente abgezogen. 3. Wert einer Determinante n-ter Ordnung Die Determinante n-ter Ordnung wird mit Hilfe des Entwicklungssatzes auf n Determinanten (n — l)-ter Ordnung zurückgeführt. Zweckmäßigerweise werden die einzelnen Determinanten mit Hilfe der Rechenregeln für Determinanten so umgeformt, daß möglichst viele ihrer Elemente zu Null werden. 2 9 9 4 2 -3 12 8 4 8 3-5 12 6 4 2 5 9 4 2 -7 12 8 4 0 3-5 10 6 4 = 3 2 53 4 2-7 4 8 4 0 1-5 102 4 (Regel 6) = 3(-5 24 8 4 1 -5 1 2 4 -7 23 4 4 1 -5 1 2 4 = 0 (Regel 3) = -21 -21( 1 -51 2 4 ) = 147 (Regel 4) 111 Ol 4 1-5 |l 2 4| (Regel 4) Hinweis: Besonders günstig kann eine Determinante n-ter Ordnung berechnet werden, wenn sie in Analogie zur Rangbestimmung von Matrizen (s 4 1.4,7., S. 264) so umgeformt wird, daß alle Elemente, die unterhalb der Diagonalen flu, 022, • • •, ann stehen, zu Null werden. Der Wert der Determinante ist dann gleich dem Produkt der Elemente auf der Hauptdiagonalen der umgeformten Determinante
270 4 Lineare Algebra 4.3 Tensoren 4.3.1 Transformation des Koordinatensystems 1. Lineare Transformation Durch die lineare Transformation X\ = ÖH^i + a\2X2 + 013^3 x = Ax oder x2 = a2\X\ + a22x2 + «23^3 D.64) ^3 = 0>3\Xl + «32^2 + 033^3 wird im dreidimensionalen Raum eine Koordinatentransformation beschrieben Dabei sind xß und xß (fi = 1,2,3) die Koordinaten ein und desselben Punktes, bezogen auf zwei verschiedene Koordinatensysteme K und K. 2. Einst einsehe Summenkonvention Anstelle von D 64) kann man auch 3 xß = ^alxuxu (//= 1,2,3) D 65a) v=\ oder abkürzend nach Einstein Xß = a^vxv D 65b) schreiben, d.h., über den doppelt auftretenden Index v ist zu summieren und das Ergebnis für \x = 1,2,3 aufzuschreiben. Die Summenkonvention legt allgemein fest. Tritt in einem Ausdruck ein Index zweimal auf, so wird der Ausdruck über alle vorgesehenen Werte dieses Index summiert Tritt ein Index in den Ausdrücken einer Gleichung nur einmal auf, z B \i in der Gleichung D.65b), so bedeutet das, daß die betreffende Gleichung für alle Werte gilt, die der Index durchlaufen kann. 3. Drehung des Koordinatensystems Wenn das kartesische Koordinatensystem K aus K durch Drehung hervorgeht, dann gilt in D.64) für die Transformationsmatrix A = D . Dabei ist D = {d^) die orthogonale Drehungsmatrix. Die orthogonale Drehungsmatrix D hat die Eigenschaft D-1 = DT . D.66a) Elemente d^ von D sind die Richtungskosinusse der Winkel zwischen den alten und neuen Koordinatenachsen. Aus der Orthogonalität der Drehungsmatrix D, d.h aus DDT = E und DTD = E, D 66b) folgt für ihre Elemente- 3 (/i,i/ = 1,2,3) D 66c) Die Gleichungen D.66c) besagen, daß die Zeilen- und Spaltenvektoren der Matrix D orthonormiert sind, denn 5^ ist das KRONECKER-Symbol (s 4 1 2,10., S. 261). Die Elemente der dßU der Drehungsmatrix können auch mit Hilfe der EuLERschen Winkel (s. 3.5.3.2,4., S 218) dargestellt werden. Zur Drehung in der Ebene s. 3 5.2.2, 2., S. 196, im Raum s. 3.5.3.2,2., S. 217. 4.3.2 Tensoren in kartesischen Koordinaten 1. Definition Eine mathematische oder physikalische Größe T läßt sich in einem kartesischen Koordinatensystem K durch 3n Elemente Uj m, die translationsinvariant sind, beschreiben Dabei sei die Anzahl der Indizes 3 / _j U>ßiavi z t=l = <w' 3 /Z dkßdkv = k=l = *,
4.3 Tensoren 271 i, j,..., m genau n (n > 0). Die Indizes sind geordnet, und jeder Index nimmt die Werte 1, 2 und 3 an. Gilt für die Elemente Uj m bei einer Transformation des Koordinatensystems K nach K gemäß D.64) 3 3 3 tßv p / j / j ' ' ' / j Q>iiiQ>vj ' ' ' Q'pmJ'ij m 5 V^*^'/ i=l j=\ m=l dann wird T als Tensor n-ter Stufe bezeichnet, und die Elemente Uj m (meist Zahlen) mit geordneten Indizes sind die Komponenten des Tensors T. 2. Tensor 0. Stufe Ein Tensor nullter Stufe hat nur eine Komponente, d.h., er ist ein Skalar. Da sein Wert in allen Koordinatensystemen gleich ist, spricht man von der Invarianz des Skalars oder vom invarianten Skalar. 3. Tensor 1. Stufe Ein Tensor erster Stufe hat 3 Komponenten £i, £2 und t3 . Das Transformationsgesetz D 67) lautet 3 *M = £fl/ii*i Qu =1,2,3). D.68) i=l Das ist aber gerade das Transformationsgesetz für Vektoren, d h., ein Vektor ist ein Tensor 1. Stufe 4. Tensor 2. Stufe Im Falle n — 2 hat der Tensor T 9 Komponenten Uj , die sich in der Matrixform ^11 t\2 ^13 \ *2i *22 *23 D.69a) ^ £31 £32 £33 / anordnen lassen Das Transformationsgesetz D.68) lautet dann 3 3 V = J2 X! atMiavjUj (/i, v = 1,2,3) D.69b) *=i j=i Damit läßt sich jeder Tensor 2. Stufe als Matrix darstellen ¦ A: Das Trägheitsmoment Og eines Körpers bezüglich einer Geraden g , die durch den Nullpunkt geht und den Richtungsvektor a = aT hat, läßt sich in der Form Og = aT0 a D 70a) darstellen, wenn man mit / Ox —Oxy —Oxz\ © = (Oij) = -exy ey -eyz D 70b) \-exz-eyz ez ) den sogenannten Trägheitstensor einführt Dabei sind Ox , Oy und Oz die Trägheitsmomente bezüglich der Koordinatenachsen und 0xy , Oxz und ßyz die Deviationsmomente bezüglich der Koordinatenachsen. ¦ B: Der Belastungszustand eines elastisch verformten Körpers wird durch den Spannungstensor /(Tu CTi2 <7i3\ <T = I 0-21 0-22 0-23 D.71) \ 031 ^32 OSs ) beschrieben. Die Elemente o^. (z, k = 1,2,3) werden wie folgt erklärt: In einem Punkt P des elastischen Körpers wählt man ein kleines ebenes Flächenelement, dessen Normale in Richtung der Xi-Achse eines rechtwinklig kartesischen Koordinatensystems zeigt Die Kraft pro Flächeneinheit auf dieses Element, die vom Material abhängt, ist ein Vektor mit den Koordinaten crn, 0\2 und a^. Analog werden die Komponenten bezüglich der übrigen zwei Achsenrichtungen erklärt.
272 4- Lineare Algebra 5. Rechenregeln 1. Elementare algebraische Operationen Die Multiplikation eines Tensors mit einer Zahl und die Addition und Subtraktion von Tensoren gleicher Stufe erfolgen komponentenweise analog zu den entsprechenden Operationen bei Vektoren und Matrizen 2. Tensorprodukt Die Tensoren A bzw B mit den Komponenten a^ bzw brs seien von der Stufe m bzw n . Dann bilden die 3m+n Skalare ckj rs = a>ij Ks D.72a) die Komponenten eines Tensors C der Stufe m + n. Man schreibt C = AB und spricht vom Tensorprodukt von Aund B. Es gelten Assioziativ- und Distributivgesetz (AB)C = A(BC), A{B + C) = AB + AC. D.72b) 3. Dyadisches Produkt Das Produkt zweier Tensoren 1 Stufe A = (ai, a2, a3) und B — (bi,b2,b3) ergibt einen Tensor 2. Stufe mit den Elementen Cij = aibj (ij = 1,2,3), D.73a) d.h., das Tensorprodukt stellt die Matrix /axbi aib2 aib3\ a2h a2b2 a2b3 D 73b) \a36i a3b2 a363/ dar. Diese wird auch als dyadisches Produkt der beiden Vektoren A und B bezeichnet. 4. Verjüngung Setzt man in einem Tensor der Stufe m (m > 2) zwei Indizes gleich und summiert über sie, so erhält man einen Tensor der Stufe m — 2 und spricht von einer Verjüngung des Tensors. ¦ Der 2stufige Tensor C von D 73a) mit Cy = a$j . der das Tensorprodukt der beiden Vektoren A = (ai, a2, a3) und B = F1} b2, b3) darstellt, wird über die Indizes i und j verjüngt, so daß man mit ah = a\b\+ a2b2 + a3b3 D 74) einen Skalar, also einen Tensor nullter Stufe erhält. Er stellt das Skalarprodukt der Vektoren A und B dar. 4.3.3 Tensoren mit speziellen Eigenschaften 4.3.3.1 Tensoren 2. Stufe 1. Rechenregeln Für Tensoren 2. Stufe gelten dieselben Rechenregeln wie für Matrizen Insbesondere läßt sich jeder Tensor Tals Summe eines symmetrischen und eines schiefsymmetrischen Tensors darstellen: l(T +T 2V- _T) + I(r-rT). D75a) Ein Tensor T = (Uj) heißt symmetrisch, wenn Uj = tji für alle i und j D 75b) gilt. Im Falle Uj = —tji für alle i und j D 75c) heißt er schief- oder antisymmetrisch. Dabei ist zu beachten, daß bei einem antisymmetrischen Tensor die Elemente in , t22 und £33 Null sind. Der Begriff der Symmetrie und Antisymmetrie läßt sich auch auf Tensoren höherer Stufe übertragen, wenn man diese Begriffe auf bestimmte Paare von Indizes bezieht 2. Hauptachsentransformation Zu einem symmetrischen Tensor T, d h für tßl/ = tUß , gibt es stets eine orthogonale Transformation D. so daß er nach der Transformation Diagonalform hat: (in 0 0\ f = 0 i22 0 D.76a) V 0 0 £33/
4 3 Tensoren 273 Die Elemente in , £22 und £33 heißen Eigenwerte des Tensors T. Sie sind gleich den Wurzeln Ai, A2 und A3 der Gleichung 3. Grades in A: I £11 — A £12 £13 I <2i *22 - A t23 = 0 D.76b) £31 £32 £33 — A I Die Spaltenvektoren dj, d2 und 6$ der Transformationsmatrix D heißen die zu den Eigenwerten gehörenden Eigenvektoren und genügen den Gleichungen Ti = A,i A/= 1,2,3). D.76c) Ihre Richtungen bezeichnet man als Hauptachsenrichtungen, die Transformation von Tauf die Diagonalform heißt Hauptachsentransformation. 4.3.3.2 Invariante Tensoren 1. Definition Ein kartesischer Tensor heißt invariant, wenn seine Komponenten in allen kartesischen Koordinatensystemen identisch sind. Da physikalische Größen wie Skalare und Vektoren, die Spezialfälle von Tensoren sind, nicht vom Koordinatensystem abhängen, in dem sie bestimmt werden, darf sich ihr Wert weder bei Verschiebung des Koordinatenursprunges (Translation) noch bei Drehung eines Koordinatensystems K ändern Man spricht von Translationsinvarianz und Drehungsinvarianz und allgemein von Transformationinvarianz. 2. Deltatensor Wählt man als Elemente Uj eines 2stufigen Tensors das KRONECKER-Symbol (s. 4.1.2,10., S. 261), dh ^H 5 sonsT'' D'77a) dann folgt aus dem Transformationsgesetz D 69b) im Falle einer Drehung des Koordinatensystems unter Beachtung von D.66c) inu = dßidvj = ößU , D.77b) d h , die Elemente sind drehungsinvariant Paßt man sie so in ein Koordinatensystem ein, daß sie unabhängig von der Wahl des Ursprungs, also auch translationsinvariant sind, dann bilden die Zahlen 6ij einen invarianten Tensor 2. Stufe, den sogenannten Deltatensor. 3. Epsilontensor Sind e*j, e} und e^ die Einheitsvektoren in Richtung der Achsen eines rechtwinkligen Koordinatensystems, dann gilt für das Spatprodukt (s 3.5.1 4,2., S. 190) {1, falls i, j, k zyklisch (Rechte-Hand-Regel), -1, falls i, j, k antizyklisch, D 78a) 0, sonst Das sind insgesamt 33 = 27 Elemente, die als Elemente eines 3stufigen Tensors aufgefaßt werden können Im Falle einer Drehung des Koordinatensystems folgt aus dem Transformationsgesetz D.67) iiO,ujO,pk^-ijk : U}j,i av\ Upi dß2 du2 dp2 dß3 du3 dp3 D.78b) d h., die Elemente sind drehungsinvariant. Paßt man sie so in ein Koordinatensystem ein, daß sie unabhängig von der Wahl des Ursprungs, also auch translationsinvariant sind, dann bilden die Zahlen e^ einen invarianten Tensor 3 Stufe, den sogenannten Epsilontensor 4. Tensorinvarianten Von den invarianten Tensoren muß man die Tensorinvarianten unterscheiden Letztere sind Funktionen von Tensorkomponenten, deren Form und deren Wert bei Drehung des Koordinatensystems gleichblei-
274 4- Lineare Algebra hl t\2 tis hl ^22 ^23 ^31 ^32 £33 = hl tl2 tl3 ^21 ^22 ^23 ^31 £32 £33 ben. ¦ A: Für die Spur des Tensors T = (Uj), der durch Drehung in T = (Uj) übergeht, gilt Sp(T) - tu + t22 + fo = £n + taa + £33 • D 79) Die Spur des Tensors T ist gleich der Summe der Eigenwerte (s. 4 1 2,4., S 260). ¦ B: Für die Determinante des Tensors T = (tij) gilt: D.80) Die Determinante des Tensors ist gleich dem Produkt der Eigenwerte. 4.3.4 Tensoren in krummlinigen Koordinatensystemen 4.3.4.1 Kovariante und kontravariante Basisvektoren 1. Kovariante Basis Durch den variablen Ortsvektor r = r(u,v,w) = x(u,v,w)ex + y(u,v,w)ey + z(u,v,w)ez D 81a) werden allgemeine krummlinige Koordinaten u,v,w eingeführt. Die zu diesem System gehörenden Koordinatenflächen erhält man, indem man in f(u, v, w) jeweils eine der unabhängigen Variablen u, v, w festhält Durch jeden Punkt des in Frage kommenden Raumteils gehen drei Koordinatenflächen, je zwei schneiden sich in Koordinatenlinien, die durch den betrachteten Punkt hindurchgehen. Die drei Vektoren dr_ df_ df_ D »IM du' dv'' dw zeigen in die Richtungen der Koordinatenlinien im betrachteten Punkt. Sie bilden die kovariante Basis des krummlinigen Koordinatensystems. 2. Kontravariante Basis Die drei Vektoren 1 f dr df\ 1 f dr df\ 1 f dr df\ D\dv~Xd^)' D\d^Xdu~)' D\du~Xdv') D82a) mit der Funktionaldeterminante \du dv dw) stehen im betrachteten Flächenelement jeweils auf einer der Koordinatenflächen senkrecht und bilden die sogenannte kontravariante Basis des krummlinigen Koordinatensystems. Hinweis: In orthogonalen krummlinigen Koordinaten, für die dr dr _ dr dr dr dr du dv ' du dw dv dw gilt, fallen die Richtungen der kovarianten und kontravarianten Basis zusammen 4.3.4.2 Kovariante und kontravariante Koordinaten von Tensoren 1. Stufe Um die EiNSTEiNsche Summenkonvention anwenden zu können, beschreibt man die kovarianten bzw kontravarianten Basisvektoren durch dr dr dr ^ = 91- ^ = 52- a^ = 93 bzw- (dr dr\ „, 1 f dr df\ ^9 1 f dr df^ ^ ' -('- dv dwI ' D \dw du) ' D \du dv
4 3 Tensoren 275 Die Darstellung eines Vektors v lautet dann V=V1g1 + V2ff2 + V3g3 = Vkgk bzw. v = V,gl + V2g2 + V3g3 D 85) Die Komponenten Vk werden als kontravariante Koordinaten, die Komponenten Vk als kovariante Koordinaten des Vektors v bezeichnet Zwischen diesen Koordinaten besteht der Zusammenhang Vk = gklVt bzw Vk = gklVl D.86a) mit 9ki = 9ik = 9k-9i bzw gkl = glk = gk • gl. D.86b) Weiterhin gilt mit dem KRONECKER-Symbol 9k-9l = hl, D.87a) und daraus folgt 9kl9im = 6km D 87b) Den Übergang von Vk zu Vk bzw von Vk zu Vk gemäß D.86b) beschreibt man als Heraufziehen bzw. Herunterziehen des Index durch Überschiebung Hinweis: In kartesischen Koordinatensystemen sind kovariante und kontravariante Koordinaten einander gleich 4.3.4.3 Kovariante, kontravariante und gemischte Koordinaten von Tensoren 2. Stufe 1. Koordinatentransformation In einem kartesischen Koordinatensystem mit den Basisvektoren e\ , e2 und e3 kann ein Tensor 2 Stufe Tals Matrix /tu tu t\3\ T = lt2i «ja «23 D 88) \^31 ^32 £33/ dargestellt werden Durch f = xi(ui,u2,U3)ei + x2(ui,u2,u3)e2 + x3(ui,u2,u3)e3 D.89) werden krummlinige Koordinaten u\, u2, u3 eingeführt. Die neue Basis werde mit gu g2 und g3 bezeichnet Es gilt df dx^ dx2^ dx3^ dxk^ gi = -z- = -5—ei + ^—62 + ^— e3 = -^—ek . D.90) OUi OUi OUi OUi OUi Setzt man e} = gl, dann können g\ und gl als kovariante und kontravariante Basisvektoren aufgefaßt werden 2. Lineare Vektorfunktion In einem festgelegten Koordinatensystem wird mit Hilfe des Tensors Tgemäß D.88) durch w = Tv D.91a) mit v = Vkgk = Vkgkl w = Wkgk = Wkgk D91b) eine lineare Beziehung zwischen den Vektoren v und w hergestellt Deshalb wird D.91a) auch als lineare Vektorfunktion bezeichnet 3. Gemischte Koordinaten Beim Übergang zu einem neuen Koordinatensystem geht D 91a) in w = tv D.92a)
276 4- Lineare Algebra k ~ a... *„ 'mn' D 93a) über. Dabei entsteht zwischen den Komponenten von Tund T der Zusammenhang ~ duk dxn tki = ö—-^—tmn D.92b) OXm ÖUi Man führt die Bezeichnung tu = T\ D.92c) ein und spricht von gemischten Koordinaten des Tensors, weil der Index k für kontravariant, der Index / für kovariant steht. Für die Komponenten der Vektoren {Tund w gilt dann Wk = Tfc yl D 92d) Ersetzt man die kovariante Basis gk durch die kontravariante Basis gk, dann erhält man analog zu D.92b) und D.92c) dxm dui duk dxn und D.92d) geht in Wk = TklVt . D.93b) über. Zwischen den gemischten Koordinaten Tk l und Tkt besteht der Zusammenhang T'^g^gmT^. D.93c) 4. Rein kovariante und rein kontravariante Koordinaten Setzt man in D.93b) für Vi die Beziehung Vi = gimV™ ein, so ergibt sich Wk = Tk lglmVm = TkmVm , D.94a) wenn man Tklgim = Tkm D.94b) setzt Die Tkm heißen rein kovariante Koordinaten des Tensors T, weil beide Indizes kovariant stehen Analog erhält man die rein kontravarianten Koordinaten Tkm = gml^ D 95j Explizite Darstellungen: dxmdxn kl duk du, Tkt = ——-^—tmn, D.96a) T =-—-—tmn. D.96b) ouk dui oxmdxn 4.3.4.4 Rechenregeln Neben den in 4 3 3.1,1., S. 272 bereits formulierten gelten die folgenden Rechenregeln- 1. Addition, Subtraktion Tensoren gleicher Stufe, deren einander entsprechende Indizes beide kovariant oder beide kontravariant stehen, werden koordinatenweise addiert oder subtrahiert und liefern einen Tensor der gleichen Stufe. 2. Multiplikation Die Multiplikation der Koordinaten eines Tensors n-ter Stufe mit denen eines Tensors ra-ter Stufe ergibt stets einen Tensor der Stufe m + n. 3. Verjüngung Setzt man in einem Tensor n-ter Stufe (n > 2) einen kovariant und einen kontravariant stehenden Index einander gleich und summiert entsprechend der ElNSTElNschen Summenkonvention über diesen Index, dann entsteht ein Tensor der Stufe n — 2 Diese Operation heißt Verjüngung. 4. Überschiebung Unter Überschiebung zweier Tensoren versteht man folgende Operation: Beide Tensoren werden multipliziert, und anschließend wird eine Verjüngung des Ergebnisses derart vorgenommen, daß die Indizes, nach denen verjüngt wird, verschiedenen Faktoren angehören 5. Symmetrie Ein Tensor heißt symmetrisch bezüglich zweier kovariant oder zweier kontravariant stehender Indizes, wenn er sich bei deren Vertauschung nicht ändert.
4.3 Tensoren 277 6. Schiefsymmetrie Ein Tensor heißt schiefsymmetrisch bezüglich zweier kovariant oder zweier kontravariant stehender Indizes, wenn er sich bei deren Vertauschung mit —1 multipliziert ¦ Der Epsilontensor (s 4 3 3.2,3., S 273) ist schiefsymmetrisch bezüglich zweier beliebiger kovarianter oder kontravarianter Indizes 4.3.5 Pseudotensoren In der Physik spielt häufig das Spiegelungsverhalten von Tensoren eine entscheidende Rolle. Wegen ihres unterschiedlichen Spiegelungsverhaltens unterscheidet man zwischen polaren und axialen Vektoren (s 3 5 1.1,2., S 185 obgleich sie mathematisch sonst völlig gleich zu behandeln sind. In ihrer Beschreibung unterscheiden sich polare und axiale Vektoren dadurch, daß axiale Vektoren neben ihrer Länge und Orientierung durch einen Drehsinn dargestellt werden können Axiale Vektoren werden auch Pseu- dovektoren genannt Da Vektoren als Tensoren aufgefaßt werden können, wurde allgemein der Begriff des Pseudotensors eingeführt 4.3.5.1 Punktspiegelung am Koordinatenursprung 1. Tensorverhalten bei Rauminversion 1. Begriff der Rauminversion Unter Rauminversion oder Koordinateninversion versteht man die Spiegelung der Ortskoordinaten von Raumpunkten am Koordinatenursprung In einem dreidimensionalen kartesischen Koordinatensystem bedeutet Rauminversion eine Umkehr der Vorzeichen der Koordinatenachsen: (*,!/,*)-(-s,-3/,-*) D.97) Dadurch wird ein rechtshändiges in ein linkshändiges Koordinatensystem überführt. Analoges gilt für andere Koordinatensysteme In Kugelkoordinaten ergibt sich (r. tf, ip) -> (-r, TT - tf, ip + tt) . D 98) Bei Spiegelungen dieser Art bleiben die Längen von Vektoren und die Winkel zwischen ihnen unverändert. Der Übergang wird durch eine lineare Transformation vermittelt 2. Transformationsmatrix Die Transformationsmatrix A = (aßl/) einer linearen Transformation im dreidimensionalen Raum gemäß D.64) hat bei Rauminversion die folgenden Eigenschaften- a>tiv = -öfu,, det A = -1 D.99a) Für die Komponenten eines Tensors n-ter Stufe folgt damit aus D 67) ißu , = (-1)%, P D.99b) Das bedeutet' Unter einer Punktspiegelung am Koordinatenursprung bleibt ein Tensor 0 Stufe, also ein Skalar, ungeändert, ein Tensor 1 Stufe, also ein Vektor, ändert sein Vorzeichen, ein Tensor 2. Stufe bleibt ungeändert, usw. Abbildung 4.3 2. Geometrische Deutung Die Realisierung der Rauminversion kann man sich in einem dreidimensionalen kartesischen Koordinatensystem geometrisch betrachtet in zwei Schritten vorstellen (Abb.4.3):
278 4 Lineare Algebra 1. Durch Spiegelung an einer Koordinatenebene, z.B. der x,2;-Ebene, geht das x, y, z-Koordinaten- system in das x, — y, ^-Koordinatensystem über. Ein rechtshändig orientiertes System (s. 3.5.3.1,2., S. 213) wird dabei in ein linkshändig orientiertes überführt. 2. Durch eine 180 °-Drehung des x, y, ^-Systems um die y-Achse entsteht das vollständig am Koordinatenursprung gespiegelte Koordinatensystem x,y,z. Es behält im Vergleich zum 1. Schritt seine Linkshändigkeit bei. Ergebnis: Bei Rauminversion ändert ein polarer Vektor seine Orientierung im Raum um 180 °, ein axialer Vektor behält seinen Drehsinn bei 4.3.5.2 Einführung des Begriffs Pseudotensor 1. Vektorprodukt bei Rauminversion Durch Rauminversion werden zwei polare Vektoren a und b in —a bzw —b überfuhrt, d.h., ihre Komponenten genügen der Transformationsformel D.99b) für Tensoren 1. Stufe. Betrachtet man dagegen das Vektorprodukt c = a x b als Beispiel eines axialen Vektors, dann erhält man bei Spiegelung am Koordinatenursprung c = c, d.h. eine Verletzung der Transformationsformel D 99a) für Tensoren 1. Stufe Deshalb wird der axiale Vektor c als Pseudovek- tor oder allgemein als Pseudotensor bezeichnet. ¦ Die Vektorprodukte rxv,rxF,'Vxv = rottf mit dem Ortsvektor r*, dem Geschwindigkeitsvektor v, dem Kraftvektor F und dem Nablaoperator V sind Beispiele für axiale Vektoren, die das „falsche" Spiegelungsverhalten besitzen. 2. Skalarprodukt bei Rauminversion Eine Verletzung der Transformationsformel D 99b) für Tensoren 1. Stufe ergibt sich auch für die Anwendung der Rauminversion auf ein Skalarprodukt aus einem polaren und einem axialen Vektor. Da das Ergebnis des Skalarprodukts ein Skalar ist und dieser in allen Koordinatensystemen denselben Wert besitzt, handelt es sich hierbei um einen besonderen Skalar, Pseudoskalar genannt, der die Eigenschaft besitzt, bei Rauminversion sein Vorzeichen zu ändern. Die Drehinvarianzeigenschaft des Skalars besitzt der Pseudoskalar nicht ¦ Das Skalarprodukt aus den polaren Vektoren f (Ortsvektor) bzw. v (Geschwindigkeitsvektor) mit dem axialen Vektor ü (Vektor der Winkelgeschwindigkeit) ergibt die Skalare f ¦ ü und v • ü), die das „falsche" Spiegelungsverhalten zeigen, also Pseudoskalare sind 3. Spatprodukt bei Rauminversion Das Spatprodukt (a x b) • c (s. 3 5.1.4,2., S. 190) aus den polaren Vektoren a, b und c ist gemäß B.) ein Pseudoskalar, da der Faktor (a x b) ein axialer Vektor ist. Das Vorzeichen des Spatproduktes ändert sich bei Rauminversion. 4. Pseudovektor und schiefsymmetrischer Tensor 2-. Stufe Das Tensorprodukt der axialen Vektoren a = (di, a2,a3)T und b = (&i,&2,&3)T ergibt gemäß D.72a) einen Tensor 2. Stufe mit den Komponenten Uj = aibj (z, j = 1,2,3). Da sich jeder Tensor 2. Stufe als Summe eines symmetrischen und eines schiefsymmetrischen Tensors 2. Stufe darstellen läßt, gilt wegen D.79) *»j = 9 (ai°j + aJ°i) + 9 (aibJ - afii) {h 3 = 1,2,3) D 100) Der schiefsymmetrische Anteil in D 100) ergibt bis auf den Faktor Ä gerade die Komponenten des Vektorprodukts (axb), so daß man den axialen Vektor c=(axb) mit den Komponenten ci, c2, c3 auch als schiefsymmetrischen Tensor 2. Stufe / 0 C12 Ci3 \ C23 = CL2h - 03^2 = Ci C =c= -C12 0 c23 I D.101a) mit c3i = a3bi - aib3 = c2 D.101b) \ -C13 -C23 0 / C12 = aib2 - a2bi = c3 auffassen kann, dessen Komponenten die Transformationsformel D.99b) für Tensoren 2 Stufe erfüllen Damit kann man jeden axialen Vektor (Pseudovektor oder Pseudotensor 1. Stufe) c = (ci, c2, c3)T als schiefsymmetrischen Tensor 2. Stufe Cauffassen, wobei gilt.
4 4 Lineare Gleichungssysteme 279 0 c3 -c2 -c3 0 ci c2 -Ci 0 D 102) 5. Pseudotensoren n-ter Stufe In Verallgemeinerung der Begriffe Pseudoskalar und Pseudovek- tor ist ein Pseudotensor n-ter Stufe dadurch gekennzeichnet, daß er sich unter einer reinen Drehung (Drehungsmatrix D mit detD = 1) wie ein Tensor n-ter Stufe verhält, sein Spiegelungsverhalten sich aber um einen Faktor —1 unterscheidet. Beispiele für Pseudotensoren höherer Stufe s. [4.2], 4.4 Lineare Gleichungssysteme 4.4.1 Lineare Systeme, Austauschverfahren 4.4.1.1 Lineare Systeme Ein lineares System besteht aus den m Linearformen Vi = o.nxi + aux2 + • • 2/2 = 021^1 + «22^2 + • • a2nxn + a2 bzw. y = Ax + a Dabei bedeuten. ~T OjffijiXji "T~ CIjt; D.103a) A = {a>u «12 021 a22 «In \ a2 fXl\ x2 y = (yi\ 2/2 D.103b) \ Ami <lm2 • • ' flmn / V Am / V ^n / \ 2/m / Die Elemente a^,, der Matrix A, die vom Typ (m, n) ist, und die Komponenten aM (/i = 1,2,..., m) des Spaltenvektors a sind konstant. Die Komponenten xu (y = 1,2, . , n) des Spaltenvektors x sind die unabhängigen, die Komponenten 2/M (/i, = 1,2, , m) des Spaltenvektors y die abhängigen Variablen. 4.4.1.2 Austauschverfahren 1. Austauschschema Wenn in D 103a) ein Element a^ von Null verschieden ist, dann kann in einem sogenannten Austauschschritt die Variable yi zur unabhängigen und die Variable Xk zur abhängigen Variablen gemacht werden. Der Austauschschritt ist das Grundelement des Austauschverfahrens, mit dessen Hilfe z B lineare Gleichungssysteme und lineare Optimierungsaufgaben gelöst werden können Der Austauschschritt wird mit Hilfe der Schemata 2/i 2/2 Vi ym xk Xl an Ö21 Otl flml «il X2 ' Ö12 • «22 * «i2 ' Gm2 " «i2 • • xk • • ölfc • • 0>2k ' • \ä*k\ ' ¦ dmk * ' • «ifc • • ^n ' &ln * &2n ^m ^ran ' «in 1 öl 02 &i Am «i 2/i 2/2 £fc 2/m Xl 1 «il «mi Z2 * «12 * «22 * «i2 • «m2 ' • 2/i • • «lfc * • «2fc ' ' «ifc ¦ ' «mfc * Xn • «In ' «2n * «in • Omn 1 «1 «2 «i «m D.104) durchgeführt, wobei das linke Schema dem System D.103a) entspricht. 2. Austauschregeln Das in dem linken Schema hervorgehobene Element a^ (aifc ^ 0) wird Pivotelement genannt, es steht im Schnittpunkt von Pivotspalte und Pivotzeile. Die Elemente a^u und aM des neuen rechten Schemas
280 4 Lineare Algebra werden nach den folgenden Austauschregeln bestimmt 1 1. 3. 4. dik = — , dik _ diu Q-iv i dik ™fj,v — Ußi/ OLi = diu dßk dik D di . dik = OyLv i d^ik^ D.105a) 2. d^k / aßk = — W ¦¦ dik 1, ..,m,/i^i (i/= l,2,...,n;^fc), D.105b) D 105c) Q!/i = fl/i + a^fcQj (für alle /i ^ z und alle v ^ k) D 105d) Zur Rechenerleichterung D Regel) werden die Elemente aiu dem Ausgangsschema als (m + l)-te Zeile (Kellerzeile) hinzugefügt. Mit Hilfe dieser Austauschregeln können weitere Variable ausgetauscht werden. 4.4.1.3 Lineare Abhängigkeiten Die Linearformen D 103a) sind genau dann linear unabhängig (s 9 1 2 3,2., S 518), wenn sich sämtliche y^ gegen unabhängige Variable xu austauschen lassen. Die lineare Unabhängigkeit wird z.B. für die Rangbestimmung bei Matrizen benötigt. Anderenfalls läßt sich die Abhängigkeitsbeziehung unmittelbar aus dem Schema ablesen. Nach 3 Austauschschritten (z.B ?/4 —? £4, 2/2 -> xu 2/i -» x3) erhält man: Wegen a32 = 0 ist kein weiterer Austausch möglich, und man kann die Abhängigkeitsbeziehung y3 = 2yi — 3t/2 + 10 ablesen Auch bei einer anderen Reihenfolge des Austausches wäre ein nicht austauschbares Paar von Variablen übriggeblieben. 4.4.1.4 Invertierung einer Matrix Im Falle einer nichtsingulären Matrix A vom Typ (n, n) erhält man nach n Austauschschritten, angewandt auf das System y = Ax, die inverse Matrix A_1. Vi y?. 2/3 2/4 Xi 2 1 1 0 X2 x3 X4 1 1 0 -100 5 2 0 2 0 1 1 -2 2 0 0 £3 X\ 2/3 £4 2/2 x2 2/1 2/4 -2-3 10 110 0 -3020 0-201 1 6 -2 10 0 ^35 1 245 a 22 2/1 2/2 2/3 X\ X2 X3 3 5 1 2 4 5 E 2 2 2/3 X2 X3 3 -1-5 yi 2 0 00 ' x3 1 -2 -2 xi 2/3 x2 2/2 13 1-11-5 -2 0 1' 5 -2 -2 £2 2?3 X\ 2/3 13 -2 -21 2/1 -1 0 2 2/2 -5 1 8 Nach dem Ordnen der Elemente erhält man A l = 2 8 -21 -1 -5 13 0 1 -2 4.4.2 Lösung linearer Gleichungssysteme 4.4.2.1 Definition und Lösbarkeit 1. Lineares Gleichungssystem Ein System von m linearen Gleichungen mit n Unbekannten Xi, x2,..., xn anxi + d\2x2 + a2\X\ + 022^2 + + d\nxn = öi + d2nxn = a2 bzw. in Kurzform Ax = a, D 106a) dmiXi + am2x2 + • • • + dmnxn = a,
4-4 Lineare Gleichungssysteme 281 heißt ein lineares Gleichungssystem. Dabei bedeuten. /an ai2 Ö21 «22 •• «2n «2 ^2 D.106b) Vflmi «m2 • • • amn) \am/ \xnJ Je nachdem, ob der Spaltenvektor a verschwindet (a = 0), oder nicht (a ^ 0), spricht man von einem homogenen bzw. inhomogenen Gleichungssystem. Die Elemente a^u der sogenannten Koeffizientenmatrix A sind die Koeffizienten des Systems, während die Komponenten aß des Spaltenvektors a seine Absolutglieder sind. 2. Lösbarkeit eines linearen Gleichungssystems Ein lineares Gleichungssystem heißt lösbar, wenn wenigstens ein Vektor x = a existiert, der D 106a) zu einer Identität macht Anderenfalls heißt das System unlösbar. Das Lösungsverhalten hängt vom Rang der erweiterten Matrix (A, a) ab. Letztere entsteht durch Hinzufügen der Komponenten des Vektors a als (n + l)-te Spalte zur Matrix A. Es gilt: 1. Allgemeine Regel für das inhomogene System Das inhomogene System Ax = a ist genau dann lösbar, wenn Rg(A) = Rg(A,a), D 107a) ist. Für r = Rg (A) gilt die folgende Fallunterscheidung: a) Für r = n ist die Lösung eindeutig, D.107b) b) für r < n ist die Lösung nicht eindeutig, D 107c) dh,n-r Unbekannte können als Parameter frei gewählt werden ¦ A: Die Matrix A hat den Rang 2, die erweiterte Koeffizientenmatrix (A,a) den Rang 3, d.h., das System ist unlösbar. x\ - 2x2 + 3£3 3xi - x2 + 5x3 2xi + x2 + 2x3 ¦ B: xi - x2 + 2x3 = 1 x\ — 2x2 — x3 = 2 3xi — x2 + 5x3 = 3 -2xx + 2x2 + 3x3 = -4 ¦ C: Xi - X2 + X3 - X4 = X\ — X2 — X3 + X4 = x\ — x2 — 2x3 + 2x4 = - £4 + 2x5 = 2 3x4 — x5 = 6 2^4 — 3^5 = 8 Die Matrizen A und (A,a) haben beide den Rang 3 Wegen r = n = 3 ist die Lösung eindeutig. Sie lautet: x\ = ip, x2 = -\, x3 = -7. Die Matrizen A und (A,a) haben beide den Rang 2. Das System ist lösbar, aber wegen r < n nicht eindeutig Man kann n — r = 2 Unbekannte als freie Parameter wählen und erhält z.B.- x2 = X\ — k , x3 = x4 + k {x\, X4 beliebig) Die Anzahl der Gleichungen stimmt mit der Anzahl der Unbekannten überein, aber das System ist wegen Rg (A) = 2 , Rg (A , a) = 3 unlösbar. ¦ D: xi + 2x2 - x3 + X4 = 1 2xi — x2 + 2x3 + 2x4 = 2 3xi + x2 + £3 + 3^4 = 3 £1 - Sx2 4- 3x3 + £4 = 0 2. Triviale Lösung und Fundamentalsystem des homogenen Systems a) Das homogene Gleichungssystem Ax = 0 besitzt stets die sogenannte triviale Lösung xi = x2 = .. = xn = 0. D 108a) b) Besitzt es eine nichttriviale Lösung x =a =(a1}a2j • )ön)T > d.h. a^Q, dann ist auch x = ka mit k beliebig reell eine Lösung des homogenen Gleichungssystems. Besitzt es / nichttriviale, linear un-
282 4- Lineare Algebra abhängige Lösungen c*i, a2 ,. •, QU , dann bilden diese ein sogenanntes Fundamentalsystem (s 9.1 2.3, 2., S 518), und die allgemeine Lösung des homogenen linearen Gleichungssystems ist von der Form x = kiQLi 4- k2QL2 H \~ hOLi (h,k2,. , h beliebig reell) D.108b) Gilt für den Rang der Koeffizientenmatrix A des homogenen Gleichungssystems r < n, wobei n die Anzahl der Unbekannten ist, dann besitzt das homogene Gleichungssystem ein Fundamentalsystem von Lösungen. Im Falle r = n hat das homogene System nur die Triviallösung Zur Bestimmung eines Fundamentalsystems im Falle r < n können n — r Unbekannte als freie Parameter gewählt werden, und zwar derart, daß sich die übrigen Unbekannten durch diese ausdrücken lassen, d.h., die entsprechende r-reihige Unterdeterminante darf nicht Null sein Man kann das durch Umordnen der Gleichungen und Unbekannten erreichen. Erhält man z B X\ = XiCJr+i, Xr+2i • • • 5 xn) x2 — x2\xr+\i xr+2, • • • i xn) , D.109) dann ergeben sich die Fundamentallösungen z.B. durch die folgende Wahl der freien Parameter. xr+l xr+2 xr+3 ' ' ' xn 1 Fundamentallösung. 1 0 0 • • • 0 2. Fundamentallösung 0 1 0 ••• 0 D 110) (n — r)-th Fundamentallösung 0 0 0 • • • 1 ¦ E: Der Rang der Matrix A ist gleich 2 Das Gleichungssystem läßt sich x\ — x2 + 0x3 — X4 = U nacn Xl unci x<2 auflösen, und man erhält x\ = — 4^3 — x4, x2 = nx3 — X\ -\- x2 — 2x% + 3^4 = 0 Q _ 3a;i— x2 + 8#3 + X4 — 0 2x4 (x3,x4 beliebig) Fundamentallösungen sind ax = (—4,i,l,0)T x, + 3x2 - 9x3 + 7x4 = 0 und a2 = {-\, -2,0,1)T 4.4.2.2 Anwendung des Austauschverfahrens 1. Zuordnung eines Systems linearer Funktionen Zur Lösung von D.106a) wird dem linearen Gleichungssystem Ax = a ein System linearer Funktionen y = Ax — a zugeordnet, auf das das Austauschverfahren (s 4 4 1 2, S 279) anzuwenden ist: Ax = a D 111a) ist äquivalent zu y = Ax - a = 0 D 111b) Die Matrix A ist vom Typ (m, n), a ist ein Spaltenvektor mit rn Komponenten, d.h , die Anzahl m der Gleichungen muß nicht mit der Anzahl n der Unbekannten übereinstimmen. Nach Abschluß des Austauschverfahrens wird y = 0 gesetzt Das Lösungsverhalten von Ax = a kann unmittelbar aus dem letzten Austauschschema abgelesen werden 2. Lösbarkeit des linearen Gleichungssystems Das lineare Gleichungssystem D lila) ist genau dann lösbar, wenn für das zugeordnete System linearer Funktionen D.111b) einer der folgenden zwei Fälle gilt. 1. Fall: Alle yß(fj, = 1,2,..., m) lassen sich gegen gewisse xv austauschen. Das bedeutet, das zugehörige System linearer Funktionen ist linear unabhängig. 2. Fall: Mindestens ein ya ist nicht mehr gegen ein xv austauschbar, d h , es gilt Va = Ai2/i + X2V2 + • • • + XmVm + A0 , D.112) und es ist A0 = 0 Das bedeutet, das zugehörige System linearer Funktionen ist linear abhängig.
4 4 Lineare Gleichungssysteme 283 3. Unlösbarkeit des linearen Gleichungssystems Das lineare Gleichungssystem ist unlösbar, wenn sich im voranstehenden 2. Fall Ao ^ 0 ergibt. Dann enthält das System einen Widerspruch. ¦ X\ — 2^2 + 4^3 ~ X4 = 2 —3xx 4- 3x2 — 3x3 + 4x4 = 3 2xi — 3^2 + 5x3 — 3x4 = —1 3/1 3/2 2/3 Xi 1 -3 2 £2 -2 3 -3 x3 x4 4 -1 -3 4 5 -3 1 -2 -3 1 Nach 3 Austauschschritten (z.B. y\ ys —> X4,2/2 —> £2) erhält man: Xi, Xi £2 X4 3/1 3 2 1 ~2 3 5 3/2 £3 -3 2 -i 3 -io 3/3 5 ~2 1 ~2 3 ~2 1 1 -2 3. Das Verfahren endet mit dem 1. Fall: 2/1,2/2, 3/3 und x3 sind unabhängige Variable. Man setzt y\ = 3/2 = 3/3 — 0, und xs = t (—00 < t < 00) ist ein Parameter. Damit lautet die Lösung X\ = 2t + 1, x2 = 3t — 2 , X3 = t, X4 = 3 4.4.2.3 Cramersche Regel In dem wichtigen Spezialfall, in dem die Anzahl der Unbekannten mit der Anzahl der Gleichungen des Systems anXi + 012X2 + • 021X1 + 022^2 + • 1 &ln%n ' + a2nxn CLi a2 D.113a) aniXi + on2x2 H h annxn = an übereinstimmt und die Koeffizientendeterminante D = det A nicht verschwindet, d h D = detA^0, D.113b) kann die Lösung des inhomogenen Gleichungssystems D.113a) explizit und eindeutig angegeben werden Di __ D2 Dn *i = -, x2 = -, xn = -. D.113c) Mit D„ wird die Determinante bezeichnet, die aus D dadurch entsteht, daß die Elemente aßU der i/-ten Spalte von D durch die Absolutglieder aM ersetzt werden, z.B. D2 = an ai öi3 «21 Ö2 #23 • * «In •• a2n D.113d) I önl ön ön3 Ist D = 0 und sind nicht alle D„ = 0, dann ist das System D.113a) unlösbar Im Falle D = 0 und D„ = 0 für alle v = 1,2,.. , n, d.h., D und alle D„ sind gleich Null, ist es möglich, daß eine Lösung existiert Diese ist aber nicht eindeutig (s Hinweis S. 283). 2xi 1 = 13, + x2 + 3x3 = 9 xi - 2x2 + x3 = -2. 3xi + 2x2 + 2x3 = 7 9 1 31 Dj = |-2 -2 1 = -13, 7 22 D = 2 1 3 1 -2 1 3 2 2 93 -2 1 72 = 26, D3 = 2 1 9 1 -2 -2 3 2 7 = 39. Das System hat die eindeutige Lösung xx = Di D 1 D2 o D3 o -l,X2 = - = 2,x3 = - = 3. Hinweis: Für die praktische Lösung von linearen Gleichungssystemen höherer Dimensionen ist die
284 4 Lineare Algebra CRAMERsche Regel nicht geeignet Der Rechenaufwand übersteigt mit wachsender Dimension sehr schnell alle Vorstellungen Deshalb verwendet man zur numerischen Lösung linearer Gleichungssysteme den GAUSSschen Algorithmus bzw das Austauschverfahren oder iterative Methoden (s 19.1.1, S. 911). 4.4.2.4 Gaußscher Algorithmus 1. Gaußsches Eliminationsprinzip Zur Lösung des linearen Gleichungssystems Ax = a D.106a) von m Gleichungen mit n Unbekannten kann das GAUSS sehe Eliminationsprinzip angewendet werden. Es besteht darin, mit Hilfe einer Gleichung eine Unbekannte aus den restlichen Gleichungen zu entfernen Dadurch entsteht ein System von m — 1 Gleichungen und n — \ Unbekannten Dieses Prinzip wird entsprechend oft angewendet, bis ein sogenanntes gestaffeltes Gleichungssystem entstanden ist, aus dem dann die Lösung bzw. das Lösungsverhalten des Ausgangssystems einfach ermittelt bzw abgelesen werden kann. 2. Gauß-Schritte Der erste GAUSS-Schritt wird an der erweiterten Koeffizientenmatrix (A, a) demonstriert (s. 19 1 1, S 911) Es sei an^O, wenn nicht, dann werden entsprechende Gleichungen vertauscht. In der Matrix &21 a22 Ö2n a2 D.114a) \öml Öm2 ••• 0<mn\amJ werden die Glieder der 1 Zeile der Reihe nach mit — %& . — ^L gebnisse zur 2 > 3 ,. , ra-ten Zeile addiert Die umgeformte Matrix hat dann die Form a , ö- > • • • j ~~ ^^ multipliziert und die Er- /öll Al2 ' 0 a'22 V 0 a'm Gin öl }\ °LI D 114b) Die (r - l)-malige Anwendung dieses GAUSS-Schrittes liefert / an ^ 0N 0~ 0 Al2 a22 \0 0 0 Al3 • a23 • a33 • urr \ ° 1) ßl,r+l a2,r+l • n" a3,r+l „(r-1) ar,r+l 0 ain • a2n a'L rtnl) 0 0 0 0 0 0 a(»-l) / D.115) 3. Lösungsverhalten GAUSS-Schritte sind elementare Umformungen, durch die der Rang der Matrix (A, a) und damit auch die Lösung und das Lösungsverhalten des Systems nicht geändert werden. Aus D 115) liest man für das zu lösende inhomogene lineare Gleichungssystem ab: 1. Fall: Das System ist unlösbar, wenn eine der Zahlen a^x , aJ.+~2 \ • > am~^ von Null verschieden ist 2. Fall: Das System ist lösbar, wenn gilt aj.7^ = a^2 = • = ßm-1' = 0 Weiterhin ist zu unterscheiden
4 4 Lineare Gleichungssysteme 285 a) r = n: Die Lösung ist eindeutig. b) r < n. Die Lösung ist nicht eindeutig; n — r Unbekannte sind als Parameter frei wählbar Im Falle der Lösbarkeit werden die Unbekannten sukzessiv, mit der letzten Gleichung beginnend, aus dem gestaffelten Gleichungssystem, das zu D 115) gehört, bestimmt ¦ A: xi + 2x2 + 3x3 + 4x4 = -2 Nach drei GAUSS- 2xi + Sx2 + 4x3 + x4 = 2 Schritten hat die er- 3xi + 4x2 + x3 + 2x4 = 2 weiterte Koeffizienten- 4xi + x2 + 2x3 + 3x4 = -2 matrix die Form Die Lösung ist eindeutig, und aus dem zugehörigen gestaffelten linearen Gleichungssystem folgt x\ = 0 , x2 = 1, x3 = 0 , X4 = — 1. -xi - 3x2 - 12x3 = -5 /-l -3 -12 -xi + 2x2 + 5x3 = 2 Nach zwei GAUSS-Schritten 5x2 + 17x3 = 7 hat die erweiterte Koeffizi- 3xi — x2 + 2x3 = 1 entenmatrix die Form 7xi — 4x2 — x3 = 0 0 5 17 0 0 0 0 0 0 V 0 0 0 0 0 Eine Lösung existiert, aber sie ist nicht eindeutig. Man kann eine Unbekannte als freien Parameter wählen, z B. x3 = t (—oo < t < oo), und erhält X\ = $ — ¥t, x2 = t — ^J-t, X3 = t. 4.4.3 Überbestimmte lineare Gleichungssysteme 4.4.3.1 Überbestimmte lineare Gleichungssysteme und lineare Quadratmittelprobleme 1. Überbestimmte Gleichungssysteme Das lineare Gleichungssystem Ax = b D.116) besitze eine rechteckige Koeffizientenmatrix A = (a^) mit z = 1,2,. .,m; j = 1,2, .. ,n, m > n. Die Matrix A und der Vektor b = F1, b2,..., bm)T der rechten Seite seien bekannt Gesucht sei der Vektor x = (#1,0:2, ,#n)T Wegen m > n spricht man von einem überbestimmten System. Sein Lösungsverhalten und gegebenenfalls seine Lösung können z B. mit dem Austauschverfahren bestimmt werden 2. Lineares Quadratmittelproblem Wenn D.116) das mathematische Modell eines praktischen Vorganges darstellt (A, b und x reell), dann werden auf Grund von Meßfehlern oder anderen Fehlern die einzelnen Gleichungen von D 116) nicht exakt erfüllbar sein, sondern es wird sich ein Restvektor r = (ri? r2, , rm)T mit r = Ax-b, r^O D117) ergeben In diesem Falle wird man x so bestimmen, daß £rf = rTr = (Ax - b)T(Ax - b) = min D.118) gilt, d h., daß die Fehlerquadratsumme minimal wird Dieses Prinzip geht auf GAUSS zurück. Man bezeichnet D 118) auch als lineares Quadratmittelproblem. Die Norm ||r|| = VlTI des Restvektors r heißt Residuum. 3. Gauß-Transformation Der Vektor x ist genau dann eine Lösung von D.118), wenn der Restvektor r orthogonal zu allen Spalten von A ist Das bedeutet. ATr = AT(Ax-b) = 0 oder ATAx = ATb D 119)
286 4 Lineare Algebra Die Gleichung D.119) stellt ein lineares Gleichungssystem mit quadratischer Koeffizientenmatrix dar Es wird als System der Normalgleichungen bezeichnet Seine Dimension ist n Den Übergang von D 116) zu D.119) nennt man GAUSS -Transformation. Die Matrix ATA ist symmetrisch Hat die Matrix A den Rang n (wegen m > n spricht man in diesem Falle von Vollrang), dann ist die Matrix ATA positiv definit und insbesondere regulär, d.h., das System der Normalgleichungen hat bei Vollrang von A eine eindeutige Lösung. 4.4.3.2 Hinweise zur numerischen Lösung linearer Quadratmittelprobleme 1. Cholesky-Verfahren Wegen der Symmetrie und positiven Definitheit von AT A im Falle des Vollranges von A bietet sich zur Lösung des Normalgleichungssystems das Cholesky-Verfahren an (s. 19.2.1.2, S. 920).Leider handelt es sich dabei um einen numerisch instabilen Algorithmus, der sich jedoch bei Problemen mit „großem" Residuum ||r|| und „kleiner" Lösung ||x|| numerisch gutartig verhält 2. Householder-Verfahren Numerisch gutartige Verfahren zur Lösung linearer Quadratmittelprobleme stellen die Orthogonahsie- rungsverfahren dar, die auf einer Faktorisierung A = QR beruhen. Zu empfehlen ist das HOUSEHOLDER- Verfahren, bei dem Q eine orthogonale Matrix vom Typ (m, m) und R eine Dreiecksmatrix vom Typ (ra,n) (s. 4.1.2,11., S. 261) ist. 3. Regulärisiertes Problem Im rangdefizienten Fall, d.h., wenn Rg (A) < n ist, kann das Normalgleichungssystem nicht mehr eindeutig gelöst werden, und auch die Orthogonalisierungsverfahren liefern unbrauchbare Ergebnisse. Dann geht man an Stelle von D.118) zu dem sogenannten regularisierten Problem rTr + axTx = min! D 120) über Dabei ist a > 0 ein Regularisierungsparameter Die Normalgleichungen zu D 120) lauten: (ATA + «E)x = ATb D.121) Die Koeffizientenmatrix dieses linearen Gleichungssystems ist für a > 0 positiv definit und insbesondere regulär, aber die Wahl eines geeigneten Regularisierungsparameters a ist ein schwieriges Problem (s. [4.7]). 4.5 Eigenwertaufgaben bei Matrizen 4.5.1 Allgemeines Eigenwertproblem A und B seien zwei quadratische Matrizen vom Typ (n, n). Ihre Elemente können reelle oder komplexe Zahlen sein Die Aufgabe, Zahlen A und zugehörige Vektoren x^O mit Ax = ABx, D 122) zu bestimmen, wird als allgemeines Eigenwertproblem bezeichnet. Die Zahl A heißt Eigenwert, der Vektor x Eigenvektor Ein Eigenvektor ist lediglich bis auf einen Faktor bestimmt, da mit x auch ex (c = const) Eigenvektor zu A ist. Der Spezialfall B = E, wobei E eine n-reihige Einheitsmatrix ist, d h Ax = Ax bzw (A-AE)x = 0, D 123) wird als spezielles Eigenwertproblem bezeichnet. Dieses tritt in vielen Anwendungen auf, vorwiegend mit symmetrischer Matrix A, und wird im folgenden ausführlich dargestellt Bezüglich des allgemeinen Eigenwertproblems muß auf die Spezialliteratur verwiesen werden (s [4.1]) 4.5.2 Spezielles Eigenwertproblem 4.5.2.1 Charakteristisches Polynom Die Eigenwertgleichung D.123) stellt ein homogenes lineares Gleichungssystem dar, das genau dann nichttriviale Lösungen x^O besitzt, wenn gilt det (A - AE) = 0 D 124a)
4-5 Eigenwertaufgaben bei Matrizen 287 Durch Entwicklung von det (A — A E) =0 ergibt sich det(A-AE) = an - «21 - A ai2 «22- Ö13 • - A Ü23 • • • O'ln ' * Ö2n ,-A I önl O'n'l «n3 ' = pn(\) = (-l)nAn + an-xX1-1 + • • • + aiA + a0 = 0 D.124b) Die Eigenwertbedingung entspricht somit einer Polynomgleichung. Sie wird charakteristische Gleichung genannt; das Polynom Pn{\) heißt charakteristisches Polynom. Seine Nullstellen sind die Eigenwerte der Matrix A Damit gilt für eine beliebige quadratische Matrix A vom Typ (n, n): 1. Fall: Die Matrix A(n>n) besitzt genau n Eigenwerte Ai, A2, ..., An , denn ein Polynom vom Grade n hat n Nullstellen, wenn diese entsprechend ihrer Vielfachheit gezählt werden. Die Eigenwerte von nichtsymmetrischen Matrizen können komplex sein. 2. Fall: Sind die n Eigenwerte der Matrix A(n>n) sämtlich verschieden, dann existieren genau n linear unabhängige Eigenvektoren x^ als Lösungen des Gleichungssystems D.123) mit A = A* 3. Fall: Ist A* ein r^-facher Eigenwert und hat die Matrix A(njn) — A*E den Rang r^, dann ist die Zahl der linear unabhängigen Eigenvektoren, die zu Aj gehören, gleich dem sogenannten Rangabfall n — ri. Es gilt 1 < n - Ti < rii, d.h , zu einer reellen oder komplexen quadratischen Matrix A(n>n) gibt es mindestens einen und höchstens n reelle oder komplexe linear unabhängige Eigenvektoren. / 2-3 1\ 12 — A —3 II ¦ A: 3 1 3 , det (A - AE) = 3 1 - A 3 = -A3 - A2 + 2A = 0 V-5 2-4/ I -5 2 —4 — AI Die Eigenwerte sind Ai = 0, A2 = 1, A3 = — 2 Die Eigenvektoren werden aus den zugehörigen homogenen linearen Gleichungssystemen bestimmt. • Ai = 0: 2xi - 3a;2 + £3 = 0 . 3xi + x2 + 3:r3 = 0 -5zi + 2x2 - 4x3 = 0 Man erhält z.B. nach dem Austauschverfahren X\ beliebig, x2 ( 10> Man wählt X\ = 10 und erhält den Eigenvektor Xi = Ci \ 3 V-ii, ist • A2 = 1 Das zugehörige homogene System ergibt £3 beliebig, x2 = 0, x\ wählt xs = 1 und erhält den Eigenvektor X2 = C2 ( 0 J , wobei C2 eine beliebige Konstante ist. ^^15^3 -2xx + 3x2 -Tu3*' , wobei C\ eine beliebige Konstante 3^2 — X3 = —xs. Man • A3 4 3*2, X3 ¦¦ -4xi + Sx2 = - \x2. -2: Das zugehörige homogene System ergibt x2 beliebig, X\ ( 4N Man wählt x2 = 3 und erhält den Eigenvektor X3 = C3 I 3 ] , wobei C3 eine beliebige Konstante ist. / 30-l> ¦ B: 14 1 V-10 3) Die Eigenwerte sind Ai = 2, A2 = A3 = 4. • A2 = 2: Man erhält x3 beliebig, x2 = —x3,Xi = x3 und wählt z.B. rr3 = 1. Damit lautet der erste Eigenvektor Xi = C\ ( —1 ] , wobei C\ eine beliebige Konstante ist. det (A - AE) = ¦A 0-1 14-A 1 -1 03-A = -A3 + 10A2-32A + 32 = 0.
288 4 Lineare Algebra • X2 — A3 = 4. Man erhält x2, X3 beliebig, X\ = —X3 Zwei linear unabhängige Eigenvektoren ergeben sich z.B. für x2 = 1, £3 = 0 und x2 = 0, Xs = 1: X2 = C2 1 , X3 = C3 0 , wobei C2, C3 beliebige \o/ V 1/ Konstanten sind. 4.5.2.2 Reelle symmetrische Matrizen, Ahnlichkeitstransformationen Für das spezielle Eigenwertproblem D.123) gelten im Falle einer reellen symmetrischen Matrix A die folgenden Aussagen* 1. Eigenschaften bezüglich des Eigenwertproblems 1. Anzahl der Eigenwerte Die Matrix A hat genau n reelle Eigenwerte Aj (i = 1,2,..., n), die entsprechend ihrer Vielfachheit zu zählen sind 2. Orthogonalität der Eigenvektoren Die zu verschiedenen Eigenwerten A; ^ \j gehörenden Eigenvektoren x* und x^ sind orthogonal, d.h., es gilt xjx,- =0 D 125) 3. Matrix mit p-fachem Eigenwert Zu einem p-fachen Eigenwert A = Ai = A2 = ... = Ap existieren p linear unabhängige Eigenvektoren xx, x2, ¦ •»2^, • Wegen D.123) sind auch alle nichttrivialen Linearkombinationen Eigenvektoren zu A Davon können p mit Hilfe des GRAM-SCHMiDTschen Orthogonalisierungsverfahrens ausgewählt werden, die orthogonal sind Insgesamt gilt Die Matrix A besitzt genau n reelle orthogonale Eigenvektoren. /011\ ¦ A= 1 0 1 , det(A-AE) = -A3 + 3A + 2 = 0. Die Eigenwerte sind Ai = A2 = -lundA3 = 2. Vi 10/ • Ai = A2 = — 1: Aus dem zugehörigen homogenen Gleichungssystem erhält man x\ beliebig, x2 beliebig, xs = —x\ — x2 Man wählt x\ = 1, x2 = 0 und x\ = 0, x2 = 1 und erhält die beiden linear ( l\ f °\ unabhängigen Eigenvektoren xx = C\ I 0 und x2 = C2\ 1 ) , wobei C\ und C2 beliebige Konstanten sind \— / \— / • A3 = 2 Man erhält x\ beliebig, x2 = x\, x3 = x\, wählt z B x\ = 1 und erhält den Eigenvek- tor X3 = C3 1 , wobei C3 eine beliebige Konstante ist. Die Matrix A ist symmetrisch, die zu den w verschiedenen Eigenwerten gehörenden Eigenvektoren sind orthogonal 4. Gram-Schmidtsches Orthogonalisierungsverfahren Es sei Vn ein beliebiger n-dimensionaler EUKLlDischer Vektorraum Die Vektoren x1}x2, • • • ,xn € Vn seien linear unabhängig Dann existiert ein Orthogonalsystem von Vektoren y_1?y2, • >yn ^ Ki > das auf folgende Weise konstruiert werden kann. y1=xl,yk = xk-Y.T^]=iyi (* = 2,3,...,n). D126) Hinweise: 1. Mit (xfc , y .) wird das Skalarprodukt der Vektoren x^ und y . bezeichnet 2. Zu dem Orthogonalsystem der Vektoren y 1, y 2, , y erhält man das Orthonormalsystem x x, x 2, y y y . ,xn durch Xi = t=*j , x2 = -rg^r-,.. , xn = -g^- , wobei mit ||y.|| = ^/(y^y^) die Eu- KLiDische Norm des Vektors y . bezeichnet wird
4-5 Eigenwertaufgaben bei Matrizen 289 ¦Xl = Yj = Xi y3 = ^' /°\ (:)• (¦? -(!. (x3. x2= 1 \ ,- ^\ / (oj,X3=( 1 /°> und x i = —7= 1 y^ (x3,y2) ^2' y.2' a\ .!)¦ 1 h* .-1 Daraus 2 = ^2- f 2/3 \ 2/3 ^-2/3/ folgt (Xi< und: ^3 = ^( -1/2 ) undx2 = ^= ( -1 1/2/ ^V ly 1 -1 2. Hauptachsentransformation, Ähnlichkeitstransformation Zu jeder reellen symmetrischen Matrix A gibt es eine orthogonale Matrix U und eine Diagonalmatrix Dmit A = UDUT. D.127) Dabei sind die Diagonalelemente von D die Eigenwerte von A, und die Spalten von U sind die dazugehörigen normierten Eigenvektoren. Aus D.127) folgt unmittelbar D = UTAU D.128) Man bezeichnet D 128) als Hauptachsentransformation Auf diese Weise wird A in die Diagonalform überfuhrt (s. auch 4.1.2,2., S 260). Wird die quadratische (nicht notwendig symmetrische) Matrix A mit Hilfe der regulären quadratischen Matrix G nach der Vorschrift G^AG = Ä D.129) transformiert, dann spricht man von einer Ahnlichkeitstransformation. Die Matrizen A und A heißen ähnlich, und es gilt- 1. Die Matrizen A und A haben dieselben Eigenwerte, d.h , bei einer Ahnlichkeitstransformation ändern sich die Eigenwerte nicht. 2. Ist A symmetrisch, dann ist auch A symmetrisch, falls G orthogonal ist: Ä = GTAG mit GTG = E D.130) Die Beziehung D.130) heißt orthogonale Ahnlichkeitstransformation. Bei ihr bleiben Eigenwerte und Symmetrie erhalten. In diesem Zusammenhang besagt D.128), daß eine symmetrische Matrix A orthogonal ähnlich auf die reelle Diagonalform D transformiert werden kann. 4.5.2.3 Hauptachsentransformation quadratischer Formen 1. Reelle quadratische Form, Definition Eine reelle quadratische Form Q in den Variablen £1, £2,. • , xn hat die Gestalt n n Q = X^ S aijxixj = xTAx D 131) Dabei ist x = (x\, x2, .., xn)T der Vektor der Variablen, und A = {aij) ist eine reelle symmetrische Matrix. Die Form Q heißt positiv definit oder negativ definit, wenn sie nur positive bzw. nur negative Werte annehmen kann und den Wert Null nur für das einzige Wertesystem X\ = X2 = .. = xn = 0 annimmt Die Form Q heißt positiv oder negativ semidefinit, wenn sie nur Werte desselben Vorzeichens, den Wert Null aber auch für ein nicht durchweg verschwindendes Wertesystem annehmen kann. Entsprechend dem Verhalten von Q wird auch die zugehörige reelle symmetrische Matrix A als positiv oder negativ definit bzw semidefinit bezeichnet.
290 4- Lineare Algebra 2. Reelle positiv definite quadratische Form, Eigenschaften 1. In einer reellen positiv definiten quadratischen Form Q sind alle Hauptdiagonalelemente der zugehörigen reellen symmetrischen Matrix A positiv, d h , es ist aü>0 (i = l,2,...,n). D.132) Für die positive Definitheit stellt D.132) eine notwendige Bedingung dar. 2. Eine reelle quadratische Form Q ist genau dann positiv definit, wenn sämtliche Eigenwerte der zugehörigen Matrix A positiv sind 3. Eine reelle quadratische Form Q = xTAx , deren zugehörige Matrix A den Rang r hat, kann durch die lineare Transformation x = Cx D 133) in eine Summe rein quadratischer Glieder, die sogenannte Normalform r Q = xTKx = Y,Pi£i2 mit fa = (signAOk) D 134) »=i und beliebig vorgegebenen positiven Werten k\, k2, ... ,kr überführt werden Hinweis: Unabhängig davon, wie eine reelle quadratische Form D.131) vom Rang r durch eine reelle nichtsinguläre Transformation D.133) in die Normalform D.134) überführt wird, bleibt neben der Rangzahl r auch die Anzahl p der positiven und damit auch die Anzahl q — r —p der negativen Koeffizienten ki der Normalform unverändert (Trägheitsgesetz von Sylvester). Die Zahl p heißt Trägheitsindex der quadratischen Form. 3. Erzeugung der Normalform Die praktische Durchführung der Transformation D.134) erfolgt über die Hauptachsentransformation D.128). Anschaulich bedeutet dieses Vorgehen, daß zunächst das Koordinatensystem einer Drehung mit der Orthogonalmatrix U der Eigenvektoren von A unterworfen wird, so daß die Form Q = xTLx = J2 XiX-2 D.135) *=1 entsteht, in der L die Diagonalmatrix von A ist Daran schließt sich eine Dehnung mit der Diagonal- / u matrix D an, deren Diagonalelemente d* = \ r&\ lauten Die Gesamtransformation wird dann durch C - UD D.136) beschrieben, und man erhält Q = xTAx = (UDx)TA(UDx) = xT(DTUTAUD)x = xTDTLDx = xTKx. D 137) Hinweis: Die Hauptachsentransformation spielt eine wesentliche Rolle bei der Klassifizierung von Kurven und Flächen 2. Ordnung (s. 3.5.2 11, S. 210 und 3 5 3.10, S 230) 4. Jordansche Normalform Mit A sei eine beliebige reelle oder komplexe quadratische Matrix vom Typ (n, n) gegeben. Dann gibt es eine nichtsinguläre Matrix T, so daß T_1AT = J D 138)
4 5 Eigenwertaufgaben bei Matrizen 291 gilt, wobei J als Jordan- Matrix oder JORDANsc/ie Normalform von A bezeichnet wird Die Jordan- Matrix hat die Gestalt J2 O | D 139) O V hj wobei die Elemente Jj von J auch als Jordan -Kästchen bezeichnet werden. Für deren Form gilt: - 1. Sind alle Eigenwerte Xj von A einfach, so ist Jj = A^ und k = n , d.h , J ist eine Diagonalmatrix der Form A2 D 140) J = O An-i V A, nj 2. Ist Xj ein pj -facher Eigenwert von A, so gibt es ein oder mehrere JORDAN Kastchen der Form (Xj 1 Xj 1 o \ o Xj 1 D 141) AJ/ Dabei gilt ^Pj — n Die Summe der Dimensionen der JORDAN-Kästchen zu einem Eigenwert ist pj Weitere Informationen zu den JORDAN-Kästchen findet man in [4.18], [19 16] Bd. 1. 4.5.2.4 Hinweise zur numerischen Bestimmung von Eigenwerten 1. Die Eigenwerte könnten als Nullstellen der charakteristischen Gleichung D 124b) berechnet werden (s. Beispiele in 4.5.2.1, S. 287) Dazu müssen die Koeffizienten a; (i = 0,1,2, , n — 1) des charakteristischen Polynoms der Matrix A bestimmt werden Diese Vorgehensweise sollte aber vermieden werden, da sie einen außerordentlich instabilen Algorithmus darstellt, d.h., kleine Änderungen in den Koeffizienten a; führen zu sehr großen Änderungen der Nullstellen A;. 2. Für die numerische Lösung des symmetrischen Eigenwertproblems sind zahlreiche Algorithmen entwickelt worden. Man unterscheidet zwei Verfahrensklassen (s. [4 7]) a) Transformationsverfahren, z.B. JACOBI-Verfahren, HOUSEHOLDER-Tridiagonalisierung, QR-Al- gorithmus; b) Iterationsverfahren, z.B Vektoriteration, RAYLElGH-RiTZ-Algorithmus, Inverse Iteration, Lanc- ZOS-Verfahren, Bisektionsverfahren Als Beispiel wird die Potenzmethode von MiSES betrachtet. 3. Potenzmethode von Mises Hierbei handelt es sich um ein Iterationsverfahren zur Bestimmung des betragsgrößten Eigenwertes und des zugehörigen Eigenvektors einer Matrix A, falls A reell und symmetrisch ist und einen betragsgrößten (dominanten) Eigenwert hat. Dieser sei Ai Dann gilt: N>|A2|>|A3|>-- >|A„|. D.142) Die Matrix A hat n linear unabhängige Eigenvektoren x1,x2,---)Xn Daraus folgt 1. Axi = XiXi (i = 1,2, ., n). D.143) 2. Jedes Element xGRn läßt sich als Linearkombination der Eigenvektoren x j darstellen: x = C\x1 + C2X2 + \~ cnxn (Qconst; 1 = 1,2,... ,n). D 144)
292 4- Lineare Algebra Multipliziert man D 144) mit A und berücksichtigt D.143), dann erhält man nach fc-maliger Multiplikation- Akx = ciAjxi + C2A2X2 + • • • + cnA*xn / \ \ k /x \ k x2 + - = A^[ciXi+c2 Daraus folgt wegen D.142): • + cn Afcx —^ > x1iüik —> 00 bzw. Afex « CiAfxx. Die Aussagen D 146) sind Grundlage des folgenden IterationsVerfahrens: Schritt 1: Wahl eines beliebigen Startvektors x@) € Rn. Schritt 2: Iterative Berechnung von Afcx gemäß x(fc+1) = Ax(fc) (jfe = 0,1,2,...; x@) gegeben). Daraus folgt unter Beachtung von D.146): x(*) = Afcx@) « ciAjxi • Schritt 3: Aus D 147) und D 148) folgt: X(*+D = Ax<*> = A(Afcx(°)), A(Afcx@)) « A(ciAjxi) = ciA{(Axx), ci(AjAXi) = Ai(ciAjxi) ~ Aix(fc), also x(fc+1> » AiX(fc), D.145) D.146) D 147) D.148) D.149) d.h. für große Werte von k unterscheiden sich aufeinanderfolgende Näherungsvektoren x^ durch den Faktor Ai Schritt 4: Aus D.148) und D.149) erhält man zur Berechnung von xx und Ai: r(k+l) Ai: (x(A:),x(A:+1)) (xW,x«) D.150) ¦ Zahlenbeispiel mit / 2,23-1,15 1,77 A= -1,15 9,25 -2,13 V 1,77-2,13 1,56 x@) = x(o) 1 0 0 Ai X(D x<2) 3,23 14,89 -1,15 -18,12 - 1,77 10,93 XC) 88,27 -208,03 82,00 Normierung 1 -2,36 0,93 9,964 XD) 7,58 -24,93 - 8,24 x(ß) 67,75 -256,85 79,37 Normierung 1 -3,79 1,17 10,177 x(ß) x(?) 9,66 96,40 -38,78 -394,09 11,67 117,78 Normierung 1 -4,09 1,22 10,16 x(8) x(9) 10,09 102,33 -41,58 -422,49 12,38 125,73 Normierung 1 * ) -4,129 ~Xi V 1,229/ 10,161 «Ai
4 5 Eigenwertaufgaben bei Matrizen 293 Hinweise: 1. Da Eigenvektoren nur bis auf einen Zahlenfaktor eindeutig bestimmt sind, ist es numerisch zweckmäßig, die Vektoren xk zu normieren, z B. in der im Beispiel angegebenen Weise. 2. Der betragskleinste Eigenwert von A und der zugehörige Eigenvektor lassen sich bestimmen, indem man die Potenzmethode auf die Inverse A-1 von A anwendet. 3. Zur Bestimmung der übrigen Eigenwerte und Eigenvektoren von A kann die Potenzmethode ebenfalls angewendet werden. Ist der Eigenvektor x1 bekannt, dann wird zur Bestimmung von A2 ein Startvektor gewählt, der zu xx orthogonal ist, und dann wie bei der Bestimmung von Ai verfahren, falls A2 dominant gegenüber A3, A4,.. , An ist Zur Bestimmung von A3 wird dann ein Startvektor gewählt, der orthogonal zuxt und x2 ist, usw Diese Vorgehensweise wird auch als Deflation bezeichnet 4. Aufgrund der Iterationsvorschrift D 147) wird die Potenzmethode auch Vektoriteration genannt. 4.5.3 Singulärwertzerlegung 1. Singulärwerte und Singulärvektoren Wenn A eine reelle Matrix vom Typ (m, n) mit dem Rang r ist, dann heißen die positiven Wurzeln dv = \f\, (y = 1,2, ,r) aus den Eigenwerten A„ der Matrix ATA Singulärwerte der Matrix A Die zugehörigen Eigenvektoren uu von ATA heißen Rechtssingulärvektoren von A, die zugehörigen Eigenvektoren v„ von AAT Linkssingulärvektoren. Dabei besitzt die Matrix AAT dieselben r von Null verschiedenen Eigenwerte A„ wie die Matrix ATA: A'Au,, = A„u/y AA1^ A/= 1,2,.. ,r). D.151a) D.151b) Außerdem besteht zwischen den Rechts- und Linkssingulärvektoren der Zusammenhang Au„ = dv\_v , ATVj, = du\iu Es gilt Eine Matrix A vom Typ (m, n) mit dem Rang r besitzt r positive Singulärwerte du {y = 1,2, , r) Dazu existieren r orthonormierte Rechtssingulärvektoren u^ und r orthonormierte Linkssingulärvektoren \_u Darüber hinaus existieren zum Singulärwert Null n — r orthonormierte Rechtssingulärvektoren uu(v = r + 1, , n) und m — r orthonormierte Linkssingulärvektoren v„ {y = r + 1, ., m). Eine Matrix vom Typ (m, n) hat demzufolge n Rechtssingulärvektoren und m Linkssingulärvektoren, die man zu den orthogonalen Matrizen (s 4.1.2,9., S. 265) U= (Ui,U2, ..,Un), V = (Vi,Va, .,Vsn) D 152) zusammenfassen kann 2. Singulärwertzerlegung Die Darstellung A = VÄUT D.153a) mit Ä = /di 0 0 0 d2 0 0 0 0 V o o 0 0 0 0 dr o... o\ 0 i 0 ••• 0 0 ••• 0 o... 0/ > r Zeilen D.153b) > m — r Zeilen r Spalten n — r Spalten heißt Singulärwertzerlegung der Matrix A. Die Matrix Ä ist wie die Matrix A vom Typ (m, n) und enthält bis auf die ersten r Diagonalelemente avv = du A/ = 1,2,. ., r) nur Nullen. Dabei sind die dv die Singulärwerte von A .
294 4- Lineare Algebra 3. Anwendung Die Singulärwertzer legung kann zur Rangbestimmung einer Matrix A vom Typ (m, n) und zur genäherten Lösung uberbestimmter linearer Gleichungssysteme Ax = b (s. 4 4.3.1,1., S. 285) nach dem sogenannten Regularisierungsverfahren, d.h. zur Lösung der Aufgabe 12 ||Ax-b||2 + a||x||2 = £ 5Z a+kXk ~ h + a ^2 x\ = min! k=l eingesetzt werden, wobei a > 0 ein Regularisierungsparameter ist. D.154)
295 5 Algebra und Diskrete Mathematik 5.1 Logik 5.1.1 Aussagenlogik 1. Aussagen Eine Aussage ist die gedankliche Widerspiegelung eines Sachverhalts in Form eines Satzes einer natürlichen oder kunstlichen Sprache. Jede Aussage ist entweder wahr oder falsch. Man spricht vom Prinzip der Zweiwertigkeit (zur mehrwertigen oder Fuzzy-Logik s 5 9 1, S. 374). Man nennt „wahr" bzw. „falsch" den Wahrheitswert der Aussage und bezeichnet ihn mit W (oder 1) bzw. F (oder 0) Die Wahrheitswerte werden auch als aussagenlogische Konstanten bezeichnet. 2. Aussagenverbindungen Die Aussagenlogik untersucht den Wahrheitswert von Aussagenverbindungen in Abhängigkeit von den Wahrheitswerten der einzelnen Aussagen. Dabei werden ausschließlich extensionale Aussagenverbindungen betrachtet, d.h., der Wahrheitswert der Aussagenverbindung hängt nur von den Wahrheitswerten der Teilaussagen und den verbindenden Junktoren ab Dabei wird der Wahrheitswert der Verbindung durch die klassischen Junktoren „NICHTS" (-iA), E.1) „A ODER B" (AvB), E.3) „j4UNDJ3" (AAB), E 2) „WENN A, DANN Bu (A=>B) E 4) und „A GENAU DANN, WENN Bu (A&B) E.5) bestimmt. Dabei ist das „logische ODER" immer als „einschließendes ODER" zu verstehen. Im Falle der Implikation sind für A => B auch die folgenden Sprechweisen üblich: A impliziert B, B ist notwendig für A sowie A ist hinreichend für B. 3. Wahrheitstafeln Faßt man A und B als Variable auf, die nur die Werte F und W annehmen können (Aussagenvariable), so beschreiben die folgenden Wahrheitstafeln die den Junktoren entsprechenden Wahrheitsfunktionen Tabelle 5 1 Wahrheitstafeln der Aussagenlogik Negation Konjunktion A F W -.A W F A F F W W B F W F W AAB F F F W Disjunkt A F F W W B F W F W ion AV B F W W w A F F W W B F W F W A^B W W F W A F F W W B F W F W A&B W F F W 4. Ausdrücke der Aussagenlogik Mit diesen einstelligen (Negation) und zweistelligen (Konjunktion, Disjunktion, Implikation und Äquivalenz) Verknüpfungen können aus gegebenen Aussagenvariablen kompliziertere Ausdrucke der Aussagenlogik aufgebaut werden Diese Ausdrücke werden induktiv definiert: 1. Konstanten und Variable sind Ausdrücke. E.6) 2. Sind A und B Ausdrücke, so sind es auch (-.4), (AAB), (AV B), (A=>B), (A <& B) E 7)
296 5 Algebra und Diskrete Mathematik Zur Vereinfachung der Schreibweise solcher Ausdrücke werden Außenklammern weggelassen und Vorrangregeln (Prioritäten) festgelegt. In der folgenden Reihenfolge bindet jeder Junktor stärker als der folgende: -,, A, V, =», <& . Häufig wird anstelle von „-^A" auch A geschrieben und der Junktor A ganz weggelassen Durch diese Einsparungen kann man z.B den Ausdruck ((A V (->B)) => ((A Aß)V C)) kürzer so notieren- 5. Wahrheitsfunktionen Ordnet man jeder Aussagenvariablen eines Ausdrucks einen Wahrheitswert zu, dann spricht man von einer Belegung der Variablen Mit Hilfe der Wahrheitstafeln für die Junktoren kann man einem Ausdruck für jede Belegung einen Wahrheitswert zuordnen Der oben angegebene Ausdruck repräsentiert somit eine dreistellige Wahrheitsfunktion (BöOLEsche Funktion s. 5.7 5, S 356) ¦ Jeder aussagenlogische Ausdruck repräsentiert auf diese Weise eine n-stellige Wahrheitsfunktion, d h eine Funktion, die jedem n-Tupel von Wahrheitswerten wieder einen Wahrheitswert zuordnet Es gibt 22" n-stellige Wahrheitsfunktionen, insbesondere 16 zweistellige 6. Grundgesetze der Aussagenlogik Zwei aussagenlogische Ausdrücke A und B heißen logisch äquivalent oder wertverlaufsgleich, in Zeichen: A = B, wenn sie die gleiche Wahrheitsfunktion repräsentieren Folglich kann man mit Hilfe von_ Wahrheitstafeln die logische Äquivalenz aussagenlogischer Ausdrücke überprüfen So gilt z B AVB=>AB\/C = BVCi d.h., der Ausdruck A V B => AB V C hängt von A explizit nicht ab, was man schon an der obigen Wahrheitstafel erkennt Insbesondere gelten folgende Grundgesetze der Aussagenlogik 1. Assoziativgesetze A F F F F W W W W B F F W W F F W W C F W F W F W F W AV B W w F F W W w w AB VC F W F W F W W W A\/ B=> ABVC F W W W F W W W (A A B) A C = A A (B A C), E 8a) (Av B)VC = Av{BvC) E.8b) 2. 3. 4. 5. 6. Kommutativgesetze AAB = B AA, Distributivgesetze (A V B)C = ACVBC, Absorptionsgesetze A(A\/B) = A, Idempotenzgesetze AA = A, ausgeschlossener Dritter Xä = F, E 9a) - E.10a) E IIa) E 12a) E.13a) A\J B = BV A ABVC = (AV A\f AB = A. AWA = A. A\JÄ = W E 9b) E IIb) E 12b) E.13b)
5.1 Logik 297 7. DE MORGANsche Regeln ÄB = ÄVB, 8. Gesetze für W und F AW = A, AF = F, W = F, 9. Doppelte Negation 2 = A E.14a) A\/B = AB E.14b) E.15a) AVF = A, E.15b) E.15c) AVW = W, E.15d) E 15e) F = W. E.15f) E.16) Aus den Wahrheitstafeln für die Implikation und die Äquivalenz kann man erkennen, daß die Implikation und die Äquivalenz mit Hilfe der anderen Junktoren durch die Gleichungen B = AVB und A&B = ABV AB E.17b) E 17a) ausgedruckt werden können. Diese Gesetze werden zur Umformung (Vereinfachung) aussagenlogischer Ausdrucke verwendet. ¦ Die Gleichung ^Vß=>ißVC = 5VC kann wie folgt bewiesen werden: AVß^>ißVC = AVß V AB V C = TB V AB V C = AB V AB V C = (Ä V A)B V C = WB V C = B V C. 10. Weitere Umformungen A(ÄV£) = AB, E.18a) AV AB = A\/ B, E.18b) Tabelle 5.2 NAND-Funktion Tabelle 5.3 NOR-Funktion (A V C)(B \/C)(A\/ B) = (AV C)(B V C), E 18c) iCVßCvA5 = iCVJBC. E.18d) 11. NAND-Funktion und NOR-Funktion Jede Wahrheitsfunktion kann durch einen aussagenlogischen Ausdruck repräsentiert werden Wegen E.17a) und E.17b) kann man dabei noch auf Implikationen und Äquivalenz verzichten (vgl auch 5 7, S 355ff) In Anbetracht der De MORGANschen Regeln E.14a) und E.14b) sind darüber hinaus noch Konjunktion oder Disjunktion zur Darstellung aller Wahrheitsfunktionen entbehrlich Es gibt sogar zwei zweistellige Wahrheitsfunktionen, die einzeln zur Repräsentation aller Wahrheitsfunktionen ausreichen. Es sind dies die NAND-Funktion oder SHEFFER-Funk- tion (Funktionssymbol. |) und die NOR- Funktion oder PEIRCE-Funktion (Funktionssymbol: i) mit den nebenstehenden Wahrheitstafeln. Der Vergleich dieser Tafeln mit den entsprecheneden Wahrheitstafeln für die Konjunktion bzw. die Disjunktion erklärt die Namen NAND- Funktion (NICHT-UND) bzw. NOR- Funktion (NICHT-ODER). 7. Tautologien, mathematische Schlußweisen Ein aussagenlogischer Ausdruck heißt allgemeingültig oder Tautologie, wenn er die Wahrheitsfunktion identisch W repräsentiert. Folglich sind zwei Ausdrücke A und B genau dann logisch äquivalent, wenn der Ausdruck A <& B eine Tautologie ist Mathematische Schlußweisen folgen aussagenlogischen Gesetzen. Als Beispiel sei das Kontrapositionsgesetz genannt, d.h. der allgemeingültige Ausdruck A=>B^B=>Ä E.19a) A F F W W B F W F W A\B W W w F A F F W W B F W F W A[B W F F F
298 5 Algebra und Diskrete Mathematik Dieses Gesetz, das auch in der Form A^ B = ^^Ä E 19b) notiert werden kaim, läßt sich wie folgt interpretieren- Um zu zeigen, daß B aus A folgt, kann man auch zeigen, daß A aus B folgt. Der indirekte Beweis (s auch 1 1 2 2, S 5) beruht auf folgendem Prinzip Um B aus A zu folgern, nimmt man B als falsch an und leitet daraus - unter der Voraussetzung, daß A richtig ist - einen Widerspruch her. Formal läßt sich dieses Prinzip auf verschiedene Weise durch aussagenlogische Gesetze beschreiben: A => B = AB =? ~Ä E.20a) oder A => B = AB => B E 20b) oder A => B = AB => F E 20c) 5.1.2 Ausdrücke der Prädikatenlogik Zur logischen Grundlegung der Mathematik wird eine ausdrucksstärkere Logik als die Aussagenlogik benötigt. Um Eigenschaften von und Beziehungen zwischen (mathematischen) Objekten beschreiben zu können, bedient man sich der Prädikatenlogik 1. Prädikate Dabei werden die betrachteten Objekte zu einem Individuenbereich X, z B Menge IN der natürlichen Zahlen, zusammengefaßt Eigenschaften der Individuen, z.B. „n ist eine Primzahl", und Beziehungen zwischen Individuen, z B. „m ist kleiner als n", werden als Prädikate bezeichnet. Ein n-stelliges Prädikat über dem Individuenbereich X ist eine Abbildung P. Xn —? {F,W}, die jedem n-Tupel von Individuen einen Wahrheitswert zuordnet So sind die oben angeführten Prädikate über den natürlichen Zahlen ein- bzw. zweistellig 2. Quant oren Charakteristisch für die Prädikatenlogik ist die Verwendung von Quantoren, dem Allquantor oder Generalisator V und dem Existenzquantor oder (Partikularisator) 3 Ist P ein einstelliges Prädikat, so wird die Aussage „Für jedes x aus X gilt P(x)u mit V x P(x) und die Aussage „Es gibt ein x aus X, für das P(x) gilt "mit 3 x P(x) bezeichnet Durch die Quantifizierung entsteht aus dem einstelligen Prädikat P eine Aussage Ist z B IN der Individuenbereich der natürlichen Zahlen und bezeichnet P das (einstellige) Prädikat „n ist eine Primzahl", so ist V n P(n) eine falsche und 3n P(n) eine wahre Aussage 3. Ausdrücke des Prädikatenkalküls Allgemein werden die Ausdrucke des Prädikatenkalküls wieder induktiv definiert. 1. Sind x\, , xn Individuenvariable und P eine n-stellige Prädikatenvariable, so ist P(xi,. .,xn) ein Ausdruck (Elementarformel) E.21) 2. Sind A und B Ausdrücke, so sind es auch (-.A), (A A B), (A V B), (A=>B),(A<*B), (V x A) und C x A) E.22) Betrachtet man Aussagenvariable als nullstellige Prädikatenvariable, so erkennt man die Aussagenlogik als Teil der Prädikatenlogik. Eine Individuenvariable x kommt in einem Ausdruck gebunden vor, wenn x Variable eines Quantors V x , 3 x ist oder im Wirkungsbereich eines Quantors liegt, andernfalls kommt x in diesem Ausdruck frei vor Ein Ausdruck der Prädikatenlogik, der keine freien Variablen enthält, heißt geschlossene Formel. 4. Interpretation prädikatenlogischer Ausdrücke Eine Interpretation eines Ausdrucks der Prädikatenlogik besteht aus • einer Menge (Individuenbereich) und • einer Zuordnung, die jeder n-stelligen Prädikatenvariablen ein n-stelliges Prädikat zuweist. Die Interpretation einer geschlossenen Formel liefert somit eine Aussage Enthält ein Ausdruck der Prädikatenlogik freie Variable, so repräsentiert eine Interpretation dieses Ausdrucks eine Relation (s
5 2 Mengenlehre 299 5.2.3, 1., S. 303) im Individuenbereich ¦ Sei P das zweistellige Prädikat, das im Individuenbereich N der natürlichen Zahlen die <-Beziehung beschreibt, so charakterisiert • P(x,y) die Menge aller Paare (x,y) natürlicher Zahlen mit x < y (zweistellige Relation in N); x, y sind freie Variable, • V y P(x,y) die Teilmenge von N (einstellige Relation), die nur aus der Zahl 0 besteht; x ist freie, y gebundene Variable; • 3 x\f y P(x, y) die Aussage „Es gibt eine kleinste natürliche Zahl"; x und y sind gebundene Variable. Ein Ausdruck der Prädikatenlogik heißt wahr für eine gegebene Interpretation, wenn für jede Ersetzung der freien Variablen durch Elemente aus dem Individuenbereich eine wahre Aussage entsteht. Ein Ausdruck der Prädikatenlogik heißt allgemeingültig oder Tautologie, wenn er für alle Interpretationen wahr ist. 5. Tautologien der Prädikatenlogik Die Verneinung prädikatenlogischer Ausdrücke wird durch folgende Tautologien beschrieben -A/xP(x) = 3x-P(x) bzw. n3xP(i)=Vin?(x). E.23) Damit sind die Quantoren V und 3 durcheinander ausdrückbar: VxP(x) = -3x-P(x) bzw 3xP{x) = -Wx-*P{x) E 24) Weitere Tautologien der Prädikatenlogik sind: Vx Vy P(x, y)=\/y\fx P(x, y), E.25) 3x3yP(x,y) = 3y3xP{x,y), E 26) Vx P(x) AVx Q(x) = Vx (P(x) A Q{x)), E.27) 3x P{x) V 3 x Q(x) = 3x (P(x) V Q(x)). E.28) Außerdem gelten folgende Implikationen. Vx P(x) Wx Q(x) => Vx (P(x) V Q(x)), E 29) 3x (P(x) A Q(x)) ^3x P(x) A 3x Q{x), E 30) Vx (P(x) =» Q(x)) => (Vx P{x) =4> Vx Q(x)), E.31) Vx (P(x) & Q(x)) => (Vx P{x) & Vx Q(x)), E.32) 3xV7/P(x,y)=^V?/3xP(x,y). E.33) Die Umkehrungen dieser Implikationen gelten durchweg nicht Insbesondere muß man beachten, daß verschiedene Quantoren nicht vertauschbar sind (s. letzte Implikation). 6. Beschränkte Quantifizierung Oft ist es sinnvoll, Quantifizierungen auf die Elemente einer vorgegebenen Menge zu beschränken. Dabei ist VxeXP(x) als Abkürzung für Vx (x G X => P(x)) und E.34) 3 x G X P(x) als Abkürzung für 3 x (x G X A P(x)) E.35) aufzufassen. 5.2 Mengenlehre 5.2.1 Mengenbegriff, spezielle Mengen Als Begründer der Mengenlehre gilt Georg Cantor A845-1918). Die Bedeutung der von ihm verwendeten Begriffsbildungen wurde erst später erkannt. Die Mengenlehre hat nahezu alle Gebiete der Mathematik entscheidend vorangebracht bzw. überhaupt erst ermöglicht und ist heute zu einem unverzichtbaren Handwerkszeug der Mathematik und deren Anwendungen geworden.
300 5 Algebra und Diskrete Mathematik 1. Elementbeziehung 1. Mengen und ihre Elemente Der grundlegende Begriff der Mengenlehre ist die Elementbeziehung Eine Menge A ist eine Zusammenfassung bestimmter, wohlunterschiedener Objekte a unserer Anschauung oder unseres Denkens zu einem Ganzen. Diese Objekte heißen Elemente der Menge. Für ,,a ist Element von A" bzw. „a ist nicht Element von A" schreibt man „a G A" bzw. „a ^ A". Mengen können beschrieben werden durch Aufzählung aller ihrer Elemente in geschweiften Klammern, z.B. M = {a, b, c] oder U = {1,3,5,.. } , oder durch eine definierende Eigenschaft, die genau den Elementen der Menge zukommt Z.B. wird die Menge U der ungeraden natürlichen Zahlen durch U = {x \ x ist eine ungerade natürliche Zahl } beschrieben Für die Zahlenbereiche sind folgende Bezeichnungen üblich IN = {0,1,2, . } Menge der natürlichen Zahlen, Z ={0,1,-1,2,-2, } Menge der ganzen Zahlen, \P\ 1 Q — <-p,^GZAg^0> Menge der rationalen Zahlen, U1 J R Menge der reellen Zahlen, C Menge der komplexen Zahlen. 2. Extensionalitätsprinzip für Mengen Zwei Mengen A und B sind genau dann gleich, wenn sie die gleichen Elemente enthalten, d.h A = B &\/x(xeA&xeB). E 36) ¦ Die Mengen {3,1,3, 7,2} und {1,2, 3, 7} sind gleich 2. Teilmengen 1. Teilmenge Sind A und B Mengen und gilt Vx(xeA=>xeB), E 37) so heißt A Teilmenge von B, und man schreibt A C B. Mit anderen Worten. A ist Teilmenge von B, wenn alle Elemente von A auch zu B gehören Damit gilt auch stets A C A Gibt es für A C B in B weitere Elemente, die nicht in A vorkommen, so heißt A echte Teilmenge von £?, und man schreibt AcB (Abb.5.1) ¦ Es seien A= {2,4,6, 8,10} eine Menge gerader Zahlen und {1,2,3, ..,10} eine Menge natürlicher Zahlen Da die Menge A die ungeraden Zahlen nicht enthält, ist A eine echte Teilmenge von B. 2. Leere Menge Es erweist sich als sinnvoll, die leere Menge 0, die kein Element enthält, einzuführen Wegen des Extensionalitätsprinzips gibt es nur eine solche Menge ¦ A: Die Menge {x\x G R A x2 + 2x + 2 = 0} ist leer ¦ B: Für jede Menge M gilt 0 C M, d h., die leere Menge ist Teilmenge jeder Menge M 3. Gleichheit von Mengen Zwei Mengen sind demnach genau dann gleich, wenn jede Teilmenge der anderen geich ist. A = B&ACBABCA E.38) Diese Tatsache wird häufig zum Beweis der Gleichheit zweier Mengen benutzt 4. Potenzmenge Die Menge aller Teilmengen A einer Menge M nennt man Potenzmenge von M und bezeichnet sie mit P(M), d.h P(M) = {A\ AC M}. ¦ Für die Menge M = {a, 6, c} lautet die Potenzmenge P(M) = {0, {a}, {&}, {c}, {a, 6}, {a, c}, {6, c}, {a, fr, c}} Es gilt a) Hat eine Menge M m Elemente, so hat ihre Potenzmenge P(M) 2m Elemente. b) Für jede Menge M gilt 0 G P(M) d.h., die leere Menge ist Potenzmenge jeder Menge M 5. Kardinalzahl Die Anzahl der Elemente einer endlichen Menge M heißt Kardinalzahl von M und wird mit card M oder manchmal auch \M\ bezeichnet. Auch unendlichen Mengen werden Kardinalzahlen zugeordnet (s. 5 2 5, S 307)
5.2 Mengenlehre 301 5.2.2 Operationen mit Mengen 1. VENN-Diagramm Zur Veranschaulichung von Mengen und Mengenoperationen benutzt man Venn -Diagramme Dabei werden Mengen durch ebene Figuren dargestellt. So wird durch Abb.5.1 die Teilmengenbeziehung AC B dargestellt Abbildung 5.1 Abbildung 5.2 Abbildung 5.3 2. Vereinigung, Durchschnitt, Komplement Durch Mengenoperationen werden aus gegebenen Mengen auf verschiedene Weise neue Mengen gebildet: 1. Vereinigung Seien A und B Mengen. Die Vereinigungsmenge oder die Vereinigung (Bezeichnung AU B) ist definiert durch AöB = {x\xeAVxeB} E.39) Man liest nA vereinigt mit B" Sind A und B durch die Eigenschaften Ei bzw E2 beschrieben, dann enthält die Vereinigungsmenge AU B die Elemente, die eine der beiden Eigenschaften besitzen, also wenigstens zu einer der beiden Mengen gehören In Abb.5.2 ist die Vereinigungsmenge durch das schattiert gezeichnete Gebiet dargestellt. ¦ {1,2,3}U{2,3,5,6} = {1,2,3,5,6} 2. Durchschnitt Seien A und B Mengen. Die Schnittmenge oder der Durchschnitt (Bezeichnung An B) ist definiert durch A n B = {x | x e A A x e B}. E 40) Man liest „A geschnitten mit B". Sind A und B durch die Eigenschaften E\ bzw. E2 beschrieben, dann enthält A fl B die Elemente, die beide Eigenschaften E\ und E2 besitzen. In Abb.5.3 ist die Schnittmenge schattiert dargestellt. ¦ Mit Hilfe des Durchschnitts der Teilermengen T(a) und T(b) zweier Zahlen a und b läßt sich der größte gemeinsame Teiler (ggT) (s. 5.4.1.4,1., S. 333) bestimmen. Für a = 12 und b = 18 ist T(a) = {1,2,3,4,6,12} und T(b) = {1,2,3,6,9,18 }, so daß TA2) n TA8) die Zahl ggTA2,18) = 6 ergibt Hinweis: Als DEDEKiNDsc/ien Schnitt (A, B) bezeichnet man ein geordnetes Paar von nichtleeren Mengen A und B reeller Zahlen, so daß jede reelle Zahl entweder in A oder in B liegt und aus a € A und b e B stets a < b folgt. ¦ Die reellen Zahlen lassen sich durch Schnitte im Bereich der rationalen Zahlen einführen. 3. Disjunkte Mengen Zwei beliebige Mengen A und B, die kein gemeinsames Element besitzen, nennt man elementfremd oder disjunkt, für sie gilt ADB = ®, E.41) d h., ihr Durchschnitt ist eine leere Menge. ¦ Der Durchschnitt der Menge der ungeraden und der Menge der geraden Zahlen ist leer, d.h {ungerade Zahlen} n {gerade Zahlen} = 0 4. Komplement Betrachtet man nur Teilmengen einer vorgegebenen Grundmenge M, z.B. die Teilmenge A C M, so besteht die Komplementärmenge oder das Komplement Cm(A) von A bezüglich M aus allen Elementen von M, die nicht zu A gehören CM(A) = {x\xeMAx<£A} E.42)
302 5. Algebra und Diskrete Mathematik Man liest „Komplement von A bezüglich M". Ist die Grundmenge M aus dem Zusammenhang heraus offenbar, dann wird für die Bezeichnung der Komplementärmenge auch das Symbol A verwendet In Abb.5.4 ist das Komplement A schattiert dargestellt. e£jj> Abbildung 5.4 Abbildung 5.5 Abbildung 5 6 3. Grundgesetze der Mengenalgebra Die eingeführten Mengenoperationen haben analoge Eigenschaften wie die Junktoren in der Aussagenlogik. Es gelten folgende Grundgesetze der Mengenalgebra. 1. Assoziativgesetze (AuB)UC = Aö(BuC). E 44) AUB = BUA. E.46) (AnB)UC=(AöC)n(BUC) E 48) 2. 3. 4. 5. 6. 7. (A n B) n C = A n (B n c), Kommutativgesetze Anß = 5nA, Distributivgesetze (i4uJ5)nc = (i4nc)u(ßn Absorptionsgesetze i4n(>lU5) = A, Idempotenzgesetze AnA = A, DE MORGANsche Regeln Anß = Äu5, Weitere Gesetze AnÄ = 0, AnM = A, 4n0 = 0, M = 0, E.43) E 45) C),E 47) E.49) E.51) E.53) E.55) E 57) E.59) E.61) Aö(AHB) = A AöA = A. AUB = ADB. AUÄ=M M Grundmenge, AU0 = A, AUM = M, 0-M E.50) E.52) E.54) E 56) E.58) E.60) E 62) A = A. E 63) Diese Tabelle erhält man unmittelbar aus den Grundgesetzen der Aussagenlogik (s. 5.1.1, S 295), wenn man folgende Ersetzungen vornimmt: A durch n , V durch U , W durch M und F durch 0 Auf diesen nicht zufälligen Zusammenhang wird in 5.7, S. 355ff genauer eingegangen. 4. Weitere Mengenoperationen Außer den oben für zwei Mengen A und B eingeführten Mengenoperationen werden noch die Differenzmenge oder Differenz A \ B, die Diskrepanz oder symmetrische Differenz AAB Und das kartesische Produkt Ax B erklärt.
5.2 Mengenlehre' 303 1. Differenz zweier Mengen Die Menge der Elemente von A, die nicht zu B gehören, nennt man Differenzmenge oder Differenz von A und B: A\B = {x\xeAAx£B}. E.64a) Wird A durch die Eigenschaft E\ und B durch die Eigenschaft E2 beschrieben, dann liegen in A \ B die Elemente, die zwar die Eigenschaft Ei, nicht aber die Eigenschaft E2 besitzen. In Abb.5.5 ist die Differenz schattiert dargestellt. ¦ {1,2,3,4}\{3,4,5} = {1,2}. 2. Symmetrische Differenz zweier Mengen Die symmetrische Differenz AAB ist die Menge aller Elemente, die zu genau einer der beiden Mengen A und B gehören: AAB = {x\(xeAAx(£B)V(xeBAx(£A)} E.64b) Aus der Definition folgt, daß gilt AAB = {A\B)U{B\A), E.64c) d.h , die symmetrische Differenz enthält die Elemente, die genau eine der beiden Eigenschaften Ei (zu A) und E2 (zu B) besitzen In Abb.5.6 ist die symmetrische Differenz schattiert dargestellt. ¦ {1,2,3,4}A{3,4,5} = {1,2,5}. 3. Kartesisches Produkt zweier Mengen Das kartesische Produkt zweier Mengen A x B ist durch A x B = {(o, b) | a € A A b <E B} E.65a) definiert Die Elemente (a, b) von Ax B heißen geordnete Paare und sind charakterisiert durch (a, b) = (c, d) <=> a = c A b = d. E.65b) Die Anzahl der Elemente im kartesischen Produkt zweier endlicher Mengen beträgt card (Ax B) = (cardA)(card£). E.65c) ¦ A: Für .4 = {1,2,3} und B = {2,3} ergibt sich A x B = {A,2), A,3), B,2), B,3), C,2), C,3), } undB x A = {B,l),B,2),B,3),C,l),C,2),C,3)}mitcardAi = 3, cardß = 2, card(,4 x B) = card(£ x A) = 6. ¦ B: Mit dem kartesischen Produkt R x R (R Menge der reellen Zahlen) kann man alle Punkte der x, y-Ebene beschreiben. Die Menge der Koordinaten (x, y) wird durch R x R dargestellt, denn es gilt: R2 = R x R = {(x, y) | x e R, y € R} . 4. Kartesisches Produkt aus n Mengen Aus n Elementen werden durch Festlegung einer bestimmten Reihenfolge A. Element, 2. Element,..., n-tes Element) geordnete n-Tupel gebildet. Sind a* € Ai (i = 1,2,..., n) die Elemente, dann notiert man das n-Tupel als (ai, a2,..., an), wobei a* f-te Komponente genannt wird Für n = 3,4,5 spricht man von Tripel, Quadrupel und Quintupel. Das n-fache kartesische Produkt j4i x A2 x • • • x An ist dann die Menge aller geordneten n-Tupel (oi, a2,.. , an) mit a* £ j4» . .Ai x ... x An = {(ai,...,an) | Oj € j4j (i = 1,.. ,n)}. E.66a) Sind alle A{ endliche Mengen, dann beträgt die Anzahl der geordneten Elemente card(Ai x A2 x • • • x An) = cardAi cardA2 • • • cardAin. E 66b) Hinweis: Das n-fache kartesische Produkt einer Menge A mit sich selbst wird mit An bezeichnet. 5.2.3 Relationen und Abbildungen 1. n-stellige Relationen Relationen beschreiben Beziehungen zwischen den Elementen einer oder verschiedener Mengen. Eine n-stellige Relation R zwischen den Mengen Ai,..., An ist eine Teilmenge des kartesischen Produkts dieser Mengen, d.h Ä C ^ x . . x An. Sind die Mengen Ai,i = 1,. ., n, sämtlich gleich der Menge A, so wird R C An und heißt n-stellige Relation in der Menge A.
304 5 Algebra und Diskrete Mathematik 2. Binäre Relationen 1. Begriff der binären Relation einer Menge Besondere Bedeutung haben zweistellige (binäre) Relationen in einer Menge, dh.RC.AxA Im Falle binärer Relationen ist auch die Schreibweise aRb statt (o, b) € R üblich ¦ Als Beispiel werde die Teilbarkeitsbeziehung in A = {1,2,3,4} betrachtet, d h die binäre Relation T = {(a,b) \ a,b e A A a teilt b} . E 67) T = {(a, b) | a, b G A A a ist Teiler von b} E 68a) = {A,1), A,2), A,3), A,4), B,2), B,4), C,3), D,4)} E.68b) 2. Pfeildiagramme Endliche binäre Relationen R in einer Menge A werden durch Pfeildiagramme oder Relationsmatrizen dargestellt Die Elemente von A werden als Punkte in der Ebene dargestellt und genau dann ein Pfeil von a nach b gezeichnet, wenn aRb gilt Die Abb.5.7 zeigt das Pfeildiagramm der Relation T in der Menge A = {1,2,3,4} . 1 2 3 4 1 1 0 0 0 2 1 1 0 0 3 1 0 1 0 4 1 1 0 1 Abbildung 5.7 Tabelle: Relationsmatrix 3. Relationsmatrix Die Elemente von A werden als Zeilen- und Spalteneingänge einer Matrix (s 4 1 1,1., S. 259) verwendet Am Schnittpunkt der Zeile zu a G A mit der Spalte zu b G B wird eine 1, falls aRb gilt, ansonsten eine 0 notiert Die obige Tabelle gibt die Relationsmatrix für T in der Menge A = {1,2,3,4} wieder 3. Relationenprodukt, inverse Relation Relationen sind spezielle Mengen, so daß zwischen Relationen die üblichen Mengenoperationen (s 5 2 2, S. 301) ausgeführt werden können Für zweistellige Relationen sind darüber hinaus das Relationenprodukt und die inverse Relation von Bedeutung. Es seien R C A x B und S C BxC zweistellige Relationen. Dann ist das Produkt RoS der Relationen R, S durch RoS = {{a,c) \3b{beBAaRbAbSc)} E 69) definiert Das Relationenprodukt ist assoziativ, aber nicht kommutativ Die inverse Relation R~l einer Relation R ist durch R-1 = {{b,a) | (a,ft) G R} E 70) festgelegt Für binäre Relationen in einer Menge A gelten folgende Beziehungen (R U S) o T = [R o T) U (S o T), E.71) (R n S) o T C (R o T) n {S o T), E 72) (ÄU5)-1 = Ä-1U5~1, E.73) (RnS)-1 = R-1nS~11 E.74) (ÄoSJ-^S-^oJT1 E.75) 4. Eigenschaften binärer Relationen Wichtige Eigenschaften einer binären Relation in einer Menge A. R heißt reflexiv, falls Va G Aai?a, E.76)
5.2 Mengenlehre 305 irreflexiv, falls Va G A -^aRa, symmetrisch, falls Va, ö € A (ai?6 => bRa), antisymmetrisch, falls Va, 6 G A (ai?6 A &i?a =>• a = 6), transitiv, falls Va, 6, c G .A (a.Ro A 6.Rc => aRc), linear, falls Va,6GA (aitß V bRa) E.77) E 78) E 79) E.80) E.81) gilt. Diese Eigenschaften lassen sich auch mit Hilfe des Relationenprodukts beschreiben. So gilt z.B.: Eine binäre Relation ist genau dann transitiv, wenn RoR C R gilt. Von besonderem Interesse ist gelegentlich der transitive Abschluß (transitive Hülle) tra(i?) einer Relation R. Darunter versteht man die kleinste (bezuglich der Teilmengenbeziehung) transitive Relation, die R enthält. Es gilt: tra(Ä) = U Rn = R1 U R2 U R3 U • • • , E.82) n>l wobei unter Rn das n-fache Relationenprodukt von R mit sich selbst zu verstehen ist ¦ Die binäre Relation R auf der Menge {1,2,3,4,5} sei durch die Relationsmatrix M gegeben. M 1 2 3 4 5 1 1 0 0 0 0 2 0 0 0 1 1 3 0 0 1 0 0 4 1 1 0 0 0 5 0 0 1 1 0 M2 1 2 3 4 5 1 1 0 0 0 0 2 1 1 1 1 0 3 0 0 1 0 0 4 1 0 0 1 1 5 1 1 1 0 0 M3 1 2 3 4 5 1 1 0 0 0 0 2 1 1 1 1 1 3 0 0 1 0 0 4 1 1 1 1 0 5 1 0 1 1 1 MVM2 1 2 3 4 5 VM3 1 1 0 0 0 0 2 1 1 1 1 1 3 0 0 1 0 0 4 1 1 1 1 1 5 1 1 1 1 1 Bildet man M2 , indem man bei der Matrizenmultiplikation 0 und 1 als Wahrheitswerte interpretiert und anstelle von Multiplikation bzw. Addition die logischen Operationen Konjunktion bzw. Disjunktion verwendet, so ist M2 die zu R2 gehörige Relationsmatrix. Entsprechend kann man auch die Relationsmatrizen von R3, R4 usw aufstellen. Die zu R U R2 U R3 gehörige nebenstehende Relationsmatrix erhält man, indem man die Matrizen M, M2 und M3 elementweise disjunktiv verknüpft Da höhere Potenzen von M keine neuen Einträge liefern, ist diese Matrix zugleich die zu tra(i?) gehörige Relationsmatrix Die Relationsmatrix und das Relationenprodukt finden auch Anwendung zur Untersuchung von Weglängen in Graphen (s. 5.8.2.1, S. 364). Bei endlichen binären Relationen kann man diese Eigenschaften größtenteils leicht aus den Pfeildiagrammen bzw Relationsmatrizen erkennen So erkennt man z B. Reflexivität durch „Schlingen "im Pfeildiagramm bzw. durch Einsen der Hauptdiagonalen der Relationsmatrix. Symmetrie äußert sich im Pfeildiagramm dadurch, daß zu jedem Pfeil ein gegenläufiger gehört bzw. durch Symmetrie der Relationsmatrix (s. 5 2 3,2., S. 304). Aus dem Pfeildiagramm oder der Relationsmatrix liest man ab, daß die Teilbarkeitsbeziehung T reflexiv, aber nicht symmetrisch ist. 5. Abbildungen Eine Abbildung (oder Funktion, s. 2.1.1.1, S. 48) / von einer Menge A in eine Menge B mit der Bezeichnung /: A —* B ist eine ZuOrdnungsvorschrift, die jedem Element a € A eindeutig ein Element f(a) € B zuordnet. Man kann eine Abbildung / als zweistellige Relation zwischen A und B, (/ C A x B), auffassen: f C Ax B heißt Abbildung von A nach B, falls gilt. Vae A3beB{{a,b) e f) und E 83) Va e AVbuh e B ((a,6i), (a,b2) G / =» h = b2). E 84) / heißt eineindeutig (oder injektiv), falls zusätzlich gilt- Vai,a2 G AMbe B ((aub),{a2,b) G / => ax = a2). E.85)
306 5. Algebra und Diskrete Mathematik Während bei einer Abbildung nur verlangt wird, daß jedes Original nur ein Bild hat, bedeutet Injekti- vität, daß auch jedes Bild nur ein Original besitzt / heißt Abbildung von A auf B (oder surjektiv), falls gilt: VbeB3aeA((a,b) € /). E 86) Eine injektive und surjektive Abbildung heißt bijektiv. Für bijektive Abbildungen f: A —> B ist die inverse Relation eine Abbildung /_1: B —* A, die sogenannte Umkehrabbildung von /. Das Relationenprodukt, auf Abbildungen angewandt, charakterisiert die Hintereinanderausfuhrung von Abbildungen- Sind /: A —> B und gvB —> C Abbildungen, so ist / o g eine Abbildung von A nach C, und es gilt (/°5)(a) = <?(/(«))¦ E 87) Man beachte die Reihenfolge von / und g in dieser Gleichung (unterschiedliche Handhabung in der Literatur'). 5.2.4 Äquivalenz- und Ordnungsrelationen Die wichtigsten Klassen binärer Relationen in einer Menge A sind die Äquivalenz- und Ordnungsrelationen 1. Äquivalenzrelationen Eine binäre Relation R in einer Menge A heißt Aquivalenzrelation, wenn R reflexiv, symmetrisch und transitiv ist. Für aRb verwendet man in diesem Falle auch die Bezeichnung a ~# b oder o ~ 6, wenn die Aquivalenzrelation R aus dem Zusammenhang bekannt ist, und sagt, a ist äquivalent zu b (bezüglich R) ¦ Beispiele für Aquivalenzrelationen. A: A = Z , m E N \ {0} Es gilt a ~# b genau dann, wenn a und b bei Division durch m den gleichen Rest lassen (Kongruenzrechnung modulo m). B: Gleichheitsbeziehung in unterschiedlichen Bereichen, z.B in der Menge Q der rationalen Zahlen: — = — <{=> pi#2 = P2Q1> wobei das erste Gleichheitszeichen die Gleichheit in Q definiert, während das Qi 0.2 zweite die Gleichheit in Z bezeichnet. C: Ähnlichkeit oder Kongruenz geometrischer Figuren. D: Logische Äquivalenz aussagenlogischer Ausdrücke (s. 5 1 1,6., S 296) 2. Äquivalenzklassen, Zerlegungen 1. Äquivalenzklassen Eine Aquivalenzrelation in einer Menge A bewirkt eine Aufteilung von A in nicht leere paarweise disj unkte Teilmengen, Aquivalenzklassen [a]R :={b\beAAa~Rb} E 88) heißt Aquivalenzklasse von a bezüglich R. Für Aquivalenzklassen gilt. Wä^0, a~Rb<*[a]R = [b]R und a ^R b <s> [a}R n [b]R = 0 E 89) Diese Aquivalenzklassen werden zu einer neuen Menge, der Faktormenge A/R, zusammengefaßt A/R={[a}R\aeA} E.90) Eine Teilmenge Z C P(A) der Potenzmenge P(j4) heißt Zerlegung von A, wenn 0^z, x,yeZAX^Y^xnY = 0, \Jx = A. E91) xez 2. Zerlegungssatz Jede Aquivalenzrelation R in einer Menge A bewirkt eine Zerlegung Z von A, nämlich Z = A/R. Umgekehrt bestimmt jede Zerlegung Z einer Menge A eine Aquivalenzrelation R mA: a ~ß b & 3 X e Z (a G X A b € X) E 92)
5.2 Mengenlehre 307 Man kann eine Aquivalenzrelation in einer Menge A als Verallgemeinerung der Gleichheitsbeziehung auffassen, wobei von „unwesentlichen" Eigenschaften der Elemente von A abstrahiert wird und Elemente, die sich bezüglich einer gewissen Eigenschaft nicht unterscheiden, zu einer Aquivalenzklasse zusammengefaßt werden. 3. Ordnungsrelationen Eine binäre Relation R in einer Menge A heißt Ordnung(-srelation), wenn R reflexiv, antisymmetrisch und transitiv ist Ist R zusätzlich linear (s. E.81)), so heißt R vollständige Ordnung(-srelation) oder Kette Die Menge A heißt dann durch R geordnet bzw vollständig geordnet. In einer vollständig geordneten Menge sind also je zwei Elemente vergleichbar. Statt aRb verwendet man auch die Bezeichnung a<nb oder a < b, wenn die Ordnungsrelation R aus dem Zusammenhang bekannt ist. Anstelle von Ordnung ist auch die Bezeichnung Halbordnung oder partielle Ordnung üblich ¦ Beispiele für Ordnungsrelationen. A: Die Zahlenbereiche IN, Z, Q, R sind durch die übliche <-Beziehung vollständig geordnet B: Die Teilmengenbeziehung ist eine Ordnung, die nicht vollständig ist. C: Die lexikographische Ordnung auf den Wörtern der deutschen Sprache ist eine Kette. Hinweis: Ist Z = {A, B} eine Zerlegung von Q mit der Eigenschaft a£AAb£B=>a<b, so heißt (A, B) DEDEKiNDscher Schnitt Hat weder A ein größtes Element noch B ein kleinstes Element, so wird durch diesen Schnitt eindeutig eine irrationale Zahl bestimmt. Außer der Intervallschachtelung (s 1.1.1.2, S. 1) sind die DEDEKiNDschen Schnitte eine weitere Möglichkeit, die irrationalen Zahlen einzuführen (s auch Hinweis auf S 301) 4. HASSE-Diagramme Endliche geordnete Mengen werden durch HASSE -Diagramme dargestellt: Auf einer endlichen Menge A sei eine Ordnungsrelation < gegeben. Die Elemente von A werden als Punkte in der Ebene dargestellt, wobei der Punkt zu b G A oberhalb des Punktes zu a G A liegen soll, falls a < b gilt. Gibt es außerdem kein c G A mit a < c < b - man sagt, a und b sind benachbart - so werden a und b durch eine Strecke verbunden. Ein HASSE-Diagramm ist also ein „abgerüstetes" Pfeildiagramm, bei dem alle Schlingen, Pfeilspitzen und alle Pfeile, die sich aus der Transitivität der Relation ergeben, weggelassen sind. In Abb.5.7 ist das Pfeildiagramm zur Teilbarkeitsrelation T auf der Menge A = {1,2,3,4} angegeben. Mit T ist eine Ordnungsrelation bezeichnet, die durch das HASSE-Diagramm in Abb.5.8 dargestellt ist. 5.2.5 Mächt igkeit von Mengen In 5 2 1, S 299 wurde die Anzahl der Elemente einer endlichen Menge als Kardinalzahl bezeichnet. Dieser Anzahlbegriff soll auf unendliche Mengen übertragen werden 1. Mächtigkeit, Kardinalzahl Zwei Mengen A, B heißen gleichmächtig, falls es zwischen ihnen eine bijektive Abbildung gibt. Jeder Menge A wird eine Kardinalzahl \A\ oder caidA zugordnet, so daß gleichmacht ige Mengen die gleiche Kardinalzahl erhalten Eine Menge ist zu ihrer Potenzmenge niemals gleichmächtig, so daß es keine ,,größte" Kardinalzahl gibt 2. Unendliche Mengen Unendliche Mengen sind dadurch charakterisiert, daß sie echte Teilmengen besitzen, die zur Gesamtmenge gleichmächtig sind Die „kleinste" unendliche Kardinalzahl ist die Kardinalzahl der Menge IN der natürlichen Zahlen Sie wird mit Ko (aleph 0) bezeichnet Eine Menge heißt abzählbar (unendlich), wenn sie zu IN gleichmächtig ist. Das bedeutet, ihre Elemente lassen sich durchnumerieren bzw. als unendliche Folge a\, 02, schreiben. Eine Menge heißt überabzählbar (unendlich), wenn sie unendlich, aber nicht gleichmächtig zu N ist. 4. U Abbildung 5 8
308 5. Algebra und Diskrete Mathematik Demzufolge ist jede nicht abzählbare (unendliche) Menge überabzählbar (unendlich). ¦ A: Die Menge Z der ganzen Zahlen und die Menge Q der rationalen Zahlen sind abzählbar (unendlich). ¦ B: Die Menge R der reellen Zahlen und die Menge C der komplexen Zahlen sind überabzählbar (unendlich). Beide Mengen sind gleichmächtig. Ihre Kardinalzahl wird mit c bezeichnet; c heißt auch Mächtigkeit des Kontinuums. 5.3 Klassische algebraische Strukturen 5.3.1 Operationen 1. n-stellige Operationen Der Strukturbegriff spielt in der Mathematik und ihren Anwendungen eine zentrale Rolle Hier sollen algebraische Strukturen behandelt werden, d.h. Mengen, auf denen Operationen erklärt sind. Eine n- stellige Operation ip in einer Menge A ist eine Abbildung (p: An —> A, die jedem n-Tupel von Elementen aus A wieder ein Element aus A zuordnet. 2. Eigenschaften binärer Operationen Besonders wichtig ist der Fall n = 2 , wobei man von binären Operationen spricht, z.B. Addition und Multiplikation von Zahlen bzw. Matrizen oder Vereinigung und Durchschnitt von Mengen Eine binäre Operation ist also eine Abbildung * : A x A —* A, wobei man anstelle von „*(a, b)u in der Regel die Infixschreibweise „a * 6" benutzt Eine binäre Operation * in A heißt assoziativ, falls (o * b) * c = a * (b * c), E.93) und kommutativ, falls a * b = b * a E.94) jeweils für alle a, 6, c € A gilt Ein Element e G A heißt neutrales Element bezüglich einer binären Operation * in A, falls gilt. a* e = e * a = a für alle a € A. E 95) 3. Äußere Operationen Manchmal werden auch äußere Operationen betrachtet. Das sind Abbildungen von K x A in K, wobei K eine „äußere", meist auch selbst strukturierte Menge ist (s. 5 3.7, S. 327). 5.3.2 Halbgruppen Oft auftretende algebraische Strukturen haben besondere Namen bekommen. Eine Menge i/, versehen mit einer assoziativen binären Operation * , heißt Halbgruppe; Bezeichnung H = (//",*) Beispiele für Halbgruppen: ¦ A: Zahlenbereiche bezüglich Addition oder Multiplikation, ¦ B: Potenzmenge bezüglich Vereinigung oder Durchschnitt, ¦ C: Matrizen bezüglich Addition oder Multiplikation, ¦ D: Menge A* aller „Wörter" (strings) über einem „Alphabet" A bezüglich Hintereinanderschrei- bung (Worthalbgruppe) Hinweis: Bis auf die Multiplikation von Matrizen und die Hintereinanderschreibung von Wörtern sind alle in den Beispielen vorkommenden Operationen kommutativ; man spricht dann von kommutativen Halbgruppen.
5 3 Klassische algebraische Strukturen 309 5.3.3 Gruppen 5.3.3.1 Definition und grundlegende Eigenschaften 1. Definition Eine Menge G, versehen mit einer binären Operation * , heißt Gruppe, wenn • * assoziativ ist, • * ein neutrales Element e besitzt und zu jedem Element a G G ein inverses Element a~l existiert, mit a*a~x = a~l * a = e. E.96) Eine Gruppe ist also eine spezielle Halbgruppe. Das neutrale Element einer Gruppe ist eindeutig bestimmt. Außerdem besitzt jedes Gruppenelement genau ein Inverses. Ist die Operation * kommutativ, so spricht man von einer ABELschen Gruppe. Ist die Gruppenoperation als Addition + geschrieben, so wird das neutrale Element mit 0 und das inverse Element eines Elementes a mit — a bezeichnet. Beispiele für Gruppen: ¦ A: Zahlenbereiche (außer N) bezüglich Addition ¦ B: Q \ {0} , R \ {0} und C \ {0} bezüglich Multiplikation. ¦ C: Sm — {/ ' M —> M A / bijektiv} bezüglich Hintereinanderausführung von Abbildungen (symmetrische Gruppe). ¦ D: Man betrachte die Menge Dn aller Deckabbildungen eines regelmäßigen n-Ecks in der Ebene Dabei beschreibt eine Deckabbildung den Übergang zwischen zwei Symmetrielagen des n-Ecks, d h die Bewegung des n-Ecks in eine deckungsgleiche Lage Werden mit d eine Drehung um 2n/n und mit a die Spiegelung an einer Achse bezeichnet, so hat Dn 2n Elemente: Dn = {e,d,d2,...,dn-\a,d<j,. ,dn-la}. Bezüglich der Hintereinanderausführung von Abbildungen bildet Dn eine Gruppe, die Diedergruppe Dabei gilt dn = a1 = e und ad = dn~1a ¦ E: Alle regulären Matrizen (s. 4.1.4, S 262) über den reellen bzw komplexen Zahlen bezüglich Multiplikation. Hinweis: Matrizen spielen in Anwendungen eine besondere Rolle, insbesondere zur Darstellung linearer Transformationen. Lineare Transformationen lassen sich durch Matrizengruppen klassifizieren 2. Gruppentafeln oder Cayley-Tafeln Zur Darstellung endlicher Gruppen werden Gruppen- oder CAYLEY-Tafeln verwendet: Man notiert die Gruppenelemente als Zeilen- und Spalteneingänge An der Kreuzung der Zeile mit dem Eingang a und der Spalte mit dem Eingang b steht das Gruppenelement a * b. ¦ Ist M = {1,2,3} , so bezeichnet man die symmetrische Gruppe Sm auch mit Ss . Die Ss besteht also aus allen bijektiven Abbildungen (Permutationen) auf der Menge {1,2,3} und hat demzufolge 3' = 6 Elemente (s. 16.1.1, S. 768). Permutationen werden meist zweizeilig notiert, indem man in die erste Zeile die Elemente von M und darunter die jeweiligen Bildelemente schreibt. So erhält man die 6 Elemente der 53 folgendermaßen P3 (l 2 3\ (l 2 3\ (\ 2 3\ = {l 2 3j' P' = {l 3 2j'P2=U 2 lj' (l 2 3\ fl 2 3\ (l 2 3\ = \2 1 3j'^=U 3 lJ'P5=U 1 2) E.97) Durch Hintereinanderausführung (binärer Operationen o) von Abbildungen erhält man für Ss folgende Gruppentafel.
310 5. Algebra und Diskrete Mathematik o £ Pl V* Pz PA Pb £ Pl P2 P3 PA Pb £ Pi Pi Pz Pa Pb P\ e p5 p4 P3 P2 Pl PA £ Pb Pl P3 P3 Pb Pa £ Pi Pi PA P2 P3 Pl Pb € Pb P3 Pi P2 £ Pa • Aus der Gruppentafel erkennt man, daß die identische Permutation e das neutrale Element der Gruppe ist • In der Gruppentafel kommt jedes Element in jeder Zeile /_ q^ und jeder Spalte genau einmal vor. • Das Inverse zu einem Gruppenelement ist aus der Tafel leicht ablesbar; so ist das Inverse zu p± in der 53 die Per Imitation p§ , da an der Schnittstelle der p4-Zeile mit der p5- Spalte das neutrale Element e steht • Ist die Gruppenoperation kommutativ (AßELsche Gruppe), so ist die Tafel symmetrisch bezüglich der „Hauptdiagonalen"; die 53 ist nicht kommutativ, da z.B. p\op2 ^ p2 opi • Das Assoziativgesetz ist aus der Gruppentafel nicht ablesbar. 5.3.3.2 Untergruppen und direkte Produkte 1. Untergruppen Es sei G = (G, *) eine Gruppe und U C G. Ist U bezüglich * wieder eine Gruppe, so heißt U = (U, *) eine Untergruppe von G. Eine nichtleere Teilmenge U einer Gruppe (G, *) ist genau dann Untergruppe von G, wenn für alle a, b G U auch a * b und a~l mU liegen (Untergruppenkriterium) 1. Zyklische Untergruppen Die Gruppe G selbst und E = {e} sind Untergruppen von G, die trivialen Untergruppen. Außerdem bestimmt jedes Element aG(? eine Untergruppe, die von a erzeugte zyklische Untergruppe < a > = { .., o-2, a~\ e, a, a2,...} . E.99) Ist die Gruppenoperation eine Addition, so schreibt man statt der Potenzen ak als Abkürzung für die /c-fache Verknüpfung von a mit sich selbst ganzzahlige Vielfache ka als Abkürzung für die /c-fache Addition von a mit sich selbst, d.h. < a > = {..., (-2)a, -a, 0, a, 2a,...} . E.100) Dabei ist < a > die kleinste Untergruppe von G, die a enthält. Gilt < a > = G für ein Element a aus G, so heißt G zyklisch. Es gibt unendliche zyklische Gruppen, wie Z bezuglich der Addition, und endliche zyklische Gruppen, wie die Restklassenaddition in der Menge Zm der Restklassen modulo m (s 5 4.3,3., S. 337). ¦ Ist die Elementeanzahl einer endlichen Gruppe G eine Primzahl, so ist G stets zyklisch 2. Verallgemeinerung Man kann den Begriff der zyklischen Gruppe wie folgt verallgemeinern- Ist M eine nichtleere Teilmenge einer Gruppe G, so wird mit < M > die Untergruppe von G bezeichnet, deren Elemente sich sämtlich als Produkt von endlich vielen Elementen aus M und deren Inversen schreiben lassen. Die Teilmenge M heißt dann Erzeugendensystem von < M > . Besteht M nur aus einem Element, dann ist < M > zyklisch. 3. Gruppenordnung, Links- und Rechtsnebenklassen In der Gruppentheorie wird die Elementenzahl einer endlichen Gruppe mit ord G bezeichnet. Ist die von einem Element a einer Gruppe erzeugte zyklische Untergruppe < a > endlich, so heißt deren Ordnung auch Ordnung des Elements a, d.h ord < a > = ord a. Ist U eine Untergruppe einer Gruppe (G, *) und a € G, so heißen die Teilmengen aU := {a * u\u € U} bzw. Ua := {u * a\u G U} E.101) von G Linksnebenklassen bzw. Rechtsnebenklassen von U in G Die Links- bzw Rechtsnebenklassen bilden jeweils eine Zerlegung von G (s. 5.2.4,2., S. 306). Alle Links- oder Rechtsnebenklassen einer Untergruppe U in einer Gruppe G haben die gleiche Anzahl von Elementen, nämlich ord U. Daraus ergibt sich, daß die Anzahl der Linksnebenklassen gleich der Anzahl der Rechtsnebenklassen ist Diese Zahl wird Index von U in G genannt. Aus den genannten Fakten ergibt sich der Satz von LAGRANGE.
5 3 Klassische algebraische Strukturen 311 4. Satz von Lagrange Die Ordnung einer Untergruppe ist stets Teiler der Gruppenordnung. Im allgemeinen ist es schwierig, alle Untergruppen einer Gruppe anzugeben. Im Falle endlicher Gruppen ist der Satz von LAGRANGE als notwendige Bedingung für die Existenz von Untergruppen hilfreich 2. Normalteiler Für Untergruppen U ist im allgemeinen all verschieden von Ua (es gilt jedoch \aU\ = \Ua\) Ist aber aU = Ua für alle o G G, so heißt U Normalteiler von G Diese speziellen Untergruppen sind die Grundlage für die Bildung von Faktorgruppen (s. 5.3.3 3,3., S. 312). In AßELschen Gruppen ist natürlich jede Untergruppe Normalteiler Beispiele für Untergruppen und Normalteiler: ¦ A: R \ {0} , Q \ {0} bilden Untergruppen von C \ {0} bezüglich der Multiplikation. M B: Die geraden ganzen Zahlen bilden eine Untergruppe von Z bezüglich der Addition. ¦ C: Untergruppen der Gruppe £3- Wegen des Satzes von LAGRANGE kann die 6-elementige Gruppe S3 (außer den trivialen Untergruppen) nur Untergruppen mit 2 oder 3 Elementen haben. Tatsächlich hat die Gruppe S3 folgende Untergruppen: E — {e} , U\ = {s,Pi}, U2 = {s,p2} , Uz = {£,£3}, U4 = {£,P4,P5},S3. Die nichttrivialen Untergruppen U\, U2, U3 und t/4 sind zyklisch, weil ihre Elementeanzahlen sämtlich Primzahlen sind. Die 53 ist dagegen nicht zyklisch Außer den trivialen Normalteilern hat die Gruppe Sß nur noch die Untergruppe t/4 als Normalteiler Übrigens ist jede Untergruppe U einer Gruppe G mit \U\ = \G\/2 Normalteiler von G. Alle symmetrischen Gruppen 5m und ihre Untergruppen werden Permutationsgruppen genannt. ¦ D: Spezielle Untergruppen der Gruppe GL(n) aller regulären Matrizen vom Typ (n, n) bezüglich der Matrizenmultiplikation. SL(n) Gruppe aller Matrizen A mit der Determinante 1, 0(n) Gruppe aller orthogonalen Matrizen, SO(n) Gruppe aller orthogonalen Matrizen mit der Determinante 1. Die Gruppe SL(n) ist Normalteiler von GL(n) (s. 5.3.3 3,3., S 312) und SO(n) Normalteiler von 0{n). ¦ E: Als Untergruppen der Gruppe aller regulären komplexen Matrizen seien erwähnt (s. 4 1 4, S. 262)- U(n) Gruppe aller unitären Matrizen, SU(n) Gruppe aller unitären Matrizen mit der Determinante 1. 3. Direkte Produkte 1. Definition Es seien A und B Gruppen, deren Gruppenoperation (z B Addition oder Multiplikation) mit • bezeichnet sein soll. Im kartesischen Produkt (s 5.2 2,4., S. 303) A x B E.65a) kann man durch die folgende Vorschrift eine Operation * einführen: (ai, fei) * (a2, b2) — (a,\ • a2, fei • b2) E.102a) Damit wird A x B zu einer Gruppe, die das direkte Produkt von A und B genannt wird. Mit (e, e) wird das Einselement von A x B bezeichnet, (a_1, fe-1) ist das inverse Element zu (o, fe). Für endliche Gruppen A, B gilt ordAx B = oidA- ordB E.102b) Die Giuppen A! := {(o, e)\a € A} bzw. B' := {(e, fe)|fe G B} sind zu A bzw. B isomorphe Normalteiler von Ax B. Das direkte Produkt AßELscher Gruppen ist wieder abelsch. Für zyklische Gruppen gilt: Das direkte Produkt zweier zyklischer Gruppen A, B ist genau dann zyklisch, wenn der größte gemeinsame Teiler der Gruppenordnungen gleich 1 ist. ¦ A: MitZ2 = {e,a}undZ3 = {e,fe,fe2} wird Z2 x Z3 = {(e,e), (e, fe), (e,fe2), (a,e), (a, fe), (a,fe2)} eine zu Z6 isomorphe Gruppe (s. 5 3 3.3,2., S 312), die u.a von (a, fe) erzeugt wird. ¦ B: Andererseits ist Z2xZ2 = {(e, e), (e, fe), (a, e), (a, fe)} nicht zyklisch. Diese Gruppe der Ordnung 4 wird auch KLEiNsche Vierergruppe genannt und beschreibt die Deckabbildungen eines Rechtecks
312 5 Algebra und Diskrete Mathematik 2. Basissatz für Abelsche Gruppen Da die Bildung des direkten Produktes eine Konstruktion ist, mit der aus „kleineren" Gruppen „größere" gewonnen werden, entsteht umgekehrt die Frage, wann lassen sich große Gruppen G als direktes Produkt kleinerer Gruppen A, B darstellen, d.h., wann ist G isomorph zuixß? Für AßELsche Gruppen gibt darüber der sogenannte Basissatz Auskunft. Jede endliche AßELsche Gruppe ist als direktes Produkt zyklischer Gruppen von der Primzahlpotenzordnung darstellbar 5.3.3.3 Abbildungen zwischen Gruppen 1. Homomorphismen und Isomorphismen 1. Gruppenhomomorphismus Zwischen algebraischen Strukturen werden nicht beliebige, sondern „strukturerhaltende" Abbildungen betrachtet: Es seien G\ = (Gi, *) und G2 = {G2, o) Gruppen. Eine Abbildung h G\ —> G2 heißt Gruppenhomomorphismus, wenn für alle a, b € G\ gilt h(a *b) = h(a) o h(b) („Bild des Produktes = Produkt der Bilder"). E 103) ¦ Als Beispiel sei der Multiplikationssatz für Determinanten (s 4.2 2,7., S 269) erwähnt. det(AB) = (det A)(det B). E 104) Dabei ist auf der linken Seite der Gleichung die Multiplikation reeller Zahlen (ungleich Null) und auf der rechten Seite die Multiplikation von regulären Matrizen gemeint Ist h: Gi —? G2 ein Gruppenhomomorphismus, so wird die Menge ker h aller Elemente von G\, die auf das neutrale Element von G2 abgebildet werden, Kern von h genannt Der Kern von h erweist sich als Normalteiler von G\. 2. Gruppenisomorphismus Ist ein Gruppenhomomorphismus h darüber hinaus bijektiv, so heißt h Gruppenisomorphismus, und die Gruppen G\ und G2 heißen zueinander isomorph (Bezeichnung: Gi = G2). Es gilt ker h = E Isomorphe Gruppen sind von gleicher Struktur, d.h., sie unterscheiden sich nur durch die Bezeichnung ihrer Elemente. ¦ Die symmetrische Gruppe S3 und die Diedergruppe D3 sind zueinander isomorphe Gruppen der Ordnung 6 und beschreiben die Deckabbildungen eines gleichseitigen Dreiecks. 2. Satz von Cayley Der Satz von Cayley beinhaltet, daß durch die Permutationsgruppen (s 5 3 3 2,2., S. 311) alle Gruppen strukturell beschrieben werden können Jede Gruppe ist zu einer Permutationsgruppe isomorph Eine zu (<?, *) isomorphe Permutationsgruppe P ist die aus den Permutationen irg (g € G), die a auf a * g abbilden, bestehende Untergruppe der Sc • Dabei ist ein zugehöriger Isomorphismus f.G—>P durch f(g) = ng gegeben 3. Homomorphiesatz für Gruppen Die Menge der Nebenklassen eines Normalteilers ./V in einer Gruppe G wird bezüglich der Operation aNobN = abN E 105) zu einer Gruppe, der Faktorgruppe von G nach N , die mit G/N bezeichnet wird. Der folgende Satz beschreibt einen Zusammenhang zwischen homomorphen Bildern und Faktorgruppen einer Gruppe und wird deshalb Homomorphiesatz für Gruppen genannt Ein Gruppenhomomorphismus h' G\ —? G2 bestimmt einen Normalteiler von Gi, nämlich ker h = {a € Gi\h(a) = e} . Die Faktorgruppe Gi/kerh ist isomorph zum homomorphen Bild h(G\) = {h(a)\a € Gi} . Umgekehrt bestimmt jeder Normalteiler iV von Gi eine homomorphe Abbildung nat^' G\ —? Gi/N mit nat^j(a) = aN. Diese Abbildung natu wird natürlicher Homomorphismus genannt. ¦ Weil die Determinantenbildung det: GL(n) —*¦ R\ {0} ein Gruppenhomomorphismus mit dem Kern SL(n) ist, bildet SL(n) einen Normalteiler von GL(n), und es gilt (nach dem Homomorphiesatz)- GL{n)/SL{ri) ist isomorph zur multiplikativen Gruppe R \ {0} der reellen Zahlen (Bezeichnungen s 5 33 2,2., S 311)
5 3 Klassische algebraische Strukturen 313 5.3.4 Darstellung von Gruppen* 5.3.4.1 Definitionen 1. Darstellung Eine Darstellung D(G) der Gruppe G ist eine Abbildung (Homomorphismus) von G auf die Gruppe nichtsingulärer linearer Transformationen D in einem n-dimensionalen (reellen oder komplexen) Vektorraum Vn : D(G) a^D{a), aeG. E.106) Der Vektorraum Vn heißt Darstellungsraum, n ist die Dimension der Darstellung (s. auch 12.1.3,2., S 619) Nach Einführung einer Basis {e^} (i = 1,2, , n) in Vn kann jeder Vektor x als Linearkombination der Basisvektoren geschrieben werden x = JTxiei, xeVn E 107) Die Wirkung der linearen Transformation D(a), a G G auf x läßt sich durch eine quadratische Matrix (Dik(a)) (z, k — 1, 2, , n) definieren, die die Koordinaten des transformierten Vektors x' in der Basis ei liefert- n n x' = D(a)x = Y, x'iZi, x'i = Y, Dik{o)xk . E.108) t=l fc=l Diese Transformation kann auch als Basistransformation je*} —? {ej} aufgefaßt werden. e'i = eiD{a) = JTDki{a)ek E.109) fc=i Damit wird jedem Gruppenelement a eine Darstellungsmatrix (Dik(a)) zugeordnet D{G) a^{Dik{a)) (i, k = 1,2,... ,n) ,a G G E.110) Die Darstellungsmatrix hängt von der Wahl der Basis ab. 2. Treue Darstellung Bei einer treuen Darstellung ist G —> D(G) ein Isomorphismus, d h , die Zuordnung von Gruppenelement und Darstellungsmatrix ist eineindeutig. 3. Eigenschaften der Darstellung Eine Darstellung besitzt folgende Eigenschaften (a, b G G, / . Einheitsoperator). D(a*b) = D(a)-D{bI D(a~l) = D~\a), D(e) = I. E 111) 5.3.4.2 Spezielle Darstellungen 1. Identische Darstellung Jede Gruppe G besitzt eine triviale eindimensionale Darstellung (identische Darstellung), bei der jedes Gruppenelement dem Einheitsoperator / zugeordnet wird, a —? / für alle aeG 2. Adjungierte Darstellung Die zu D(G) adjungierte Darstellung D+(G) geht aus D(G) durch komplexe Konjugation und Spiegelung an der Hauptdiagonalen der Darstellungsmatrix hervor D+(G) = D*(G) E 112) 3. Unitäre Darstellung Bei einer unitären Darstellung sind alle Darstellungsmatrizen unitär: D(G)-D+(G) = E, E 113) wobei E die Einheitsmatrix ist *In diesem Abschnitt sind Vektoren im allgemeinen nicht fett gesetzt
314 5 Algebra und Diskrete Mathematik 4. Äquivalente Darstellungen Zwei Darstellungen D(G) und D'(G) nennt man äquivalent, wenn für jedes Gruppenelement a die Darstellungsmatrizen durch die gleiche Ahnlichkeitstransformation mit der nichtsingulären Matrix T auseinander hervorgehen. D'(a) = T-1-D(a)-T, D'ik(a) = £ (T). • Dß{a) ¦ Tlk . E 114) 3,1=1 lJ Im entgegengesetzten Falle spricht man von einer inäquivalenten Darstellung Der Übergang von D(G) nach D'{G) entspricht einer Basistransformation T : {ei,e2, . ,en} —> {e\,e'2, .., e|J im Darstellungsraum Vn: n e' = eT, e; = ^Tfciefc (i = 1,2, .,n) E.115) fc=i Jede Darstellung einer endlichen Gruppe ist einer unitären Darstellung äquivalent 5. Charakter eines Gruppenelements Der Charakter x{o) eines Gruppenelements a in einer Darstellung D(G) ist definiert als Spur der Darstellungsmatrix D(a) (Summe der Hauptdiagonalelemente)- x(a) = Sp(D) = £Ai(a). E.116) i=l Der Charakter des neutralen Elemenmts e liefert die Dimension n der Darstellung: \{e) = n. Da die Spur einer Matrix bei Ahnlichkeitstransformationen invariant bleibt, hat das Gruppenelement a in äquivalenten Darstellungen den gleichen Charakter ¦ Es wird eine dreidimensionale Darstellung der symmetrischen Gruppe S3 betrachtet Von drei Teilchen mit den Koordinaten xi,x2, x3 besetzen in einem Schalenmodell der Atom- oder Kernphysik zwei Teilchen den Zustand (pa , und ein Teilchen befindet sich im Zustand tpß (Konfiguration a2ß). Die möglichen Besetzungen ^(xi)^^)^^) = ei, (pa{xi)(pß{x2)(pa{x3) = e2, Vß(xi)<pa{x2)<Pa{x3) = e3 bilden eine Basis {ei, e2, es} in einem dreidimensionalen Vektorraum V3 zur Darstellung der symmetrischen Gruppe 5ß Die Matrixelemente der Darstellungsmatrizen können entsprechend E.109) durch Anwendung der Gruppenelemente E.93) auf die Koordinatenindizes in den Basiselementen t\ gewonnen werden. So gilt z.B. Piei = Plfa{Xl)^a(x2)fß{x3) = Wa(Xi)Vß{x2)ya(x3) = A>l(Pl)e2 , P\e2 = Pi^>a{xi)(fß(x2)(pa(x3) = ^Pa(xi)(pa(x2)ipß(x3) = Du(pi)ei, P\e3 = Pi<Pß(xi)<pa(x2)(pa(x3) = <Pß(xi)(pa(x2)ipa(x3) = D33(pi)e3 . E 117) Man findet insgesamt* /100\ /010\ Z001 D(e) =010, D(pi) =100, D(p2) = 010 \001/ \001/ \100 /ioo\ /010\ /°01 D(pa) = 001, D(p4) = 001, D(ps) =100 \oio/ \iooy \oio Für die Charaktere ergibt sich: X(e) = 3, x(Pi) = Xfe) = x(Ps) = 1, x(Pa) = x(Ps) = 0 5.3.4.3 Direkte Summe von Darstellungen Die Darstellungen D^(G), D^2\G) mit den Dimensionen ni,n2 können zu einer neuen Darstellung D(G) mit der Dimension n = n\ + n2 zusammengefaßt werden, indem man die direkte Summe der E 118)
5.3 Klassische algebraische Strukturen 315 Darstellungsmatrizen bildet. D(a) = D<1)(a)$DB)(a)= (D<>)D(°(a)) E 119) Die Block-Diagonalform der Darstellungsmatrix bedeutet, daß der Darstellungsraum Vn eine direkte Summe von invarianten Unterräumen Vni, Vn2 ist: Vn = Vni©Vn2, n = n1+n2. E.120) Ein Unterraum Vm (m < n) von Vn heißt invarianter Unterraum, wenn bei jeder linearen Transformation D(a), a G G jeder Vektor x G Vm wieder auf ein Element aus Vm abgebildet wird: x'= D(a)x mit x,x' G Vm E.121) Der Charakter der Darstellung E.119) ist die Summe der Charaktere der Einzeldarstellungen* X(a) = xA)(«) + XB)(a) E 122) 5.3.4.4 Direktes Produkt von Darstellungen Sind ei (i = 1,2, ,n\) und e'k (k = 1,2,...,n{) die Basisvektoren der Darstellungsräume Vni und Vn2, dann bilden die Tensorprodukte eik = {eiek} (i = 1.2,... ,nx, k = 1,2,... ,n2) E 123) eine Basis im Produktraum Vni ® Vn2, der die Dimension n\ • n2 hat. Aus den Darstellungen D^(G) und D^2\G) in Vni bzw. Vn2 kann man eine rii • n2-dimensionale Darstellung D(G) im Produktraum gewinnen, indem das direkte Produkt oder (innere) KRONECKER-Produkt der Darstellungsmatrizen bildet: D(G) = DM(G) ® Wie), (D(G))ikJl = D\l\a) • Df[a) mit i,k = 1,2,...,ri!, j,l = 1,2, . ,n2. E.124) Der Charakter des KRONECKER-Produktes zweier Darstellungen ist gleich dem Produkt der Charaktere der Faktoren- x(lx2)(a) = x(l)(a).xB)(a) E125) 5.3.4.5 Reduzible und irreduzible Darstellungen Wenn der Darstellungsraum Vn einen gegenüber den Gruppenoperationen invarianten Unterraum Vm (m < n) besitzt, dann können die Darstellungsmatrizen durch eine geeignete Basistransformation T in Vn auf die Form gebracht werden. Di(o) und D2(a) sind selbst Matrixdarstellungen von a G G mit den Dimensionen m bzw. n — m Existiert in Vn kein echter invarianter Unterraum, dann nennt man die Darstellung D(G) irreduzibel. Die Anzahl der inäquivalenten irreduziblen Darstellungen einer endlichen Gruppe ist endlich. Läßt sich eine Basistransformation T finden, die Vn in eine direkte Summe von invarianten Teilräumen überführt, dh. Vn = V!©.--eVnj, E-127) dann geht die Darstellungsmatrix D(a) für jedes a G G nach einer Ahnlichkeitstransformation mit T in Block-Diagonalform (A = 0 in E.126)) über /D^(a) 0 \ T-1.D(a)-T = DA)(a)e---eD(n^)(a)= '-. . E.128) \ 0 D^)(a)j
316 5. Algebra und Diskrete Mathematik Eine solche Darstellung heißt vollständig reduzibel. Hinweis: Bei naturwissenschaftlichen Anwendungen der Gruppentheorie besteht eine fundamentale Aufgabe darin, die Klassifizierung aller inäquivalenten irreduziblen Darstellungen einer gegebenen Gruppe zu finden. ¦ Die in E 118) angegebene Darstellung der symmetrischen Gruppe 53 ist reduzibel Durch die Basistransformation {ei,e2,es} —? {e^ = e\ + e2 + 63, e'2 = e2, e3 = e3} erhält man z.B für die Darstellungsmatrix der Permutation p3: mit A = f p> J , Di(p3) = 1 als identische Darstellung von 53 und D2(p3) — ( 1 n 5.3.4.6 Erstes Schursches Lemma Wenn C ein Operator ist, der mit allen Transformationen einer irreduziblen Darstellung D einer Gruppe kommutiert, d.h., es gilt [C, D(a)] = C • D(a) — D(a) • C = 0, a £ G, und der Darstellungsraum Vn ein invarianter Unterraum von C ist, dann ist C ein Vielfaches des Einheitsoperators, d.h. eine Matrix (C»*), die mit allen Matrizen einer irreduziblen Darstellung kommutiert, ist ein Vielfaches einer Einheitsmatrix E also C = A • E, A G C 5.3.4.7 Clebsch-Gordan-Reihe Das KRONECKER-Produkt zweier irreduzibler Darstellungen D^(G), D^(G) ist im allgemeinen reduzibel. Durch eine geeignete Basistransformation im Produktraum kann D^(G) ® D^(G) in eine direkte Summe seiner irreduziblen Bestandteile D^ (a = 1,2,..., n) zerlegt werden (CLEBSCH- Gord an-Theorem). Diese Entwicklung nennt man CLEBSCH-GORDAN-iüei/ie* £>A)(G)®£>B)(a) = fem0i)(Q)(G). E.129) Q=l Hier ist mQ die Multiplizität, mit der die irreduzible Darstellung D^Q\G) in der CLEBSCH-GORDAN- Reihe auftritt. Die Matrixelemente der Basistransformation im Produktraum, die eine Reduktion des Kronecker- Produktes in seine irreduziblen Bestandteile bewirkt, heißen ChE&SCYi-GoR'D AN-Koeffizienten 5.3.4.8 Irreduzible Darstellung der symmetrischen Gruppe Sm 1. Symmetrische Gruppe SM Die inäquivalenten irreduziblen Darstellungen der symmetrischen Gruppe Sm werden eindeutig durch die Partitionen [A] von M charakterisiert, d h durch die Aufspaltung von M in ganze Zahlen entsprechend [A] = [Ai, A2,. ., AM], Ai + A2 + • • • + AM = M , \x > A2 > • • • > AM > 0 E.130) Die graphische Darstellung der Partitionen erfolgt durch Kästchen, die zu YouNGschen Rahmen geordnet werden ¦ Für die Gruppe S4 erhält man die fünf, im nebenstehenden Schema dargestellten Young- r^i _ m 13 ^1 \o 21 \2111 H41 sehen Rahmen. ________ ' _ '_ ' ' Die Dimension der Darstellung [A] ist gegeben I I I I I 1 I I ' durch U I I I L| n (Ai-A,+i-z) G nW = M'^^ E 131)
5.3 Klassische algebraische Strukturen 317 Der konjugierte YoUNGsche Rahmen [Ä] geht aus [A] durch Vertauschen von Zeilen und Spalten hervor Irreduzible Darstellungen von Sm sind im allgemeinen reduzibel, wenn man sich auf eine der Untergruppen Sm-i, Sm-2, • •' beschränkt. ¦ Für ein System identischer Teilchen mit halbzahligem Spin verlangt das PAULI-Prinzip in der Quantenmechanik die Konstruktion von Vielteilchen-Wellenfunktionen, die bei Vertauschung aller Koordinaten zweier beliebiger Teilchen antisymmetrisch sind Oft liegt die Wellenfunktion als Produkt aus einer Orts- und einer Spinfunktion vor Transformiert sich in diesem Fall die Ortsfunktion bei Teilchenpermutation nach einer irreduziblen Darstellung [A] der symmetrischen Gruppe, dann muß sie mit einer Spinfunktion kombiniert werden, die sich nach der konjugierten Darstellung [A] transformiert, damit die Gesamt-Wellenfunktion zweier Teilchen bei Vertauschung antisymmetrisch wird. 5.3.5 Anwendungen von Gruppen In der Chemie und der Physik finden Gruppen Anwendung zur Beschreibung der „Symmetrien" der ent- spiechenden Objekte. Solche Objekte sind z B. Moleküle, Kristalle, Festkörperstrukturen oder quantenmechanische Systeme. Diesen Anwendungen liegt das VON NEUMANNsche Prinzip zu Grunde: Wenn ein System eine gewisse Gruppe von Symmetrieoperationen besitzt, dann muß jede physikalische Beobachtungsgröße dieses Systems dieselbe Symmetrie besitzen. 5.3.5.1 Symmetrieoperationen, Symmetrieelemente Unter einer Symmetrieoperation s eines räumlichen Objekts versteht man eine Abbildung des gesamten Raumes in sich, bei der die Streckenlängen unverändert bleiben und das Objekt mit sich zur Deckung kommt Mit Fix s wird die Menge aller Fixpunkte der Symmetrieoperation s bezeichnet, d h die Menge aller Punkte des Raumes, die bei 5 festbleiben. Fix s heißt das Symmetrieelement von s Zur Bezeichnung der Symmetrieoperation wird die SCHOENFLIESS-Symbolik verwendet Man unterscheidet zwei Typen von Symmetrieoperationen, Operationen ohne Fixpunkt und Operationen mit mindestens einem Fixpunkt. 1. Symmetrieoperationen ohne Fixpunkt, bei denen kein Punkt des Raumes fest bleibt, können bei begrenzten räumlichen Objekten, und nur solche sollen hier betrachtet werden, nicht auftreten. Eine Symmetrieoperation ohne Fixpunkt ist z B. eine Parallel Verschiebung 2. Symmetrieoperationen mit mindestens einem Fixpunkt sind z.B. Drehungen und Spiegelungen. Zu ihnen gehören folgende Operationen. a) Drehungen bezüglich einer Achse um einen Winkel ip: Für ip = 2n/n bezeichnet man sowohl die Drehachse als auch die Drehung selbst mit Cn Die Drehachse heißt dann n-zählig b) Spiegelungen an einer Ebene: Sowohl die Spiegelungsebene als auch die Spiegelung selbst werden mit a bezeichnet. Ist zusätzlich eine Hauptdrehachse vorhanden, so zeichnet man diese senkrecht und bezeichnet Spiegelungsebenen, die senkrecht auf dieser Achse stehen, mit a^ (h von horizontal) und Spiegelungsebenen, die durch die Drehachse gehen, mit av (v von vertikal) oder ad (d von dihe- dral, wenn dadurch gewisse Winkel halbiert werden) c) Drehspiegelungen: Eine Operation, die dadurch entsteht, daß nach einer Drehung Cn eine Spiegelung Gh erfolgt, heißt Drehspiegelung und wird mit Sn bezeichnet Drehung und Spiegelung sind dabei vertauschbar. Die Drehachse heißt dann Drehspiegelungsachse n-ter Ordnung und wird ebenfalls mit Sn bezeichnet Diese Achse nennt man zugehöriges Symmetrieelement, obwohl bei der Anwendung der Operation Sn nur das Symmetriezentrum fest bleibt. Für n = 2 heißt eine Drehspiegelung auch Punktspiegelung oder Inversion (s. 4 3 5.1, S.277) und wird mit i bezeichnet. 5.3.5.2 Symmetriegruppen Zu jeder Symmetrieoperation S gibt es eine inverse Operation S~l, die S wieder „rückgängig" macht, d h , es gilt SS-1 = S~1S = e E 132)
318 5 Algebra und Diskrete Mathematik Dabei bezeichnet e die identische Operation, die den gesamten Raum unverändert läßt. Die Gesamtheit der Symmetrieoperationen eines räumlichen Objektes bildet bezüglich der Hintereinander-Ausführung eine Gruppe, die im allgemeinen nichtkommutative Symmetriegruppe des Objektes. Dabei gelten die folgenden Beziehungen- a) Jede Drehung ist das Produkt zweier Spiegelungen. Die Schnitt gerade der beiden Spiegelungsebenen ist die Drehachse. b) Für zwei Spiegelungen er und er' gilt erer' = cr'cr E.133) genau dann, wenn die zugehörigen Spiegelungsebenen identisch sind oder senkrecht aufeinander stehen. Im ersten Fall ist das Produkt die Identität e, im zweiten die Drehung C2 c) Das Produkt zweier Drehungen mit sich schneidenden Drehachsen ist wieder eine Drehung, deren Achse durch den Schnittpunkt der gegebenen Drehachsen geht. d) Für zwei Drehungen C2 und C2 um dieselbe oder um zwei zueinander senkrechte Achsen gilt C2C'2 = C'2C2. E.134) Das Produkt ist jeweils wieder eine Drehung. Im ersten Fall ist die zugehörige Drehachse die gegebene, im zweiten steht die Drehachse senkrecht auf den beiden gegebenen. 5.3.5.3 Symmetrieoperationen bei Molekülen Es erfordert viel Routine, um alle Symmetrieelemente eines Objektes zu erkennen. In der Literatur, z.B. in [5.17], [5.19], [5.24], ist ausführlich beschrieben, wie man die Symmetriegruppen von Molekülen erhält, wenn alle Symmetrieelemente bekannt sind Zur räumlichen Darstellung der Moleküle kann die folgende Symbolik verwendet werden: Das Zeichen oberhalb C in Abb.5.9 bedeutet, daß sich hier die OH-Gruppe über der Zeichenebene befindet, das Zeichen rechts neben C, daß sich die OC2H5-Gruppe unter ihr befindet Die Bestimmung der Symmetriegruppe kann mit Hilfe des folgenden Verfahrens erfolgen 1. Keine Drehachse a) Existiert überhaupt kein Symmetrieelement, so ist G = {e}, d.h., außer der Identität e läßt das Molekül keine Symmetrieoperationen zu. ¦ Das Molekül Halbacetal (Abb.5.9) ist nicht eben und besitzt vier verschiedene Atomgruppen. b) Ist er eine Spiegelung bzw. i eine Inversion, so ist G = {e, er} =: Cs bzw. G = {e, i] = d und damit jeweils isomorph zu Z2 . ¦ Das Molekül der Traubensäure (Abb.5.10) kann im Mittelpunkt P gespiegelt werden (Inversion). CH, OH T CIN" OC2H5 H Abbildung 5.9 H T HO Clin- C02H I p C02H^£ OH H Abbildung 5.10 H*c Abbildung5.11 2. Genau eine Drehachse C a) Sind Drehungen um beliebige Winkel möglich, d.h. C = C^, so ist das Molekül linear, und die Symmetriegruppe ist unendlich.
5.3 Klassische algebraische Strukturen 319 ¦ A: Beim Molekül des Kochsalzes vom Typ Na—Cl gibt es keine horizontale Spiegelung. Die dazugehörige Symmetriegruppe aller Drehungen um C wird mit CooV bezeichnet. ¦ B: Das Molekül O2 besitzt eine horizontale Spiegelung. Die dazugehörige Symmetriegruppe wird durch die Drehungen und diese Spiegelung erzeugt und mit A*^ bezeichnet. b) Die Drehachse ist n-zählig, C = Cn , sie ist aber keine Drehspiegelungsachse der Ordnung 2n. Gibt es keine weiteren Symmetrieelemente, dann wird G von einer Drehung d um den Winkel ir/n um Cn erzeugt, d.h. G = < d > = Zn In diesem Fall wird G ebenfalls mit Cn bezeichnet Gibt es noch eine vertikale Spiegelung crv, so gilt G =< d,crv >= Dn (s.5.3.3.1, S. 309), und G wird mit Cnv bezeichnet Existiert dagegen eine horizontale Spiegelung ah , so gilt G =< d,av >= Zn x Z2. G wird mit Cnh bezeichnet und ist für ungerades n zyklisch (s. 5 3 3.2, S 310). ¦ A: Beim Wasserstoffperoxid (Abb.5.11) treten diese drei Fälle in der oben angegebenen1 Reihenfolge für 0 < ö < 7r/2, S = 0 bzw. S = n/2 ein. ¦ B: Das Wassermolekul H20 besitzt als Symmetrieelemente eine zweizählige Drehachse und eine vertikale Spiegelungsebene. Folglich ist die Symmetriegruppe des Wassers isomorph zur Gruppe D2 , die ihrerseits isomorph zur KLEiNschen Vierergruppe V4 ist (s. 5.3.3.2,3., S. 311) c) Die Drehachse ist n-zählig, ist aber gleichzeitig Drehspiegelungsachse der Ordnung 2n. Dabei sind zwei Fälle zu unterscheiden. a) Gibt es weiter keine vertikale Spiegelung, so gilt G = Z2n , und G wird auch mit £2« bezeichnet. ¦ Ein Beispiel ist das Molekül Tetrahydroxy-Allen mit der Formel C3(OHL (Abb.5.12). ß) Gibt es eine vertikale Spiegelung, dann ist G eine Gruppe der Ordnung An, die mit Dnh bezeichnet wird. ¦ Für n = 2 ergibt sich G = D4 , d.h die Diedergruppe der Ordnung 8. Ein Beispiel ist das Alien- Molekül (Abb.5.13) Abbildung 5.12 Abbildung 5.13 Abbildung 5.14 3. Mehrere Drehachsen Gibt es mehrere Drehachsen, so sind weitere Fallunterscheidungen zu treffen Haben insbesondere mehrere Drehachsen eine Ordnung n > 3 , dann treten folgende Gruppen als zugehörige Symmetriegruppen auf a) Tetraedergruppe T^: isomorph zu S4 , ord Td = 24; b) Oktaedergruppe O^: isomorph zu S4x Z2, ord Oh = 48; c) Ikosaedergruppe 1^: ord h = 120. Diese Gruppen sind die Symmetriegruppen der in 3.3.3,11., S. 158, (Abb.3.63) besprochenen re- 1 gulären Polyeder j ¦ Das Methan-Molekül (Abb.5.14) hat als Symmetriegruppe die Tetraedergruppe Td .
320 5 Algebra und Diskrete Mathematik 5.3.5.4 Symmetriegruppen in der Kristallographie 1. Gitterstrukturen In der Kristallographie wird das Parallelepiped, das unabhängig von der Art der Besetzung durch Atome oder Ionen die Elementarzelle eines Kristallgitters darstellt, durch drei, von einem gewählten Gitterpunkt ausgehende nichtkomplanare Basisvektoren äl bestimmt (Abb.5.15) Die unendliche geometrische Gitterstruktur ergibt sich durch Ausführung aller primitiven Translationen tn : tn = wiäl + n2a2 + n3a^ , n=(ni,n2,n3) n^eZ E 135) Dabei durchlaufen die Koeffizienten ni (« = 1,2,...) alle ganzen Zahlen. Die Gesamtheit aller Translationen tn , die als Gittervektoren die Raumpunkte des Gitters L = {tn} festlegen, bilden die Translationsgruppe T mit dem Gruppenelement T(t„), dem inversen Element T_1(tn) = T(—tn) und der Multiplikationsregel T(t„) * T(tm) = T(tn + tm) Für die Anwendung eines Gruppenelementes T(tn) auf den Ortsvektor r gilt* T(t;)r = r + C E 136) 2. Bravais-Gitter Berücksichtigt man die möglichen Kombinationen der relativen Länge der Basisvektoren äi und der paarweise zugeordneten Zwischenwinkel a, ß, 7 (besondere Winkel 90° und 120°), dann ergeben sich 7 verschiedene Typen von Elementarzellen, sogenannte primitive Elementarzellen mit den entsprechenden Gittern, den BRAVAIS-Gittern (s. Abb.5.15 und Tabelle 5.4). Diese Systematik läßt sich um 7 weitere nichtprimitive Elementarzellen mit ihren Gitter erweitern, indem man bei Erhaltung der Symmetrie der Elementarzelle an den Schnittpunkten der Flächen- oder Raumdiagonalen weitere Gitterpunkte hinzufügt. Dabei unterscheidet man einseitig flächenzentrierte Gitter, innenzentrierte Gitter und allseitig flächenzentrierte Gitter. Tabelle 5.4 Primitive BRAVAIS-Gitter Elementarzelle triklin monoklin rhombisch trigonal hexagonal tetragonal kubisch Längenverhältnis der Basisvektoren öl 7^ Ö2 ^ a3 cn ^ a2 7^ a3 ai + a<2 ¥" a3 cl\ = a2 = a3 ai = a2j^ a3 ai = a2y£ a3 ai = a2 = a3 Zwischenwinkel a ± ß ± 7 ^ 90° a = 7 = 90° ^ ß öl = ß = 7 = 90° a = ß = 7 < 120°(^ 90°) a = /? = 90°,7 = 120° a = ß = 7 = 90° a = ß = 7 = 90° 3. Symmetrieoperationen in Kristallgitterstrukturen Unter den Symmetrieoperationen, die das Raumgitter in äquivalente Lagen überfuhren, sind auch Punkt gruppen-Operationen, wie gewisse Drehungen,'Drehspiegelungen und Spiegelungen an Ebenen oder Punkten Allerdings sind nicht alle Punktgruppen auch kristallographische Punktgruppen Die Forderung, daß die Anwendung der Gruppenelemente auf einen Gittervektor tn wieder einen Gittervektor Vn e L (L. Gesamtheit aller Gitterpunkte) ergeben muß, schränkt die zugelassenen Punktgruppen Abbildung 5.15
5.3 Klassische algebraische Strukturen 321 P mit den Gruppenelementen P(R) ein: &={R ittnGL}, tn€L. E.137) Dabei bedeutet R einen eigentlichen (R G 50C)) oder uneigentlichen Rotationsoperator (R = IR' £ 0C), R' e SO(S),I : Inversionsoperator mit ir = —r, r: Ortsvektor). Mit einer Gitterstruktur verträglich sind z.B. nur Drehachsen mit der Zähligkeit 1,2,3,4 oder 6. Insgesamt gibt es 32 kristallo- graphische Punktgruppen P. Die Symmetriegruppe eines Raumgitters kann auch Operationen enthalten, die aus einer simultanen Ausführung von Drehungen und primitiven Translationen bestehen Auf diese Weise erhält man Gleitspiegelungen, d.h. Spiegelungen an einer Ebene und Translationen parallel zur Ebene, und Schraubungen, d h Rotation um 2n/n und Translationen um raa/n (m = 1,2,..., n — 1, a: Basistranslation). Diese Operationen heißen nicht primitive Translationen V(R), da sie „gebrochenen" Translationen entsprechen. Bei einer Gleitspiegelung ist R eine Spiegelung, bei einer Schraubung ist R eine eigentliche Rotation. Die Elemente der Raumgruppe G, die ein Kristallgitter invariant läßt, setzen sich also aus Elementen R der kristallographischen Punktgruppe P, primitiven Translationen T(tn) und nichtprimitiven Translationen V(jR) zusammen: G = {{R\V(R)+fn:ReP, CeL}}. E.138) Das neutrale Element der Raumgruppe ist {e|0} , wobei e das neutrale Element in P bedeutet. Das Element {e|tn} bedeutet eine primitive Translation, {R\0} steht für eine Drehung oder Spiegelung. Bei der Anwendung des Gruppenelementes {i?|tn} auf den Ortsvektor r erhält man {Ä|tn}r = Är + tn. E.139) Tabelle 5 5 BRAVAIS-Gitter, Kristallsysteme und Kristallklassen Es bedeuten: Cn - Drehung mit einer Drehachse der Zähligkeit n, Dn- Diedergruppe, Tn - Tetraedergruppe, On - Oktaedergruppe, Sn - Drehspiegelungen mit einer Drehachse der Zähligkeit n. Gittertyp triklin monoklin rhombisch tetragonal hexagonal trigonal kubisch Kristallsystem (Holoedrie) Q Cih D2h D4h D6h D3d oh Kristallklasse CuCi C2,Ch,C2h C2v,D2,D2h O4, S4, Oj/i, D4, Ö4V, D2d, D^h Cß, C$h, Cßh, Dß, Oöv, Dsh, D&h Cs,Sg,Ds,Csv,D3A T,Th,Td,0,Oh 4. Kristallsysteme (Holoedrie) Man kann zeigen, daß aus den 14 BRAVAis-Gittern L — {t„} , den 32 kristallographischen Punktgruppen P = {R} und den erlaubten nicht primitiven Translationen V(R) insgesamt 230 Raumgruppen G = {R\V(R) + tn} konstruiert werden können. Den Punktgruppen entsprechen 32 Kristallklassen Unter den 32 Punktgruppen sind 7 Gruppen dadurch ausgezeichnet, daß sie keine Untergruppe einer anderen Punktgruppe sind, aber weitere Punktgruppen als Untergruppe enthalten. Diese 7 Punktgruppen bilden jeweils ein Kristallsystem (Holoedrie). Die Symmetrie der 7 Holoedrien findet sich in
322 5 Algebra und Diskrete Mathematik den Symmetrien der 7 BRAVAIS-Gitter wieder. Die Verteilung der 32 Kristallklassen auf die 7 Kristallsysteme ist in der Bezeichnungsweise von Schönflies in Tabelle 5.5 angegeben Hinweis: Die Raumgruppe G E.138) ist die Symmetriegruppe des „leeren" Gitters Der reale Kristall entsteht, wenn bestimmte Atome oder Ionen als Kristallbausteine auf den Gitterplätzen angeordnet werden, wobei deren Verteilung eine eigene Symmetrie aufweist. Deshalb besitzt die Symmetriegruppe Gq des Kristalls im allgemeinen eine geringere Symmetrie als G (G D G0) 5.3.5.5 Symmetriegruppen in der Quantenmechanik Lineare Koordinatentransformationen, die den HAMILTON-Operator H eines quantenmechanischen Systems (s 9 2.3.5,2., S. 558) invariant lassen, repräsentieren eine Symmetriegruppe G, deren Elemente g mit H kommutieren [g,H}=gH-Hg = 0, 9eG. E.140) Die Vertauschbarkeit von g und H bedeutet, daß bei Anwendung des Operatorproduktes aus g und H auf einen Zustand ip die Reihenfolge der Operatorwirkung beliebig ist g(Htp) = H(g<p) E 141) Folglich gilt. Wenn (pßa (<* = 1,2,..., n) die Eigenzustände von H zum n-fach entarteten Eigenwert E sind, d.h HipEa = E<pEa (a = l,2,...,n), E 142) dann sind auch die transformierten Zustände gtpEa Eigenzustände zum gleichen Eigenwert E gHifEa = HgVEa = Eg^pEa . E 143) Die transformierten Zustände gipEa können als Linearkombinationen der Eigenzustände ipEa geschrieben werden: n QVEa = Y, Dßa(9)^E0 ¦ E 144) 0=1 Die Eigenzustände ipEa bilden demzufolge die Basis eines n-dimensionalen Darstellungsraumes für eine Darstellung D(G) der Symmetriegruppe G des HAMILTON-Operators H mit den Darstellungsmatrizen (Daß(g)). Diese Darstellung ist irreduzibel, wenn keine „versteckten" Symmetrien vorliegen Man kann feststellen, daß sich die Energie-Eigenzustände eines quantenmechanischen Systems durch die irreduziblen Darstellungen der Symmetriegruppen des HAMILTON-Operators klassifizieren lassen. Die Darstellungstheorie von Gruppen liefert damit qualitative Aussagen über solche Strukturen des Energiespektrums eines quantenmechanischen Systems, die allein auf seine äußeren oder inneren Symmetrien zurückgehen. Auch die Aufspaltung entarteter Energieniveaus unter dem Einfluß einer Störung, die die Systemsymmetrie bricht, und die Auswahlregel für die Matrixelemente der Übergänge zwischen Energie-Eigenzuständen folgen aus der Untersuchung der Darstellungen, nach denen sich die beteiligten Zustände und Operatoren unter Gruppenoperationen transformieren Die Anwendung der Gruppentheorie in der Quantenmechanik wird ausführlich in der Literatur dargestellt, z B in [5 11], [5 13], [5 21], [5 22], [5.23] 5.3.5.6 Weitere Anwendungsbeispiele aus der Physik Weitere Beispiele für die Anwendung spezieller kontinuierlicher Gruppen in der Physik können hier lediglich genannt werden. Weiterfuhrende Literatur s. [5 11], [5.15]. U(l): Eichtransformationen der Elektrodynamik. SU'B). Spin- und Isospinmultipletts in der Teilchenphysik. SU'C)' Klassifizierung von Baryonen und Mesonen in der Teilchenphysik, Vielteilchenprobleme der Kernphysik
5.3 Klassische algebraische Strukturen 323 50C)- Drehimpulsalgebra in der Quantenmechanik; atomare und nukleare Vielteilchenprobleme. SODc): Entartung im Wasserstoffspektrum SU{%). WlGNER-Supermultipletts im Schalenmodell der Kerne durch Vereinigung von Spin- und Iso- spinfreiheitsgraden, Beschreibung von Flavour-Multipletts im Quarkmodell unter Einbeziehung des Charm-Preiheitsgrades. SUF) Multipletts im Quarkmodell durch Kombination von Flavour- und Spinfreiheitsgraden, Kernstrukturmodelle. U(n) Schalenmodelle in Atom- und Kernphysik SU(n), SO(n)' Vielteilchenprobleme der Kernphysik. SUB) ® U(l) Standardmodell der elektroschwachen Wechselwirkung 517E) D SUC) ® SUB) <g> U(l). Vereinheitlichung der fundamentalen Wechselwirkungen (GUT). Hinweis: Die Gruppen SU(n) und SO(n) sind LlE-Gruppen. Das sind spezielle kontinuierliche Gruppen, auf deren Behandlung hier nicht eingegangen werden kann (s. z.B. [5.11]). 5.3.6 Ringe und Körper In diesem Abschnitt werden algebraische Strukturen mit zwei binären Operationen betrachtet. 5.3.6.1 Definitionen 1. Ringe Eine Menge R, versehen mit zwei binären Operationen +, * heißt Ring (Bezeichnung (R , + , *)), wenn • (R, +) eine AßELsche Gruppe, • (R,*) eine Halbgruppe ist und • die Distributivgesetze gelten: a * (b + c) = (a * b) + (a * c), (b + c) *a = (b*a) + (c*a). E.145) Ist (R, *) kommutativ bzw. hat (Ä, *) ein neutrales Element, so heißt der Ring (Ä, +, *) kommutativ bzw. Ring mit Einselement. 2. Körper Ein Ring wird Körper genannt, wenn (R \ {0}, *) eine AßELsche Gruppe ist Deshalb ist jeder Körper speziell ein kommutativer Ring mit Einselement. 3. Körpererweiterungen Es seien K und E Körper. Gilt K C E , so heißt E Körpererweiterung über K Beispiele für Ringe und Körper ¦ A: Die Zahlenbereiche Z, Q, R und C sind bezuglich der Addition und Multiplikation kommutative Ringe mit Einselement; Q , R und C sind sogar Körper. Die Menge der geraden ganzen Zahlen ist ein Beispiel für einen Ring ohne Einselement Der Körper C ist der Erweiterungskörper von R. ¦ B: Die Menge Mn aller Matrizen vom Typ (n,n) über den reellen oder komplexen Zahlen bildet einen nichtkommutativen Ring mit der Einheitsmatrix als Einselement ¦ C: Die Menge der reellen Polynome p(x) = anxn + an-\Xn~l + h a\X + üq bildet bezüglich der üblichen Addition und Multiplikation von Polynomen einen Ring, den Polynomring R[x].n heißt Grad des Polynoms p(x). Er wird mit degp(x) bezeichnet Allgemeiner kann man anstelle des Polynomringes über R auch Polynomringe über beliebigen kommutativen Ringen mit Einselement betrachten. ¦ D: Beispiele für endliche Ringe sind die Restklassenringe Zm modulo m • Zm besteht aus allen Klassen [a]m von ganzen Zahlen, die bei der Division durch m den gleichen Rest lassen. ([a]m ist die durch die ganze Zahl a bestimmte Aquivalenzklasse bezüglich der in 5 2.4, S 306 eingeführten Relation ~A ) Dabei sind durch [a\m®[b]m = [a + b}rn und [a]m 0 [6]m = [a • b]m E.146)
324 5. Algebra und Diskrete Mathematik Ringoperationen 0, 0 auf Zm erklärt. Ist die natürliche Zahl m eine Primzahl, so wird (Zm ,0,0) sogar ein Körper. Meist wird Zm = {0,1,.. , m — 1} gesetzt, d.h. die Restklassen werden durch Repräsentanten ersetzt. 5.3.6.2 Unterringe, Ideale 1. Unterring Es sei R = (R, +, *) ein Ring und U C R. Ist U bezüglich + und * wieder ein Ring, so heißt U = {U, +, *) ein Unterring von R. Eine nichtleere Teilmenge U eines Ringes (R, +, *) bildet genau dann einen Unterring von R, wenn für alle a,b G U auch a 4- (—b) und a * b in U liegen (Unterringkriterium). 2. Ideal Ein Unterring / heißt Ideal, wenn für alle r G R und a G / sowohl r * a als auch a * r in / liegen Diese speziellen Unterringe sind die Grundlage für die Bildung von Faktorringen (s. 5.3.6 3,4., S. 324). Die trivialen Unterringe {0} und R sind auch stets Ideale von R Körper haben nur triviale Ideale. 3. Hauptideal Sämtliche Ideale von Z sind Hauptideale, das sind Ideale, die von einem Ringelement „erzeugt" werden können Sie werden in der Form raZ = {mg\g G Z} geschrieben und mit (m) bezeichnet. 5.3.6.3 Homomorphismen, Isomorphismen, Homomorphiesatz 1. Ringhomomorphismus und Ringisomorphismus 1. Ringhomomorphismus Es seien Ri = (Äi, +, *) und R2 = (#2, °+, °*) Ringe. Eine Abbildung h: Ri —> R2 heißt Ringhomomorphismus, wenn für alle a, b G Ri gilt h(a + b) = h(a)o+h(b) und h{a * b) = h(a) o, h{b) E.147) 2. Kern Der Kern von h ist die Menge aller Elemente aus R\, die bei h auf das neutrale Element 0 von (R2, +) abgebildet werden, und wird mit ker h bezeichnet ker/i = {a G #i|/i(a) = 0} E 148) Dabei ist ker h ein Ideal von R\. 3. Ringisomorphismus Ist h außerdem bijektiv, so heißt h Ringisomorphismus, und die Ringe R\ und R2 heißen zueinander isomorph 4. Faktorring Ist / ein Ideal eines Ringes (R, +, *), so wird die Menge der Nebenklassen {a + I\a G R} von / in der additiven Gruppe (R, +) des Ringes R (s 5.3 3,1., S. 310) bezüglich der Operationen (o + /)o+F + /) = (a + 6) + 7 und (o + /) o„ F + /) = (o * b) + / E.149) zu einem Ring, dem Faktorring von R nach /, der mit R/I bezeichnet wird Die Hauptideale (m) von Z liefern als Faktorringe gerade die Restklassenringe Zm = Z/(m) (s. obige Beispiele für Ringe und Körper). 2. Homomorphiesatz für Ringe Ersetzt man im Homomorphiesatz für Gruppen den Begriff Normalteiler durch Ideal, so erhält man den Homomorphiesatz für Ringe: Ein Ringhomomorphismus h' Ri —> R2 bestimmt ein Ideal von Ri, nämlich ker/i = {a G Ri\h(a) = 0} . Der Faktorring Ri/kerh ist isomorph zum homomorphen Bild h(Ri) = {h(a)\a G R\} Umgekehrt bestimmt jedes Ideal / von Ri eine homomorphe Abbildung nati'. R\ —? R2/I mit nati(a) = a + I. Diese Abbildung nati wird natürlicher Homomorphismus genannt. 5.3.6.4 Endliche Körper und Schieberegister 1. Endliche Körper Körper zeichnen sich insbesondere dadurch aus, dass sie keine Nullteiler besitzen. Endliche Körper sind sogar dadurch charakterisiert. Nullteiler sind von Null verschiedene Elemente eines Ringes, für die ein von Null verschiedenes Element existiert, so dass das Produkt gleich Null wird. Die in 5.3.6.1, S. 323, ¦ D erwähnten Restklassenringe Zm haben genau dann Nullteiler, wenn m keine Primzahl ist, denn m = k • l hat k 0 / = 0 (Multiplikation modulo m) zur Folge. Auf diese Weise erhält man mit Zp, p Primzahl, (bis auf Isomorphie) alle endlichen Körper mit p Elementen Allgemeiner gilt:
5 3 Klassische algebraische Strukturen 325 Für jede Primzahlpotenz pn gibt es (bis auf Isomorphie) genau einen Körper mit pn Elementen, und jeder endliche Körper hat pn Elemente Die Körper mit pn Elementen werden auch mit GF(pn) bezeichnet (GALOIS field). Man beachte, für n > 1 ist GF(pn) von Zpn verschieden. Zur Konstruktion endlicher Körper mit pn Elementen {p Primzahl, n > 1) werden Polynomringe über Zp (s. 5 3.6.1, S. 323, ¦ C) und irreduzible Polynome benötigt: Zp[x] besteht aus allen Polynomen mit Koeffizienten aus Zp Mit den Koeffizienten wird also bei der Addition und Multiplikation der Polynome modulo p gerechnet. In Polynomringen K[x] über Körpern K gilt der Divisionsalgorithmus (Polynomdivision mit Rest), d h. für f(x),g{x) G K[x] mit deg/(x) < deg^(x) existieren q{x),r{x) G K[x] mit g(x) = q(x) • f(x) + r(x) und degr(x) < deg/(x). E.150) Diese Situation wird durch r(x) = g(x) (modf(x)) beschrieben. Fortgesetzte Division mit Rest liefert den Euklidischen Algorithmus für Polynomringe und der letzte von Null verschiedene Rest den größten gemeinsamen Teiler (ggT) der Polynome f(x) und g(x) Ein Polynom f(x) G K[x] heißt irreduzibel, wenn es sich nicht als Produkt von Polynomen niedrigeren Grades schreiben lasst, d.h (in Analogie zu den Primzahlen in Z) f(x) ist Primelement in K[x]. Für Polynome zweiten oder dritten Grades ist Irreduzibilität gleichbedeutend mit der Nichtexistenz von Nullstellen in K. Man kann zeigen, dass in K[x] irreduzible Polynome beliebigen Grades liegen. Fui ein irreduzibles Polynom f(x) G K[x] wird K[x]/f{x) = {r{x) G K[x] | degr(x) < deg<?(:r)} E.151) ein Körper, in dem modulo f(x) multipliziert wird, d h. g(x) * h(x) = g(x) • h(x) (mod /(#)). Ist K = Zp und degf(x) = n, so hat der Körper K[x]/f(x) pn Elemente, d.h. GF(pn) = Zp[x]/f(x), wobei f(x) ein irreduzibles Polynom n-ten Grades ist Die multiplikative Gruppe K* = K \ {0} eines endlichen Körpers K ist zyklisch, d h , es gibt ein Element a G K, so dass jedes Element aus K* als Potenz von a geschrieben werden kann. Man sagt, a erzeugt die multiplikative Gruppe des Körpers- K* = {1, a, a2, .., aQ~2} Ein irreduzibles Polynom f(x) G K[x] heißt primitiv, wenn die Potenzen von x alle von Null verschiedenen Elemente von L := K[x]/f(x) durchlaufen, d h wenn x die multiplikative Gruppe von L erzeugt. Mit einem primitiven Polynom f(x) n-ten Grades aus Zp[x] kann man eine „Logarithmentafel"für GF(pn) aufstellen, die das Rechnen in diesem Körper wesentlich erleichtert. ¦ Konstruktion des Körpers GFB3) und Aufstellen der zugehörigen Logarithmentafel f(x) = 1 + x + x3 ist über Z2[x] irreduzibel, da weder 0 noch 1 Nullstellen sind, also gilt: GFB3) = Z2[x]/f(x) = {a0 + axx + a2x2 \ a0,aua2 G Z2 A x3 = 1 + x} E 152) f(x) ist sogar primitiv, und man kann für GFB3) eine Logarithmentafel aufstellen. Dazu werden jedem Polynom aQ+a\X+a2x2 aus Z2[x]/f(x) zwei Ausdrücke zugeordnet, der Koeffizientenvektor a0aia2 und der sog Logarithmus, das ist diejenige natürliche Zahl i mit x% = a0 + a\X + a2x2 modulo 1 + x + x3. Man erhält für GF(8) die folgende Logarithmentafel- KE 1 X x2 x3 x4 xh X6 KV 100 010 001 1 10 01 1 111 101 Log 0 1 2 3 4 5 6 Addition der Körperelemente (KE) in GF(8). Addition der Koordinatenvektoren (KV), komponentenweise mod 2 (allgemein: mod p). Multiplikation der KE in GF(8) Addition der Logarithmen (Log.) mod 7 (allg.: mod (pn — 1)). Berechnungsbeispiel: xJ + x4
326 5. Algebra und Diskrete Mathematik L •= GF(q),q = pn, kann also als Erweiterungskörper von K=:GF(p) aufgefasst werden. Nach dem Satz von Fermat (s 5 4 4, S. 341) gilt für alle a G L die Gleichung aq = a, d.h. jedes Element a G L ist Nullstelle eines Polynoms mit Koeffizienten aus K, z.B. des Polynoms xq — x Das Polynom ma(x) G K[x] heißt Minimalpolynom von a G L über K, wenn gilt: ma(x) hat a zur Nullstelle, den höchsten Koeffizienten 1 (ma(x) ist normiert) und ist unter diesen dasjenige mit minimalem Grad. Das Minimalpolynom ma(x) hat folgende Eigenschaften: a) ma(x) ist irreduzibel über K. b) ma(x) teilt jedes f(x) G K[x] mit f(a) = 0, insbesondere teilt es xq — x. c) degraa(:z) < n. d) Ist a erzeugendes Element von L*, so ist der Grad seines Minimalpolynoms gleich n. In den voranstehenden Ausführungen kann für p statt einer Primzahl auch eine Primzahlpotenz stehen. Es sei q = pn eine Primzahlpotenz und ggT (n, q) = 1 Dann heißt jedes Element a eines Erweiterungskörpers L von GF(g), das die Gleichung xn = 1 erfüllt, n-te Einheitswurzel über GF(q) Die n-ten Einheitswurzeln über GF(g) bilden eine zyklische Gruppe der Ordnung n. Ein erzeugendes Element dieser Gruppe heißt primitive n-te Einheitswurzel 2. Anwendungen für Schieberegister Das Rechnen mit Polynomen kann sehr gut mit linear rückgekoppelten Schieberegistern durchgeführt werden (s. Abb.5.16). —i 1—r r I1 i2 f L-»p7|—+ -|sT|—+.... + -»[s^]-4. Abbildung 5.16 Für ein linear rückgekoppeltes Schieberegister mit Rückkopplungspolynom f(x) = /o + f\X + • • • + fr-iXT~l + xr erhält man aus dem Zustandspolynom s(x) = s0 + six -\ \- sr-ixr~l im Folgetakt das Zustandspolynom s{x) ¦ x — sr_i • f(x) = s(x) • x (mod f(x)) Insbesondere entsteht aus s(x) = 1 nach i Takten das Zustandspolynom x% (mod f{x)). ¦ Demonstration am Beispiel von S. 325: Das primitive Polynom f(x) = 1 + x + x3 G Z2[x] wird als Rückkopplungspolynom gewählt. Dann ergibt sich ein Schieberegister der Länge 3 mit folgender Zustandsfolge: Mit dem Anfangszustand 10 0 = 1 ergeben sich die Folgezustände: 0 1 0 = x 0 0 1 = x2 1 1 0 = x3 0 1 1 = xA 1 1 1 = x5 1 0 1 = x6 = l + x = x + x2 = 1 + X + X2 = l + x2 (mod/(x)) (mod/(x)) (mod/(x)) (mod/(a;)) (mod/(x)) (mod/(x)) (mod/(a;)) 100 = = 1 (mod/(x)) Die Zustände sind als Koeffizientenvektoren eines Zustandspolynoms s0 + Six + s2x2 aufzufassen Allgemein gilt: Ein linear rückgekoppeltes Schieberegister der Länge r liefert genau dann eine Zustandsfolge maximaler Periodenlänge 2r — 1, wenn das Rückkopplungspolynom ein primitives Polynom vom Grad r ist.
5.3 Klassische algebraische Strukturen 327 5.3.7 Vektorräume* 5.3.7.1 Definition Ein Vektorraum über einem Körper K (K-Vektorraum) besteht aus einer additiv geschriebenen Abel- schen Gruppe V = (V, +) von „Vektoren", einem Körper K = (K, +, *) von „Skalaren" und einer äußeren Multiplikation K x V —> V, die jedem geordneten Paar (fc, v) mit k G K und v G V einen Vektor kv eV zuordnet. Dabei gelten folgende Gesetze: (VI) (u + v) 4- w = u + (v + w) für alle u, v, tu € V . E 153) (V2) Es gibt einen Vektor 0 G V mit v + 0 = v für alle v G V. E.154) (V3) Zu jedem Vektor v gibt es einen Vektor —v mit v + (—v) = 0 E.155) (V4) v + iu = iü + v für alle ^tuGV E 156) (V5) lv = v für alle u 6 V , 1 bezeichnet das Einselement von if. E 157) (V6) r(sv) = (rs)v für alle r,s e K und alle u € V . E.158) (V7) (r + s)v = rv + sv für alle r,s £ K und alle t;GV E.159) (V8) r(v + w) = rv + rw für alle r £ K und alle v,«; G V E.160) Ist if = R, so spricht man von einem reellen Vektorraum. Beispiele für Vektorräume: ¦ A: Einspaltige bzw. einzeilige reelle Matrizen vom Typ (n, 1) bzw. A, n) bilden bezüglich der Matrizenaddition und äußerer Multiplikation mit einer reellen Zahl einen reellen Vektorraum Rn (Vektorraum der Spalten- bzw Zeilenvektoren, s. 4.1.3, S. 261). ¦ B: Alle reellen Matrizen vom Typ (m, n) bilden einen reellen Vektorraum. ¦ C: Alle auf einem Intervall [a, b] stetigen reellen Funktionen bilden mit den durch (f + 9)(x) = f(x) + 9(x) und (kf)(x) = k-f(x) E.161) definierten Operationen einen reellen Vektorraum. Funktionenräume spielen in der Funktionalanalysis eine wesentliche Rolle 5.3.7.2 Lineare Abhängigkeit Es sei V ein K-Vektorraum Die Vektoren u1} i>2, .., i>m 6 V heißen linear abhängig, falls es fci, &2> • • •» km G K gibt, die nicht alle gleich Null sind, so daß 0 = k\V\ + k2V2 + • • • 4- kmvm gilt, und andernfalls linear unabhängig. Lineare Abhängigkeit von Vektoren bedeutet also, daß sich ein Vektor durch die anderen darstellen läßt. Existiert eine Maximalzahl n linear unabhängiger Vektoren in V , so heißt V n-dimensional. Diese Zahl n ist dann eindeutig bestimmt und heißt Dimension. Je n linear unabhängige Vektoren in V bilden eine Basis Gibt es eine solche Maximalzahl nicht, so heißt der Vektorraum unendlichdimensional. Die Vektorräume aus den obigen Beispielen sind in der angegebenen Reihenfolge n-, m • n- bzw unendlichdimensional. Aus dem Vektorraum Rn sind n Vektoren genau dann linear abhängig, wenn die Determinante der Matrix, die diese Vektoren als Spalten bzw. Zeilen enthält, gleich 0 ist. Ist {^i, f2, , vn} eine Basis eines n-dimensionalen K- Vektorraumes, so besitzt jeder Vektor v £ V eine eindeutige Darstellung v = k\V\ + k2v2 + • • • 4- knvn mit /ci, k2 ..., kn G K Jede Menge linear unabhängiger Vektoren eines Vektorraumes läßt sich zu einer Basis dieses Vektorraumes ergänzen 5.3.7.3 Lineare Abbildungen Die mit der Struktur von Vektorräumen verträglichen Abbildungen werden lineare Abbildungen genannt / Vi —? V2 heißt linear, wenn für alle u,v G Vi und alle k G K gilt: /(u + v) = /(u) + /(i>) und f{ku) = k.f(u) E 162) *In diesem Abschnitt sind Vektoren im allgemeinen nicht fett gesetzt
328 5. Algebra und Diskrete Mathematik ¦ Die linearen Abbildungen / von Rn in Rm werden mittels Matrizen A vom Typ (m, n) durch f(v) = Av beschrieben 5.3.7.4 Unterräume, Dimensionsformel 1. Unterraum: Es sei V ein Vektorraum und U eine Teilmenge von V . Bildet U bezüglich der Operationen aus V einen Vektorraum, so heißt U ein Unterraum von V Eine nichtleere Teilmenge U von V ist genau dann Unterraum, wenn für alle u\,U2 G U und alle k € K auch u\ + U2 und h-u\'mU liegen (Unterraumkriterium) 2. Kern, Bild: Es seien Vi, V2 AT-Vektorräume Ist /• Vi —> V2 eine lineare Abbildung, so sind die Unterräume Kern (Bezeichnung: ker /) und Bild (Bezeichnung: im /) wie folgt definiert: kevf = {veV\f(v) = 0}, irnf = {f(v)\veV}. E.163) So ist zum Beispiel die Lösungsmenge eines homogenen linearen Gleichungssystems Ax = 0 der Kern der durch die Koeffizientenmatrix A vermittelten linearen Abbildung. 3. Dimension: Die Dimension dim ker / bzw. dim im / werden Defekt f bzw Rang f genannt. Zwischen diesen Dimensionen besteht der Zusammenhang Defekt / + Rang / = dim V, E.164) der Dimensionsformel genannt wird. Ist speziell Defekt / = 0 , d.h. ker / = {0} , dann ist die lineare Abbildung / injektiv und umgekehrt. Injektive lineare Abbildungen werden regulär genannt 5.3.7.5 Euklidische Vektorräume, Euklidische Norm Um in abstrakten Vektorräumen Begriffe wie Länge, Winkel, Orthogonalität verwenden zu können, werden EuKLiDisc/ie Vektorräume eingeführt. 1. Euklidischer Vektorraum Es sei V ein reeller Vektorraum. Ist ip: V x V —? R eine Abbildung mit folgenden Eigenschaften (statt tp(v, w) wird v • w geschrieben), dann gilt für alle u,v,w G V und für alle r G R (Sl) v -w = w -v, E 165) (S2) (u + v)-w = u-w + v-w, E.166) (S3) r(v • w) = (rv) -w = v- (rw), E 167) (S4) v ¦ v > 0 genau dann, wenn v ^ 0, E.168) und <p heißt Skalarprodukt auf V Ist auf V ein Skalarprodukt erklärt, so heißt V ein ElJKLlDischer Vektorraum 2. Euklidische Norm Mit \\v\\ = y/v • v wird die EuKLiDische Norm (Länge) von v bezeichnet Der Winkel a zwischen v, w aus V wird über die Formel v - w cosa= E.169) INI • INI erklärt. Ist v • w = 0 , so werden v und w zueinander orthogonal genannt ¦ Orthogonalität trigonometrischer Funktionen: Im Zusammenhang mit FOURIER-Reihen (s 7.4.1.1, S. 437) werden Funktionen der Form sin kx und cos fco; betrachtet Diese Funktionen können als Elemente von C[0,2ir] aufgefaßt werden. Im Funktionenraum C[a, b] wird durch f-g = faf(x)g(x)dx E 170) ein Skalarprodukt erklärt Wegen f-2-K r2n / sin kx • sin Ix dx = 0 (k ^ l), E 171) / cos kx • cos Ix dx = 0 (k ^ /), E 172) JQ JQ f ¦2n sin kx • cos Ix dx = 0 E.173)
5 3 Klassische algebraische Strukturen 329 sind die Funktionen sin kx und cos kx für alle A:, / G N paarweise zueinander orthogonal. Diese Or- thogonalität trigonometrischer Funktionen wird zur Berechnung der FOURIER-Koeffizienten bei der harmonischen Analyse (s. 7 4 1.1, S. 437) ausgenutzt. 5.3.7.6 Lineare Operatoren in Vektorräumen 1. Begriff des linearen Operators Es seien V und W zwei Vektorräume. Jede eindeutige Abbildung a von V in W heißt lineare Abbildung, lineare Transformation oder linearer Operator (s auch 12 1 5.2, S 621) von V in W genau dann, wenn gilt. a(u + v) = au + av für alle ii,u6K, E.174) a(Xu) = Xau für alle u eV und alle reellen A E.175) ¦ A: X)ie Abbildung au .= f£ u(t)dt des Raumes der stetigen Funktionen C[a} b] in den der reellen Zahlen ist linear. Lineare Abbildungen a V —? W, bei denen wie in diesem Beispiel W = R1 gilt, werden lineare Funktionale genannt ¦ B: Die Abbildung a des Raumes V = Rn in den Vektorraum W der Polynome höchstens (n— l)-ten Grades ist linear. a(ai, a2, , an) := a\ + a2X + a^x2 H h anxn~l Jedem n-dimensionalen Vektor wird ein Polynom vom Grade < n — 1 zugeordnet ¦ C: Ist V = Rn und W = Rm, dann sind alle linearen Operatoren a . Rn —> Rm durch reelle Matrizen A = (a^) vom Typ (m, n) gegeben Die Gleichung Ax = y entspricht dem linearen Gleichungssystem D.103a) /Oll Gl2 '• OL\n \ (Xl\ &21 «22 • • * Ö2n \ Oml Om2 ' " * CLmn I X2 \Xnl (Vl\ V2 \2/m/ 2. Summe und Produkt zweier linearer Operatoren Sind a- V —> W und b V —> W sowie c. W —> U lineare Operatoren, so definiert man die Summe o + b: V —> W durch (a + b)u = au-\-bu für alle u eV und das E 176) Produkt ca. V —? U durch (ca)u = c(au) für alle u eV . E.177) Hinweise: 1. Mit a, b und c sind auch a + 6 und ac wieder lineare Operatoren 2. Das Produkt E 177) stellt die Hintereinanderausführung der beiden linearen Operatoren a und c dar 3. Das Produkt zweier linearer Operatoren ist im allgemeinen nicht kommutativ, d h., im allgemeinen gilt- ca ^ ac E.178a) Vertauschbarkeit liegt vor, wenn gilt: ca-ac = 0. E.178b) Der Ausdruck ca — ac wird in der Quantenmechanik als Kommutator bezeichnet. Im Falle von E.178a) sind die Operatoren a und c nicht vertauschbar, d h., es ist unbedingt auf ihre Reihenfolge zu achten. ¦ Als Beispiel für Summe und Produkt zweier linearer Operatoren können Summe und Produkt zweier entsprechender Matrizen angesehen werden
330 5. Algebra und Diskrete Mathematik 5.4 Elementare Zahlentheorie Die elementare Zahlentheorie befaßt sich mit den Teilbarkeitseigenschaften der ganzen Zahlen 5.4.1 Teilbarkeit 5.4.1.1 Teilbarkeit und elementare Teilbarkeitsregeln 1. Teiler Eine ganze Zahl b G Z heißt in Z durch eine ganze Zahl a ohne Rest teilbar, wenn es eine ganze Zahl q gibt, die die Bedingung qa = b E 179) erfüllt Dabei ist a ein Teiler von b in Z und q der zu a komplementäre Teiler, b ist ein Vielfaches von a Für „a teilt b" schreibt man auch a\b. Für „a teilt b nicht" kann man a/6 schreiben. Die Teilbarkeitsbeziehung E 179) ist eine binäre Relation in Z (s. 5 2 3,2., S 304) Analog kann man die Teilbarkeit in der Menge der natürlichen Zahlen definieren. 2. Elementare Teilbarkeitsregeln (TRI) Für jedes a G Z gilt l|a, a\a und a\0. E.180) (TR2) Gilt a\b, so gilt auch (-a)\b und a\(-b). E 181) (TR3) Aus a\b und b\a folgt a = b oder a = -b. E 182) (TR4) Aus a\\ folgt a = 1 oder a = -1. E 183) (TR5) Aus a\b und b ^ 0 folgt \a\ < \b\. E 184) (TR6) Aus a\b folgt a\zb für alle z G Z . E 185) (TR7) Aus a|fc folgt az\bz für alle 2 G Z. E 186) (TR8) Aus az\bz und z ^ 0 folgt a\b für alle 2 G Z . E 187) (TR9) Aus a\b und 6|c folgt a\c. E.188) (TRIO) Aus a\b und c|d folgt ac|6d E 189) (TR11) Aus a\b und a\c folgt a|(^i6 + z2c) für beliebige zi,*2 G Z. E.190) (TR12) Aus a\b und o|F + c) folgt a|c. E.191) 5.4.1.2 Primzahlen 1. Definition und Eigenschaften der Primzahlen Eine natürliche Zahl p mit p > 1, die in der Menge N der natürlichen Zahlen nur 1 und p als Teiler besitzt, wird Primzahl genannt Natürliche Zahlen, die keine Primzahlen sind, heißen zusammengesetzte Zahlen. Der kleinste positive, von 1 verschiedene Teiler jeder ganzen Zahl ist eine Primzahl. Es gibt unendlich viele Primzahlen. Eine natürliche Zahl p mit p > 1 ist genau dann Primzahl, wenn gilt: Für beliebige natürliche Zahlen a, b folgt aus p\(ab), daß p\a oder p\b gilt. * 2. Sieb des Eratosthenes Mit dem Sieb des Eratosthenes kann man alle Primzahlen ermitteln, die kleiner als eine vorgegebene natürliche Zahl n sind. a) Man schreibe alle natürlichen Zahlen von 2 bis n auf. b) Man markiere die 2 und streiche jede zweite auf 2 folgende Zahl. c) Ist p die erste nichtgestrichene und nichtmarkierte Zahl, dann markiere man p und streiche jede p--te darauffolgende Zahl. d) Man führe Schritt c) für alle p mit p < y/n aus und beende den Algorithmus Alle markierten bzw nicht gestrichenen Zahlen sind Primzahlen Es handelt sich dabei um alle Primzahlen < n In der Menge der ganzen Zahlen werden die Primzahlen und die zu diesen entgegengesetzten Zahlen Primelemente genannt.
5.4 Elementare Zahlentheorie 331 3. Primzahlzwillinge Zwei Primzahlen mit dem „Abstand" 2 bilden einen Primzahlzwilling. ¦ C,5), E,7), A1,13), A7,19), B9,31), D1,43), E9,61), G1,73), A01,103) sind Primzahlzwillinge. 4. Primzahldrillinge Man spricht von Primzahldrillingen, wenn unter vier aufeinanderfolgenden ungeraden Zahlen drei Primzahlen sind. ¦ E,7,11), G,11,13), A1,13,17), A3,17,19), A7,19,23), C7,41,43) sind Primzahldrillinge. 5. Primzahlvierlinge Bilden von fünf aufeinanderfolgenden ungeraden Zahlen die ersten beiden und die letzten beiden jeweils einen Primzahlzwilling, dann spricht man von Primzahlvierlingen. ¦ E,7,11,13), A1,13,17,19), A01,103,107,109), A91,193,197,199) sind Primzahlvierlinge. Eine bis heute unbewiesene Vermutung ist, daß unendlich viele Primzahlzwillinge, unendlich viele Primzahldrillinge und unendlich viele Primzahlvierlinge existieren. 6. Mersennesche Primzahlen Ist eine Zahl 2k — 1 mit k € IN eine Primzahl, dann ist auch k eine Primzahl Man nennt die Zahlen 2P - 1 (p Primzahl) MERSENNEsche Zahlen. Von einer Mersen- NEschen Primzahl spricht man, wenn 2P — 1 eine Primzahl ist. ¦ Für die folgenden ersten 10 Werte von p ist 2P - 1 eine Primzahl: 2, 3, 5, 13,17, 19, 31, 61, 89, 107, usw. 7. Fermatsche Primzahlen Ist eine Zahl 2k — 1 mit k G IN eine ungerade Primzahl, dann ist k eine Potenz von 2 Die Zahlen 2k + 1 mit k G IN heißen FERMATsche Zahlen Ist eine FERMATsche Zahl eine Primzahl, dann spricht man von einer FERMATschen Primzahl. ¦ Für k = 0,1, 2,3,4 sind die zugehörigen FERMATschen Primzahlen: 3,5,17, 257,65537. Man vermutet, daß es keine weiteren FERMATschen Primzahlen gibt. 8. Fundamentalsatz der elementaren Zahlentheorie Jede natürliche Zahl n > 1 kann man als Produkt von Primzahlen darstellen. Diese Darstellung ist eindeutig bis auf die Reihenfolge der Faktoren. Man sagt, daß n genau eine Primfaktorenzerlegung besitzt ¦ 360 = 2 • 2 • 2 • 3 • 3 • 5 = 23 • 32 • 5 Hinweis: Analog kann man ganze Zahlen (außer —1,0,1) eindeutig bis auf Vorzeichen und Reihenfolge der Faktoren als Produkt von Primelementen darstellen 9. Kanonische Primfaktorenzerlegung Es ist üblich, in der Primfaktorenzerlegung einer natürlichen Zahl die Primfaktoren der Größe nach zu ordnen und gleiche Faktoren zu Potenzen zusammenzufassen. Ordnet man jeder nicht vorkommenden Primzahl den Exponenten 0 zu, dann gilt: Jede naturliehe Zahl ist eindeutig durch die Folge der Exponenten in ihrer Primfaktorenzerlegung bestimmt ¦ Zu 1533312 = 27 • 32 • ll3 gehört die Exponentenfolge G,2,0,0,3,0,0, . ) Für eine natürliche Zahl n seien p1} p2> • • • Pm die paarweise verschiedenen n teilenden Primzahlen, und ftfc bezeichne den Exponenten der Primzahl pk in der Primfaktorenzerlegung von n . Dann schreibt man m n=Y[pakk E.192a) fc=i und nennt diese Darstellung die kanonische Primfaktorenzerlegung von n. Oft schreibt man dafür auch n = Y[p^n), E.192b) v wobei das Produkt über alle Primzahlen p zu bilden ist und vp(n) die Vielfachheit von p als Teiler von n bedeutet. Es handelt sich um ein endliches Produkt, da nur endlich viele der Exponenten vp(n) von 0 verschieden sind Positive Teiler: Wenn eine natürliche Zahl n > 1 mit der kanonischen Primfaktorenzerlegung E 192a) gegeben ist, dann läßt sich jeder positive Teiler t von n in der Form t=f[plk mitTfc € {0,1,2,...,ak} für k= 1,2,.. ,ra E.193a)
332 5. Algebra und Diskrete Mathematik darstellen Die Anzahl r(n) aller positiven Teiler von n ist m r{n)= IJK + 1) E.193b) jfc=i ¦ A: rE040) = rB4 • 32 • 5 • 7) = D + 1)B + 1)A + 1)A + 1) = 60 ¦ B: r(pip2 • • -pr) = 2r , fallspi,p2, • • • ,pr paarweise verschiedene Primzahlen sind. Das Produkt P(n) aller positiven Teiler von n ist gegeben durch P(n) = n~2Tin) E 193c) ¦ A: PB0) = 203 = 8000 ¦ B: P(p3) = p6 , falls p Primzahl ist. ¦ C: P(pq) = p2q2, falls p und q zwei verschiedene Primzahlen sind. Die Summe a(n) aller positiven Teiler von n ist a(n) = n _ i • E.193d) ¦ A: (jA20) = aB3 • 3 • 5) = 15 • 4 • 6 = 360 HB: cr(p) = p + 1, falls p Primzahl ist 5.4.1.3 Teilbarkeitskriterien 1. Bezeichnungen Es sei n = (akak_i • • • a2aia0I0 = ak10k + a^-ilO*-1 -\ + a2!02 + ailO + a0 E 194a) eine im dekadischen Positionssystem dargestellte natürliche Zahl. Dann heißen Qi(n) = a0 + ai + a2 H V ak E.194b) bzw. Q[(n) = a0 - öi + a2 - + • • • + {-l)kak E.194c) Quersumme bzw alternierende Quersumme A Stufe) von n Weiter heißen Q2(n) = (aia0)io + @3^2I0 + @5^4I0 H bzw E 194d) Q2(n) = (aia0)io - @3^2I0 + @504I0 - + • • • E 194e) Quersumme 2. Stufe bzw. alternierende Quersumme 2. Stufe und Q3(n) = (o2aia0)io + @50403I0 + (ös^^io H E 194f) bzw. <2'3(n) = (a2aia0)io - @50403I0 + @30706I0 - + • • • E 194g) Quersumme 3 Stufe bzw. alternierende Quersumme 3. Stufe, usw. ¦ Die Zahl 123 456 789 hat die folgenden Quersummen: Qx =9 + 8 + 7 + 6 + 5 + 4 + 3 + 2 + 1 = 45, q; = 9-8+7-6+5-4+3-2+1 = 5, Q2 = 89+67+45+23+1 = 225, Q'2 = 89-67+45-23+1 = 45, Q3 = 789 + 456 + 123 = 1368 und Q'3 = 789 - 456 + 123 = 456. 2. Teilbarkeitskriterien Es gelten folgende Teilbarkeitskriterien: TK-1 TK-3 TK-5 TK-7: TK-9 3|n*»3|<2i(n), E 195a) 9|n«»9|Qi(n), E 195c) 13|ra ^ 13|Q'3(n), E.195e) 101|n^l01|Q'2(n), E 195g) 5|n<^5|a0, E.195i) TK-10: 2k\n & 2fc|(afc_1afc_2 •• • 0^0I0 , E.195J) TK-2: TK-4: TK-6: TK-8: 7\n^7\Q'3(n), ll|n<*ll|Qi(n), 37|n & 37|Q3(n), 2\n<& 2|a0, E 195b) E.195d) E.195f) E 195h)
5.4 Elementare Zahlentheorie 333 TK-11: bk\n <S> 5*|(ajb_iafc_2 • • • aia0)io • E.195k) ¦ A: a = 123456789 ist durch 9 teilbar wegen Qi(a) = 45 und 9|45, aber nicht durch 7 teilbar wegen Q'3{a) = 456 und 7J456. ¦ B: 91619 ist durch 11 teilbar wegen Q[(91619) = 22 und 11|22 ¦ C: 99 994 096 ist durch 24 teilbar wegen 24|4096. 5.4.1.4 Größter gemeinsamer Teiler und kleinstes gemeinsames Vielfaches 1. Größter gemeinsamer Teiler Für ga.nze Zahlen ai,a2,.. ,an, die nicht alle gleich 0 sind, wird die größte Zahl in der Menge der gemeinsamen Teiler von ai, a2,..., an der größte gemeinsame Teiler von oi, a2,..., an genannt und mit ggT(ai, 02,..., an) bezeichnet. Gilt ggT(ai, a2,..., an) = 1, dann heißen die Zahlen ai, a2,. ., an teilerfremd. Für die Bestimmung des größten gemeinsamen Teilers reicht es aus, die positiven gemeinsamen Teiler zu betrachten Sind die kanonischen Primfaktorenzerlegungen ai = Y[pMai) E 196a) von a\, a2, .., an gegeben, dann gilt f min [i/p(oi)] 1 ggT(ai,a2, )fl„) = llPl l J- E.196b) v ¦ Für die Zahlen ax = 15400 = 23 • 52 7 • 11, o2 = 7875 = 32 • 53 • 7, a3 = 3850 = 2 • 52 • 7 • 11 ist der ggT(a1,a2,a3) = 52.7=175 2. Euklidischer Algorithmus Für zwei natürliche Zahlen a, b kann man den größten gemeinsamen Teiler mit dem EUKLiDischen Algorithmus ohne Zuhilfenahme der Primfaktorenzerlegung ermitteln Dazu ist nach dem folgenden Schema eine Kette von Divisionen mit Rest auszuführen. Für a > b sei ao = a, a\ = b. Dann gilt: «o = QiQ-i + a-i, 0 < a2 < ai, ai = #202 + «3 > 0 < a3 < a2 , : • ' E.197a) Ön-2 = tfn-lßn-l + An > 0 < ön < ßn_i , ön-1 = 9nön • Der Divisionsalgorithmus endet nach endlich vielen Schritten, da die Folge a2,ü3,.. eine streng monoton fallende Folge natürlicher Zahlen ist. Der letzte von 0 verschiedene Rest an ist der größte gemeinsame Teiler von ao und a\ ¦ Es gilt ggTC8, 105) - 1, denn 105 = 2 • 38 + 29; 38 = 1 • 29 + 9; 29 = 3-9 + 2; 9 = 4-2 + 1; 2 = 2-1. Benutzt man die Reduktionsvorschrift ggT(ai,a2,..., a„) = ggT(ggT(ai, a2,. , an-i), an), E.197b) dann kann man durch wiederholte Anwendung des EUKLiDischen Algorithmus auch für n natürliche Zahlen mit n > 2 den größten gemeinsamen Teiler ermitteln ¦ ggTA50, 105, 56) = ggT(ggTA50, 105), 56) = ggTA5, 56) = 1.
334 5 Algebra und Diskrete Mathematik ¦ Der EuKLlDische Algorithmus zur Berechnung des ggT (s. auch 1 1 1 4,1., S 3) zweier Zahlen hat besonders viele Rechenschritte, wenn es sich um benachbarte Zahlen aus der Folge der FlBONACCl-Zahlen (s 5.4.1 5, S 334) handelt. In der nebenstehenden Rechnung ist ein Beispiel gegeben, in dem die auftretenden Quotienten jeweils gleich 1 sind. Satz zum Euklidischen Algorithmus Für natürliche Zahlen a, b mit a > b > 0 sei A(o, b) die Anzahl der Divisionen mit Rest im EUKLlDischen Algorithmus und K(b) die Stellenzahl von b im dekadischen System. Dann gilt: A(a,ft) <5-«F) E.198) 3. Größter gemeinsamer Teiler als Linearkombination Aus dem EUKLlDischen Algorithmus folgt a2 = a0- qxdi = c0a0 + d0ai, Ö3 = CL\ — G2^2 = C\Üq + d\CLi , an = an-2 — qn-\an-\ = cn_2ao + dn-2a\. Dabei sind cn_2 und dn-2 ganze Zahlen. Also ist ggT(a0, Q>i) als Linearkombination von üq und a\ mit ganzzahligen Koeffizienten darstellbar: ggT(a0, ai) = cn-2a0 + dn.2a1. E.199b) Man kann auch ggT(ai, a2,..., an) als Linearkombination von ai, a2,..., an darstellen, denn: ggT(ai, a2,..., a„) = ggT(ggT(ai, a2,..., an_i), an) = c- ggT(ax, a2,..., an_i) + dan . E.199c) ¦ ggTA50, 105, 56) = ggT(ggTA50, 105), 56) = ggTA5, 56) =1 mit 15 = (-2)-150 + 3-105 und 1 = 15 • 15 + (-4) • 56, also ggTA50, 105, 56) = (-30) • 150 + 45 • 105 + (-4) • 56. 4. Kleinstes gemeinsames Vielfaches Für ganze Zahlen a\, a2, .., an , von denen keine gleich 0 ist, wird die kleinste Zahl in der Menge der positiven gemeinsamen Vielfachen von a\, a2,..., an das kleinste gemeinsame Vielfache von öi, a2,..., an genannt und mit kgV(ai, a2,..., an) bezeichnet Sind die kanonischen Primfaktorenzerlegungen E 196a) von ai, a2,. ., an gegeben, dann gilt: f max [vp(ai)} 1 kgV(ai,02, .,an) = Y[p\ { I E.200) p ¦ Für die Zahlen ax = 15400 = 23 • 52 • 7 • 11, a2 = 7875 = 32 • 53 • 7, a3 = 3850 = 2 • 52 • 7 • 11 gilt kgV(ai, 02, a3) - 23 • 32 • 53 • 7 • 11 = 693000. 5. Zusammenhang zwischen dem ggT und dem kgV Für beliebige ganze Zahlen a, b gilt: |a6|=ggT(a,6).kgV(a,&) E 201) Deshalb kann das kgV(a, b) auch ohne Kenntnis der Primfaktorenzerlegung von a und b unter Zuhilfenahme des EUKLlDischen Algorithmus ermittelt werden. 5.4.1.5 Fibonacci—Zahlen 1. Fibonacci-Folge Die Folge (^n)neN mit Fi = F2 = 1 und Fn+2 = Fn + Fn+1 E 202) wird Fibonacci -Folge genannt. Sie beginnt mit den Elementen 1,1,2,3,5,8,13,21,34,55,89,144, 233,377, . ¦ Die Betrachtung dieser Folge geht auf die folgende, 1202 von Fibonacci gestellte Frage zurück: Wieviele Kaninchenpaare stammen am Ende eines Jahres von einem Kaninchenpaar ab, wenn jedes Paar 55 = 34 = 21 = 13 = 8 = 5 = 3 = 2 = 1 = 1 1 1 1 1 1 : 1 : 1 : 1 34 + 21 21 + 13 13 + 8 8 + 5 5 + 3 3 + 2 2 + 1 •1 + 1 •1 E 199a)
5.4 Elementare Zahlentheorie 335 jeden Monat ein neues Paar als Nachkommen hat, das selbst vom zweiten Monat an Nachkommen- Paare gebiert? Die Antwort ist Fi4 = 377. 2. Fibonacci-Rekursionsformel Außer der rekursiven Definition E.202) gibt es auch eine explizite Darstellung der FlBONACCl-Zahlen: h(\ "l + >/5 2 - '1-75" 2 n"V5 Einige wichtige Eigenschaften der FlBONACCl-Zahlen werden im folgenden aufgeführt. Für alle m, n G IN gilt (l)Fm+n = Fm_!Fn + FmFn+1 (m>l). E 204a) C) Aus ggT(m, n) = dfolgt ggT(Fm, Fn) = Fd .E.204c) E.203) B)Fm|Fmn. E.204b) D)ggT(Fn,Fn+1) = l. E.204d) E) Fm|Fjt gilt genau dann, wenn gilt m\k. E.204e) F) sjTF? = FnFn+l. E.204f) G) AusggT(m,n) = lfolgtFmFn|Fm E.204g) (S)J2Fi = Fn+2-l. E.204h) (9)FnFn+2-Fn2+1 = (-l)n+1. (ll)Fn2+2-Fn2 = F2n+2. E.204i) E.204k) A0)Fn2 + Fn2+1 = F2n+1.E.204j) 5.4.2 Lineare Diophantische Gleichungen 1. Diophantische Gleichungen Eine Gleichung }{x\, x2, , xn) = b wird DiOPHANTisc/ie Gleichung in n Unbekannten genannt, wenn f(xi,x2, , xn) ein Polynom in Xi, z2,..., xn mit Koeffizienten aus der Menge Z der ganzen Zahlen und b eine ganzzahlige Konstante ist und man sich ausschließlich für ganzzahlige Lösungen interessiert Die Bezeichnung „DiOPHANTisch" erinnert an den griechischen Mathematiker Diophant, der um 250 lebte. DiOPHANTische Gleichungen treten in der Praxis z.B dann auf, wenn Beziehungen zwischen Stückzahlen beschrieben werden. Allgemein gelöst sind bisher nur die DiOPHANTischen Gleichungen bis zum zweiten Grad mit zwei Variablen. Für die DiOPHANTischen Gleichungen höheren Grades sind nur in Spezialfällen Lösungen bekannt 2. Lineare Diophantische Gleichungen in n Unbekannten Eine lineare DiOPHANTisc/ie Gleichung in n Unbekannten ist eine Gleichung der Form a\X\ + a2x2 + • • • anxn = b (ö; G Z, b € Z), E.205) für die nur die ganzzahligen Lösungen gesucht werden. Im weiteren wird ein Lösungsverfahren angegeben 3. Lösbarkeitsbedingung Unter der Bedingung, daß nicht alle ö; gleich 0 sind, ist die DiOPHANTische Gleichung E.205) genau dann lösbar, wenn der ggT(ai, a2,. ., an) ein Teiler von b ist. ¦ 114a; + 315?/ = 3 ist lösbar, denn ggTA14,315) = 3. Wenn eine lineare DiOPHANTische Gleichung in n Unbekannten n > 1 eine Lösung hat und Z der Variablengrundbereich ist, so hat die Gleichung unendlich viele Lösungen In der Lösungsmenge treten dann n—\ freie Parameter auf. Für Teilmengen von Z gilt dies aber nicht
336 5 Algebra und Diskrete Mathematik 4. Lösungsverfahren für n = 2 Es sei aiXi + a2x2 = b (ai,a2) ^ @,0) E.206a) eine lösbare DiOPHANTische Gleichung, d.h. ggT(ai, a2)\b . Um eine spezielle Lösung der Gleichung zu erhalten, dividiert man die Gleichung durch den ggT(ai,a2) und erhält dxx\ + a2x2 = b' mit ggT(ai,a'2) = l Wie unter 5 4 1,3., S 334 beschrieben, berechnet man nun den ggT(a/1, a'2) mit Hilfe des EUKLiDischen Algorithmus, um schließlich eine Darstellung von 1 als Linearkombination von a\ und a'2 zu erhalten a[c[ 4- a!2d2 = 1 Durch Einsetzen in die Ausgangsgleichung kann man sich davon überzeugen, daß das geordnete Paar (c'xb\ d2b') ganzer Zahlen eine Lösung der vorgegebenen DiOPHANTischen Gleichung ist ¦ 114a? + 315?/ = 6 . Man dividiert durch 3, denn 3 = ggTA14,315). Daraus folgt 38a: + 105?/ = 2 und 38 • 47 + 105 • (-17) = 1 (s. 5.4.1,3., S. 334). Das geordnete Paar D7 • 2, (-17) • 2) = (94, -34) ist eine spezielle Lösung der Gleichung 114x + 315y = 6 Die Lösungsgesamtheit der Gleichung E.206a) erhält man wie folgt Ist (x®,x2) irgendeine spezielle Lösung, die man auch durch Probieren erhalten haben könnte, dann ist die Menge aller Lösungen {(xj + t • a'2, x°2 - t • a[)\t e Z} E 206b) ¦ Die Lösungsmenge der Gleichung 114a: + 315y = 6 ist {(94 + 315t, -34 - 114*)|* G Z} . 5. Reduktionsverfahren für n > 2 Gegeben ist die lösbare DiOPHANTische Gleichung aiXi + a2x2 H h anxn = b E 207a) mit (ai,a2,... ,an) ^ @,0,... ,0) und ggT(ai,a2, ..,an) = 1. Wäre ggT(ai,o2, ,an) ^ 1, dann müßte man die Gleichung noch durch ggT(ax, a2,.... an) dividieren Nach der Umformung aiXi + a2x2 -\ h an-ixn-i =b- anxn E.207b) betrachtet man xn als ganzzahlige Konstante und erhält eine lineare DiOPHANTische Gleichung in n — 1 Unbekannten, die genau dann lösbar ist, wenn ggT(ai, a2,..., an_i) ein Teiler von b — anxn ist. Die Bedingung ggT(ai, a2,..., an-i)\b - anxn E 207c) ist genau dann erfüllt, wenn es ganze Zahlen c, cn gibt, für die gilt: ggT(oi,o2,. . ,a„-i) Q + ancn = b. E.207d) Das ist eine lineare DiOPHANTische Gleichung in zwei Unbekannten, die wie unter 5 4 2,4., S. 336 angegeben gelöst werden kann Ist ihre Lösung bekannt, hat man nur noch eine lineare DiOPHANTische Gleichung in n — 1 Unbekannten zu lösen. Die beschriebene Reduktion ist fortsetzbar, bis man schließlich eine lineare DiOPHANTische Gleichung in zwei Unbekannten erhält und mit dem Verfahren aus 5.4 2,4., S 336 lösen kann Aus den zwischenzeitlich berechneten Lösungsmengen für DiOPHANTische Gleichungen in zwei Unbekannten muß man nun nur noch die Lösungsmenge der Ausgangsgleichung ablesen. ¦ Es ist die DiOPHANTische Gleichung 2a: + 4y + 3z = 3 . E.208a) zu lösen. Sie ist lösbar, denn ggTB,4,3) ist ein Teiler von 3. Die DiOPHANTische Gleichung 2x + 4y = 3 - 3z E.208b) in den Unbekannten x, y ist genau dann lösbar, wenn ggTB,4) ein Teiler von 3 — 3,2 ist Die zugehörige DiOPHANTische Gleichung 2z' + 3z = 3 hat die Lösungsmenge {(-3 + 3t, 3 - 2t)\t G Z} Daraus folgt z = 3 — 2t, und gesucht ist nun die Lösungsmenge der lösbaren DiOPHANTischen Gleichung 2x + Ay = 3 - 3C - 2t) bzw x + 2y = -3 + 3£ E 208c)
5.4 Elementare Zahlentheorie 337 für jedes t € Z. Die Gleichung E.208c) ist lösbar wegen ggT(l,2) = 1|(—3 + 3*). Es gilt 1 • (-1) + 2 • 1 = 1 und 1 • C - St) + 2 • (-3 + St) = -3 + St. Die Lösungsmenge ist {(C - St) + 2s, (-3 + St) - s)\s € Z} . Daraus folgt x = C — St) + 2s, y = (—3 + St) — s, so daß sich die Lösungsmenge von E.208a) zu {C - 3/ + 2s, -3 + St - s, 3 - 2t)\s, t € Z} ergibt. 5.4.3 Kongruenzen und Restklassen 1. Kongruenzen Es sei m eine natürliche Zahl mit m > 1 Lassen zwei ganze Zahlen a und b bei Division durch m den gleichen Rest, so nennt man a und b kongruent modulo m und schreibt dafür a = b mod m oder a = b(m). ¦ 3 = 13 mod 5, 38 = 13 mod 5, 3 = -2 mod 5 Hinweis: Offensichtlich gilt a = b mod m genau dann, wenn m ein Teiler der Differenz a — b ist. Die Kongruenz modulo m ist eine Aquivalenzrelation (s. 5.2.4,1., S. 306) in der Menge der ganzen Zahlen Es gilt: a = a mod m für alle a G Z, E.209a) a = b mod m => b = a mod m, E.209b) a = b mod mAb = c mod m => a = c mod m. E.209c) 2. Rechenregeln a = b mod m Ac = d mod ra=>a + c = 6 + d mod m, E.210a) ö = b mod m Ac = d mod m => a ¦ c = b • d mod m, • E.210b) a- c = b- c mod m A ggT(c, m) = 1 => a = b mod m, E.210c) a- c = b- c mod m A c^0=> a = 6 mod—— r . E.210d) T ggT(c,m) V } 3. Restklassen, Restklassenring Da die Kongruenz modulo m eine Aquivalenzrelation in Z ist, induziert diese Relation eine Klasseneinteilung von Z in Restklassen modulo m. [o]m = {%\x € Z A x = a mod m} . E.211) Die Restklasse „a modulo m" besteht aus allen ganzen Zahlen, die bei Division durch m den gleichen Rest wie a lassen. Es gilt [a]m = [b]m genau dann, wenn a = b mod m ist. Zum Modul m gibt es genau m Restklassen, zu deren Beschreibung man in der Regel ihre kleinsten nichtnegativen Repräsentanten verwendet* [0]m,[l]m, .,[m-l]m E.212) In der Menge Zm der Restklassen modulo m wird durch [a]m 0 [b]m = [a + 6]m , E.213) [a]m 0 [b]m '= [o • 6]m E.214) eine Restklassenaddition bzw.Restklassenmultiplikation erklärt. Diese Restklassenoperationen sind unabhängig von der Auswahl der Repräsentanten, d.h., aus [a]m = [a'}m und [6]m = [b']m folgt Mm e [ft]ro = [a']m 0 [6']m und [o]m 0 [6]m = [a']m 0 [bf]m . E.215) Die Restklassen modulo m bilden bezüglich der Restklassenaddition und Restklassenmultiplikation einen Ring mit Einselement (s. 5 4.3,1., S. 337) den Restklassenring modulo m. Ist p eine Primzahl, dann ist der Restklassenring modulo p ein Körper (s. 5.4.3,1., S. 337).
338 5. Algebra und Diskrete Mathematik 4. Prime Restklassen Eine Restklasse [a]m mit ggT(a, m) = 1 nennt man eine prime Restklasse modulo m Ist p eine Primzahl, dann sind alle von [0]p verschiedenen Restklassen prime Restklassen modulo p Die primen Restklassen modulo m bilden bezüglich der Restklassenmultiplikation eine AßELsche Gruppe, die prime Restklassengruppe modulo m Die Ordnung dieser Gruppe ist (p(m). Dabei ist (p die Eu- LERsche Funktion (s. 5 4 4,1., S 341). ¦ A: [1]8, [3]8, [5]8, [7]s sind die primen Restklassen modulo 8. ¦ B: [1]5, [2] 5, [3] 5, [4] 5 sind die primen Restklassen modulo 5 ¦ C: Es gilt v?(8) = (p{5) = 4 5. Primitive Restklassen Eine prime Restklasse [a]m wird primitive Restklasse genannt, wenn sie in der primen Restklassengruppe modulo m die Ordnung ip(m) hat. ¦ A: [2]5 ist eine primitive Restklasse modulo 5, denn ([2]5J = [4]5, ([2]5K = [3]5, ([2]5L = [1]5 ¦ B: Es gibt keine primitive Restklasse modulo 8, denn [1]8 hat die Ordnung 1, und [3]8, [5]8, [7]8 haben in der primitiven Restklassengruppe die Ordnung 2. Hinweis: Es existiert genau dann eine primitive Restklasse modulo m , wenn m = 2,ra = 4,m = pfc oder m = 2pk gilt, wobei p eine ungerade Primzahl und k eine natürliche Zahl ist. Existiert eine primitive Restklasse modulo m, dann ist die prime Restklassengruppe modulo m eine zyklische Gruppe. 6. Lineare Kongruenzen 1. Definition Sind a, b und m > 0 ganze Zahlen, dann wird ax = b(m) E 216) lineare Kongruenz (in der Unbekannten x) genannt 2. Lösungen Eine ganze Zahl #*, die die Bedingung ax* = b(m) erfüllt, ist eine Lösung dieser Kongruenz Jede ganze Zahl, die zu x* kongruent modulo m ist, ist ebenfalls eine Lösung Will man alle Lösungen von E 216) angeben, dann genügt es also, die paarweise modulo m inkongruenten ganzen Zahlen zu finden, die die Kongruenz erfüllen Die Kongruenz E.216) ist genau dann lösbar, wenn ggT(a, m) ein Teiler von b ist Die Anzahl der Lösungen modulo m ist dann gleich ggT(a, m). Ist insbesondere ggT(a, m) = 1, dann ist die Kongruenz modulo m eindeutig lösbar 3. Lösungsverfahren Es gibt verschiedene Lösungsverfahren für lineare Kongruenzen. Man kann z.B. die Kongruenz ax = b(m) in die diophantische Gleichung ax + my = b umformen und zunächst eine spezielle Lösung (x°, y°) der diophantischen Gleichung a'x + m'y = b' mit a' = a/ggT(a, m),m' = m/ggT(a,ra),6' = 6/ggT(a,ra) ermitteln (s 5 4.2, S 335) Die Kongruenz a'x = b'(mf) ist wegen ggT(a', m!) = 1 modulo m! eindeutig lösbar, und es gilt. x = xQ(m') E.217a) Die Kongruenz ax = b(m) hat modulo m genau ggT(a, m) Lösungen x°, x° + m, x° + 2m,. ., x° + (ggT(a, m) - l)m. E 217b) ¦ 114a; = 6 mod 315 ist lösbar, denn ggTA14,315) ist Teiler von 6, es gibt 3 Lösungen modulo 315 3Sx = 2 mod 105 ist eindeutig lösbar- x = 94 mod 105 (s 5.4.2,4., S 336) Also sind 94, 199 und 304 die Lösungen von 114a: = 3 mod 315 7. Simultane lineare Kongruenzen Sind endlich viele Kongruenzen a: = 6i(mi),a; = 62G712), ..}x = bt(mt) E.218) vorgegeben, dann spricht man von einem System simultaner linearer Kongruenzen. Eine Aussage über die Lösungsmenge macht der Chinesische Restsatz Es sei ein System x = b\(m\),x = 62G712),. , x =
5.4 Elementare Zahlentheorie 339 bt(mt) so vorgegeben, daß mi,m2, ...,mt paarweise teilerfremd sind. Setzt man mm m . rt_ . m = nii - m<i • • -mt,ai = —, ö2 =—, • , a* = — E.219a) m\ m<i mt und wählt Xj so, daß üjXj = bj(mj) für j = 1,2,. , £ gilt, dann ist x' = a\X\ + 02^2 + • • • + atxt E.219b) eine Lösung des Systems Das System ist bis auf Kongruenz modulo m eindeutig lösbar, d h., mit x' sind genau diejenigen Elemente x" weitere Lösungen, für die gilt x" = x'{m). ¦ Es ist das System x = 1 B), x = 2 C), x = 4 E) zu lösen, wobei 2,3,5 paarweise teilerfremd sind Es gilt m — 30, ai = 15, a2 — 10, a3 = 6. Die Kongruenzen 15xi = 1 B), 10x2 = 2 C), 6x3 = 4 E) haben die speziellen Lösungen x\ = 1, X2 = 2, x3 = 4 Das gegebene System ist eindeutig lösbar mit x = 15 • 1 + 10 • 2 + 6 • 4 C0), d h x = 29 C0) Hinweis: Systeme simultaner linearer Kongruenzen kann man benutzen, um die Lösung von nichtlinearen Kongruenzen mit dem Modul m auf die Lösung von Kongruenzen zurückzuführen, deren Modul Primzahlpotenzen sind (s. 5 4.3,9., S 340). 8. Quadratische Kongruenzen 1. Quadratische Reste modulo m Man kann alle Kongruenzen ax2 + bx + c = 0(m) lösen, wenn man alle Kongruenzen x2 = a(m) lösen kann ax2 + bx + c = 0(ra) <£> {2ax + bJ = b2 - 4ac(m) E 220) Man betrachtet zunächst quadratische Reste modulo m Sei m G IN, m > 1 und a G Z, ggT(a, m) = 1 Die Zahl a heißt quadratischer Rest modulo m, wenn es ein x G Z mit x2 = a(m) gibt Ist die kanonische Primfaktorenzerlegung von m gegeben, d h. 00 m=Y[p*\ E.221) i=l so ist r genau dann quadratischer Rest modulo m, wenn r quadratischer Rest modulo p°* für i = 1,2,3, ..ist. Ist a quadratischer Rest modulo einer Primzahl p, dann schreibt man dafür auch kurz ( — 1 = 1, ist a nichtquadratischer Rest modulo p, dann schreibt man I - ) = — 1 (LEGENDRE-Symbol). ¦ Die Zahlen 1,4, 7 sind quadratische Reste modulo 9 2. Eigenschaften quadratischer Kongruenzen (El) Aus pj[ab und a = b(p) folgt [ - J = ( - ) . E.222a) (E2) ( - j = 1 E.222b) (E3) ( — j = (-lJ^ E.222c) (E4) (?) = (?) • 0; spezie11 (f) = (?) ¦ E-222d) (E5) (?) = <-^ •E 222e) (E6) Quadratisches Reziprozitätsgesetz Sind p und q zwei verschiedene ungerade Primzahlen, dann gilt. (?\ ¦ (l\ = (-ljW E 222f)
340 5 Algebra und Diskrete Mathematik ' © - (*) ¦ (ä) - (¥) ¦ (f) - (!) ¦ (I) - <->- (§) - - (ü) - 132-1 -(-i)—= i. Allgemein gilt: Eine Kongruenz x2 = aBa), ggT(a, 2) = 1, ist genau dann lösbar, wenn a = 1D) für a = 2 und a = 1(8) für cü > 3 ist. Sind diese Bedingungen erfüllt, dann gibt es für a = 1 eine Lösung, für q = 2 zwei und für a > 3 vier Lösungen modulo 2a . Für Kongruenzen der allgemeinen Form x2 = a(m), m = 2ap<?p? • • • pf', ggT(a, m) = 1 E.223a) sind o = lD)füra = 2, a = 1(8) für a > 3, ( — )=!,( — ]=1, .,(-]=! E.223b) notwendige Bedingungen für die Lösbarkeit. Sind alle diese Bedingungen erfüllt, dann ist die Anzahl der Lösungen gleich 2* für a = 0 und a = 1, gleich 2t+1 für a = 2 und gleich 2t+2 für a > 3 9. Polynomkongruenzen Sind mi, m2,.. •, mt paarweise teilerfremde Zahlen, dann ist die Kongruenz /(rr) = anxn + an-ix"-1 H h a0 = 0(mim2 • • • mt) E.224a) dem System f(x) = 0(mO, f(x) = 0(m2), ..., /(x) = 0(m,) E.224b) äquivalent. Ist kj die Anzahl der Lösungen von f(x) = 0(rrij) für j = 1,2,...,^, dann ist fci/^ • • • ^ die Anzahl der Lösungen von f(x) = 0(mim2 • • • mt). Man kann also die Lösung von Kongruenzen /(x)EO(pW-rf(). E.224c) wobei pi,P2, • • -,Pt Primzahlen sind, auf die Lösung von Kongruenzen f(x) = 0(pa) zurückfuhren. Diese wiederum lassen sich wie folgt auf Kongruenzen f(x) = 0(p) vom Primzahlmodul p zurückführen: a) Jede Lösung von f(x) = 0(pa) ist auch Lösung von f(x) = 0(p). b) Jede Lösung x = X\(p) von f(x) = 0(p) bestimmt unter der Bedingung, daß f'(xi) nicht durch p teilbar ist, eine einzige Lösung modulo pa: Sei f(xi) = 0(p) Man setzt x = X\ + pt\ und ermittelt die modulo p eindeutig bestimmte Lösung t\ der linearen Kongruenz Ü& + f(x1 )«i=0(p). E 225a) Setzt man t\ = t[ + pt^ in x = X\ + ph ein, dann erhält man x = x2 + p2t2. Man ermittelt nun die modulo p2 eindeutig bestimmte Lösung t'2 der linearen Kongruenz £^ + /'(x2)t2 = 0(p) E.225b) pl und erhält durch Einsetzen von t2 = t'2 -\-pts in x = x2 -\-p2t2 , daß x = x3 +p3t3 gilt. Durch Fortsetzung des Verfahrens erhält man die Lösung der Kongruenz f(x) = 0 (pQ). ¦ Es ist die Kongruenz f(x) = x4 + Ix + 4 = 0 B7) zu lösen. Aus f{x) = xA + 7x + 4 = 0 C) folgt x = 1 C), d.h x = l + 3ti Wegen f'{x) = 4x3 + 7 und 3//'(l) ist zunächst die Lösung der Kongruenz /(l)/3 + /'(l) • ti = 4 + llti = 0 C) gesucht: tx = 1 C), d.h. ti = 1 + 3£2 und x = 4 + 9t2 . Weiter betrachtet man /D)/9 + /'D) • t2 = 0 C) und erhält als Lösung t2 = 2 C), d.h t2 = 2 + 3£3
5.4 Elementare Zahlentheorie 341 und x = 22 + 27t3 Also ist 22 die modulo 27 eindeutig bestimmte Lösung von xA + 7x + 4 = 0 B7) 5.4.4 Sätze von Fermat, Euler und Wilson 1. Eulersche Funkt ion Für jede natürliche Zahl m mit m > 0 kann man die Anzahl der zu m teilerfremden Zahlen x mit 1 < x < m angeben Die zugehörige Funkion yp wird EULERsche Funktion genannt Der Funktionswert (p(rn) ist die Anzahl der primen Restklassen modulo m (s. 5.4.3,4., S 338). Es gilt ip{l) = 1, <pB) = 1, y?C) = 2, tpD) = 2, <pE) = 4, y?F) - 2, <pG) = 6, p(8) = 4 usw Allgemein gilt ip(p) = p — 1 für jede Primzahl p und </?(pQ) = pa — pa~l für jede Primzahlpotenz pQ Ist m eine beliebige natürliche Zahl, dann kann man ip(m) wie folgt berechnen (p(m) =mn(l--l , E.226a) p\m \ " / wobei das' Produkt über alle Primteiler p von m zu erstrecken ist ¦ <pC60) = (^B3 • 32 • 5) = 360 • A - \) • A - \) • A - \) = 96 Außerdem gilt 2<^(d) = m. E.226b) d\m Gilt ggT(m, n) = 1, dann ist ip(mri) = ip(m)<p(ri) ¦ <pC60) = v^B3 • 32 • 5) = <pB3) • y?C2) • y?E) = 4 • 6 • 4 = 96. 2. Satz von Fermat-Euler Der Satz von Fermat-Euler ist einer der wichtigsten Sätze der elementaren Zahlentheorie Sind a und m teilerfremde natürliche Zahlen, dann gilt: a*(m) = l(m). E.227) ¦ Es sind die letzten drei Ziffern der Dezimalbruchdarstellung von 999 zu ermitteln Gesucht ist x mit x = 99° A000) mit 0 < x < 999. Es gilt <pA000) = 400, und nach dem Satz von Fermat ist 9400 = 1 A000) Weiter gilt 99 = (80 + lL • 9 = ((J)80° • l4 + (^O1 • l3) • 9 = A + 4 • 80) • 9 = -79 • 9 = 89 D00). Daraus folgt 999 = 989 = A0 - l)89 = (809)l0° • (-1)89 + (^lO1 • (-1)88 + (829)l02 • (-1)87 = -1 + 89 • 10 - 3916 • 100 = -1 - 110 + 400 = 289A000). Die Dezimaldarstellung von 9q9 endet mit den Ziffern 289. Hinweis: Der obige Satz geht für m = p, d.h. <p(p) = p — 1, auf Fermat zurück; die allgemeine Form stammt von EULER Der Satz bildet die Grundlage eines Kodierungsverfahrens (s 5.4 5). Er beinhaltet ein notwendiges Kriterium für die Primzahleigenschaft einer natürlichen Zahl: Ist p eine Primzahl, dann gilt ap~l = l(p) für jede ganze Zahl a mit p\a . 3. Satz von Wilson Ein weiteres Primzahlkriterium liefert der Satz von WILSON Für jede Primzahl p ist (p — 1)' = —l(p). Auch die Umkehrung dieses Satzes ist eine wahre Aussage, so daß gilt: Die Zahl p ist genau dann eine Primzahl, wenn (p — 1)' = — l(p) ist 5.4.5 Codierungen In der Codierungstheorie werden Verfahren bereitgestellt, um Fehler in Datensätzen erkennen und korrigieren zu können. Die einfachsten Methoden zur Erkennung von Fehlern sind die im folgenden vorgestellten Prüfzeichenverfahren.
342 5. Algebra und Diskrete Mathematik 5.4.5.1 Prüfzeichenverfahren 1. Internationale Standard-Buchnummer ISBN Eine einfache Anwendung von Zahlenkongruenzen ist die Verwendung von Prüfziffern in der Internationalen Standard-Buchnummer ISBN. Büchern wird eine 10-stellige Ziffernkombination der Form ISBN a-bcd- efghi - p E.228a) zugeordnet. Dabei ist a die Gruppennummer (a = 3 bedeutet z.B , daß das Buch aus Deutschland, Östereich oder der Schweiz kommt), bcd ist die Verlagsnummer und efghi die Titelnummer für das einzelne Buch des betreffenden Verlages. Als Prüfziffer ist p eingeführt, damit fehlerhafte Buchbestellungen erkannt und im Zusammenhang damit stehende Unkosten minimiert werden können. Die Prüfziffer p ist die kleinste nichtnegative Zahl, die die folgende Kongruenz erfüllt: 10a + 96 + 8c + ld + 6e + 5/ + 4g + 3h + 2t 4- p = 0A1) E.228b) Anstelle von 10 verwendet man als Prufziffer auch das nichtnumerische Zeichen X (s. auch 5.4.5,3., S. 342). Man kann nun für jede übermittelte ISBN-Nummer nachprüfen, ob die angegebene Prüfziffer mit der aus der restlichen Ziffernkombination ermittelten Prüfziffer übereinstimmt. Bei Nichtübereinstimmung liegt mit Sicherheit ein Fehler vor Beim ISBN-Prüfziffernverfahren werden folgende Fehler stets aufgedeckt: • Verwechslung einer Ziffer und • Vertauschung zweier Ziffern („Drehfehler") Statistische Untersuchungen ergaben, daß damit über 90% aller auftretenden Fehler aufgedeckt werden. Alle weiteren beobachteten Fehlertypen haben eine relative Häufigkeit von unter 1%. In der Mehrheit der Fälle werden das Verwechseln zweier Ziffern und die Vertauschung zweier kompletter Ziffernblöcke durch das beschriebene Ziffernverfahren aufgedeckt 2. Pharmazentralnummer In Apotheken wird zur Kennzeichnung von Arzneimitteln ein ähnliches Nummernsystem mit Prüfziffer verwendet. Jedes Medikament erhält eine 7-stellige Pharmazentralnummer abcdefp. E.229a) Die letzte Ziffer ist die Prüfziffer p, die man als kleinste nichtnegative Zahl erhält, die die Kongruenz 2a + 36 + 4c + 5d 4- 6e + 7/ = p(ll) E 229b) erfüllt. Auch bei diesem Prüfzifferverfahren werden die Verwechslung einer Ziffer und Drehfehler durch Vertauschung zweier Ziffern stets aufgedeckt. 3. Einheitliches Kontonummernsystem EKONS EKONS ist die Abkürzung für „Einheitliches Kontonummernsystem", das bei Banken und Sparkassen verwendet wird Die Nummern sind maximal zehnstellig (je nach Geschäftsvolumen). Die ersten (maximal 4) Ziffern dienen der Klassifikation der Konten. Die restlichen 6 Ziffern bilden die eigentliche Kontonummer einschließlich der Prüfziffer, die an der letzten Stelle steht. Bei den einzelnen Banken und Sparkassen sind unterschiedliche Prüfziffernverfahren üblich, z.B.- a) Die Ziffern werden abwechselnd, von rechts beginnend, mit 2 bzw. 1 multipliziert, und die Summe dieser Produkte wird durch Addition der Prüfziffer p zur nächsten durch 10 teilbaren Zahl ergänzt, d.h., für die Kontonummer abcd efghi p mit der Prüfziffer p gilt- 2z + /i + 2# + / + 2e + d + 2c + 6 + 2a + p = 0A0). E.230) b) Bei dem Verfahren a) wird anstelle der Produkte - falls die Produkte zweistellig sind - die Quersumme der Produkte verwendet Bei Variante a) entdeckt man alle Fehler durch Vertauschung zweier benachbarter Ziffern und fast alle Fehler durch Verwechslung einer Ziffer. Bei Variante b) werden dagegen jeder Fehler durch Verwechslung einer Ziffer und fast alle Fehler durch Vertauschung zweier benachbarter Ziffern erkannt. Drehfehler nicht benachbarter Ziffern und Verwechslungen zweier Ziffern werden oft nicht aufgedeckt
5.4 Elementare Zahlentheorie 343 Daß man das leistungsfähigere Prüfziffernsystem zum Modul 11 nicht verwendet, hat außermathematische Gründe So erfordert das nichtnumerische Zeichen X (anstelle der Prüfziffer 10 (s. 5.4.5,1., S 342)) eine Erweiterung der Eingabetastatur. Dagegen hätte ein Verzicht auf Kontonummern mit der Prüfziffer 10 bei Umstellung auf das einheitliche Nummernsystem in einer beträchtlichen Zahl von Fällen eine Erweiterung der ursprünglichen Kontonummern nicht zugelassen. 4. Europäische Artikelnummer EAN EAN ist eine Abkürzung für „Europäische Artikelnummer ", die man auf sehr vielen Artikeln in Form eines Strichcodes bzw. als 13- oder 8-stellige Ziffernfolge findet Mit Hilfe von Scannern kann der Strichcode an Computerkassen eingelesen werden Bei der 13-stelligen Nummer geben die ersten beiden Ziffern das Herstellungsland an, z B 40, 41, 42, 43 oder 44 für Deutschland. Die nächsten 5 Ziffern stehen für den Hersteller, und eine weitere Gruppe von 5 Ziffern für das entsprechende Produkt. Die letzte Ziffer ist die Prüfziffer p. Man erhält die Prüfziffer, wenn man die ersten 12 Ziffern abwechselnd von links beginnend mit 1 bzw 3 multipliziert und die Summe dieser Produkte durch Addition der Prufziffer p zur nächsten durch 10 teilbaren Zahl ergänzt Somit gilt für die Artikelnummer ab cdefg hikmn p mit der Prüfziffer p: a + 3& + c + 3d + e + 3/ + # + 3/i + i + 3A; + m + 3n + p = 0A0) E.231) Durch dieses Prüfziffernverfahren werden an der EAN Fehler durch Verwechslung einer Ziffer immer aufgedeckt und Fehler durch Vertauschung zweier benachbarter Ziffern in den meisten Fällen erkannt Oft nicht aufgedeckt werden Drehfehler durch Vertauschen nicht benachbarter Ziffern und Verwechslungen zweier Ziffern. 5.4.5.2 Fehlerkorrigierende Codes 1. Modell der Datenübertragung und Fehlerkorrektur Auch bei der Übertragung von Nachrichten in gestörten Kanälen ist oft eine Korrektur von Fehlern möglich, indem zunächst die Nachrichtenwörter codiert und nach einer eventuell fehlerhaften Übertragung wieder zu den richtigen Codewörtern korrigiert werden, so dass die ursprüngliche Nachricht durch Decodieren ermittelt werden kann Hier wird der Fall betrachtet, dass die Nachrichtenwörter die Länge k und die Codewörter die Länge n haben und sowohl Nachrichten- als auch Codewörter Folgen von Nullen und Einsen sind. Dabei wird k auch die Anzahl der Informationsstellen und n — k die Anzahl der Redundanzstellen genannt. Jedes Nachrichtenwort ist ein Element von GFB)fc (s. 5 3.6.4, S. 325) und jedes Codewort ein Element von GFB)n Zur Vereinfachung der Darstellung schreibt man einfach a\a2 . ßfc für die Nachrichtenwörter und C\C2 ... cn für die Codewörter Übertragen werden nicht die Nachrichtenwörter selbst, sondern die ihnen zugeordneten Codewörter. Ein häufig benutztes Prinzip der Fehlerkorrektur ist die Methode, das empfangene Wort d\d2 dn zu einem Codewort C\c2 cn zu decodieren, das sich von d\d2 .. dn an möglichst wenigen Stellen unterscheidet (MLD-Decodierung) Von den Eigenschaften der Codierung und den Eigenschaften des Übertragungskanals hängt es ab, wie viele Fehler auf diese Weise korrigierbar sind I Bei Verwendung eines Wiederholungscodes kann man die Nachricht 0 als Codewort 0000 darstellen Erhält nach Übertragung des Codeworts der Empfänger das Wort 0010, wird er vermuten, dass 0000 das ursprüngliche Codewort gewesen ist und 0 die ursprüngliche Nachricht. Erhält er dagegen 1010, dann ist eine Entscheidung nicht möglich, ob die Nachricht 0 oder die Nachricht 1, die bei diesem Wiederholungscode durch 1111 codiert wird, übermittelt werden sollte Man erkennt aber, dass beim Übertragen ein Fehler aufgetreten ist 2. t-fehlerkorrigierende Codes Die Menge aller Codewörter nennt man einen Code C. Der Abstand zweier Codewörter ist die Anzahl der Stellen, in denen sich diese Codewörter unterscheiden Der Minimalabstand dm\n(C) des Codes ist der kleinste Abstand, der zwischen zwei Codewörtern von C vorkommt ¦ Für d = {0000,1111} gilt dmin(d) = 4 Für C2 = {000,011,101,110} gilt dmin(C2) = 2; je zwei Codewörter haben den Abstand 2 Für C3 = {00000,01101,10111,11010} gilt dmin(C3) = 4; es gibt in C3 aber auch Codewörter mit dem
344 5 Algebra und Diskrete Mathematik Abstand 3. Kennt man den Minimalabstand dmin(C) eines Codes C, dann kann man leicht ablesen, wie viele Über- tragungsfehler korrigierbar sind. Codes, die t Fehler korrigieren, werden t-fehlerkorrigierend genannt Ein Code C ist t-fehlerkorrigierend genau dann, wenn dmm(C) > 2t + 1 gilt ¦ (Fortsetzung) C\ ist l-fehlerkorrigierend, C2 ist O-fehlerkorrigierend (damit sind also keine Fehler korrigierbar), C3 ist l-fehlerkorrigierend. Für jeden Mehlerkorrigierenden Code C C GFB)n gilt £ (f) • \C\ < T. Gilt Gleichheit, dann nennt man C einen t-perfekten Code. ¦ Der Wiederholungscode C = {00... 0,11.. 1} C GFBJt+1 ist t-perfekt. 3. Linearcodes Eine nichtleere Teilmene C C GFB)n heißt (binärer) linearer Code, wenn C ein Untervektorraum von GFB)n ist. Hat ein linearer Code C C GFB)n die Dimension k, dann wird er ein (n, k)-Linearcode genannt ¦ (Fortsetzung) C\ ist ein D, l)-Linearcode, C2 ist ein C,2)-Linearcode, C3 ist ein E,2)-Linearcode. Für binäre Linearcodes sind die Minimalabstände (und daraus die Anzahlen der korrigierbaren Fehler) leicht erkennbar: Der Minimalstand eines solchen Codes ist der kleinste Abstand eines Codewortes, das nicht selbst der Nullvektor ist, zum Nullvektor des Vektorraums. Man findet also den Minimalabstand, indem man die Minimalzahl > 0 von Einsen in den Codewörtern ermittelt. Für jeden (n, /c)-Linearcode C gibt es eine Generatormatrix G mit C = {aG \ a G GFB)/c}- [Qu •.- 9in\ (9i\ G= : : = ! E232) \9ki ¦ ¦ 9knJ kxn \9kJ Der Code ist durch Angabe der Generatormatrix eindeutig beschrieben, das Codewort zum Nachrichtenworts a\ü2 . ak wird nach folgender Vorschrift bestimmt: aia2 ...ak^ aigi + a2#2 + • • ¦ + ak9k E.233) aG Zum Decodieren benötigt man bei (n, fc)-Linearcodes C eine Kontrollmatrix H. / hu ... hin \ H = • • : E 234) \/ln_M ... hn-ktn ) {n_k)xn Der (binäre) Linearcode C ist (mindestens) l-fehlerkorrigierend, wenn die Spalten von H paarweise verschieden und ungleich vom Nullvektor sind Hat man in so einem Fall nach der Übertragung das Wort d = d\d2 . dn erhalten, dann berechnet man Hd?. Ist das der Nullvektor, dann ist d selbst ein Codewort. Ansonsten stellt man fest, daß HdF die i-te Spalte hi der Kontrollmatrix H ist, das zugehörige Codewort ist dann d + e*, wobei e» = @,. ., 0,1,0, ., 0) ist und die 1 an der i-ten Stelle steht. 4. Zyklische Codes Die zyklischen Codes sind die am besten untersuchten Linearcodes, sie erlauben eine effiziente Codierung und Decodierung Ein (binärer) (n, A;)-Linearcode C heißt zyklisch, wenn für alle c\c2 . cn gilt CqCi . Cn_i GC^> Cn_iCoCi . . Cn_2 G C ¦ C = {000,110,101,011} ist ein zyklischer C,2)-Linearcode. Um effizient mit zyklischen Codes arbeiten zu können, stellt man deren Codewörter durch Polynome
5.4 Elementare Zahlentheorie 345 vom Grad < n — 1 mit Koeffizienten aus GFB) dar. cqCi . cn_i <-> c(x) = Co + C\x + ... + cn-ixn~l E.235) Ein (binärer) (n, /c)-Linearcode C ist genau dann zyklisch, wenn für alle c(x) gilt: c(x) G C => c{x) • x(mod xn -1) G C E.236) Einen zyklischen (n, A;)-Linearcode kann man durch Generatorpolynome und Kontrollpolynome wie folgt beschreiben. Das Generatorpolynom g(x) vom Grad n - k (k G {1,2,..., n — 1}) ist ein Teiler von xn - 1 Das Polynom h(x) vom Grad /c mit g{x)h(x) = xn — 1 wird Kontrollpolynom genannt. Die Codierung von a\ü2 . ßfc in Polynomdarstellung a(x) erfolgt durch a(x) h-> a(x) • ^(x). E.237) d(x) ist genau dann ein Element des Codes, wenn das Generatorpolynom g(x) ein Teiler von d(x) ist, und genau dann, wenn für das Kontrollpolynom h(x) die Bedingung d(x) • h(x) = 0(mod a:n — 1) erfüllt ist. Eine besonders wichtige Klasse von zyklischen Codes sind die BCH-Codes, weil man sich dabei eine untere Schranke S für den Minimalabstand und damit eine untere Schranke für die Fehleranzahl vorgeben kann, die der Code korrigieren soll Dabei wird 5 die Entwurfsdistanz des Codes genannt. Ein (binärer) (n, fc)-Linearcode C ist ein BCH-Code mit Entwurfsdistanz 6, wenn für sein Generatorpolynom g(x) gilt. g(x) — kgV(mab(x),mab+i(x), ,mQb+s-2(x)), E.238) wobei a eine primitive n-te Einheitswurzel und b eine ganze Zahl ist. Die Polynome mQj(x) sind Minimalpolynome von a?. Für einen BCH-Code C mit Entwurfsdistanz S gilt dmin(C) > ö.
346 5. Algebra und Diskrete Mathematik 5.5 Kryptologie 5.5.1 Aufgabe der Kryptologie Kryptologie ist die Wissenschaft der Geheimhaltung von Informationen durch Transformation von Daten Die Idee, Daten vor unberechtigtem Lesen zu schützen, ist schon alt Als selbständiger Wissenszweig hat sich die Kryptologie in den 70er Jahren unseres Jahrhunderts mit der Einführung von Kryptosyste- rnen mit öffentlichem Schlüssel etabliert Heute ist es Aufgabe kryptologischer Untersuchungen, Daten sowohl gegen unberechtigten Zugriff als auch gegen unberechtigte Änderungen zu schützen Neben den „klassischen" militärischen Anwendungen erlangen die Bedürfnisse der Informationsgesellschaft immer mehr an Bedeutung Beispielsweise geht es um die Gewährleistung der Sicherheit bei der Nachrichtenübermittlung per e-mail, um den elektronischen Zahlungsverkehr (Home-Banking), PIN bei EC-Karten usw Unter dem Oberbegriff Kryptologie faßt man heute die beiden Teilgebiete Kryptographie und Kryp- toanalysis zusammen. Im Rahmen der Kryptographie werden Kryptosysteme entwickelt, deren kryp- tographische Stärke mit Hilfe der Methoden der Kryptoanalysis zum Brechen von Kryptosystemen beurteilt werden kann 5.5.2 Kryptosysteme Ein abstraktes Kryptosystem besteht aus den folgenden Mengen: Nachrichtenraum M, Schlüsseltextraum C, Schlüsselräume K und K', Funktionsräume E undID Eine Nachricht m G M wird durch Anwendung einer Abbildung E G E mit einem Schlüssel k G K zu einem Schlüsseltext c G C verschlüsselt und über einen Kommunikationskanal übermittelt Der Empfänger kann aus c die ursprüngliche Nachricht rn reproduzieren, sofern er über eine geeignete Abbildung DgD und den dazu passenden Schlüssel k' G K' verfügt Es gibt zwei Arten von Kryptosystemen: 1. Symmetrische Kryptosysteme: Beim klassischen symmetrischen Kryptosystem verwendet man den gleichen Schlüssel k zum Verschlüsseln der Nachricht und zum Entschlüsseln des Schlüsseltextes. Beim Erstellen von klassischen Kryptosystemen kann der Anwender seiner Phantasie freien Lauf lassen. Das Verschlüsseln und Entschlüsseln darf aber nicht zu kompliziert werden In jedem Fall ist die sichere Übertragung zwischen beiden Kommunikationspartnern unabdingbar 2. Asymmetrische Kryptosysteme: Beim asymmetrischen Kryptosystem (s 5.5.7.1, S. 350) verwendet man zwei Schlüssel, einen privaten (streng geheimen) und einen öffentlichen Schlüssel Der öffentliche Schlüssel kann auf dem gleichen Weg wie der Schlüsseltext übertragen werden Die Sicherheit der Kommunikation ist hierbei durch die Verwendung sogenannter Einwegfunktionen (s. 5.5.7 2, S 351) gewährleistet, die es dem unbefugten Lauscher unmöglich machen, den Klartext aus dem Schlüsseltext zu ermitteln. 5.5.3 Mathematische Präzisierung Ein Alphabet A = {ao, ai, • • , an-i} ist eine endliche nichtleere totalgeordnete Menge, deren Elemente üi Buchstaben genannt werden Die Länge des Alphabetes ist \A\ Eine Zeichenreihe w = a!xa!2 . a'n der Länge n G IN, die aus Buchstaben von A besteht, ist ein Wort der Länge n über dem Alphabet A Mit An wird die Menge aller Wörter der Länge n über A bezeichnet Seien n,m G N und A, B Alphabete sowie S eine endliche Menge. Eine Kryptofunktion ist eine Abbildung t. An x S —? Bm , so daß die Abbildung t9. An —> Bm w —? t(w, s) für jedes s G S injektiv ist. Dabei werden ts und t~l Verschlüsselungsfunktion bzw Entschlüsselungsfunktion genannt, w ist der Klartext und t8(w) der Schlüsseltext. Für eine Kryptofunktion ist die einparametrige Familie {ts }ses ein Kryptosystem Ts Der Begriff Kryptosystem findet Verwendung, wenn neben der Abbildung t auch Struktur und Größe der Schlüsselmenge
5.5 Kryptologie 347 von Bedeutung sind. Die Menge S aller zu einem Kryptosystem gehörenden Schlüssel heißt Schlüsselraum. Für n = m und A = B wird Ts = {ts: An -? An\s e S} E.239) Kryptosystem auf An genannt. Ist Ts ein Kryptosystem auf An, dann heißt ts kontinuierliche Chiffre, falls n = 1 ist; anderenfalls ist ts eine Blockchiffre. Kryptofunktionen aus einem Kryptosystem auf An sind zum Verschlüsseln von Klartexten beliebiger Länge geignet Man zerlegt dazu den Klartext in Blöcke der Länge n und wendet die Funktion auf jeden der Blöcke einzeln an. Gegebenenfalls müssen noch sogenannte Blender hinzugefügt werden, um den Klartext auf eine durch n teilbare Länge zu ergänzen. Blender dürfen den Klartext nicht stören Man unterscheidet kontextfreie Verschlüsselung, bei der ein Schlüsseltextblock nur Funktion des zugehörigen Klartextblocks und dessen Schlüssel ist, und kontextsensitive Verschlüsselung, bei der der Schlüsseltextblock auch von anderen Blöcken der Nachricht abhängig ist Im Idealfall hängt jede Schlüsseltextstelle von allen Klartextstellen und allen Schlüsselstellen ab Kleine Änderungen in Klartext oder Schlüssel bewirken dann große Änderungen im Schlüsseltext (Lawineneffekt). 5.5.4 Sicherheit von Kryptosystemen In der Kryptoanalysis geht es um die Entwicklung von Methoden, mit denen man aus dem Schlüsseltext ohne Kenntnis des Schlüssels möglichst viele Informationen über den Klartext gewinnen kann Nach A. Kerckhoff liegt die Sicherheit eines Kryptosystems allein in der Schwierigkeit, den Schlüssel oder genauer die Entschlüsselungsfunktion zu finden Sie darf nicht auf der Geheimhaltung des Systems selbst beruhen Es gibt verschiedene Aspekte zur Beurteilung der Sicherheit von Kryptosystemen* 1. Absolut sichere Kryptosysteme: Das one-time-tape ist ein absolut sicheres Kryptosystem. Der Beweis dafür wurde von Shannon im Rahmen der Informationstheorie erbracht. 2. Analytisch sichere Kryptosysteme: Es gibt kein Verfahren, mit dem dieses Kryptosystem systematisch gebrochen werden kann. Der Beweis für die Nichtexistenz solcher Verfahren kann durch den Nachweis der Nicht-Berechenbarkeit der Entschlüsselungsfunktion erfolgen 3. Komplexitätstheoretisch sichere Kryptosysteme: Es gibt keinen Algorithmus, der das Kryptosystem in Polynomzeit (bezüglich der Textlänge) brechen kann. 4. Praktisch sichere Kryptosysteme: Es ist kein Verfahren bekannt, das das Kryptosystem mit den verfügbaren Ressourcen bei vertretbaren Kosten brechen kann. Bei der Kryptoanalyse werden oft statistische Methoden (Häufigkeitsanalysen für Buchstaben und Wörter) angewandt Neben dem vollständigen Suchen und der Trial-and-Error-Methode ist auch eine Strukturanalyse des Kryptosystems denkbar (Lösen von Gleichungssystemen) Bei Angriffen auf Kryptosysteme kann man versuchen, einige häufig vorkommende Chiffrierfehler auszunutzen, z B.die Verwendung stereotyper Formulierungen, das wiederholte Senden wenig geänderter Klartexte, eine ungeschickte vorhersehbare Schlüsselauswahl und die Verwendung von Füllzeichen. 5.5.4.1 Methoden der klassischen Kryptologie Außer durch Anwendung von Kryptofunktionen ist es auch möglich, einen Klartext durch kryptologische Codes zu verschlüsseln (Kodierung). Darunter versteht man eine bijektive Abbildung von einer Teilmenge A! der Menge aller Wörter über einem Alphabet A auf eine Teilmenge B' der Menge aller Wörter über einem Alphabet B. Die Menge aller Original-Bild-Paare dieser Abbildung heißt Codebuch. _ heute abend 0815 morgen abend 1113 Dem Vorteil, daß lange Klartexte durch kurze Nachrichten ersetzt werden können, steht der Nachteil gegenüber, daß gleiche Klartextteile durch gleiche Schlüsseltextteile ersetzt werden und auch nur teilweise kompromittierte Codebücher mit großem Aufwand komplett ausgetauscht werden müssen.
348 5 Algebra und Diskrete Mathematik Im weiteren Text weiden nur noch Verschlüsselungen mit Hilfe von Kryptofunktionen betrachtet Diese haben den zusätzlichen Vorteil, daß keine vorherige Absprache über den Inhalt der auszutauschenden Nachrichten erfolgen muß Klassische Kryptooperatwnen sind Substitution und Transposition Transpositionen sind in der Kryptologie spezielle, über geometrische Figuren definierte Permutationen. Im weiteren sollen die Substitutionschiffren genauer vorgestellt werden Man unterscheidet monoalphabetische und polyalphabetische Substitutionen, je nachdem, ob ein Alphabet oder mehrere Alphabete zur Abfassung des Schlüsseltextes herangezogen werden Allgemeiner spricht man auch von polyalphabetischen Substitutionen, wenn zwar nur ein Alphabet benutzt wird, jedoch die Verschlüsselung der Klartextzeichen von deren Position im Text abhängig ist Außerdem ist eine Einteilung in monographische und polygraphische Substitutionen sinnvoll Im ersten Fall werden Einzelzeichen ersetzt, im zweiten Fall Zeichenfolgen einer festgesetzten Länge > 1. 5.5.4.2 Affine Substitutionen Ist A — {ao, oi, , an_i} und k, s € {0,1,..., n — 1} mit dem ggT(/c, n) = 1, dann wird die Permutation £j , die jeden Buchstaben ai auf ^(aj = a^+s abbildet, eine affine Substitution genannt Es gibt n ip(ri) verschiedene affine Substitutionen auf A Veischiebechiffren sind affine Substitutionen mit k = 1 Die Verschiebechiffre mit s = 3 wurde schon von JULIUS Caesar A00 bis 44 v Chr ) benutzt und heißt deshalb CAESAR-Chiffre A B C D E F A B C D E F A B C D E F B C D E F G C D E F G H D E F G H I E F G H I J F G H I J K 5.5.4.3 Vigenere-ChifFre Die Verschlüsselung bei der ViGENERE-Chiffre basiert auf der periodischen Verwendung eines Schlüsselwortes, dessen Buchstaben paarweise verschieden sind In einer Version dieser Chiffre nach L. CAROLL wird zum Ver- und Entschlüsseln das sogenannte VlGENERE-Tableau benutzt (s nebenstehend) Steht das Klartextzeichen in Zeile i und das Schlüsselzeichen in Spalte j des ViGENERE-Tableaus, dann wird das Schlüsseltextzeichen im Schnittpunkt der beiden Reihen im Innern des Tableaus abgelesen Die Entschlüsselung erfolgt in umgekehrter Reihenfolge ¦ Als Schlüsselwort wird „Hut" gewählt Klartext- E S W A R E Schlüssel H U T H U T Schlüsseltext L M P H L X Formal kann man die Vigenere- Chiffre auch wie folgt schreiben- Ist a^ der Klartextbuchstabe und aj der zugehörige Schlüsselbuchstabe, dann ist a^ der Schlüsseltextbuchstabe genau dann, wenn i + j = k gilt 5.5.4.4 Matrixsubstitutionen Sei A = {aQ,a±, ,an-i} ein Alphabet und S = (s^), Sy G {0,1, ,n — 1}, eine nichtsinguläre Matrix vom Typ (m, m) mit ggT(det5, n)= 1 Die Abbildung, die jedem Klartextblock a*(i)-ö£B), • • • ,Q>t(m) den Schlüsseltextblock mit der Indexfolge (die Rechnung wird modulo n ausgeführt) I N H U P H M T F A H H L U F / (a'm\\T V a>t(m) I E 240)
5.5 Kryptologie 349 zuordnet, heißt HiLL-ChifTre. Es handelt sich dabei um eine monoalphabetische Matrixsubstitution. /1483\ ¦ S = I 8 5 2 ; die Buchstaben des Alphabetes seien a0 = A,a\ = B,.. ,a25 = Z Wählt V 321/ man als Klartext das Wort „HERBST", dann sind den Buchstabenfolgen HER, BST die Indexfolgen G,4,17) bzw A,18,19) zugeordnet. Man erhält S • G,4,17)T = A81,110,46)T und S • A,18,19)T = B15,136,58)T. Nach Reduktion modulo 26 ergeben sich die Indexfolgen B5,6,20) und G,6,6) sowie die zugehörigen Buchstabenfolgen ZGU bzw HGG. Der Schlüsseltext zum Klartext HERBST lautet also ZGUHGG 5.5.5 Methoden der klassischen Kryptoanalysis Das Ziel kryptoanalytischer Untersuchungen besteht darin, ohne Kenntnis des Schlüssels aus dem Schlüsseltext möglichst viele Informationen über den zugehörigen Klartext abzuleiten Solche Untersuchungen sind nicht nur für unberechtigte „Lauscher" von Interesse, sondern auch zur Beurteilung der Sicherheit von Kryptosystemen aus der Sicht von deren Anwendern. 5.5.5.1 Statistische Analyse Für jede natürliche Sprache gibt es Verteilungen der Häufigkeiten von Einzelbuchstaben, Buchstabenpaaren, Worten usw. Zum Beispiel ist in der deutschen Sprache E der häufigste Buchstabe: Buchstaben Gesamthäufigkeiten E, N 27,18 % I, S, R, A, T 34,48 % D, H, U, L, C, G, M, O, B, W, F, K, Z 36,52 % P,V, J,Y,X, Q 1,82% Für ausreichend lange Schlüsseltexte ist es unter Ausnutzung der Häufigkeitsverteilungen möglich, monoalphabetische monographische Substitutionen zu brechen 5.5.5.2 Kasiski-Friedman-Test Mit der kombinierten Methode von Kasiski und Friedman ist es möglich, ViGENERE-Chiffren zu brechen. Dabei wird die Tatsache ausgenutzt, daß bei diesem Chiffrierverfahren das Schlüsselwort periodisch verwendet wird Es treten also Wiederholungen von Teilfolgen im Schlüsseltext auf, wenn gleiche Klartextfolgen mit gleichen Schlusselfolgen verschlüsselt worden sind. Der Abstand solcher übereinstimmender Teilfolgen mit der Länge > 2 im Schlüsseltext ist ein Vielfaches der Schlüssellänge Gibt es mehrere sich wiederholende Schlüsseltextfolgen, dann muß die Schlüssellänge den größten gemeinsamen Teiler der Abstände teilen Diese Überlegung wird KASISKI-Test genannt. Man muß aber die Möglichkeit in Betracht ziehen, daß solche Übereinstimmungen auch durch Zufall enstanden sein könnten und damit das Ergebnis verfälschen würden Während der KASISKI- Test die Schlüsselwortlänge nur bis auf Vielfache und Teiler liefert, gibt der Friedman-Test die Größenordnung der Schlüsselwortlänge an Für die Schlüsselwortlänge / eines ViGE- NERE-verschlüsselten Klartextes in deutscher Sprache mit einem Schlüsseltext der Länge n (Zeichenzahl) gilt 0,0377n ~ (n- \)IC - 0,0385n + 0,0762 ^ ^ Dabei ist IC der Koinzidenzindex des Schlüsseltextes, der sich wie folgt aus den Anzahlen rii der Buchstaben üi (i 6 {0,1, , 25}) des Schlüsseltextes berechnen läßt. 26 £ ni(rii - 1) &=—, TT"' E241b) n(ra-l)
350 5. Algebra und Diskrete Mathematik Zur Ermittlung des Schlüsselwortes schreibt man den Schlüsseltext der Länge n in / Spalten. Es genügt nun, spaltenweise das Äquivalent der Buchstaben E zu finden, da die Spalten bei der VlGENERE-Chiffre durch eine Verschiebechiffre entstanden sind. Ist z B. V der häufigste Buchstabe in einer Spalte, dann findet man im ViGENERE-Tableau E E 241c) R. V den Buchstaben R des Schlüsselwortes Benutzt eine VlGENERE-Chiffre einen sehr langen Schlüssel (z B von der Länge des Klartextes), dann führen die hier beschriebenen Methoden nicht zum Ziel. Man kann aber erkennen, ob die verwendete Chiffre monoalphabetisch, polyalphabetisch mit kleiner Periode oder polyalphabetisch mit großer Periode ist. 5.5.6 One-Time-Tape Hierbei handelt es sich um eine als theoretisch sicher geltende Chiffre Die Verschlüsselung erfolgt nach dem Prinzip der VlGENERE-Chiffre, jedoch verwendet man als Schlüssel eine Zufallsfolge von Buchstaben, deren Länge mit der Länge des Klartextes übereinstimmt. In der Regel werden one-time-tapes als binäre ViGENERE-Chiffren realisiert. Klartext und Schlüssel sind dann als Dualzahlen dargestellt und werden modulo 2 addiert. Unter diesen Bedingungen ist die Chiffre involutorisch, d h., das zweimalige Anwenden der Chiffre liefert wieder den Klartext Die technische Ausführung von binären ViGENERE-Chiffren erfolgt durch Schieberegister Schaltungen. Darunter versteht man Schaltungen, die nach bestimmten Regeln aus Speicherbausteinen, die die Zustände 0 oder 1 annehmen können, und Schaltern zusammengesetzt sind. 5.5.7 Verfahren mit öffentlichem Schlüssel Obwohl die Verfahren der klassischen Kryptologie mit der heutigen Rechentechnik effizient realisierbar sind und auch für zweiseitige Nachrichtenverbindungen nur ein Schlüssel erforderlich ist, gibt es auch eine Reihe von Nachteilen • Die Chiffriersicherheit beruht allein auf der Geheimhaltung des Schlüssels. • Die Schlüssel müssen vor der Kommunikation auf einem hinreichend gesicherten Kanal ausgetauscht werden, spontane Kommunikation ist nicht möglich. • Es ist darüber hinaus nicht möglich, Dritten gegenüber nachzuweisen, daß ein bestimmter Absender eine bestimmte Nachricht geschickt hat. 5.5.7.1 Konzept von Diffie und Hellman Das Konzept der Verfahren mit öffentlichem Schlüssel wurde 1976 von Diffie und Hellman entwickelt. Jeder Teilnehmer verfugt über einen öffentlichen Schlüssel, der in einem allgemein zugänglichen Verzeichnis veröffentlicht wird, und einen privaten Schlüssel, der nur dem jeweiligen Teilnehmer selbst bekannt ist und streng geheim gehalten wird Solche Verfahren nennt man asymmetrische Chiffrierverfahren (s 5.5.2, S. 346). Der öffentliche Schlüssel des i-ten Teilnehmers bestimmt den Chiffrierschritt Ei, der private Schlüssel KSi des i-ten Teilnehmers bestimmt den Dechiffrierschritt Di. Es müssen folgende Bedingungen erfüllt sein 1. Di o Ei ist die identische Abbildung 2. Für Ei und A gibt es effiziente Realisierungen 3. Der private Schlüssel KSi kann mit den bis auf absehbare Zeit zur Verfügung stehenden Mitteln nicht aus dem öffentlichen Schlüssel KPi abgeleitet werden Gilt darüber hinaus noch
5.5 Kryptologie 351 4. Ei o Di ist die identische Abbildung, dann handelt es sich um ein Signaturverfahren mit öffentlichem Schlüssel. Ein Signaturverfahren ermöglicht dem Absender der Nachricht, diese mit einer unfälschba- ren Unterschrift zu versehen. Möchte A eine Nachricht m verschlüsseln und an B senden, dann entnimmt A aus dem Verzeichnis den öffentlichen Schlüssel KPB von B und legt damit die Verschlüsselungsfunktion EB fest. EB(m) — c. A sendet nun den Schlüsseltext c über das öffentliche Netz an B , und B kann den Klartext der Nachricht mit Hilfe seines privaten Schlüssels KSB bestimmen, der die Entschlusselungsfunktion DB festlegt: DB{c) = DB{EB(m)) = m. Um das Fälschen von Nachrichten zu verhindern, kann A in einem Signaturverfahren mit öffentlichem Schlüssel seine Nachricht m an B wie folgt signieren: A verschlüsselt den Klartext m mit seinem privaten Schlüssel gemäß DA(m) = d, fügt dem Text seine Unterschrift „A" hinzu und verschlüsselt den unterschriebenen Text d mit dem öffentlichen Schlüssel von B: EB(DA{m),vAu) = EB(d,»A") = e. Der so signierte Text wird von A an B geschickt. Der Teilnehmer B entschüsselt den Text mit seinem privaten Schlüssel und erhält DB(e) = DB(EB(d, „A")) = (d, „A"). Aus diesem Text erkennt B den Absender A und kann nun den Text d mit dem öffentlichen Schlüssel von A entschlüsseln: EA{d) = Ea{Da(tti)) = m. 5.5.7.2 Einwegfunktionen Chiffrierfunktionen in Verfahren mit öffentlichem Schlüssel müssen Einwegfunktionen mit „Falltür'1 sein Unter Falltür versteht man hier eine geheimzuhaltende Zusatzinformation Eine injektive Funktion /: X —> Y heißt Einwegfunktion mit Falltür, falls die folgenden Bedingungen gelten: 1. Es gibt effiziente Verfahren zur Berechnung von / und f~l. 2. Das effiziente Verfahren zur Berechnung von /_1 kann aus / nicht ohne eine geheimzuhaltende Zusatzinformation gewonnen werden. Man kann nicht beweisen, daß es Einwegfunktionen gibt, kennt jedoch Funktionen, die als Kandidaten für Einwegfunktionen in Frage kommen. 5.5.7.3 RSA-Verfahren 1. Voraussetzungen: Man wählt zwei große Primzahlen p und q und n = pq. Dabei soll pq > 10200 gelten, p und q müssen sich als Dezimalzahlen in ihrer Länge um einige Stellen unterscheiden; die Differenz zischen p und q darf aber auch nicht zu groß sein. Weiterhin sollen p— 1 und q—1 große Primfaktoren enthalten, und der größte gemeinsame Teiler von p—1 und q — 1 soll möglichst klein sein. Man wähle ein e > 1, das teilerfremd zu (p — l){q — 1) ist, und berechne ein d mit d • e = 1 modulo (p — l)(q — 1). Dann bilden n und e den öffentlichen Schlüssel und d den privaten Schlüssel. 2. Verschlüsselungsoperation: E: {0,1,..., n - 1} -? {0,1,..., n - 1} E(x) := xe modulo n. E.242a) 3. Entschlüsselungsoperation: D: {0,1,..., n - 1} -> {0,1,..., n - 1} D(x) := xd modulo n. E.242b) Damit gilt D(E(m)) = E(D(m)) = m für jede Nachricht m. Die zur Verschlüsselung verwendete Funktion ist für n = pq > 10200 ein Kandidat für eine Einwegfunktion mit Falltür (s 5 5.7.2, S. 351). Die Zusatzinformation liegt hier in der Kenntnis der Primfaktoren- zerlegung von n. Ohne diese Information ist es praktisch unmöglich, die Kongruenz d • e = 1 modulo (p - l)(q - 1) zu lösen. Das RSA-Verfahren gilt weithin als praktisch sicher, sofern die obengenannten Bedingungen erfüllt sind Als Nachteil gegenüber anderen Verfahren sind die relativ große Schlüssellänge und die Tatsache
352 5 Algebra und Diskrete Mathematik zu beachten, daß RSA gegenüber DES (s. 5.5.8) um etwa den Faktor 1000 langsamer ist 5.5.8 AES—Algorithmus (Advanced Encryption Standard) Von 1977 bis 2001 diente das DES-Verfahren als offizieller US-Verschlüsselüngsstandard für vertrauliche Daten (s [5.36] und auch [22 7], S 350). Im Jahre 2001 wurde vom NIST (National Institute of Standards and Technology) nach einer weltweit geführten Diskussion eine Variante des von J. Dae- men und V. Rijnmen vorgeschlagenen Rijndaeh Algorithmus als neuer Verschlüsselungsstandard eingeführt Beim AES werden hintereinander über mehrere Runden Substitutionen und Permutationen ausgeführt Zunächst wird ein geheimer Schlüssel gewählt. Die Blocklänge im zu verschlüsselnden Klartext und die Schlüssellänge können 128 , 192 oder 256 Bits betragen. Die verschlüsselten Klartextblöcke bilden den Geheimtext, der die gleiche Länge wie der Klartext hat Aus diesem kann mit einem inversen Algorithmus und dem Schlüssel wieder blockweise der Klartext rekonstruiert werden. Die aus dem Schlüssel erzeugten Rundenschlüssel werden dabei im Vergleich zur Verschlüsselung in umgekehrter Reihenfolge eingesetzt. Die Stärke dieses Chiffrierungsverfahrens liegt in der Konstruktion der Abbildungen, die in den einzelnen Iterationsrunden angewendet werden Die einzige nichtlineare Substitution findet man in der Operation „SubBytes" Zu ihrer Beschreibung werden die zu transformierenden Blöcke als Elemente eines endlichen Körpers aufgefaßt Alle Details zum Algorithmus findet man in [5.37]. Obwohl der AES- Algorithmus bis ins Detail offengelegt wurde, sind bis heute keine realistischen Angriffsmöglichkeiten bekannt geworden. 5.5.9 IDEA-Algorithmus (International Data Encryption Algorithm) Der IDEA Algorithmus wurde 1991 von Lai und MASSAY zum Patent vorgelegt Wie beim DES- Algorithmus handelt es sich um ein symmetrisches Verschlüsselungsverfahren; IDEA ist ein potentieller Nachfolger für DES Der Algorithmus ist insbesondere als Bestandteil des bekannten Softwarepakets PGP (Pretty Good Privacy) zur Verschlüsselung von e-mails bekannt geworden Im Unterschied zu DES wurde nicht nur der Algorithmus veröffentlicht, sondern auch seine Entwurfsgrundlagen Ziel war die Verwendung möglichst einfacher Operationen (Addition modulo 2, Addition modulo 216 , Multiplikation modulo 216+1). Mit IDEA kann man 64-Bit-Klartextblöcke verschlüsseln und bei Wahl der Teilschlüssel in umgekehrter Reihenfolge wieder entschlüsseln Zur Verschlüsselung wird jeder 64 Bit Klartextblock in vier Teilblöcke von je 16 Bit aufgeteilt IDEA benutzt 128-Bit-Schlüssel, aus denen 52 Teilschlüssel von je 16 Bit erzeugt werden. In 8 Verschlüsselungsrunden werden jeweils 6 dieser Teilschlüssel benötigt, die restlichen 4 Teilschlüssel werden in einer Ausgabetransformation mit den vier Textblöcken verknüpft und abschließend zu einem 64-Bit-Schlüsseltextblock zusammengesetzt IDEA ist etwa doppelt so schnell wie DES, in Hardware jedoch schwieriger zu implementieren Öffentlich sind keine erfolgreichen Angriffe gegen IDEA bekannt geworden Angriffe durch Ausprobieren aller Schlüssel bleiben bei der Schlüssellänge von 128 Bit wirkungslos
5.6 Universelle Algebra 353 5.6 Universelle Algebra Eine (universelle) Algebra besteht aus einer Menge, der Trägermenge, und Operationen auf dieser Menge Einfache Beispiele sind die in den Abschnitten 5.3.2, S. 308, 5.3.3, S. 309 und 5 3.6, S. 323 behandelten Halbgruppen, Gruppen, Ringe und Körper. Universelle Algebren (meist mehrsortig, d.h. mit mehreren Trägermengen) werden insbesondere in der theoretischen Informatik betrachtet. Sie dienen dort als Grundlage für die (algebraische) Spezifikation abstrakter Datentypen und für Termersetzungssysteme. 5.6.1 Definition Es sei Q eine Menge von Operationssymbolen, die in paarweise disjunkte Teilmengen fln, n G N, zerfällt In Q0 liegen die Konstanten, in ün , n > 0, die n-stelligen Operationssymbole. Die Familie (rän)n€N heißt Typ oder Signatur. Ist A eine Menge und ist jedem n-stelligen Operationssymbol u G ün eine n-stellige Operation uA in A zugeordnet, so heißt A = (A, {uA\u G f2}) eine Ü-Algebra oder Algebra vom Typ (oder der Signatur) Ü . Ist ü endlich, fi = {u)U ..., uk} , so schreibt man für A auch A = (A, u>A, .., uA) Faßt man einen Ring (s. 5 3.6, S. 323) als Q-Algebra auf, so zerfällt Q in f20 — {^1} » ^i = {^2} , ^2 = {^3,^4} , wobei den Operationssymbolen ui, u>2 , U3 , U4 die Konstante 0, Inversenbildung bezüglich Addition, Addition und Multiplikation zugeordnet sind Es seien A und B Q-Algebren. B heißt Q-Unteralgebra von A, falls B C A ist und die Operationen ljb die Einschränkungen der Operationen uA (u £ Q.) auf die Teilmenge B sind. 5.6.2 Kongruenzrelationen, Faktoralgebren Um Faktorstrukturen, wie im Falle der Gruppen und Ringe, für universelle Algebren konstruieren zu können, wird der Begriff der Kongruenzrelation benötigt Eine Kongruenzrelation ist eine mit der Struktur verträgliche Aquivalenzrelation: Es sei A = (A, {lüa\lü G Q}) eine Q-Algebra und R eine Aquivalenzrelation in A R heißt Kongruenzrelation in A, falls für alle u G £ln (n G N) und alle aj, bi G A mit üiRbi (i = 1,..., n) gilt. uA{au. .,an) RuA{bu. . A) E.243) Die Menge der Aquivalenzklassen (Faktormenge) bezüglich einer Kongruenzrelation bildet bezüglich repräsentantenweisem Rechnen wieder eine J7-Algebra: Es sei A = (A, {lüa\lj G fi}) eine f2-Algebra und R eine Kongruenzrelation in A. Die Faktormenge A/R (s. 5.2.4, S. 306) wird bezüglich folgender Operationen wAlR (u G ün , n G N) mit «^Ä([ai]Ä,..., K]h) = [0^@,,... ,an)]Ä E 244) zu einer Q-Algebra A/R, der Faktoralgebra von A nach R. Die Kongruenzrelationen von Gruppen bzw Ringen lassen sich durch spezielle Teilstrukturen - Normalteiler (s. 5.3.3.2,2., S. 311) bzw. Ideale (s. 5.3.6,2., S. 324) - beschreiben. Im allgemeinen, z.B. bei Halbgruppen, ist eine solche Beschreibung der Kongruenzrelationen nicht möglich. 5.6.3 Homomorphismen Wie bei den klassischen algebraischen Strukturen besteht auch hier über den Homomorphiesatz ein Zusammenhang zwischen den Homomorphismen und den Kongruenzrelationen Es seien A und B Ü-Algebren Eine Abbildung h: A —> B heißt Homomorphismus, wenn für jedes üü G On und alle ai, . , an G A gilt: h(uA(au ..,an))=LüB(h{ai), .,h(an)) E 245) Ist h darüber hinaus bijektiv, so heißt h Isomorphismus] die Algebren A und B heißen dann zueinander isomorph Das homomorphe Bild h(A) einer Q-Algebra A erweist sich als Ü-Unteralgebra von B. Bei einem Homomorphismus h entspricht der Zerlegung von A in bildgleiche Elemente eine Kongruenzrelation, die der Kern von h genannt wird ker/i= {(a,6) G A x A\h{a) = h{b)} E.246)
354 5 Algebra und Diskrete Mathematik 5.6.4 Homomorphiesatz Es seien A und B Q- Algebren und h' A —? B ein Homomorphismus, h bestimmt eine Kongruenzrelation ker hm A. Die Faktoralgebra Aj ker h ist isomorph zum homomorphen Bild h(A). Umgekehrt bestimmt jede Kongruenzrelation R eine homomorphe Abbildung natu: A —> A/R mit natR(a) = [cl]r Die Abb.5.17 soll den Homomorphiesatz veranschaulichen *a h(a) • h(A) nat ker h fclkerh ^ DDD DDD DDD A/ker h Abbildung 5.17 5.6.5 Varietäten Eine Varietät V ist eine Klasse von f2-Algebren, die abgeschlossen ist gegenüber der Bildung von Unteralgebren, von homomorphen Bildern und direkten Produkten, d.h., diese Bildungen führen aus V nicht heraus Dabei sind direkte Produkte folgendermaßen definiert. Erklärt man auf dem kartesischen Produkt der Trägermengen von Ü-Algebren die Q entsprechenden Operationen komponentenweise, so erhält man wieder eine ^-Algebra, das direkte Produkt dieser Algebren. Der Satz von BlRKHOFF (s. 5.6.6, S. 354) charakterisiert die Varietäten als diejenigen Klassen von Q-Algebren, die sich durch „Gleichungen" definieren lassen. 5.6.6 Termalgebren, freie Algebren Es sei (rin)n€N eine Signatur und X eine abzählbare Menge von Variablen Die Menge Tq(X) der Q- Terme über X ist induktiv wie folgt definiert l.XUQoCTQ{X) 2. Sindti, . ,tn G Tn(X) und cj G fi„ , so ist auch cj^ tn e Tn(X) Die so definierte Menge Tq(X) wird Trägermenge einer 17-Algebra, der Termalgebra Tq(X) vom Typ Ü über X , gemäß folgender Operationen: Ist £i, . , tn G Tq(X) und u G Qn , so ist uT{1^ durch uTa{x)(tu.. ,tn)=cüt1 . tn E 247) erklärt. Termalgebren sind die „allgemeinsten" Algebren in der Klasse aller Q-Algebren, d.h , in Termalgebren gelten keine „Gleichungen" Solche Algebren werden freie Algebren genannt. Eine Gleichung ist ein Paar (s(a"i, . , xn), t(xi,. ., xn)) von £7-Termen in den Variablen x\, ,xn Eine f2-Algebra A erfüllt eine solche Gleichung, wenn für alle ax,. , an G A gilt* (ai,.. ,an) = t (ai,... ,an). E.248) Eine gleichungsdefinierte Klasse von Ü-Algebren ist eine Klasse von f2-Algebren, die eine vorgegebene Menge von Gleichungen erfüllen Satz von Birkhoff: Die gleichungsdefinierten Klassen sind genau die Varietäten ¦ Varietäten sind zum Beispiel die Klasse aller Halbgruppen, die Klasse aller Gruppen, die Klasse aller AßELschen Gruppen und die Klasse aller Ringe Andererseits gilt zum Beispiel, daß das direkte Produkt von zyklischen Gruppen keine zyklische Gruppe und das direkte Produkt von Körpern kein Körper ist Deshalb bilden die zyklischen Gruppen bzw. Körper keine Varietäten und können nicht durch Gleichungen definiert werden.
5 7 Boolesche Algebren und Schaltalgebra 355 5.7 Boolesche Algebren und Schaltalgebra Die in 5 2 2,3., S 302 festgestellte Analogie der Grundgesetze (Rechenregeln) der Mengenalgebra und der Aussagenlogik E.1 1,6., S 296) trifft auch auf die Rechenregeln für Operationen mit anderen mathematischen Objekten zu Die Untersuchung dieser Rechenregeln führt auf den Begriff der Boo- LEschen Algebra 5.7.1 Definition Eine Menge B , versehen mit zwei binären Operationen n („Konjunktion") und U („Disjunktion"), einer einstelligen Operation- („Negation") und zwei ausgezeichneten (neutralen) Elementen 0 und 1 aus B , heißt BoOLEsc/ie Algebra B = (B , n , U , ~, 0.1), wenn folgende Gesetze gelten: A) Assoziativgesetze: (a n b) n c = a n (b n c), E 249) {a U b) U c = a U (b U c). E 250) B) Kommutativgesetze: a\lb = bna, E.251) aUb = büa E.252) C) Absorptionsgesetze: an(aüb) = a, E.253) a U (a n b) = a E 254) D) Distributivgesetze: (a U 6) n c = (a n c) U (b n c), E 255) (a n 6) U c = (a U c) n F U c). E.256) E) Neutrale Elemente: aHl = a, E.257) aU0 = a, E 258) E 260) ano = o, F) Komplement: aUä = 0, E.259) E.261) flUl = 1 aUä=l E 262) Eine Struktur, in der Assoziativ-, Kommutativ- und Absorptionsgesetze gelten, heißt Verband Gelten darüber hinaus die Distributivgesetze, so spricht man von einem distributiven Verband So ist also eine BoOLEsche Algebra ein spezieller distributiver Verband. Hinweis: Die für BoOLEsche Algebren verwendeten Bezeichnungen der Operationen sind nicht notwendigerweise identisch mit den in der Aussagenlogik verwendeten Operationen mit gleicher Bezeichnung 5.7.2 Dualitätsprinzip 1. Dualisieren: In den obigen „Axiomen" einer BoOLEschen Algebra erkennt man folgende Dualität Ersetzt man in einem Axiom l~l durch U, U durch l~l, 0 durch 1 und 1 durch 0, dann erhält man das jeweils andere Axiom auf derselben Zeile Man sagt, die Axiome einer Zeile sind zueinander dual und nennt den Ersetzungsprozeß Dualisieren Durch Dualisieren erhält man aus einer Aussage über BoOLEsche Algebren die dazu duale Aussage 2. Dualitätsprinzip für Boolesche Algebren: Die duale Aussage zu einer wahren Aussage über BoOLEsche Algebren ist wieder eine wahre Aussage über BoOLEsche Algebren, d.h., mit jeder bewiesenen Aussage ist gleichzeitig auch die dazu duale Aussage bewiesen 3. Eigenschaften: Aus den Axiomen folgen z B. folgende Eigenschaften für BoOLEsche Algebren. (El) Die Operationen n und U sind idempotent:
356 5. Algebra und Diskrete Mathematik aHa = a, E.263) aüa = a. E.264) (E2) De Morgansche Regeln: ~äTÜ) = äUb, E.265) a\Jb = är\b, E 266) C) Eine weitere Eigenschaft: Ü = a. E.267) Es genügt auch hier, von nebeneinanderstehenden (dualen) Aussagen nur eine zu beweisen, während die dritte Aussage zu sich selbst dual ist. 5.7.3 Endliche Boolesche Algebren Alle endlichen BoOLEschen Algebren lassen sich bis auf „Isomorphie" einfach angeben Es seien B\, B2 BoOLEsche Algebren und /: B\ —> B2 eine bijektive Abbildung. / heißt Isomorphismus, falls gilt. f(anb) = f(a)nf(bI f(aUb) = f(a)Uf{b) und f(ä)=J(a). E.268) Jede endliche BoOLEsche Algebra ist isomorph zur BoOLEschen Algebra der Potenzmenge einer endlichen Menge Insbesondere hat jede endliche BoOLEsche Algebra 2n Elemente, und je zwei endliche BoOLEsche Algebren mit gleich vielen Elementen sind isomorph Im folgenden wird mit B die zweielementige BoOLEsche Algebra {0,1} mit den Operationen u 0 1 0 1 0 1 1 1 n 0 i 0 0 0 1 0 1 0 1 - 1 0 bezeichnet. Erklärt man auf dem n-fachen kartesischen Produkt Bn = {0,1} x • • • x {0,1} die Operationen n , U und ~ komponentenweise, so wird Bn mit 0 = @,. ., 0) und 1 = A, , 1) zu einer BoOLEschen Algebra. Man nennt Bn das n-fache direkte Produkt von B . Da Bn 2n Elemente enthält, erhält man auf diese Weise alle endlichen BoOLEschen Algebren (bis auf Isomorphie) 5.7.4 Boolesche Algebren als Ordnungen Jeder BoOLEschen Algebra B läßt sich eine Ordnungsrelation in B zuordnen. Dabei wird a < b genau dann gesetzt, wenn on6 = o gilt (oder gleichbedeutend dazu, wenn a U b = b gilt) Somit läßt sich jede endliche BoOLEsche Algebra durch ein HASSE-Diagramm darstellen (s. 5.2 4, 4., S. 307) ¦ B sei die Menge {1,2,3,5,6,10,15,30} der Teiler der Zahl 30 Als zweistellige Operationen werden die Bildung des größten gemeinsamen Teilers bzw des kleinsten gemeinsamen Vielfachen verwendet und als einstellige Operation die Bildung des Komplements. Die ausgezeichneten Elemente 0 bzw 1 entsprechen den Zahlen 1 bzw. 30 Das zugehörige HASSE-Diagramm zeigt Abb.5.18 5.7.5 Boolesche Funktionen, Boolesche Ausdrücke 1. Boolesche Funktionen Es bezeichnet B wieder die zweielementige BoOLEsche Algebra wie in 5 7.3, S 356. Eine n-stellige BoOLEsche Funktion f ist eine Abbildung von Bn in B Es gibt 22" n- stellige BoOLEsche Punktionen Die Menge aller n-stelligen BoOLEschen Funktionen wird mit (/n <?)(&) = /(fc)n 9F), E.269) {fUg)(b) = f(b)Ug(b), E 270) 7F) = 7F) E.271) zu einer BoOLEschen Algebra. Dabei ist b jeweils ein n-Tupel von Elementen aus B = {0,1}, und auf der rechten Seite der Gleichungen werden die Operationen in B ausgeführt. Die ausgezeichneten Abbildung 5 18
5 7 Boolesche Algebren und Schaltalgebra 357 Elemente 0 bzw 1 entsprechen den Funktionen /0 bzw. /i mit f0(b) = 0, /iF) = 1 für alle b e Bn E 272) ¦ A: Im Falle n = 1, d.h bei nur einer BoOLEschen Variablen b, gibt es die vier BoOLEschen Funktionen- E.273) Identität f(b) = b, Negation f(b) = b, Tautologie f(b) = 1, Kontradiktion f(b) = 0. ¦ B: Im Falle n = 2, d.h bei zwei BoOLEschen Variablen a und b, gibt es 16 verschiedene BoOLEschen Funktionen, von denen die wichtigsten eigene Namen haben und durch eigene Symbole dargestellt werden. Sie sind in der folgenden Tabelle aufgeführt. Tabelle 5 6 Einige BoOLEsche Funktionen mit zwei Variablen a und b Name der Funktion Sheffer bzw NAND Peirce bzw NOR Antivalenz bzw XOR Äquivalenz Implikation Verschiedene Schreibweisen a - b a | b NAND (a, b) a + b a i b NOR a,6 ab + ab aXORb a £ b a © b äb + ab a = b a <r+ b ä + b a —? b Verschiedene Symbole A A Eh^ fr^ *^ *^ Wertetabelle für CMKMK) 1, 1, 1, 0 1, 0, 0, 0 0, 1, 1, 0 1, 0, 0, 1 1, 1, 0, 1 2. Boolesche Ausdrücke BoOLEsc/ie Ausdrücke werden induktiv definiert Sei X = {x, y, z,. .} eine (abzählbare) Menge BoOLEsc/ier Variabler (die nur Werte aus {0,1} annehmen können) 1. Die Konstanten 0 und 1 sowie die BoOLEschen Variablen aus X sind BoOLEsche Ausdrücke. E.274) 2. Sind S und T BoOLEsche Ausdrücke, so sind es auch T, E n T) und E U T) E 275) Enthält ein BoOLEscher Ausdruck die Variablen xi,..., xn , so repräsentiert er eine n-stellige BoOLEsche Funktion fr Es sei b eine „Belegung" der BoOLEschen Variablen x\,..., xn , d.h. b = Fi, .., bn) G Bn . Unter Beachtung der induktiven Definition werden den Ausdrücken T wie folgt BoOLEsche Funktionen zugeordnet: 1. Ist T = 0, so gilt fr = /o , ist T = 1, so gilt fr = fi • E.276a) 2. Ist T = Xi, so gilt fr(b) = bi\ ist T = S, so gilt fr(b) = fs(b) 3. Ist T = R n S, so gilt fr(b) = fR(b) n fs(b) 4. Ist T - R U S, so gilt /TF) = /Ä(&) U fs(b). E.276b) E.276c) E.276d)
358 5. Algebra und Diskrete Mathematik Umgekehrt läßt sich jede BooLEsche Funktion / durch einen BoOLEschen Ausdruck T darstellen (s 5.7.6, S 358). 3. Wert verlaufsgleiche Boolesche Ausdrücke Die BooLEsche Ausdrücke S und T heißen wert- verlaufsgleich, wenn sie die gleiche BooLEsche Punktion repräsentieren. BooLEsche Ausdrucke sind genau dann gleich, wenn sie durch „Umformungen" entsprechend den Axiomen einer BoOLEschen Algebra ineinander überführbar sind. Bei der Umformung BoOLEscher Ausdrucke stehen zwei Aspekte im Vordergrund: • Umformung in einen möglichst „einfachen" Ausdruck (s. 5.7.7, S. 358), • Umformung in eine „Normalform" . 5.7.6 Normalformen 1. Elementarkonjunktion, Elementardisjunktion Es sei B = (B, ("I, U, ~, 0,1) eine BooLEsche Algebra und {xi,. ., xn} eine Menge BoOLEscher Variabler. Jede Konjunktion bzw. Disjunktion, in der jede Variable oder ihre Negation genau einmal vorkommt, heißt Elementarkonjunktion bzw. Elementardisjunktion (in den Variablen x\,. , xn) Es sei T(x\,..., xn) ein BoOLEscher Ausdruck. Eine Disjunktion D von Elementarkonjunktionen mit D = T heißt kanonisch disjunktive Normalform (KDNF) von T. Eine Konjunktion K von Elementardisjunktionen mit K — T heißt kanonisch konjunktive Normalform (KKNF) von T. ¦ Teil 1: Um zu zeigen, daß sich jede BooLEsche Funktion / durch einen BoOLEschen Ausdruck darstellen läßt, wird zu der in der nebenstehenden Tabelle gegebenen Funktion / die KDNF konstruiert. Die KDNF zur BoOLEschen Funktion / besteht aus den Elementar kon- junktionen xUyUz , xHyHz , xnyH'z . Diese Element arkonjunktionen gehören zu den Belegungen b der Variablen, die bei / den Funktionswert 1 haben. Ist in b eine Variable v mit 1 belegt, so wird v in die Elementarkonjunktion aufgenommen, andernfalls v. ¦ Teil 2: Für das betrachtete Beispiel (s. Teil 1) lautet die KDNF. (x n y n z) U (x n y n z) U (x n y n z) E 277) Die „duale" Form zur KDNF ist die KKNF: Die Elementardisjunktionen gehören zu den Belegungen b der Variablen, die bei / den Funktionswert 0 haben. Ist in b eine Variable v mit 0 belegt, so wird v in die Elementardisjunktion aufgenommen, andernfalls v Somit lautet die KKNF: (x U y U z) H (x Uy U z) H (x Uy Uz) H (x U y U z) H (x Uy Uz). E.278) Die KDNF und die KKNF zu / sind eindeutig bestimmt, wenn man eine Reihenfolge der Variablen und eine Reihenfolge der Belegungen vorgibt, z B. wenn man die Belegungen als Dualzahlen auffaßt und der Größe nach ordnet. 2. Kanonische Normalformen Unter den kanonischen Normalformen eines BoOLEschen Ausdrucks T versteht man die kanonischen Normalformen der zugehörigen BoOLEschen Funktion fa. Oft bereitet die Überprüfung der Wertverlaufsgleichheit zweier BoOLEscher Ausdrücke durch Umformung Probleme. Hilfreich sind dann die kanonischen Normalformen: Zwei BooLEsche Ausdrücke sind genau dann wert verlaufsgleich, wenn die zugehörigen eindeutig bestimmten kanonischen Normalformen Zeichen für Zeichen übereinstimmen ¦ Teil 3: Im betrachteten Beispiel (s Teile 1 und 2) sind die Ausdrücke (y n z) U (x H y n ~z) und (xU((yUz)n(yUz)r\(yU~z)))r\(xU((yUz)n(yUz))) untereinander wert verlaufsgleich, weil beide die kanonisch disjunktive (bzw konjunktive) Normalform haben 5.7.7 Schaltalgebra Eine typische Anwendung der BoOLEschen Algebra ist die Vereinfachung von Reihen-Parallel-Schal- tungen (RPS). Dazu wird einer RPS ein BoOLEscher Ausdruck zugeordnet (Transformation). Dieser Ausdruck wird mit den Umformungsregeln der BoOLEschen Algebra „vereinfacht". Anschließend wird X 0 0 0 0 1 1 1 1 y 0 0 i i 0 0 i i z 0 1 0 1 0 1 0 1 /(. v,y,z) 0 1 0 0 0 1 1 0
5 7 Boolesche Algebren und Schaltalgebra 359 RPS Transformation (Modellierung) elektrisch gleichwertig BOOLEscher Ausdruck Vereinfachung in BOOLEscher Algebra Abbildung 5 19 vereinf. RPS Rücktransformation vereinf. BOOLEscher Ausdruck diesem Ausdruck wieder eine RPS zugeordnet (Rücktransformation) Im Ergebnis erhält man eine vereinfachte RPS, die das gleiche Schaltverhalten wie die Ausgangsschaltung hat (Abb.5.19) RPS bestehen aus Grundelementen, den Arbeits- und Ruhekontakten, mit jeweils zwei Zuständen (geöffnet oder geschlossen) Die Symbolik ist, wie üblich, so zu verstehen Wird die steuernde Schaltvorrichtung eingeschaltet, so schließt der Arbeitskontakt („Schließer") und der Ruhekontakt („Offner") öffnet sich (s [5 6]). Den die Kontakte steuernden Schaltvorrichtungen werden BoOLEsche Variable zugeordnet Dem Zustand „aus" bzw „ein" der Schaltvorrichtung entspricht der Wert 0 bzw 1 der BoOLEschen Variablen Kontakte, die durch die gleichen Vorrichtungen geschaltet werden, erhalten als Symbol die BoOLEsche Variable dieser Vorrichtung Der Schaltwert einer RPS ist 0 bzw. 1, wenn die Schaltung elektrisch nichtleitend bzw. leitend ist Der Schaltwert ist abhängig von der Stellung der Kontakte und damit eine BoOLEsche Funktion S (Schaltfunküori) der den Schaltvorrichtungen zugeordneten Variablen. In Abb.5.20 sind Kontakte, Schaltungen, Symbole und die ihnen entsprechenden BoOLEschen Ausdrücke dargestellt. Arbeitskontakt (Symbol: Reihenschaltung (Symbol: ¦ Ruhekontakt (Symbol: a S = ä Parallelschaltung ) (Symbol: Abbildung 5.20 b S = aub Die BoOLEschen Ausdrücke, die Schaltfunktionen von RPS repräsentieren, sind dadurch ausgezeichnet, daß das Negationszeichen nur über Variablen (nicht über Teilausdrücken) stehen darf. ¦ Die RPS aus Abb. 5.21 ist zu vereinfachen. Dieser Schaltung ist der BoOLEsche Ausdruck S = (ä n b) U (a n b n c) U (ä n (b U c)) E.279) als Schaltfunktion zugeordnet. Entsprechend den Umformungsregeln der BoOLEschen Algebra ergibt sich. S = {bn(äü(an c))) U (ä n (fc U c)) = Fn(äUc))U(än(fcUc)) = (ä n b) u (b n c) u (a n c)
360 5. Algebra und Diskrete Mathematik Abbildung 5 21 Abbildung 5.22 = (a n b n c) u (ä n b n c) u (b n c) u (a n b n c) u (ä n c) u (ä n b n c) = (ä n c) U F n c) E.280) Dabei ergibt sich an c aus (änönc)U (änc)U (än6nc) und6ncaus (än6nc)UFnc)U(an6nc) Man erhält die in Abb.5.22 dargestellte vereinfachte RPS. Dieses Beispiel veranschaulicht, daß es nicht immer einfach ist, durch Umformung auf den „einfachsten" BoOLEschen Ausdruck zu kommen. In der Literatur sind dazu Verfahren bereitgestellt.
5 8 Algorithmen der Graphentheorie 361 5.8 Algorithmen der Graphentheorie Unter den Teilgebieten der Diskreten Mathematik hat die Graphentheorie wesentliche Bedeutung für die Informatik erlangt, z.B bei der Darstellung von Datenstrukturen, endlichen Automaten, Kommunikationsnetzen, Ableitungen in formalen Sprachen usw. Daneben gibt es auch Anwendungen in Physik, Chemie, Elektrotechnik, Biologie und Psychologie Darüber hinaus sind Flüsse in Transportnetzen und Netzplantechnik in Operations Research und kombinatorischer Optimierung anwendbar. 5.8.1 Grundbegriffe und Bezeichnungen 1. Ungerichtete und gerichtete Graphen Ein Graph G ist ein geordnetes Paar (V, E) aus einer Menge V von Knoten und einer Menge E von Kanten Auf E ist eine Abbildung, die Inzidenzfunktion erklärt, die jedem Element von E eindeutig ein geordnetes oder ungeordnetes Paar (nicht notwendig verschiedener Elemente) von V zuordnet. Ist jedem Element von E ein ungeordnetes Paar zugeordnet, dann wird G ein ungerichteter Graph (Abb.5.23) genannt. Ist dagegen jedem Element von E ein geordnetes Paar zugeordnet, dann spricht man von einem gerichteten Graphen (Abb.5.24), und die Elemente von E heißen Bögen oder gerichtete Kanten. Alle anderen Graphen werden gemischte Graphen genannt In der graphischen Darstellung erscheinen die Knoten der Graphen als Punkte, die gerichteten Kanten als Pfeile und die ungerichteten Kanten als ungerichtete Linien. Abbildung 5.23 Abbildung 5.24 Abbildung 5.25 ¦ A: Für den Graphen G in Abb.5.25 gilt- V = {fi,f2,f3,^4,M , E = {ei,e2,e3,e4,e5, e$, e^} , /i(ei) = {vi,u2}, /i(e2) = KM> /i(e3) = KM> /i(e4) = KM» /i(e5) = KM> /i(e6) = KM> fi(e7) = KM- ¦ B: Für den Graphen G in Abb.5.24 gilt- V = {v 1, v2, t>3, v4, M , E' = {e[, e2, e'3, e'4} /2(ei) = KM, /2(e2) = KM, ^(e's) = (*>4, v2), /2(e4) = (v5iv5). ¦ C: Für den Graphen G in Abb.5.23 gilt: V = {vuv2, v3) v4,^5} , E" = {ej,ej,ej,ej} , /s(c?) = {^2,^3} , /3(c5) - KM , /3(e3') = KM , /3(cJ) = KM • 2. Adjazenz Gilt (u, w) E E, dann heißt der Knoten t> adjazent, d.h benachbart, zum Knoten iu. Der Knoten v heißt Startpunkt von (u, iü) , iü heißt Zielpunkt von (v, it;), v und w heißen Endpunkte von (v, iü) . Entsprechend werden die Adjazenz in ungerichteten Graphen und die Endpunkte von ungerichteten Kanten definiert 3. Schlichte Graphen Ist mehreren Kanten oder Bögen dasselbe ungeordnete oder geordnete Paar von Knoten zugeordnet, dann spricht man von Mehrfachkanten. Eine Kante oder ein Bogen mit identischen Endpunkten heißt Schlinge Graphen ohne Schlingen und Mehrfachkanten bzw. Mehrfachbögen werden schlicht genannt 4. Knotengrade Als Grad dc(v) eines Knotens v bezeichnet man die Anzahl der mit v inzidierenden Kanten oder Bögen. Schlingen werden doppelt gezählt. Knoten vom Grad 0 heißen isolierte Knoten. Für jeden Knoten v eines gerichteten Graphen G unterscheidet man Ausgangsgrad d%(v) und Eingangsgrad d^{v): d£(v) = \{w\(v,w)eE}\, E.281a) dä{v) = \{w\(w,v)€E}\. E.281b)
362 5. Algebra und Diskrete Mathematik 5. Spezielle Klassen von Graphen Endliche Graphen besitzen eine endliche Knotenmenge und eine endliche Kantenmenge Anderenfalls werden die Graphen unendlich genannt. In regulären Graphen vom Grad r haben alle Knoten den Grad r Ein ungerichteter schlichter Graph mit der Knotenmenge V heißt vollständiger Graph, wenn je zwei verschiedene Knoten aus V durch eine Kante verbunden sind Ein vollständiger Graph mit n-elementiger Knotenmenge wird mit Kn bezeichnet Kann man die Knotenmenge eines ungerichteten schlichten Graphen G in zwei disj unkte Klassen X und Y zerlegen, so daß jede Kante von G einen Knoten aus X mit einem Knoten aus Y verbindet, dann heißt G ein paarer Graph Ein paarer Graph wird vollständiger paarer Graph genannt, wenn jeder Knoten aus X mit jedem Knoten aus Y durch eine Kante verbunden ist Ist X eine n-elementigc und Y eine ra-elemeritige Menge, dann wird der Graph mit Kn^m bezeichnet. ¦ Die Abb.5.26 zeigt einen vollständigen Graphen mit 5 Knoten ¦ Die Abb.5.27 zeigt einen vollständigen paaren Graphen mit 2 - elementiger Knotenmenge X und 3-elementiger Knotenmenge Y K2, Abbildung 5 26 Abbildung 5 27 Weitere spezielle Klassen von Graphen sind ebene Graphen, Bäume und Transportnetze Ihre Eigenschaften werden jeweils in einem der folgenden Abschnitte angegeben. 6. Darstellung von Graphen Endliche Graphen können veranschaulicht werden, indem man jedem Knoten einen Punkt in der Ebene zuordnet und zwei Punkte genau dann durch eine gerichtete oder ungerichtete Kurve verbindet, wenn der Graph die entsprechende Kante besitzt. In den Abb.5.28 bis Abb.5.31 sind Beispiele gezeigt Die Abb.5.31 zeigt den PETERSEN-Crap/i, der dadurch bekannt geworden ist, daß er für viele graphentheoretische Vermutungen, deren Beweis allgemein nicht gelang, als Gegenbeispiel diente. Abbildung 5 28 Abbildung 5.29 Abbildung 5.30 Abbildung 5 31 7. Isomorphie von Graphen Ein Graph G\ = (Vi, E\) heißt isomorph zu einem Graphen G2 = (V2, E2), wenn es je eine bijektive Abbildung ip von Vi auf V2 und ip von Ei auf E2 gibt, die verträglich mit der Inzidenzfunktion ist, d h., sind u, v die Endpunkte einer Kante bzw u Startpunkt eines Bogens und v Zielpunkt dieses Bogens, dann sind ip{u) und ip(v) Endpunkte einer Kante bzw tp(u) Startpunkt und ip(v) Zielpunkt eines Bogens. Die Abb.5.32 und Abb.5.33 zeigen zwei zueinander isomorphe Graphen Die Abbildung ip mit </?(!) = a, (pB) = b, <pC) = c, <pD) = d ist ein Isomorphismus. Es ist sogar jede bijektive Abbildung
5.8 Algorithmen der Graphentheorie 363 von {1,2,3,4} auf {a, b, c, d} ein Isomorphismus, weil die Graphen vollständige Graphen mit gleicher Knotenzahl sind Abbildung 5.32 Abbildung 5.33 8. Untergraphen, Faktoren Ist G = (V, E) ein Graph, dann heißt ein Graph G' = (V7, E') Untergraph von G, wenn V C V und E' CE gilt. Enthält E' genau diejenigen Kanten aus E, die Knoten aus V verbinden, dann heißt G' der von V induzierte Untergraph von G Ein Untergraph G' = (V", E') von G = (V, E) mit V = V wird Teilgraph von G genannt. Unter einem Faktor F eines Graphen G versteht man einen regulären Untergraphen von G, der alle Knoten von G enthält. 9. Adjazenzmatrix Endliche Graphen kann man wie folgt durch eine Matrix beschreiben: Es sei G = (V, E) ein Graph mit V = {vi, i>2,. • , vn} und E — {ei, e2, . , em} Dabei bezeichne ra(uj, v^) die Anzahl der Kanten von Vj nach Vj . Bei ungerichteten Graphen werden Schlingen doppelt gezählt; bei gerichteten Graphen zählt man Schlingen einfach. Die Matrix A vom Typ (n, n) mit A = (m(vi, Vj)) wird Adjazenzmatrix genannt. Ist der Graph zusätzlich schlicht, dann hat die Adjazenzmatrix die folgende Gestalt: für (vi,Vj) e E, für (vi,Vj) $. E. D h., in der Matrix A steht in der i-ten Zeile und j-ten Spalte genau dann eine 1, wenn eine Kante von Vi nach Vj verläuft Für ungerichtete Graphen ist die Adjazenzmatrix symmetrisch. ¦ A: Neben Abb.5.34 ist die Adjazenzmatrix A(G?i) des gerichteten Graphen G\ gezeigt. ¦ B: Neben Abb.5.35 ist die Adjazenzmatrix A(G2) des ungerichteten schlichten Graphen G^ gezeigt. Vl A = (ay) = I ^ E.282) '0 1 0(^ 0000 0 103 ^0 100; Abbildung 5.34 /010 1 0 1\ 10 10 10 0 10 10 1 10 10 10 0 10 10 1 \\ 0 1 0 1 0/ Abbildung 5 35 10. Inzidenzmatrix Für einen ungerichteten Graphen G = (V, E) mit V = {vi, V2» > vn} und E = {ei, e2,..., em} wird die Matrix I vom Typ (n, m) mit {0, Vi inzidiert nicht mit ej , 1, Vi inzidiert mit ej und ej ist keine Schlinge, E.283) 2, Vi inzidiert mit ej und ej ist eine Schlinge
364 5 Algebra und Diskrete Mathematik , vn} und E = {ei,e2, . ,em}istdie E.284) Inzidenzmatrix genannt Für einen gerichteten Graphen G = (V,E) mit V = {vi,^2, Inzidenzmatrix I die durch !0, Vi inzidiert nicht mit ej , 1, Vi ist Startpunkt von ej und ej ist keine Schlinge, — 1, Vi ist Zielpunkt von ej und ej ist keine Schlinge, —0, Vi inzidiert mit ej und ej ist eine Schlinge definierte Matrix vom Typ (n, m) 11. Bewertete Graphen Ist G = (V,E) ein Graph und / eine Abbildung, die jeder Kante eine reelle Zahl zuordnet, so heißt (V, E, f) ein bewerteter Graph und /(e) die Bewertung oder Länge der Kante e In vielen Anwendungsfällen repräsentieren die Bewertungen der Kanten Kosten, die durch den Bau, die Aufrechterhaltung oder die Benutzung der Verbindungen Zustandekommen. 5.8.2 Durchlaufungen von ungerichteten Graphen 5.8.2.1 Kantenfolgen 1. Kantenfolgen In einem ungerichteten Graphen G — (V, E) wird jede Folge F = {{vi,v2}, {^2< ^3 von Elementen aus E eine Kantenfolge dei Länge s genannt. Ist Vi = vs+i, dann spricht man von einer geschlossenen Kantenfolge oder einem Kreis, anderenfalls von einer offenen Kantenfolge. Eine Kantenfolge F heißt Weg, wenn V\,V2, ¦ ¦ ,v8 paarweise verschiedene Knoten sind Ein geschlossener Weg ist ein Elementarkreis ¦ Im Graphen der Abb.5.36 ist Fi = ({1,2}, {2,3}, {3, 5}, {5,2}, {2,4}) eine offene Kantenfolge der Länge 5, F2 = ({1, 2}, {2,3}, {3,4}, {4, 2}, {2,1}) eine geschlossene Kantenfolge der Länge 5, F3 = ({2, 3}, {3,5}, {5,2}, {2,1}) ein Kantenzug, FA — ({1,2}, {2.3}, {3,4}) ein Weg Ein Elementarkreis wird durch F5 = ({1, 2}, {2, 5}, {5,1}) dargestellt Abbildung 5 36 2. Zusammenhängende Graphen, Komponenten Man spricht von einem zusammenhängenden Graph G, wenn zu je zwei verschiedenen Knoten v, w in G ein Weg existiert, der v mit w verbindet. Ist G nicht zusammenhängend, dann zerfällt G in Komponenten, d h in zusammenhängende induzierte Untergraphen mit maximaler Knotenzahl 3. Abstand zweier Knoten Der Abstand ö(v,w) zweier Knoten v, w eines ungerichteten Graphen ist die Länge eines v mit w verbindenden Weges mit minimaler Kantenzahl Existiert ein solcher Weg nicht, dann setzt man 8(v,w) = 00 4. Problem des kürzesten Weges Es sei G = (V,E,f) ein bewerteter schlichter Graph mit f(e) > 0 für alle e G E Für zwei verschiedene Knoten v, w von G wird ein kürzester Weg von v nach w gesucht, d.h ein Weg von v nach w , für den die Summe der Bewertungen der Kanten bzw Bögen minimal ist Es gibt einen effizienten Algorithmus von Dantzig zur Lösung dieses Problems, der für gerichtete Graphen formuliert ist und entsprechend auf ungerichtete Graphen angewendet werden kann (s 5 8 6, S 371) Man kann für jeden bewerteten schlichten Graphen G = (V, E, f) mit V = {v\,V2, • •, vn} die Entfernungsmatrix oder Distanzmatrix D vom Typ (ro, n) aufstellen. T> = (dij) mit dij = 6{vi,Vj) (i, j = 1,2,... ,n). E 285) Sind speziell alle Kanten mit 1 bewertet, d h der Abstand von v und w ist gleich der Mindestanzahl der Kanten, die man durchlaufen muß, um im Graphen von v nach w zu gelangen, kann man den Abstand zweier Knoten aus der Adjazenzmatrix ermitteln: Die Knoten von G seien t>i,^2, ,vn Die
5 8 Algorithmen der Graphentheorie 365 Adjazenzmatrix von G ist A = (a^), und die Potenzen der Adjazenzmatrix bezüglich der üblichen Multiplikation von Matrizen (s. 4.1.4,5., S. 262) werden mit Am = (o^), m G N , bezeichnet. Vom Knoten v{ zum Knoten Vj (i ^ j) führt genau dann ein kürzester Weg der Länge k , wenn gilt* 4^0 und a£ = 0 E = 1,2,. .,&-!). E 286) ¦ Der in Abb.5.37 dargestellte bewertete Graph besitzt die nebenstehend angegebene Ent- fernungsmatrix ¦ Der in Abb.5.38 gezeigte Graph hat die daneben angegebene Adjazenzmatrix, und für m = 2 bzw m = 3 erhält man die Matrizen A2 und A3 D = / 0 2 3 5 6 CO oo oo oo \oo oo oo oo oo oo/ 4 3 Abbildung 5 37 Kurzeste Wege der Länge 2 verbinden die Knoten 1 und 3, 1 und 4, 1 und 5, 2 und 6, 3 und 4, 3 und 5 sowie 4 und 5 Dagegen haben kürzeste Wege zwischen den Knoten 1 und 6, 3 und 6 bzw. 4 und 6 die Länge 3. A = /O 1 0000\ 111110 0 10000 0 10000 0 1000 1 Voooo 10/ A2 = /l 1 1 1 10\ 15 1111 111110 111110 111120 \0 1 000 1/ /l 5 1 1 1 1\ 59 5 56 1 15 1111 15 1111 16 1112 Vi 1 1 1 20/ Abbildung 5.38 5.8.2.2 Euler sehe Linien 1. Eulersche Linien, Eulersche Graphen Ein Kantenzug, der jede Kante eines Graphen G enthält, heißt offene oder geschlossene EuLERsc/ie Linie von G. Ein zusammenhängender Graph, der eine geschlossene EULERsche Linie enthält, ist ein EULERscher Graph ¦ Der Graph Gi (Abb.5.39) hat keine EULERsche Linie Der Graph G2 (Abb.5.40) besitzt eine EULERsche Linie, ist aber kein EULERscher Graph. Der Graph G3 (Abb.5.41) hat eine geschlossene EULERsche Linie und ist kein EULERscher Graph Der Graph G4 (Abb.5.42) ist ein EULERscher Graph. G4 Abbildung 5.39 Abbildung 5 40 Abbildung 5 41 Abbildung 5 42 2. Satz von Euler-Hierholzer Ein Graph ist genau dann ein EULERscher Graph, wenn er zusammenhängend ist und jeder Knoten positiven geraden Grad hat
366 5. Algebra und Diskrete Mathematik 3. Konstruktion einer geschlossenen Eulerschen Linie Ist G ein EULERscher Graph, dann wähle man einen beliebigen Knoten v\ in G und konstruiere, ausgehend von vi, einen Kantenzug Fi, den man nicht mehr fortsetzen kann. Enthält Fi noch nicht alle Kanten von G, so bilde man ausgehend von einem Knoten v2 , der von Fx durchlaufen wird und in G mit einer nicht in Fi enthaltenen Kante indiziert, einen Kantenzug F2 , den man nicht mehr fortsetzen kann. Die beiden Kantenzüge Fi und F2 setze man zu einem geschlossenen Kantenzug von G zusammen, indem man von V\ aus Fi bis v2 durchläuft, von t>2 aus ganz F2 durchläuft, und danach über die noch nicht benutzten Kanten von Fi den Kantenzug zu v\ fortsetzt Eine Fortsetzung des Verfahrens liefert nach endlich vielen Schritten eine geschlossene EuLERsche Linie 4. Offene Eulersche Linien Eine offene EuLERsche Linie existiert in einem Graphen G genau dann, wenn es in G genau zwei Knoten ungeraden Grades gibt. Die Abb.5.43 zeigt einen Graphen, der keine geschlossene, sondern eine offene EuLERsche Linie besitzt Die Kanten sind entlang einer EuLERschen Linie fortlaufend numeriert In Abb.5.44 ist ein Graph mit einer geschlossenen EuLERschen Linie dargestellt. Abbildung 5 43 Abbildung 5 44 Abbildung 5.45 5. Chinesisches Briefträgerproblem Das Problem, daß ein Briefträger jede Straße seines Zustellbereiches mindestens einmal durchläuft, zum Ausgangspunkt zurückkehrt und insgesamt einen möglichst kurzen Weg durchlaufen will, läßt sich graphentheoretisch wie folgt formulieren. Es sei G — (V, E, f) ein bewerteter Graph mit f(e) > 0 für alle Kanten e E E. Gesucht wird eine Kantenfolge F mit minimaler Gesamtlänge L=£/(e) E 287) eeF Die Bezeichnung des Problems erinnert an den chinesischen Mathematiker KUAN, der sich als erster mit dem Problem beschäftigt hat. Zur Lösung sind zwei Fälle zu unterscheiden: 1. G ist ein EULERscher Graph - dann ist jede geschlossene EuLERsche Linie optimal - und 2. G besitzt keine geschlossene EuLERsche Linie Einen effektiven Algorithmus zur Lösung des Problems haben Edmunds und Johnson angegeben (s. [5.40]) 5.8.2.3 Hamilton-Kreise 1. Hamilton-Kreis Ein Elementarkreis in einem Graphen G, der alle Knoten von G durchläuft, heißt Hamilton-Kreis. ¦ In Abb.5.45 bilden die stärker gezeichneten Linien einen HAMILTON-Kreis Die Idee für ein Spiel, in dem man in dem abgebildeten Graphen eines Pentagondodekaeders Hamil- TON-Kreise auffinden soll, geht auf Sir W Hamilton zurück Hinweis: Die Frage nach der Charakterisierung der Graphen mit HAMILTON-Kreisen führt auf eins der klassischen NP-vollständigen Probleme Deshalb kann hier kein effizienter Algorithmus zur Ermittlung von HAMILTON-Kreisen angegeben werden
5 8 Algorithmen der Graphentheorie 367 2. Satz von Dirac Enthält ein schlichter Graph G = (V, E) mindestens 3 Knoten, und gilt dG{v) > | V\/2 für jeden Knoten v von G, dann enthält G einen HAMILTON-Kreis. Diese hinreichende Bedingung für die Existenz eines HAMILTON-Kreises ist aber nicht notwendig Auch die folgenden Sätze mit verallgemeinerten Voraussetzungen liefern nur hinreichende Bedingungen für die Existenz von HAMILTON-Kreisen. ¦ In Abb.5.46 ist ein Graph gezeigt, der einen HAMILTON-Kreis besitzt, ohne die Voraussetzungen des folgenden Satzes von Ore zu erfüllen. 3. Satz von Ore Enthält ein schlichter Graph G = (V, E) mindestens 3 Knoten, und gilt dö{v) + dc{w) > \V\ für je zwei nichtadjazente Knoten v, w , dann enthält G einen HAMILTON-Kreis. 4. Satz von Posa Es sei G = (V, E) ein schlichter Graph mit mindestens 3 Knoten. Er besitzt einen HAMILTON-Kreis, wenn die folgenden Bedingungen erfüllt sind: Abbildung 5 46 1. Für l<fc<(|V| — l)/2 gelte: Die Anzahl derjenigen Knoten, deren Grad höchstens k ist, ist kleiner als k. 2. Ist | V| ungerade, dann gelte zusätzlich. Die Anzahl derjenigen Knoten, deren Grad höchstens (|V| — l)/2 ist, ist höchstens (|V| - l)/2 . 5.8.3 Bäume und Gerüste 5.8.3.1 Bäume 1. Bäume Ein ungerichteter zusammenhängender Graph, in dem kein Kreis existiert, wird Baum genannt. Jeder Baum mit mindestens zwei Knoten enthält mindestens zwei Knoten vom Grad 1. Jeder Baum mit der Knotenzahl n hat genau n — 1 Kanten. Ein gerichteter Graph heißt Baum, wenn G zusammenhängend ist und keinen Zyklus enthält (s. 5.8.6, S. 371). ¦ In Abb.5.47 und Abb.5.48 sind zwei nichtisomorphe Bäume mit der Knotenzahl 14 dargestellt. Sie zeigen die chemischen Strukturformeln von Butan bzw. Isobutan. 2. Wurzelbäume Ein Baum mit einem ausgezeichneten Knoten wird Wurzelbaum genannt, und der ausgezeichnete Knoten heißt Wurzel. Im Bild eines Wurzelbaumes wird die Wurzel in der Regel oben angeordnet, und die Wege werden von der Wurzel weggerichtet betrachtet (s. Abb.5.49). Wurzelbäume dienen zur graphischen Darstellung hierarchischer Strukturen, wie z.B Befehlsflüsse in Betrieben, Stammbäume, grammatikalische Strukturen. ¦ Die Abb.5.49 zeigt den Stammbaum einer Familie in der Form eines Wurzelbaumes. Die Wurzel ist der dem Vater zugeordnete Knoten 3. Reguläre binäre Bäume Hat ein Baum genau einen Knoten vom Grad 2 und sonst nur Knoten vom Grad 1 oder 3, dann wird er regulärer binärer Baum genannt. Abbildung Abbildung 5.47 5.48 Vater * * * * Urenkel Abbildung 5.49
368 5. Algebra und Diskrete Mathematik Die Knotenzahl in regulären binären Bäumen ist ungerade. Reguläre Bäume mit der Knotenzahl n haben (n + l)/2 Knoten vom Grad 1. Das Niveau eines Knotens ist sein Abstand von der Wurzel. Das maximale auftretende Niveau wird Höhe des Baumes genannt. Für reguläre binäre Wurzelbäume gibt es die verschiedensten Anwendungsmöglichkeiten, z B in der Informatik 4. Geordnete binäre Bäume Arithmetische Ausdrücke kann man durch binäre Bäume graphisch darstellen. Dabei werden Zahlen und Variablen Knoten vom Grad 1 zugeordnet, den Operationen + , — ,-,/ entsprechen Knoten vom Grad > 1, und der linke bzw rechte Teilbaum repräsentiert den ersten bzw zweiten Operanden, der im allgemeinen wieder ein Ausdruck ist. Man spricht auch von geordneten binären Bäumen. Das Durchlaufen von geordneten binären Bäumen kann auf drei verschiedene Arten erfolgen, die rekursiv beschreibbar sind (s auch Abb.5.50) • Inorder-Durchlauf. linken Teilbaum der Wurzel (nach Inorder) durchlaufen, Wurzel durchlaufen, rechten Teilbaum der Wurzel (nach Inorder) durchlaufen Wurzel durchlaufen, linken Teilbaum der Wurzel (nach Preorder) durchlaufen, rechten Teilbaum der Wurzel (nach Preorder) durchlaufen. linken Teilbaum der Wurzel (nach Postorder) durchlaufen, rechten Teilbaum der Wurzel (nach Postorder) durchlaufen, Wurzel durchlaufen Beim Inorder-Durchlauf ändert sich die Reihenfolge gegenüber dem Ausgangsterm nicht Die sich aus dem Postorder-Durchlauf ergebende Schreibweise wird Postfix-Notation PN oder Polnische Notation genannt Analog ergibt sich aus dem Preorder- Durchlauf die Präfix - Notation oder Umgekehrte Polnische Notation UPN. Zur Implementierung von Bäumen kann man ausnutzen, daß Präfix- und Postfix-Ausdrücke den Baum eindeutig beschreiben. ¦ In Abb.5.50 ist der Term o • (b — c) + d durch einen Graphen dargestellt. Man erhält im Inorder-Durchlauf a • b — c + d, im Preorder- Durchlauf + • —bcad und im Postorder-Durchlauf abc — -d+ . Preorder-Durchlauf: Postorder-Durchlauf: Abbildung 5.50 5.8.3.2 Gerüste 1. Gerüste Ein Baum, der Teilgraph eines ungerichteten Graphen G ist, wird ein Gerüst von G genannt Jeder zusammenhängende endliche Graph G enthält ein Gerüst H Enthält G einen Kreis, dann löscht man in G eine Kante vi i dieses Kreises Der entstandene Graph G\ ist wieder zusammenhängend und kann durch Löschen einer Kante eines Kreises von G\, falls eine solche existiert, in einen zusammenhängenden Graphen G2 überführt werden. Nach endlich vielen Schritten erhält man ein Gerüst von G. Abbildung 5.51 Abbildung 5.52 ¦ Die Abb.5.52 zeigt ein Gerüst H des in Abb.5.51 dargestellten Graphen G. 2. Satz von Cayley Jeder vollständige Graph mit n Knoten (n > 1) hat genau nn 3. Matrix-Gerüst-Satz Es sei G = (VyE) ein Graph mit V = {i>i,t>2> D = (dij) mit f 0 für i ^ j , \ dG{vi) für i = j 2 Gerüste n} (n > 1) und E = {ei,e2, dij n} . Durch E 288a)
5.8 Algorithmen der Graphentheorie 369 wird eine Matrix vom Typ (n, n) definiert, die auch Valenzmatrix genannt wird. Die Differenz von Valenzmatrix und Adjazenzmatrix ist die Admittanzmatrix L von G: L = D - A. E.288b) Aus L erhält man durch Streichen der i-ten Zeile und der z-ten Spalte die Matrix L». Die Determinante von Li ist gleich der Anzahl der Gerüste im Graphen G. ¦ Die Adjazenzmatrix, die Valenzmatrix und die Admittanzmatrix zum Graphen in Abb.5.51 lauten- B 1 1 0\ /4000\ / 2-1-1 0\ 1020 i-i _ @3001 -13-20 120 1 ' U~ 0040 ' L"~ -1-2 4-1 " 00 10/ \000 1/ V 0 0—1 1/ Wegen detL3 = 5 hat der Graph genau 5 Gerüste. 4. Minimalgerüste Es sei G — (V,E,f) ein zusammenhängender bewerteter Graph. Ein Gerüst H von G heißt Minimalgerüst, wenn seine Gesamtlänge f(H) minimal ist. /(ff)=£/(e). E.289) Minimalgerüste sucht man z B. dann, wenn die Kantenbewertungen Kosten repräsentieren und man an minimalen Gesamtkosten interessiert ist Ein Verfahren zur Ermittlung von Minimalgerüsten ist der KRUSK AL -Algorithmus: a) Man wähle eine Kante mit kleinster Bewertung. b) Man füge solange wie möglich zu den bereits gewählten Kanten eine Kante mit kleinstmöglicher Bewertung hinzu, die mit den schon gewählten Kanten keinen Kreis bildet Die Auswahl der in Schritt b) zulässigen Kanten kann durch den folgenden Markierungsalgorithmus erleichtert werden • Die Knoten des Graphen werden paarweise verschieden markiert • Kanten dürfen in jedem Schritt nur dann hinzugefügt werden, wenn sie Knoten mit verschiedenen Markierungen verbinden. • Nach Hinzufügen einer Kante wird den Knoten, die die größere der Markierungen ihrer Endpunkte tragen, die kleinere der beiden Markierungen zugeordnet 5.8.4 Matchings 1. Matchings Eine Menge M von Kanten eines Graphen G heißt Matching in G, wenn M keine Schlingen enthält und je zwei verschiedene Kanten aus M keinen gemeinsamen Endpunkt besitzen. Ein Matching M* von G heißt gesättigt, wenn es in G kein Matching M mit M* C M gibt. Ein Matching M** von G nennt man maximal, wenn es in G kein Matching M mit \M\ > \M**\ gibt. Ist M ein Matching in G mit der Eigenschaft, daß jeder Knoten von G mit einer Kante aus M indiziert, dann wird M perfektes Matching genannt. ¦ Im Graphen Abb.5.53 ist Mx = {{2,3}, {5,6}} ein gesättigtes Matching und M2 = {{1,2}, {3,4}, {5,6}} ein maximales Matching, das außerdem perfekt ist. Hinweis: In Graphen mit ungerader Knotenzahl gibt es keine per- Abbildung 5.53 fekten Matchings. 2, Satz von Tutte Ein Graph G = (V, E) besitzt genau dann ein perfektes Matching, wenn | V| gerade ist und für jede Teilmenge S der Knotenmenge q(G — S) < \S\ ist. Dabei ist G — S der Graph, der aus G durch Löschen
370 5 Algebra und Diskrete Mathematik aller Knoten von S und der mit diesen Knoten inzidierenden Kanten entsteht Mit q(G — S) wird die Anzahl der Komponenten von G — S mit ungerader Knotenzahl bezeichnet Perfekte Matchings haben z.B. vollständige Graphen mit gerader Knotenzahl, vollständige paare Graphen Kn,n und beliebige reguläre paare Graphen vorn Regularitätsgrad r > 0 3. Alternierende Wege Es sei G ein Graph mit einem Matching M. Ein Weg W in G wird alternierend genannt, wenn in W auf jede Kante e mit e G M (bzw. e 0 M) eine Kante e' mit e' £ M (bzw e G M) folgt. Ein offener alternierender Weg wird zunehmend genannt, wenn kein Endpunkt des Weges mit einer Kante aus M inzidiert. 4. Satz von Berge Ein Matching M in einem Graphen G ist genau dann maximal, wenn es in G keinen zunehmenden alternierenden Weg gibt. Ist W ein zunehmender alternierender Weg in G mit zugehöriger Menge E(W) durchlaufener Kanten, dann bildet M' = (M \ E(W)) U (E{W) \ M) ein Matching in G mit \M'\ = \M\ + 1 Man spricht in diesem Zusammenhang von einem Austauschverfahren. ¦ Im Graphen der Abb.5.53 ist ({1, 2}, {2,3}, {3,4}) ein zunehmender alternierender Weg bezüglich des Matchings M\. Mit dem Austauschverfahren erhält man daraus das Matching M2 . 5. Ermittlung maximaler Matchings Gegeben sei ein Graph G mit einem Matching M. a) Man bilde zu M ein gesättigtes Matching M* mit M C M*. b) Man wähle in G einen Knoten v, der mit keiner Kante aus M* inzidiert, und suche in G einen zunehmenden alternierenden Weg, der in v beginnt. c) Existiert ein solcher Weg, dann liefert das oben beschriebene Austauschverfahren ein Matching M' mit \M'\ > \M*\. Existiert kein solcher Weg, dann lösche man in G den Knoten v und alle mit v inzidierenden Kanten und wiederhole Schritt b). Es gibt einen kompliziert zu beschreibenden Algorithmus von Edmonds, der sich zur effektiven Suche nach maximalen Matchings eignet (s. [5 39]). 5.8.5 Planare Graphen In diesem Abschnitt kann man sich auf die Betrachtung ungerichteter Graphen beschränken, weil ein gerichteter Graph genau dann planar ist, wenn der zugehörige ungerichtete Graph planar ist 1. Ebener Graph und planarer Graph Ein ebener Graph ist ein derart in die Ebene gezeichneter Graph, daß die Schnittpunkte der Kanten stets in Knoten des Graphen liegen Ein zu einem ebenen Graphen isomorpher Graph heißt planar. Die Abb.5.54 zeigt einen ebenen Graphen G\, die Abb.5.55 einen zu G\ isomorphen Graphen G2, der nicht eben, wegen der Isomorphie zu G\ aber planar ist. 2. Nichtplanare Graphen Der vollständige Graph K5 und der vollständige paare Graph K^ sind nichtplanare Graphen. 3. Unterteilungen Man erhält eine Unterteilung eines Graphen G, indem man auf Kanten von G Knoten vom Grad 2 einfügt. Jeder Graph ist eine Unterteilung von sich selbst. In den Abb.5.56 und Abb.5.57 sind Unterteilungen der Graphen K5 bzw. K^ dargestellt. Abbildung 5.54 Abbildung 5.55
5.8 Algorithmen der Graphentheorie 371 Abbildung 5.56 Abbildung 5.57 4. Satz von Kuratowski Ein Graph ist genau dann nichtplanar, wenn er eine Unterteilung des vollständigen paaren Graphen if3K oder eine Unterteilung des vollständigen Graphen K5 als Untergraph enthält. 5.8.6 Bahnen in gerichteten Graphen 1. Bogenfolgen In gerichteten Graphen wird eine Folge F = (ei, e<i, .., es) von Bögen Kette der Länge s genannt, wenn F keinen Bogen zweimal enthält und für i = 2,3,.. ,5 — 1 jeder Bogen e* einen seiner Endpunkte mit dem Bogen e;_i und den anderen mit ei+i gemeinsam hat. Eine Kette heißt Bahn, wenn für i = 1,2,. ., s — 1 der Zielpunkt des Bo- gens ei mit dem Startpunkt des Bo- gens ei+i übereinstimmt. Ketten bzw. Bahnen, die jeden Knoten des Graphen höchstens einmal durchlaufen, sind elementare Ketten bzw. elementare Bahnen. Eine geschlossene Kette wird Zyklus genannt Eine geschlossene Bahn, in der jeder Knoten Endpunkt genau zweier Bögen ist, heißt Kreis. ¦ In Abb.5.58 sind Beispiele für die verschiedenen Bogenfolgen dargestellt 2. Zusammenhängende und stark zusammenhängende Graphen Ein gerichteter Graph G heißt zusammenhängend, wenn je zwei Knoten von G durch eine Kette verbunden sind Von einem stark zusammenhängenden Graphen G spricht man, wenn es in G zu je zwei Knoten v, w eine Bahn gibt, die v mit w verbindet. 3. Algorithmus von Dantzig Es sei G = (V, E, f) ein bewerteter schlichter gerichteter Graph mit f(e) > 0 für alle Bögen e. Der folgende Algorithmus liefert alle von einem Knoten v\ von G aus erreichbaren Knoten zusammen mit ihren Entfernungen von v\ • a) Der Knoten v\ erhält die Markierung t{v\) =0 Es sei S\ = {vi} . b) Die Menge der markierten Knoten sei Sm c) Ist Um = {e\e = (vi, Vj) Gß, Vi E Sm, Vj 0 Sm} = 0, dann beende man den Algorithmus. d) Anderenfalls wähle man einen Bogen e* = (x*,y*) aus, für den t(x*) + /(e*) minimal ist. Man markiere e* und?/*, setzet (j/*) = t(x*) + f(e*) sowie 5m+i = Smö{y*} und wiederhole b) mitra := ra+1 Kette Bahn elementare elementare Kette Bahn V Zykl äs Kreis Abbildung 5 58
372 5. Algebra und Diskrete Mathematik Sind alle Bögen mit 1 bewertet, dann kann man wiederum (s. 5.8.2.1,4., S. 364) mit Hilfe der Adjazenz- matrix die Länge einer kürzesten Bahn von einem Knoten v zu einem Knoten w des Graphen finden. Wird dagegen ein Knoten v von G nicht markiert, dann gibt es keine von v\ nach v führende Bahn. Wird v mit t(v) markiert, dann ist t(v) die Länge einer solchen Bahn Eine kürzeste Bahn von v\ nach v liegt in dem von allen markierten Knoten und Bögen gebildeten Baum, dem Entfernungsbaum bezüglich v\. ¦ Im Graphen der Abb.5.59 bilden die markierten Bögen einen Entfernungsbaum bezuglich des Knotens v\. Die Längen der kürzesten Bahnen sind. von v\ nach v3 • von vi nach i>7 : von vi nach v9 von v\ nach v2 : von vi nach v10 ' von vi nach v4 • von vi nach vu 2 3 3 4 5 6 6. von vi nach Vq : von vi nach v% : von vi nach u14 : von vi nach v5 : von Vi nach v^ von f i nach v13 : 10 Hinweis: Für den Fall, daß G = (V, E, f) Bögen mit negativen Längen besitzt, gibt es einen modifizierten Algorithmus zur Ermittlung kürzester Bah- Abbildung5 59 nen (s [5.42]). 5.8.7 Transportnetze 1. Transportnetz Ein zusammenhängender gerichteter Graph heißt Transportnetz, wenn in ihm zwei Knoten als Quelle Q bzw Senke S ausgezeichnet sind und folgende Eigenschaften gelten: a) Es existiert ein Bogen ui von S nach Q, wobei ui der einzige Bogen mit dem Startknoten S und der einzige Bogen mit dem Zielknoten Q ist. b) Jedem von Ui verschiedenen Bogen Ui ist eine reelle Zahl c(ui) > 0, seine Kapazität, zugeordnet. Der Bogen ui hat die Kapazität oo Eine Funktion (p, die jedem Bogen eine reelle Zahl zuordnet, heißt Strom auf G, wenn für jeden Knoten v die Gleichung Y^ ip(u,v)= Yl V(viw) E.290a) (u,v)eG (v,w)eG gilt Die Summe E ¥>(Q>U) E 290b) (Q,v)eG heißt Stromstärke Ein Strom <p heißt mit den Kapazitäten verträglich, wenn für jeden Bogen v* von G gilt: 0 < (p(ui) < c(ui). ¦ Transportnetz s. S. 373. 2. Maximalstrom-Algorithmus von Ford und Fulkerson Mit dem Maximalstrom-Algorithmus ist feststellbar, ob ein vorgegebener Strom (p maximal ist Es sei G ein Transportnetz und </? ein mit den Kapazitäten verträglicher Strom der Stärke vi Der Algorithmus beinhaltet die folgenden Schritte zur Markierung von Knoten, nach deren Ausführung man ablesen kann, um welchen Betrag die Stromstärke in Abhängigkeit von den ausgewählten Markierungsschritten verbessert werden kann.
5.8 Algorithmen der Graphentheorie 373 a) Man markiere Q und setze e(Q) = oo b) Existiert ein Bogen e» = (x, y) mit markiertem x , nichtmarkiertem y und (pfe) < cfe), dann markiere man y und (x, y), setze e(y) = min{e(x), c(u{) — tp{ui)} und wiederhole Schritt b), anderenfalls folgt Schritte). c) Existiert ein Bogen e* = (x, y) mit nichtmarkiertem x, markiertem y, </?(iii) > 0 und t^ ^ u\, dann markiere man x und (x, y), setze e(x) = mm{s(y), <p(ui)} un(i führe, falls möglich, Schritt b) aus. Anderenfalls beende man den Algorithmus. Wird die Senke S von G markiert, dann läßt sich der Strom in G um e(S) verbessern. Wird die Senke nicht markiert, dann ist der Strom maximal. ¦ Maximalstrom Im Graphen der Abb.5.60 geben die Bewertungen der Kanten die Kapazitäten der Kanten an Im bewerteten Graphen der Abb.5.61 ist ein mit diesen Kapazitäten verträglicher Strom der Stärke 13 dargestellt Es handelt sich dabei um einen Maximalstrom Abbildung 5 60 Abbildung 5.61 ¦ Transportnetz: Ein Produkt wird von p Firmen Fi, F2,..., Fp hergestellt Es gibt q Verbraucher Vi, V2,.. ,Vq In einem bestimmten Zeitraum werden Si Einheiten von Fi produziert und tj Einheiten von Vj benötigt. In der vorgegebenen Zeit können Qj Einheiten von Fi nach Vj transportiert werden Können in diesem Zeitraum alle Bedarfswünsche erfüllt werden? Den zugehörigen Graphen zeigt die Abb.5.62. Abbildung 5.62
374 5. Algebra und Diskrete Mathematik 5.9 Fuzzy-Logik 5.9.1 Grundlagen der Fuzzy-Logik 5.9.1.1 Interpretation von Fuzzy-Mengen (Unscharfe Mengen) Das englische Wort „fuzzy" bedeutet so viel wie fusselig oder besser unscharf. Auf dieser Bedeutung beruht der Name Fuzzy-Logik. Grundsätzlich sollten zwei Arten von Unscharfe unterschieden werden Vagheit und Unsicherheit. Mathematisch gesehen, gehören dazu zwei Konzepte: Die Theorie der unscharfen Mengen und die Theorie der unscharfen Maße. In der folgenden praxisorientierten Einführung sollen die Begriffe, Methoden und Konzepte unscharfer Mengen, die zur Zeit als mathematische Hilfsmittel akzeptiert werden, auf der Basis der mehrwertigen Logik erläutert werden. 1. Klassischer Mengenbegriff und unscharfe Mengen Der klassische Mengenbegriffist zweiwertig, und die klassische BoOLEsche Mengenalgebra ist isomorph zur zweiwertigen Aussagenlogik. Zu jeder Menge A über einer Grundmenge X existiert eine Funktion /A:X-{0,1}, E.291a) die für jedes Element x E X angibt, ob x Element der Menge A ist oder nicht: fA(x) = 1 & x e A und fA(x) =0&x<£A. E 291b) Das Konzept der unscharfen Mengen basiert aus logischer Sicht auf der Idee, den Zugehörigkeitsgrad eines Elements als den graduellen Wahrheitswert einer Aussage im Intervall [0,1] zu betrachten. Zur mathematischen Modellierung einer Puzzy-Menge A benötigt man eine Funktion, die anstatt in die Menge {0,1} in das Intervall [0,1] abbildet, d.h. fjLA X -> [0,1]. E.292) Mit anderen Worten- Jedem Element x € X kann eine Zahl /^(x) im Intervall [0,1] zugeordnet werden, die den Grad der Zugehörigkeit von x zu A repräsentiert. Die Abbildung \iA heißt Zugehörigkeitsfunktion. Der Funktionswert ha(x) an der Stelle x heißt Zugehörigkeitsgrad. Die unscharfen Mengen A, B, C etc. über X werden auch unscharfe Teilmengen von X genannt Die Gesamtheit aller unscharfen Mengen über X sei mit F(X) bezeichnet. 2. Eigenschaften unscharfer Mengen und weitere Definitionen Aus der Definition ergeben sich unmittelbar die folgenden Eigenschaften- (El) Scharfe Mengen können als unscharfe Mengen mit den Zugehörigkeitsgraden 0 und 1 interpretiert werden. (E2) Alle Argumentwerte x, für deren Zugehörigkeitsgrade fiA[x) > 0 gilt, werden zum Träger (sup- port) der unscharfen Menge A zusammengefaßt: supp(A) = {x e X I fiA(x) > 0} . E.293) (E3) Die Gleichheit zweier unscharfer Mengen A und B über der Grundmenge X ist gegeben, wenn die Werte ihrer Zugehörigkeitsfunktionen gleich sind: A = B, falls gilt nA(x) = y.B(x) für alles € X . E.294) (E4) Diskrete Darstellung oder Wertepaardarstellung: Im Falle endlicher Grundbereiche X , d.h. X = {xi,X2, • • • ,xn} ist es zweckmäßig, die Zugehörigkeitsfunktionen unscharfer Mengen durch Wertetabellen zu be- Tabelle 5.7 Tabellarische Darstellung schreiben. Die unscharfe Menge A kann dann tabellarisch in einer unscharfen Menge der Form der Tabelle 5.7 dargestellt werden. Man schreibt dafür auch n A := iiA(xi)/xi + • • • + ßA{xn)/xn = J2^A{xi)/Xi. E.295) t=i In E.295) sind Bruchstriche und Summenzeichen rein symbolisch zu verstehen. (E5) Ultra-Fuzzy-Sets: Fuzzy-Mengen, deren Zugehörigkeitsgrade selbst wieder eine Fuzzy-Menge repräsentieren, nennt man nach Zadeh Ultra-Fuzzy-Sets. Xi /J>a{xi) X2 Ha(X2) %n ßA{Xn)
5 9 Fuzzy-Logik 375 3. Fuzzy—Linguistik Nimmt eine Kenngröße linguistische Werte wie z B „niedrig", „mittel" oder „hoch" an, so bezeichnet man sie als linguistische Größe oder linguistische Variable. Jeder linguistische Wert ist durch eine Fuzzy Menge beschreibbar, beispielsweise durch einen Funktionsgraphen (s. 5 9 1 2) mit einem bestimmten Träger. Die Anzahl der Fuzzy-Mengen (im Falle von „niedrig", „mittel", „hoch" sind es drei) ist nicht probleminvariant In 5 9 1 2 wird die linguistische Variable mit x bezeichnet Beispielsweise steht x für Temperatur, Druck, Volumen, Frequenz, Geschwindigkeit, Helligkeit, Alter, Abnutzungsgrad etc., aber auch für medizinische, elektrische, chemische, ökologische etc Variable. ¦ Mit Hilfe der Zugehörigkeitsfunktion ha{x) kann man den Zugehörigkeitsgrad eines scharfen Wertes zu einer unscharfen Menge bestimmen. Die Modellierung einer Prozeßgröße, z B der Temperatur, mit dem linguistischen Wert „hoch" durch eine unscharfe Menge in Form einer trapezförmigen Abhängigkeit (Abb.5.63) liefert Repräsentiert x die Temperatur und somit der Wert a eine bestimmte Temperatur, so gehört a mit dem Zugehörigkeitsgrad ß zu der unscharfen Menge „hoch". 5.9.1.2 Zugehörigkeitsfunktionen Die Zugehörigkeitsfunktionen werden durch Funktionsgraphen mit Werten zwischen 0 und 1 modelliert Mit ihrer Hilfe kann eine graduelle Zugehörigkeit zu einer Menge dargestellt werden 1. Trapezförmige Zugehörigkeitsfunktionen Weit verbreitet sind trapezförmige Zugehörigkeitsfunktionen. Die folgenden Beispiele für bereichsweise stetig differenzierbare Zugehörigkeitsfunktionen und Spezialfälle davon, wie beispielsweise drei- eckförmige Zugehörigkeitsfunktionen, sind oft verwendete Funktionsgraphen. Mit stetigen bzw. bereichsweise stetigen Funktionsgraphen als Repräsentanten fuzzy-wertiger Größen, die miteinander verknüpft werden sollen, erhält man im allgemeinen glattere Ergebnisfunktionen für die Ausgabegröße. ¦ A: Trapezfunktion (Abb.5.63) gemäß E.296). Für a2 = a3 = a und a\ < a < a4 geht dieser Funktionsgraph in den einer Dreieckfunktion über. Je nach Wahl unterschiedlicher Werte ai,.. , a4 erhält man symmetrische oder asymmetrische Trapez- und symmetrische Dreieckfunktionen (a2 = 0,3 = a und \a — a\\ = |a4 — a\) oder asymmetrische Dreieckfunktionen (a2 = a3 = aund \a — a\\ ^ |a4 — a\) 0 ¦ai x < d\, ai < x < a2 , Va(x) = { 0 a2 — a\ 1 a2<x<a3, E.296) a3 < x < a4 , a4 - a3 0 x > a4. a," a2 a3 a4 x Abbildung 5 63 B: Linksseitig und rechtsseitig berandete Zugehörigkeitsfunktion (Abb.5.64) gemäß E 297): r 1 Va(x) = { a, a2 a3 a4 x Abbildung 5 64 X < (L\ , a2 a2- 0 x - a4 - 1 -ai -Q3 -a3 ai < x < a2 o>2 < x < a3 a3 < x < CL4 a4 < x. E 297)
376 5. Algebra und Diskrete Mathematik C: Verallgemeinerte Trapezfunktion (Abb.5.65) gemäß E.298). h(x - ai) (fr3 - b2){x - q2) a3 - a2 b3 = b4 = l F4 -65)(a4 - x) ar> — a4 65 (a6 - x) Ö6 - Ö5 Mx> 1 b2 b5 0 k b3=b4 y A a: a2 a3 a4 a5 a6 x Abbik Iun£ 5 5.65 Va{x) = { X < öl , öi < x < a2, + b2 ^2 < x < a3 , a3 < x < a4, + 65 04 < x < a5 , Ö5 < X < 06 , a6 < x. E 298) /(*) = 0 P-1/P(x) 0 x < a, a<z<o, E299) x>b 2. Glockenförmige Zugehörigkeitsfunktionen ¦ A: Eine Klasse von glockenförmigen, differenzierbaren Zugehörigkeitsfunktionen erhält man mit Hilfe von f(x) aus E.299), wenn man p(x) geeignet wählt. Für p(x) = k(x — a)(b — x) und z.B. k = 10 bzw. k = 1 oder k = 0,1 erhält man mit dem Normierungsfaktor l//Bf^) die in (Abb.5.66) angegebenen Zugehörigkeitsfunktionen //^(z) = f(x)/f(g^) unterschiedlicher Breite einer symmetrischen Kurvenschar Mit dem Wert k = 10 ergibt sich die äußere, mit k = 0,1 die innere Kurve Asymmetrische Zugehörigkeitsfunktionen in [0,1] erhält man beispielsweise für p(x) = x(l — x)B — x) oder p(x) = x(l — x)(x + 1) (Abb.5.67), wenn entsprechende Normierungsfaktoren berücksichtigt werden. Der Faktor {2—x) im ersten Polynom bewirkt eine Verschiebung des Maximums nach links und liefert eine asymmetrische Kurvenform. Entsprechend bewirkt der Faktor (x + 1) im zweiten Polynom eine Verschiebung nach rechts mit asymmetrischer Form. Abbildung 5 66 0,5 Abbildung 5.67 ¦ B: Beispiele für eine noch flexiblere Klasse von Zugehörigkeitsfunktionen erhält man durch eine Transformation £ in [a, b] gemäß Ft(x) = **s du I f{t{u))du Ja E 300)
5.9 Fuzzy-Logik 377 wobei / durch E 299) mit p(x) = (x—a)(b—x) definiert ist. Ist t eine glatte Transformation in [a, b], d h ist t unendlich differenzierbar im Intervall [a, b], so ist auch Ft glatt, weil / glatt ist Verlangt man, daß t steigend oder fallend und glatt ist, dann liefert die Transformation t Möglichkeiten, die Kurvenform einer Zugehörigkeitsfunktion zu verändern In der Praxis sind Polynome für die Transformation gut geeignet. Im Intervall [a, b] = [0,1] ist das einfachste Polynom die Identität t(x) = x . Das nächst einfache Polynom mit den angegebenen Eigenschaften ist t(x) = — |c£3 + ex2 + A — |J x mit einer Konstanten c G [—6,3]. Mit der Wahl c = —6 für maximale Krümmung des Polynoms ergibt sich q(x) = 4x3 — 6x2 + 3x Wählt man für qo die Identitätsfunktion, d h qo{x) — x) s0 kann man zusammen mit q rekursiv durch ^ = q o q{_i für i G IN weitere Polynome berechnen. Setzt man für die Transformation t in E 300) die entsprechenden Transformationspolynome qo, q\,. . ein, so erhält man eine Folge glatter Funktionen Fqo,Fqi und Fq2 (Abb.5.68), die als Zugehörigkeitsfunktionen ha{x) identifiziert werden, wobei Fqn zu einer Geraden konvergiert. Mit Hilfe der Funktion Fq2 sowie ihrer gespiegelten Form und einer waagerechten Geraden kann eine trapezförmige Zugehörigkeitsfunktion differenzierbar approximiert werden (Abb.5.69) 0,5 \ jT 0,5 0 0,25 0,5 0,75 1 x 0 0,25 0,5 0,75 1 x Abbildung 5.68 Abbildung 5.69 Resümee: Unscharfe und unpräzise Informationen können durch Fuzzy-Mengen beschrieben und durch Zugehörigkeitsfunktionen [i{x) visualisiert werden. Sprachliche Aussagen wie WENN-DANN- Regeln werden dann zu Berechnungsverfahren 5.9.1.3 Fuzzy-Mengen 1. Leere und universelle Fuzzy-Menge a) Leere Fuzzy-Menge: Eine Menge A über X heißt leer, wenn ^la(x) = 0^x e X gilt b) Universelle Fuzzy-Menge: Eine Menge heißt universell, wenn ^(x) = lVa;6l gilt. 2. Fuzzy-Teilmenge Gilt /iß(x) < ha{x) V x ^ X , so heißt B eine Fuzzy-Teilmenge von A (Schreibweise* B C A). 3. Toleranz einer Fuzzy-Menge Ist A eine Fuzzy-Menge über X , so heißt [a, b] = {x e X\fiA(x) = 1} (a, b const, a < b) E.301) Toleranz der Fuzzy-Menge A ¦ A: In Abb.5.63 ist [02,03] die Toleranz ¦ B: Für a2 = a3 = a (Abb.5.63) entsteht eine dreieckförmige Zugehörigkeitsfunktion fi Die zugehörige Fuzzy-Menge besitzt keine Toleranz. Ist zusätzlich a\ = a = a4 , so entsteht ein scharfer Wert, Singleton genannt Ein Singleton besitzt keinen Träger und keine Toleranz. 4. Umwandlung kontinuierlicher und diskreter fuzzy-wertiger Mengen Wird eine kontinuierliche fuzzy-wert ige Menge, dargestellt durch ihre Zugehörigkeitsfunktion, diskreti- siert, so entsteht eine Menge von Singletons. Umgekehrt kann durch Interpolation von Zwischenwerten eine diskrete Menge in eine kontinuierliche Menge umgewandelt werden 'M-a(x)
378 5 Algebra und Diskrete Mathematik 5. Normale und subnormale Fuzzy-Mengen Ist A eine Fuzzy-Menge über X , so ist die Höhe von A H{A) := max{pA(x)\x € X} . E.302) Man spricht von einer normalen Fuzzy-Menge, wenn H(A) = 1, sonst von einer subnormalen. Die dargestellten Begriffe und Methoden, die auf normale Fuzzy-Mengen beschränkt sind, lassen sich leicht auf subnormale Fuzzy-Mengen erweitern. 6. Schnitt einer Fuzzy-Menge Der Schnitt einer Fuzzy-Menge A in der Höhe a (Zugehörigkeitsgrad a) heißt a-Schnitt A>a bzw. scharfer a-Schnitt A-a , falls gilt: A>a = {xe X\nA{x) > a) , A*a = {x € X\pA{x) > a} , a € [0,1]. E 303) 1. Eigenschaften a) Die a-Schnitte von Fuzzy-Mengen sind klassische scharfe Mengen. b) Der Träger supp(^4) ist ein spezieller a-Schnitt: Es gilt supp(^4) = A>0 c) Der scharfe 1-Schnitt A-1 = {x E X\ha{^) = 1} heißt Toleranz von A. 2. Darstellungssatz Jeder unscharfen Menge A über X lassen sich eindeutig die Familien (^>a)aer0)i) und [A-aj ihrer a-Schnitte und scharfen a-Schnitte zuordnen. Die a-Schnitte und scharfen a-Schnitte sind monotone Familien von Teilmengen über X, für die gilt: a<ß=>A>a^A>ß und A*Q D A** E 304a) Existieren umgekehrt monotone Familien (^a)a€r0>i) °der {Va)ae,Q ^ von Teilmengen über X , so entspricht diesen je genau eine unscharfe Menge U bzw V über X , so daß stets U>a = Ua und V-a = Va gilt und ßu(x) = sup{a e [0, l)\x 6 Ua} , fj,v(x) = sup{a e @, l]\x G VQ} . E.304b) 7. Ähnlichkeit von Fuzzy-Mengen A und £ 1. A,B mit ila,V>b '¦ X —» [0,1] heißen fuzzy-ähnlich, wenn es für jedes a e @,1] Zahlen oti mit et < OLi < 1 (i = 1, 2) gibt, so daß gilt: supp(ai/^)Q C supp(/iß)Q , supp(a2/iß)Q C supp(/i^)a • E.305) (/xc)a ist eine Fuzzy-Menge mit der Zugehörigkeitsfunktion (//c)q = \ n t un<^ (ßfJLc) eme Fuzzy-Menge mit der Zugehörigkeitsfunktion (/3/xc) = { n V7 2. Satz: Zwei Fuzzy-Mengen A, 5 mit /x^, /x#: X —> [0,1] sind fuzzy-ähnlich, wenn sie dieselbe Toleranz besitzen: supp(/i^)i = supp(/iß)i, E 306a) da die Toleranz gerade gleich dem a-Schnitt einer Fuzzy-Menge in der Höhe 1 ist: supp(//^)i = {x<E X\fj,A{x) = 1} . E 306b) 3. A, B mit ha, \xb' X —> [0,1] heißen streng fuzzy-ähnlich, wenn sie dieselbe Toleranz und denselben Träger besitzen: supp(/x>i)i = supp(/xß)i, E.307a) supp(/x^H = supp(/ißH . E 307b) 5.9.2 Verknüpfungen unscharfer Mengen Fuzzy-Mengen lassen sich durch Operatoren auf Fuzzy-Mengen miteinander verknüpfen Es gibt mehrere Vorschläge zur Verallgemeinerung der Mengenoperation Vereinigung, Durchschnitt und Komplement bezüglich unscharfer Mengen.
5.9 Fuzzy-Logik 379 5.9.2.1 Konzept für eine Verknüpfung (Aggregation) unscharfer Mengen 1. Unscharfe Mengenvereinigung, unscharfer Mengenschnitt Der Grad der Zugehörigkeit eines beliebigen Elements a;Glzu den Mengen A U B bzw. A n B soll nur von den beiden Zugehörigkeitsgraden ijla(x) und fiß(x) des Elementes zu den beiden unscharfen Mengen A und B abhängen. Mit Hilfe zweier Funktionen s,t. [0,1] x [0,1] -+ [0,1], E 308) lassen sich die unscharfe Mengenvereinigung und der unscharfe Mengenschnitt wie folgt definieren. Vaub(x) =s(ha{x),hb(x)) , E.309) A^nsfa) := t (nA(x),nB(x)) ¦ E.310) Die Zugehörigkeitsgrade ha(x) und y,ß(x) werden in einen neuen Zugehörigkeitsgrad abgebildet. Die Funktionen t und s werden t-Norm und t-Konorm, letztere auch s-Norm genannt. Interpretation: Die Funktionen haub und [Iahb stellen den Wahrheitswert dar, der sich aus der Verknüpfung der Wahrheitswerte ha(x) und /iß(x) ergibt. 2. Definition der t-Norni Die £-Norm ist eine binäre Operation t in [0,1] und eine Abbildung t. [0,1] x [0,1] -H. [0,1]. E.311) Sie ist symmetrisch, assoziativ, monoton wachsend und besitzt 0 als Nullelement und 1 als neutrales Element Für x,y,z,v,w G [0,1] gelten folgende Eigenschaften: (El) Kommutativität: t{x, y) = t(y, x) E.312a) (E2) Assoziativität: t{x, t(y, z)) = t(t(x, y),z). E 312b) (E3) Spezielle Operationen mit dem neutralen Element 1 und dem Nullelement 0: t(x, l) = x und wegen (El) gilt: *A, x) = x, t(x, 0) = t@, x) = 0 . E 312c) (E4) Monotonie: Ist x < v und y < w, dann gilt t(x, y) < t(v, w). E.312d) 3. Definition der s-Norm Die s-Norm ist eine binäre Operation in [0,1] und eine Abbildung s: [0,1] x [0,1] -> [0,1]. E 313) Sie besitzt die folgenden Eigenschaften (El) Kommutativität: s(x,y) = s(y,x). E.314a) (E2) Assoziativität: s(x, s(y, z)) = s(s(x, y),z). E.314b) (E3) Spezielle Operationen mit dem Nullelement 0 und dem neutralen Element 1: s(x,0) = s@,x) = x, s(x, 1) = 5A,x) = 1 E.314c) (E4) Monotonie: Jstx<v und y < w , dann gilt: s(x, y) < s(v, w) E.314d) Mit Hilfe dieser Eigenschaften lassen sich jeweils eine ganze Klasse T von Funktionen der ^-Normen bzw eine Klasse S von Funktionen der s-Normen einführen. Detailierte Untersuchungen haben gezeigt, daß der folgende Zusammenhang gilt min{x, y) > t{x, y) V t € T, V x, y € [0,1] und E 314e) max{x,y} < s(x,y)VsG 5, Vx,y G [0,1]. E.314f) 5.9.2.2 Praktische Verknüpfungen unscharfer Mengen 1. Durchschnitt zweier Fuzzy-Mengen Der Durchschnitt oder die Schnittmenge AHB („intersection") zweier Fuzzy-Mengen A und B ist definiert durch die Minimumoperation min( . , . ) bezüglich ihrer Zugehörigkeitsfunktionen /^(x) und Hb(x) Auf Grund der vorstehenden Überlegungen erhält man. C := A n B und ßc(x) '— mm (i*>a(x) , Hb(x)) Vx6l, wobei gilt E.315a) . / ,x (a, falls a< 6, /t-oicu min(a,6):=|6 fa]]8ffl-6_ E.315b)
380 5. Algebra und Diskrete Mathematik Der Schnittoperation entspricht die UND-Operation zweier Zugehörigkeitsfunktionen (Abb.5.70) Die Zugehörigkeitsfunktion ßc(x) definiert den minimalen Wert, gebildet aus ha{x) und Hb{x) 2. Vereinigung zweier Fuzzy-Mengen Die Vereinigung Aö B („union") zweier Fuzzy-Mengen ist definiert durch die Maximumoperation max(.,.) bezüglich ihrer Zugehörigkeitsfunktionen /ia{x) und hb{x). Man erhält: C = AU B und fic(x) •= max(//^(a;),//j3(x)) VzEX, wobei gilt: E.316a) / ,>, f a, falls a > 6, /r01cU max(a,6) ={6jfallsa<6 E.316b) Die Vereinigung enstpricht der logischen ODER-Verknüpfung. Die Darstellung in Abb.5.71 zeigt ßc{x) als den maximalen Wert der jeweiligen Zugehörigkeitsfunktionen jia{x) und hb{x) . ¦ Die t-Norm t(x, y) = min{a;, y} wird als Durchschnitt (Abb.5.72) zweier Fuzzy-Mengen bezeichnet, die s-Norm s(x, y) = max{x, y} als Vereinigung (Abb.5.73) H(x)f x> 1 0 i /^a(X)/\ /M.B(x) \McM X Abbildung 5.70 t(x,y)f Abbildung 5.71 s(x,yH Abbildung 5 72 Abbildung 5 73 3. Weitere Verknüpfungen { Weitere Verknüpfungen zur Vereinigungsbildung sind die beschränkte, die algebraische und die drastische Summe sowie die beschränkte Differenz, das algebraische und das drastische Produkt (s. Tabelle 5.8). Die algebraische Summe z B. ist definiert durch C := A + B und nc{x) = Pa(x) + Vb{x) — iia{x) • ßß(x) für alle x G X . E.317a) Wie die Vereinigung E.316a,b) gehören die genannten Summen zu den s-Normen Sie sind in vereinfachter Schreibweise in der rechten Spalte von Tabelle 5.8 zu finden. In Analogie zum erweiterten Summenbegriff für die Vereinigungsbildung ergeben sich für die Durchschnittsbildung mit Hilfe des beschränkten, des algebraischen und des drastischen Produktes entsprechende Erweiterungen So ist z B. das algebraische Produkt wie folgt definiert: C •= A • B und ßC(x) = i^a(x) • fiB{x) für alle x € X E.317b) Es gehört wie die Durchschnittsbildung E.315a,b) zu den ^-Normen, die in der mittleren Spalte von Tabelle 5.8 zu finden sind
5.9 Fuzzy-Logik 381 Tabelle 5.8 t- und s-Normen, p G R Autor i-Norm s-Norm Zadeh Durchschnitt: t(x,y) = min{:c,y} Vereinigung: s(x, y) = max{x, y} LUKASIEWICZ beschränkte Differenz tb(x, y) = max{0, x + y — 1} beschränkte Summe sb(x,y) = min{l,£ + y} algebraisches Produkt ta(x,y) = xy algebraische Summe sa(x,y) = x + y-xy drastisches Produkt min{:r, y}, falls x = 1 tdp(x,y) = { odery = 1 0 sonst drastische Summe C max{:r, y}, falls x = 0 sds(x,y) = < odery = 0 \ 1 sonst Hamacher (P>0) Produkt zy p + (l -p)(£ + y-:ry) Summe x + y - xy - A -p)xy 1 - A -p)ary Einstein Produkt *e(z,2/) = xy l + (l-s)(l-y) Summe Se(^,2/) : _Xj-y_ 1 + Xy Frank (p>0,p^l) */(s,2/) : logp|l + (Px-i)(py-i) p-1 5/(x,y) = 1- (P1-x-l)(p1-y-l)' log. 1 + - P-1 Yager (p>0) tya(x,y) = 1- sya(:r, y) = min (l, (ajp + yp) IM min(l,((l-o:)P + (l-y)PI/p) Schweizer (p>0) tfl(x, y) = max@, x~p + y~p - 1) -i/p ss(z,y) = 1- max @, A - x)~p + A - y)~p - 1) -i/p DOMBI (p>0) W^, 2/) : Sdofc,!/) = 1- {¦+[(¥H^)']'T 1 + fe)'+fe)T"} Weber (p > -1) tw(x, y) = max@, A + p) ix + y- 1) -pxy) sw{x, y) = min(l, x + y + pxy) Dubois @<p< 1) tdu(x,y) ¦¦ xy max(x,y,p) Sdu(x,y) = x-\-y — xy — min(x, y, A — p)) max((l-x),(l -y),p) Hinweis zu Tabelle 5.8: Es existiert eine Ordnungsrelation für die in der Tabelle aufgelisteten t- und s-Normen bezüglich ihrer Rückgabewerte. tdp < h < te < ta < th < t < s < sh < sa < se < sb < sds • E.318)
382 5 Algebra und Diskrete Mathematik 5.9.2.3 Kompensatorische Operatoren Gelegentlich benötigt man Operatoren, die zwischen den t- und s-Normen liegen; sie werden kompensatorische Operatoren genannt Beispiele für kompensatorische Operatoren sind der Lambda- und der Gamma-Operator. 1. Lambda-Operator Ha\b(x) = A \}Ia(x)ilb{x)] + A - A) [fJ,A{x) + Pb(x) ~ fJLA(x)fiB{x)] mit A G [0,1]. E 319) Fall A = 0 • Die Gleichung E.319) liefert eine Form, die als algebraische Summe bekannt ist (Tabelle 5.8, s-Normen); ihr ist der ODER-Operator zuzuordnen. Fall A = 1: Die Gleichung E 319) liefert eine Form, die als algebraisches Produkt bekannt ist (Tabelle 5.8, s-Normen); ihr ist der UND-Operator zuzuordnen. 2. Gamma-Operator VAiBix) = [fiA(x)iiB(x)}1-1 [1 - A - ßA{x)) A - liB{x))\1 mit 7 € [0,1] E 320) Fall 7= 1: liefert die Darstellung für die algebraische Summe Fall 7= 0: liefert die Darstellung für das algebraische Produkt. Die Anwendung des Gamma-Operators auf beliebig viele unscharfe Mengen ist gegeben durch ll-7 I Lt=i J L »=i und mit einer Wichtung Si versehen ergibt sich p{x) ¦¦ Ußi(xM i=l l-na-M*))** mit x G X , E 321) 1, 7 e [0,1] E.322) 5.9.2.4 Erweiterungsprinzip In vorangegangenen Abschnitten wurden Möglichkeiten der Verallgemeinerung mengentheoretischer Grundoperationen gewöhnlicher Mengen auf unscharfe Mengen diskutiert. Beim Erweiterungsprinzip geht es um die Abbildung einer unscharfen Definitionsmenge. Grundlage bildet das Konzept des Akzeptanzgrades vager Aussagen In Analogie zur Abbildungsvorschrift der Funktion $ • Xn —? Y , die einem Punkt (#i,..., xn) G Xn den scharfen Funktionswert $(#i,..., xn) G Y zuordnet, läßt sich diese Zuordnung auf unscharfe Mengen übertragen. Die Abbildungsvorschrift ist <l>: F(X)n —> F(Y), wobei die unscharfen Zugehörigkeitsfunktionen (/ii,..., /in) G F(X)n bezuglich (xi, ., xn) dem unscharfen Funktionswert $(/ii, . , fin) zugeordnet werden. Hinweis: In Analogie zur Summen- und Produktbildung existieren für alle i6l entsprechende Erweiterungen für die Vereinigungsbildung und die Durchschnittsbildung. 5.9.2.5 Unscharfe Komplementfunktion Eine Funktion c: [0,1] —> [0,1] heißt Komplementfunktion, falls sie die folgenden Eigenschaften Vx, y G [0,1] besitzt: (EK1) Grenzbedingungen: c@) = 1 und c(l) = 0 E.323a) (EK2) Monotonie: x < y => c(x) > c(y) E.323b) (EK3) Involutivität: c(c(x)) =x E 323c) (EK4) Stetigkeit: c(x) sei stetig für alle x G [0,1]. E 323d) ¦ A: Die am häufigsten untersuchte und angewandte Komplementfunktion (intuitive Definition) ist stetig und involutiv: c(x) :=l-x. E.324)
5.9 Fuzzy-Logik 383 Tabelle 5.9 Gegenüberstellung von Operationen der BoOLEschen und der Fuzzy-Logik Operator UND ODER NICHT BoOLEsche Logik C = AAB C = AVB C = -iA Fuzzy-Logik {ßA, ßB € [0,1]) fiAnB = mm{(iA:ßB) ßAuB = max(/x^,//ß) fA = 1 — ßA (a*a a^s Komplement von ßA) Pa A={(x,y)eR2\x = y} ¦ B: Andere stetige und involutive Komplemente sind das SlJGENO-Komplementc\(x) := A—x)(l+ Xx)'1 mit A € (—1, oo) und das YAG ER- Komplement cp(x) •= A — xpI/p mit p G @, oo). 5.9.3 Fuzzy—wert ige Relationen 5.9.3.1 Fuzzy-Relationen 1. Modellierung fuzzy-wertiger Relationen Unscharfe oder fuzzy-wertige Relationen wie beispielsweise „ungefähr gleich", „im wesentlichen größer" oder „im wesentlichen kleiner" etc. spielen für die praktischen Anwendungen eine große Rolle. Sie werden als Relationen zwischen Zahlen und demzufolge als Teilmengen im R erklärt. So läßt sich Gleichheit „=" als Menge E.325) erklären, d.h. durch eine Gerade y = x im R2 . Zur Modellierung der Relation Ri „ungefähr gleich" kann angrenzend an ein scharfes Gebiet (hier beschrieben durch die Gerade im R2 , allgemein im Rn , mit der Toleranz A) eine unscharfe Übergangszone zugelassen und verlangt werden, daß die Zugehörigkeitsfunktion in einer gewünschten Art (linear oder quadratisch) mit abnehmender Zugehörigkeit gegen Null geht. Eine lineare Abnahme kann wie folgt modelliert werden- liRx{x,y) = max{0,1 — a\x — y\} mit a€R,a>0. E.326) Zur Modellierung der Relation R2 „im wesentlichen größer als" ist es zweckmäßig, von der scharfen Relation „>" auszugehen. Die zugehörige Wertemenge ist dann gegeben durch E 327) Sie beschreibt das scharfe Gebiet oberhalb der Geraden x = y. Die Modellierung „im wesentlichen" bedeutet, daß geringe Unterschreitungen in ein Randgebiet unterhalb der Halbebene, gekennzeichnet durch die Gerade, noch akzeptiert werden. Die Modellierung von R2 ergibt sich dann zu {(x,y)€B?\x<y} m Ax,y) = I " max{0,1 — a\x — y\} für y < x für y <x) y>x) mit a € R, a > 0. E.328) Setzt man für eine der Variablen einen festen Wert ein, z.B. y = y0 , dann folgt aus dieser modellmäßigen Beschreibung unmittelbar, daß R2 als unscharfe Schranke bezüglich der anderen Variablen interpretiert werden kann. Unscharfe Schranken besitzen im Bereich der unscharfen mathematischen Optimierung, der qualitativen Datenanalyse und der Musterklassifikation praktische Bedeutung Die vorstehende Betrachtung zeigt, daß das Konzept der unscharfen Relationen, d.h. der unscharfen Beziehungen zwischen mehreren Objekten, mit Hilfe unscharfer Mengen aufgebaut werden kann. Im folgenden werden Grundtatsachen zweistelliger Relationen über einem Grundbereich behandelt, dessen Elemente geordnete Paare sind. 2. Kartesisches Produkt Seien X und Y Fuzzy-Grundmengen, so repräsentiert das „Kreuzprodukt" X x Y , auch kartesisches Produkt genannt, im Grundbereich G eine Fuzzy-Menge: G = XxY = {(x, y)\xeXAyeY}. E.329)
384 5. Algebra und Diskrete Mathematik Die Fuzzy-Menge wird dann in Analogie zur klassischen Mengenlehre zu einer Fuzzy-Relation, weil sie die Elemente aus den Grundmengen paarweise in Beziehung setzt Eine unscharfe Relation R in G ist eine unscharfe Teilmenge R G F(G), wobei F(G) die Gesamtheit aller unscharfen Mengen über X xY bezeichnet. R läßt sich durch eine Zugehörigkeitsfunktion fin(x,y) beschreiben, die jedem Element (x, y) G G den Zugehörigkeitsgrad /i#(x, y) aus [0,1] zuordnet 3. Eigenschaften fuzzy-wertiger Relationen (El) Da unscharfe Relationen nur spezielle unscharfe Mengen sind, gelten prinzipiell die für unscharfe Mengen ausgesprochenen Aussagen auch für unscharfe Relationen. (E2) Alle für unscharfe Mengen erklärten Verknüpfungen lassen sich auf unscharfe Relationen anwenden, sie liefern als Resultat wieder unscharfe Relationen. (E3) Der Begriff des a-Schnittes läßt sich auf Grund der vorangegangenen Überlegungen mühelos auf unscharfe Relationen übertragen. (E4) Der Träger als O-Schnitt einer unscharfen Relation R G F(G) ist eine gewöhnliche Relation von G. (E5) Mit /ir(x, y) wird der Zugehörigkeitswert bezeichnet, d h. der Grad, mit dem die unscharfe Relation R auf die Objekte (x, y) zutrifft. Der Wert Hr(x, y) = 1 bedeutet, daß R auf (x, y) voll zutrifft, der Wert Hr(x, y) = 0, daß R auf (x, y) nicht zutrifft (E6) Es sei R G F(G) eine unscharfe Relation, dann wird die zu R inverse unscharfe Relation S = R~l definiert durch /i5(x, y) = fj,R(y, x) für alle (x, y) G G. E 330) ¦ Die inverse Relation jR^ bedeutet „im wesentlichen kleiner als" (s. 5.9 3.1,1., S 383); die Vereinigung Ri U R21 kann als Beziehung „im wesentlichen kleiner oder ungefähr gleich" beschrieben werden 4. n-faches kartesisches Produkt Eine Kreuzproduktmenge aus n Grundmengen repräsentiert in Analogie zum oben definierten kartesi- schen Produkt ein n-faches kartesisches Produkt, d.h. eine n-stellige Fuzzy-Relation. Folgerung: Die bisher betrachteten Fuzzy-Mengen sind einstellige Fuzzy-Relationen, d.h. im Sinne der Analysis Kurven über einer Grundmenge Eine zweistellige Fuzzy-Relation kann als Fläche über der Grundmenge G aufgefaßt werden Eine zweistellige Fuzzy-Relation auf diskreten endlichen Grundmengen kann als Fuzzy-Relationsmatrix dargestellt werden. ¦ Farbe-Reifegrad-Relation Es wird der bekannte Zusammenhang zwischen Farbe x und Reifegrad y einer Frucht mit den möglichen Farben X = {grün, gelb, rot} und dem Reifegrad Y = {unreif, halbreif, reif} in Form einer binären Relationsmatrix mit den Elementen aus {0,1} modelliert. Ausgangspunkt für die Relationsmatrix E 331) ist die folgende Tabelle- unreif halbreif reif ' 1 n n \ 010) E 331) 00 1/ Interpretation der Relationsmatrix: WENN eine Frucht grün ist, DANN ist sie unreif WENN eine Frucht gelb ist, DANN ist sie halbreif WENN eine Frucht rot ist, DANN ist sie reif. Grün ist eindeutig unreif zugeordnet, gelb halbreif und rot reif. Soll darüber hinaus noch formuliert werden, daß eine grüne Frucht zu einem gewissen Prozentsatz durchaus als halbreif angesehen werden kann, beispielsweise mit graduellen Zugehörigkeiten dann kann man die folgende Tabelle aufstellen: grün gelb rot 1 0 0 0 1 0 0 0 1 /iR (grün, unreif) Hr (grün, reif) fiR (gelb, halbreif) Hr (rot, unreif) Hr (rot, reif) = 1,0, = 0,0, = 1,0, = 0,0, = 1,0. fiR (grün, halbreif) ßr (gelb, unreif) fiR (gelb, reif) Hr (rot, halbreif) = 0,5, = 0,25, = 0,25, = 0,5, Die Relationsmatrix mit hr G [0,1] lautet /1,0 0,5 0,0 \ R= 0,25 1,0 0,25 . E.332) \0,0 0,5 1,0 /
5 9 Fuzzy-Logik 385 5. Rechenregeln Für die Verknüpfung von Fuzzy-Mengen, z.B. ß\: X —> [0,1] und fi2' Y ~* [0,1] auf unterschiedlichen Grundmengen mit der UND-Verknüpfung, d.h. mit der min-Operation, gilt: VR(x,y) = min(/ii(z),/i2(y)) oder (^ x ß2)(x,y) = min(/xi(x),//2B/)) mit E 333a) fiiXßi G-+ [0,1], wobei G = X xY. E.333b) Das Ergebnis der Verknüpfung ist eine Fuzzy-Relation R auf der Kreuzproduktmenge (kartesisches Produkt der Fuzzy-Mengen) G mit (x, y) G G Sind X und Y diskrete endliche Mengen und somit ßi{x), ß2(y) als Vektoren darstellbar, dann gilt: Vi x ß2 = ßi ° ßl und /iß-i (x, 2/) = /xß(?/, x) V (x, j/) € G. E 334) Der Verknüpfungsoperator o steht nicht für das übliche Matrizenprodukt, die Produktbildung wird durch die komponentenweise min-Operation und die Addition durch die komponentenweise max-Ope- ration ersetzt Der Grad des Zutreffens einer inversen Relation R~l auf die Objekte (x, y) ist also stets gleich dem Grad des Zutreffens von R auf die Objekte (y, x). Rechenregeln für die Verknüpfung von Fuzzy-Relationen auf derselben Produktmenge lassen sich wie folgt angeben: Es seien zweistellige Fuzzy-Relationen R\,R2 '• X x Y —? [0,1] und (x,y) G G gegeben, mit denen Rechenregeln aufgestellt werden können. Die Berechnungsvorschrift für eine UND- Verknupfung erfolgt über die min-Operation: ßRxc\R2(x,y) = mm(iiRl(x,y),ßR2(x,y)). E.335) Eine entsprechende Berechnungsvorschrift für die ODER-Verknüpfung durch die max-Operation ist gegeben durch: ßRluR2{x,y) = max(/iÄ1(x,?/),/^2(x,?/)). E.336) 5.9.3.2 Fuzzy-Relationenprodukt Ro S 1. Verkettung oder Relationenprodukt Es seien R G F(X x Y) und S G F(Y x Z), aber auch speziell R, S G F(G) mit G C X x Z, dann versteht man unter der Verkettung oder dem Fuzzy-Relationenprodukt Ro S ßRos(x, z) := supyer{min(//ß(x, y), ßS(y, z))} V (x, z) G X x Z. E.337) Verwendet man über endlichen Grundbereichen eine Matrixdarstellung analog E.332), so läßt sich die Verknüpfung Ro S wie folgt motivieren: Es seien gegeben X = {xi,..., xn}, Y = {yi, . , ym}, Z = {21,..., zi) und R G F(X x Y), S G F(Y x Z) sowie die Matrixdarstellung von R, S in der Form R = (uj) und S = (sjk) mit i = 1, ., n; j = 1,..., m; k = 1,..., / sowie Tij = ßR(xi, yj) und sjk = fj,s(yj, zk) E.338) Wird für die Verknüpfung T = Ro S die Matrixdarstellung tik gewählt, dann ist tik = sup mm{rij,sjk} . E.339) 3 Als Ergebnis erhält man nicht die übliche Form der Matrixmultiplikation, da die Supremumbildung anstelle der Summenbildung und die Minimumbildung anstelle der Produktbildung zur Anwendung kommen. ¦ Mit den Darstellungen für r^ und Sjk sowie mit Gleichung E.337) kann die inverse Relation R~l durch die zu (r»j) transponierte Matrix R~l — (ri:/)T dargestellt werden. Interpretation: Sei R eine Relation von X nach Y und S eine Relation von Y nach Z, dann sind folgende Verknüpfungen möglich: a) Wird die Verknüpfung Ro S aus R und S als ein max-min-Produkt definiert, dann wird das vorstehende Fuzzy-Verknupfungsprodukt als max-min-Verknüpfung bezeichnet. Das Zeichen sup steht
386 5. Algebra und Diskrete Mathematik für Supremum und bezeichnet den größten Wert, wenn kein Maximum vorliegt; es wird oft als max- Operation aufgefaßt. b) Wird die Produktbildung wie bei der bekannten Matrix-Multiplikation vorgenommen, dann erhält man die max-prod-Verknüpfung c) Bei der max-average-Verknüpfung wird die „Multiplikation" durch eine Mittelwertbildung ersetzt 2. Verknüpfungsregeln Für die Verknüpfung unscharfer Relationen R,S,T € F(G) gelten die folgenden Gesetzmäßigkeiten (El) Assoziativgesetz: (RoS)oT = Ro(SoT) E 340) (E2) Distributivgesetz für die Verknüpfung mit Vereinigungsbildung: Ro(SöT) = (RoS)U{RoT) E 341) (E3) Distributivgesetz in abgeschwächter Form für die Verknüpfung mit Schnittbildung: Ro(Sf)T) C (RoS)n(RoT). E342) (E4) Inversenbildung: (RoS)-1=S~1oR-\ {RUS)-1=R-1US~1 und (An 5) = R~* n 5. E 343) (E5) Komplementbildung und Inversenbildung: (R-1)'1 =ä, (rC)'1 = (R-1H . E 344) (E6) Monotonieeigenschaften: RCS=> RoTCSoT undToRCToS E.345) ¦ A: Die Gleichung E 337) für das Relationenprodukt Ro S wurde entsprechend wie bei der Durchschnittsbildung mittels der min-Operation definiert. Allgemeine Überlegungen zeigen, daß statt der min-Operation irgendeine der i-Normen verwendet werden kann. ¦ B: Für die Vereinigungs-, Durchschnitts- und Komplementbildung bezüglich a-Schnitte gilt (A U B)>a = A>a U B>a, (A n B)>a = A>a n B>a , {Ac)>a = A^~a = {x e X\pA(x) < 1 - a} . Entsprechendes gilt auch für die scharfen a-Schnitte 3. Fuzzy-logisches Schließen Ein fuzzy-logisches Schließen z B mit WENN-DANN-Regel ist über die Verknüpfung /i2 = fi\ o R möglich. Die Fuzzy-Menge \i2 stellt dann die gesuchte Schlußfolgerung dar, die sich als Formel wie folgt darstellt: p2{y) = maxxeX(min(/ii(:r), nR{x,y))) E 346) mit y E Y , /ii: X -». [0,1], [i2 Y -? [0,1], R. G -> [0,1] und G = X x Y 5.9.4 Fuzzy—Inferenz Die Fuzzy-Inferenz ist eine Anwendung der Fuzzy-Relationen mit dem Ziel des fuzzy-logischen Schlie- ßens bezüglicher vager Informationen (s. 5 9.6.3, S. 390) Vage Information bedeutet hier unscharfe Information, aber nicht unsichere Information Die Fuzzy-Inferenz, auch Implikation genannt (s 5.9 4,1., S 386), besteht aus einer oder mehreren Regeln, einem Faktum und einem Schluß Das unscharfe Schließen (nach Zadeh approximate reasoning) ist nicht mit der klassischen Logik beschreibbar. 1. Fuzzy-Implikation, WENN-DANN-Regel Die Fuzzy-Implikation besteht im einfachsten Falle aus einer WENN-DANN-i?e^e/. Der WENN-Teil der Regel wird als Prämisse bezeichnet und repräsentiert die Bedingung Der DANN-Teil ist die Schlußfolgerung, auch Konklusion genannt. Die Auswertung erfolgt mittels fi2 = Mi ° R und E.346). Interpretation: /i2 ist das Fuzzy-Inferenzbild von ß\ bezüglich der Fuzzy-Relation R, d h eine Berechnungsvorschrift für WENN-D ANN-Regeln bzw. für Gruppen von Regeln
5.9 Fuzzy-Logik 387 2. Verallgemeinertes Fuzzy-Inferenz-Schema Die Regel WENN Ax UND A2 UND A3 UND An DANN B mit ^. ^. X< -+ [0,1] (i = 1,2,. , n) und die Zuhörigkeitsfunktion der Konklusion B \i Y —> [0,1] wird beschrieben durch die (n + 1)- stellige Relation R XixX2x---Xnxy-*[0,l]. E.347a) Für das aktuelle Ereignis x[,x2,. ., x'n mit den scharfen Werten x[,x2, , x'n der Kenngrößen Xi (i = 1,2, ,n)und?/G K gilt /iß/(y) = /ifi(xi,X2, ,x'n,y) = min(//i(xi),/i2DM--->^n«),/iß(y)) E.347b) Anmerkung: Die Größe min(/xi(x'1), ^2(^2) > • • • A*n(^n)) heißt Erfüllungsgrad der Regel, und die Größen {//i(a;/1), ß2(x'2)» • ' MnK)} repräsentieren die fuzzy-wertigen Eingangsgrößen. 0' 50 100 b) T Temperatur c) 0 10 p d) 0 Abbildung 5.74 H*(P,T) a) 0 Hr(P/T) 10 p b) Abbildung 5.75 ¦ Bildung von Fuzzy-Relationen für einen Zusammenhang zwischen den Größen „mittlerer" Druck und „hohe" Temperatur (Abb.5.74) fii(p,T) = /ii(p) VT G X2 mit ni : X\ -* [0,1] ist eine zylindrische Erweiterung (Abb.5.74c) der Fuzzy-Menge mittlerer Druck (Abb.5.74a) Analog ist ß2(p.T) = fi2(T) Vp G X\ mit /x2 X2 —? [0,1] eine zylindrische Erweiterung (Abb.5.74d) der Fuzzy-Menge hohe Temperatur (Abb.5.74b), wobei fr\,fi2 G = X\ x X2 —> [0,1]. Die Abb.5.75a zeigt graphisch das Ergebnis der Bildung von Fuzzy-Relationen: In Abb.5.75b ist das Ergebnis der Verknüpfung mittlerer Druck UND hohe Temperatur mit dem min-Operator /j,r(p, T) =
388 5 Algebra und Diskrete Mathematik min(/ii(p), /x2(T)) dargestellt, und (Abb.5.75b) zeigt das Ergebnis der Verknüpfung ODER mit dem max-Operator/iß(p, T) = max(iJ,i(p),ijq(T)) . 5.9.5 Defuzzifizierungsmethoden Zur Berechnung einer scharfen Ausgangsgröße ist eine Defuzzifizierung der Fuzzy-Menge am Ausgang erforderlich. Man bedient sich verschiedener Methoden. 1. Maximum-Kriterium-Methode Aus dem Bereich, innerhalb dessen die Fuzzy-Menge /x?"tp,'it„ den maximalen Zugehörigkeitsgrad besitzt, wird ein beliebiger Wert rj e Y ausgewählt 2. Mean-of-Maximum-Methode (MOM) Als Ausgabewert wird der Mittelwert über die maximalen Zugehörigkeitswerte genommen: sup(/£^J := {V € Y\ßxu ,In(y) > ßxu ^(y') Vj/* € Y) . E.348) D.h., die Menge Y ist ein Intervall, sie sei nicht leer und charakterisiert durchE 348), woraus sich E.349) ergibt. 3. Schwerpunktmethode (S) Bei der Schwerpunktmethode wird die Abszisse des Schwerpunktes einer Fläche mit gedachter homogener Dichtebelegung vom Werte 1 berechnet. 4. Parametrisierte Schwerpunktmethode (PS) Die parametrische Methode geht von 7 € R aus Aus E.351) folgt für 7 = 1 7/ps = rjs und für 7 —? 0 r/Ps = 7?MOM • 5. Verallgemeinerte Schwerpunktmethode (VS) Wird der Exponent 7 bei der parametrischen Defuzzifizie- rungsmethode als Funktion von y angesehen, dann folgt daraus unmittelbar E.352). Die VS-Methode ist eine Verallgemeinerung der PS-Methode. Sie ist von Interesse, wenn /z(y) selbst ein besonderes, von y abhängiges Gewicht erhalten soll 6. Methode der Flächenhalbierung (FH) Die Position einer Geraden parallel zur Ordinate wird so berechnet, daß die linke und die rechte Seite der Fläche unter der Zugehörigkeitsfunktion gleich groß ist 7. Methode der parametrisierten Flächenhalbierenden (PF) 8. Methode der größten Fläche (GF) Es wird die signifikante Teilmenge aus der Gesamtmenge ausgewählt, die dann mit bekannten Methoden, wie z.B. der Schwerpunktsmethode (S) oder der Bestimmung der Flächenhalbierenden (FH) ausgewertet wird JyesuP(^^Xn)ydy Vuom = —f — • E.349) / Jw y€sup(/i°u,tp£n) /1/sup p(y)ydy. Vs = ^~p E 350) / ß(y) dy Jyinf /•3/sup fVsup / ßivTydy r/PS = -%rP E.351) / ß(yV dy JVint r* ßW{y)ydy E 352) r* H(y)«v) dy Jy-mf / ii{y)dy= fi(y)dy E.353) / ß(yydy= / ß(y)-<dy E.354) Jyinf Jvpf
5.9 Fuzzy-Logik 389 5.9.6 Wissensbasierte Fuzzy—Systeme Mit Hilfe der mehrwertigen, auf dem Einheitsintervall basierenden Fuzzy-Logik ergeben sich vielseitige Anwendungsmöglichkeiten im technischen und nichttechnischen Bereich Das allgemeine Konzept besteht darin, Größen oder Kennwerte zu fuzzifizieren, geeignet in einer Wissensbasis mit Operatoren zu verknüpfen und die möglicherweise unscharfen Ergebnismengen gegebenenfalls zu defuzzifizieren. 5.9.6.1 Methode Mamdani Für einen fuzzy-geregelten Prozeß werden folgende Entwurfsschritte verwendet 1. Regelbasis Für die i-te Regel gelte z B rV • WENN e ist El UND c ist AE1 DANN u ist IT . E 355) Hierbei charakterisiert e den Fehler, e die Änderung des Fehlers und u die Änderung des Ausgabewertes (nicht fuzzy-wertig) Alle Größen seien auf ihren Definitionsbereichen E, AE und U definiert, und der gesamte Definitionsbereich sei E x AE x U. Über diesem Definitionsbereich werden die Größen Fehler und Fehleränderung fuzzifiziert, d.h mittels unscharfer Mengen dargestellt, wobei linguistische Beschreibungen benutzt werden 2. Fuzzifizierungsalgorithmus Im allgemeinen sind der Fehler e und dessen Änderung e nicht fuzzy-wertig, so daß sie über eine linguistische Beschreibung fuzzifiziert werden müssen. Die Fuzzy- Werte werden mit den Prämissen der WENN-DANN-Regeln aus der Regelbasis verglichen. Daraus folgt, welche Regeln aktiv sind und mit welchem Gewicht eine Regel beteiligt ist 3. Verknüpfungsmodul Die aktivierten Regeln mit ihrem unterschiedlichen Gewicht werden mit Hilfe einer Verknüpfungsoperation zusammengefaßt und dem Defuzzifizierungsalgorithmus zugeführt 4. Entscheidungsmodul Im Defuzzifizierungsprozeß soll ein scharfer Wert für die Stellgröße erhalten werden. Mit Hilfe einer Defuzzifizierungsoperation wird aus der Menge der möglichen Werte eine nicht fuzzy-wertige Größe, d.h. eine scharfe Größe, ermittelt. Diese Größe drückt aus, wie eine Einstellung des Systems vorzunehmen ist, so daß die Regelabweichung gering bleibt. Fuzzy-Regelung bedeutet, daß die Schritte 1. bis 4. wiederholt werden, bis das Ziel, geringste Regelabweichung e und deren Änderung e , erreicht ist. 5.9.6.2 Methode Sugeno Die Methode von Sugeno dient ebenfalls zum Entwurf eines fuzzy-geregelten Prozesses und unterscheidet sich vom MAMDANI-Konzept durch die Art der Regelbasis und durch die Methode, einen scharfen Ausgangswert zu bekommen. Sie beinhaltet die folgenden Schritte. 1. Regelbasis: Die Regelbasis besteht aus Regeln der folgenden Form. IV ¦ WENN Xi ist A\ UND UND xk ist A{ DANN ui=p\i+ p\x! + p^x2 + • • • + p[xk E 356) Es bedeuten. Aj. unscharfe Mengen, die durch Zugehörigkeitsfunktionen festgelegt werden können, Xj\ scharfe Eingabewerte, wie z B der Fehler e und die Fehleränderung e , die etwas über die Dynamik des Systems aussagen, plj Parametergewichte der Xj (j = 1, 2, ..,&); Ui zur i-ten Regel gehörige Ausgangsgröße (i = 1,2,.. , n) 2. Fuzzifizierungsalgorithmus: Für jede Regel FC wird ein jii G [0,1] berechnet. 3. Entscheidungsmodul: Aus dem gewichteten Mittel der Ui mit den /z* aus der Fuzzifizierung wird die nicht fuzzy-wertige Ausgangsgröße berechnet: u = J2fiiUi[J2ßi) . E.357) i=i \i=i ) Dabei bedeutet u einen scharfen Wert. Eine Denazifizierung wie bei der MAMDANI-Methode entfällt hier. Die Bereitstellung der Werte der Gewichtsparameter p* stellt zwar ein Problem dar, aber die Parameter können durch ein maschinelles
390 5. Algebra und Diskrete Mathematik Lernverfahren, z B durch ein künstliches neuronales Netz, ermittelt werden. 5.9.6.3 Kognitive Systeme Zur Erläuterung der Methode soll das bekannte Beispiel der Regelung eines, auf einer beweglichen Unterlage aufrechtstehenden Pendels (Abb.5.76) mit dem MAMDANI-Regelungskonzept behandelt werden. Ziel der Regelung ist es, das Pendel so in der Balance zu halten, daß der Pendelstab vertikal steht, d.h. die Winkelabweichung vom Lot und die Winkelgeschwindigkeit zu Null werden Das kann durch die Kraft F, die Stellgröße, die auf das untere Ende des Pendels einwirkt, erreicht werden Dazu wird das Modell eines menschlichen „Kontrollexperten" (kognitive Aufgabe) zugrunde gelegt. Der Experte formuliert sein Wissen in Form linguistischer Regeln. Linguistische Regeln bestehen im allgemeinen aus einer Prämisse, d.h. einer Spezifikation der Werte für die Meßgrößen, und einer Konklusion, die einen geeigneten Stellwert angibt. Für jede der Wertemengen Xi, X2:..., Xn für die Meßgrößen und Y für die Stellgröße sind geeignete linguistische Terme wie „ungefähr Null", „positiv klein" usw. festzulegen. Dabei kann „ungefähr Null" bezüglich der Meßgröße £1 durchaus eine andere Bedeutung besitzen als für die Meßgröße £2 • ¦ Pendel auf beweglicher Unterlage 1. Modellierung Für die Menge X\ (Winkelwerte) seien die sieben linguistische Terme, negativ groß (ng), negativ mittel (nm), negativ klein (nk), etwa Null (eN), positiv klein (pk), positiv mittel (pm) und positiv groß (pg) gewählt und entsprechend für die Eingangsgröße X2 (Werte der Winkelgeschwindigkeit). Für die mathematische Modellierung muß jedem dieser linguistischen Terme eine Fuzzy-Menge über Graphen zugeordnet werden (Abb.5.75), wie es unter Fuzzy-Inferenz gezeigt wurde. Festlegung der Wertebereiche: • Winkelwerte. 0(-9O° < © < 90°): Xx := [-90°, 90°]. • Winkelgeschwindigkeitswerte: <9(—45°s-1 < © < 45°s-1)- X2:= [-450s,450s-1]. • Kraftwerte F (-10N < F < ION): Y .= [-10N, ION] Die Partitionierung der Eingangsgrößen Xi und X2 und der Ausgangsgröße Y ist graphisch in (Abb.5.77) für das inverse Pendel (Abb.5.76) dargestellt. Die Startwerte sind in der Regel aktuelle Meßwerte, z.B. © = 36° , © = Abbildung 5.76 2. Regelaus wähl Von den gemäß der folgenden Tabelle 49 möglichen Regeln Gx7) sind 19 praxisrelevant, und von diesen werden die folgenden beiden Regeln Rl und R2 betrachtet Rl: Ist © positiv klein (pk) und © etwa Null (eN), dann ist F positiv klein (pk) Für den Erfüllungsgrad der Prämisse mit a = min lfi^(©)] n^l\©)\ = min{0,4; 0,8} = 0,4 ergibt sich die Ausgabenmenge E.358) durch einen a-Schnitt der Ausgabe-Fuzzy-Menge positiv-klein (pk) in der Höhe a = 0,4 (Abb.5.78c).
5.9 Fuzzy-Logik 391 Tabelle Regelbasis mit 19 praxisrelevanten Regeln e\e ng nm nk eN pk pm Pg ng nm ng nm nm nk pk nk nk eN Pg pm pk eN nk nm ng pk pk pk nk pm pm Pg Pg pm Output(Rl), x _ P36;-2,25 KU) ~ 2 5 0,4 V 0<y < 1, 1 < 2/ < 4, 2 E.358) 2--y 4<?/<5, 5 R2: Ist 0 positiv mittel (pm) und Ö etwa Null (eN), dann ist F positiv mittel (pm). Für den Erfüllungsgrad der Prämisse ergibt sich mit a = min {/iB)@),/xB)@} = min{0,6,0,8} = 0,6 die Ausgabenmenge E.359) analog zu Regel Rl (Abb.5.78f). 0 B 5 0, uutpuHK^/ x //36;-2,25 \V) " sonst y-l 2,5<?/<4, 4<y <6, 2 E.359) 3--y 6<y<7,5, 5 0 sonst 3. Entscheidungslogik Die Auswertung mit der min-Operation der Regel Ri liefert die Fuzzy- Menge in (Abb.5.78a-c). Die entsprechende Auswertung für die Regel R2 zeigt die (Abb.5.78d-f). Aus der Fuzzy-Aussagenmenge (Abb.5.78g) wird letztlich die Stellgröße mit einer Defuzzifizierungs- methode berechnet. a) Auswertung der erhaltenen Fuzzy-Mengen, die mittels Operatoren zusammengefügt wurden (s max-min-Komposition in 5 9.3.2, S. 385) Die Entscheidungslogik liefert: Output "xi, ,x„ K-[0,l];y max < r€{l, ,*} ' l{$l(xi)>- "t!WA(i/)}} E 360) /i36;-2,25(?/) ~ 0,4 5y 0,6 für für 1 < 0<y < 1, <3,5, E 361) b) Für den Funktionsgraphen der Fuzzy- Menge nach Maximumsbildung ergibt sich E.361). c) Für alle anderen 17 Regeln ergibt sich ein Erfüllungsgrad Null für die Prämisse, d h. sie liefern Fuzzy-Mengen, die selbst Null sind. 4. Defuzzifizierung Die Entscheidungslogik liefert keinen scharfen Wert für den Stellwert, sondern eine Fuzzy-Menge D.h., mit der Methode erhält man eine Abbildung, die jedem Tupel (xi, ., xn) G Xi x X2 x • • • x Xn von Meßwerten die Fuzzy-Menge A4?"'^ von Y zuordnet. Defuzzifizierung bedeutet, daß ein Stellwert berechnet werden muß. Die Schwerpunktsmethode und die Maximum-Kriterium-Methode liefern als Stellgröße die Werte F = 3,95 bzw. F = 5,0 5. Bemerkungen 1. Die „wissensbasierte" Trajektorie soll so in der Regelbasis verlaufen, daß der Endpunkt im Zentrum geringster Regelabweichung liegt 2. Durch die Defuzzifizierung wird ein Iterationsprozeß eingeleitet, der letztlich in die Mitte der Regelfläche führt, d h die Stellgröße Null liefert. 3. Jedes nicht lineare Kennfeld kann durch Wahl geeigneter Parameter beliebig genau approximiert werden. 0 - 1 für 3,5 < y < 4, für 4 < y < 6, "zy für 6 < y < 7,5, für sonst
392 5. Algebra und Diskrete Mathematik 22.5 36 9 15.2.2511-5 ö a) positiv klein b) 2.5 F c) positiv klein max-Operation 2.25 e d) positiv mittel e) etwa Null f) positiv mittel Abbildung 5.78 I F g) Stellgröße 5.9.6.4 Wissensbasiertes Interpolationssystem 1. Interpolationsmechanismen Mit Hilfe der Fuzzy-Logik lassen sich Interpolationsmechanismen aufbauen. Fuzzy-Systeme sind Systeme zur Verarbeitung unscharfer Informationen, mit ihnen lassen sich Funktionen approximieren und interpolieren. Ein einfaches Fuzzy-System, an dem diese Eigenschaften untersucht wurden, ist der SuGENO-Controller. Er besitzt n Eingangsvariable £i,. , £n und bestimmt den Wert der Ausgangsvariablen y durch Regeln Ri,..., Rn der Form R, • WENN & ist 40 und • • • und £n ist^0, DANN ist y = /<(&,.. , fn) (i = 1,2, ., n) E 362) Die Fuzzy-Sets Aj, ., Aj partitionieren dabei jeweils die Eingabenmenge Xj . Die Konklusionen /i(£i, • • •»Cn) der Regeln sind Singletons, die von den Eingabevariablen £i,..., £n abhängen können Durch die einfache Wahl der Konklusionen kann auf eine aufwendige Defuzzifizierung verzichtet werden und der Ausgangswert y als gewichtete Summe berechnet werden. Dazu berechnet der Controller für jede Regel R^ mit einer £-Norm aus den Zugehörigkeitsgraden der einzelnen Eingaben einen Erfullungs- grad oh und bestimmt den Ausgangswert zu E£Li<* E 363) 2. Einschränkung für den eindimensionalen Fall Bei Fuzzy-Systemen mit nur einer Eingabe x = £i werden oft Fuzzy-Mengen verwendet, die durch Dreieckfunktionen dargestellt, die sich auf der Höhe 0,5 schneiden werden. Solche Fuzzy-Mengen genügen drei Bedigungen: 1. Für jede Regel 1^ gibt es eine Eingabe Xi, für die nur eine Regel erfüllt ist. Für diese Eingabe
5.9 Fuzzy-Logik 393 Xi wird die Ausgabe über fi berechnet Dadurch ist die Ausgabe des Fuzzy-Systems an N Stützstellen x\, ,xN festgelegt Man kann daher sagen, das Fuzzy-System interpoliert die Stützstellen Xi,. ,xn Die Forderung, daß an den Stützstellen X{ nur die eine Regel R^ gilt, ist für eine exakte Interpolation hinreichend, aber nicht notwendig. Für zwei Regeln Ri und R2, wie sie im folgenden betrachtet werden, bedeutet diese Forderung, daß ai(x2) = ot2(x{) = 0gilt Zur Erfüllung der 1 Bedingung muß ai(x2) = »2C:1) = 0 sein Das ist eine hinreichende Bedingung für eine exakte Interpolation der Stützstellen 2. Zwischen zwei aufeinanderfolgenden Stutzstellen sind höchstens 2 Regeln erfüllt. Sind X\ und x2 zwei solche Stützstellen mit den Regeln Ri und R2 , so berechnet sich für Eingaben x € [rci, x2] die Ausgabe yzu y = = /1 + g(h - h) E 364 üfi -I- a2 Oi2 mit von x abhängigen fi,f2,ai und a2 sowie g •= . ot\ + a2 Der eigentliche Verlauf der Interpolationskurve zwischen x\ und x2 wird von der Funktion g bestimmt Diese wird daher als Kurvenverlauf bezeichnet. Sie hängt nur von den Erfüllungsgraden a\ und a2 ab, die sich als Werte der Zugehörigkeitsfunktionen /i^(i) und ßAB) an der Stelle x ergeben, d.h., es ist ai — A^wO^) un<^ a2 — f^A^i00) j °der kurz ai = Vifa) und »2 — ^(x) Der Kurvenverlauf hängt nur vom Verhältnis ßi/ß2 der Zugehörigkeitsfunktionen ab. 3. Die Zugehörigkeitsfunktionen sind positiv, so daß die Ausgabe y eine Konvexkombination der Konklusionen fi ist. Daher gilt: min(/i, f2) <y < max(/i, /2) E 365) bzw. für den allgemeinen Fall min fi<y< max fi. ' E 366) i=l,2, ,N i=l,2, ,N Für konstante Konklusionen bewirken die Terme /1 und f2 lediglich eine Verschiebung und Streckung des Kurvenverlaufes g Sind die Konklusionen von den Eingangsvariablen abhängig, dann wird der Kurvenverlauf in verschiedenen Abschnitten unterschiedlich verzerrt Dadurch kann sich eine andere Ausgangsfunktion ergeben. Verwendet man für die Eingabe x linear abhängige Konklusionen und Zugehörigkeitsfunktionen mit konstanter Summe, dann ist die Ausgabe y = cJ2iL\ onfi(x) mit von x abhängigen c^ und einer Konstanten c, so daß sich Polynome 2. Ordnung als Interpolationsfunktionen ergeben Diese Polynome kann man zur Konstruktion eines'Interpolationsverfahrens mit Polynomen 2. Ordnung verwenden. Allgemein ergibt sich aus der Wahl von Polynomen n-ter Ordnung als Konklusion ein Interpolationspolynom (n+ l)-ter Ordnung Daher können die konventionellen Interpolationsverfahren, die lokal mit Polynomen interpolieren (beispielsweise mit Splines), auch mit diesen Fuzzy-Systemen durchgeführt werden
394 6 Differentialrechnung 6 Differentialrechnung 6.1 Differentiation von Funktionen einer Veränderlichen 6.1.1 Differentialquotient 1. Differentialquotient oder Ableitung einer Funktion Die Ableitung einer Funktion y = f(x) du df ix) ist eine neue Funktion von x, die mit den Symbolen y', y, Dy, — , f'(x), Df(x) oder —-— gekenn- dx dx zeichnet wird und die für jeden Wert von x gleich dem Grenzwert des Quotienten aus dem Zuwachs der Funktion Ay und dem entsprechenden Zuwachs Ax für Ax —¦> 0 ist* fjx + As) - f{x) f'ix)= lim Ax F.1) 2. Geometrische Bedeutung der Ableitung Wenn y = f(x) wie in Abb.6.1 als Kurve in kartesischen Koordinaten dargestellt ist und'die x- sowie die y-Achse den gleichen Maßstab haben, dann ist f'(x) = ta,na F 2) Der Winkel a zwischen der s-Achse und der Tangente an die Kurve in dem betreffenden Punkt bestimmt die Steigung der Tangente (s 3 6 1.2,2.,4. S 234). Der Winkel wird von der positiven z-Achse zur Tangente im entgegengesetzten Drehsinn des Uhrzeigers gemessen und als Tangentenneigungswinkel bezeichnet 3. Differenzier bar keit Die Existenz der Ableitung einer Funktion f(x) für die Werte der Variablen x ist gegeben, wenn für diese Werte der Differentialquotient F.1) einen endlichen Wert besitzt Existiert in einem Punkt x keine Ableitung, dann hat die Kurve in dem betreffenden Punkt entweder keine bestimmte Tangente oder diese bildet mit der x-Achse einen rechten Winkel. Im zweiten Falle ist der Grenzwert F.1) unendlich. Man benutzt für diesen Sachverhalt die Schreibweise f'(x) = +oo bzw. /'(*) =-oo. Abbildung 6 1 A: f{x) = tfx- ¦ fix) 3^ (Abb.6.2a), d.h., sie existiert nicht. 1 b) c) Abbildung 6 2 , f(Ö) = oo Im Punkt 0 geht die Ableitung gegen unendlich B: fix) = xsin- , /(O) = 0: An der Stelle x = 0 existiert kein Grenzwert der Art F.1) (Abb.6.2b) x
6.1 Differentiation von Funktionen einer Veränderlichen 395 4. Links- und rechtsseitige Ableitung Wenn für einen Wert x — a der Grenzwert F 1) nicht existiert, dafür aber der links- bzw. rechtsseitige Grenzwert, dann wird dieser Grenzwert links- bzw. rechtsseitige Ableitung genannt Da die Kurve an der Stelle zwei Tangenten mit den Steigungen f'(a -0) = tan ax, f'(a + 0) = tan a2 F 3) besitzt, kennzeichnen die beiden Ableitungen, geometrisch gesehen, einen Knick der Kurve (Abb.6.2c, Abb.6.3). a « x x Abbildung 6.3 ¦ f(x) = r , /@) = 0: An der Stelle x = 0 existiert kein 1 + e* Grenzwert der Art F.1), jedoch gibt es einen linksseitigen und einen rechtsseitigen Grenzwert /'(—0) = 1 und /'(+0) = 0, d h., die Kurve besitzt hier einen Knick (Abb.6.2c). 6.1.2 Differentiationsregeln für Funktionen einer Veränderlicher 6.1.2.1 Ableitungen elementarer Funktionen Die elementaren Funktionen besitzen im gesamten Definitionsbereich eine Ableitung, ausgenommen einzelne Punkte, in denen solche Fälle auftreten können, wie sie in Abb.6.2 dargestellt sind. Eine Zusammenstellung der Ableitungen der elementaren Funktionen enthält Tabelle 6.1. Weitere Ableitungen elementarer Funktionen können aus der Umkehrung der Integrationsergebnisse in Tabelle 8.1 der unbestimmten Integrale gewonnen werden. Hinweis: Bei der Lösung praktischer Aufgaben ist es zweckmäßig, vor dem Differenzieren einer Funktion diese, sofern das möglich ist, in eine Summe umzuformen, indem Klammerausdrücke aufgelöst (s. 1.1 6.1, S. 11) und ganzrationale Teile abgespaltet werden (s 1.1.7, S. 14) oder der Ausdruck loga- rithmiert (s 1.1.4.3, S 9) wird usw r- 9 12 3 5 2-3A/i + 4^ + s2 2 .-9^,-0^ dy _2 3 -z 8-« ¦ A: y = = Sx 1 + 4x o + x; — = -2x + -x * — -x o+l. xx dx 2 3 _ _ . x2 +1 1 w o ^ ! i / 2 ix dy l ( 2x \ 1 / 2x \ 2x ¦B^ = l-V^ = 2ln(*+1)-2ln(*-1); J = 2(^Tt)-2(^t) = -^T 6.1.2.2 Grundregeln für das Differenzieren Im folgenden sind u,v,w und y Funktionen der unabhängigen Veränderlichen x und w', v', w' und y' die Ableitungen dieser Funktionen nach x Mit du, dv, dw und dy werden die Differentiale bezeichnet (s. 6.2 1.3, S. 408). Die Grundregeln für das Differenzieren, die anschließend erläutert werden, findet man zusammengefaßt in Tabelle 6.2, S 400. 1. Konstantenregel Die Ableitung einer Konstanten c ist gleich Null. d = 0. F.4) 2. Faktorregel Ein konstanter Faktor c kann vor das Differentiationssymbol gezogen werden* (cm)' = cu', d(cu) = cdu. F.5) 3. Summenregel Die Ableitung einer Summe oder Differenz von zwei oder mehreren Funktionen ist gleich der Summe oder Differenz der Ableitungen dieser Funktionen. (u + v — w)' = u' + v' — w\ F.6a) d(u + v — w) = du + dv — dw. F.6b)
396 6 Differentialrechnung Tabelle 6.1 Ableitungen elementarer Funktionen in Intervallen, in denen diese definiert und die auftretenden Nenner ^ 0 sind Funktion C (Konstante) X xn (n G R) 1 X 1 xn y/x V/x (n e R, n ^ 0, x > 0) ex ebx {beR) ax (a>0) abx (b e R, a > 0) Ina; logax (o > 0, a ^ 1, x > 0) \gx (x > 0) sinx cosx tana; (x ^ Bfc+l)|, k G Z) cota; (x 7^ /c7r, fc € Z) Ableitung 0 1 nrcn_1 1 n ,£71+1 1 1 n Vx71'* ex bebx ax\na babx\na 1 X 1 i x - ^ga e = —j x xina 1 0,4343 -Ige« X X cosx — sinx 1 _„cc2x COS2 X -1 2 —^— = — cosec x sin a: Funktion seca; cosec a; aresina; (\x\ < 1) arecosa; (|x| < 1) aretan x arecot x aresee x sinhx cosha; tanha: cotha; (x ^ 0) Arsinha; Arcosha; (x > 1) Artanha; (\x\ < 1) Arcotha; (|a:| > 1) [/(*)]» (n e R) ln/(x) (/(s)>0) Ableitung sina; cos2 x — cos x sin2 a: 1 Vi - x2 1 x/1 - x2 1 1 + a;2 1 1 + x2 1 aV#2 — 1 aVa;2 — 1 cosha; sinha; 1 cosh2 x 1 sinh2 x 1 yfl + x2 1 Va;2-1 1 1-a;2 1 a;2-l n[/W]n-7'W fix) 4. Produktregel Für die Ableitung eines Produkts aus zwei, drei oder n Funktionen gilt: a) Produktregel für zwei Funktionen: (u v)' — v! v + uv', d(u v) = vdu + udv F.7a)
6.1 Differentiation von Funktionen einer Veränderlichen 397 b) Produktregel für drei Funktionen: (uvw)' = uvw' + uv'w + u'vw , d(uvw) = uvdw + uwdv + vwdu. F 7b) a) Produktregel für n Funktionen: n (uiu2 • • • un)' = ^T uxu2 • • • u'i • • • un. F.7c) t=i ¦ A: y = x3 cos x, y' = 3x2 cos x - x3 sin x. ¦ B: y = x3ex cos x , y' = 3x2ex cos x + x3ex cos x — x3ex sin x . 5. Quotientenregel Die Ableitung des Quotienten zweier Funktionen wird nach der Formel (Quotientenregel) fu\' vu' — uv' (u\ vdu — udv t oN W =^~' AVv) = ^fi— F-8) unter der Voraussetzung v(x) 7^ 0 berechnet sinrr , (cos x) (sin x)' — (sin x) (cos x)' cos2 x 4- sin2 x 1 ¦ y = tan x = , y = — — cos x ' cos2 x cos2 x cos2 x ' 6. Kettenregel Die mittelbare Funktion (s. S. 61) y = u(v(x)) hat die Ableitung wobei die Funktionen u = u(v) und v = v(x) differenzierbare Funktionen bezuglich ihrer Argumente darstellen. Man bezeichnet u(v) als äußere und v(x) als innere Funktion und dementsprechend — als dv äußere Ableitung und — als innere Ableitung. Analog verfährt man, wenn die „Kette" aus einer größeren Anzahl von Funktionen mit den entsprechenden Zwischenveränderlichen besteht. So gilt z.B. für y = u(v(w(x))). , dy du dv dw y = u(v(W(x))), ,=_ = ___. F.10) ¦ A:, = ^, j» = d(;S1^ <fX) d{STX) = <***2 sinxcosx ^ d(sin2xj a(sina;) cfo j fptan y/x\ ¦ B: y = etan^; ^ = —* ) djtsmy/x) d{^x) = ^any^ 1 * da; (i (tan ^/i) d (y^) cfa; cos2 y^ 2y^ 7. Logarithmische Differentiation Im Falle von y(x) > 0 kann man zur Berechnung der Ableitung y' von der Funktion In 2/B;) ausgehen, für deren Ableitung (unter Berücksichtigung der Kettenregel) gilt: d(lny(x))= 1 (ix 3/B;)y V ; Daraus folgt unmittelbar * = «*)^. F-12)
398 6. Differentialrechnung Hinweis 1: Mit Hilfe der logarithmischen Differentiation lassen sich viele Differentiationsaufgaben wesentlich vereinfachen bzw. überhaupt erst durchführen. Letzteres trifft z.B. auf Punktionen der Form y = u(x)vW mit u(x) > 0 F 13) zu Die logarithmische Differentiation dieser Gleichung ergibt gemäß F 12) y=y^r- = y^^ = u{vlnu+-) F14) y' 3x - 2 ¦ y= Bx + lKa;, lny = 3zlnBx + l), - = 31nBx + 1) + -; y> = 3Bx + lKx (\nBx + l) + ^v Hinweis 2: Die logarithmische Differentiation wird häufig angewendet, wenn ein Produkt von Funktionen zu differenzieren ist. 1, ¦ A: y = \/x3e4x sin x , In y — - C In x + \x + In sin x), v' 1/3 , cosx\ , 1 >—=—;—:—/3 , \ — = - ( - + 4 H , y — -vx3eAx sin x [ - + 4 + cot sc) y 2 \x sinxj 2 \x J y' l i ¦ B: 7/ = Mu , In w = In u + In v , — = —i/ + -v' Daraus folgt y' = (uv)' = vu' + uv'. Man erhält y u v die Produktregel F 7a) u 2/1,1, , /uV u' ui/ vu' -uv' m d y = — , In w = In tt — In u , — = —w v . Daraus folgt y — ( — 1 = 5- = 0 t> y u v \vj v vl vl Man erhält die Quotientenregel F.8). 8. Ableitung der inversen Funktion Wenn y — tp(x) die inverse Punktion zur ursprünglichen Funktion y = f(x) ist, dann gilt. Die beiden Darstellungen y — f(x) und x = <p(y) sind äquivalent Unter der Voraussetzung ip'(y) ^ 0 besteht dann die folgende Beziehung zwischen den Ableitungen einer Funktion / und ihrer Umkehrfunktion ip: /'(X) = _L bzw ^- = 4-- F-15) J v ' ip'(y) dx dx_ v > dy ¦ Die Funktion y = f{x) = aresinx ist für — 1 < x < 1 der Funktion x = (p(y) = siny mit — tt/2 < y < 7r/2 äquivalent Aus F 15) folgt dann (aresin x)' = — = = , = = , , da cos y ^ 0 für — tt/2 < y < ir/2 K ) (siny)' cos?/ Ji-stfy v7!^^ ' ' 9. Ableitung einer impliziten Funktion Eine Funktion y = f(x) sei implizit durch die Gleichung F(x, y) = 0 gegeben Unter Beachtung der Differentiationsregeln für Funktionen mehrerer Veränderlicher (s. 6.2, S. 408) erhält man durch Differentiation nach x 8F f)F F falls die parteile Ableitung Fy von Null verschieden ist x y ¦ Die Gleichung — + — = 1 einer Ellipse mit den Halbachsen a und b kann in der Form F(x,y) = a2 er
6.1 Differentiation von Funktionen einer Veränderlichen 399 0? b2 1 = 0 geschrieben werden. Für die Steigung der Tangente im Ellipsenpunkt (x,y) erhält man gemäß F.16) 2x y = ¦ I V 10. Ableitung einer Funktion in Parameterdarsteilung Wenn die Funktion y — f(x) in der Parameterform x = x(t), y = y{t) gegeben ist, dann läßt sich ihre Ableitung y' nach der Formel £-™-i F.17) dx über die Ableitungen y(t) = — und x(t) = —- nach dem Parameter t berechnen, falls x(t) ^ 0 gilt dt dt ¦ Polarkoordinatendarstellung: Ist eine Funktion in ihrer Polarkoordinatendarstellung (s. S. 196) p = p(<p) gegeben, dann lautet ihre Parameterdarstellung x ='p{(p) cos ip, y = p(cp) sin (p F.18) mit dem Winkel <p als Parameter. Für die Steigung der Tangente y' der Kurve (s 3.6 1.2,2.,4., S 234 oder 6 1 1,2., S. 394) gilt dann wegen F.17) p sin (p + p cos (p p cos ip — p sin (p mit p - F.19) Hinweise: 1. Die Ableitungen x, y sind die Komponenten des Tangentenvektors im Punkt {x(t), y(t)) der Kurve. 2. Häufig wird mit Vorteil die komplexe Zusammenfassung benutzt: x{t) + iy(t) = z(t), x{t) + iy{t) = z(t). F 20) eiu)t = rue^ut + 2). Der Tangenten- ¦ Kreisbewegung: z(i) = reluJ (r,o;const), z(t) = riue" vektor läuft dem Ortsvektor um ir/2 phasenverschoben voraus. 11. Graphische Differentiation Wenn eine differenzierbare Funktion y = f(x) durch ihre Kurve T in kartesischen Koordinaten in einem Intervall a < x < b dargestellt ist, kann die Kurve T' ihrer Ableitung näherungsweise konstruiert werden Die Konstruktion einer Tangente in einem gegebenen Kurvenpunkt nach Augenmaß kann recht ungenau ausfallen. Wenn aber die Richtung der Tangente MN (Abb.6.4) bekannt ist, kann der Berührungspunkt A genauer ermittelt werden. a) Konstruktion des Berührungspunktes einer Tangente Parallel zur gegebenen Tangentenrichtung MN werden zwei Sehnen M\Ni und M2N2 so eingezeichnet, daß die Kurve in nicht weit voneinander liegenden Punkten geschnitten wird. Danach werden die Mittelpunkte der Sehnen ermittelt und durch diese eine Gerade PQ gezogen, die die Kurve im Punkt A schneidet, in dem die Tangente näherungsweise die vorgegebene Richtung MN hat. Um die Genauigkeit zu überprüfen, kann eine dritte parallele Sehne in geringem Abstand von den ersten beiden eingetragen werden, die von der Geraden PQ im Mittelpunkt geschnitten werden muß b) Konstruktion der Kurve einer abgeleiteten Funktion 1. Vorgabe einiger Richtungen h,l2,--Jn, die den Tangentenrichtungen der Kurve y = f(x) in dem betrachteten Intervall entsprechen sollen (Abb.6.5), und Ermittlung der dazugehörigen Berührungspunkte Ai, A<i,.. ,A„, nach dem unter a) beschriebenen Verfahren, wobei die Tangenten selbst nicht konstruiert werden müssen. Abbildung 6.4
400 6. Differentialrechnung Tabelle 6.2 Differentiationsregeln Regel Konstantenregel Faktorregel Summenregel Produktregel für zwei Funktionen Produktregel für n Funktionen Quotientenregel Kettenregel für zwei Funktionen Kettenregel für drei Funktionen Potenzregel Logarithmische Differentiation Differentiation der Umkehrfunktion Implizite Differentiation Ableitung in Parameterdarstellung Ableitung in Polarkoordinaten Formel für die Ableitung d = 0 (c const) (cu)' = cu' (c const) (u ± v)' = u' ±v' (uv)' = u'v + uv' n (u\u2 • • • uny = J2 u\ • • • u\ • • • un t=l fuV vu'-uv' f du dv y = u{v(x)) ,=-- / , / vxv , du dv dw y = uivlwlx))). y — ——: — y K v v >,} y dv dw dx (ua)f = aua~lu' (a € R, a ^ 0) /1 \' u' speziell ( — ) = —- (u ^ 0) \uj u2 d(hiy(x)) 1 , dQny) —i = -y => y = y—i— dx y dx , ( vu'\ speziell (uv) = uv \v' In u H (u > 0) V u ) ip inverse Funktion zu / , d h. y = f(x) <*=*> x = tp(y) : dy F(x, y) = 0: Fx + Fy y1 = 0 oder ,,-_£ (F-W F-dJl. F^0) V Fy \tx dx ' ty dy ' tyt") x = x(t), y = y{t) (t Parameter) , _ dy _y (x-dx ¦ -dy\ V dx x \dt'y dt) p = p(ip): ~ (\ ' (Winkel <p als Parameter) ; dy p sin (p + p cos (p ( dp\ dx p cos (p — p sin tp \ dipj 2. Wahl eines Punktes P, eines „Pols", auf der negativen x-Achse, wobei die Strecke PO — a um so größer sein soll, je flacher die Kurve ist.
6.1 Differentiation von Funktionen einer Veränderlichen 401 Abbildung 6.5 3. Einzeichnen von Geraden, die parallel zu den Richtungen h,l2,... bzw. ln verlaufen, durch den Pol P hindurchgehen und die y-Achse in den Punkten i?i, B2, • • • bzw. Bn schneiden. 4. Konstruktion horizontaler Geraden B\C\,B2C2, ... ,BnCn von den Punkten B\,B2,...,Bn aus bis zu den Schnittpunkten Ci,C2,.. , Cn mit den aus den Punkten Ai,A2, .., An gefällten Loten. 5. Verbinden der Punkte Ci,C2,. . ,Cn mit Hilfe eines Kurvenlineals durch eine Kurve, die der Gleichung y = af'(x) genügt. Wenn die Strecke a so gewählt wird, daß sie der Längeneinheit auf der y-Achse entspricht, ist die gewonnene Kurve die der gesuchten Ableitung. Ist das nicht der Fall, dann sind die gefundenen Ordinaten C\, C2,. ., Cn der Ableitung mit dem Faktor - zu multiplizieren. a Die sich so ergebenden Punkte D\,D2,... ,Dn in Abb.6.5 liegen auf der maßstabsgerechten Ableitungskurve r;. 6.1.3 Ableitungen höherer Ordnung 6.1.3.1 Definition der Ableitungen höherer Ordnung Die Ableitung von y' — f(x), also (y')' oder — I — I , wird als zweite Ableitung der Funktion y = d2y d2f(x) fix) mit y'\ y, —-, fix) oder ——r— bezeichnet. Analog werden die Ableitungen höherer Ordnung dxz dxz definiert. Bezeichnungen für die n-te Ableitung der Funktion y = f(x) sind: „(») - dx I = f{n)(*) = dnf(x) dxn (n = 0,l,...;yW(x) = fM(x) = f(x)) F.21) 6.1.3.2 Ableitungen höherer Ordnung der einfachsten Funktionen In Tabelle 6.3 sind die n-ten Ableitungen für die einfachsten Funktionen zusammengestellt. 6.1.3.3 Leibnizsche Regel Zur Berechnung der Ableitung n-ter Ordnung für ein Produkt aus zwei Funktionen kann die Leib- Nizsche Regel Dn(uv) =uDnv+y]Du Dn~lv + ^ ^ D2u Dn~2v + • • • + n(n-l). .{n-m + l)DmuDn_mv + _ + ^ m\ dn F.22) benutzt werden Dabei ist D^ = — . Wenn D°u durch u und D°v durch v ersetzt werden, dann erhält dx man die Formel F 23), die in ihrer Struktur dem Binomischen Satz entspricht (s. 1 1.6.4, S. 12). Dn{uv) = JT (n)DmuDn-mv. m=0 \m/ F.23)
402 6 Differentialrechnung ¦ A: (x2 cos ax)E0K Setzt man v = x2, u = cos ax , dann ergibt sich u^ = ak cos (ax + k\ J , u' = 2x, v" = 2, i/" = i/4) = • • • = 0 Mit Ausnahme der ersten drei sind alle Summanden gleich 0, so daß (HE0) = ^5° cos (ax + 50f) + y • 2xa49 cos (ax + 490 + ^y ' 2a* = a48[B450 — a2x2) cosax — lOOazsinax] cos ax + 48- B: (rV)F) = • xV + rVsxV + rj'^^ + u)-6^ Tabelle 6 3 Ableitungen höherer Ordnung einiger elementarer Funktionen Funktion xm lux loga£ ekx ax akx sinx cosa; sinkx coskx sinhx coshrr n-te Ableitung m(m — l)(ra — 2)... (ra — n + l)xm-n (für ganzzahliges m und n > ra ist die n-te Ableitung gleich 0) (-l)-'(n -1)|1 Ina xn ^.rigfca; (In a)nax (fc In a)nafcx sin(:r + —) cos(x + —) IT, . /I n7rN «nsin(A;a: 4- —) Ärcos(/c:r H ) sinh x für gerades n, cosh .t für ungerades n cosh x für gerades n, sinh x für ungerades n 6.1.3.4 Höhere Ableitungen von Funktionen in Parameterdarstellung Wenn die Funktion y = f(x) in der Parameterform x = x(t), y = y(t) gegeben ist, dann lassen sich ihre Ableitungen höherer Ordnung (y" , y'" usw ) nach den folgenden Formeln berechnen, wobei / \ dy i \ dx . d2y d?x _, wm = — , zm = — , yyt) = -—r , x = -—- usw die Ableitungen nach dem Parameter t bedeuten yw dt K J dt yK } dt2' dt2 B d2y xy — yx dx2 x3 dx3 ¦3xxy+Syx2 — xyx F 24) Voraussetzung ist, daß x(t) ^ 0 gilt. 6.1.3.5 Ableitungen höherer Ordnung der inversen Funktion Wenn y = ip(x) die inverse Funktion zur ursprünglichen Funktion y = f(x) ist, dann gilt. Die beiden Darstellungen y = f(x) und x = (p(y) sind äquivalent Unter der Voraussetzung tp'(y) ^ 0 besteht dann die Beziehung F.15) zwischen den Ableitungen einer Funktion / und ihrer Umkehrfunktion (p.
6 1 Differentiation von Funkhonen einer Veränderlichen 403 Für höhere Ableitungen (y" , y' d2y = <p"{y) d3y _ dx2 [^'(y)]3' dxs ' usw.) erhält man W(y)]2-^(yW"(y) W{y)f F.25) 6.1.4 Hauptsätze der Differentialrechnung 6.1.4.1 Monotoniebedingungen Wenn eine Funktion f(x) in einem zusammenhängenden Intervall definiert und stetig ist und wenn sie in allen inneren Punkten dieses Intervalls eine Ableitung besitzt, dann ist für die Monotonie der Funktion die Bedingung f'(x) > 0 für eine monoton wachsende Funktion, F 26a) f(x) < 0 für eine monoton fallende Funktion F.26b) notwendig und hinreichend Wird gefordert, daß die Funktion im strengen Sinne monoton wachsend oder fallend sein soll, dann darf zusätzlich die Ableitung f'(x) in keinem Teilintervall des oben angegebenen Intervalls identisch verschwinden In Abb.6.6b ist diese Bedingung auf der Strecke BC nicht erfüllt Die geometrische Deutung der Monotoniebedingung ergibt sich daraus, daß die Kurve einer monoton wachsenden Funktion mit wachsendem Argumentwert an keiner Stelle fällt, d h , daß sie entweder steigt oder horizontal verläuft (Abb.6.6a) Daher bildet die Tangente in den einzelnen Kurvenpunkten mit der positiven x- Achse entweder einen spitzen Winkel oder sie verläuft parallel zu ihr Für die monoton fallenden Funktion (Abb.6.6b) gilt eine analoge Aussage. Ist die Funktion im strengen Sinne monoton, dann kann die Tangente nur in einzelnen Punkten parallel zur x-Achse verlaufen, z B im Punkt A in Abb.6.6a, jedoch nicht in einem ganzen Teilintervall, wie BC in Abb.6.6b. ' 0 fr. y< -- 0 i s B C x Kot^ x X b) Abbildung 6.6 y 0 i » c i _V»i/__ X B Abbildung 6 7 6.1.4.2 Satz von Fermat Wenn eine Funktion y = f(x) in einem zusammenhängenden Intervall definiert ist und in irgendeinem inneren Punkt x = c dieses Intervalls ihren größten oder kleinsten Wert besitzt (Abb.6.7), d.h., wenn für alle x dieses Intervalls gilt M > fix) F 27a) oder /(c) </(*), F 27b) und wenn darüber hinaus ihre Ableitung im Punkt c existiert, dann kann diese dort nur gleich Null sein /'(c) = 0. F.27c) Die geometrische Bedeutung des Satzes von Fermat besteht darin, daß eine Funktion, die den Satz erfüllt, in den Punkten A und B der Funktionskurve parallel zur x -Achse verlaufende Tangenten besitzt (Abb.6.7) Der Satz von FERMAT stellt aber lediglich eine notwendige Bedingung für die Existenz eines Maximal-
404 6. Differentialrechnung oder Minimalwertes einer Funktion in einem Intervall dar. Aus Abb.6.6a erkennt man, daß die Bedingung nicht hinreichend ist: Im Punkt A ist zwar }'{x) — 0 erfüllt, aber es gibt weder einen Maximal- noch einen Minimalwert an der Stelle. Auch die Bedingung der Differenzierbarkeit im Satz von Fermat ist wesentlich. So hat die Funktion im Punkt E von Abb.6.8d zwar einen Maximalwert, die Ableitung existiert dort aber nicht 6.1.4.3 Satz von Rolle Wenn eine Funktion y = f(x) in einem abgeschlossenen Intervall [a, b] stetig ist, wenigstens in dem offenen Intervall (a, b) eine Ableitung besitzt und in den Endwerten des Intervalls den Wert Null annimmt, d h., wenn /(a) = 0, f(b) = 0 (a<b) F.28a) ist, dann existiert mindestens ein Wert c zwischen a und b derart, daß gilt f'(c) = 0 (a < c < b) F 28b) Die geometrische Bedeutung des Satzes von Rolle besteht darin, daß eine Funktion y = f(x), die die x-Achse in zwei Punkten A und B schneidet, in diesem Intervall stetig ist, und in jedem inneren Punkt eine nichtvertikale Tangente besitzt, zwischen A und B wenigstens einen Punkt C hat, in dem die Kurventangente parallel zur rr-Achse verläuft (Abb.6.8a). y 0 A/d / B/. f- c) Abbildung 6 8 Es kann auch mehrere derartige Punkte in dem Intervall geben, z.B. die Punkte C, D und E in Abb.6.8b. Daß die Forderung nach Stetigkeit und Existenz einer Ableitung in dem Intervall wesentlich ist, kann an Hand von Abb.6.8c erkannt werden, wo die Funktion bei x = d eine Unstetigkeitsstelle besitzt, und an Hand von Abb.6.8d, wo die Funktion im Punkt x — e keine Ableitung besitzt. In beiden Fällen gibt es keinen Punkt C, in dem f'(x) = 0 gilt. 6.1.4.4 Mittelwertsatz der Differentialrechnung Wenn eine Funktion y = f(x) in einem abgeschlossenen Intervall [a, b] stetig ist und im Innern eine Ableitung besitzt, dann existiert zwischen a und b wenigstens eine Zahl c derart, daß gilt f(b)-f(a) ¦¦ f'{c) {a<c<b) F 29a) b — a Setzt man b = a + h und bezeichnet mit 0 eine zwischen 0 und 1 liegende Zahl, dann lautet der Satz in anderer Schreibweise f(a + h) = f(a) + h f(a + 0h) @ < 0 < 1) F.29b) 1. Geometrische Bedeutung Die geometrische Bedeutung a c b x des Satzes besteht darin, daß eine Funktion y = f(x), die zwi- Abbildung 6 9 sehen den Punkten A und B (Abb.6.9) stetig ist und in jedem Punkt eine nicht vertikale Tangente besitzt, wenigstens einen Kurvenpunkt C hat, in dem die Kurventangente parallel zur Sehne AB liegt. Es kann auch mehrere solcher Punkte geben (Abb.6.8b). Daß die
6 1 Differentiation von Funktionen einer Veränderlichen 405 Forderung nach Stetigkeit der Funktion und Existenz ihrer Ableitung wesentlich ist, kann an Hand von Beispielen gezeigt werden, die solche Kurvenverläufe ergeben, wie sie in den Abb.6.8c,d dargestellt sind 2. Anwendungen Für den Mittelwertsatz der Differentialrechnung gibt es vielfältige Anwendungs- möglichkeiten. ¦ A: Eine Anwendung betrifft die Abschätzung von Fehlern gemäß \f(b)-f(a)\<K\b-a\, F.30) wobei K eine für alle x in dem Intervall [a, b] gültige obere Schranke von |/'(a;)| ist. ¦ B: Mit welcher Genauigkeit kann f(n) = höchstens angegeben werden, wenn für tt der 1 + 7rz 2c A + c2J |7T-7f| < 0,053-0,0016: gerundete Wert ir = 3,14 eingesetzt wird7 Es gilt |/Gr)-/Gr)| = 0,000 085, so daß T-i-^ = 0,092 084 ± 0,000 085. 1 + 7T 6.1.4.5 Satz von Taylor für Funktionen von einer Veränderlichen Wenn eine Funktion y = f(x) im Intervall [a, a+h] stetig ist und dort stetige Ableitungen bis einschließlich der Ordnung n — \ besitzt und wenn im Innern des Intervalls noch die n-te Ableitung existiert, dann gilt die TAYLORsche Formel oder TAYLOR-Entwicklung f(a + h) = f(a) + £/'(a) + £/» + • • • + (f^/*"""» + £/<»>(« + 9h) F.31) mit 0 < O < 1 Die Größe h kann positiv oder negativ sein. Der Mittelwertsatz der Differentialrechnung F 29b) ist ein Spezialfall dieser TAYLOR-Formel für n = 1 6.1.4.6 Verallgemeinerter Mittelwertsatz der Differentialrechnung Wenn zwei Funktionen y = f(x) und y = (p(x) in einem abgeschlossenen Intervall [a, b] stetig sind und wenigstens im Innern Ableitungen besitzen, wobei <p'(x) an keiner Stelle des Intervalls verschwinden darf, dann existiert zwischen a und b wenigstens eine Zahl c derart, daß die Gleichung gilt f(b) - f(a) f'(c) —— 7— = -—- (a < c < b) F.32) <p(b) - tp(a) iff(c) Die geometrische Bedeutung des verallgemeinerten Mittelwertsatzes entspricht der des gewöhnlichen Mittelwertsatzes. Geht man z B davon aus, daß die Kurve in Abb.6.9 in der Parameterform x = ^M 5 V — /M gegeben ist, wobei die Punkte A und B den Parameterwerten t = a bzw. t = b entsprechen sollen, dann gilt für den Punkt C tfln„ /(*)-/(*) /'W /ßW tan öl = —— — = —— F.33) <P(P) - ip{a) <f/(c) Für ip(x) = x geht der verallgemeinerte Mittelwertsatz in den gewöhnlichen Mittelwertsatz über 6.1.5 Bestimmung von Extremwerten und Wendepunkten 6.1.5.1 Maxima und Minima Unter relativen oder lokalen Extremwerten versteht man die relativen Maxima und Minima einer Funktion. Relatives Maximum (M) bzw relatives Minimum (m) einer Funktion f(x) werden solche Funktionswerte f(xo) genannt, die die Ungleichungen f(x0 + h) < f{xo) (für das Maximum), F.34a) f(x0 + h) > f(x0) (für das Minimum) F.34b) erfüllen, wobei für h beliebig kleine positive oder negative Werte eingesetzt werden können. Im relativen Maximum sind die Werte f(x0) größer als alle benachbarten Funktionswerte und entsprechend im
406 6. Differentialrechnung Minimum kleiner. Den größten bzw. kleinsten Wert, den eine Funktion in einem Intervall annehmen kann, bezeichnet man als ihr globales oder absolutes Maximum bzw. globales oder absolutes Minimum in bezug auf dieses Intervall 6.1.5.2 Notwendige Bedingung für die Existenz eines relativen Extremwertes Ein relatives Maximum oder Minimum kann bei einer stetigen Funktion nur in den Punkten auftreten, in denen die Ableitung entweder verschwindet oder nicht definiert ist. Das bedeutet In den Kurvenpunkten, die relativen Extremwerten entsprechen, verläuft die Tangente entweder parallel zur x-Achse (Abb.6.10a) oder parallel zur y-Achse (Abb.6.10b) oder sie existiert gar nicht (Abb.6.10c) Allerdings handelt es sich hierbei nicht um hinreichende Bedingungen, was an Hand der Punkte A, B, C in Abb.6.11 erkennbar ist, für die diese Bedingungen erfüllt sind, in denen es aber keine Extrema gibt /h Abbildung 6.10 Wenn eine stetige Funktion relative Extremwerte besitzt, dann wechseln Maxima und Minima einander ab, so daß zwischen zwei benachbarten Maxima stets ein Minimum liegt und umgekehrt 6.1.5.3 Relative Extremwerte einer differenzierbaren, explizit gegebenen Funktion y = f (x) 1. Ermittlung der Extrempunkte Da diese die notwendige Bedingung f'(x) = 0 erfüllen, werden nach der Berechnung der Ableitung f'(x) alle reellen Wurzeln Xi, X2, , Xi,..., xn der Gleichung f'(x) = 0 bestimmt und jede von ihnen, z.B. x», mit einer der folgenden Me- Abbildung 6.11 thoden untersucht. 2. Methode des Vorzeichenvergleichs Für je einen Wert X- bzw x+ , der etwas kleiner bzw. etwas größer als Xi ist, wird das Vorzeichen der Ableitung f'{x) festgestellt, wobei zwischen Xi und x_ bzw. x+ keine weiteren Nullstellen von f'(x) liegen dürfen. Wenn beim Übergang von f'(xJ) zu f'(x+) das Vorzeichen von f'(x) von ,,+" nach „—"wechselt, dann befindet sich bei x = Xi ein relatives Maximum der Funktion f(x) (Abb.6.12a); wechselt es umgekehrt von ,,—" nach ,,+ ", dann liegt ein relatives Minimum vor (Abb.6.12b). Gibt es keinen Vorzeichenwechsel der Ableitung (Abb.6.12c,d), dann besitzt die Kurve bei x = Xi kein Extremum, sondern einen Wendepunkt mit einer zur x-Achse parallelen Tangente. 3. Methode der höheren Ableitungen Besitzt die Funktion an der Stelle x = xi höhere Ableitungen, dann wird jede Wurzel Xi in die zweite Ableitung f"(x) eingesetzt. Ist f"(xi) < 0, dann gibt es an der Stelle Xi ein relatives Maximum, ist f"(xi) > 0, ein relatives Minimum, ist f"{xi) = 0, dann wird Xi in die dritte Ableitung f'"(x) eingesetzt. Ergibt sich dabei f"'(xi) ^ 0, dann gibt es bei x = X\ kein Extremum, sondern einen Wendepunkt. Erhält man f"'(xi) = 0, dann ist in die vierte Ableitung einzusetzen usw.
6.1 Differentiation von Funktionen einer Veränderlichen 407 d) Abbildung 6.12 4. Weitere Bedingungen für Extremwerte und Wendepunkte Ist die Ordnung der Ableitung, die an der Stelle x = Xi erstmalig nicht verschwindet, gerade, dann besitzt f(x) dort ein relatives Extremum für einen negativen Wert ein relatives Maximum, für einen positiven ein relatives Minimum. Ist die Ordnung dieser Ableitung ungerade, dann besitzt die Funktion an dieser Stelle keinen Extremwert, sondern einen Wendepunkt. Die Methode des Vorzeichenvergleichs kann auch bei nichtexistierender Ableitung wie in Abb.6.10b,c und Abb.6.11 eingesetzt werden. Hinweis: Die Bestimmung der Extremwerte von nichtstetigen, manchmal auch von gewissen differenzierbaren Funktionen erfordert eine besondere Herangehensweise. Es kann vorkommen, daß eine Funktion ein Extremum bestitzt, so daß ihre erste Ableitung existiert und gleich Null ist, während die zweite Ableitung nicht existiert, oder, dass die erste Ableitung unendlich viele Wurzeln in einer beliebig kleinen Umgebung des betrachteten Punktes besitzt, so daß es sinnlos ist, davon zu sprechen sie würde hier ihr Vorzeichen ändern. Ein Beispiel ist die Funktion f(x) = x2B + sin(l/:c)) für x ^ 0 und /@) = 0 6.1.5.4 Bestimmung der globalen Extremwerte Das betreffende Intervall der unabhängigen Variablen wird in Teilintervalle zerlegt, in denen die Funktion differenzierbar ist. Die globalen Extremwerte sind dann unter den relativen Extremwerten der Teilintervalle und den Funktionswerten in den Randpunkten der Teilintervalle zu finden. Beispiele für Extremwertbestimmungen: ¦ A: y = e~x2, Intervall [-1, +1] Größter Wert bei x = 0 (Abb.6.13a). B: y = x3 1 1 + e* ¦ D: y = 2 - x% Ableitung) , Intervall [-1, +2]. Größter Wert bei x = +2 (Abb.6.13b, rechtes Intervallende) Intervall [-3, +3]. Größter Wert x = 0 ; Festlegung: y = 1 für x = 0 (Abb.6.13c). , Intervall [-1, +1]. Größter Wert bei x = 0 (Abb.6.13d, Maximum, unendliche y\ i * - 1/x 1+e rrii^^^ -3 0 t M, M2 3 x y=2- fy M c) d) Abbildung 6.13 6.1.5.5 Bestimmung der Extremwerte einer implizit gegebenen Funktion Wenn die Funktion in der impliziten Form F(x,y) = 0 gegeben ist und die Funktion F selbst sowie ihre partiellen Ableitungen Fx, Fy stetig sind, können die Maxima und Minima folgendermaßen bestimmt werden:
408 6. Differentialrechnung 1. Lösung des Gleichungssystems F(x, y) = 0, Fx(x, y) = 0 und Einsetzen der erhaltenen Werte (xi,yi),{x2,y2),".{xi,yi), in Fy und Fxx. 2. Vorzeichenvergleich für Fy und Fxx irn Punkt (#j, yi). Im Falle verschiedener Vorzeichen besitzt die Funktion y = f(x) bei Xi ein Minimum, im Falle gleicher Vorzeichen von Fy und Fxx besitzt sie ein Maximum bei X{. Wenn jedoch Fy oder Fxx in (x{, yi) verschwindet, dann ist die weitere Untersuchung komplizierter. 6.2 Differentiation von Funktionen von mehreren Veränderlichen 6.2.1 Partielle Ableitungen 6.2.1.1 Partielle Ableitung einer Funktion Partielle Ableitung einer Funktion u = /(xi, x2, ...,£*,..., xn) nach einer ihrer n Veränderlichen, z.B nach X\, heißt der durch du = /(a?i + Axi, x2, x3,..., gn) - f(xux2, x^..., xn) dxi Aifüo Aaii ' definierte Differentialquotient, der zum Ausdruck bringt, daß nur eine der n Variablen variiert, während die anderen n — 1 dabei als Konstante betrachtet werden Symbole für die partielle Ableitung sind TT- , ux. TT- , fx Von einer Funktion mit n Veränderlichen können n partielle Ableitungen erster ox ox 0ii ou du du Ordnung gebildet werden —— , —— , —— ,... , -— . Die Berechnung der partiellen Ableitungen er- OX\ OX2 OX3 OXn folgt nach den Regeln, die für die Differentiation von Funktionen von einer Veränderlichen bekannt sind x2y du 2xy du x2 du x2y z ' dx z ' dy z ' dz z2 6.2.1.2 Geometrische Bedeutung bei zwei Veränderlichen Stellt man eine Funktion u = f(x, y) als Fläche in einem kartesischen Koordinatensystem dar und legt man durch den Flächenpunkt P eine Ebene parallel zur x, w-Ebene (Abb.6.14), dann gilt —- = tan a. F 36a) dx Dabei ist a der Winkel zwischen der positiven x-Achse und der Tangente an die Schnittkurve der Fläche in dem betreffenden Punkt mit einer Ebene, die parallel zur x, w-Ebene verläuft Die Messung von a erfolgt, ausgehend von der x-Achse zur Tangente an die Schnittkurve, im entgegengesetzten Drehsinn des Uhrzeigers Dabei ist der Blick in die Richtung der positiven ?/-Achse gerichtet. In Analogie zu a ist ß definiert gemäß — = tan/?. F.36b) dy Bezüglich der Ableitung nach einer gegebenen Richtung (Richtungsableitung) bzw nach einem Volumen (Volumenableitung) sei auf die Vektoranalysis (s 13.2 1.3, S 671) verwiesen. 6.2.1.3 Begriff des Differentials Für jede der Variablen x\,x2,... ,xn läßt sich ein Differential dx\,dx2, ,dxi, ,dxn bilden Die Definition fällt unterschiedlich aus, je nachdem, ob es sich um das Differential einer unabhängigen Variablen oder um das einer Funktion handelt
6 2 Differentiation von Funktionen von mehreren Veränderlichen 409 Abbildung 6 14 Abbildung 6.15 1. Differential einer unabhängigen Variablen x nennt man den Zuwachs der Größe x gemäß dx = Ax. F.37a) Dabei kann man Ax einen beliebigen Wert beimessen. 2. Differential einer Funktion y = f(x) einer Veränderlichen x nennt man für einen gegebenen x-Wert und einen gegebenen Wert des Differentials dx das Produkt dy = f'{x) dx F 37b) 3. Zuwachs (Inkrement) A y einer Funktiony = f(x) nachx + Ax Ax = f(x + Ax) - f{x) F.37c) 4. Geometrische Bedeutung des Differentials Wenn die Funktion durch eine Kurve in einem kartesischen Koordinatensystem dargestellt ist, dann ist dy der Zuwachs, den die Ordinate der Kurventangente im Punkt x für einen gegebenen Zuwachs dx erfährt (Abb.6.1). 6.2.1.4 Haupteigenschaften des Differentials 1. Invarianz Unabhängig davon, ob x eine unabhängige Variable oder eine Funktion von einer weiteren Variablen t ist, gilt dy = f(x)dx. F.38) 2. Größenordnung Wenn dx eine beliebig kleine Größe ist, dann sind auch dy und Ay Ay = y(x + Ax) — y(x) beliebig kleine, aber äquivalente Größen, d.h. lim —— = 1. Infolgedessen ist Aa:->o ay die Differenz zwischen ihnen ebenfalls eine beliebig kleine Größe, aber von höherer Ordnung als dx, dy und Ax. Daraus ergibt sich die Beziehung Ax->o dy 1, Ay*dy = f{x) dx, F.39) die es gestattet, die Berechnung kleiner Zuwächse Ay (Inkremente) auf die Berechnung ihres Differentials zurückzuführen. So wird oft bei näherungsweisen Berechnungen vorgegangen (s. 6.1.4.4,2., S. 405 und 16.4.2.1,2., S. 818)
410 6 Differentialrechnung 6.2.1.5 Partielles Differential Von einer Funktion von mehreren Veränderlichen u = f(x, y, . ) kann das partielle Differential nach einer dieser Veränderlichen, z.B. nach x gebildet werden, was durch die Gleichung dxu = dxf = — dx F 40) definiert ist. 6.2.2 Vollständiges Differential und Differentiale höherer Ordnung 6.2.2.1 Begriff des vollständigen Differentials einer Funktion von mehreren Veränderlichen (totales Differential) 1. Differenzierbarkeit Man nennt eine Funktion von mehreren Veränderlichen u = f(x\, x2, ,#»,•• , xn) im Punkt Pq(x\q, £2o, • > xi0, • • • » xno) differenzierbar, wenn sich der vollständige Zuwachs der Funktion Au = f(xio + dx\, x2q + dx2,..., xi0 4- dxi, . , xn0 + dxn) -/(^10,^20,---,^i0,-- ,Zno) F 41a) beim Übergang zu einem beliebig nahe benachbarten Punkt P(xio+dxi, x2o+dx2, •., XiQ+dxi,..., xn0 +dxn) mit den beliebig kleinen Größen dx\,dx2, ...,<&»,..., dxn von der Summe der partiellen Differentiale der Funktion nach allen Variablen , du . du . du . . /r, _. x (—— ctei + — dx2 + ... + — axn)Xl0)a;20) )Xn0 F 41b) um eine beliebig kleine Größe höherer Ordnung unterscheidet als der Abstand P0P = yjdx\ + dx22 + . . + dx2n F 41c) Differenzierbar ist jede stetige Funktion von mehreren Variablen, die stetige partielle Ableitungen nach allen ihren Variablen besitzt Umgekehrt folgt die Differenzierbarkeit einer Funktion nicht aus der blossen Existenz der partiellen Ableitungen 2. Vollständiges Differential Wenn u eine differenzierbare Funktion ist, wird die Summe F.41b) das vollständige Differential der Funktion genannt. du 1 du . du . ln An . du = ——dx\ + ——dx2 + . + -r—dxn (o 42a) OX\ OX2 OXn Mit Hilfe der Vektoren / du du du\ ,„ An. . gradu=fe'^'-"^:j ' F42b) dr = (dxi,dx2,..., dxn)T F.42c) läßt sich das totale Differential als Skalarprodukt -> T -> du = gradu • dr F.42d) darstellen. In F 42b) handelt es sich um den in 13.2.2.1, S. 671 definierten Gradienten für den Fall von n unabhängigen Variablen. 3. Geometrische Bedeutung Die geometrische Bedeutung des vollständigen Differentials einer Funktion von zwei Veränderlichen u = /(#, y), die in einem kartesischen Koordinatensystem als Fläche dargestellt werden kann (Abb. 6.15), besteht darin, daß du gleich dem Zuwachs der Applikate der Tangentialebene (untere Fläche
6 2 Differentiation von Funktionen von mehreren Veränderlichen 411 durch den betrachteten Punkt) ist, wenn dx und dy die Inkremente von x und y sind Aus der TAYLORschen Formel (s 6 2.2.3, S 412) folgt für Funktionen von zwei Variablen /(z, y) = /fco, yo) + ^(xo, yo){x - x0) + ^-(x0, y0)(y - yo) + Ri- F 43a) Vernachlässigt man das Restglied Ri, dann stellt u = f(x0,y0) + — (x0,y0){x - x0) + — {x0,y0){y - y0) F.43b) die Gleichung der Tangentialebene an die Fläche u = f(x, y) im Punkt Po(^o, 2/o> uo) dar. 4. Haupteigenschaft des vollständigen Differentials wird in Analogie zum Differential einer Funktion von einer Veränderlichen die in F.38) formulierte Invarianz in bezug auf die enthaltenen Variablen genannt. 5. Anwendung in der Fehlerrechnung Im Rahmen der Fehlerrechnung wird das totale Differential du zur Schätzung des Fehlers Au (s F.41a)) verwendet (s z.B 16.4 1 3,5., S. 815). Aus der TAYLORschen Formel (s 6.2 2.3, S. 412) folgt \Au\ = \du + Ri\ < |du| + |Äi| »|du|, F.44) d h., der absolute Fehler |Ait| kann in erster Näherung durch \du\ ersetzt werden. Damit ist du eine lineare Approximation für Au 6.2.2.2 Ableitungen und Differentiale höherer Ordnungen 1. Partielle Ableitung 2. Ordnung, Schwarzscher Vertauschungssatz Die partielle Ableitung 2. Ordnung einer Funktion u = f(x\, x2 , ..., Xi, . ., xn) kann sowohl nach d2u d2u der gleichen Variablen gebildet werden, wie die erste Ableitung, d h. -—^ , tt-^ ,... , als auch nach d2u d2u d2u einer anderen Variablen, d.h. 7^—-— , ——-— , ——-— , Im zweiten Falle spricht man von ei- OX1OX2 OX2OX2, OX3OX1 ner gemischten Ableitung. Der Wert einer gemischten Ableitung ist für gegebene Werte von x\ und x<i unabhängig von der Reihenfolge der Ableitungsbildung, wenn die gemischte Ableitung in dem betrachteten Punkt stetig ist (SCHWARZsc/ier Vertauschungssatz): d2u _ d2u . . dxidx2 dx2dxi d3u d3u Partielle Ableitungen höherer Ordnung, wie z.B. 7—r , ^ ^ - ,... sind analog definiert. dx3 oxoy2 2. Differential 2. Ordnung einer Funktion von einer Veränderlichen y = f(x) Das Differential zweiter Ordnung einer Funktion von einer Veränderlichen y = f(x) mit dem Symbol d2y, d2f(x) wird als Differential des ersten Differentials gebildet: d2y = d(dy) = f"(x)dx2 . Diese Symbole sind allerdings nur geeignet, wenn x eine unabhängige Veränderliche ist und nicht geeignet, wenn x z.B. in der Form x = z(v) gegeben ist Die Differentiale höherer Ordnung werden in analoger Weise definiert. Wenn die Variablen #i, x2,..., x»,..., xn selbst Funktionen anderer Veränderlicher sind, ergeben sich kompliziertere Formeln (s.6.22.2,2.,S.415). 3. Vollständiges Differential 2. Ordnung einer Funktion zweier Veränderlicher u = f(x,y) ,9 ,/ , n d2u , 9 n d2u , , d2u 7 o ,„ „,. \ d2u = d(du) = —dx2 + 2^- dxdy + — dy2 F 46a)
412 6. Differentialrechnung bzw. symbolisch Txdx+hdv)u- F46b) 4. Vollständiges Differential n-ter Ordnung einer Funktion zweier Veränderlicher ^ = {1**+&)"*¦ F-47) 5. Vollständiges Differential n—ter Ordnung einer Funktion mehrerer Veränderlicher u = f(xx, x2,..., xn) t— dxx + -— dx2 + ... 4- -r— dxn I u F 48) ÖXi ÖX2 OXn J 6.2.2.3 Satz von Taylor für Funktionen von mehreren Veränderlichen 1. Taylor-Formel für Funktionen von zwei Veränderlichen a) Erste Form der Darstellung: /(,,y) = /(.,ö) + «M (*-) + ^| (v-b) OX \(x,y)=(a,b) Oy l(x,y)=(a,ö) 2! I ox2 \(x,y)=(aM dxdy l(x,y)=@,f>) + ^%^| (y-bf\ + k-} + --- + ^{ -} + Rn F49a) Ö2/2 l(a:,y)=(a,6) J 3' 7l! Dabei ist (a, 6) die Entwicklungsstelle und Rn das Restglied Manchmal verwendet man an Stelle von df(x,y)\ df z.B. —TT-2— die kürzere Schreibweise — (x0, yo). <?# l(x,y)=(xo,yo) ^ Die Terme höherer Ordnung in F.49a) können mit Hilfe von Operatoren übersichtlich dargestellt werden: f(x,y) = f(a,b) + ±{(s - o)|- + (y - b)£-\f(x,y)\ 2! I dx dj/J l(x,y)=(a,b) + 2!1 Diese symbolische Darstellung bedeutet, daß nach Anwendung des binomischen Satzes die Potenzen der Differentialoperatoren -^- bzw. — als Differentiationsvorschrift höherer Ordnung für die Punktion ox oy f(x,y) zu interpretieren sind. Die Ableitungen sind dann an der Stelle (a, b) zu nehmen. b) Zweite Form der Darstellung: /(, + fcJ,+fc) = /(,)y) + ^(^fc+^fc)/(,,tf) + ^(|&+|-*)8/(,lJf) + h(ih+lk)Zf(x'y)+ ¦+h(mh+iLk)nHx>ti+R- F49c)
6 2 Differentiation von Funktionen von mehreren Veränderlichen 413 c) Restglied: Der Ausdruck für das Restglied lautet . n+l ^n = ,_ r,M ( 75ZÄ + i^ I f{x + ßh,y + Ok) 1 /_Ö_ _Ö_ (n + l)' ^x 0y (O<0< 1). 2. Taylor-Formel für Funktionen von m Veränderlichen Die zu F 49c) analoge Darstellung mit Differentialoperatoren lautet f(x + h,y + k,. ,* + /) = /(x,y,. ,t) ! \dx dy dt wobei das Restglied mit Hilfe der folgenden Formel berechnet wird: k n+l O . ; + 1 ( d L 0 , (n + 1)! \dx dy + 0-1) f(x + Oh,y + 0k,. ,t + ßl) mit @ < G < 1). F.49d) F.50a) F.50b) du du dx\ du dx2 d£ dxi d£ dx2 d£ 6.2.3 Differentiationsregeln für Funktionen von mehreren Veränderlichen 6.2.3.1 Differentiation von zusammengesetzten Funktionen 1. Mittelbare Funktion von einer unabhängigen Veränderlichen u = f(xux2, .,£„), zi=zi@, x2 = x2(£),... , xn = xn{£) du dxn dxn dt, 2. Mittelbare Funktion von mehreren unabhängigen Veränderlichen u = f(xi,x2,...,xn), X1=Xi(^Tj, ..,r), X2 = X2(C,77,...,T), du du dx\ du dx2 du dxn d£ dx\ <9£ dx2 <9£ dxn d£ ' du du dx\ du dx2 du dxn drj dxi dn dx2 dr\ dxn dn ' : = : + * + • + : du _ du dxi du dx2 du dxn dr dx\ dr dx2 dr dxn dr ' Xn = Xn(£,T], ...,T) F 51a) F 51b) F.52a) F.52b) 6.2.3.2 Differentiation impliziter Funktionen 1. Eine Funktion mit einer Veränderlichen y = f(x) sei implizit gegeben durch die Gleichung F{x,y)=0. . F 53a) Durch Differentiation von F.53a) nach x ergibt sich mit Hilfe von F.51b) Fx + Fyy' = 0 F 53b) und y' = —=f , falls gilt: Fy ^ 0. Fv Differentiation von F.53b) liefert auf die gleiche Weise Fxx 4- 2Fxyy' + Fyy(y'J + Fyy" = 0 , F.53c) F 53d)
414 6. Differentialrechnung so daß man unter Berücksichtigung von F.53c) erhält // *'"x"y"xy \"y) "xx \"x) "yy F 53e) Durch analoges Vorgehen berechnet man Fxxx + SFxxyj/ + SFxyyb/J + Fyyy{y'f + 2>Fxyy" + ?>Fyyy'y" + Fyy'" = 0, F.53f) was unter Beachtung von F.53c) und F.53e) nach y'" aufgelöst werden kann. 2. Eine Funktion von mehreren Veränderlichen u = f(x\ , X2, • • , X{) . , Xn ) sei implizit gegeben durch die Gleichung F(xi,x2,..., Xi,..., x„, u) = 0 . F.54a) Die partiellen Ableitungen du_ = _FXJL du_ = _Fx1 du_ = _FXjL dxx Fu'dx2 Fu''"'dxn Fu {Ö-°W) werden in Analogie zum eben demonstrierten Fall ermittelt, aber mit Hilfe der Formeln F.52b) Auf dieselbe Weise werden die partiellen Ableitungen höherer Ordnung berechnet 3. Zwei Funktionen von einer Veränderlichen y = f(x) und z = <p(x) seien gegeben durch das Gleichungssystem F(x,y,z) = 0 und $(x,y,z) = Q. F.55a) Differentiation von F.55a) gemäß F.51b) liefert Fx + Fyy' + Fzz' = 0, $x + $yy' + $xz' = 0, F.55b) F 55c) Die zweiten Ableitungen y" und z" werden in derselben Weise durch Differentiation von F.55b) unter Berücksichtigung von y' und z' berechnet 4. n Funktionen von einer Veränderlichen Die Funktionen yi = f(x),y2 = y>(z),... ,yn = ip(x) seien gegeben durch ein System von n Gleichungen F{x,y1,y2,...,yn) = 0, <P(x,yl,y2,... ,yn) = 0, .. 1&{x1yuy2, . ,3/„) = 0 F 56a) Differentiation von F 56a) mit Hilfe von F.51b) liefert Fz$x - 0ZFX Fy$z - Fz4-„ ' F $ _ f <f> " ~ F 0 — F 0 1 y*z ¦* z^y F 56b) Fx + Fmy[ + Fmy'2 + • • • + Fyny'n = 0 ^ + «Wi + ^22/2 + * • • + *vnVn = 0 : + : + • + : + : =0 *x + *y,y'i + KV2 + • • • + VvnT/n = ° J Auflösen von F.56b) liefert die gesuchten Ableitungen y[,y'2, .., y'n Auf die gleiche Weise werden die Ableitungen höherer Ordnung bestimmt. 5. Zwei Funktionen von zwei Veränderlichen u = f(x, y), v = y?(x, y) seien gegeben durch das Gleichungssystem F(x,y, u,v) = 0 und <P{x,y, u, v) = 0 F 57a) Differentiation von F.57a) nach x und y mit Hilfe von F.52b) liefert dx + du dx + dv dx ~ ' l F 57b) ^ §w $/ ^ ^ \ F 57c) » 0*0u d$dv = Mö.57bj ^ + ^öu + c^ö!;=o Mb57c) dx + du dx + öu dx ~ ' J ^2/ ^ #2/ öv #2/
6.2 Differentiation von Funktionen von mehreren Veränderlichen 415 uu uv uu uv Auflösen des Systems F.57b) nach -r-, —- und des Systems F.57c) nach -r-, — ergibt die partiellen ox ox oy oy Ableitungen erster Ordnung. Die Ableitungen höherer Ordnung werden auf gleiche Weise berechnet 6. n Funktionen von m Veränderlichen, gegeben durch ein System von n Gleichungen Die Berechnung der partiellen Ableitungen erster und höherer Ordnung erfolgt nach dem gleichen Schema, wie es in den vorangegangenen Fällen demonstriert wurde. 6.2.4 Substitution von Variablen in Differentialausdrücken und Koordinatentransformationen 6.2.4.1 Funktion von einer Veränderlichen Gegeben sei eine Funktion sowie ein funktionaler Zusammenhang, der die unabhängige Variable, die Funktion und deren Ableitungen enthält: Die Ableitungen können dann bei der Substitution der Variablen auf die folgende Weise berechnet werden. Fall 1 a: Die Variable x wird durch die Variable t ersetzt, die mit x gemäß x = ip(t) F.59a) verknüpft ist. Dann gilt dy 1 dy d2y 1 \,Ju^y „,Ady\ , . Tx^wüt^ ^ = RöFr()^"^()^r { ] S = RöF {m)?di -3 *'{t) ™w + w'{t)]2 - w ^t)]t) F-59c) Fall 1 b: Wenn die Verknüpfung beider Variabler nicht in expliziter, sondern in der impliziten Form <P{x,t) = 0 F.60) dy dry d y gegeben ist, werden die Ableitungen — , —* , —-« mit denselben Formeln berechnet, aber die Ablei- dx dx dx tungen y>'(£), ^>"(t), <p"'(t) sind nach den Regeln für implizite Funktionen zu berechnen In diesem Falle kann es vorkommen, daß der Zusammenhang F.58b) die Variable x enthält Zur Eliminierung wird dann die Verknüpfung F.60) benutzt Fall 2: Die Funktion y wird durch eine Funktion u ersetzt, die mit y gemäß y = (p(u) F.61a) verknüpft ist. Die Berechnung der Ableitungen kann dann mit den folgenden Formeln erfolgen *.^i. g=/Mg+,,„(*)¦, „eib, Fall 3: Die Variablen x und y werden durch die neuen Veränderlichen t und u ersetzt, die mittels der Formeln x — <p(t, u), y = ip(t, u) F.62a)
416 6. Differentialrechnung verknüpft sind Zur Berechnung der Ableitungen können die folgenden Formeln verwendet werden dip dip du dV _ ~di + ~du~~dt dx dip dip du' dt du dt d2y d (dy\ d dx2 dx \dx) dx ' dip dip du * dt du dt dip dip du - dt du dt ¦ 1 d ~ dip dip du dt dt du dt ' dip dip du dt du dt dip dip du - dt du dt 1 d /A\ 1 ( dA dB\ ~~Bdt\B)~"B*\ ~dt~ ~dt) dip dip du dt du dt F.62e) und B = dip dip du dt du dt d3y Die Berechnung der dritten Ableitung —3 geschieht in analoger Weise ¦ Für die Transformation kartesischer Koordinaten in Polarkoordinaten gemäß x = p cos ip, y = p sin <p berechnen sich die erste und zweite Ableitung wie folgt dy_ = p/siny? + /Pcosy? <py_ = p2 + 2p'2 - pp" dx p' cos p — p sin ip ' dx2 (p' cos ip — p sin ipK F 62b) F 62c) F 62d) F.62f) F 63a) F.63c) 6.2.4.2 Funkt ion zweier Veränderlicher Gegeben sei eine Funktion sowie ein funktionaler Zusammenhang, der die unabhängigen Variablen, die Funktion und deren partielle Ableitungen enthält. u = f{x,y) F 64a) H = F \x,y:uj, du duj d2u d2uj d2u ' dx ' dy ' dx2 ' dxdy ' dy2 ) Wenn x und y durch neue Variable u und v , gegeben durch x = tp(u, v), y = ip(u, v), F.65a) substituiert werden, können die partiellen Ableitungen erster Ordnung aus dem Gleichungssystem du du dip du dip du du dx du dy du ' dv mit den neuen Funktionen A, B, C und D von u und v berechnet werden zu du dip du dip dx dv dy dv F 65b) du du du dx du dv ' du du du dy du dv F.65c) Die partiellen Ableitungen zweiter Ordnung werden mit denselben Formeln berechnet, aber indem sie du du nicht auf u , sondern auf dessen partielle Ableitungen —— und — angewendet werden, z B. ox oy d2u _ d (du dx2 dx \dx d f du du dx V du dv A\A— B d2uJ —— ^.^\ du2 dudv du du du dv I
6 2 Differentiation von Funktionen von mehreren Veränderlichen 417 B(A&u_ B&^_ &4£^ dB_du\ \ dudv dv2 dv du dv dv) ' Die höheren partiellen Ableitungen können in derselben Weise berechnet werden. ¦ Der LAPLACE-Operator (s. 13 2 6.5, S 678) soll in Polarkoordinaten (s. 3.5.2 1,1.,2., S. 195) ausgedruckt werdende d2u Au = ^—¦ + ^—r , F.67a) x = pcosip, y = psunp. F.67b) dx2 dy2 Gang der Rechnung: du du du . du du du du du sinipdu du . du cos (p du — = coscp- — , —- = siinp—- + — , dx dp p oip dy dp p dtp d2u _ d ( du sin(pdu\ simp d ( du sin<pdu dx2 dp\ dp p dtp) p dtp \ dp p dtp d2u Analog wird -r-r- berechnet, so daß man erhält: dy2 Au-— —— -— f6 67c) dp2 p2 d(p2 p dp Hinweis: Wenn Funktionen mit mehrer als zwei Veränderlichen substituiert werden sollen, können ähnliche Substitutionsformeln hergeleitet werden. 6.2.5 Extremwerte von Funktionen von mehreren Veränderlichen 6.2.5.1 Definition Eine Funktion u = f(x\, x<i, ¦, Xi,..., xn) besitzt im Punkt Po(^io, ^20? • • • > ^o5 • • •»^no) einen relativen Extremwert, wenn sich eine Zahl e derart angeben läßt, daß das Gebiet X\q — e<x\ < X\q + e, £20 — e < x2 < x2o + e,.. , xn0 — e< xn < xn0 + e zum Definitionsbereich der Funktion gehört und für jeden Punkt dieses Gebiets mit Ausnahme von P0 für ein Maximum die Ungleichung f{xux2, • ,zn) </(zio,x20, 'x«o) F.68a) und für ein Minimum die Ungleichung f(xux2, •. ,x„)> f{xl0,x20, >xno) F 68b) gilt In der Sprache des Begriffs des mehrdimensionalen Raumes (s 2 18 1.1, S 120) sind in den Punkten eines relativen Maximums oder relativen Minimums die Funktionswerte größer oder kleiner als in den benachbarten Punkten 6.2.5.2 Geometrische Bedeutung Geometrisch betrachtet gehört zu einem relativen Extremwert einer Funktion zweier Veränderlicher, die in einem kartesischen Koordinatensystem als Fläche dargestellt ist (s. 2.18 1.2, S. 120), ein Punkt A, in dem die Applikate der Fläche größer bzw. kleiner ist als die Applikate aller beliebigen anderen Punkte in hinreichend kleiner Entfernung vom Punkt A, d h. in einem Gebiet kleiner Ausdehnung, das den Punkt A enthält (Abb.6.16) Wenn die Fläche im Punkt Po ? der ein relatives Extremum darstellt, eine Tangentialebene besitzt, dann verläuft diese parallel zur x, y-Ebene (Abb.6.16a,b) Diese Bedingung ist notwendig, aber nicht hinreichend dafür, daß im Punkt P0 ein Maximum oder Minimum vorhanden ist. In (Abb.6.16c) zeichnet
418 6 Differentialrechnung Abbildung 6.16 sich die Fläche im Punkt P0 durch eine horizontale Tangentialebene aus, doch besitzt die Funktion dort kein Extremum, sondern einen Sattelpunkt. 6.2.5.3 Best immune der Extremwerte einer Funktion von zwei Veränderlichen Wenn u = f(x, y) gegeben ist, wird das Gleichungssystem fx = 0, fy ¦ Wertepaare (zi, 3/1), (#2,2/2), • m dx2 ' dxdy ' dy2 eingesetzt werden können. Durch Diskussion des Ausdrucks = 0 gelöst, damit die erhaltenen F.69) \A B\ \B C\ '¦ AC — B — [fxxfyy — (fxy) ]x=Xi,y=yi (^ — 1,2,.. ) F.70) bestimmt man die Art des Extremwertes* 1. Im Falle A > 0 besitzt die Funktion f{x,y) für das Wertesystem (#j, yi) mit fxx < 0 ein Maximum, mit fxx > 0 ein Minimum (hinreichende Bedingung) 2. Im Falle A < 0 hat f(x, y) kein Extremum. 3. Im Falle A = 0 ist die Diskussion komplizierter 6.2.5.4 Bestimmung der Extremwerte einer Funktion von n Veränderlichen Die notwendige, aber nicht hinreichende Bedingung dafür, daß die Funktion u = /(xi,X2,.. ,xn) für ein Wertesystem (xi,X2,... ,xn) ein Extremum besitzt, besteht darin, daß das Wertesystem die n Gleichungen /x:=0, /*„=(), ...JXn=0 F.71) erfüllt Im allgemeinen Falle sind die hinreichenden Bedingungen von komplizierter Art. Damit man die Frage, ob die Funktion für ein Lösungssystem xw, X20, • •, xno der Gleichung F.71) ein Extremum besitzt oder nicht, effektiv beantworten kann, untersucht man solche Werte der Funktion, die nahe bei Xio,a;2o,- ,^n0 liegen. 6.2.5.5 Lösung von Appr oximat ionsauf gab en Mit Hilfe der Extremwertbestimmung bei Funktionen von mehreren Veränderlichen lassen sich viele Approximationsaufgaben, die vor allem unter dem Namen Ausgleichsaufgaben oder Quadratmittelaufgaben bekannt sind, lösen.
6 2 Differentiation von Funktionen von mehreren Veränderlichen 419 Beispiele: • Bestimmung von FOURIER-Koeffizienten (s 7 4.1.2, S. 438, 19.6 4.1,1., 954); • Bestimmung der Ansatzkoefhzienten und Parameter von Näherungsfunktionen (s 19.6.2, S. 947 ff), • Bestimmung einer Näherungslösung für überbestimmte lineare Gleichungssysteme (s. 19 2 1.3,1., S 920). Methoden: Für die Lösungsmethode sind folgende Bezeichnungen gebräuchlich: • GAUSSsche Fehlerquadratmethode (s z B. 19.6 2, S 947), • Methode der kleinsten Quadrate, s. 19.6.2.2, S. 948. • Approximation im Mittel (stetig und diskret) (s. z B. 19.6.2, S.947), • Ausgleichsrechnung (s. 19 6 2, S 947) und Regression (s. 16.3.4.2,1., S. 803). 6.2.5.6 Bestimmung der Extremwerte unter Vorgabe von Nebenbedingungen Wenn das Extremum einer Funktion u = f(x\, x2, . , xn) mit n Veränderlichen bestimmt werden soll, die voneinander abhängig und durch die Nebenbedingungen Y?(zi, x2,..., xn) = 0, ip(xi,x2,..., xn) = 0,... , x(zi> x2i..., xn) = 0 F 72a) miteinander verknüpft sind, wobei die Anzahl dieser Verknüpfungen k < n sein muß, dann führt man gemäß der Multiplikatorenmethode von LAGRANGE k unbestimmte Multiplikatoren A, /i, . , n ein und betrachtet die folgenden LAGRANGE-Funktionen der n + k Veränderlichen X\,x2, ., xn, A, /z, , «• $ (xi,X2,.. ,xn, A,/i,...,«) = f(xi,x2,...,xn) + \ip(xux2,. ..,xn) + [iip(xi,x2,.. ,xn)-\ +kx(xi,x2,.. ,xn) F.72b) Die notwendige Bedingung für ein Extremum der Funktion $ ist ein System von n + k Gleichungen F 71) mit den Unbekannten x\, x2,..., xn, A, /x, . , k in der Form ^ = 0,^ = 0, . , x = 0, $Xl =0, ^xa=0, . ,^Xn=0. F 72c) Als notwendige Bedingung dafür, daß die Funktion / im Punkte Pq(x\q,x2q, . ,xn0) ein Extremum besitzen kann, muß das Wertesystem xi0, x20, , xuq diese Gleichungen erfüllen ¦ Die Extremwerte der Funktion u = f{x,y) mit der Nebenbedingung <p(x,y) = 0 werden aus den drei Gleichungen <p(z,y) = 0, —[f(x,y) + \ip(x,y)} = 0, —[f(x,y) + \tp(x,y)}=0 F.73) mit den drei Unbekannten x, ?/, A bestimmt.
420 7 Unendliche Reihen 7 Unendliche Reihen 7.1 Zahlenfolgen 7.1.1 Eigenschaften von Zahlenfolgen 7.1.1.1 Definition der Zahlenfolge Eine unendliche Zahlenfolge ist eine unendliche Menge von Zahlen fli>fl2) • ,fln,- • oder kurz {a^} mit fc = l,2,..., G.1) die in einer bestimmten Reihenfolge angeordnet sind. Die Zahlen der Zahlenfolge werden Glieder der Zahlenfolge genannt Unter den Gliedern einer Zahlenfolge können auch gleiche Zahlen auftreten Eine Folge gilt als gegeben, wenn das Bildungsgesetz der Zahlenfolge, d.h. eine Regel, bekannt ist, nach der jedes beliebige Glied der Zahlenfolge bestimmt werden kann. Häufig läßt sich eine Formel für das allgemeine Glied an angeben Beispiele für Zahlenfolgen: ¦ A: an = n. 1, 2, 3, 4, 5, . . . ¦ B: an = 4 + 3(n - 1): 4, 7, 10, 13, 16, ... ¦ C: an = 3 (-i)n \ 3, -?, ?, - jj, A , .. ¦ D: an = (-1)^: 1, -1, 1, -1,1,.... JL_.122I252Z • B?-H) 1 1 __2=i „.. , , „12 ¦ F: an = 3- - - • 10 2 für ungerades n und an = 3- + - • 10 2+i für gerades n. 3; 4, 3,3; 3,4, 3,33; 3,34, 3,333, 3,334, . . ¦ G: an = - 1, i l,], i ¦ H: an = (-l)"+1n. 1, -2, 3, -4, 5, -6, . . n Z ö 4 o n + 1 ¦ I: an = — für ungerade n und an = 0 für gerades n: —1,0, —2, 0, —3, 0, —4, 0,. ¦ J: an = 3 3- für ungerades n und an = 13 g _ 9 für gerades n. 1, 11, 2, 12, 2-, 12-, 2-, 22~ 2 22 z 2 2 4 ¦^ 7.1.1.2 Monotone Zahlenfolgen Man nennt eine Folge a\, a2,- ¦ •, an,... monoton wachsend, wenn gilt öi < a2 < a3 < • • • < an < • • • , G 2) und monoton fallend, wenn gilt ai > a2 > a3 > • • • > an > • • • . G 3) Man spricht von einer streng monoton wachsenden Folge bzw. streng monoton fallenden Folge, wenn in G.2) bzw. G.3) die Gleichheitszeichen nicht zugelassen sind. Beispiele für monotone Zahlenfolgen: ¦ A: Von den Folgen A bis J sind A, B, E streng monoton wachsend. ¦ B: Die Folge G ist streng monoton fallend. 7.1.1.3 Beschränkte Folgen Eine Folge heißt beschränkt, wenn für alle ihre Glieder gilt K\<K, G 4)
7.1 Zahlenfolgen 421 wobei K > 0 ist. Existiert eine solche Zahl K (Schranke) nicht, dann spricht man von einer unbeschrankten Folge. ¦ Von den Folgen A bis J sind die Folgen C mit K = 4 , D mit K = 2 , E mit K = 3 , F mit K = 5 , G mit K = 2 und J mit K = 13 beschränkt. 7.1.2 Grenzwerte von Zahlenfolgen 1. Grenzwert einer Zahlenfolge Eine unendliche Zahlenfolge G.1) hat den Grenzwert oder Limes A , wenn mit unbegrenzt wachsendem Index n die Differenz an — A dem Betrage nach beliebig klein wird. Genauer formuliert bedeutet das: Zu jeder beliebig kleinen Zahl e > 0 läßt sich ein Index no(e) so bestimmen, daß für alle n > uq gilt \an-A\<e. G 5a) Die Folge hat den Grenzwert oo (—oo), wenn für beliebige K > 0 ein Index no(K) existiert, derart daß für jedes n > n0 gilt an> K bzw. an < -K . G.5b) 2. Konvergenz einer Zahlenfolge Eine Zahlenfolge {an} , die G.5a) erfüllt, heißt konvergent gegen A. Man schreibt dann lim an — A bzw. an —? A. G.6) ¦ Von den Folgen der vorhergehenden Seite A bis J sind konvergent: C mit A = 0 , E mit A = 3 , F mit A = 3± , G mit A = 0. 3. Divergenz einer Zahlenfolge Nichtkonvergente Zahlenfolgen heißen divergent Man spricht von bestimmter Divergenz, wenn an mit unbegrenzt wachsendem n nach der positiven oder negativen Seite jede vorgegebene Zahl K von beliebig großem Betrag überschreitet. Man schreibt dann: lim an = oo (an > K(K > 0) Vn > uq) bzw. lim an = -oo [an < -K(K >0)Vn>n0) G.7) Anderenfalls spricht man von unbestimmter Divergenz. Beispiele für divergente Zahlenfolgen: ¦ A: Von den Folgen A bis J auf der vorhergendenen Seite sind A und B gegen +oo bestimmt divergent ¦ B: Von den Folgen ist D unbestimmt divergent 4. Sätze über Grenzwerte von Zahlenfolgen a) Wenn die Folgen {an} und {bn} konvergieren, gilt lim (an + bn) = lim an + lim bn , G.8) lim (anbn) = (lim an)( lim bn), G 9) n lim an lim -^ = ^^pV , falls lim bn ^ 0 G.10) ™^°° bn hm ön ™-*°° n—>oo Hinweis: Wenn lim bn = 0 gilt und {an} beschrnkt ist, dann gilt lim (anbn) = 0 sogar dann, wenn {an} keinen endlichen Grenzwert hat b) Wenn lim an = lim bn = A gilt und wenigstens von einem Index n\ ab stets an < cn < bn ist, dann gilt auch limcn = ,4. G 11)
422 7. Unendliche Reihen c) Eine monotone beschränkte Folge besitzt stets einen endlichen Grenzwert. Ist eine monoton wachsende Folge ai < a2 < dz < ... nach oben beschränkt, d.h. an < K\ für alle n bzw. eine monoton fallende nach unten, d.h. an > K2 für alle n, so konvergiert sie gegen einen Grenzwert, der nicht größer als die obere Schranke K\ bzw. nicht kleiner als die untere Schranke K2 ist 7.2 Reihen mit konstanten Gliedern 7.2.1 Allgemeine Konvergenzsätze 7.2.1.1 Konvergenz und Divergenz unendlicher Reihen 1. Unendliche Reihe und ihre Summe Aus den Gliedern ak einer unendlichen Zahlenfolge {ofc} (s. 7.1.1.1, S. 420) kann formal der Ausdruck oo oi + a2 + • • • + an + • • • = J2 flfc G 12) gebildet werden, der eine unendliche Reihe genannt wird. Die Summen n Si = ax, £2 = ai + a2 , . ., Sn = ]T ak G 13) fc=i nennt man Partialsummen 2. Konvergente und divergente Reihen Man spricht von einer konvergenten Reihe G.12), wenn die Folge {Sn} der Partialsummen konvergiert. Den Grenzwert oder Limes 00 S= lim Sn = Y>fc G.14) nennt man die Summe und ak das allgemeine Glied der Reihe. Wenn-der Grenzwert G.14) nicht existiert, spricht man von einer divergenten Reihe. In diesem Falle können die Partialsummen unbegrenzt wachsen oder oszillieren. Die Frage nach der Konvergenz einer unendlichen Reihe wird somit auf die Existenz eines Grenzwertes der Folge {Sn} zurückgeführt. ¦ A: Die geometrische Reihe (s. 1.2.3, S. 19) ist konvergent. ¦ B: Die harmonische Reihe 1 + - + - + --- + - + --- G.16) und die Reihen 1 + 1 + 1 + - • - + 1 + - • • und G.17) 2 3 n 1-1 + 1 + (_i)»-i + ... G.18) sind divergent. Während für die Reihen G.16) und G.17) lim Sn = 00 ist, oszilliert G.18) 3. Reihenrest 00 Unter dem Rest oder dem Restglied einer konvergenten Reihe S = ^ ak versteht man die Differenz fc=i zwischen ihrer Summe S und der Partialsumme Sn: 00 Rn = S-Sn= Y, ak = ßn+1 + fln+2 + • ' • • G 19) k=n+l
7 2 Reihen mit konstanten Gliedern 423 7.2.1.2 Allgemeine Sätze über die Konvergenz von Reihen 1. Notwendiges Kriterium für die Konvergenz einer Reihe Die Folge der Glieder einer konvergenten Reihe muß gegen Null streben. lim an = 0 G 20) n—>oo Hierbei handelt es sich um eine notwendige, nicht aber um eine hinreichende Bedingung. ¦ Für die harmonische Reihe G.16) ist lim an = 0, aber lim Sn = oo. n—>oo n—>oo 2. Weglassen, Hinzufügen oder Vertauschen von Gliedern Werden endlich viele Anfangsglieder einer Reihe weggelassen oder endlich viele Glieder einer Reihe hinzugefügt oder endlich viele Glieder vertauscht, dann ändert sich das Konvergenz verhalten der Reihe nicht. 3. Multiplikation aller Glieder Werden alle Glieder einer konvergenten Reihe mit ein und demselben Faktor c multipliziert, dann bleibt die Konvergenz der Reihe ungestört, ihre Summe ist mit dem Faktor c zu multiplizieren. 4. Gliedweise Addition oder Subtraktion Konvergente Reihen dürfen gliedweise addiert oder subtrahiert werden Aus der Konvergenz der Reihen oo oo ai + a2 + • • • + an + • • • = £ ak = Si,G.21a) fei + fe2 + • • • + bn + • • = £ &fc = S2 G.21b) fc=i fc=i folgt die Konvergenz und die Summe der Reihe (ai ± fei) + (a2 ± b2) + • • • + {ak ± bk) + • • • = Sx ± S2 . G.21c) 7.2.2 Konvergenzkriterien für Reihen mit positiven Gliedern 7.2.2.1 Vergleichskriterium Wenn zwei Reihen oo oo ai + a2 + • • • + an + • • • = Y, ak G.22a) fei + b2 + • • • + bn + • • • = ^ bk G.22b) ib=l fe=l nur positive Glieder (an > 0, fen > 0) besitzen und wenn von einem gewissen n an an > bn ist, dann folgt aus der Konvergenz der Reihe G 22a) auch die Konvergenz der Reihe G.22b). Umgekehrt folgt aus der Divergenz der Reihe G 22b) auch die Divergenz der Reihe G 22a). ¦ A: Aus dem Vergleich der Glieder der Reihe l+h+i+-+^+- ' G-23a) mit denen der geometrischen Reihe G 15) folgt die Konvergenz der Reihe G.23a) Von n = 2 an sind die Glieder der Reihe G.23a) kleiner als die der konvergenten Reihe G.15)- ^<^T ("^2)- G23b) ¦ B: Aus dem Vergleich der Glieder der Reihe 1 + — + — + ... + — + ... G.24a) \/2 y/S y/n mit denen der harmonischen Reihe G.16) folgt die Divergenz der Reihe G.24a). Von n > 1 an sind die Glieder der Reihe G 24a) größer als die der divergenten Reihe G 16). 4= > - (n > 1). G 24b) y/n n
424 7. Unendliche Reihen 7.2.2.2 Quotientenkriterium von d'Alembert Wenn für die Reihe oo a\ + a2 H h an H = J^ «fc G.25a) fc=i von einem gewissen n an alle Quotienten —— kleiner sind als eine Zahl q < 1, dann ist die Reihe konvergent °^<q<l. G.25b) Wenn diese Quotienten von einem gewissen n an größer sind als eine Zahl Q > 1, dann ist die Reihe divergent. Daraus ergibt sich. Gilt lim^=p, G 25c) dann ist die Reihe für p < 1 konvergent und für p > 1 divergent. Für p = 1 kann mit dem Quotientenkriterium keine Aussage über das Konvergenz verhalten gemacht werden. ¦ A. Die Reihe I + 1 + A + . .. + £ + ... G 26a) konvergiert, denn es gilt p = hm (Vl±± : £-) = hm —H = * . G.26b) P n-^oo V 2n+1 2V «-»oo 2 2 ' ¦ B: Für die Reihe 2 + - + - + ••• + ^- + • • • G 27a) 4 9 n2 liefert das Quotientenkriterium wegen .. / n + 2 n+l\ ,,--,. keine Entscheidung über die Konvergenz oder Divergenz der Reihe. 7.2.2.3 Wurzelkriterium von Cauchy Gilt für eine Reihe oo di + ö2 H 1- ön H = 51 afc G.28a) von einem gewissen n an für alle Zahlen ^/ö^ v7^ < Q < 1, G.28b) dann ist die Reihe konvergent Sind umgekehrt von einem gewissen n an alle Zahlen ^/ö^ größer als eine Zahl Q und ist Q > 1, dann divergiert die Reihe. Daraus ergibt sich* Gilt lim </ä^ = p G 28c) dann ist die Reihe konvergent für p < 1 und divergent für p > 1 Für p = 1 kann mit dem Wurzelkriterium keine Aussage über das Konvergenzverhalten gemacht werden. ¦ Die Reihe \ + ©4 + (i)' + •' + G^i)"' + • ¦ • G-29a)
7.2 Reihen mit konstanten Gliedern 425 ist konvergent wegen / \ n i \n2 I 1 \ 1 < 1. G.29b) = Um nj( n V2 = lim (-J—I = - 7.2.2.4 Integralkriterium von Cauchy 1. Konvergenz Eine Reihe mit dem allgemeinen Glied an = f(n) ist konvergent, wenn f(x) eine monoton fallende Funktion ist und das uneigentliche Integral oo ff(x)dx (s 8 2.3.2,1., S 471) G.30) c konvergiert 2. Divergenz Eine Reihe mit dem allgemeinen Glied an = f(n) ist divergent, wenn das Integral G.30) divergiert. Die untere Integrationsgrenze c ist zwar beliebig, sie ist jedoch so zu wählen, daß die Punktion f(x) für c < x < oo definiert und frei von Unstetigkeiten ist ¦ Die Reihe G.27a) ist divergent wegen f(x) = £±! , r^dx=\lnx--r = oc. G.31) X2 Je X2 [ X\c 7.2.3 Absolute und bedingte Konvergenz 7.2.3.1 Definition Neben der Reihe G 12) mit Gliedern, die verschiedene Vorzeichen haben können, wie z.B. in einer alternierenden Reihe, wird auch die Reihe oo M + H + --- +kl+ ••• = £ kl G.32) fc=i betrachtet, deren Glieder die Absolutbeträge der Glieder der Reihe G 12) sind. Wenn die Reihe G.32) konvergent ist, dann ist es auch die Reihe G.12). In diesem Falle spricht man von der absoluten Konvergenz der Reihe G.12). Wenn die Reihe G 32) divergent ist, dann kann die Reihe G 12) entweder auch divergent oder konvergent sein Im letzten Falle spricht man von der bedingten Konvergenz der Reihe G.12). _ i ^. ^ ., sina sin 2a sin na ,„ nn N ¦ A: Die Reihe —— + —— + • • • + ——— + • • • , G.33a) in der a eine beliebige konstante Zahl ist, konvergiert absolut, da die Reihe mit dem absoluten Glied I sin na I 2n konvergiert. Dies zeigt ein Vergleich mit der geometrischen Reihe G.15): I sin na! 1 . —7,— < TT ¦ G.33b) | 2n I ~" 2n B: Die Reihe 1 - ]- + ]- + (-l)n_1- + • • • G.34)
426 7. Unendliche Reihen konvergiert bedingt, wie G 36b) und ein Vergleich mit der divergenten harmonischen Reihe G.16) zeigen, die das allgemeine Glied — = \an\ hat n 7.2.3.2 Eigenschaften absolut konvergenter Reihen 1. Vertauschung von Gliedern a) Die Glieder einer absolut konvergenten Reihe können nach Belieben miteinander vertauscht werden Die Reihensumme ändert sich dadurch nicht. b) Wenn die Glieder einer bedingt konvergenten Reihe so umgestellt werden, daß in die Umstellung beliebig viele Glieder einbezogen sind, dann kann dadurch die Reihensumme geändert werden Der Satz von RiEMANN besagt, daß auf diese Weise jede beliebige vorgegebene Zahl zur Reihensumme gemacht werden kann 2. Addition und Subtraktion Absolut konvergente Reihen können gliedweise addiert oder subtrahiert werden. 3. Multiplikation Absolut konvergente Reihen können wie gewöhnliche Polynome miteinander multipliziert werden. Das Ergebnis ist wieder als Reihe darstellbar, z.B.: (ai + a2 + • • • + an + • • -)(&i + b2 + • • • + bn + • • •) = a\bi + a2b\ + 0162 + 0361 + a2h + fli&3 H G.35a) + anb\ + an-ih H 1- Q>\bn H Wenn die Reihensummen ^ an = Sa und J^ bn — 5& bekannt sind, dann ergibt sich die Summe der multiplizierten Reihen gemäß S = SaSb G 35b) 00 00 Wenn zwei Reihen a\ + a2 H h an H = J2 an und b\ + b2 H h bn -\ = Yl bn konvergent sind n=l n=l und wenigstens eine von ihnen absolut konvergiert, dann konvergiert auch die durch Multiplikation aus beiden erhaltene Reihe Sie ist jedoch nicht notwendig ebenfalls absolut konvergent 7.2.3.3 Alternierende Reihen 1. Leibnizsches Konvergenzkriterium (Satz von Leibniz) Hinreichendes Kriterium für die Konvergenz der alternierenden Reihe ai — a2 + 03 — • • • ± an =F • • • , G 36a) in der die an positive Zahlen sind, ist die Erfüllung der zwei Bedingungen 1. lim an = 0 und 2 ai > a2 > a3 > • • • > a„ > • • • . G 36b) n—>oo ¦ Die Reihe G.34) ist nach diesem Kriterium konvergent. 2. Abschätzung des Restgliedes der alternierenden Reihe Wenn in einer konvergenten alternierenden Reihe nur die ersten n Glieder berücksichtigt werden, dann stimmt das Vorzeichen des Restgliedes Rn mit dem des ersten weggelassenen Gliedes an+i überein, und Rn ist absolut genommen kleiner als |an+i|- sign#n - sign(an+i) mit Rn = S - Sn , G.37a) \S - Sn\ < \an+l\. G.37b) ¦ Bei der Reihe G.38a) gilt für das Restglied G.38b)- l-i + i-7 + ---±-q=-.- = ln2, G 38a) |ln2-5n|<-^— G.38b) 2 3 4 n n + 1
7.2 Reihen mit konstanten Gliedern 427 7.2.4 Einige spezielle Reihen 7.2.4.1 Summenwerte einiger Reihen mit konstanten Gliedern 1 + h+h + h + - + h. + -- = e> G-39) G.40) G.41) G.42) G.43) G.44) G.45) G.46) G.47) G.48) G.49) G.50) G.51) G 52) G.53) G.54) G.55) G.56) G.57) , 111 ,1 1 2 3 4 n , 111 1 1+2 + 4 + 8 + '- + ^ + "^2' , 111 ,1 2 1111 1 TT ~3+5~7+9 2n - 1 T " ' ~ 4 ' 111 1 1-2 2-3 3-4 ' ' n(n + l) ' 111 1 1^3 + 3^ + 5^7 + ' '+ Bn-l)Bra + l) +' 111 1 T^3 + 2^4 + 3^5 + '"+(n- l)(n + 1) + " ' 111 1 3T5 + 7^9 + 11 • 13 + " ' + Dn - l)Dn 4-1) ' 1 1 1 l-2-3 + 2.3-4 + '" + n(n+ l)(n + 2) + * " 1 1 1 l-2.../ + 2-3...(/ + lL"" + n...(n + /- 111 1 TT2 + 22 + 32 + 42+'" + ^"f""~"' 111 1 TT2 22 + 32 42 + ' * ' ± n2 ^ ' • ' - 12 ' 111 1 TT2 12 + 32 + J32 + " ' + Bn + lJ + '"' ~ ~8~ ' 111 1 TT4 + ¥ + 3^ + 44" + " ' + ^ + ' " ~ 90 ' 11 1 7tt4 24 + 34 " " n* " ' ~ 720 ' 111 1 TT4 14 + 31 + 54 + " *' + Bn + 1L + " ' ~ 96 ' 111 1 7r2fc22fc- + 22fc + 32fc + 42fc + " ' + n2k + " " ~ Bfc)! 1 "'~2' _ 3 ~ 4' 1 + ... = _. 1 ~ 4' T)+~ = -1 TT ~ 8 ' 1 (/-!)(/-!)!'
428 7 Unendliche Reihen 22k + 32fc 42k — — — + 32A; + 52A: + 72A; "•" " • q:...= 1 7T2fcB2' ¦1), B*)! _ 7T2fcB2fc - Bn - lJfc 2 • BJfc)! 1- 1 1 1 1 -£*, „.2*+! 7^ t G 58) G 59) G 60) 32fe+i 52/c+i 72fc+i Bn-lJfc+1 22fc+2Bfc)!- 7.2.4.2 Bernoullische und Eulersche Zahlen 1. Erste Definition der Bernoullischen Zahlen Die BERNOULLischen Zahlen Bk treten bei Potenzreihenentwicklungen spezieller Funktionen auf, z.B. bei den trigonometrischen Funktionen tanz, cotz und cscx sowie bei den hyperbolischen Funktionen tanhx, cotrim und cosechx. Die BERNOULLischen Zahlen Bk können wie folgt definiert l-x + ßi^-B2^±-.. + (-ir+1ßn7^T±.- (N<2tt) G 61) 1 -2+Bl--B^±- • + (-1'n+lß"(^)T±' und durch Koeffizientenvergleich bezüglich der Potenzen von x ermittelt werden. Die so gewonnenen Werte sind in Tabelle 7.1 angegeben Tabelle 7.1 Erste Bernoullische Zahlen k 1 2 3 Bk 1 6 1 30 1 42 k 4 5 6 Bk 1 30 5 66 691 2730 k 7 8 9 Bk 7 6 3617 ~51Ö~ 43867 798 k 10 11 Bk 174611 330 854513 138 2. Zweite Definition der Bernoullischen Zahlen Manche Autoren gehen zur Definition der BERNOULLischen Zahlen von der folgenden Darstellung aus- ry.1 ^.2Tl ¦ + ¦•• (W<2tt). G 62) Dadurch erhält man die Rekursionsformel BkVi = (B + l)h+l (/c-1,2,3,. .), G.63) wobei nach Anwendung des binomischen Satzes (s. 1.1.6.4,1., S 12) überall B durch Bv zu ersetzen ist, d h. der Exponent wird zum Index. Für die ersten Zahlen gilt- Bi B8 #16 = = = 1 ~2' 1 ~3Ö' 3617 ~~51Ö B2 = Bio '• ; 1 6' 5 ~ 66 Bs B4 = - B\2 = B5 = 1 30' — - = B7 B6 6Q1 273Ö' = • • • 1 = 42 Bi = 0. 7 M-g, G.64) *Bk sind BERNOULLlsche Zahlen ^ Ek sind EuLERsche Zahlen
7.2 Reihen mit konstanten Gliedern 429 Es besteht der Zusammenhang Bk = (-l)k+1Wk (k = 1,2,3,. .) G.65) 3. Erste Definition der Eulerschen Zahlen Die EULERschen Zahlen Ek treten bei der Potenzreihenentwicklung spezieller Funktionen auf, z.B. bei den Funktionen secx und sechs; Die EULERschen Zahlen Ek können wie folgt definiert X2n TT secx = 1 + üi— + hh— + • • • + En-j^—r, + • • • {\x\ < -) G.66) lWn)\ und durch Koeffizientenvergleich bezüglich der Potenzen von x ermittelt werden. Die so gewonnenen Werte sind in Tabelle7.2 angegeben 4. Zweite Definition der Eulerschen Zahlen Zur Definition der EuLERsc/ien Zahlen kann man in Analogie zu G 63) von der Rekursionsformel (E + l)fc + (E - l)k = 0 {k = 1,2,3,...) G 67) ausgehen, wobei auch hier nach Anwendung des binomischen Satzes überall Ev durch Eu zu ersetzen ist. Für die ersten Zahlen gilt. J% = -1, Ei = 5, i% = -61, £« = 1385, £^ = -50521, T\2 = 2702765, Tfa = -199360981, G.68) £^ = 19391512145,. ; ~E[ = % = ~E~h = - • - = Q. Es besteht der Zusammenhang Ek = (-l)kWk (k = 1,2,3,...). G.69) Tabelle 7.2 Erste Eulersche Zahlen k 1 2 3 4 Ek 1 5 61 1385 k 5 6 7 Ek 50521 2702765 199360981 5. Zusammenhang zwischen EULERschen und BERNOULLischen Zahlen Zwischen den EULERschen und den BERNOULLischen Zahlen besteht der Zusammenhang A2k+1 / i v 2fc+l " äTi^"*) (* = U.-). (r.70) -&2A; : 7.2.5 Abschätzung des Reihenrestes 7.2.5.1 Abschätzung mittels Majorante Um festzustellen, mit welcher Genauigkeit die Summe einer Reihe durch ihre n-te Teilsumme angenähert wird, versucht man, den Betrag des Restausdrucks |S-Sn| = |Ä»| = k=n+l < E kl G.71) k=n+l der Reihe J^ ßfc abzuschätzen Dazu benutzt man als Majorante für ^ |a&| eine geometrische oder k=l k=n+l eine andere Reihe, die sich leicht summieren oder abschätzen läßt.
430 7 Unendliche Reihen 00 1 a ¦ Abschätzung des Restes der Reihe e = V" — . Für den Quotienten —— zweier aufeinanderfolgen- der Glieder dieser Reihe gilt mit m > n + 1: m+ = -, lttt = 7 < = q < 1 Damit am (ra+1)! ra + 1 ~ n + 2 kann der Reihenrest i?n = -. — + —7 4- 7 ttt + • • • durch die geometrische Reihe G 15) (n + 1)! (n + 2)! (n + 3)! & v ' mit dem Quotienten q = und dem Anfangsglied a = - —7 majorisiert werden, und es gilt: a _ 1 n + 2 1 n + 2 _ 1 ^ < 1 - q ~ (n + 1)! n + 1 < n! n2 + 2n " n • n! ' ( ] 7.2.5.2 Alternierende konvergente Reihen Für eine konvergente alternierende Reihe, deren Glieder dem Betrage nach monoton gegen Null streben, gibt es eine einfache Abschätzung des Reihenrestes (s 7 2.3 3,1., S 426) |ÄB| = |5-5n|<|ofH.1|. G.73) 7.2.5.3 Spezielle Reihen Für einige besondere Reihen, z.B. TAYLOR-Reihen, gibt es bestimmte Formeln für den Reihenrest (s 7.3.3.3, S. 434). 7.3 Funktionenreihen 7.3.1 Definitionen 1. Funktionenreihe wird eine Reihe genannt, deren Glieder Funktionen ein und derselben Variablen x sind: 00 Mx) + Mx) + ¦¦¦ + Ux) + • • • = E fn(x). G.74) n=l 2. Partialsumme Sn(x) heißt die Summe der ersten n Glieder der Reihe G 74): Sn(x) = fi(x) + f2(x) + • • • + fn(x). G.75) 3. Konvergenzbereich der Funktionenreihe G.74) werden sämtliche Werte x = a genannt, die zum gemeinsamen Definitionsbereich aller Funktionen /n(:r) gehören und für die die Reihen mit konstanten Gliedern 00 fi(a) + Ma) + ¦¦¦ + /„(a) + • • • = £ /„(a) G.76) n=l konvergieren, d.h. für die der Grenzwert der Partialsummen Sn(a) existiert lim Sn(a) = lim £ fk(a) = S(a). G.77) fc=l Die Funktion S(x) heißt dann Summe der Reihe G.74), und man sagt, die Reihe konvergiert gegen die Funktion S(x). 4. Restglied Rn(x) heißt die Differenz zwischen der Summe S(x) einer konvergenten Funktionenreihe und ihrer Partialsumme Sn(x) Rn{x) = S(x) - Sn(x) = fn+1(x) + fn+2(x) + • • • + fn+m{x) + • • • . G.78)
7.3 Funktionenreihen 431 7.3.2 Gleichmäßige Konvergenz 7.3.2.1 Definition, Satz von Weierstrass In Übereinstimmung mit der Definition des Grenzwertes einer Zahlenfolge (s. 7.1.2, S. 421 und 7.2 1.1,2., S. 422) konvergiert die Reihe G 74) in einem gegebenen Gebiet, wenn für eine beliebige Zahl e > 0 eine ganze Zahl N derart angegeben werden kann, daß die Ungleichung \S(x) — Sn(x)\ < e für alle n > N erfüllt ist. Für Funktionenreihen können dabei zwei Fälle unterschieden werden 1. Gleichmäßig konvergente Reihe Es kann eine derartige Zahl N gefunden werden, die für alle x- Werte im Konvergenzbereich der Reihe G.74) gemeinsam gilt. Dann spricht man von einer gleichmäßig konvergenten Reihe in dem betrachteten Gebiet. 2. Ungleichmäßig konvergente Reihe Es kann keine derartige Zahl N gefunden werden, die für alle x-Werte im Konvergenzgebiet gilt. Es gibt dann im Konvergenzbereich der Reihe wenigstens eine Zahl x , für die die Ungleichung \S(x) — Sn(x)\ > e erfüllt ist, egal wie groß n gewählt ist. Man spricht in diesem Falle von einer ungleichmäßig konvergenten Reihe 2 n ¦ A : Die Reihe i + £ + |r + ... + ^ + ... G.79a) mit der Summe ex (s Tabelle 21.5, S. 1047) konvergiert für alle Werte von x. Die Konvergenz ist hier für jedes beliebige endliche Gebiet von x gleichmäßig, und es gilt für \x\ < a und unter Benutzung des Restgliedes nach der Formel von Mac Laurin (s. 7.3.3.3,2., S. 435) für die Reihe die Ungleichung \S(x)-Sn(x)\: (n + 1)! (n + 1)! @ < 6 < 1). G.79b) Da (n + 1)! schneller als an+l wächst, wird der Ausdruck auf der rechten Seite der Ungleichung für hinreichend großes n, das unabhängig von x ist, kleiner als e. Für die gesamte Zahlengerade gibt es hier allerdings keine gleichmäßige Konvergenz: Wie groß man n auch immer wählt, es wird sich stets rn+! _ I größer ist als ein beliebiges vorgegebenes e eine Zahl x derart finden lassen, daß |(n+l)! , ¦ B: Für alle x-Werte im abgeschlossenen Intervall [0,1] konvergiert die Reihe x + x(l - x) + x(l - xf + • • • + x(l - x)n + • • • , G.80a) da in Übereinstimmung mit der Schlußfolgerung aus dem Kriterium von d' Alembert (s. S. 424) gilt. p = lim l^-l = II - x\ < 1 für 0 < x < 1 (für x = 0 ist S = 0). G 80b) Die Konvergenz ist aber ungleichmäßig, weil S(x) - Sn{x) = x[(l - x)n+1 + A - x)n+2 + ¦••] = A - x)n+1 G.80c) gilt und, wie groß auch immer n gewählt wird, stets ein hinreichend kleines x gefunden werden kann, für das A — x)n+1 beliebig nahe bei 1 liegt, d.h. nicht kleiner als e ist. Gleichmäßige Konvergenz liegt im Intervall a < x < 1 aber mit der Einschränkung 0 < a < 1 vor. 3. Kriterium von Weierstrass für die gleichmäßige Konvergenz In einem gegebenen Gebiet konvergiert die Reihe /i(aO + /2(z)+ ••• + /„(*) + ... G-81a) gleichmäßig, wenn es eine konvergente Reihe mit konstanten Gliedern ci + c2 + • • • + cn + • • • G.81b) gibt, so daß für alle x-Werte in diesem Gebiet die Ungleichung \fn(x)\<cn G.81c)
432 7 Unendliche Reihen erfüllt werden kann Man nennt dann G.81b) eine Majorante zur Reihe G.81a) 7.3.2.2 Eigenschaften gleichmäßig konvergenter Reihen 1. Stetigkeit Wenn fi(x), /2(x), • • •, fn(x), • • • stetige Funktionen in einem Definitionsbereich sind und wenn die Reihe f\(x) + /^(z) + • • • 4- fn(x) + ••• in diesem Gebiet gleichmäßig konvergiert, dann ist ihre Summe S(x) in dem gleichen Gebiet eine stetige Funktion Wenn die Reihe in einem endlichen Gebiet nicht gleichmäßig konvergiert, dann kann ihre Summe S(x) in diesem Gebiet Unstetigkeitsstel- len besitzen. ¦ A: Die Summe der Reihe G.80a) ist unstetig: S(x) = 0 für x = 0 und S(x) = 1 für x > 0 ¦ B: Die Summe der Reihe G 79a) ist eine stetige Funktion Die Reihe ist ungleichmäßig konvergent, aber nicht in einem endlichen Gebiet, sondern auf der gesamten Zahlengeraden. 2. Integration und Differentiation gleichmäßig konvergenter Reihen Im Gebiet [a, b] der gleichmäßigen Konvergenz darf eine Reihe gliedweise integriert werden Ebenso darf eine konvergente Reihe gliedweise differenziert werden, wenn die dadurch entstehende Reihe gleichmäßig konvergent ist. Das heißt* /x oo oo °i £ fn(t) dt = £ fn{t) dt für %xe[a,6], G 82a) n=l n=l/0 oo \ ' oo £/»(*) =£/;(*) für x€[a,ft] G 82b) 7.3.3 Potenzreihen 7.3.3.1 Definition, Konvergenz 1. Definition Die wichtigsten Funktionenreihen sind die Potenzreihen der Gestalt oo oo + a\X + ü2X2 + • • • + anxn + ••• = £ CLnxn oder G.83a) 71=0 oo a0 + a\(x — xq) + a2(x - xqJ H (- an(x - x0)n -\ = ^ an(x - x0)u , G.83b) 71=0 wobei die Koeffizienten an und die Entwicklungsstelle xq konstante Zahlen sind 2. Absolute Konvergenz und Konvergenzradius Eine Potenzreihe konvergiert entweder nur für x = xq oder für alle Werte von x , oder es gibt eine Zahl r > 0 , den Konvergenzradius, so daß die Reihe für \x — x0\ < r absolut konvergiert und für \x — x0\ > r divergiert (Abb.7.1) Der Konvergenzradius kann mittels oder r = lim . G 84) n—»oo n/\„ I {/Kl r = lim n—>oo ön+1 Konvergenzbereich bestimmt werden, falls die Grenzwerte existieren In den Endpunk- a ten des Konvergenzintervalls x = +r und x = — r für die Reihe __i i i__ G.83a) und x = xq + r und x = x0 — r für die Reihe G.83b) kann xo"r xo xo+r die Reihe entweder konvergent oder divergent sein Existieren diese Grenzwerte nicht, dann ist an Stelle des gewöhnlichen Limes (lim) Abbildung 7.1 der Limes superior (lim) zu nehmen (s. [7.8], Bd I) 3. Gleichmäßige Konvergenz Gleichmäßig konvergent ist eine Potenzreihe in jedem abgeschlossenen Teilgebiet \x — xq\ < ro < r des Konvergenzbereiches (Satz von Abel) X X Xn 1 TL ~\- 1 ¦ Für die Reihe 1 + - + — H + 1 ist - = lim = 1, d h. r = 1. G 85) 12 n r n^°° n
7.3 Funktionenreihen 433 Somit konvergiert die Reihe absolut in —1 < x < +1, für x = —1 ist sie bedingt konvergent (s. Reihe G.34), S 425) und für x = 1 divergiert sie (s. die harmonische Reihe G.16), S. 422). Gemäß dem Satz von Abel handelt es sich um eine gleichmäßig konvergente Reihe in jedem Intervall [—n, +7*1], wobei T\ eine beliebige Zahl zwischen 0 und 1 ist. 7.3.3.2 Rechnen mit Potenzreihen 1. Summe und Produkt Konvergente Potenzreihen dürfen innerhalb ihres gemeinsamen Konvergenzbereiches gliedweise addiert, miteinander multipliziert und mit einem beliebigen konstanten Zahlenfaktor multipliziert werden Das Produkt zweier Potenzreihen ergibt sich zu I Y^ anxn I • I Y bnxn ) = ao&o + (ao&i + aibo)x + (ao&2 + ai&i + a2b0)x2 \n=0 / \n=0 / + (ö0^3 + Ö1&2 + «2^1 + G^M^3 H • 2. Erste Glieder einiger Potenzen von Potenzreihen S = a + bx + ex2 + dx3 + ex4 + fx5 H S2 = a2 + 2abx + {b2 + 2ac)x2 + 2(ad + bc)x3 + (c2 + 2oe 4- 2bd)xA +2(o/ + 6e + crf)x5 H , /- _i iT 16 /lc 162\ 2 (\d 16c 1 63\ 3 v^S = S* = ß2 1 + --x + ----- \x2 + ----_ + —- x3 [ 2 a \2a Sa2J \2a 4a2 16a6J + l2a 4a2 8a2 + 16a3 128a4,r+* — = 5-3 =a" V5 2aX+l8a2 2aJa;+Ua2 2a 16a3 Sbd 3c2^_le_1562c _35_&\ , + \4a2 + 8a2 2a 16 a3 + 128a4 I X + ' = 5-1 = a -*+ t — - S~2 bl-C\x2+B±-±-bl)x* a2 aj \a2 a a3 y 26d c2 e 62c 64\ 4 1 a al a aö a4 y J - 2-x + 3— - 2- x2 + 6^ - 2- - 4— z3 a \ a ay \ a a a^y i^W c2 e 62c 64\ 4 + I 6- + 3- - 2- - 12— + 5- )x* + • a^ a a a0* a4 < Quotient zweier Potenzreihen a0 1 + a\x + a2a;2 + ¦ J2anXn n=0 n=0 60 i+A^ + /?2^2 + - [1 + (ttl - ft)z + (a2 - a^ft + ft2 - ß2)x2 G 86) G.87) G.88) G.89) G 90) G.91) G.92) G.93) +(a3 - Q2ft - a!Ä - Ä - A3 + axft2 + 2ßxß2)x3 + • • •] Diese Formel ergibt sich, indem der Quotient als Reihe mit unbestimmten Koeffizienten angesetzt und mit der Nenner-Reihe ausmultipliziert wird, worauf die Koeffizienten der entstehenden Reihe durch Koeffizientenvergleich mit der Zähler-Reihe bestimmt werden.
434 7. Unendliche Reihen 4. Umkehrung einer Potenzreihe Ist die Reihe y = f(x) = ax + bx2 + ex3 + dx4 + ex5 + fx6 + • • • (o ^ 0) G 94a) gegeben, dann versteht man unter ihrer Umkehrung die Reihe x = (p{y) = Ay + By2 + Cy3 + Dy4 + Ey5 + Fy6 + - - - G 94b) Die Koeffizienten ergeben sich zu A=-, B = ~, C=\{2b2-ac), D = \(babc-a2d-5b3), a a6 a5 a7 E = \Fa2bd + 3a2c2 + 1464 - a3e - 21ab2c), G.94c) a9 F = -^Ga3be + 7a3cd + 84ab3c - a4/ - 28a2b2d - 28a26c2 - 42b5) Die Konvergenz der Umkehrreihe muß in jedem Beispiel besonders untersucht werden 7.3.3.3 Entwicklung in Taylor-Reihen, MacLaurinsche Reihe Für die wichtigsten elementaren Funktionen sind in Tabelle 21.5 S. 1045ff.) Potenzreihenentwicklungen zusammengestellt worden. Sie wurden in der Regel durch TAYLOR-Entwicklungen gewonnen 1. Taylor-Reihe für Funktionen von einer Veränderlichen Stetige Funktionen f(x), die für x = a alle Ableitungen besitzen, können oftmals mit Hilfe der Tay- LORschen Formel (s. 6.1.4.5, S. 405) als Summe einer Potenzreihe dargestellt werden. a) Erste Form der Darstellung: /(*) = /(«) + ^/» + {^-f» + ¦¦¦ + ^^/("V) + • • • G 95a) Die Reihenentwicklung G.95a) ist für die x-Werte richtig, für die das Restglied Rn = f(x) — Sn beim Übergang n —? oo gegen Null strebt. Dabei ist zu beachten, daß der Begriff Restglied nur dann mit dem in 7 3.1, S. 430 eingeführten Begriff gleichen Namens identisch ist, wenn die Formel G 95a) richtig ist Für das Restglied gibt es die folgenden Formeln. (x — a)n+l Rn = -^ T7i-/(re+1)@ (a < f < x oder x < f < a) (LAGRANGEsche Form), G 95b) (n+ l)i Rn = —/f{x- t)nf{n+1){t) dt (Integralformel). G.95c) n\ J a b) Zweite Form der Darstellung: f(a + h) = f(a) + ~{'{a) + ^/"(a) + • • • + ^/<">(a) + • • • . G 96a) Die Ausdrücke für das Restglied sind un+l R- = r-TT\T/(n+1)(a + eh) @ < © < 1), G.96b) (ra + 1)! h Rn = - f(h- *) "/(n+1) (a + t)dt. G.96c) n\ J
7.3 Funktionenreihen 435 2. MacLaurirische Reihe MACLAURiNsc/ie Reihe wird die Entwicklung der Funktion f(x) nach Potenzen von x im Spezialfall der TAYLORschen Reihe für a = 0 genannt Es ergibt sich /(*) = /@) + ^/'@) + ^/"@) + • • + J/("»@) + • • • G 97a) mit dem Restglied ~n+l Rn = J^TTy.fin+l){ex) (°<e<1)- G97b) 1 x Rn = -J(x-t)nf^l\t)dt G 97c) ' 0 Die Konvergenz der TAYLORschen und MACLAURiNschen Reihe ist entweder durch Untersuchung des Restgliedes Rn nachzuweisen oder durch Bestimmung des Konvergenzradius (s 7 3 3 1,2., S. 432) Im zweiten Falle kann es vorkommen, daß die Reihe zwar konvergiert, ihre Summe S(x) aber ungleich f(x) ist. Das ist z.B. der Fall bei der Funktion f(x) = exp(-l/x2) für x ^ 0 und /@) = 0. Die Glieder ihrer MACLAURiNschen Reihe sind sämtlich 0. 7.3.4 Näherungsformeln Unter Beschränkung auf eine hinreichend kleine Umgebung der Entwicklungsstelle sind mit Hilfe der TAYLOR-Entwicklung rationale Näherungsformeln für viele Funktionen hergeleitet worden, deren erste Glieder für einige dieser Funktionen in Tabelle 7.3 wiedergegeben sind Angaben über die Genauigkeit wurden durch Abschätzung des Restgliedes erhalten. Weitere Möglichkeiten der angenäherten Darstellung von Funktionen, z B durch Interpolations- und Ausgleichspolynome oder Spline-Funktionen, findet man in 19.6, S. 945 und 19.7, S. 959 7.3.5 Asymptotische Potenzreihen Zur Funktionswertberechnung können auch divergente Reihen nützlich sein. Im folgenden werden einige asymptotische Potenzreihen bezüglich - zur Berechnung von Funktionswerten für große Werte von \x\ betrachtet. 7.3.5.1 Asymptotische Gleichheit Zwei Funktionen f(x) und g(x), die für xq < x < oo definiert sind, heißen asymptotisch gleich für x —? oo , wenn fix) lirn^ ^ = 1 G.98a) bzw. f{x) = g{x) + o{g(x)) für x -> oo G.98b) x~*°° g\x) gilt. Dabei wird in o(g(x)) das LANDAU-Symbol „klein o" verwendet (s 2 1 4.9, S. 57). Wenn G 98a bzw. b) erfüllt ist, schreibt man auch f(x) ~ g(x). MAiVx^Tl-x ¦B:ei-1. ¦ C: f \ ~ A Ax6 + x + 2 4x2 7.3.5.2 Asymptotische Potenzreihen 1. Begriff der asymptotischen Potenzreihe Eine Reihe Z^Lo ~ heißt asymptotische Potenzreihe der Funktion f(x), die für x > x0 definiert ist, wenn /(*) = E£ + o(-ir) G-99)
436 7. Unendliche Reihen für jedes n = 0,1,2,. gilt. Dabei wird in 0(——) das LANDAU-Symbol „groß O" verwendet Für au G 99) schreibt man auch f{x) sa ^ — Tabelle 7 3 Näherungsformeln für einige oft gebrauchte Funktionen Näherungsformel sin x « x x3 sin x « x 6 cosx « 1 1 *2 COS X « 1 — tan x « x x3 tan x « x 4- — o \/a2 + x « a 4- •£- 2a 1/ a2 + x\ -2(8 + —j 1 1 X Va2 4- x a 2a3 1 _ 1 x a 4 x a a2 e* » 1 4- x ln(l +x) « x Nächstes Glied x3 6 X5 + 120 x2 2 x4 + 24 x3 2 5 + 15* x2 8a3 3x2 + 8a5 x2 a-3 x2 X2 2 Zulässiges Intervall für x bei einem Fehler von 0,1% von -0,077 -4,4° -0,580 -33,2° -0,045 -2,6° -0,386 -22,1° -0,054 -3,1° -0,293 -16,8° -0,085a2 -0,051a2 -0,031a -0,045 -0,002 bis 0,077 4,4° 0,580 33,2° 0,045 2,6° 0,386 22,1° 0,054 3,1° 0,293 16,8° 0,093a2 0,052a2 0,031a 0,045 0,002 1% von -0,245 -14,0° -1,005 -57,6° -0,141 -8,1° -0,662 -37,9° -0,172 -9,8° -0,519 -29,7° -0,247a2 -0,157a2 -0,099a -0,134 -0,020 bis 0,245 14,0° 1,005 57,6° 0,141 oM° 0,662 37,9° 0,172 9,8° 0,519 29,7° 0,328a2 0,166a2 0,099a 0,148 0,020 10% von -0,786 -45,0° -1,632 -93,5° -0,415 -25,8° -1,036 -59,3° -0,517 -29,6° -0,895 -51,3° -0,607a2 -0,488a2 -0,301a -0,375 -0,176 bis 0,786 45,0° 1,632 93,5° 0,415 25,8° 1,036 59,3° 0,517 29,6° 0,895 51,3° 1,545a2 0,530a2 0,301a 0,502 0,230 2. Eigenschaften asymptotischer Potenzreihen a) Eindeutigkeit: Existiert für eine Funktion /(x) die asymptotische Potenzreihe, dann ist sie eindeutig, aber durch eine asymptotische Potenzreihe ist eine Funktion nicht eindeutig bestimmt b) Konvergenz: Von einer asymptotischen Potenzreihe muß keine Konvergenz gefordert werden A: e* y^ —— ist eine asymptotische Reihe, die für alle x mit |x| > x0 (xq > 0) konvergiert. roo e~xt B: Wiederholte partielle Integration ergibt für das Parameterintegral fix) = / dt (x > 0), jq 1 +1
74 Fourier-Reihen 437 X X2 X3 X4 dasfürx > 0 konvergiert, die Darstellung/(x) = ö + ~^ 7^' + (—l)n * '- + Rn(x) mit f,\ roo p—xt „~| /.qo 77! 1 K(x) = (-1)n^ I (T^y^ dt ¦Wegen |iJn(l)l - F /o e dt = ^ g;lt *»(*) = o(^) (i + ty und damit /.' Die asymptotische Potenzreihe G 100) ist divergent für alle x , da der Betrag des Quotienten aus dem n + 1 (n + l)-ten und dem n-ten Glied den Wert hat. Trotzdem ist diese divergente Reihe zur Funkti- x onswertberechnung von f(x) gut geeignet. So erhält man z B für x = 10 mit Hilfe der Partialsummen roo p —10t 54A0) und 55A0) die Abschätzung 0,09152 < / dt < 0,09164 Jo 1 +1 7.4 Fourier-Reihen 7.4.1 Trigonometrische Summe und Fourier—Reihe 7.4.1.1 Grundbegriffe 1. Fourier-Darstellung periodischer Funktionen (Fourier-Analyse) Oft ist es notwendig oder vorteilhaft, eine gegebene periodische Funktion f(x) mit der Periode T exakt oder angenähert durch eine Summe aus trigonometrischen Funktionen in der Form sn{x) = — + fli cosa;x + a2 cos 2ux + • • • + an cos nux +61 sina;x + b2siu2ux + • • • + bn sin nux G.101) 27T darzustellen Man spricht von FOURIER-Entwicklung Dabei gilt für die Kreisfrequenz u = — Im Falle T = 2tt ist u = 1. Die beste Approximation von f(x) in dem in 7.4.1.2, S. 438 angegebenen Sinne erreicht man mit einer Näherungsfunktion sn(x), wenn für die Koeffizienten a* und bk (k = 0,1, 2,.. , n) die FOURIER- Koeffizienten der gegebenen Funktion gewählt werden. Ihre Bestimmung geschieht analytisch mit Hilfe der EULERschen Formeln T x0+T T/2 dk = — I f{x) cos kux dx = — / f(x) cos kuox dx = — [f{x) + f(—x)] cos kux dx , G.102a) 0 XQ 0 T xo+T T/2 bk — — f{x) sin kux dx = — / f(x) sm kux dx = 7^ [f(x) — f{—x)] sin kux dx , G.102b) 0 XQ 0 oder näherungsweise mit Hilfe der Methode der harmonischen Analyse (s 19 6 4, S. 954). 2. Fourier-Reihe Wenn für ein System von rc-Werten die Funktion sn(x) beim Übergang n —> 00 gegen einen bestimmten Grenzwert s(x) strebt, dann gibt es für diese x eine konvergente FOVRIER-Reihe der gegebenen Funktion. Sie kann in der Form s(x) = — + cl\ qosux 4- ü2 cos 2ux + • • • + an cos nux + • • • +&i sin ux + 62 sin 2ux + • • • + bn sin nux + • • • G 103a)
438 7. Unendliche Reihen und auch in der Form s(x) — TT + ^1 sin(ujx + (fi) + A2 sinBu;;r + ^2) H H ;4n sin(no;a; + </?n) + • • • G 103b) dargestellt werden, wobei im zweiten Falle gilt- Ak = \fak2 + 6fc2, tanp* = ^ . G.103c) Ok 3. Komplexe Darstellung der Fourier-Reihe In vielen Fällen hat die komplexe Schreibweise Vorteile. +00 s(x)= J2 c^kux, G.104a) k——00 1 Ck = ±//<*)« a0 fürfc = 0, ^(a/b-iftfc) fürfc>0, G 104b) -(a_fc + ib-k) fürfc < 0. 7.4.1.2 Wichtigste Eigenschaften von Fourier—Reihen 1. Mittlerer quadratischer Fehler einer Funktion Wenn eine Funktion f(x) durch eine trigonometrische Summe n n n sn(x) = —- + J2 ak cos kujx + ^2 bk sin /ccjx , G 105a) ^ Jfe=i fc=l auch FoURlER-5wrarae genannt, angenähert wird, dann ist der mittlere quadratische Fehler (s 19 6.2 1, S 947, 19.6.4 1,2.,2., S. 955) 1 T F = fJ[f(x)-sn(x)]2dx G 105b) 0 am kleinsten, wenn für Ofc und bk die FOURIER-Koeffizienten G.102a,b) der gegebenen Funktion zur Näherung benutzt werden. 2. Konvergenz einer Funktion im Mittel, Parsevalsche Gleichung Die FOURIER-Reihe konvergiert im Mittel gegen die gegebene Funktion, d.h., es gilt T f[f(x) - sn(x)]2 dx-*Q für n -» 00 , G.106a) 0 wenn die Funktion beschränkt und im Intervall 0 < x < T stückweise stetig ist. Eine Folge der Konvergenz im Mittel ist die PARSEVALsc/ie Gleichung: T ± j[f{x)f dx = ^ + £(a*2 + h2). G.106b) 0 fc=1 3. Dirichletsche Bedingungen Wenn die Funktion f(x) die DiRlCHLETschen Bedingungen erfüllt, d.h. wenn a) das Definitionsintervall in endlich viele Intervalle zerlegt werden kann, in denen die Funktion f(x) stetig und monoton ist, und b) an jeder Unstetigkeitsstelle von f(x) die Werte f(x + 0) und f(x — 0) definiert sind,
7.4 Fourier-Reihen 439 dann konvergiert die FOURIER-Reihe dieser Funktion. Der Summenwert der Reihe ist dort, wo f(x) ffx - 0) + fix + 0) stetig ist, gleich f(x), in den Unstetigkeitsstellen gleich — 4. Asymptotisches Verhalten der Fourier-Koeffizienten Wenn eine periodische Funktion f(x) mit ihren Ableitungen bis zur k-ten Ordnung stetig ist, dann streben für n —? oo die Ausdrücke annk+1 und bnnk+1 gegen Null. f(x) 1 T 2 Abbildung 7.2 Abbildung 7.3 Abbildung 7.4 7.4.2 Koeffizientenbestimmung für symmetrische Funktionen 7.4.2.1 Symmetrien verschiedener Art 1. Symmetrie 1. Art Wenn f{x) eine gerade Funktion ist, d.h. wenn f(x) = f{—x) (Abb.7.2), dann gilt für die Koeffizienten T/2 4 f Zttx a* = fJ /(aOcosfc—dz, bk = 0 (fc = 0,1,2,...). G.107) 2. Symmetrie 2. Art Wenn f(x) eine ungerade Funktion ist, d.h. wenn f(x) = —f(—x) (Abb.7.3), dann gilt für die Koeffizienten T/2 Öfc : = 0, h = - I f(x)smk-^dx (fc = 0,l,2,...) G 108) 3. Symmetrie 3. Art Wenn für f(x + T/2) = —f{x) gilt (Abb.7.4), dann ergeben sich die Koeffizienten zu T/2 4 f Zttx a>2k+i = j, J f(x) cosBk + 1)— dx, a2k = 0, G.109a) T/2 4 f Zttx Sfc+i = f J fix) sinB/c + 1)— dx , b2k = 0 (k = 0,1,2,. .). G.109b) 4. Symmetrie 4. Art Wenn die Funktion f(x) ungerade ist und außerdem der Symmetrie 3. Art genügt (Abb.7.5a), dann gilt für die Koeffizienten T/4 O f ZTTX ak = b2k = 0, b2k+1 = - J f(x)sinBA; + 1)— dx (k = 0,1,2,. G.110)
440 7 Unendliche Reihen Wenn die Funktion f(x) gerade ist und außerdem der Symmetrie 3. Art genügt (Abb.7.5b), dann gilt für die Koeffizienten T/4 bk = a2k = 0, a2k+1 = ^jf(x) cosBk + l)^dx (k = 0,1,2,...). G 111) Abbildung 7.5 m / 1 0 fM, l / /Vf^x) J21 , X f(*> \ ° f(x^" / i' \ 21 / uwyv X Abbildung 7.6 Abbildung 7.7 7.4.2.2 Formen der Entwicklung in eine Fourier-Reihe Jede Funktion f(x), die in einem Intervall 0 < x < l die DiRiCHLETschen Bedingungen erfüllt (s. 7.4.1.2,3., S. 438), kann in diesem Intervall in konvergente Reihen folgender Formen entwickelt werden: . , x a0 2irx n^7TX 27nr /i(x) = -^- + ai cos —-—h a2 cos 2——| 1- an cos n——h . . . 27TX . . 2lTX , . 27TX + Ol sin —-—I- 02 sin 2——I + onsin n——h G 112a) Die Periode der Funktion fi(x) ist T = l, im Intervall 0 < x < l ist /i(x) identisch mit der Funktion f(x) (Abb.7.6). In den Unstetigkeitsstellen wird f(x) = -[f(x — 0) + /(x + 0)] gesetzt Die Entwick- lungskoeffizienten werden mit Hilfe der EuLERschen Formeln G.102a,b) für u = —- bestimmt r / \ a0 KX nKX 2. f2(x) = — + aicos— + a2cos2— + • 7TX ¦ + ancosn— + • G.112b) Die Periode der Funktion /2(x) ist T = 2/; im Intervall 0 < x < l ist /2(x) von der Symmetrie 1 Art und identisch mit f(x) (Abb.7.7). Die Entwicklungskoeffizienten für /2(x) werden nach den Formeln für den Fall der Symmetrie 1 Art mit T = 21 bestimmt. r , \ , . 7TX . . nx f3(x) = öi sin — + 02 sin 2— + • • + bn sin n— + • G.112c) Die Periode der Funktion f3(x) ist T = 21, im Intervall 0 < x < l ist fs(x) von der Symmetrie 2. Art und identisch mit f(x) (Abb.7.8). Die Entwicklungskoeffizienten werden mit den Formeln für den Fall
7.4 Fourier-Reihen 441 der Symmetrie 2. Art für T = 21 bestimmt f(x)f i(x)y" IT T x Abbildung 7 8 Abbildung 7.9 7.4.3 Koeffizientenbestimmung mit Hilfe numerischer Methoden Wenn die periodische Funktion f(x) kompliziert ist oder im Intervall 0 < x < T nur für ein diskretes kT System von Punkten Xk = — mit k = 0,1,2, , TV—1 bekannt ist, muß die Berechnung der FOURIER- Koeffizienten näherungsweise erfolgen Dabei kann z B bei der Auswertung von Meßergebnissen die Zahl N sehr groß sein. In diesen Fällen wendet man die Methoden der numerischen harmonischen Analyse an (s 19 6.4, S. 954) 7.4.4 Fourier—Reihe und Fourier—Integral 1. Fourier-Integral Wenn die Funktion f(x) in einem beliebigen endlichen Intervall die DiRiCHLETschen Bedingungen +oo erfüllt (s 7 4 1.2,3., S 438) und außerdem das Integral / \f(x)\ dx konvergiert (s 8.2.3.2,1.), S. 471), —oo dann gilt für ihre Darstellung (FOURIER-Integral). +oo +oo oo +oo f(x) = — I eiu,xduj f f(t)e-'wtdt = - j du J f(t) cos u(t - x) dt G.113a) G.113b) In den Unstetigkeitsstellen setzt man m = \\f(*-o)+f(x+o)]. 2. Grenzfall einer nichtperiodischen Funktion Die Formel G 113a) kann als Grenzfall der Entwicklung einer nichtperiodischen Funktion f(x) in eine trigonometrische Reihe im Intervall (—/, +/) für Z —? oo aufgefaßt werden Mit Hilfe der FoURiERschen Reihenentwicklung wird eine periodische Funktion mit der Periode T als 27T Summe harmonischer Schwingungen mit den Frequenzen ujn = n— mit n = 1,2, .. und den Amplituden An dargestellt Diese Darstellung beruht somit auf einem diskreten Frequenzspektrum. Im Unterschied dazu wird mit Hilfe des FOURIER-Integrals die nichtperiodische Funktion f(x) als Summe unendlich vieler harmonischer Schwingungen mit stetig variierender Frequenz u dargestellt. Das FOURIER-Integral liefert somit eine Entwicklung der Funktion f(x) in ein kontinuierliches Frequenzspektrum. Hierbei entspricht der Frequenz u die Dichte des Spekrums. 9(w) ¦ +oo t, I n* ldt. G 113c)
442 7. Unendliche Reihen Das FOURIER-Integral ist von einfacherer Form, wenn die Funktion f(x) entweder a) eine gerade oder b) eine ungerade Funktion ist. a) f(x) = — cos lux du / / (t) cos ut dt, G 114a) o o oo oo b) f(x) = - f sin lux du f f(t) sin ut dt G 114b) ¦ Für die gerade Funktion f(x) = e '*' ergeben sich die Dichte des Frequenzspektrums und die Darstellung der Funktion zu g(u>) = - re-tcosutdt = --^-- G.115a) und e~W = - f° ^^ dw G.115b) yv ' Wo iru2 + l v ' Wo u2 + 1 y ' 7.4.5 Hinweise zur Tabelle einiger Fourier—Entwicklungen In Tabelle 21.6 sind die FOURIER-Entwicklungen einiger einfacher Funktionen angegeben, die in einem bestimmten Intervall gegeben sind und darüber hinaus periodisch fortgesetzt werden. Der Kurvenverlauf der entwickelten Funktion ist graphisch dargestellt. 1. Anwendung von Koordinatentransformationen Viele der einfachsten periodischen Funktionen können auf die in der Tabelle 21.6 dargestellten Funktionen zurückgeführt werden, indem man entweder den Maßstab auf den Koordinatenachsen ändert oder den Koordinatenursprung verschiebt ¦ Eine Funktion f(x) = f(—x), die durch die Bedingungen IT 2 für 0 < x < - , T \ G.116a) 0 für - < x < - gegeben ist (Abb.7.9), kann auf die Form 5 in der Tabelle 21.6 gebracht werden, indem a = 1 gesetzt 27T3J TT wird und die neuen Variablen Y = y — 1 und X = —— + — eingeführt werden. Durch die Variablen- (QiTTX TT \ QiTTX —— + — J = (—l)n cosBn + l)-^r" für die darzustellende Funktion G.116a) den Ausdruck „ 4/ 2ttx 1 2ttx 1 2ttx \ ,„„„^ y = ^ + - (^cos— - -cos3— + -cos5— J G.116b) 2. Nutzung der Reihenentwicklung komplexer Funktionen Viele der in Tabelle 21.6 angegebenen Formeln für die Entwicklung von Funktionen in trigonometrische Reihen können aus Potenzreihenentwicklungen für Funktionen einer komplexen Veränderlichen hergeleitet werden. ¦ Die Entwicklung der Funktion T-i-^ = l + 2 + z2 + -.. (|*| <1) G.117) liefert für z = aei<p G.118)
7.4 Fourier-Reihen 443 nach der Trennung von Real- und Imaginärteil 9 n \ — a cos ip 1 + a cos (p + a cos 2<p H |- a cos n<zH = ~ , 1 — 2a cos <£ + a2 asiny? -I- a2sin2<p H h an sinnt/? 4- • • • = für \a\ < 1. G.119) 1 — 2a cos ip + al
444 8 Integralrechnung 8 Integralrechnung 1. Integralrechnung und unbestimmtes Integral Die Integralrechnung stellt im folgenden Sinne die Umkehrung der Differentialrechnung dar. Während bei der Differentialrechnung zu einer gegebenen Funktion f(x) die Ableitung f'(x) zu bestimmen ist, wird in der Integralrechnung zu einer gegebenen Ableitung f'(x) eine Funktion gesucht, deren Ableitung mit der vorgegebenen übereinstimmt Dieser Prozeß ist nicht eindeutig und führt auf den Begriff des unbestimmten Integrals. 2. Bestimmtes Integral Geht man von der anschaulichen Aufgabenstellung der Integralrechnung aus, den Inhalt der Fläche unter der Kurve y = f{x) zu bestimmen, indem man diesen z.B. durch hinreichend schmale Rechtecke approximiert (Abb.8.1), dann kommt man zum Begriff des bestimmten Integrals. 3. Zusammenhang zwischen unbestimmtem und bestimmtem Integral Den Zusammenhang zwischen den genannten Integralarten vermittelt der Hauptsatz der Integralrechnung (s. 8.2.1.2,1., S 458). 8.1 Unbestimmtes Integral 8.1.1 Stammfunktion oder Integral 1. Definition Stammfunktion oder Integral einer gegebenen Funktion y = f(x), die in einem zusammenhängenden Intervall [a, b] definiert ist, wird eine differenzierbare Funktion F(x) genannt, die in demselben Intervall definiert ist und deren Ableitung gleich f(x) ist f(x) = /(*). (8 1) Da bei der Differentiation einer Funktion eine additiv auftretende Konstante verschwindet, existieren zu einer gegebenen Funktion unendlich viele Stammfunktionen Die Differenz zweier Stammfunktionen ist eine Konstante Daher können die Bilder aller Stammfunktionen Fi(x),F2(x), . ,Fn(x) zu einer gegebenen Funktion durch Parallelverschiebung einer bestimmten Stammfunktion in Richtung der Ordinatenachse erzeugt werden (Abb.8.2). 01 a=xn x, x. 1 A2 Xk-1 Sk Xk Xk+1 Vi Xn-b X Abbildung 8.1 Abbildung 8.2 Abbildung 8.3 2. Existenz Jede in einem zusammenhängenden Intervall stetige Funktion besitzt dort eine Stammfunktion Im Falle von Unstetigkeitsstellen wird das Intervall in Teilintervalle zerlegt, in denen die Aus-
8.1 Unbestimmtes Integral 445 gangsfunktion stetig ist (Abb.8.3). Die gegebene Funktion y = f(x) befindet sich im oberen Teil der Abbildung, die Stammfunktion y = F(x) im unteren 8.1.1.1 Unbestimmte Integrale Das unbestimmte Integral einer gegebenen Funktion f(x) ist der allgemeine Ausdruck F{x) + C= f f{x)dx. (8 2) Die Funktion /(*) unter dem Integralzeichen / heißt Integrand, x ist die IntegraUonsvanable, C die Integrationskonstante Es ist auch üblich, vor allem in der Physik, das Differential dx unmittelbar hinter das Integralzeichen und damit vor f(x) zu setzen. 8.1.1.2 Integrale elementarer Funktionen 1. Grundintegrale Die Integration der elementaren Funktionen in analytischer Form wird auf eine Reihe von Grundintegralen zurückgeführt. Diese Grundintegrale können unmittelbar aus den Ableitungen bekannter elementarer Funktionen gewonnen werden, da das unbestimmte Integrieren einer Funktion f(x) das Aufsuchen einer Stammfunktion F(x) bedeutet Die in der Tabelle 8.1 zusammengestellten Integrale ergeben sich aus der Umkehrung der wichtigsten Differentiationsformeln der Tabelle 6.1, S.396 (Ableitungen elementarer Funktionen). Die Integrationskonstante C ist weggelassen worden. 2. Allgemeiner Fall Bei der Lösung von Integralen wird versucht, ein gegebenes Integral durch algebraische und trigonometrische Umformungen bzw durch Anwendung von Integrationsregeln auf die Grundintegrale zurückzuführen Die im Abschnitt Integrationsregeln (s 8.1 2, S 445ff) angegebenen Integrationsmethoden ermöglichen die Integration von Funktionen, die eine elementare Stammfunktion besitzen. Die Integrationsergebnisse sind in der Tabelle21.7, S. 1053ff. (Unbestimmte Integrale) zusammengestellt. Folgende Hinweise sind bei der Benutzung zu beachten: a) Die Integrationskonstante wurde meist weggelassen. Ausgenommen sind einige Integrale, die in verschiedenen Formen mit verschiedenen beliebigen Konstanten darstellbar sind. b) Tritt in der Stammfunktion ein Ausdruck auf, der In f(x) enthält, dann ist darunter stets In |/(a;)| zu verstehen c) Wenn die Stammfunktion durch eine Potenzreihe dargestellt ist, kann die Funktion nicht elementar integriert werden. Eine ausführlichere Zusammenstellung enthalten die Tabellenwerke dieser Taschenbuchserie [8.1], [8.3]. 8.1.2 Integrat ionsregeln Eine allgemeine Regel für die Berechnung eines Integrals mit einem Integranden aus beliebigen elementaren Funktionen kann nicht angegeben werden. Durch Üben kann man sich eine gewisse Routine im Integrieren aneignen. Heute setzt man zur Berechnung von Integralen meist Computer ein. Die wichtigsten Integrationsregeln für unbestimmte Integrale, die anschließend erläutert werden, findet man zusammengefaßt in der Tabelle 8.2 (Wichtige Integrationsregeln für unbestimmte Integrale) 1. Integrand mit konstantem Faktor Ein konstanter Faktor im Integranden kann vor das Integralzeichen gezogen werden (Faktorregel). f öl f(x) dx = Ol f f{x) dx. (8 3)
446 8 Integralrechnung 4) 2. Integration einer Summe oder Differenz Das Integral einer Summe oder Differenz kann auf die Integrale der einzelnen Terme zurückgeführt werden {Summenregel): (u + v — w)dx = l udx + I vdx — wdx. { Die Variablen u,v,w sind Funktionen von x . //. x5 3 10 (x + 3J(x2 + 1) dx = / (x4 + 6x3 + 10z2 + 6x + 9) dx = — + -x4 + —x3 + 3x2 + 9x + C J 5 2 3 Tabelle 8.1 Grundintegrale Potenzen jx"dx = ^ (n^-1) / f =ln|x| Trigonometrische Funktionen -cosx vdx = sin x / sin x dx = / cosxc / tan x dx = — In | cos x\ / cotxdx = ln|sinx| [-4%- = tanx J COS X /: dx -cotx Gebrochenrationale Funktionen / )dx o = A arctan £ A -^.jA«»hS-ito|f±|| (für |x| < a) dx _ lAr™+Vi£— 1 In [X - gl r—z - -^Arcotri 5 - ^ In 1^-^ (für |x| > a) Exponentialfunktionen ! ex dx ¦ Hyperbelfunktionen sinh xdx = cosh x cosh xdx = sinh x / / / tanh x dx = In | cosh x| / coth x dx = In | sinh x| A y si] ^o =tanh x cosh x dx — coth x Irrationale Funktionen /7fe = arcsini / fr = Arsinh £ = In Ix + Vx2 + a2 7 Va + x2 "l / dx VX = Arcosh | = ln x + \/x2 — a2 3. Umformung des Integranden Die Integration eines komplizierten Integranden läßt sich durch algebraische oder trigonometrische Umformung auf einfachere Integrale zurückführen. I / sin 2x cos xdx = I - (sin 3x + sin x) dx
8.1 Unbestimmtes Integral 447 Tabelle 8.2 Wichtige Integrationsregeln für unbestimmte Integrale Regel Integrationskonstante Integration und Differentiation Faktorregel Summenregel Partielle Integration Substitutionsregel Spezielle Form des Integranden Integration der Umkehrfunktion Formel für die Integration f f(x) dx = F(x) + C {C const) F'(*) = g = /(,) / af(x) dx = a f(x) dx (a const) / [u(x) ± v{x)] dx = u(x) dx ± v(x) dx / u(x)v'(x) dx = u(x)v(x) — / u'(x)v(x) dx x = u(t) bzw t = v(x), u und v seien zueinander Umkehrfunktionen : / f(x) dx= f f{u(t))u'{t) dt bzw. 1. / . dx = In \f(x)\ 4- C (logarithmische Integration) J J\x) 2 j f(x)f(x)dx = -f(x) + C u und v seien zueinander Umkehrfunktionen • / u(x) dx = xu(x) — F(u(x)) + Ci mit F(x) = / v{x) dx + C2 (Ci, C2 const) 4. Lineare Transformation im Argument Ist / f(x) dx = F(x) bekannt, z.B. aus einer Integraltafel, dann gilt: / f{ax) dx = -F{ax) + C, (8.5a) J f(x + b)dx = F{x+ b)+ C, (8.5b) f f{ax + b)dx= -F{ax + b) + C. (8.5c) A: / sin axdx = — cos ax + C. J a -/• B: /eaa;+0dx = -eaa;+6 + C. a C: / ^ 7 ^t — arctan(a; + a) + C. J l + fx + aJ -"(^+aJ 5. Spezielle Form des Integranden a) Wenn der Integrand ein Bruch ist, in dem der Zähler die Ableitung des Nenners ist, dann ist das Integral gleich dem Logarithmus des Absolutbetrages des Nenners- / ^TT dx = [ ^rv- = In |/(&)| + C (logarithmische Integration). (8.6) J f(x) J f(x)
448 8. Integralrechnung M A: / -^-±^—dx = \n\x2 + 3x-5\ + C J x2 + 3x - 5 b) Wenn der Integrand ein Produkt der Potenz einer Funktion multipliziert mit der Ableitung der Funktion ist, und ist die Potenz ungleich — 1, dann gilt / f'(x)fa(x) dx= f fa{x) dx = ^ V + C (a const, ol±-1) (8 7) J J a 4-1 J (x2 + 3x- 5K (~2){x2 + 3x-5J 6. Substitutionsmethode Ist x = u(t) bzw ist t = v(x) die Umkehrfunktion zu x = u(t), dann gilt Jf(x)dx = Jf(u(t))u'(t)dt bzw. J f(x)dx = Ji^ldt. (8.8) /ex — 1 dx 1 dx . Substitution x = Int, (£ > 0), —- = - , danach Partialbruchzerlegung: ex ~\~ 1 dt t ieHl J t + 1 t J \t + l t) v ; _ „ /• xdx „ , . . . o dt ^ r xdx r dt 1 . 9x ^ ¦ B: / . Substitution 1 + x2 = t, — = 2x. / = — = - InA + x2) + C. y 1 + x2 'da; 7 1 + x2 J 2t 2 v ; 7. Partielle Integration / u(x)v'(x) dx = u(x)v(x) — / u'(x)v(x) dx, (8 9) wobei u(x) und v(x) stetige Ableitungen besitzen müssen ¦ Das Integral / xex dx kann durch partielle Integration gelöst werden, indem man u = x und v' = ex setzt, was auf u' = 1 und v = ex führt: / xex dx = xex — / ex dx = (x — l)ex + C 8. Nichtelementare Integrale Integrale elementarer Funktionen sind nicht immer elementare Funktionen. Solche Integrale werden hauptsächlich mit Hilfe der folgenden drei Methoden gelöst, wobei die Stammfunktion in einer bestimmten Näherung berechnet wird: 1. Wertetabellen Integrale von besonderem theoretischen oder praktischen Interesse, die sich nicht durch elementare Funktionen ausdrücken lassen, können durch eine Wertetabelle dargestellt werden Dabei wird die Integrationskonstante durch Festlegung der unteren Integrationsgrenze bestimmt Solchen speziellen Funktionen werden meist besondere Namen und Zeichen zugeordnet. Beispiele sind rx dt ¦ A: Integrallogarithmus (s 8 2.5,3., S 477) : / -— = Li (x). (8 10) Jo int dt y/(i-m-tH2) /•sin v dl B: Elliptisches Integral 1. Gattung (s. 8 1.4.3, S. 453) : / ; = F(k, u>) (8 11) h J(i-t*)(l-tH2) M C: Fehlerintegral (s. 8.2.5,5., S 478) . -= [* e~t2 dt = erf (x). (8.12) y/n Jo 2. Integration durch Reihenentwicklung Der Integrand wird in eine Reihe entwickelt, die im Falle ihrer gleichmäßigen Konvergenz gliedweise integriert werden kann. rx cin l M A: Integralsinus (s 8 2 5,1., S 477) / dt = Si (x) (8 13) Jo t
8 1 Unbestimmtes Integral 449 ¦ B: Integralexponentialfunktion (s 8 2 5,4. S. 478) : f — dt = Ei (x) (8.14) J—oo t 3. Graphische Integration ist eine dritte Näherungsmethode, die in 8.2.1.4,5., S. 463 behandelt wird 8.1.3 Integration rationaler Funktionen Integrale rationaler Funktionen können stets durch elementare Funktionen ausgedrückt werden 8.1.3.1 Integrale ganzrationaler Funktionen (Polynome) Integrale ganzrationaler Funktionen werden durch direkte gliedweise Integration berechnet: / ( anxn + an-\Xn~l + • • • + d\x -f clq) dx = ^xn+l + ^xn + ... +?±x2 + aQX + C (815) n + 1 n 2 8.1.3.2 Integrale gebrochenrationaler Funktionen Integrale gebrochenrationaler Funktionen / dx, wobei P(x) und Q(x) Polynome vom Grade m J Q{x) bzw n sind, werden algebraisch auf eine leicht integrierbare Form gebracht. Dazu dient die folgende Verfahrensweise: 1. Kürzung des Bruches bis P(x) und Q(x) keine gemeinsamen Teiler mehr enthalten 2. Abspaltung des ganzrationalen Teiles, wenn m > n ist, indem P(x) durch Q(x) geteilt wird. Zu integrieren verbleiben dann ein Polynom und ein echter Bruch. 3. Zerlegung des Nenners Q(x) in lineare und quadratische Faktoren (s. 1.6.3.2, S. 44): Q(x) = an{x - a)k{x - ßI • • • {x2 + px + q)\x2 + p'x + q')s ¦ ¦ (8.16a) v2 v'2 mit *L-q<oi (l__g'<o,... (816b) 4. Vorziehen des konstanten Koeffizienten an vor das Integralzeichen. 5. Zerlegung in eine Summe von Partialbrüchen: Der so erhaltene echte Bruch, der nicht mehr gekürzt werden kann und dessen Nenner in seine irreduziblen Faktoren zerlegt ist, wird in eine Summe von Partialbrüchen zerlegt (s. 1.1.7 3, S. 15), die leicht integriert werden können 8.1.3.3 Vier Fälle bei der Partialbruchzerlegung 1. Fall: Alle Wurzeln des Nenners sind reell und einfach Q(x) = (x- a){x -ß)...(x-\) (8.17a) a) Form der Zerlegung- P{x) A B L Q{x) x — a x — ß (8.17b) . A P{a) n P{ß) T P{\) ,01GN mrt A=wdr B=m- 'L=^M (8-17c) b) Die Zahlen A, B, C,..., L können auch mit Hilfe der Methode der unbestimmten Koeffizienten berechnet werden (s 1 1 7.3,4., S. 16). /A dx = A\n(x — a). (8.17d) x — a
450 8. Integralrechnung r Bx + 3)dx 2x + 3 _A B C _ P(Q) _ / 2x + 3 \ ~ J x3 + x2- 2x ' x(x-l)(x + 2) ~ x+ x-l + x + 2' ~ Q'@) ~ V 3x2 + 2 x - 2) x=0 _3 2' P ^ / 2x + 3 \ =5 / 2x + 3 \ =_1 V3.^2 + 2a;-2yx=i 3' \3x2 + 2x - 2)x=.2 6' I = j(^l + -!-_ + _ZI_>j da; = -? In x + | ln(x - 1) - i ln(a: + 2) + Ci = In * ¦,-l"s + 2;-- ^n.+ 3ln(,-l)--ln(, + 2) + C^ln^^I/6 2. Fall: Alle Wurzeln des Nenners sind reell, einige von ihnen sind mehrfach Q(x) = {x- a)l{x -ß)m--- (8.18a) a) Form der Zerlegung- P(x) _ Ax t A2 t _ _ Ai Q(x) (x — a) (x — aJ (x — aI b) Berechnung der Konstanten A\, A2,..., Ai, B\, B2,.. , Bm mit Hilfe der Methode der unbestimmten Koeffizienten (s. 1.1 7 3,4., S. 16). c) Integration gemäß I~W-*> /Ä°-(*-l)?-a^ (k>l)- (8'18C) ¦ ¦* = / ~7 ^dx: — — = —I -+- —+- — . Die Berechnung der Konstanten J x(x - lK a;(x - lK x x—l (x - lJ (x - lK mit Hilfe der Methode der unbestimmten Koeffizienten ergibt A + B\ = 1, —3,4 — 2i?i + B2 = 0, 3,4 + ßi - B2 + 53 = 0 , -A = 1; ;4 = -1, Bx = 2 , 52 = 1, ß3 = 2 . Die Integration erfolgt gemäß I -i 1 2 1 ¦ + r + - a; x — l (x — lJ (x — 1); dx = -lnx + 21n(a;-l) — + C x - 1 (x — lJ , (x-1J s 3. Fall: Einige Wurzeln des Nenners sind einfach komplex Im Falle reeller Koeffizienten von Q(x) treten komplexe Wurzeln stets auch konjugiert komplex auf, so daß sie sich zu quadratischen Termen zusammenfassen lassen. Q(x) = (x- a)l(x -ß)m. . (x2 +px + q)(x2 +p'x + q')... (8.19a) v2 v'2 mit j<9, ^r-<q',.. (8.19b) a) Form der Zerlegung: Pix) Ax A2 Ai Bi B2 Bm Q(x) x — OL (x - olJ (x - aI x - ß (x - ßJ (x - ß)m Cx + D Ex + F . n , + — + — + ... (8 19c x2 + px + q xz + ipx + q b) Berechnung der Konstanten mit Hilfe der Methode der unbestimmten Koeffizienten (s. 1 1 7.3,4., S 16)
8 1 Unbestimmtes Integral 451 Cx 4- D c) Integration des Ausdrucks — gemäß xz + px + q r(Cx + D)dx C1/2 N D-Cp/2 x + p/2 / ^ — = — ln(x2 4- px 4- q) 4- , ' arctan , F/ . (8 19d) J x2+px + q 2 yfq-p2/4 ^Jq-p2/* /4 dx 4 A Cx 4- Z} — — . -= — = 1 - — . Die Methode der unbestimmten Koeffizienten liefert x6 + Ax x6 + 4x x xl 4- 4 A + C = 0,D = 0,4A = 4,A = 1,C=-1,D = 0.I= [(*-—?—) dx = In z - i ln( x2 + 4) + In Ci = In . , wobei in diesem Falle das Glied mit der Funktion arctan fehlt. \jx2 + 4 4. Fall: Einige Wurzeln des Nenners sind mehrfach komplex Q(x) = (x- a)k(x - ßI (x2 + px 4- q)m(x2 4- p'x 4- q')n .... (8 20a) a) Form der Zerlegung- P(x) Ai A2 Ak Bi B2 Bi ~ + 7 ^T + "- + 7 ^TT + ^ + 7 W + -- + Q(x) s-a (x-aJ (x-a)fc x-ß (x - ßJ {x - ß) x2 + pa; + q (x2 + p.T + qJ (x2 +px + q)m E1x + F1 E2X + F2 Enx + Fn x2 + p'x + q' {x2 4- p'x + <?'J (x2 + p'x + tf')n b) Berechnung der Konstanten mit Hilfe der Methode der unbestimmten Koeffizienten. C x + D c) Integration des Ausdrucks , „ m ^— mit m > 1 in folgenden Schritten: ' 6 (x2 + px + g)m a) Umformung des Zählers gemäß Cmx + Dm = ^fBx+p) + (Dm - ^f) (8.20c) ß) Zerlegung des gesuchten Integrals in zwei Summanden, wobei sich der erste direkt integrieren läßt: rCm Bx+p)dx = Cm 1 (820d) J 2 {x2+px + q)m 2{m- l) (x2 + px + q)m~l ' K ' 7) Der zweite Summand wird ohne den konstanten Faktor mittels Rekursionsformel berechnet. dx x + p/2 / (x2 +px + q)m 2(ra - 1) (q - p2/4) (x2 + px + q)m~l 2m — 3 r dx + - [7-0 x , • (8'20e) J (x2 + px + q)m-1 v 2(m- l)(q-p2/4)J (x2 4- px + q)n = J , _oW o . ,xo <& : 7 ^7-^7—T^ = « + ^—7- + / o ¦ ,xo Mlt Hllfe der 2x2 + 2x + 13 , 2x2+ 2x + 13 A Cxx + Dx C2x 4- D2 (Int- • — _|_ _|_ (£-2)(a;2 + lJ (x-2)(ir24-lJ x-2 x2 4-1 (x2 4- lJ Methode der unbestimmten Koeffizienten ergibt sich das Gleichungssystem A 4- C\ = 0, —2Ci 4- Di = 0,2A + Ci-2Di + C2 = 2,-2Ci + Di-2C2 + D2 = 2,A-2Di-2D2 = 13, woraus folgt A = l,Ci = -l|jDl = -2,C2 = -3,D2 = -4,/ = / (-1^ -0i- tJ^J ^.Da gemäß (8.20e) gilt f dx x 1 r dx x 1 . . . .. _,. . _ 3 — 4x I W^W = 2(^TT) + 2 I ^TT = ^^^ly + S^tan^er^btsichschheßhch/ = W^T) +
452 8. Integralrechnung 1 , (x - 2J - In —r 4 arctan x + C . 2 x2 + 1 Tabelle 8 3 Substitutionen zur Integration irrationaler Funktionen I Integral * /*(*.#^W /d/. n/aa; + 6 m/aa; 4- 6 y xi i x, y c;r _|_e, y cx _(_ e, dz / i2 f x, \/a:r2 + bx + cj dz 1. Füra>Ot 2 FüroO 3. Falls das Polynom ax2 + bx + c verschiedene reelle Wurzeln besitzt: ax2 + bx + c = a(x — a)(a; — /?) Substitution n ax + b . ex + e ax + b _ f ex + e wobei r das kleinste gemeinsame Vielfache der Zahlen m, n, .. ist Eine der drei EuLERsc/ien Substitutionen- Vax2 + bx + c = t — y/äx y/ax2 + bx + c = xt + y/c Vax2 + bx + c — t(x — a) * Das Symbol R bezeichnet eine rationale Funktion in den Ausdrücken, vor denen es steht. Die Zahlen n,m,. sind ganz t Ist a < 0 und hat das Polynom ax2 + bx + c komplexe Wurzeln, so ist der Inte- grand für keinen Wert von x definiert, da dann y/ax2 + bx + c für alle reellen Werte von x imaginär wird In diesem Falle ist ein Integrieren nicht von Interesse 8.1.4 Integration irrationaler Funktionen 8.1.4.1 Substitution zur Rückführung auf Integrale rationaler Funktionen Irrationale Funktionen können nicht immer elementar integriert werden. Die Tabelle 21.7, S 1053ff enthält eine ganze Reihe von Integralen irrationaler Funktionen In den einfachsten Fällen lassen sie sich durch Substitutionen, wie sie in Tabelle 8.3 aufgeführt sind, auf Integrale rationaler Funktionen zurückfuhren. Das Integral / R (x, Vax2 + bx + c) dx kann auch auf eine der drei Formen [ R(x,Vx2 + a2)dx, (8.21a) (R{x,\/x< a2) dx, f R(x,Va2-x2)dx (8.21b) (8.21c) gebracht werden, da sich das quadratische Polynom ax2 + bx + c stets als Summe oder Differenz zweier Quadrate darstellen läßt. Die Integrale der Form (8.21a) bis (8 21c) können dann mit Hilfe der in Tabelle 8.4 angegebenen Substitutionen bearbeitet werden A: 4a;2 + 16:r + 17 = a(x2 + 4x + 4 + i) = 4 \{x + 2J + Q) B: x2 + 3x + 1 = x2 + 3x + - - - = (x + -) - f ^r- xi + (i)' \/5' .. — ] mit xi mit^i = x + 2 3 = x+-
8 1 Unbestimmtes Integral 453 C: -x2 + 2x = 1 - x2 + 2x - 1 = l2 - (x - lJ = l2 - x\ mit Xi = x - 1 Tabelle 8.4 Substitutionen zur Integration irrationaler Funktionen II Integral / R (x, Vx2 + a2J dx 7ä (x, \/x2 - a2j dx / i? (x, Va2 - x2) dx Substitution x = a sinh t oder x = a tan £ x = öl cosh £ oder x = a sec £ x = a sin £ oder x = a cos £ 8.1.4.2 Integration binomischer Integranden Binomischer Integrand wird ein Ausdruck der Form xm(a + bxn)p (8 22) genannt, in dem a und b beliebige reelle Zahlen sind und m, n,p beliebige positive oder negative rationale Zahlen Der Satz von Tschebyscheff besagt, daß das Integral (8 23) J xrn(a + bxn)pdx nur in den folgenden drei Fällen durch Elementarfunktionen ausgedrückt werden kann: 1. Fall: Wennp eine ganze Zahl ist, kann der Ausdruck (a+bxn)p nach dem binomischen Satz entwickelt werden, so daß der Integrand nach Auflösen der Klammern eine Summe von Gliedern der Form cxk darstellt, die sich leicht integrieren lassen 2. Fall: Wenn eine ganze Zahl ist, kann das Integral (8.23) durch die Substitution t = y/a + bxn , wobei r der Nenner des Bruches p ist, auf ein Integral einer rationalen Funktion zurückgeführt werden 3. Fall: Wenn h p eine ganze Zahl ist, kann das Integral (8.23) durch die Substitution t = a + bxn , wobei r der Nenner des Bruches p ist, auf ein Integral einer rationalen Funktion zurückgeführt werden \fx *¦/¦ dx ¦¦ ¦i* V2, 1 + x 1/4 1/3 dx, m ¦ 1 ra+ 1 3' n 2, (Fall 2): Substitution t = ^1 4- ^x , x = (t3 - lL , dx = 12t2(t3 - lK dt, f * ~*~ dx = 12 f(t{ -13) dt = \t\tf ¦7) + C. x3 dx B:/w&^/x3A+a;3)/4-m=3'": 1 m + 1 : 3, p= --; 4 n 4 m + 1 3' n 13 + P=T2 Da keiner der drei Fälle vorliegt, kann das Integral keine elementare Funktion sein. 8.1.4.3 Elliptische Integrale 1. Unbestimmte elliptische Integrale Elliptische Integrale sind Integrale der Form ax3 + bx2 + ex + e) dx , R (x, yax4 + bx3 + ex2 + ex + f) dx. (8 24) Sie lassen sich in der Regel nicht durch elementare Funktionen ausdrücken; wenn dies trotzdem gelingt, nennt man sie pseudoelliptisch Ausgangspunkt für die Bezeichnung war das erstmalige Auftreten eines
454 8. Integralrechnung derartigen Integrals bei der Berechnung des Umfanges der Ellipse (s. 8.2.2.2,2., S. 466). Die Umkehrung der elliptischen Integrale sind die elliptischen Funktionen (s. 14.6, S. 724). Integrale der Art (8 24), die nicht elementar integrierbar sind, können durch eine Reihe von Umformungen auf elementare Funktionen und auf Integrale der folgenden drei Typen zurückgeführt werden (s. [21.1], [21.2], [21.6]). / , dt @ < k < 1), (8.25a) [ . A-kH^dt @<fc<l), (8.25b) J y/{l-t*)(l-k*t*) J yJ(l-t*)(l-kH*) f , dt @<fc<l). (825c) J {l + nt2)J(l-t2){l-k2t2) Bezüglich des Parameters n in (8.25c) sind Fallunterscheidungen notwendig (s. [14.1]). Mit Hilfe der Substitution t = sin<p @ <</?<-) können die Integrale (8.25a,b,c) auf die Legendre- sche Form gebracht werden: Elliptisches Integral 1. Gattung d(p / "* y 1 — k2 sin' ip Elliptisches Integral 2. Gattung: f yjl - k2 sin2 </? d<p (8 26b) Elliptisches Integral 3. Gattung: / ^ = . (8 26c) J A + nsin2(/?)yl - k2sm2ip 2. Bestimmte elliptische Integrale Die zu den unbestimmten elliptischen Integralen (8.26a,b,c) gehörenden bestimmten Integrale mit der unteren Integrationsgrenze Null haben die folgenden Bezeichnungen erhalten- / , ^ = = F(ki(p).1 (8.27a) / J1 - k2 sin2 iß dtp = E(k, <p), (8.27b) { yjl-k2sm2ip J I ^ = = n(n,A;,v?) (für alle drei Integrale gilt 0 < k < 1) (8 27c) Man nennt diese Integrale unvollständige elliptische Integrale 1., 2. und 3. Gattung. Für (p = — heißen die ersten beiden Integrale vollständige elliptische Integrale, und man kennzeichnet sie durch *=F(*• 9=/^wm¦(828a) E=E(*¦ 9=J^-****» (8-28b) In den Tabellen 21.9.1,2,3S. 1091 sind für die unvollständigen und vollständigen elliptischen Integrale erster und zweiter Gattung F(k,(p) und E(k,(p) sowie K und E Wertetabellen angegeben ¦ Die Berechnung des Umfanges der Ellipse führt auf ein vollständiges elliptisches Integral 2. Gattung als Funktion der numerischen Exzentrizität e (s. 8.2.2 2,2., S. 466) Für a = 1,5, b = 1 folgt e = 0,74. Wegen e = k = 0, 74 liest man aus Tabelle 21.9.3 ab. sina = 0,74, d.h., a = 47° und E(k, |) = £7@,74) = 1,33 Daraus folgt U = 4a£@,74) = AaE(a = 47°) - 4 • 1,33a = 7,98 Die
8.1 Unbestimmtes Integral 455 Berechnung mit der Näherungsformel C.329c) liefert den Wert 7,93. 8.1.5 Integration trigonometrischer Funktionen 8.1.5.1 Substitution Mit Hilfe der Universalsubstitution * = tan-, d.h., dx = —— , sinz = —-, cosx = —— , (8.29) läßt sich ein Integral der Form R(sinx,cosx)dx (8.30) auf ein Integral einer rationalen Funktion zurückführen, wobei mit R eine rationale Funktion des Ausdrucks bezeichnet ist, vor dem es steht. In einzelnen Fällen können einfachere Substitutionen eingesetzt werden (\ 2t \ 2 J sina;(l + cosz) J 2t ( 1 -12\ 2J \ t) 4 2 1 + t2 \ 1 + t2 + tan - + - In tan - + C. 4 2 2 2 Wenn der Integrand in (8.30) nur gerade Potenzen der Funktionen sin x und cos x enthält, kann er durch die Substitution t = tan x wesentlich einfacher auf ein Integral einer rationalen Funktion zurückgeführt werden. 8.1.5.2 Vereinfachte Methoden 1. Fall: / R (sin x) cos x dx. Substitution t = sin x, cos xdx = dt. (8.31) 2. Fall: R (cos x) sin xdx Substitution t = cosx, sin x dx = —dt (8.32) 3. Fall: fsmnxdx. (8.33a) a) n = 2m + 1, ungerade- sinn x dx = A — cos2 x)m sin x dx = — A — t2)m dt mit t = cosx. (8.33b) b) n = 2m, gerade: f smnxdx = f |-A - cos2x)| dx = —— /(l - cost)mdt mit t = 2x. (8.33c) Die Potenz wird auf diese Weise halbiert. Nach Auflösen des Klammerausdruckes A — cost)m wird gliedweise integriert 4. Fall: f cos71 xdx. (8.34a) a) n = 2m + 1, ungerade: fcosnxdx= f(l-sm2x)mcosxdx= f{l-t2)mdt mit t = sinx. (8.34b) b) n = 2m, gerade fcosnxdx= I [-(l + cos2z)| dx = —- f{1-\-cost)mdt mit t = 2x. (8 34c)
456 8 Integralrechnung Die Potenz wird auf diese Weise halbiert. Nach Auflösen der Klammer wird gliedweise integriert. 5. Fall: f sinn x cosm x dx. (8 35a) a) Eine der Zahlen m oder n ist ungerade: Zurückführung auf die Fälle 1 oder 2. ¦ A: / sin2 xcos5 xdx = / sin2x A — sin2 a;J cos a; da; = t2(l — t2Jdt mit t = sinx. _ f sinx 1 f dt ¦ B: / . dx = — I —= mit £ = cosa;. y Vcosx 7 v^ b) Die Zahlen m und n sind beide gerade. Zurückführung auf die Fälle 3 oder 4 und Verwendung der trigonometrischen Formeln sin 2a; . « 1 —cos 2a: 2 1 +cos 2a; . o , . sina;cosa; = , sin x = , cos x = . (8 35b) 2 2 2 v y ¦ / sin2 x cos4 xdx = (sin £ cos xJ cos2 xdx = - / sin2 2x(l + cos 2x) dx = - sin2 2a; cos 2a; dx + — / A — cos 4a;) dx = — sin3 2a; -\—-x sin 4a; + C. 16 7 48 16 64 6. Fall: / tannxdx = tanna;(sec2x - 1) dx = / tannx (tanx)'dx - j tann_2xdx tann_1x r „_2 , . n , = / tan xdx . (8 36a) n — 1 J Durch Wiederholung dieses Verfahrens der Potenzerniedrigung ergibt sich für gerades n bzw ungerades n schließlich das Integral dx = x bzw. / tan x dx = — In cos x s (8.36b) 7. Fall: fcotnxdx (8.37) Lösung durch Integration wie in Fall 6. Hinweis: Tabelle 21.7 S. 1053ff. enthält eine ganze Reihe von Integralen mit trigonometrischen Funktionen. 8.1.6 Integration weiterer transzendenter Funktionen 8.1.6.1 Integrale mit Exponentialfunktionen Integrale mit Exponentialfunktionen können in Integrale mit rationalen Funktionen im Integranden überführt werden, wenn sie in der Form [ R{emx,enx,...,epx)dx (8.38a) gegeben sind, wobei m, n,... ,p rationale Zahlen sind Dazu sind zwei Substitutionen erforderlich 1. Substitution von t = ex führt auf ein Integral f-R{tm,tn,...,tp)dt. (838b) 2. Substitution von z = yft, wobei r das kleinste gemeinsame Vielfache der Nenner der Brüche m, n, ., p ist, führt auf ein Integral einer rationalen Funktion 8.1.6.2 Integrale mit Hyperbelfunktionen Integrale mit Hyperbelfunktionen, die die Funktionen sinh x , cosh x , tanh x und coth x im Integranden enthalten, werden gewöhnlich berechnet, indem die Hyperbelfunktionen durch Exponentialfunk-
8.2 Bestimmte Integrale 457 tionen ersetzt werden. Die meist auftretenden Fälle / sinhn x dx , / coshn x dx , / sinhn x coshm x dx werden mit Methoden integriert, wie sie bei den trigonometrischen Funktionen zur Anwendung kommen (s. 8.1 5, S. 455) 8.1.6.3 Anwendung der partiellen Integration Wenn der Integrand Logarithmen, inverse trigonometrische Funktionen, inverse Hyperbelfunktionen oder Produkte von xm mit lnx,eax ,smax oder cosax enthält, kann die Lösung durch einfache oder mehrfache Anwendung der partiellen Integration herbeigeführt werden. In einigen Fällen führt die wiederholte Anwendung der partiellen Integration wieder auf das ursprünglich gegebene Integral Dann wird seine Berechnung auf die Lösung einer algebraischen Gleichung zurückgeführt Auf diese Weise werden z B die Integrale / eax cos bx dx, / eax sin bx dx berechnet, wozu eine zweimalige partielle Integration erforderlich ist Als Faktor u wird in beiden Fällen die Funktion des gleichen Typs gewählt, also entweder die Exponential- oder die trigonometrische Funktion. Die partielle Integration wird auch in den Fällen f P(x)<r dx,f P(z)ünbxdx ,Jp(x)cosbxdX eingesetzt, wobei P (x) ein Polynom ist. 8.1.6.4 Integrale transzendenter Funktionen Die Tabelle 21.7, S 1053ff enthält eine große Anzahl von Integralen transzendenter Funktionen. 8.2 Bestimmte Integrale 8.2.1 Grundbegriffe, Regeln und Sätze 8.2.1.1 Definition und Existenz des bestimmten Integrals 1. Definition des bestimmten Integrals Das bestimmte Integral einer in einem abgeschlossenen Intervall [a, b] definierten und beschränkten Funktion y = f (x) ist eine Zahl, die als Grenzwert einer Summe definiert wird, wobei entweder a < b (Fall A) oder a > b (Fall B) sein kann Die Forderung rjach Abgeschlossenheit des Intervalls bedeutet, daß auch das Integrationsintervall beschränkt sein soll. Bei einer Verallgemeinerung des Begriffs bestimmtes Integral (s 8 2.3.1, S. 470) werden auch Funktionen zugelassen, die in einem beliebigen zusammenhängenden Gebiet definiert sind, wie z B das offene oder halboffene Intervall, die Zahlenhalbachse oder die ganze Zahlengerade, oder aber auch in einem Gebiet, das nur stückweise zusammenhängend ist, d.h. überall, außer in endlich vielen Punkten. Integrale dieser verallgemeinerten Definition gehören zu den uneigentlichen Integralen (s. 8.2.3, S. 470). 2. Bestimmtes Integral als Grenzwert einer Summe Der Grenzwert, der zum bestimmten Integral führt, wird wie folgt gebildet (Abb.8.1, S. 444) 1. Schritt: Das Intervall [a, b] wird durch n — 1 beliebige Teilpunkte sei, x2,..., £n-i in n Elementarintervalle zerlegt, die so gewählt sind, daß einer der folgenden Fälle gilt* a = xo < xi < X2 < • • • < Xi < - ¦ - < xn-i < xn = b (Fall A) oder (8 39a) a = xq > Xi > x2 > - • • > Xi > • • • > xn_i > xn — b (Fall B) (8 39b) 2. Schritt: Im Innern oder auf dem Rande jedes der Elementarintervalle wird in Übereinstimmung mit Abb.8.4 eine Zahl & ausgewählt. Xi-i<ii<Xi (im Fall A) oder x^x > & > x{ (im Fall B) (8 39c) 3. Schritt: Die Werte / (&) der Funktion / (x) in diesen ausgewählten Punkten werden mit der zugehörigen Differenz Axj_i = Xi — Xj_i, d.h. mit den Längen der Teilintervalle multipliziert, die im Falle A mit positivem Vorzeichen, im Falle B mit negativem Vorzeichen zu nehmen sind. Auf diese Weise entsteht für den Fall A das Bild der Abb.8.1, S. 444.
458 8. Integralrechnung ._ ^ ... AX1-1 AVl « i^UV^ ^ '"IVI"'^ u> oo (A) a=x0 | xj x2| x3 * * ' xM I xt xn.! I xn=b Sl *2 ^3 5l ^n Ax^ Ax14 Ax2 Axj Ax0 -oo -< ^~*—' ' ' i" o "i —IL-o-^p-H" <p ? oQ /ß\ b=Xn k-l' " Xl I Xl-1 " ' X3 I X2l *1 I X0=a Abbildung 8.4 4. Schritt: Alle so gewonnenen n Produkte / (&) Axj_i werden addiert. 5. Schritt: Von der auf diese Weise entstehenden Zerlegungs- oder Zwischensumme, auch Riemann- Summe genannt, E/fö)Axi_1 ' (8.40) »=1 wird der Grenzwert für den Fall berechnet, daß die Länge der Elementarintervalle Ax;_i gegen Null strebt und demzufolge ihre Anzahl gegen oo. Auf Grund dieser Eigenschaft wird Axi-i auch als infinitesimale Größe bezeichnet. Wenn dieser Grenzwert existiert und unabhängig ist von der Wahl der Zahlen Xi und & , heißt er das bestimmte RlEMANNsche Integral der betreffenden Funktion in dem gegebenen Intervall Man schreibt dafür b n J f (s) dx = a Um^ ¦£ f F) Ax,_,. (8.41) a n-»oo i=l Die beiden Intervallgrenzen werden zu Integrationsgrenzen, sie legen das Integrationsintervall fest. Man nennt a die untere, b die obere Integrationsgrenze; x heißt Integrationsvariable, f(x) Iniegrand 3. Existenz des bestimmten Integrals Das bestimmte Integral einer im Intervall [a, b] stetigen Funktion ist stets definiert, d.h., der Grenzwert (8.41) existiert und ist unabhängig von der Wahl der Zahlen xi und &. Auch für eine beschränkte Funktion, die im Intervall [a, b] endlich viele Unstetigkeitsstellen besitzt, ist das bestimmte Integral definiert. Man nennt eine Funktion, deren bestimmtes Integral in einem gegebenen Intervall existiert, eine in diesem Intervall integrierbare Funktion. 8.2.1.2 Eigenschaften bestimmter Integrale Die wichtigsten Eigenschaften der bestimmten Integrale, die im folgenden erläutert werden, findet man zusammengefaßt in Tabelle 8.5. 1. Hauptsatz der Integralrechnung Hauptsatz der Integralrechnung wird die Beziehung f f(x)dx= f F'(x) dx = F(x)\ba = F{b)-F (a) (8 42) a a nnt, mit der die Berechnung eines bestimmten Integrals auf die Berechnung des zugehörigen un- mmten Integrals, d.h auf die Ermittlung einer Stammfunktion zurückgeführt wird: F{x)= ff{x)dx + C. (8.43)
8.2 Bestimmte Integrale 459 Tabelle 8.5 Wichtige Eigenschaften bestimmter Integrale Eigenschaft Hauptsatz der Integralrechnung Vertauschungsregel Gleiche Integrationsgrenzen Intervallregel Unabhängigkeit von der Bezeichnung der Integrationsvariablen Differentiation nach variabler oberer Grenze Mittelwertsatz der Integralrechnung Formel b jf(x)dx =F(x)l=F(b)-F{a) mit a F(x) = J f(x) dx + C bzw. F'(x) = f{x) b o J f(x) dx = - J f(x) dx a b a f f(x) dx = 0 a beb / f(x) dx = / f(x) dx + f(x) dx a a c b b b Jf(x)dx = jf(u)du = Jf(t)dt ' a a a ~/f(t)dt = f(x) a b Jf(x)dx=(b-a)f@ (a<e<6) a 2. Geometrische Interpretation und Vorzeichenregel 1. Fläche unter einer Kurve Für x in [o, b] sei f (x) > 0. Dann läßt sich die Summe (8.40) als Gesamtinhalt von Rechtecken deuten (Abb.8.1, S. 444), durch die die Fläche unter der Kurve y = f (x) angenähert wird Demzufolge ergibt der Grenzwert dieser Summe und damit das bestimmte Integral den Inhalt der Fläche A, die von der Kurve y = f (x), der x-Achse und den Parallelen x = a und x = b zur y-Achse begrenzt wird: A= f f{x)dx = F{b)-F(a) (a < b und /(x) > 0 für a < x < b) (8.44) 2. Vorzeichen- oder Flächenregel Wenn die Funktion y = f(x) im Integrationsintervall abschnittsweise positiv oder negativ ist (Abb. 8.5), dann nehmen die Teilintegrale über den betreffenden Teilintervallen, also auch die Teilflächen, positive oder negative Werte an, so daß die Integration über das gesamte Intervall eine Flächendifferenz liefert. In den folgenden Abb.8.5a bis d sind vier Fälle mit unterschiedlichen Möglichkeiten der Flächen- Vorzeichenbildung dargestellt ¦ A: / sin x dx (lies Integral von x = 0 bis x = n) = — cos x\ = — cos n + cos 0 = 2 . Jx=o l0 rx=2n |27r ¦ B: / sin x dx (lies Integral von x = 0 bis x = 2tt) = - cos = — cos 27r + cos 0 = 0 . 3. Variable obere Integrationsgrenze 1. Partikulärintegral Wenn die obere Grenze des Integrals variabel gelassen wird (Abb.8.6, Fläche ABCD), dann ist die Fläche eine Funktion der oberen Grenze des Integrals, das dann Partikulärintegral
460 8. Integralrechnung a b x f(x)>0, a<b a) b a x f(x)>0, a>b f(x)<0, a>b c) Abbildung 8.5 d) genannt wird. In diesem Falle eines variablen Flächeninhalts spricht man von einer Flächenfunktion in der Form S(x) = f f(t) dt = F{x) - F{a) (f(x) > 0 für x > a). (8.45) Um Verwechslungen mit der variablen Integrationsgrenze x zu vermeiden, wird hier bei der Darstellung des Integranden die Integrationsvariable mit t bezeichnet. 2. Differentiation des bestimmten Integrals mit variabler obererGrenze Ein bestimmtes Integral mit variabler oberer Integrationsgrenze / f(t) dt ist eine stetige Funktion F(x) dieser Integra- Ja tionsgrenze, d h. die Stammfunktion des Integranden- F'(x) = f(x) oder £ j f(t) dt = f(x). J.46) Die geometrische Bedeutung dieses Satzes besteht darin, daß die Ableitung einer variablen Fläche S(x) gleich der variablen Endordinate NM ist (Abb.8.7). Dabei sind sowohl die Fläche als auch die Ordinate gemäß Vorzeichenregel mit Vorzeichen zu nehmen (Abb.8.5) 4. Zerlegung des Integrationsintervalls Das Integrationsintervall [a, b] kann in Teilintervalle zerlegt werden Der Wert des bestimmten Integrals über das gesamte Intervall wird dann gemäß O C V / f(x) dx = f(x) dx + / f(x) dx $.47) berechnet (Intervallregel). Besitzt der Integrand eine endliche Zahl von Sprungstellen, dann wird das Intervall durch sie in Teilintervalle aufgespaltet, in denen die Funktion stetig ist Das Gesamtintegral kann mittels der Zerlegungsformel aus den Integralen über die Teilintervalle zusammengesetzt werden. Hinweis: Formel (8 47) gilt auch, wenn c außerhalb von [a, b] liegt und auch in diesem Falle die Integrale auf der rechten Seite von (8.47) existieren. 8.2.1.3 Weitere Sätze über Integrationsgrenzen 1. Unabhängigkeit von der Bezeichnung der Integrationsvariablen Der Wert eines bestimmten Integrals ist unabhängig von der Bezeichnung der Integrationsvariablen b b b j f(x) dx = f f(u) du = f f{t) dt. (8 48)
8 2 Bestimmte Integrale 461 2. Gleiche Integrationsgrenzen Der Wert des bestimmten Integrals ist Null, wenn die Integrationsgrenzen gleich sind- / f(x) dx = 0. (8.49) 3. Vertauschung der Integrationsgrenzen Eine Vertauschung der Integrationsgrenzen ändert das Vorzeichen des Integralwertes (Vertauschungs- regel) I f(x) dx = - I f(x) dx . (8.50) 4. Mittelwertsatz und Mittelwert 1. Mittelwertsatz Wenn eine Funktion f(x) im Intervall [o, b] stetig ist, dann gibt es im Innern des Intervalls mindestens einen Wert £ derart, daß im Falle A mit a < £ < b und im Falle B mit a > £ > b gilt. 6 Jf(x)dx = (b-a)f(Z). (8.51) m=«ö Abbildung 8.6 Abbildung 8.7 Abbildung 8.8 Der geometrische Sinn dieses Satzes besteht darin, daß es zwischen den Punkten a und b einen Punkt £ gibt, für den der Flächeninhalt der Figur ABCD gleich dem des Rechtecks AB'CD in Abb.8.8 ist. Der Wert 1 ) m = / fix) dx (8.52) b — a J a heißt Mittelwert oder das arithmetische Mittel der Funktion f(x) im Intervall [o, b]. 2. Verallgemeinerter Mittelwertsatz Sind die Funktionen f(x) und (p(x) im abgeschlossenen Intervall [a, b] stetig und ändert (p(x) in diesem Intervall sein Vorzeichen nicht, dann gibt es im Innern des Integrationsintervalles mindestens eine Zahl f , so daß gilt* b b Jf(x)tp(x)dx = f(S)J<p(x)dx (a<£<b) (8.53) a a 5. Abschätzung des bestimmten Integrals Die Hauptmethode zur Berechnung eines bestimmten Integrals ist der Weg über den Hauptsatz der Integralrechnung, d h die Berechnung des unbestimmten Integrals (s. 8 2 1.2,1., S. 458), z.B. unter Benutzung von Tabelle 21.7, S. 1053ff. Dabei ist darauf zu achten, ob beim Einsetzen der Grenzen uneigentliche Integrale entstehen.
462 8. Integralrechnung Der Wert eines bestimmten Integrals liegt zwischen den Produkten des kleinsten und des größten Funktionswertes m und M des Integranden im Intervall [a, b] mit der Länge des Integrationsintervalls: b m(b -a)< f f(x) dx < M(b - a) (8.54) a Die geometrische Bedeutung dieses Satzes ist an Hand der Abb.8.9 zu erkennen. 8.2.1.4 Berechnung bestimmter Integrale 1. Hauptmethode Heute werden verbreitet Computeralgebrasysteme zur analytischen Berechnung von unbestimmten und bestimmter Integralen eingesetzt (s Kapitel 20.1), S. 982fT. 2. Umformung bestimmter Integrale Durch geeignete Umformung können bestimmte Integrale in vielen Fällen mittels der Substitutionsregel und der Methode der partiellen Integration berechnet werden Abbildung 8 9 A: Einsatz der Substitutionsregel für / = / Va2 — x2 dx. Jo 1 Substitution: x = (p(t) = asint, t = ip(x) — aresin - , ^@) = 0, ip(a) = — . Es ergibt sich. rrc/2 ra /-arcsin 1 i rTC/2 rir/2 \ 1= Va2 -x2dx= / a2\/l-sin2 tcostdt = a2 cos2tdt = a2 -A+cos2t) dt Jo ./aresin 0 Jo Jo 2 2. Substitution: t = ip{z) = * , z = tp(t) = 2t, -0@) = 0, V (tH = * • Es ergibt sich: : <p(z) = 2'z'~ ir/2 Q2 + 0 a2 r* T Jo cos zdz = ——h —- sin z\ 4 4 na ~ ¦ B: Methode der partiellen Integration: / xex dx = xex\ — ex dx = e - (e - 1) = 1 Jo 'o ./o 3. Methoden zur Berechnung komplizierter Integrale Wenn die Berechnung eines unbestimmten Integrals sehr kompliziert ist oder wenn es sich nicht durch elementare Funktionen ausdrücken läßt, dann ist es in einer Reihe von Fällen durch Anwendung verschiedener Methoden (manchmal „Kunstgriffe" genannt) trotzdem möglich, den Wert des Integrals zu berechnen. Dazu gehören die Integration von Funktionen mit komplexen Veränderlichen (s die Beispiele in 14.4.1, S 717 und 14.4.2, S 717ff bis 14.4.3.2,5., S 720) oder der Satz über die Differentiation eines Integrals nach einem Parameter (s. 8.2.4, S. 476)' "'df^- (855) d r r, . , tdf(x,t)J M I = f ^ dx. Parametereinführung t. F(t) = / ^ dx; F@) = 0, F(l) = /. Anwen- 7o lnx Jo \nx f*xx\ fPM dF fld\xt-1]^ [lxl\nx. yi t 1 t+l\l düng von (8 55) auf Fit) - —r- = / tt -; dx = — dx = / xl dx = x+ \ = v ' K ' dt Jo dt [ \nx J Jo lux Jo t+1 |0 -^— Integration: F(t) - F@) = C —~ = ln(t -H 1)|* = ln(i + 1). Ergebnis. I = F(l) = In2. 4. Integration durch Reihenentwicklung Wenn der Integrand f(x) im Integrationsintervall [a, b] in eine gleichmäßig konvergente Reihe f(x) = ip^x) + <p2(x) + • ¦ • + <p„(x) + • • • (8 56)
8 2 Bestimmte Integrale 463 entwickelt werden kann, dann läßt sich das Integral in der Form / f(x) dx = / ipi(x) dx+ <p2(x) dx-\ 1- / ipn(x) dx-\ (8 57) schreiben. Auf diese Weise kann das bestimmte Integral als konvergente numerische Reihe dargestellt werden. 6 6 6 6 / f(x) dx = ipi(x) dx + / (f2(x) dx + • • + / <Pn(x) dx-\ . (8.58) a a a a Im Falle leicht zu integrierender Funktionen ipk(x), wenn z.B f(x) in eine Potenzreihe entwickelt wer- rb den kann, die im Intervall [a, b) gleichmäßig konvergiert, kann das Integral / }(x)dx mit beliebiger Ja Genauigkeit berechnet werden. /•1/2 2 ¦ Das Integral / = / e~x dx ist mit einer Genauigkeit von 0,0001 zu berechnen. Die Reihe e~x = Jo 1 — tt + §T — %r + TT konvergiert gemäß Satz von Abel (s. S. 432) in jedem beliebigen endlichen Intervall gleichmäßig, so daß ,1/2 Damit folgt / = / Jo x dx /2 ( XÄ e~x dx = x I 1 - — x 3 + 2T5 3!-7 1 4!-9 gilt. 2a • 1! • 3 24-2'-5 2e • 3» • 7 28 • 4! • 9 '") = ^ f 1 — j2 + jkn ~ 2688 ~*" 55296 — ") ' ^m ^e^ ^er Berecnnung des Integrals eine Genauigkeit von 0,0001 zu erreichen, genügt es, in Übereinstimmung mit dem Satz von Leibniz über alternierende Reihen (s 7 2 3 3,1., S. 426) die ersten vier Glieder der Reihenentwicklung zu berechnen: i i r1/2 2 I « £A - 0,08333 + 0,00625 - 0,00037) = § • 0,92255 = 0,46127, / e~x dx = 0,4613. 5. Graphische Integration Die graphische Integration ist eine graphische Verfahrensweise, um die als Kurve AB (Abb.8.10) gege- rb bene Funktion y = f(x) zu integrieren, d.h das Integral / f(x) dx, das die Größe der Fläche M0ABN Ja angibt, graphisch zu berechnen: Abbildung 8.10 1. Das Intervall M0N wird durch die Punkte ^i/2, Xu Z3/2, x2,..., xn-uXn-i/2 (8 59a) in 2n gleiche Teile eingeteilt, wobei das Ergebnis um so genauer ausfällt, je größer die Anzahl der Teilungspunkte ist. 2. In den Teilungspunkten Zl/2,Z3/2,-.-,£n-l/2 (8.59b) werden Lote bis zum Schnitt mit der Kurve errichtet. Die so gewon- nenen Ordinatenwerte werden als Strecken OAi,OA2,..., OAn auf der y-Achse abgetragen. 3. Auf der negativen x-Achse wird eine Strecke OP von beliebiger Länge abgetragen, und der Punkt P wird mit den Punkten Ai,A2,...,An verbunden. 4. Durch den Punkt Mo wird eine Parallele zu PA\ gezogen. Diese schneidet die im Teilungspunkt X\ errichtete Senkrechte im Punkt Mi. Durch den Punkt M\ wird die Parallele zu PA2 gezogen Diese schneidet die im Teilungspunk,t X2 errichtete Senkrechte im Punkt M2 , usw. bis der Punkt Mn erreicht ist.
464 8. Integralrechnung Zahlenmäßig ist das zu berechnende Integral gleich dem Produkt aus den Längen der Strecken OP und / f(x) dx = OP- NMn . (8 60) Mit Hilfe der beliebig wählbaren Strecke OP werden die Ausmaße der Zeichnung bestimmt, je kleiner die zulässigen Abmessungen der Zeichnung sind, desto größer ist OP zu wählen. Für OP = 1 ergibt sich / f(x) dx = NMn , und der Polygonzug M0, Mi, M2,..., Mn entspricht angenähert dem Kurvenbild Ja der Stammfunktion von f(x), d.h. dem unbestimmten Integral / f(x) dx 6. Planimeter und Integraphen Planimeter sind Geräte zur Ermittlung des Flächeninhaltes beliebiger geschlossener ebener Kurven, also auch des bestimmten Integrals einer Funktion y = f(x), die durch ihre Kurve gegeben ist. Spezielle Planimeter ermöglichen nicht nur die Berechnung des Integrals ydx, sondern auch der Integrale / y2 dx und / y3 dx . Integraphen sind Geräte, mit deren Hilfe das Kurvenbild einer Stammfunktion Y = / f(t)dt gezeich- Ja net werden kann, wenn das Kurvenbild einer vorgegebenen Funktion y = f(x) bekannt ist (s. [19 35]) 7. Numerische Integration Wenn der Integrand eines bestimmten Integrals sehr kompliziert ist, sich nicht elementar integrieren läßt oder nur in Form von diskreten Funktionswerten vorliegt, z.B. als Wertetabelle, dann sind sogenannte Quadraturformeln und andere Methoden der numerischen Mathematik anzuwenden (s 19 3 1, S 925 8.2.2 Anwendungen bestimmter Integrale 8.2.2.1 Allgemeines Prinzip zur Anwendung des bestimmten Integrals 1. Zerlegung der zu berechnenden Größe in eine sehr große Anzahl hinreichend kleiner, d.h. inifmite- simaler Größen- A = a1 + o2 + • • • + an (8.61) 2. Ersetzen jeder dieser infinitesimalen Größen a^ durch eine Größe äi, die in ihrer Form nur wenig von üi abweicht und deren Berechnung nach einer bekannten Formel möglich ist. Dabei soll der Fehler ai = üi — äi gegenüber a^ und äi eine infinitesimale Größe höherer Ordnung sein. 3. Darstellung der Größe äi durch eine Variable x und eine Funktion f(x), die so gewählt werden, daß äi die Gestalt f(xi) Ax{ annimmt. 4. Berechnung der gesuchten Größe als Grenzwert der Summe ) A = jHSo S äi = iHä, S f(Xi)Axi = / f(X) dx ' (8-62) wobei Axi > 0 für alle i gelten muß. Mit a und b sind die Randwerte von x bezeichnet. ¦ Berechnung des Rauminhalts einer Pyramide der Grundfläche S und der Höhe H (Abb.8.11a-c): a) Zerlegung des zu berechnenden Rauminhaltes V durch ebene Schnitte in Volumina dünner Pyramidenstümpfe (Abb.8.IIa) V = v\ + v2 H \-vn. b) Ersetzen eines jeden Pyramidenstumpfes durch ein Prisma mit dem Volumen Vi mit der gleichen
8.2 Bestimmte Integrale 465 c) Darstellung der Volumenformel Vi in der Form vt = SiAhi, wobei h* (Abb.8.11c) der Abstand der "oberen Fläche von der Pyramidenspitze ist Wegen S* : S = h2 : H2 Sh2 kann man schreiben Vi = -jjj- A/i;. d) Berechnung des Grenzwertes der Summe 1/ i- ^~ i- V-57!? loh V = hm > Vi = lim > —s- A/i* = -—, 7 ^=-3- • a) 8.2.2.2 Anwendungen in der Geometrie AK brw c) Abbildung 8.11 Höhe und einer Grundfläche, die gleich der oberen Grundfläche des Pyramidenstumpfes ist (Abb.8.1 lb). Die Volumenabweichung ist eine infinitesimale Größe von höherer Ordnung als Vi. 1. Flächeninhalte ebener Flächen 1. Flächeninhalt eines zwischen den Punkten B und C krummlinig begrenzten Trapezes (Abb.8.12a) bei explizit (y = f(x) und a < x < b) bzw. in Parameterform (x = x(t), y = y(t), ti < t <t2) gegebener Kurvengleichung. Sabcd = I f(x) dx = J y{t)x'{t) dt. (8 63a) 2. Flächeninhalt eines zwischen den Punkten G und H krummlinig begrenzten Trapezes (Abb.8.12b) bei explizit (x = g(y) und a < y < ß) bzw in Parameterform (x = x(t), y = y(t), ti < t < £2) gegebener Kurvengleichung p ^2 Sefgh = J g{y) dy = J x{t)y'{t) dt (8.63b) 3. Flächeninhalt eines Kurvensektors (Abb.8.12c), begrenzt durch ein Kurvenstuck zwischen den Punkten K und L, das mit einer in Polarkoordinaten gegebenen Kurvengleichung (p = p((p), ¥>i < <£ < V2) beschrieben wird* 1 ¥>2 SoKL = X ] P2&P (8.63c) Flächeninhalte von komplizierteren Figuren werden mit Hilfe des Kurvenintegrals (s. S. 479) oder des Doppelintegrals (s. 8.4.1, S. 488) berechnet. dx b x b) 0| Abbildung 8.12 c) u <Pi <P2
466 8. Integralrechnung 2. Bogenlängen ebener Kurven 1. Bogenlänge einer Kurve zwischen zwei Punkten (I) A und B , die explizit (y = f(x) bzw x = g{y)) oder in Parameterform (x = x(t), y = y(t)) gegeben ist (Abb.8.13a)- 0 P 12 ¦¦Jyjl + [f'(x)Ydx = J J{g'(yW + ldy = j^[x'(t)Y + [?/(t)]: dt (81 Mit dem Differential der Bogenlänge dl ergibt sich L= I dl mit dl2 = dx2 + dy2. (8.64b) ¦ Ellipsenumfang gemäß (8 64a) Mit den Substitutionen x = x(t) = asint, y = y(t) = bcost erhält man L^ = / Ja2 — (a2 — b2) sin2 tdt = a v/1 — e2 sin21 dt, wobei e = y/a2 — b2/a die ab Jti v Jti numerische Exzentrizität der Ellipse ist Mit den Integrationsgrenzen für den 1 Quadranten t± = 0, t2 = tt/2 gemäß x = 0, y = b rir/2 I 7j- bzw. x = a,y = 0 gilt L^ = a yl — e2sin2tdt = aE(kJ—) mit k = e Der Integralwert ab Jo 2 E(k, ^) wird aus Tabelle 21.9, S 1091 ermittelt (s. Beispiel in 8 1.4.3, S. 454). 2. Bogenlänge einer Kurve zwischen zwei Punkten (II) C und D , gegeben in Polarkoordinaten (p = p(ip)) (Abb.8.13b): dp cd j \r \d<p dy>. Mit dem Differential der Bogenlänge dZ ergibt sich L= I dl mit d/2 = p2d(f>2 + dp2 . 5.64c) 5 64d) a) Ol (pl(p2 Abbildung 8.13 3. Mantelflächen von Rotationskörpern (s auch 1 Guldinsche Regel, S. 469) 1. Flächeninhalt eines durch Rotation der Kurve y = f(x) um die x-Achse entstehenden Mantels (Abb.8.14a): b S = 2./I/«fl = 2./»(x)Jl+y dx. 5 65a) 2. Flächeninhalt eines durch Rotation der Kurve x = f(y) um die ?/-Achse entstehenden Mantels (Abb.8.14b) S = 2tt f xdl = 2ir I' x(y)< -a* 5.65b)
8 2 Bestimmte Integrale 467 y 0 a) i dl^. aillL liwf d*> i**~ ' X dlW b) yj öfi o| ^ __ f-x— TaJL T ^/| T3 X Abbildung 8 14 Zur Berechnung von Flächen, die kompliziertere Körper begrenzen, s. Anwendung von Doppelintegralen, 8 4 1 3, S 494 und Anwendungen des Oberflächenintegrals 1. Art, 8.5.1 3, S. 499 Allgemeine Formeln zur Berechnung von Flächen mit Hilfe von Doppelintegralen sind in der Tabelle 8.9 Anwendungen von Doppelintegralen, S 494 angegeben 4. Volumina (s. auch 2. Guldinsche Regel, S. 470) 1. Volumen eines rotationssymmetrischen Körpers bei Drehung um die x-Achse (Abb.8.14a): V ¦ ¦nfy2 dx. (8.1 2. Volumen eines rotationssymmetrischen Körpers bei Drehung um die y-Achse (Abb.8.14b): = 7T / x2 dy. (8.66b) 3. Volumen eines Körpers, wenn der Flächeninhalt seines senkrecht zur x-Achse gelegten Querschnitts (Abb.8.15) eine Funktion S = f{x) ist: b V=ff(x)dx. (8.67) a Hinweise: _ _ 1. Cavalierisches Prinzip: Existiert im Intervall [a, b] eine zweite Querschnittsfunktion S = f(x), die für jeden Abszissenwert x denselben Wert hat wie f(x), so sind die Volumina V gemäß (8 67) und V = Ja f(x) einander gleich 2. Tabellen: Allgemeine Formeln zur Berechnung von Volumina mit Hilfe von Mehrfachintegralen sind in Tabelle 8.9 (Anwendungen von Doppelintegralen, S. 494) und Tabelle 8.10 (Anwendungen von Dreifachintegralen, S 497) angegeben 8.2.2.3 Anwendungen in Mechanik und Physik 1. Weg eines Punktes Der Weg eines Punktes, zurückgelegt in der Zeit t0 bis T, ergibt sich bei zeitabhängiger Geschwindigkeit V = f(t) ZU T s= fvdt (8.68) *o 2. Arbeit Die Arbeit bei Bewegung eines Körpers in einem Kraftfeld soll berechnet werden Sind Kraft- und Bewegungsrichtung konstant und fallen beide zusammen, dann kann die x-Achse in Kraft- bzw. Be-
468 8. Integralrechnung S=f(x) yi(x)t=}y2(x) Abbildung 8.15 Abbildung 8.16 wegungsrichtung gelegt werden Ist der Betrag der Kraft F veränderlich, d.h. gilt |F| = f(x), dann erhält man für die Arbeit W , die zur Verschiebung des Körpers längs der x-Achse vom Punkt x = a zum Punkt x = b notwendig ist: W -/zw dx $.69) Im allgemeinen Fall, wenn Kraft- und Bewegungsrichtung nicht ubeinstimmen, wird die Arbeit als Kurvenintegral (s. 8.3 4, S 486, Formel (8 134)) über das Skalarprodukt aus Kraft und Weg in jedem Punkt r längs des vorgegebenen Weges berechnet 3. Druck In einer ruhenden Flüssigkeit mit der Dichte q unterscheidet man den Schweredruck und den Seitendruck. Letzteren übt die Flüssigkeit auf eine Seite einer Platte aus, die senkrecht in sie eingetaucht ist Beide nehmen mit der Tiefe zu. 1. Schweredruck Der Schweredruck ph in einer Tiefe h beträgt: Vh = Qgh, (8.70) wobei g die Fallbeschleunigung ist. 2. Seitendruck Der Seitendruck ps z.B. auf den Deckel einer seitlichen AusflußöfTnung eines Flüssigkeitsbehälters mit dem Tiefenunterschied h\ — h^ (Abb.8.16)beträgt: ps = gg J x[y2{x) - yi(x)] dx (8 71) Mit den Funktionen y\(x) und 2/2(#) wird der linke bzw. rechte Rand des Deckels beschrieben. 4. Trägheitsmomente 1. Trägheitsmoment eines Bogenstücks Das Trägheitsmoment einer homogenen Kurve y = f(x) mit der konstanten Dichte g im Intervall [a, b] bezuglich der ^/-Achse (Abb.8.17a) ergibt sich zu 0 0 Iy = g f x2dl = g f x2yfl + {y'Jdx. (8 72) Ist die Dichte eine Funktion g(x), dann muß ihr analytischer Ausdruck in die Integration einbezogen werden. 2. Trägheitsmoment einer ebenen Figur Das Trägheitsmoment einer homogenen ebenen Figur mit der Dichte g bezüglich der y-Achse, wobei y die Länge des zur ?/-Achse parallelen Schnittes ist
8 2 Bestimmte Integrale 469 y' a) 0 b x j^ a X b) 0 Abbildung 8.17 dx b (Abb.8.17b), ergibt sich zu b Iy = q x2ydx (8.73) (S. auch Tabelle 8.9, Anwendungen von Doppelintegralen, S. 494)). Im Falle der Ortsabhängigkeit der Dichte muß der analytische Ausdruck in die Integration einbezogen werden. y< yc 0 i A' ^ \ X c b x y1 yc 0 i ^jgg xc % w B X b) c) Abbildung 8.18 5. Schwerpunkte, Guldinsche Regeln 1. Schwerpunkt eines Bogenstückes Der Schwerpunkt C eines Bogenstuckes einer homogenen ebenen Kurve y = f(x) im Intervall [a, b] mit der Länge L (Abb.8.18a) ergibt sich unter Berücksichtigung von (8 64a), S. 466 zu: 6 b / xyjl + y'2 dx l yyjl + y'2 dx xc = ^ j , yc = ^ Z (874) 2. Schwerpunkt einer geschlossenen Kurve Der Schwerpunkt C einer geschlossenen Kurve y = f(x) (Abb.8.18b) mit den Gleichungen y\ = f\(x) für den oberen und y2 = J2(x) für den unteren Kurventeil und der Gesamtlänge L ergibt sich zu: Jx{y/l + to.)* + y/l + toJ) dx J(y^i + (y'iJ + »V1 + dÄ)a)dx xc = ¦ yc- (8.75) 3. Erste Guldinsche Regel Die Oberfläche 5ro^ eines Körpers, die bei Rotation eines ebenen Kurvenstückes um eine Achse entsteht, die in der Ebene dieser Kurve liegt und die Kurve nicht schneidet, ist gleich dem Produkt aus dem Umfang des Kreises, den der Schwerpunkt des Kurvenstückes bei der Rotation im Abstand yc von der Umdrehungsachse beschreibt, also 2iryc , und der Länge des
470 8 Integralrechnung Kurvenstuckes L SIot = L2iryc (8 76) 4. Schwerpunkt eines Trapezes Der Schwerpunkt C eines homogenen, zwischen den Kurvenpunkten A und B krummlinig begrenzten Trapezes (Abb.8.18c) mit dem Flächeninhalt S des Trapezes und der Gleichung y = f(x) des Kurvenstückes AB ergibt sich zu: b b xydx \ y2 dx 5. Schwerpunkt einer beliebigen ebenen Figur Der Schwerpunkt C einer beliebigen ebenen Figur (Abb.8.18d) mit der Fläche S, oben und unten begrenzt durch Kurven mit den Gleichungen Vi = fi{x) bzw. y2 = f2(x), ergibt sich zu 1 J x(yi - y2) dx - J(y\ - y\) dx xc = * g , Vc = — s (8-78) Formeln zur Berechnung von Schwerpunkten mit Hilfe von Mehrfachintegralen sind in Tabelle 8.9, Anwendung von Doppelintegralen, S. 494) und in Tabelle 8.10, Anwendung von Dreifachintegralen, 5. 497) angegeben. 6. Zweite Guldinsche Regel Der Rauminhalt eines Körpers V , der bei Rotation einer ebenen Figur um eine Achse entsteht, die in der Figurenebene liegt und die Figur nicht schneidet, ist gleich dem Produkt aus dem Umfang des Kreises, den der Schwerpunkt dieser Fläche bei der Rotation beschreibt, also 2iryc , und dem Flächeninhalt der Figur S: Vmt = S.2iryc. (8 79) 8.2.3 Uneigentliche Integrale, Stieltjes— und Lebesgue—Integrale 8.2.3.1 Verallgemeinerungen des Integralbegriffs Der Begriff des bestimmten Integrals (s. 8.2.1.1, S. 457) ist als RiEMANN-Integral (s. 8.2.1.1,2., S. 458) unter der Voraussetzung einer beschränkten Funktion f(x) und eines abgeschlossenen Integrationsintervalls [a, b] eingeführt worden. Diese beiden Voraussetzungen waren Ansatzpunkte für Verallgemeinerungen des RiEMANNschen Integralbegriffs. Im Folgenden werden einige genannt. 1. Uneigentliche Integrale stellen eine Erweiterung des Integralbegriffs auf unbeschränkte Funktionen und auf unbeschränkte Integrationsintervalle dar Sie werden in den anschließenden Abschnitten Integrale mit unendlichen Integrationsgrenzen und Integrale mit unbeschränktem Integranden behandelt. 2. Stieltjes-Integral für Funktionen einer Veränderlicher Es wird von zwei endlichen Funktionen f(x) und g(x) ausgegangen, die auf dem endlichen Intervall [a, b] definiert sind Wie beim RiEMANN-Integral wird das Intervall in Elementarintervalle zerlegt, aber an Stelle der RiEMANNschen Zwischensumme (8.40) wird £,mMxi)-9(xi-i)] (8 80) t=l gebildet. Wenn der Grenzwert von (8.80) für den Fall, daß die Länge der Elementarintervalle gegen Null strebt, existiert, und zwar unabhängig von der Wahl der Punkte x% und & , dann wird dieser Grenzwert als bestimmtes Stieltjes- Integralbezeich.net (s. [8.14], [8.19]). ¦ Für g(x) = x geht das STIELTJES-Integral in das RiEMANN-Integral über.
8 2 Bestimmte Integrale 471 3. Lebesgue-Integral Eine weitere Erweiterung des Integralbegriffs erfolgt im Zusammenhang mit der Maßtheorie (s. 12.9, S. 655), in der das Maß einer Menge, Maßräume und meßbare Funktionen eingeführt werden. In der Funktionalanalysis wird das LEBESGUE-Integral (s 12 9 3.2, S. 658) auf der Basis dieser Begriffe definiert (s. [8 10]) Eine Verallgemeinerung gegenüber dem RlEMANN-Integral besteht z B darin, daß der Integrationsbereich eine Teilmenge des Rn sein kann und in meßbare Teilmengen zerlegt wird Die Bezeichnungen für die Verallgemeinerungen des Integralbegriffs sind nicht einheitlich (s [8 14]). 8.2.3.2 Integrale mit unendlichen Integrationsgrenzen 1. Definitionen a) Wenn das Integrationsgebiet die abgeschlossene Halbachse [a, +oo) ist, und wenn der Integrand dort definiert ist, dann gilt definitionsgemäß +oo B f f(x)dx = lim [f(x)dx. (8.81) J B->ooJ a a Im Falle der Existenz des Grenzwertes spricht man von einem konvergenten uneigentlichen Integral Im Falle der Nichtexistenz des Grenzwertes wird (8.81) als divergentes Integral bezeichnet. b) Wenn das Definitionsgebiet einer Funktion die abgeschlossene Halbachse (—oo, b] oder die gesamte Zahlengerade (—oo, +oo) ist, dann definiert man analog b b +oo B f f{x) dx = lim / f(x) dx, (8.82a) I f(x) dx = hrn^ f f(x) dx (8 82b) -oo A -oo ß-*°° A c) Beim Grenzübergang (8.82b) streben die Zahlen A und B unabhängig voneinander gegen unendlich. Wenn der Grenzwert (8.82b) dabei nicht existiert, dafür jedoch der Grenzwert lim A—»oo „ -A [ f(x) dx, (8 82c) > J -A dann heißt dieser Grenzwert (8.82c) Hauptwert des uneigentlichen Integrals. 2. Geometrische Bedeutung des Integrals mit unendlichen Integrationsgrenzen Die Integrale (8.81), (8 82a) und (8.82b) sind jeweils die. Grenzwerte der Flächeninhalte der Figuren, die in den Abb.8.19 dargestellt sind. /•oo rlnr rB (Inr ¦ A: / — = lim / — = lim \uB = oo, (divergent). _ „ f°° dx ,. [B dx (\ 1\ 1 ,, ¦ B: / — = hm / — = hm - — —=-, (konvergent) h x2 ß-oo72 x2 B-00V2 BJ 2' v 6 J /^"°° dx fB dx 7T / 7T\ =¦ = lim / = lim farctan B — arctan Ä\ = — — ( — — 1 = 7r, (konver- -00 1 + x2 fr» Ja 1 + x2 £--~l j 2 V 2) y B—> + oo B—»+00 gent). 3. Hinreichende Konvergenzkriterien Wenn sich die unmittelbare Berechnung der Grenzwerte (8 81), (8 82a) und (8 82b) schwierig gestaltet oder wenn lediglich nach der Konvergenz oder Divergenz eines uneigentlichen Integrals gefragt ist, dann kann eines der folgenden hinreichenden Kriterien benutzt werden. Hier wird lediglich das Integral (8 81) betrachtet Das Integral (8.82a) kann durch Substitution von x durch — x auf das Integral vom Typ
472 8. Integralrechnung y- 0 * ^^^^^ \ r 0 a) + a A + + w yyy~ x f- /f(x)dx a b (f(x)dx b)-oo Abbildung 8 19 (8.81) zurückgeführt werden a +oo j f(x)dx= //(-*) dx. (8 83) Das Integral vom Typ (8.82b) wird in eine Summe aus zwei Integralen vom Typ (8 81) und vom Typ (8.82a) zerlegt- f f(x) dx = j f{x) dx+ J f(x) dx , wobei c eine beliebige Zahl ist. 1. Kriterium: Wenn das Integral +oo dx j I fix) I 5 84) 5 85) existiert, dann existiert auch das Integral (8 81) Das Integral (8 81) heißt in diesem Falle absolutkonvergent und die Funktion f(x) absolutintegrierbar auf der Halbachse [a, +oo) 2. Kriterium: Gilt für die Funktionen f(x) und ip(x) f(x) > 0, <p(x) > 0 und f(x) < ip(x) für a < x < +oo , (8 86a) dann darf von der Konvergenz des Integrals +oo +oo / ip(x) dx (8.86b) auf die Konvergenz des Integrals / f(x) dx (8 86c) geschlossen werden und umgekehrt von der Divergenz des Integrals (8.86c) auf die Divergenz des Integrals (8 86b)
8 2 Bestimmte Integrale 473 3. Kriterium: Setzt man für ip(x) in (8.86a) V(x) = JL (8.87a) und berücksichtigt man, daß das Integral in (8.87b) für a > 0, a > 1 gegen den dort angegebenen Wert konvergiert, +oo /dx 1 — = 7 für a > 0,a > 1, (8.87b) xa (a - l)aa~l ' v ; während es für a < 1 divergiert, dann kann aus dem 2. Konvergenzkriterium ein weiteres hergeleitet werden Wenn f(x) in a < x < oo eine positive Funktion ist und wenn eine Zahl a > 1 existiert, so daß für hinreichend große x f(x) xa < oo (8.87c) gilt, dann konvergiert das Integral (8.81). Wenn allerdings f(x) positiv ist und eine Zahl a < 1 existiert, so daß f(x) xa>c>0 (8.87d) von einer gewissen Stelle an gilt, dann divergiert das Integral (8.81). r+oo ^/2 dx 1 X^^2 m X2 ¦ / . Setzt man a = - , dann ergibt sich x1' — r —? 1. Das Integral ist k 1 + x2 2 6 l + x2 l + x2 divergent. 4. Zusammenhang zwischen uneigentlichen Integralen und unendlichen Reihen Wenn xi, x2,..., xn,... eine beliebige, unbegrenzt wachsende unendliche Folge ist, d.h., wenn gilt a < x\ < x2 < - • • < xn < • • - mit lim xn = oo, (8.88a) n—>-+oo und wenn die Funktion f(x) positiv für a < x < oo ist, dann kann die Frage nach der Konvergenz des Integrals (8.81) auf die Frage nach der Konvergenz der Reihe Xl X2 Xn ff(x)dx+ If(x)dx + --+ f f(x)dx + -- (888b) a x\ xn-\ zurückgeführt werden. Wenn die Reihe (8.88b) konvergiert, dann konvergiert auch das Integral (8.81) und es ist dann gleich der Summe der Reihe (8 88b) Divergiert die Reihe (8.88b), dann divergiert auch das Integral (8.81). Somit können die Konvergenzkriterien für Reihen auch zur Konvergenzuntersuchung von Integralen eingesetzt werden. Beim Integralkriterium für Reihen (s. 7.2.2.4, S. 425) wird umgekehrt die Konvergenzuntersuchung der Reihen auf die Untersuchung der Konvergenz eines uneigentlichen Integrals zurückgeführt. 8.2.3.3 Integrale mit unbeschränktem Integranden 1. Definitionen 1. Rechts offenes oder abgeschlossenes Definitionsintervall Die Definition des uneigentlichen Integrals für eine Funktion f(x), die ein rechts offenes Definitionsintervall [a, b) oder ein abgeschlossenes Definitionsintervall [a, b] besitzt, aber im Punkt b den Grenzwert lim f(x) = oo hat, lautet in x—*b—0 beiden Fällen. b b-e ! }{x) dx = lim f f(x) dx. (8.89) a a Wenn dieser Grenzwert existiert, dann existiert bzw. konvergiert auch das Integral (8.89), und man spricht von einem konvergenten uneigentlichen Integral. Existiert der Grenzwert nicht, dann existiert
474 8 Integralrechnung bzw konvergiert auch das Integral nicht, und man spricht von einem divergenten uneigenthchen Integral. 2. Links offenes oder abgeschlossenes Definitionsintervall Die Definition des uneigentlichen Integrals für eine Punktion f(x), die ein links offenes Definitionsintervall (a, b] oder ein abgeschlossenes Definitionsintervall [a,b] besitzt, aber im Punkt a den Grenzwert lim f(x) = oo besitzt, erfolgt in Analogie zur Definition (8 89) • b b / f(x) dx = lim / f(x) dx . 5.90) 3. Zwei halboffene angrenzende Definitionsintervalle Die Definition des uneigentlichen Integrals für eine Funktion f(x), die im gesamten Intervall [a, b] definiert ist, ausgenommen einen inneren Punkt c mit a < c < b, d.h , für eine Funktion f(x), die in zwei angrenzenden halboffenen Intervallen [a, c) und (c, b] definiert ist, aber im Punkt c nicht beschränkt ist, lautet: / f(x) dx = lim / f(x) dx + lim / f(x) dx 5 91a) Dabei streben die Zahlen e und S unabhängig voneinander gegen Null Wenn der Grenzwert (8 91a) nicht existiert, wohl aber lim £^0 {c-e b j f{x)dx+ j a c+e f{x) dx (8 91b) dann heißt der Grenzwert (8 91b) der Hauptwert des uneigenthchen Integrals oder auch CAVCHYscher Hauptwert a)s (8.89) b)s (8.90) Abbildung 8 20 c)s (8 91a) 2. Geometrische Bedeutung Die geometrische Bedeutung der Integrale unstetiger Funktionen (8.89), (8.90) und (8.91a) besteht darin, daß mit ihnen Flächeninhalte von Figuren ermittelt werden, die sich längs einer vertikalen Asymptote ins Unendliche erstrecken, wie sie in Abb.8.20 dargestellt sind. rb dx ¦ A: / -7=; Fall (8.90), singulärer Punkt bei x = Q. Jo \Jx fi dx fb dx /— /— / —= = lim / -= = limBV6 - 2 Je) = 2Vb (konvergent). JO yfi e^OJe yß £-0V ' V ' ¦ B: / tanxdx , Fall (8 89), singulärer Punkt bei x = — . Jo 2
8.2 Bestimmte Integrale 475 />7t/2 /.Tr/2-e r /n \i / tan xdx = lim / tan xdx = lim In cos 0 — In cos ( — — e) = oo (divergent). /8 dx —= , Fall (8 91a), singulärer Punkt bei x = 0. -i \Ac /8 -$= = lim r ^= + lim /8 ^L = lim ?(£2/3 - 1) + lim ?D - ö2'*) = ? (konvergent). /2 2xdx ——- ; Fall (8 91a), singulärer Punkt bei x = ±1. -2 x2 - 1 f2 2xdx ,. r-i-e ,. f1-" ,. r2 / -s = hm / + hm / + hm / 7-2 r - 1 Z-+0J-2 *-° J-l+S 7^0 7i+ /•2 2zcfo ,. /•-!-£ . ,. r1-» . ,. r2 = Urning2 - 1)|~ _£ + • • • = lim[ln(l 4- 2e + e2 - 1) - In3] + • • • = oo (divergent). 3. Über die Anwendung des Hauptsatzes der Integralrechnung 1. Warnung Die Berechnung uneigentlicher Integrale vom Typ (8.91a) kann bei mechanischer Anwendung der Formel 6 jf(x)dx=F(x)\ba mit F'(x) = f(x) (8.92) a (s. 8.2.1.1, S. 457) ohne Berücksichtigung der singulären Punkte im Innern des Intervalls [a, b] zu groben Fehlern führen. ¦ E: So erhält man durch formale Anwendung des Hauptsatzes auf Beispiel D f2 2x dx / —0—- = In z2 - 1) 22= In3 - In3 = J-2 XZ — 1 0, während dieses Integral in Wirklichkeit divergiert. 2. Allgemeine Regel Der Hauptsatz der Integralrechnung darf auf den Fall (8.91a) nur angewendet werden, wenn die Stammfunktion von f(x) im singulären Punkt stetig ist ¦ F: In Beispiel D ist die Funktion ln(x2 — 1) für x = ±1 unstetig, so daß diese Bedingung nicht erfüllt ist Hingegen ist in Beispiel C die Funktion y = - x2^ für x = 0 stetig, so daß der Hauptsatz auf Beispiel C angewendet werden kann rs dx_ _ 3 2/3I _ 5@2/3/^2/3^ _ 9 J-i^ß~ 2X |_i~2iÖ [ j }~ 2 4. Hinreichende Bedingung für die Konvergenz eines uneigentlichen Integrals mit unbeschränktem Integranden rb pb 1. Wenn das Integral / \ f(x) \ dx existiert, dann existiert auch das Integral / f(x)dx Man spricht Ja Ja in diesem Falle vom absolut konvergenten Integral und von der absolut integrierbaren Funktion f(x) in dem betreffenden Intervall 2. Wenn die Funktion f(x) in dem Intervall [a, b) positiv ist, und wenn es eine Zahl a < 1 derart gibt, daß für hinreichend nahe bei b gelegene x-Werte gilt f(x) {b - x)a < 00 , (8.93a) dann konvergiert das Integral (8.91a). Wenn jedoch f(x) im Intervall [a,b) positiv ist und eine Zahl a > 1 derart existiert, daß für hinreichend nahe bei b gelegene x-Werte gilt f{x) (b-x)a>c>0, (8 93b)
476 8. Integralrechnung dann divergiert das Integral (8.91a). 8.2.4 Paramet er int egr ale 8.2.4.1 Definition des Paramet er int egr als Das bestimmte Integral b f f(x,y)dx = F(y) (8.94) ist eine Funktion der Variablen y, die in diesem Zusammenhang Parameter genannt wird In vielen Fällen ist die Funktion F(y) nicht mehr elementar Das Integral (8 94) kann ein gewöhnliches oder ein uneigentliches Integral mit unendlichen Integrationsgrenzen oder unbeschränkter Funktion f(x,y) sein Theoretische Betrachtungen zur Konvergenz uneigentlicher Integrale, die von einem Parameter abhängen, s. z.B. [8.4] ¦ Gammafunktion oder EuLERsches Integral zweiter Gattung (s 8.2.5,6., S. 478) r(y) = f xy-le~x dx (konvergent für y > 0) (8 95) o 8.2.4.2 Differentiation unter dem Integralzeichen 1. Satz Wenn die Funktion (8 94) im Intervall c < y < e definiert ist und die Funktion f(x,y) im Rechteck a < x < b, c < y < e stetig ist und eine partielle Ableitung nach y besitzt, dann gilt bei beliebigem y im Intervall [c, e] |//(^ = /^|^ (8.96) a a Man spricht vom Differenzieren unter dem Integralzeichen — ^ n i i. ! • d fl x , r1 d ( x\ . r1 xdx 1, ¦ t ur y > 0 beliebig- — / arctan — dx = i — arctan - \ dx = — / — = - In - dy Jo y Jo dy \ y) io r + r 2  + »i2 t, , rl x , 1 1 , 11 d 1 1 f y2 \ 1 Probe: / arctan - dx = arctan - + - y In ; — arctan - + - y In = - In Jo y y 2y l + y^dy\ y 2y l+?/2i 2 °y ' 2*"~l + ?/2' dy \ y ' 2°~l+y2J 2 *" 1 + y* ' Für y = 0 ist die Stetigkeitsbedingung nicht erfüllt, so daß hier keine Ableitung existiert. 2. Verallgemeinerung auf paramet er abhängige Integrationsgrenzen Die Formel (8 96) kann verallgemeinert werden, wenn die Funktionen a(y) und ß(y) unter den gleichen Bedingungen, die für (8 96) gefordert werden, im Intervall [c, e] definiert, stetig und differenzierbar sind und wenn die Kurven x = a(y), x = ß(y) das Rechteck a < x <b, c < y < e nicht verlassen: ß(y) ßiy)ßf( ) - J f{x, y)dx= j ^g^ dx + ß'(y) f (ß(y), y) - a\y) f (a(y), y) . (8.97) a(y) a{y) 8.2.4.3 Integration unter dem Integralzeichen Wenn die Funktion (8 94) im Intervall [c, e] definiert und die Funktion f(x,y) im Rechteck a < x < b, c < y < e stetig ist, dann gilt 6 r e J j f(x, V)dx\ dy = j\j f(x, y) dy dx (8.98) Man spricht in diesem Falle von Integration unter dem Integralzeichen.
8.2 Bestimmte Integrale 477 ¦ A: Integration der Funktion /(x, y) = xy über dem Rechteck 0 < x <l,a <y <b Die Funktion xy ist bei x — 0 , y = 0 unstetig, für a > 0 ist sie stetig. Daher kann die Integrationsreihenfolge gemäß rb r r1 ] z [ /"ft 1 [b dy 1 + 6 / / xy rfx dw = / / xy dy\ dx vertauscht werden. Links erhält man / = In , Ja Uo 1 Jo [Ja "\ Ja 1 + 2/ 1+a' rechts / — dx. Das unbestimmte Integral kann nicht durch elementare Funktionen ausgedrückt Jo \nx werden. Das bestimmte Integral ist allerdings bekannt, so daß sich ergibt L 1 xb - xa , , 1 + 6 . , dx = In @ < a < b). 'o In x 1 + a 2 2 ¦ B: Integration der Funktion f(x, y) = — r-^ über dem Rechteck 0<#<1,0<2/<1 Die (xz + y^ Funktion ist im Punkt @,0) unstetig, so daß die Formel (8.98) nicht anwendbar ist. Die Probe ergibt. r1 y2 - x2 x ix=i 1 r1 dy a n Jo (z2 + y2J = ^T^L=o = 1+^ ; /o IT? = arctan?/lo = 4 ; fl V2 - x2 _ y i2/=i _ 1 rl dx _ ii _ 7T /o (x2 + y2J dj/ ~ ^T?ly=o " '^TI' " 7o ^TI ~ " arctan:rlo " "I 8.2.5 Integration durch Reihenentwicklung, spezielle nichtelementare Funktionen Es ist nicht immer möglich, Integrale durch elementare Funktionen auszudrücken, auch wenn der In- tegrand eine elementare Funktion ist. In vielen Fällen lassen sich für solche nichtelementaren Integrale Reihenentwicklungen angeben. Läßt sich der Integrand in eine im Intervall [a, b] gleichmäßig konvergierende Reihe entwickeln, so erhält man aus dieser durch gliedweise Integration eine ebenfalls gleichmäßig konvergente Reihe für das bestimmte Integral / f(i) dt Ja 1. Integralsinus (\x\ < oo) (s. auch 14 4 3.2,2., S. 719) " sin t , 7T r smt s f sin t , 7T r sin t t) = J-Tdt=2-J — dt x3 x5 (-l)nx2n+1 ,0_ = X~ ^i + 5T5!- + -+Bn + l).Bn + l)!+-' (8'99) Integralkosinus @ < x < oo) OO X ^.. / N f COSt , _, , /" 1 — COSt , Ci(x) = - / d* = C + Ins - / dt 0 ^2 = C + l„x-^ + i^- + ... + i=ig; + ... mit (8K»a) OO C = - f e~t\ntdt = 0,577215665 (EuLERsche Konstante). (8.100b) o 3. Integrallogarithmus @ < x < 1, für 1 < x < oo als Cauchyscher Hauptwert) T./ x ? dt _, , ., . , (Ina;J (\nx)n ,n ^„N
478 8. Integralrechnung 4. Integralexponentialfunktion (—oo < x < 0, für 0 < x < oo als Cauchyscher Haupt wert) x t In Ei (x) = f e- dt = C + In \x\ + x + -^- + • • • + -^— + • • • (8 102a) J L & * £i fh ' FL» Ei (Ina;) = Li (x). 8.102b) 5. Gaußsches Fehlerintegral und Fehler-Funktion Das GAUSSsche Fehlerintegral wird mit # bezeichnet Es gelten die folgenden Definitionen und Beziehungen: i } * —oo (8.103a) lim $(x) — 1, I103b) ;.103c) Die Funktion $(x) ist die Verteilungsfunktion der normierten Normalverteilung (s 16 2 4 2, S 782) und liegt tabelliert vor in Tabelle 21.17, S. 1122 Die in der Statistik häufig verwendete Fehler-Funktion erf (x), auch Error-Funktion genannt, steht mit dem GAUSSschen Fehlerintegral in einem engen Zusammenhang (s auch 16.2.4.2, S. 782),: 2 r erf (x) = -j=l e~t2 dt = 2$0 [xV2) , (8.104a) Jm^ erf (x) = 1, * o {-l)nx2n+1 erf(,)„^__+__+...+___1) /erf (t) dt = xerf (x) + 4= (^ " l) » (8.104d) ^£M = JL e 6. Gammafunktion und Fakultät 1. Definition Die Gammafunktion, das EuLERsche Integral zweiter Gattung (8.95), ermöglicht eine Ausdehnung des Begriffs der Fakultät auf beliebige Zahlen x, auch auf komplexe Zahlen. Sie kann auf zweierlei Weise definiert werden: (8.104b) (8.104c) (8 104e) V r(x) = fe-H^dt (x>0), r(x) = lim n^°° x(x + l)(x + 2) ...(x + n) (x^ 0,-1,-2,...) 2. Eigenschaften der Gammafunktion (8.105a) ..105b) 4a-4 -i3 -2 -l b i i i i x r(x + i) = xr(x), (8 106a) Abbildung 8.21 r(n+l)=n! (n = 0,l,2, ), 1106b)
8.3 Kurvenintegrale 479 oo r{x) T(l - x) = -A— (x ^ 0, ±1, ±2,...), (8 106c) r(-)=2 f e~t2 dt = y/ir, (8.106d) sin7ra: \2/ J o / 1NB»)IV5F (n = 0,l,2,...), Bn)! (n = 0,1,2,...). (8.106e) (8 106f) Die gleichen Beziehungen gelten bei komplexem Argument z , aber nur für Re (z) > 0 . 3. Verallgemeinerung des Begriffs der Fakultät Der zunächst nur für ganzzahlige positive n definierte Begriff der Fakultät (s. 1.1.6.4,3., S. 13) erfährt über die Funktion x\ = T(x + l) (8.107a) seine Erweiterung auf beliebige reelle Zahlen. Es gelten die folgenden Beziehungen: Für ganzzahliges positives x' x\ = 1-2-3 • • • x,(8.107b) für x = 0: 0! = T(l) = 1, (8.107c) für ganzzahliges negatives x: x\ = ±oo, (8.107d) für x = - . ( - ]! = T ( - ) = — , (8.107e) für * = -i:(-l)l = r (!)=>/?, (8.107f) fürx = -|: (-|)< = T (-1) = -2^. (8.107g) Eine näherungsweise Berechnung der Fakultät für beliebig große Zahlen (> 10), auch gebrochene Zahlen n, kann mit Hilfe der Stirlingsehen Formel erfolgen: 1 12n 288n2 n!«g)"Ä( ln(n') « ln + -)\nn — n + In \/27r. (8.107h) (8.107i) Die Kurve der Funktion F(x) ist in Abb.8.21 dargestellt. In Tabelle 21.10, S. 1093 sind Zahlenwerte angegeben 7. Elliptische Integrale Für die vollständigen elliptischen Integrale (s. 8.1.4.3,2., S 454) gelten die folgenden Reihenentwicklungen: K 2 -/: dd TT sin2tf 2 Vi - k2 sin2 2 E= Nl-k2sm2'dd$ = \2/ 1 V2-47 3 V2-4-67 5 (8 108) (8.109) mit k2 < 1. Zahlenwerte für die elliptischen Integrale sind in Tabelle 21.9, S 1091 angegeben. 8.3 Kurvenintegrale Der Integralbegriff kann in verschiedene Richtungen verallgemeinert werden. Während das Integrationsgebiet des gewöhnlichen bestimmten Integrals ein Intervall auf der Zahlengeraden ist, wird beim Kurven-, auch Linienintegral genannt, ein Stück einer ebenen oder räumlichen Kurve als Integrationsgebiet gewählt, d h., es werden Grenzwerte von Summen betrachtet, deren Summanden von einer
480 8. Integralrechnung Kurve, dem Integrationsweg, abhängen Ist die Kurve, d h der Integrationsweg, geschlossen, dann wird das Kurven- zum Umlaufintegral Man unterscheidet Kurvenintegrale 1., 2. und allgemeiner Art 8.3.1 Kurvenintegrale 1. Art 8.3.1.1 Definitionen Kurvenintegral 1 Art oder Integral über eine Bogenlänge wird das bestimmte Integral j f(x,y)ds .110) (K) yt 0 ff .AaB JIk "aPi * Ai-1l X genannt, wobei u = f(x, y) eine in einem zusammenhängenden Gebiet definierte Funktion von zwei Veränderlichen ist und die Integration über den Kurvenbogen K =AB einer ebenen, durch ihre Gleichung vorgegebenen Kurve durchgeführt wird. Das betreffende Bogenstück liegt in dem gleichen Gebiet und wird Integrationsweg genannt Der Zahlenwert des Kurvenintegrals 1. Art wird auf die folgende Weise ermittelt (Abb.8.22). Abbildung 8 22 1. Zerlegung des Bogenstückes AB in n Elemementarbogenstücke durch beliebig gewählte Punkte Ai, A2,. , An_i, beginnend beim Anfangspunkt A = Aq bis zum Endpunkt B = An . 2. Auswahl beliebiger Punkte Pi im Innern oder auf dem Rande eines jeden Elementarbogenstuckes Ai-i Ai mit den Koordinaten & und r\i. 3. Multiplikation der Funktionswerte /(&, r/J in den gewählten Punkten mit den positiv zu nehmenden Bogenlängen Ai-\Ai= Asj_i 4. Addition aller so gewonnenen n Produkte /(&, r]i)Asi-i. 5. Berechnung des Grenzwertes der Summe £/te.tt)A*-i .lila) für den Fall, daß die Länge jedes Elementarbogenstuckes Asi_i gegen Null geht, also n gegen oo . Wenn der Grenzwert von (8 lila) existiert und von der Wahl der Punkte Ai und Pi unabhängig ist, dann wird er Kurvenintegral 1. Art genannt, und man schreibt f n / f(x, y) ds = Alimo ^ /(&, m)A^_i. i 111b) (K) In Analogie dazu wird das Kurvenintegral 1 Art für eine Funktion u = f(x, y, z) von drei Veränderlichen definiert, dessen Integrationsweg das Bogenstück einer Raumkurve ist: / f{x, y, z) ds = lim Y, /(&, r?i, CO As S.lllc) (K) 8.3.1.2 Existenzsatz Das Kurvenintegral 1 Art (8.111b) bzw. (8 111c) existiert, wenn die Funktion f(x,y) bzw. f(x,y,z) sowie die Kurve längs des Bogenstückes K stetig sind und die Kurve dort eine stetige Tangente besitzt Anders formuliert Es existieren in diesem Falle die genannten Grenzwerte, und sie sind unabhängig von der Wahl der Punkte Ai und Pi Die Funktion f(x, y, z) heißt in diesem Falle längs der Kurve K integrierbar
8.3 Kurvenintegrale 481 8.3.1.3 Berechnung des Kurvenintegrals 1. Art Die Berechnung des Kurvenintegrals 1. Art erfolgt durch Zurückführung auf die Berechnung eines bestimmten Integrals. 1. Vorgabe der Gleichung des Integrationsweges in Parameterform Lauten die Gleichungen eines ebenen Integrationsweges x = x(t) und y = y(t), dann gilt T j f(x,y)ds = jf[x(t),y(t)}^{x'(t)f + [y'{t)Ydt, (8.112a) (K) to und im Falle eines räumlichen Integrationsweges mit x = x(t), y = y(t) und z = z(t) T j f{x, y, z)ds = j f[x(t), y(t), z(t)] j\x'(t)}* + tf(t)]> + \z'{t)Y dt, (8.112b) (K) to wobei to der Wert des Parameters t im Punkt A und T sein Wert für den Punkt B ist. Die Punkte A und B werden so gewählt, daß die Bedingung to <T erfüllt ist. 2. Vorgabe der Gleichung des Integrationsweges in expliziter Form Man setzt t = x und erhält aus (8 112a) im ebenen Falle b J f(x,y)ds = f f[x,y{x))yj\ + [y'{x)Ydx, (8.113a) (K) und aus (8.112b) im räumlichen Falle b I /(x, y, z)ds = f f[x, y(x), z(x)}y/l + [y'(x)Y + [z'{x)f dx. o Tabelle 8.6 Kurvenintegrale 1. Art (8.113b) (K) Länge eines Kurvenstückes K Masse eines inhom. Kurvenstücks K Schwerpunktkoordinaten Trägheitsmomente einer ebenen Kurve in der x, y-Ebene Trägheitsmomente einer Raumkurve bezüglich der Koordinatenachsen L= f ds M = gds (g = f(x}y,z) Dichtefunktion) (K) Xc = Z / XQds' yc= Z J yßds' Zc= T J zgds (K) (K) (K) Ix = x2gds, Iy = 1 y2gds (K) (K) Ix = f (y2 + z2)gds , Iy = f (x2 + z2)gds , (K) (K) Iz= J{x2 + y2)gds Im Falle homogener Kurven ist in den obigen Formeln q = 1 einzusetzen.
482 8 Integralrechnung Ebene Kurve in der x, y-Ebene Raumkurve Tabelle 8.7 Kurvenelemente Kartesische Koordinaten x, y = y(x) Polarkoordinaten ip,p = p(ip) Parameterdarstellung in kartesischen Koordinaten x = x(t), y = y(t) Parameterdarstellung in kartesischen Koordinaten x = x(t),y = y(t), z = z(t) ds = y/l + [y'(x)]2dx ds = y/f(<p) + MvW&p ds = vVW]2 + [y'(t)]2dt ds = y/W)]* + [y'{t)Y + [z'{t)}Ht Dabei sind a und b die Abszissen der Punkte A und B , wobei die Bedingung a < b erfüllt sein muß Außerdem wird angenommen, daß jedem Punkt der Projektion des Kurvenstückes K auf die x-Achse dort eindeutig ein Punkt entspricht, d.h., daß jeder Kurvenpunkt eindeutig durch einen Abszissenpunkt bestimmt wird Wenn das nicht der Fall ist, dann wird das Bogenstück in mehrere Teilintervalle zerlegt, von denen jedes die genannte Eigenschaft besitzt Das Kurvenintegral über das gesamte Kurvenstück ist dann gleich der Summe der Kurvenintegrale über die Teilintervalle. 8.3.1.4 Anwendungen des Kurvenintegrals 1. Art Einige Anwendungen des Kurvenintegrals 1. Art sind in Tabelle 8.6 verzeichnet, in Tabelle 8.7 sind die zur Berechnung erforderlichen Kurvenelemente in verschiedenen Koordinaten angegeben. 8.3.2 Kurvenintegrale 2. Art 8.3.2.1 Definitionen Kurvenintegral 2. Art oder Integral über eine Projektion (auf die x-, y- oder z-Achse) wird das bestimmte Integral J f{x,v) dx ..114a) oder (K) j f(x,y,z) dx 8.114b) {K) genannt, wobei f(x,y) bzw. f(x,y,z) eine in einem zusammenhängenden Gebiet definierte Funktion von zwei bzw. drei Veränderlichen ist und die Integration über die Projektion eines ebenen oder räumlichen, durch seine Gleichung vorgegebenen Kurvenbogens K =AB auf die x-, y- oder z-Achse durchgeführt wird. Der Integrationsweg liegt in dem gleichen Gebiet. Das Kurvenintegral 2 Art wird ebenso gewonnen wie das Kurvenintegral 1. Art, jedoch mit dem Unterschied, daß beim dritten Schritt die Funktionswerte /(^i,^) bzw. /(^i,^,Ci) nicht mit den Längen der Elementarbogenstücke Ai_\Ai multipliziert werden, sondern mit ihren Projektionen auf eine der Koordinatenachsen (Abb.8.23). 1. Projektion auf die je-Achse Mit Prx Ai-iAi= ergibt sich - Xi-i = Axi- i (C) i (C) f(x, y) dx = Axlim_^o J^ /(&, Vi) Axj_i, XnZ]^ *=1 n f(x, y, z) dx = Jjim^ Y, /(&. Vü CO ^xi- 8.115) 8.116a) (8.116b) Abbildung 8 23
8.3 Kurvenintegrale 483 1. Projektion auf die y-Achse / f(x,y)dy= lim JT/fö^Ay^, (8.117a) (K) n^°° *-1 J f(x,y,z)dy= ^Hm^E/^^COAyi-i. (8.117b) 2. Projektion auf die z-Achse j /(*,y, z) rfz = Jirn^ £/te,**,CO A^_! (8 118) 8.3.2.2 Existenzsatz Das Kurvenintegral 2. Art (8 116a), (8 117a), (8 116b), (8 117b) und (8 118) existiert, wenn die Funktion f(x, y) bzw. f(x, y, z) sowie die Kurve längs des Bogenstückes K stetig sind und die Kurve dort eine stetige Tangente besitzt. 8.3.2.3 Berechnung der Kurvenintegrale 2. Art Die Berechnung des Kurvenintegrals 2 Art erfolgt durch Zurückführung auf die Berechnung des bestimmten Integrals. 1. Vorgabe der Gleichung des Integrationsweges in Parameterform Mit den Parametergleichungen des Integrationsweges x = x(t), y = y{t) und (für die Raumkurve) z = z(t) (8 119) ergeben sich die folgenden Formeln: T Für (8.116a) / f(x, y) dx = f f[x{t), y(t)}x'{t) dt. (8.120a) T Für (8.117a) f f(x,y)dy = J f[x{t),y{t))y'{t)dt. (8 120b) T Für (8 116b) / /(x, y, z)dx= f f[x(t), y{t\ z{t)]x'{t) dt (8.120c) T Für (8 117b) J f(x, y, z)dy = J /[*(*), y{t), z{t))y\t) dt (8.120d) T Für (8.118) / f(x, y, z)dz= f f[x{t), y(t), z(t)]z'(t) dt (8.120e) Dabei sind t0 bzw. T die Werte des Parameters t für den Anfangspunkt A bzw. den Endpunkt B des Bogenstückes. Hier wird im Gegensatz zum Kurvenintegral 1. Art die Forderung to < T nicht erhoben. Hinweis: Bei der Umkehrung des Integrationsweges, d.h beim Vertauschen der Punkte A und B, ändern die Integrale ihr Vorzeichen. 2. Vorgabe der Gleichung des Integrationsweges in expliziter Form Mit den Gleichungen y = y(x) bzw y = y(x), z = z(x) (8.121)
484 8. Integralrechnung für den Integrationsweg im Falle einer ebenen bzw. räumlichen Kurve und mit den Abszissen a und b der Punkte A und B, wobei die Forderung a < b nicht mehr unbedingt zu erfüllen ist, tritt in den Formeln (8 116a) bis (8.118) die Abszisse x an die Stelle des Parameters t. 8.3.3 Kurvenintegrale allgemeiner Art 8.3.3.1 Definition Kurvenintegral allgemeiner Art wird die Summe der Integrale 2 Art über alle Projektionen einer Kurve genannt. Wenn entlang des vorgegebenen Kurvenstückes K zwei Funktionen P(x, y) und Q(x, y) von zwei Veränderlichen oder drei Funktionen P(x, y, z), Q{x, y, z) und R(x, y, z) von drei Veränderlichen definiert sind und die entsprechenden Kurvenintegrale 2. Art existieren, dann gelten für eine ebene bzw eine Raumkurve die folgenden Formeln. 1. Ebene Kurve /(Pdx + Qdy) = j Pdx + f Qdy (8 122a) (K) (K) (K) 2. Raumkurve [ (Pdx + Qdy + Rdz)= f Pdx+ f Qdy + f Rdz. (8 122b) (K) (K) (K) (K) Die vektorielle Darstellung des Kurvenintegrals allgemeiner Art und eine Anwendung in der Mechanik werden im Kapitel Vektoranalysis behandelt (s. 13.3.1.1, S. 681). 8.3.3.2 Eigenschaften des Kurvenintegrals allgemeiner Art 1. Die Zerlegung des Integrationsweges mittels eines Teilungspunktes C, der auf der Kurve außerhalb des Bogenstückes AB liegen kann (Abb.8.24), führt zur Aufteilung des Integrals in zwei Teilin- A /yi tegrale: a) A b) V/B Abbildung 8.24 j (Pdx + Qdy)= J{Pdx + Qdy)+ J{Pdx + Qdy) .* (8.123) AB AC CB 2. Die Umkehrung der Durchlaufrichtung des Integrationsweges führt zum Vorzeichenwechsel des Integrals* J(Pdx + Qdy) = - j{Pdx + Qdy) .* (8.124) 3. Wegabhängigkeit Im allgemeinen hängt der Wert des Kurvenintegrals sowohl vom Anfangs- und Endpunkt als auch vom Integrationsweg ab (Abb.8.25): A' I {Pdx + Qdy)^ j (Pdx + Qdy)* (8.125) D — ^ Abbildung 8.25 ACB ADB ö A: I = / (xy dx -\-yzdy + zxdz), wobei K ein Gang der Schraubenlinie x = a cos t, y = a sin £, (K) r2n z = bt(s 3.6.2.3,1., S. 249) von£0 bis T = 2tt ist: / = / (-a3 sin21 cos t+a2bt sin t cos t+ab21 cos t) dt = *Für den Fall dreier Veränderlicher gelten analoge Formeln
8.3 Kurvenintegrale 485 7TÖ26 2~~ ¦ B: / = [y2 dx + (xy — x2) dy], wobei K ein Bogen der Parabel y2 = 9x zwischen den Punkten (*) 3 II du = fi 81 ??/3+l~ 620 4@,0) und ß(l, 3) ist- /= / Jo 8.3.3.3 Umlaufintegral 1. Begriff des Umlauf integrals Ein Umlauf integral ist ein Kurvenintegral über einen geschlossenen Integiationsweg K, d h., der Anfangspunkt A ist mit dem Endpunkt B identisch. Man schreibt dafür j>(Pdx + Qdy) oder j> (Pdx + Qdy + Rdz). (8.126) Im allgemeinen ist das Umlaufintegral verschieden von Null. Das gilt jedoch nicht, wenn die Integra- bilitätsbedingung (s. 8.3.4.2, S. 486) erfüllt ist oder wenn die Integration in einem konservativen Feld (s 13 3 1.6, S. 683) durchzuführen ist (S. auch Verschwinden des Umlaufintegrals, 13 3.1.6, S. 683.) 2. Die Berechnung des Flächeninhaltes einer ebenen Figur ist ein typisches Beispiel für die Anwendung des Umlauf integrals in der Form S=^j(xdy-ydx), (8 127) {K) wobei K die Randkurve der ebenen Figur ist Der Integrationsweg wird positiv gerechnet, wenn er entgegengesetzt zum Drehsinn des Uhrzeigers verläuft 8.3.4 Unabhängigkeit des Kurvenintegrals vom Integrationsweg Die Bedingung für die Unabhängigkeit des Kurvenintegrals vom Integrationsweg wird auch Integrabi- htät des vollständigen Differentials genannt 8.3.4.1 Zweidimensionaler Fall Wenn das Kurvenintegral J[P(x,y)dx + Q(x,y)dy] (8.128) mit den stetigen Funktionen P und Q , die in einem einfach zusammenhängenden Gebiet definiert sind, nur vom Anfangspunkt A und vom Endpunkt B abhängen soll, nicht aber vom Integrationsweg, der beide Punkte verbindet, d.h. für beliebige A und B und beliebige Integrationswege ACB bzw. ADB (Abb.8.25) die Gleichung j (Pdx + Qdy)= I (Pdx + Qdy) (8.129) ACB ADB gelten soll, dann ist notwendig und hinreichend, daß eine Funktion U(x, y) von zwei Veränderlichen existiert, deren vollständiges Differential der Integrand des Kurvenintegrals ist- Pdx + Qdy = dU, (8130a) d h., es gilt P=^, Q = ^. (8.130b) ox oy Die Funktion U(x, y) ist dann eine Stammfunktion des vollständigen Differentials (8.130a). In der Physik wird die Stammfunktion C/(x, y) als Potential in einem Vektorfeld gedeutet (s. 13 3 1 6,4., S. 684).
486 8. Integralrechnung 8.3.4.2 Existenz der Stammfunktion Notwendiges und hinreichendes Kriterium für die Existenz der Stammfunktion, die IntegrabiUtätsbedingung für den Ausdruck P dx + Qdy, ist die Gleichheit der partiellen Ableitungen dy dx ' von denen gefordert werden muß, daß sie stetig sind. 8.3.4.3 Dreidimensionaler Fall Die Bedingung für die Unabhängigkeit des Kurvenintegrals 8.131) / [P{x, y, z) dx + Q(x, y, z) dy + R(x, y, z) dz] (8 132) vom Integrationsweg lautet in Analogie zum zweidimensionalen Fall. Es wird die Existenz einer Stammfunktion U(x,y,z) gefordert, für die gilt P dx + Q dy + R dz = d U, und damit ¦— R- — dy' dz' Die IntegrabiUtätsbedingung besteht in diesem Falle aus den drei gleichzeitig zu erfüllenden Gleichungen dQ__3RL dR_dP_ dP__dQ^ dz dy dx dz' dy dx für die partiellen Ableitungen, die ihrerseits stetig sein müssen. '-£¦ o- (8.133a) (8.133b) (8.133c) P(x,y) P(x, y, z) A(x0 y0/z0) A(x0/ y0) Abbildung 8.26 Abbildung 8.27 ¦ Die Arbeit W (s. auch 8.2.2 3,2., S. 468) ist als Skalarprodukt aus Kraft F(r) und Weg s definiert. In einem konservativen Feld hängt die Arbeit nur vom Ort f ab, nicht aber von der Geschwindigkeit v. Mit F — Pex + Qey + Rez = gradV und ds = dxex + dyey + dzez sind somit für das Potential V(r) die Beziehungen (8.133a), (8.133b) erfüllt, und es gilt (8.133c) Unabhängig vom Weg zwischen den Punkten P\ und P2 erhält man- W : rp2 f 2 F(r) • ds = f \Pdx + Qdy + Rdz] = V(P2) - V{Pl) JPi JPi (8 134) 8.3.4.4 Berechnung der Stammfunktion 1. Zweidimensionaler Fall Wenn die IntegrabiUtätsbedingung (8 131) erfüllt ist, dann ist über einen beliebigen Integrationsweg innerhalb des Gültigkeitsbereiches von (8.131), der einen beliebigen
8 3 Kurvenintegrale 487 festen Punkt A(x0,yo) mit dem variablen Punkt P(x,y) verbindet (Abb.8.26), die Stammfunktion U(x, y) gleich dem Kurvenintegral U= f (Pdx + Qdy). (8.135) AP Bei praktischen Rechnungen ist es bequem, einen zu den Koordinatenachsen parallelen Integrationsweg zu wählen, d.h. einen der beiden Abschnitte AKP oder ALP, wenn dieser nicht außerhalb des Gültigkeitsbereiches von (8 131) liegt. Somit gibt es zwei Formeln für die Berechnung der Stammfunktion U(x, y) und des vollständigen Differentials Pdx + Qdy x y U = U(x0l yo)+ J + J =C+J P(£, y0) d£ + J Q(x%ri) drj, (8 136a) A~K ~KP XQ VO y x U = U(x0, yQ) + J + j =C + J Q(x0, r))dr} + f P(£, y) df • (8.136b) "äl tp yo ^o 2. Dreidimensionaler Fall (Abb.8.27) Ist die Bedingung (8.133c) erfüllt, dann kann die Stammfunktion für den Integrationsweg AK LP mit der Formel U = U(x0,y0,z0) + / + / + / ~ÄK ~KL TP x y z = I P(£, yo, zq) df + J Q(x, 77, z0) dr] + J R{x, y, f) d£ + C (8.137) ^o 2/o 20 berechnet werden. Für die anderen fünf möglichen Integrationswege mit Abschnitten, die parallel zu den Koordinatenachsen verlaufen, ergeben sich fünf weitere Formeln. ¦ A: Pdx+Qdy = --^ + -^7 .Die Bedingung (8 133c) ist erfüllt: ^ = ^= (ja + ^)ii • Anwendung der Formel (8.136b) und Einsetzen von xq = 0 , y0 = 1 0&o = 0 j 2/o = 0 darf nicht gewählt /¦^ 0 • dri fx —y d£ werden, da die Funktionen P und Q im Punkt @,0) unstetig sind) liefert U = / —z s- -I- / -s « + y ; 6 ' A 02 + 7?2 h £2 + y2 £/@,1) = — arctan - + C = arctan - + C\. ¦ B: P<te + Qdj/ + Äd* = 2(^-^7^) ^ + ^dy+(_T^__I_) dZt Die Bedingungen (8.133c) sind erfüllt. Anwendung von (8 137) und Einsetzen von xq = 1, yo = 1, zq = 1 liefert [/= /Vd£ + [V0'dr]+ [' | 9 g - - — 1 dC + C = arctan-- — + C Ji Ji Vo \£ -I- C xyy x zy 1. Verschwinden des Umlauf integrals Das Umlaufintegral über eine ebene geschlossene Kurve, d h das Kurvenintegral von Pdx + Qdy, ist gleich Null, wenn die Bedingung (8.131) erfüllt ist und wenn innerhalb der geschlossenen Kurve keine ßp ftp Punkte liegen, in denen eine der Funktionen P, Q, HE- oder Hf- unstetig oder nicht definiert ist
488 8. Integralrechnung 8.4 Mehrfachintegrale Der Integralbegriff kann im Vergleich zum gewöhnlichen Integral und zum Kurvenintegral erweitert werden, indem die Dimension des Integrationsgebietes erhöht wird. Ist das Integrationsgebiet ein ebenes Flächenstück, dann spricht man vom Flächenintegral, ist es ein beliebiges räumliches Flächenstück, vom Oberflächenintegral, ist es ein Raumstück, vom Volumenintegral Darüber hinaus sind für die verschiedensten Anwendungen andere spezielle Integralbezeichnungen üblich 8.4.1 Doppelintegral 8.4.1.1 Begriff des Doppelintegrals 1. Definition Als Doppelintegral einer Funktion von zwei Veränderlichen u = f(x,y) über einem ebenen Flächenstück S wird der Ausdruck I f(x, y) dS = ff f(x, y) dy dx (8 138) s s bezeichnet. Es handelt sich dabei um einen Zahlenwert, der auf die folgende Weise ermittelt wird (Abb.8.28): 1. Beliebige Zerlegung des Flächenstückes S in n Elementarflächenstücke 2. Auswahl eines beliebigen Punktes Pi(x{, yi) im Innern oder auf dem Rande eines jeden Elementar- flächenstückes. 3. Multiplikation des Funktionswertes von u — f(xi, yi) in diesem Punkt mit dem Inhalt AS* des entsprechenden Elementarflächenstückes 4. Addition aller so gewonnenen Produkte f(xi, 2/»)A5j 5. Berechnung des Grenzwertes der Summe I139a) für den Fall, daß der Inhalt aller Elementarflächenstücke AS* gegen Null geht, also ihre Anzahl n gegen oo . Dabei ist zu beachten, daß die Forderung, A5; solle gegen Null streben, allein nicht genügt. Es muß sichergestellt sein, daß auch der Abstand der beiden am weitesten voneinander entfernten Punkte, d h der Durchmesser des Elementarflächenstückes, gegen Null geht, weil der Flächeninhalt eines Rechtecks auch zu Null wird, wenn eine seiner Seiten Null gesetzt wird, der Durchmesser aber endlich bleibt ift/Yi) Abbildung 8.28 Abbildung 8 29 Wenn dieser Grenzwert existiert und von der Art der Einteilung des Flächenstückes S in Elementarflächenstücke sowie von der Wahl der Punkte Pi(xi, y^) unabhängig ist, dann wird er Doppelintegral der
8.4 Mehrfachintegrale 489 Funktion u = f(x,y) über dem Flächenstück S, das Integrationsgebiet, genannt, und man schreibt: / /(x, y) dS = lim £ /(*«, j/0 ASi • (8 139b) 2. Existenzsatz Das Doppelintegral (8.139b) existiert, wenn die Funktion f(x,y) im gesamten Integrationsgebiet einschließlich seines Randes stetig ist 3. Geometrische Bedeutung Die geometrische Bedeutung des Doppelintegrals liegt neben der Möglichkeit der Berechnung des Inhaltes einer ebenen Fläche im Falle f(x,y) = 1 auch darin, daß es die Berechnung des Rauminhaltes eines zylindrischen Körpers ermöglicht, der vom Flächenstück S in der x,y-Ebene, von einer Zylinderfläche, deren Erzeugende parallel zur z-Achse verläuft, und dem über S gelegenen Teil der Fläche u — f(x,y) begrenzt wird (Abb.8.29). Jedes Glied /(x^y^ASi der Summe (8.139b) entspricht dem Volumen einer prismatischen Säule mit der Grundfläche ASi und der Höhe /(#», y^ Das Vorzeichen des Gesamtvolumens ist positiv bzw negativ, je nachdem, ob der betreffende Teil der Fläche u = f(x, y) über oder unter der x, y-Ebene liegt Wenn er diese Ebene schneidet, dann ist das Volumen eine algebraische Summe der einzelnen Teilvolumina. 8.4.1.2 Berechnung des Doppelintegrals Die Berechnung des Doppelintegrals wird auf die nacheinanderfolgende Berechnung zweier einfacher Integrale zurückgeführt, die je nach dem verwendeten Koordinatensystem verschieden aussieht 1. Berechnung in kartesischen Koordinaten Das Integrationsgebiet, das als "Flächenstück aufgefaßt wird, teilt man mit Hilfe von Koordinatenlinien in infinitesimale Rechtecke ein (Abb.8.30a). Darauf erfolgt eine Summation aller Differentiale f(x, y)dS, beginnend mit allen Rechtecken längs jedes vertikalen Streifens,.danach längs jedes horizontalen Streifens. Die analytische Formulierung lautet <P2(x) I f{x,y)dS = I I f(x,y)dy\ dx = I I f(x,y)dydx |yi(s) b <P2(x) (8.140a) a tpi(x) Dabei sind y = wix) und y = <fi(x) die Gleichungen der oberen bzw. unteren Randkurve {AB)oben und (AB)unten des Flächenstückes S. Mit a bzw. b sind die Abszissen der am weitesten links bzw. rechts liegenden Kurvenpunkte bezeichnet. Das Flächenelement in kartesischen Koordinaten berechnet sich gemäß (8 140b) dy 0 dS = dxdy. 4& A i If i d) fflftB S < b x a) b) Abbildung 8.30 Abbildung 8.31 Abbildung 8 32 Bei der Ausführung der ersten Integration wird x konstant gehalten. Die eckigen Klammern in (8.140a) werden üblicherweise weggelassen, indem verabredungsgemäß das innere Integral der inneren Integrationsvariablen zugeordnet wird, das äußere der an zweiter Stelle stehenden Integrationsvariablen In
490 8 Integralrechnung (8 140a) stehen die Differentialzeichen dx und dy am Ende des Integranden Ebenso üblich ist es, diese Zeichen gleich hinter den Integralzeichen vor die Funktionen des Integranden zu setzen Man kann die Berechnung in kartesischen Koordinaten (Abb.8.30b) auch in der umgekehrten Reihenfolge ausführen: ß Mv) Jf{x,y)dS = J J f{x,y)dxdy. (8.140c) s * Vi(y) ¦ A = J xy2 dS, wobei S die Fläche zwischen der Parabel y = x2 und der Geraden y = 2x in Abb.8.31 s f2 f2x r2 r2x r2 v \ 1 f2 32 ist A = / / 9 xy2 dydx = xdx —\ =-/ (8x4 — x7) dx = — oder Jo Jx Jo 3 L.2 3 Jo o 2\^y 1 m / „2\ 32 A=r/^&*=r^*TL=5r^(y-^)*=:s Jy/2 Jo 2 |y/2 2 7o V 4 / 5 2. Berechnung in Polarkoordinaten Das Integrationsgebiet, die Fläche, wird durch Koordinatenlinien in infinitesimale Flächenstücke aufgeteilt, die jeweils durch zwei konzentrische Kreisbogen und zwei durch den Pol verlaufende Geraden begrenzt werden (Abb.8.32). Mit einem Integranden in Polarkoordinaten gemäß w = /(p, ip) hat das Flächenelement in Polarkoordinaten die Form pdpdip = dS (8 141a) Summiert wird zuerst innerhalb eines jeden Sektors, dann über alle Sektoren ¥>2 P2(<P) f'f(p,<p)dS = I -J f(p,<p)pdpd(p, (8.141b) S Vipite) wobei p = pi(<p) und p = P2(<p) die Gleichungen der inneren bzw. äußeren Randkurve AmB bzw. AnB der Fläche S sind und </?i bzw <p2 die Polarwinkel der Tangenten, die das Flächenstück an seinen Rändern berühren Die umgekehrte Integrationsreihenfolge wird selten verwendet ¦ A = J psin2 ip dS, wobei S die Fläche des Halbkreises p = 3 cos Lp ist (Abb.8.33) s r/2 f3cosv r,/2 ^cosv, /2 ß A = / p sin ipdpdip = / sin ipdtp —\ = 9 / sin <pcos ipdkp — - Jo Jo Jo ö \0 Jo 5 3. Berechnung in beliebigen krummlinigen Koordinaten u und v Die Koordinaten sind durch die Beziehungen x — x(u, v), y = y(u, v) (8.142) definiert (s 3.6 3.1,2., S 251) Das Flächenstück wird durch die Koordinatenlinien u = const und v = const in infinitesimale Flächenelemente eingeteilt (Abb.8.34) und der Integrand in den Koordinaten u und v ausgedrückt. Summiert wird zuerst längs eines Koordinatenstreifens, z B längs v = const, danach über alle Streifen: U2 V2(u) [f(u,v)dS= f I f(u,v)\D\dvdu. (8.143) S ui Vl(u) Dabei sind v = V\(u) bzw. v = v2(u) die Gleichungen der inneren bzw äußeren Randkurve AmB und AnB der Fläche S. Mit u\ und u2 werden die Koordinaten der beiden äußersten Linienbegrenzungen der Fläche S beschrieben. Mit \D\ ist der Absolutbetrag der Funktionaldeterminante
8.4 Mehrfachintegrale 491 2?*isf. ",U=Ui C,0) Abbildung 8.33 D- D(x,y) D{u,v) onst v 3 L dx dx du dv dy dy du dv ^SSx^ BO^C^P^ ÄT\ A\> \ £ vJ Abbildung 8.34 Abbildung 8.35 a44a) bezeichnet. Mit ihrer Hilfe wird das Flächenelement in krummlinigen Koordinaten beschrieben: \D\dvdu = dS. (8.144b) Die Formel (8.141b) ist ein Spezialfall von Formel (8.143) für die Polarkoordinaten x = pcostp, y = p sin ip. Die Funktionaldeterminate ergibt sich hier zu D = p. Man wählt die krummlinigen Koordinaten derart, daß die Integrationsgrenzen des Integrals (8.143) möglichst einfach werden. ¦ A = J /(x, y) dS ist für den Fall zu berechnen, daß S der Flächeninhalt der Astroide ist (s 2.13 4, S 104), mit x = acos3t, y = asin3£ (Abb.8.35). Zuerst werden die krummlinigen Koordinaten x = ucos3 v, y = usin3v eingeführt, deren Koordinatenlinien u = C\ eine Schar ähnlicher Astroiden mit den Gleichungen x = c\ cos31 und y = c\ sin31 darstellen. Die Koordinatenlinien v = Ci sind dann Strahlen mit der Gleichung y — kx , wobei k = tan3 c<i gilt Damit ergibt sich s3v — 3wcos21>sinv „ . 2 9 a fa f2n r, , \ , wo • i 2 ? j 3 o • 2 = Ott sin ucos v, A= / tlxiu.v), y{u, v))öusm fcos vavau. rv Su sin2 v cos v\ ' Jo Jo D 8.4.1.3 Anwendungen von Doppelintegralen Einige Anwendungen von Doppelintegralen sind in Tabelle 8.9, S 494 zusammengestellt. Die erforderlichen Flächenelemente in kartesischen Koordinaten und in Polarkoordinaten enthält die Tabelle 8.8, S. 492. 8.4.2 Dreifachintegral Das Dreifachintegral ist eine Erweiterung des Integralbegriffs auf ein dreidimensionales Integrationsgebiet. Man spricht daher auch vom Volumenintegral 8.4.2.1 Begriff des Dreifachintegrals 1. Definition Die Definition des Dreifachintegrals einer Funktion f(x, y, z) von drei Variablen über einen dreidimensionalen Bereich, z.B. den Raumteil V, erfolgt in Analogie zur Definition des Doppelintegrals. Man schreibt- (8 145) j f(x, y, z) dV = jjj f(x, y, z) dz dy dx. Das Volumen V (Abb.8.36) wird in Elementarvolumina zerlegt, mit denen Produkte der Art
492 8 Integralrechnung Tabelle 8.8 Ebene Flächenelemente Koordinaten Kartesische Koordinaten x, y Polarkoordinaten p, (/? Beliebige krummlinige Koordinaten u, v Flächenelemente dS = dx dy dS = pdp d(fi dS = \D\ dudv (D Funktionaldeterminante) schreibt' I f(x, y, z) dV = fff f(x, y, z) dz dy dx . (8 146) V V Das Volumen V (Abb.8.36) wird in Elementarvolumina zerlegt, mit denen Produkte der Art f(xi,yiyZi)AVi gebildet werden, wobei der Punkt Pi(xi,yi,Zi) im Innern oder auf dem Rande eines Elementarvolumens liegen kann Das Dreifachintegral ist dann der Grenzwert der Summe derartiger Produkte für alle Elementarvolumina, in die das Volumen V zerlegt wurde, und zwar für den Fall, daß der Rauminhalt jedes Elementarvolumens gegen Null, d h ihre Anzahl gegen oo geht Dabei ist wie beim Doppelintegral zu beachten, daß der Durchmesser des Elementarvolumens gegen Null strebt und nicht nur eine der möglichen Ausdehnungen. Es gilt dann: Abbildung 8 36 Abbildung 8 37 2. Existenzsatz Der Existenzsatz für das Dreifachintegral ist ein vollständiges Analogon zum Existenzsatz für das Doppelintegral 8.4.2.2 Berechnung des Dreifachintegrals Die Berechnung des Dreifachintegrals wird auf die nacheinanderfolgende Berechnung dreier einfacher Integrale zurückgeführt, die je nach dem verwendeten Koordinatensystem unterschiedlich aussieht. 1. Berechnung in kartesischen Koordinaten Das Integrationsgebiet, das hier als Volumen V aufgefaßt werden kann, teilt man mit Hilfe von Koordinatenflächen, die in diesem Falle Ebenen sind, in infinitesimale Parallelepipede ein (Abb.8.37). Dabei ist wie im Falle des Doppelintegrals zu beachten, daß der Durchmesser der Elementarzelle beim Grenzübergang gegen Null geht Auf die Zerlegung folgt die Summation aller Differentiale /(x, y, z) dV , beginnend bei allen Parallelepipeden längs einer vertikalen Säule, d h. Summation über z , danach aller Säulen längs jeder der vertikalen Schichten, d.h Summation über y , und schließlich aller Schichten,
8.4 Mehrfachintegrale 493 d.h. Summation über x. Die analytische Formulierung lautet* b [ ¥>2(x) f *p2(x,y) )dz\ V a ^j(x) \tfn (x,y) Jf(xty,z)dV = Jl I j f{x^z)dz\dy\ dy > da: fc V>2{x)il>2(x,y) = j J j f{x,y,z)dzdydx. :148a) a v?i(x)^i(x,j/) Dabei sind 2; = ipi(x,y) und 2; = tp2(x,y) die Gleichungen der unteren und oberen Oberfläche des Volumens V , gerechnet von der Kurve T aus, cte ofa/ dz heißt Volumenelement, hier in kartesischen Koordinaten Mit y = (fi(x) und y = (f2(x) sind die Funktionen bezeichnet, die die Projektionen C der Kurvenanteile von T auf die x, y-Ebene mit den Begrenzungspunkten x = a und x = b beschreiben An das Integrationsgebiet müssen die folgenden Forderungen gestellt werden Die Funktionen <pi(x) und <P2(x) sollen im Intervall a < x <b existieren, stetig sein und der Ungleichung (pi(x) < ^(x) genügen. Die Funktionen ipi(x,y) und ifj2{x,y) sollen im Gebiet a < x < b, ipi(x) < y < ^{x) definiert und stetig sein und der Ungleichung ^1B;, y) < ip2(x, y) genügen. Derart sind alle die Punkte (x, y, z) in V enthalten, die den folgenden Bedingungen genügen- a<x<b, <Pi(x) < y < <p2(x), i/Ji(x,y) < z < ip2{x,y) (8.148b) ¦ Berechnung des Integrals / = / (y2 + z2) dV für eine Pyramide, die von den Koordinatenebenen und der Ebene x + y + z = 1 begrenzt wird: /= /' f'1 [l-X-V(y* + z*)dzdydx= Hf^lf1 Jo Jo Jo Jo uo I/o (y2 + z2) ctej dyj dx = —. Abbildung 8.38 Abbildung 8 39 2. Berechnung in Zylinderkoordinaten Das Integrationsgebiet wird mit Hilfe der Koordinatenflächen p = const, (p = const, z = const in infinitesimale Elementarzellen eingeteilt (Abb.8.38). Das Volumenelement in Zylinderkoordinaten ist dV = pdzdpdip (8.149a) Nach der Darstellung des Integranden f(p, cp, z) in Zylinderkoordinaten lautet das Integral: <J>2 P2(<f) Z2{p,V) jf(p,ip,z)dV = j J f f(p,<p,z)pdzdpdip (8.149b) V Vipi(v>)*i(p,¥>) ¦ Das Integral I = dV ist für einen Körper zu berechnen (Abb.8.39), dessen Volumen von der v x,2/-Ebene, der £,z-Ebene, dem Zylinder x2 + y2 = ax und der Kugel x2 + y2 + z2 = a2 begrenzt
494 8. Integralrechnung Tabelle 8.9 Anwendungen von Doppelintegralen Allgemeine Formel Kartesische Koordinaten Polarkoordinaten 1. Flächeninhalt einer ebenen Figur: S = f dS s = // dydx = // pdpdif 2. Oberfläche: J cos 7 s -ii\ 1 + AJ+(|J^ -ii\ +(|J+(|J^ 3. Volumen eines Zylinders: V = J zdS s = // zdydx = // zpdpdip 4. Trägheitsmoment einer ebenen Figur, bezogen auf die cc-Achse: Ix = Jy2dS s = jj y2dydx = p3 sin2 (p dpdip 5. Trägheitsmoment einer ebenen Figur, bezogen auf den Pol 0: I0 = Jp2dS s = JJ(x2 + y2) dydx = p3 dpdip 6. Masse einer ebenen Figur mit der Dichtefunktion q: M= [gdS s — // Qdydx = jj Qp dpdip 7. Koordinaten des Schwerpunktes einer homogenen ebenen Figur: JxdS jydS yc = S-S~ jj xdydx jj dydx JJ ydydx // dydx // p2 cos if dpdip // p dpdip jj p2 sin ip dpdip // p dpdip wird- z\ = 0, Z2 = ya2 — x2 — y2 = y a2 — p' rir/2 ra cos if Pi = 0, p2 = o, cos ip; (fi = 0, ip2 1=1 l I pdz dpdip = Jo Jo Jo Jo 7r/2 I ra cos if 0 f dz dip = — (Sit — 4). Wegen 18
8.4 Mehrfachintegrale 495 /(p, (/?, z) = 1 ist das Integral gleich dem Rauminhalt des Körpers. 2 cosiD Abbildung 8.40 Abbildung 8 41 3. Berechnung in Kugelkoordinaten Das Integrationsgebiet wird mit Hilfe der Koordinatenflächen r = const, (p = const, fl = const in infinitesimale Elementarzellen eingeteilt (Abb.8.40). Das Volumenelement in Kugelkoordinaten ist dV = r2 sin ti dr dti dcp. (8.150a) Nachdem der Integrand in Kugelkoordinaten als / (r, (p, $) dargestellt wurde, lautet das Integral: y?2 ti2(f) r2('d,ip) [f(r,ip,<d)dV= f J J f(r,ip,ti)r2smtidrd$dip (8.150b) /COS 1? —— dV ist für einen Kegel zu berechnen, dessen Spitze sich im Ursprung des v Koordinatensystems befindet und der die 2-Achse zur Symmetrieachse hat Der Winkel in der Spitze beträgt 2a, die Höhe des Kegels ist h (Abb.8.41). Weiter gilt: r\ = 0,r2 = Q; $i = 0, d2 = ot\ <p\ = 0,if2 = 2tt . r2n ra rh/conti cos $ 1= / / ——r sim Jo Jo Jo rl = 2nh(l - cosa) p2tt ( rot I" rh/cos & iti dr dti dy = I < / cos # sin # / cos??' 4. Berechnung in beliebigen krummlinigen Koordinaten u, v, w Die Koordinaten sind durch die Beziehungen x = x(u,v,w), y = y(u,v,w), 2 = z(u,v,w) (8.151) definiert (s. 3.6.3.1,2., S. 251). Das Integrationsgebiet wird durch die Koordinatenflächen u = const, v = const, w = const in infinitesimale Volumenelemente in beliebigen Koordinaten eingeteilt: dV = \D\ du dv dw mit D = dx dx dx ~dü ~dv ~dw dy dy dy au ov ow dz dz dz Uü Bv Bw , 152a)
496 8 Integralrechnung wobei D die Funktionaldeterminante ist. Drückt man den Integranden in den Koordinaten u,v,w aus, dann lautet das Integral u2 v2(u)w2(u,v) ff{u,v,w)dV = f I I f(u,v,w)\D\dwdvdu (8.152b) V ui v\(u) w-[(u,v) Hinweis: Die Formeln (8 149b) und (8 150b) sind Spezialfälle von (8.152b). Für Zylinderkoordinaten ist D = p, für Kugelkoordinaten ist D — r2 sin fl . Mit Vorteil werden immer solche krummlinigen Koordinaten verwendet, die eine möglichst einfache Berechnung der Integrationsgrenzen des Integrals (8.152b) gestatten 8.4.2.3 Anwendungen von Dreifachintegralen Einige Anwendungen von Dreifachintegralen sind in Tabelle 8.10 zusammengestellt Die erforderlichen Flächenelemente in verschiedenen Koordinaten enthält die Tabelle 8.8, S 492 Die zu Berechnungen erforderlichen Volumenelemente enthält die Tabelle 8.11 in verschiedenen Koordinaten 8.5 Oberflächenintegrale In Analogie zu den drei verschiedenen Kurvenintegralen (s 8.3, S.479) unterscheidet man Oberflächenintegrale 1., 2. und allgemeiner Art. 8.5.1 Oberflächenintegrale 1. Art Oberflächenintegrale oder Integrale über einem räumlichen Flächenstück stellen eine Verallgemeinerung des Doppelintegrals dar, ähnlich wie das Kurvenintegral 1 Art (s. 8 3 1, S 480) eine Verallgemeinerung des gewöhnlichen bestimmten Integrals ist. 8.5.1.1 Begriff des Oberflächenintegrals 1. Art 1. Definition Oberflächenintegral 1. Art einer Punktion von drei Veränderlichen u = f(x, y, z), die in einem zusammenhängenden Gebiet definiert sein muß, nennt man das Integral [ f(x1y,z)dS, (8.153) s das über ein im allgemeinen gekrümmtes Flächenstück S in dem genannten Gebiet genommen wird. Der Zahlenwert des Oberflächenintegrals 1. Art wird auf die folgende Weise ermittelt (Abb.8.42). 1. Beliebige Zerlegung des Flächenstückes S in n Elementarflächen- Abbildung 8.42 stücke 2. Auswahl eines beliebigen Punktes Pi(xi,yi, Zi) im Innern oder auf dem Rande eines jeden Elemen- tarflächenstückes 3. Multiplikation des Funktionswertes von f(x^y^Zi) in diesem Punkt mit dem Inhalt von ASi des entsprechenden Elementarflächenstückes 4. Addition aller so gewonnenen Produkte f(xi, yi: Zi)ASi 5. Berechnung des Grenzwertes der Summe E/fe^i.^)^ (8 154a) i=l für den Fall, daß der Inhalt aller Elementarflächenstucke ASi gegen Null geht, also ihre Anzahl n gegen oo . Dabei ist wieder zu beachten, daß der Durchmesser des Elementarflächenstückes gegen Null geht und nicht nur eine Ausdehnung (s 84 1.1,1., S. 488). Wenn dieser Grenzwert existiert und von der Art der Einteilung des Flächenstückes S in Elementar-
8.5 Oberflächenintegrale 497 Tabelle 8.10 Anwendungen von Dreifachintegralen Allgemeine Formel Kartesische Koordinaten Zylinderkoordinaten Kugelkoordinaten 1. Volumen eines Körpers V = JäV = V /// dzdydx /// pdzdpdtp / / / r2 sin tidrätidtp 2. Trägheitsmoment eines Körpers, bezogen auf die 2-Achse V III(x2 + y2) dzdydx /// p3 dzdpdtp [[fr4 sin3 tidrdtidtp 3. Masse eines Körpers mit der Dichtefunktion g M = f gdV = V Hl q dzdydx /// gpdzdpdip Hl gr2 Sinti drdti dtp 4. Koordinaten des Schwerpunktes eines homogenen Körpers fxdV xc = v- = V JydV JzdV Hl xdzdydx Hl dzdydx Hl y dzdydx Hl dzdydx Hl z dzdydx Hl dzdydx p2 cos tp dp dtp dz III pdpd<pdz In p2 sin tp dp dtp dz Hl p dp dtp dz /// pz dp dtp dz /// pdpd(pdz Hl r3 sin2 ti cos tp dr dti dtp Hl r2 sin tidr dti dtp Hl r3 sin2 ti sin tp dr dti dtp r2 sin tidr dti dtp Hl r3 sin ti cos ti dr dti dtp Inf2 sin tidr dti dtp Tabelle 8.11 Volumenelemente Koordinaten Kartesische Koordinaten x, y, z Zylinderkoordinaten p,tp ,z Kugelkoordinaten r ,ti ,tp Beliebige krummlinige Koordinaten u,v,w Volumenelemente dV = dx dy dz dV = p dp dtp dz dV = r2 sin ti dr dti dtp dV = \D\ dudvdw (D Funktionaldeterminante) flächenstücke sowie von der Wahl der Punkte Pi(xi, y^zi) unabhängig ist, dann wird er Oberflächenintegral 1 Art der Funktion u = f(x,y,z) über dem Flächenstück S genannt, und man schreibt: / /(*, y, z) dS = Jm -£ f(xt, Vi, zt) AS*. ,154b)
498 8. Integralrechnung 2. Existenzsatz Das Oberflächenintegral 1. Art existiert, wenn die Funktion /(x, y, z) in dem betrachteten Gebiet stetig ist und die Funktionen, die in der Gleichung der Fläche auftreten, in diesem Gebiet stetige Ableitungen besitzen 8.5.1.2 Berechnung des Oberflächenintegrals 1. Art Die Berechnung des Oberflächenintegrals 1. Art wird auf die Berechnung des Doppelintegrals über einem ebenen Gebiet zurückgeführt (s 8.4 1, S. 488) 1. Explizite Darstellung der Fläche Ist die Fläche S durch die Gleichung z = z(x,y) (8.155) explizit vorgegeben, dann gilt ' (8.156a) S S> Qz wobei S' die Projektion von S auf die x,?/-Ebene ist und p und q die partiellen Ableitungen p = —, q = dz I /(x, y, z) dS = jj f[x, y, z(x, y)] y/l + p2 4- q2 dx dy , <9x' — sind Dabei wird vorausgesetzt, daß jedem Punkt der Fläche S in der x,y-Ebene eindeutig ein dy Punkt ihrer Projektion S' entspricht, d h., der Flächenpunkt muß eindeutig durch seine Koordinaten definiert sein Sollte das nicht der Fall sein, dann wird das Flächenstück S in einige Teilflächenstücke eingeteilt, so daß das Integral über die gesamte Fläche als algebraische Summe der Integrale über die Teilflächenstücke von S dargestellt werden kann. Ist die Fläche in Parameterform gegeben, dann entfällt diese Einschränkung Die Gleichung (8 156a) kann auch in der anderen Form ff(x,y,z)dS= fff[x,y,z(x,y)]^3L (8.156b) J JJ cos 7 s sxl dargestellt werden, weil die Gleichung der Flächennormalen von ( 1.155) die Form X -x -1 hat (s. Tabelle 3.29, S. 253), so daß für den Winkel zwischen der Normalenrichtung und der 2-Achse die Beziehung cos 7 = 1 besteht. Bei der Berechnung eines Oberflächenintegrals 1 Art faßt man diesen Winkel 7 stets als spitzen Winkel auf, so daß immer cos 7 > 0 ist. 2. Parameterdar st eilung der Fläche Ist die Fläche S durch die Gleichungen x = x(u,v), y = y(u,v), z = z(u,v) in Parameterform vorgegeben (Abb.8.43), dann gilt )dS Abbildung 8 43 j f(x,y,z)c s ¦¦ // f[x(u,v),y(u,v),z(u1v)]y/EG - F2dudv, (8 157a) 1.157b) wobei die Funktionen E, F und G die in 3 6.3 3,1., S 253 angegebene Bedeutung besitzen. Für das Flächenelement in Parameterform gilt dann VEG-F2dudv = dS, (8 157c) während A der Variabilitätsbereich von u und v ist, der der Fläche S entspricht Zur Berechnung des Integrals werden der Reihe nach die beiden Integrale für v und u integriert:
8 5 Oberflächenintegrale 499 U2 V2{u) [<P{u.v)dS= [ f <P(u,v)VEG-F2dvdu, <P{u , v) = f[x(u, v),y(u, v), z(u, v)] (8.4) S «l i)i(u) Dabei sind U\ und u2 die Koordinaten der äußersten Koordinatenlinien u = const, zwischen denen das Flächenstück S eingeschlossen ist (Abb.8.43). Mit v = Vi(u) und v = V2(u) sind die Gleichungen der Kurven AmB und AnB bezeichnet, die das Flächenstück S begrenzen (s 8.4.1.2,3., S 490) Hinweis: Die Formel (8.156a) ist ein Spezialfall von (8.157b) für u = x, v = y, E = l+p2, F = pq, G = 1 + q2 (8 158) 3. Flächenelemente gekrümmter Flächen Tabelle 8.12 Flächenelemente gekrümmter Flächen Koordinaten Kartesische Koordinaten x,y,z = z(x, y) Zylindermantel R (konstanter Radius), Koordinaten ip, z Kugeloberfläche R (konstanter Radius), Koordinaten $, ip Beliebige krummlinige Koordinaten u, v (E, F, G s Differential des Bogens, 3.6.3.3,1., S. 253) Flächenelemente ds=h{diJ+{d£Jdxdy dS = Rd(p dz dS = R2 smti dtid<p dS = VEG-F2dudv 8.5.1.3 Anwendungen des Ob er flächenint egr als 1. Art 1. Flächeninhalt eines gekrümmten Flächenstücks S=fdS (8 159) s 2. Masse eines inhomogenen gekrümmten Flächenstückes S Mit der koordinatenabhängigen Dichte g = f(x, y, z) gilt- Ms ¦ jgdS. (8.160) 8.5.2 Oberflächenintegrale 2. Art Das Oberflächenintegral 2 Art, auch Integral über eine Projektion, ist wie das Oberflächenintegral 1. Art eine Erweiterung des Begriffs Doppelintegral 8.5.2.1 Begriff des Oberflächenintegrals 2. Art 1. Begriff einer orientierten Fläche Eine Fläche besitzt gewöhnlich zwei Seiten, von denen man willkührlich eine als Außenseite bezeichnen kann. Nachdem die Außenseite gewählt ist, spricht man von einer orientierten Fläche. Flächen, für die sich nicht zwei Seiten angeben lassen, werden hier nicht betrachtet (s. [8.12]) 2. Projektion eines orientierten Flächenstückes auf eine Koordinatenebene Wenn ein begrenztes Stück S einer orientierten Fläche auf eine Koordinatenebene projiziert wird, z.B. auf die x,y-Ebene, dann kann dieser Projektion Prxy S auf die folgende Weise ein Vorzeichen zugeordnet werden (Abb.8.44)-
500 8. Integralrechnung a) Fällt der Blick von der positiven Seite der z-Achse aus auf die x,?/-Ebene und sieht man dabei die positive Seite des Flächenstückes S, dann gibt man der Projektion PrxyS das positive Vorzeichen, im entgegengesetzten Falle das negative (Abb.8.44a,b) b) Liegt das Flächenstück so, daß man zum Teil seine Innen- und zum Teil seine Außenseite sieht, dann ergibt sich Prxy S als algebraische Summe der Projektionen dieser Teile, die einmal von der Innen-, zum anderen von der Außenseite zu sehen sind (Abb.8.44c). Abbildung 8 44 Die Abb.8.44d zeigt die Projektionen des Flächenstückes Sxz und Syz eines Flächenstückes S, von denen die eine negativ, die andere positiv zu nehmen ist Die Projektion einer geschlossenen orientierten Fläche ist gleich Null. 3. Definition des Oberflächenintegrals 2. Art über eine Projektion auf eine Koordinatenebene Oberflächenintegral 2. Art einer Funktion von drei Veränderlichen f(x, y, z), die in einem zusammenhängenden Gebiet definiert ist, nennt man das Integral J f(x,y,z)dxdy, (8 161) s das über die Projektion auf die x,y-Ebene eines orientierten, in dem gleichen Gebiet liegenden Flächenstückes S genomen wird. Der Zahlenwert des Integrals wird ebenso gewonnen, wie der des Oberflächenintegrals 1. Art, ausgenommen den dritten Schritt, bei dem der Funktionswert f(xi, y^Zi) nicht mit dem Flächenelement ASi, sondern mit dessen Projektion PrxyASi, orientiert gemss 8 5.2 1,1., S 499 auf die x,2/-Ebene, zu multiplizieren ist Damit ergibt sich: j f(x, y, z) dx dy = Alimo ]T f(xit yu Zi) Prxy ASi ¦ (8.162a) In Analogie dazu werden die Oberflächenintegrale 2. Art über die Projektionen des orientierten Flächen-
8.5 Oberflächenintegrale 501 Stückes S auf die y,z- und die z,x-Ebene wie folgt berechnet: j f(x, y, z) dy dz = Alimo £ f(xit yu Zi) Pryz AS{, (8 162b) g n—KX> 1=1 / f{x,y,z)dzdx = \unoJ2f(^yi^i)PrzxASi. (8.162c) JS n-£ i=\ 4. Existenzsatz für das Oberflächenintegral 2. Art Die Oberflächenintegrale 2 Art (8 162a,b,c) existieren, wenn die Funktion f(x, y, z) sowie die Funktionen, die die Gleichung der Fläche bilden, stetig sind und stetige Ableitungen besitzen. 8.5.2.2 Berechnung des Oberflächenintegrals 2. Art Als Hauptmethode wird die Zurückführung auf Doppelintegrale betrachtet. 1. Explizite Vorgabe der Flächengleichung Ist die Fläche S durch die Gleichung z = ip(x,y) (8.163) explizit vorgegeben, dann wird das Integral (8.162a) nach der Formel J f{x,y,z)dxdy= J f[x,y,(p{x,y)]dSxy (8 164a) S PrxyS berechnet, wobei gilt: Sxy = PrxyS Die Oberflächenintegrale der Funktion f(x, y, z) über die Projektionen des Flächenstuckes S auf die anderen Koordinatenebenen werden analog berechnet- Jf(x,y,z)dydz= I f{iP(y,z),y,z}dSyz, (8.164b) S PryzS wobei x = i/j(y, z) die nach x aufgelöste Gleichung der Fläche S ist und Syz = PryzS zu setzen ist. f(x,y,z)dzdx = / f[x,x{z,x),z] dSzx, (8 164c) S PrzxS wobei y = x(z,x) die nach y aufgelöste Gleichung der Fläche S ist und Szx = PrzxS zu setzen ist. Wenn die Orientierung der Fläche geändert wird, d h., wenn die Außen- mit der Innenseite vertauscht wird, dann ändert das Integral über die Projektion sein Vorzeichen 2. Vorgabe der Flächengleichung in Parameter form Ist die Fläche S durch die Gleichungen x = x(u, v), y = y(u, v), z — z(u, v) (8 165) in Parameterform vorgegeben, dann berechnet man die Integrale (8.162a,b,c) nach den folgenden Formeln- /f D(x w) f(x,y,z)dxdy = f[x(u,v),y(u,v),z(u,v)] ' dudv, (8.166a) S A \uiv) My,z) I f(x,y,z)dydz = I f[x{u,v),y(u,v),z(u,v)]—-L^rdudv1 (8.166b) C A V ' / Mztx) lD{u,v)( /f D(z x) f(x,y,z)dzdx= / f[x(u,v),y(u,v),z(u,v)]——-—-dudv. (8 166c)
502 8 Integralrechnung Dabei sind die Ausdrücke D(x,y) D(y,z) D{z,x) die Funktionaldeterminanten der Funktionen- D(u,v) ' D{u,v) ' D(u,v) paare aus der Menge x,y,z, die von den Variablen u und v abhängen; A ist der Variabilitätsbereich von u und v des Flächenstückes S. 8.5.3 Oberflächenintegral allgemeiner Art 8.5.3.1 Begriff des Oberflächenintegrals allgemeiner Art Wenn in einem zusammenhängenden Gebiet drei Funktionen mit den drei Veränderlichen P(x, y, z), Q(x, y, z), R(x, y, z) und ein orientiertes Flächenstück S gegeben sind, dann wird als Oberflächenintegral allgemeiner Art die Summe der Integrale 2 Art über alle Projektionen bezeichnet ((Pdydz + Qdzdx + Rdxdy) = f Pdydz + fQdzdx+ f Rdxdy. (8167) s s s s Die allgemeine Formel, mit deren Hilfe man das Oberflächenintegral allgemeiner Art auf das gewöhnliche Doppelintegral zurückführt, lautet: (P dy dz + Q dz dx + R dx dy) = / D(u,v) WD(u,v) D{u,v) dudv, 1.168) wobei die Größen D{x,y) D{y,z) D{z,x) und A die oben angegebene Bedeutung besitzen D(u,v) ' D(u,v) ' D(u,v) Hinweis: Die vektorielle Darlegung der Theorie des Oberflächenintegrals allgemeiner Art ist im Kapitel Feldtheorie enthalten (s. 13.3.2, S. 684). 8.5.3.2 Eigenschaften des Oberflächenintegrals 1. Wenn das Integrationsgebiet, d.h. das Flächenstück S, auf irgendeine Art in Teilflächenstücke S\ und £2 eingeteilt ist (Abb.8.45), dann gilt- (Pdydz + Qdzdx + R dx dy) s = f(Pdydz + Qdzdx +Rdxdy) Si I- f{Pdydz + Qdzdx +Rdxdy) s2 169) Abbildung 8.45 2. Bei Vertauschung von Außen- und Innenseite der Fläche, d.h. bei Änderung der Orientierung der Fläche, ändert das Integral sein Vorzeichen: [ (P dy dz + Q dz dx + Rdx dy) = - I' (P dy dz + Q dz dx + Rdx dy), (8 170) 5+ s- wobei mit S+ und S~ ein und dieselbe Fläche bezeichnet ist, jedoch für entgegengesetzte Orientierung 3. Im allgemeinen hängt das Oberflächenintegral sowohl von der das Flächenstück S begrenzenden Kurve als auch von der Fläche selbst ab Daher sind die Integrale über verschiedene nichtgeschlossene Flächen Si und S2 mit der gleichen Randkurve K im allgemeinen verschieden (Abb.8.45) [{Pdydz + Qdzdx + Rdxdy) ^ I(P dy dz + Qdzdx + Rdxdy). (8 171)
8 5 Oberflächenintegrale 503 4. Eine Anwendung des Oberflächenintegrals besteht in der Berechnung des Volumens V eines Körpers, der von einer geschlossenen Fläche S begrenzt ist. Es kann als Oberflächenintegral V = - [(xdydz + ydzdx + zdxdy) (8.172) s berechnet werden, wobei S so orientiert ist, daß die äußere Seite der Fläche positiv genommen wird
504 9. Differentialgleichungen 9 Differentialgleichungen 1. Differentialgleichung wird eine Gleichung genannt, in der neben einer oder mehreren unabhängigen Veränderlichen und einer oder mehreren Funktionen dieser Veränderlichen auch noch die Ableitungen dieser Funktionen nach den unabhängigen Veränderlichen auftreten Die Ordnung einer Differentialgleichung ist gleich der Ordnung der höchsten in ihr auftretenden Ableitung 2. Gewöhnliche und partielle Differentialgleichungen unterscheiden sich nach der Anzahl der in ihnen enthaltenen unabhängigen Veränderlichen; im ersten Falle tritt nur eine auf, im zweiten mehrere ¦ A: ($L\ -xy5^+smy = 0; ¦ B: xd2ydx - dy(dxJ = ^(dyf ; ¦ C: ^ = xyz^ 9.1 Gewöhnliche Differentialgleichungen 1. Allgemeine gewöhnliche Differentialgleichung n—ter Ordnung in impliziter Form nennt man die Gleichung F[x,y{x),y'(x),.. Jn\x)) = 0. (9.1) Ist diese Gleichung nach y^n\x) aufgelöst, dann hat man die explizite Form einer gewöhnlichen Differentialgleichung rc-ter Ordnung. 2. Lösung oder Integral einer Differentialgleichung ist jede Funktion, die ihr in einem Intervall a < x < b, das auch unendlich sein kann, genügt. Eine Lösung, die n willkürliche Konstanten ci, c2, .., cn enthält, so daß ihr noch n zusätzliche Bedingungen auferlegt werden können, heißt allgemeine Lösung oder allgemeines Integral Erteilt man jeder dieser Konstanten einen festen Zahlenwert, so erhält man ein partikuläres Integral oder eine partikuläre Lösung ¦ Die Differentialgleichung — y' sin x + y cos x = 1 hat die allgemeine Lösung y — cos x + csin x Für c = 0 ergibt sich die partikuläre Lösung y = cos x. 3. Anfangswert aufgäbe Werden der Lösung y = y(x) einer gewöhnlichen Differentialgleichung n-ter Ordnung an einer Stelle x0 die n Werte y(xo), yf(xo), y"(xo),..., y^n~^(xo) vorgegeben, dann spricht man von einer Anfangswertaufgabe. Die vorgegebenen Werte werden als Anfangswerte oder Anfangsbedingungen bezeichnet. Sie führen auf n Gleichungen zur Bestimmung der n Konstanten c\, C2, , cn in der allgemeinen Lösung der Differentialgleichung n-ter Ordnung ¦ Die harmonische Schwingung eines speziellen elastischen Federpendels wird durch die folgene Anfangswertaufgabe beschrieben, y" + y = 0 mit y@) = yo, y'@) = 0. Lösung: y = y0 cosx . 4. Randwertaufgabe Werden an die Lösung einer gewöhnlichen Differentialgleichung Bedingungen an mehreren Stellen des Definitionsbereiches gestellt, so nennt man diese Bedingungen Randbedingungen Eine Differentialgleichung mit Randbedingungen heißt Randwertaufgabe ¦ Die Biegelinie eines auf 2 Stützen ruhenden Balkens bei gleichmäßiger Belastung wird in einem speziellen Fall durch die folgende Randwertaufgabe beschrieben- y" = x-x2 mit y@) = 0,2/A) = 0 @ < x3 xA x x<l). Losung y=-----
9.1 Gewöhnliche Differentialgleichungen 505 9.1.1 Differentialgleichungen 1. Ordnung 9.1.1.1 Existenzsatz, Richtungsfeld 1. Existenz einer Lösung Nach dem Existenzsatz von Cauchy existiert für die Differentialgleichung y' = f(x,y) (9.2) wenigstens eine Lösung, die an der Stelle x = xo den Wert yo annimmt und in einem gewissen Intervall um xo definiert und stetig ist, wenn die Funktion /(x, y) in einer Umgebung G des Punktes (x0, yo), die durch \x — xq\ < a und \y — y0\ < b festgelegt ist, stetig ist. 2. Lipschitz-Bedingung LiPSCHiTZ-Bedingung bezüglich y nennt man die Forderung \f(x,yi)-f(x,y2)\<N\yl-y2\ (9 3) für alle (x, y{) und (x, y2) aus G, wobei N nicht von x, y\ und y2 abhängen darf. Ist sie erfüllt, dann ist die Lösung von (9.2) eindeutig und eine stetige Funktion von y0 . Die Erfüllung der LiPSCHiTZ-Bedingung ist stets dann gegeben, wenn /(x, y) in dem betrachteten Gebiet eine beschränkte partielle Ableitung df/dy besitzt. In 9 1.1 4, S. 510 sind Fälle angeführt, in denen die Voraussetzungen des CAUCHYschen Existenzsatzes nicht erfüllt sind. 3. Richtungsfeld Wenn durch den Punkt P(x, y) die Kurve einer Lösung y = <p(x) der Differentialgleichung y' = /(x, y) geht, dann kann der Richtungsfaktor dy/dx der Tangente an die Kurve in diesem Punkt unmittelbar aus der Differentialgleichung bestimmt werden Damit definiert die Differentialgleichung in jedem Punkt die Richtung der Tangente an eine Lösungskurve. Die Gesamtheit dieser Richtungen (Abb.9.1) bildet das Richtungsfeld. Als Element des Richtungsfeldes bezeichnet man einen Punkt zusammen mit der in ihm gegebenen Richtung. Geometrisch betrachtet bedeutet die Integration einer Differentialgleichung 1 Ordnung somit die Verbindung der Elemente des Richtungsfeldes zu Integralkurven, deren Tangenten in jedem Punkt eine Richtung besitzen, die mit der des Richtungsfeldes in dem betreffenden Punkt übereinstimmt Abbildung 9.1 Abbildung 9 2 4. Vertikale Richtungen Wenn in einem Feld vertikale Richtungen auftreten, d.h , wenn die Funktion /(x, y) einen Pol besitzt, vertauscht man die Rolle der abhängigen und unabhängigen Variablen und faßt die Differentialgleichung dy f(x,y) [ ' als äquivalent zur vorgegebenen Differentialgleichung (9 2) auf In den Gebieten, in denen die Bedingungen des Existenzsatzes für die Differentialgleichungen (9.2) oder (9.4) erfüllt sind, geht durch jeden Punkt P(xo,yo) eine eindeutig bestimmte Integralkurve (Abb.9.2).
506 9 Differentialgleichungen /$f*+/g$*-°- 5. Allgemeines Integral Die Gesamtheit aller Integralkurven hängt von einem Parameter ab und kann durch die Gleichung F(x,y,C) = 0 (9.5a) der zugehörigen einparametrigen Kurvenschar beschrieben werden. Der Parameter C, die willkürliche Konstante, ist frei wählbar und unbedingter Bestandteil des allgemeinen Integrals jeder Differentialgleichung 1. Ordnung. Ein partikuläres Integral y = (p(x), das der Bedingung y0 = ip(xo) genügt, kann aus dem allgemeinen Integral (9 5a) gewonnen werden, indem C aus der Gleichung F(xo,yo,C) = 0 (9 5b) bestimmt wird. 9.1.1.2 Wichtige Integrationsmethoden 1. Trennung der Variablen Wenn eine Differentialgleichung auf die Form M{x)N(y)dx + P(x)Q(y)dy = 0 (9 6a) gebracht werden kann, dann kann sie auch in der Form R(x)dx + S{y)dy = 0 (9 6b) dargestellt werden, in der die Variablen x und y voneinander getrennt in zwei Termen auftreten. Dazu ist die Gleichung (9.6a) durch P(x)N(y) zu dividieren. Für das allgemeine Integral ergibt sich P(x) J N(y) Sollten für irgendwelche Werte x = x oder y = y die Funktionen P(x) oder N(y) Null werden, dann sind x = x und y = y ebenfalls Integrale der Differentialgleichung. ¦ xdy + ydx = 0, / — + / — = C; In |y| + In |x| = C = In \c\; yx = c J y J x 2. Homogene Gleichungen oder Ähnlichkeitsdifferentialgleichungen Wenn M(x,y) und N(x,y) homogene Funktionen gleichen Grades sind (s 2.18 2 6,1., S 124), dann kann in der Gleichung M(x, y)dx + N(x, y)dy = 0 (9.8) die Trennung der Variablen durch die Substitution u = y/x erreicht werden u ¦ x(x — y)y' + y2 = 0 Mit y = u(x)x erhält man A — u)v! + — = 0. Daraus folgt durch Trennung der /1 qi r (vT) du — — l — . Somit ist In x + In u — u = C = In c, ux = ceu , y = cey/x . Wie man u J x gemäß 9.1.1.2,1., Trennung der Variablen, S 506 erkennt, ist die Gerade x = 0 auch eine Integralkurve. 3. Exakte Differentialgleichung Exakte Differentialgleichung wird eine Gleichung der Form M(x,y)dx + N(x,y)dy = 0 bzw N(x,y)y' + M(x,y) = 0 (9.9a) genannt, wenn eine Funktion #(£, y) existiert, die der Gleichung M(x,y)dx + N(x,y)dy = d${xJy) (9 9b) genügt, d.h. wenn die linke Seite von (9.9a) das totale Differential einer Funktion $(x, y) ist (s S. 410). Die notwendige und hinreichende Bedingung dafür, daß die Gleichung (9 9a) eine exakte Differentialgleichung ist, besteht darin, daß die Funktionen M(x, y) und N(x, y) sowie ihre partiellen Ableitungen 1. Ordnung in einem einfach zusammenhängenden Gebiet stetig sind und die Bedingung dM dN ,nn^
9.1 Gewöhnliche Differentialgleichungen 507 erfüllen. Das allgemeine Integral von (9 9a) ist in diesem Falle die Funktion &(x,y) = C (C = const), (9.9d) die gemäß (8 136b) (s 8 3 4 4,1., S. 487) als Integral x y <P(x, y) = J M(£, y) df + j N(x0l ri) dv (9.9e) xq yo berechnet werden kann, wobei xq und y0 beliebig gewählt werden können. ¦ Ein Beispiel wird in 9.1 1 2,4., S 507 behandelt. 4. Integrierender Faktor Integrierender Faktor wird eine Funktion fi(x, y) genannt, wenn die Gleichung Mdx + Ndy = 0 (9.10a) durch Multiplikation mit /i(rc, y) in eine exakte Differentialgleichung übergeht Der integrierende Faktor genügt der Differentialgleichung ox oy oy ox Jede beliebige partikuläre Lösung dieser Gleichung ist ein integrierender Faktor. In vielen Fällen ist der integrierende Faktor /x(x, y) von der speziellen Form fi(x), //(y), ß(xy) oder fi(x2 + y2) ¦ Es ist die Differentialgleichung (x2 + y)dx — xdy = 0 zu lösen. Die Gleichung für den integrierenden _ . . dln/i o .dln/i . . . . Faktor lautet — x— Ix + wj—-— = 2 Em integrierender Faktor, der von y unabhängig ist, ox oy ergibt sich aus x^r— = -2zuu = — . Multiplikation der gegebenen Differentialgleichung mit ß ox xz liefert A + — ) dx dy = 0. Das allgemeine Integral gemäß (9.9e) für xq = 1, y0 = 0 lautet dann: \ xl J x ${x,y) = J* A + ^)df- fdn = C oder x - | = Ci. 5. Lineare Differentialgleichung 1. Ordnung Lineare Differentialgleichung 1. Ordnung wird eine Gleichung der Form y' + P{x)y = Q{x) (9.11a) genannt, in der die unbekannte Funktion und ihre Ableitung nur in der ersten Potenz, d.h. linear auftreten. Der integrierende Faktor ist hier H = exp(fpdx\ , (9.11b) das allgemeine Integral ergibt sich gemäß y = exp(- fpdx) \ f Qexp (f Pdx) dx + c\ . (9.11c) Wenn in dieser Formel das unbestimmte Integral überall durch das bestimmte Integral in den Grenzen Xo und x ersetzt wird, dann gilt für die Lösung y(x0) = C (s 8.2.1.2, 1., S 458). Ist y\ irgendeine partikuläre Lösung der Differentialgleichung, dann ergibt sich die allgemeine Lösung nach der Formel y = y!+Cexp(- f Pdx) . (9 lld) Sind zwei linear unabhängige partikuläre Lösungen y\(x) und 2/2B) (s 9.1.2.3,2., S. 518) bekannt, dann erhält man die allgemeine Lösung ohne Integration gemäß y = yi + C{y2-yi). (9.11e)
508 9. Differentialgleichungen ¦ Es ist die Differentialgleichung y' — y tan x = cos x mit der Anfangsbedingung y0 = 0 für x0 = 0 zu integrieren Man berechnet exp ( — / tan xdx) = cos x und erhält gemäß (9.11c) die Lösung 1 rx o , 1 rsinxcosx + x] sina; x 2/ — / cos a; dx = = —-—h . cos x Jo cos x L 2 J 2 2 cos x 6. Bernoullische Differentialgleichung BERNOULLlsc/ie Differentialgleichung wird die Gleichung y' + P(x)y = Q(x)yn (n^0,n^l) (912) genannt, die sich mittels Division durch yn und Einführung der neuen Variablen z = y~n+l auf eine lineare Differentialgleichung zurückführen läßt. ¦ Es ist die Differentialgleichung y' = xJy zu integrieren. Dan = 1/2 , erhält man mittels Divisi- x dz 2z x on durch Jy und Einführung der neuen Variablen z = Jy die Gleichung = — Nach der Formel dx x 2 für die Lösung einer linearen Differentialgleichung ist exp(/ P dx) — — und z = x2 \ --xdx + C\ = xl U 2 xz J x2 - In \x\ 4- C . Somit ergibt sich y = x4 ( - In |rzr| + C 1 . 7. Riccatische Differentialgleichung RiCCATisc/ie Differentialgleichung heißt die Gleichung y' = P(x)y2 + Q(x)y + R(x), (9 13a) die im allgemeinen nicht durch Quadraturen gelöst werden kann, d h. nicht durch endlich viele aufeinander folgende Integrationen Ist aber eine partikuläre Lösung y\ der RicCATischen Differentialgleichung bekannt, dann läßt sich diese durch die Substitution V = Vi + - (9.13b) auf eine lineare Differentialgleichung für z zurückführen Kennt man noch eine zweite Lösung y2, so ist zi = —-— (9.13c) 2/2-2/1 eine partikuläre Lösung der linearen Differentialgleichung für die Funktion z , so daß sich ihre Integration vereinfacht. Sollten sogar drei Lösungen yi, y2 und y% bekannt sein, dann ist das allgemeine Integral der RiCCATlschen Differentialgleichung V ~ 2/2 2/3 - 2/2 = C. (9 13d) 2/ - 2/i 2/3-2/1 Durch die Substitution y = W)+ß{x) (9'13e) läßt sich die RicCATische Differentialgleichung stets in die Normalform ^ = u2 + R{x) (9.13f) dx überführen. Mit der Substitution ergibt sich aus (9.13a) die lineare Differentialgleichung 2. Ordnung (s. 9.1.2.6,1., S. 525) Pv" - {P' + PQ)v' + P2Rv = 0. (9.13h)
9.1 Gewöhnliche Differentialgleichungen 509 1 4 ¦ Es ist die Differentialgleichung y'+y2-\—y—r = 0 zu lösen Man setzt?/ = z+ß(x), substituiert und x xz erhält für den Koeffizienten der ersten Potenz von z den Ausdruck 2ß 4- 1/x, der zum Verschwinden 15 gebracht wird, indem man ß(x) = —\/2x setzt. Somit ergibt sich z' — z2 — —^ = 0. Man sucht a 3 5 partikuläre Lösungen der Form z\ = - und findet durch Einsetzen a\ = — - , a2 = - , d.h zwei •i i 3 5 _. _ . . 1 1 3 .. _ , 3u partikuläre Lösungen z\ = — —-, z2 = — Die Substitution z = — + Z\ = —- liefert u H = 1 2x 2x u u 2x x 1 x Durch Einsetzen der partikulären Lösung u\ = = - ergibt sich die allgemeine Lösung u = z2- zi 4 x C xA + Cx , , . . 1 3 1 2xA - 2Ci — -\—ö = —7~^— uno- hiermit y = —- = — —— . 4« xd 4x3 u 2x 2x x5 + C\x 9.1.1.3 Implizite Differentialgleichungen 1. Lösung in Parameterform Gegeben sei eine Differentialgleichung in der impliziten Form F(a;,j/,2/) = 0 (9.14) Ein Verfahren, zu einer Auflösung nach y' zu kommen, geht von dem Satz aus, daß durch einen Punkt -P(£o> Vo) genau n Integralkurven verlaufen, wenn die folgenden Bedingungen erfüllt sind: a) In dem Punkt P(x0,yo) besitze die Gleichung F(x0,y0,p) = 0 mit p = dy/dx n reelle Wurzeln b) Die Funktion F(x, y,p) und ihre ersten Ableitungen seien für x = x0, y = y0, p = Pi stetig, und es gelte dF/dp ± 0. Wenn sich eine gegebene Gleichung nach y' auflösen läßt, dann zerfällt sie in n Gleichungen von der eben beschriebenen Form, nach deren Lösung man n Integralkurvenscharen erhält. Sollte sich eine Gleichung in der Form x = (p(y, y') oder y = ip(x, y') darstellen lassen, dann erhält man, indem y' = p gesetzt und p als Hilfsveränderliche verstanden wird, durch Differentiation nach y bzw. x eine Gleichung in dp/dy bzw dp/dx, die nach der Ableitung aufgelöst ist. Ihre Lösung zusammen mit der Ausgangsgleichung (9 14) ergibt dann die Lösung in Parameterform. ¦ Es ist die Differentialgleichung x = yy' 4- y'2 zu lösen. Man setzt y' = p und erhält x = py + p2 . _._ . . . . _ dx 1 1 .dp dy py Differentiation nach y und betzen von —— = - liefert - = p + [y + 2p)— oder — p p dy dp 1 —p2 2p2 . . c + arcsinp „ Die Auflösung dieser in y linearen Gleichung ergibt y = —p -\ . . . Einsetzen in die 1 - pl y/1 — p2 Ausgangsgleichung für x ergibt die Lösung in Parameterform. 2. Lagrangesche Differentialgleichung LAGRANGEsc/ie Differentialgleichung wird die Gleichung a(y')x + b(y')y + c(y') = 0 (9.14a) genannt. Ihre Lösung kann stets durch die oben angegebene Methode berechnet werden. Wenn für P = Po a(p) + b(p)p = 0 (9.14b) gilt, dann ist a(p0)x + b(p0)y + c(p0) = 0 (9.14c) ein singuläres Integral. 3. Clairautsche Differentialgleichung CLAiRAUTsc/ie Differentialgleichung heißt der Spezialfall der LAGRANGEschen Differentialgleichung, der sich für a(p) -f b(p)p = 0 (9.15a)
510 9. Differentialgleichungen ergibt, und der stets auf die Form y = y'x + f(y') (9.15b) gebracht werden kann. Die allgemeine Lösung lautet y = Cx + f(C). (915c) Neben der allgemeinen Lösung besitzt die CLAiRAUTsche Differentialgleichung ein singuläres Integral, das man durch Elimination der Konstanten C aus den Gleichungen y = Cx + f(C) (9.15d) und 0 = x + f'(C) (9.15e) erhält, wobei die zweite Gleichung aus der ersten durch Differentiation nach C gewonnen wird. Die geometrische Bedeutung der singulären Lösung besteht darin, daß sie die Einhüllende (s. 3 6.1.6, S. 244) der lösenden Geradenschar darstellt (Abb.9.3). ¦ Es ist die Differentialgleichung y = xy' + y'2 zu lösen. Das allgemeine Integral ist y = Cx + C2 , das singulare wird unter Zuhilfenahme der Gleichung x + 2C = 0 zur Elimination von C zu x2 + 4y = 0 berechnet Die Abb.9.3 zeigt diesen Fall Abbildung 9.3 Abbildung 9 4 9.1.1.4 Singulare Integrale und singulare Punkte 1. Singuläres Element Ein Element (x0,2/o> 2/o) w*rd singuläres Element der Differentialgleichung genannt, wenn es außer der Differentialgleichung F{x,y,y') = 0 (9.16a) auch der Gleichung dF w = 0 (9 16b) genügt. 2. Singuläres Integral Eine Integralkurve aus singulären Elementen heißt eine singulare Integralkurve, die Gleichung <p{x,y) = 0 (9.16c) einer singulären Integralkurve wird ein singuläres Integral genannt. Die Einhüllenden der Integralkurven sind singulare Integralkurven (Abb.9.3); sie bestehen ihrerseits ebenfalls aus singulären Elementen. Die Eindeutigkeit der Lösung (s Existenzsatz, 9.1 1.1,1., S 505) geht für alle Punkte einer singulären Integralkurve verloren. 3. Bestimmung singulärer Integrale Gewöhnlich kann ein singuläres Integral für keinen Wert der beliebigen Konstanten aus dem allgemeinen Integral ermittelt werden. Zur Bestimmung des singulären Integrals einer Differentialgleichung
9.1 Gewöhnliche Differentialgleichungen 511 (9.16a) mit p = y' muß die Gleichung BF - = 0 (9.1M) hinzugezogen und p eliminiert werden. Wenn die so gewonnene Beziehung ein Integral der gegebenen Differentialgleichung ist, dann ist sie ein singuläres Integral. Die Gleichung des Integrals ist zuvor auf eine Form zu bringen, die keine mehrdeutigen Funktionen enthält, insbesondere keine Radikale, wobei auch die komplexen Funktionswerte zu berücksichtigen sind Radikale sind Ausdrucke, die durch Inein- anderschachtelung von algebraischen Gleichungen auftreten (s. 2.2.1, S. 62). Wenn die Gleichung der Integralkurvenschar bekannt ist, d h das allgemeine Integral der gegebenen Differentialgleichung, dann kann die Bestimmung der Einhüllenden der Kurvenschar, die singulare Integrale darstellen, mit den Methoden der Differentialgeometrie erfolgen (s 3 6.1.6, S. 244). 4 8 ¦ A: Es ist die Differentialgleichung x — y — -y'2 + — y'3 = 0 zu lösen. Die Berechnung der zusätz- 8 8 liehen Gleichung mit Hilfe von (9.16d) ergibt — -p 4- -p2 = 0. Elimination von p liefert a) x — y = 0 4 und b) x — y = — , wobei a) keine, b) eine singulare Lösung ist, ein Spezialfall der allgemeinen Lösung (y - CJ = (x - CK . Die Integralkurven von a) und b) zeigt die Abb.9.4 ¦ B: Es ist die Differentialgleichung y' — In \x\ = 0 zu lösen. Dazu wird die Gleichung auf die Form dF ep — \x\ = 0 gebracht Außerdem ist -j— = ep = 0. Das singulare Integral ergibt sich durch Elimination von p zu x = 0 4. Singulare Punkte einer Differentialgleichung Singulare Punkte einer Differentialgleichung sind Punkte, in denen die rechte Seite der Differentialgleichung y' = f(x,y) (9 17a) nicht definiert ist. Diese Situation tritt z.B. in den Differentialgleichungen der folgenden Form auf: 1. Differentialgleichung mit gebrochenlinearem Quotienten ± = ^+h (ae_fc_,0) (917b) dx ex + ey besitzt im Punkt @,0) einen isolierten singulären Punkt, da die Bedingungen des Existenzsatzes lediglich in jedem beliebig nahe an @,0) gelegenen Punkt gelten, nicht aber in diesem selbst. Streng genommen sind die genannten Bedingungen in diesem Falle für alle Punkte nicht erfüllt, für die ex + ey = 0 ist Die Erfüllung der Bedingungen kann dadurch erzwungen werden, daß die Rolle der abhängigen und unabhängigen Variablen vertauscht und die Gleichung dx = cx + ey dy ax + by betrachtet wird. Das Verhalten der Integralkurven in der Nähe des singulären Punktes hängt von den Wurzeln der charakteristischen Gleichung A2 - {b 4- c)X + bc-ae = 0 (9.17d) ab. Dabei können die folgenden Fälle unterschieden werden: Fall 1: Wenn die Wurzeln reell sind und gleiches Vorzeichen besitzen, dann ist der singulare Punkt ein Knotenpunkt. In der Umgebung des singulären Punktes verlaufen alle Integralkurven durch ihn hindurch und verfügen hier, sofern die Wurzeln nicht zusammenfallen, mit Ausnahme einer Integralkurve, über eine gemeinsame Tangente Im Falle einer Doppelwurzel haben entweder alle Integralkurven ei-
512 9. Differentialgleichungen ne gemeinsame Tangente, oder durch den singulären Punkt verläuft in jeder Richtung eine eindeutige Kurve. ¦ A: Für die Differentialgleichung —- = — lautet die charakteristische Gleichung A2 - 3A + 2 = 0, dx x Ai = 2 , A2 = 1. Die Integralkurven gehorchen der Gleichung y = Cx2 (Abb.9.5) Die Gerade x = 0 ist in der allgemeinen Lösung ebenfalls enthalten, was aus der Form x2 — C\y hervorgeht. B: Die charakteristische Gleichung für — dx x + y lautet A2-2A+1 = 0 , Ai = A2 = 1 Integralkurven sind y = x\n \x\ 4- Cx (Abb.9.6). Der singulare Punkt ist ein sogenannter Knotenpunkt ¦ C: Die charakteristische Gleichung für —- = - lautet A2 — 2A +1 = 0 , Ai = A2 = 1. Integralkurven dx x sind y = Cx (Abb.9.7). Der singulare Punkt ist ein sogenannter Strahlpunkt. Abbildung 9.5 Abbildung 9 6 Abbildung 9.7 Fall 2: Wenn die Wurzeln reell sind und verschiedene Vorzeichen besitzen, ist der singulare Punkt ein Sattelpunkt, durch den zwei Integralkurven verlaufen D: Die charakteristische Gleichung für — = ¦ dx lautet A2 - 1 = 0, Ai = +1, A2 = -1 Integralkurven sind xy = C (Abb.9.8) Für C = 0 gibt es die partikulären Integrale x = 0 , y = 0 . Fall 3: Wenn die Wurzeln konjugiert komplex sind mit Re (A) ^ 0, dann ist der singulare Punkt ein Strudelpunkt, auf den sich die Integralkurven in unendlich vielen Windungen aufwinden. du x ~~\~ v ¦ E: Die charakteristische Gleichung für — = ist A2 ¦ dx x — y Integralkurven in Polarkoordinaten sind r = Ce^ (Abb.9.9). 2A + 2 = 0, Ai = 1 + i, A2 = 1 ¦ Abbildung 9.8 Abbildung 9.9 Abbildung 9.10 Fall 4: Wenn die Wurzeln rein imaginär sind, dann ist der singulare Punkt ein Wirbelpunkt, der von der Schar geschlossener Integralkurven eingeschlossen wird.
9.1 Gewöhnliche Differentialgleichungen 513 ¦ F: Die charakteristische Gleichung für — = — ist A2 4- 1 = 0, Ai = i, A2 = — i Integralkurven dx y sindx2 + ?/2 = C(Abb.9.10). 2. Differentialgleichung mit einem Quotienten aus zwei beliebigen Funktionen t-SM <9i8a) dx Q{x,y) besitzt singulare Punkte für Werte der Variablen, für die P(x,y) = Q(x,y) = 0 (9.18b) gilt. Wenn P und Q stetige Funktionen sind, die stetige partielle Ableitungen besitzen, dann kann (9.18a) in der Form dy_ = a(x - xo) + Kv - yo) + pi fo v) ,9 18cn dx c(x - xo) + e(y - y0) + Q\(x, y) dargestellt werden. Dabei sind x0 und y0 die Koordinaten des singulären Punktes, und die Werte von Pi (z, y) sowie Q\ (x, y) müssen infinitesimal von höherer Ordnung im Vergleich zum Abstand des Punktes (x, y) vom singulären Punkt (x0, yo) sein. Unter diesen Voraussetzungen ist die Art der singulären Punkte der gegebenen Differentialgleichung die gleiche wie für den singulären Punkt der Näherungsgleichung, die durch Weglassen von Pi und Q\ entsteht Dazu gibt es die folgenden Ausnahmen: a) Wenn der singulare Punkt ein Wirbelpunkt ist, dann ist der singulare Punkt der Ausgangsgleichung entweder ein Wirbelpunkt oder ein Strudelpunkt. b) Wenn ae — bc = 0, d.h. - = - oder a = c = 0 bzw a = b = 0 ist, dann müssen, damit die Art des c e singulären Punktes bestimmt werden kann, Glieder höherer Ordnung in die Betrachtung einbezogen werden. 9.1.1.5 Näherungsmethoden zur Integration von Differentialgleichungen 1. Ordnung 1. Methode der schrittweisen Näherung nach Picard Die Integration der Differentialgleichung y' = f(x,y) (9.19a) mit der Anfangsbedingung y = y0 für x = Xo liefert y = yo + jf(x,y)dx. (9.19b) Wird in die rechte Seite von (9.19b) anstelle von y eine angemessen ausgewählte Funktion y\(x) eingesetzt, dann ergibt sich eine neue Funktion y2(x), die sich von yi(x) unterscheidet, wenn nicht y\(x) bereits eine Lösung von (9.19a) ist. Nach Einsetzen von yi(x) in die rechte Seite von (9.19b) anstelle von y erhält man eine Funktion ys (x) Die durch Fortsetzen des Verfahrens gewonnene Funktionenfolge 2/1^ 2/2, 2/3, • konvergiert gegen die gesuchte Lösung in einem gewissen, den Punkt x0 enthaltenden Intervall, wenn die Bedingungen des Existenzsatzes erfüllt sind (s. 9.1.1.1,1., S. 505). Die PiCARDsc/ie Methode der schrittweisen Approximation ist ein Iterationsverfahren (s. 19 1 1, S. 911). ¦ Es ist die Differentialgleichung y' = ex — y2 für die Anfangsbedingungen Xo = 0, yo = 0 zu lösen Umschreibung in die Integralform und Anwendung der sukzessiven Approximation, beginnend mit yo = 0, liefert. yx = [*exdx = ex - 1, y2 = /* \ex - {ex - lJ] dx = 3ex - -e2x -x-- usw.
514 9. Differentialgleichungen 2. Integration durch Reihenentwicklung Die TAYLORsche Reihenentwicklung der Lösung einer Differentialgleichung (s 7 3 3 3,1., S. 434) ist in der Form V = 2/o + (x - xoW + ^p4o" + • • • + ^r^o' + • • • (9.20) darstellbar, wenn die Werte y^, yo"',..., yo"n\ ... aller Ableitungen der Lösungsfunktion für den Anfangswert xq der unabhängigen Variablen bekannt sind Man kann sie durch sukzessives Differenzieren der Differentialgleichung und Einsetzen der Anfangsbedingungen bestimmen Wenn die Differentiation der Differentialgleichung beliebig oft möglich ist, konvergiert die so gewonnene Reihe in einer gewissen Umgebung des Anfangswertes der unabhängigen Variablen Man kann diese Methode auch bei der Lösung von Differentialgleichungen n-ter Ordnung einsetzen. Hinweis: Man erhält auf diese Weise die TAYLOR-Reihe der Lösung, aber die TAYLOR-Reihe einer Funktion muß diese nicht darstellen (s. 7.3.3.3,1., S. 434). Häufig ist es vorteilhaft, die Lösung in der Form einer Reihe mit unbestimmten Koeffizienten anzusetzen, die mit Hilfe der Bedingung bestimmt werden, daß die Gleichung erfüllt wird, wenn man die Reihe einsetzt. ¦ A: Zur Lösung der Differentialgleichung y' = ex — y2 , Xq = 0 , yo = 0 kann y = a\X + a2x2 + a3x3 + • • • + anxn + • • • gesetzt werden. Einsetzen in die Gleichung liefert unter Berücksichtigung von S2 in Formel G.88) (s. S. 433) ax + 2a2x + 3a3x2 + • • • + [ai V + 2ala2x3 + (a22 + 2a1a3)x4 + ---]=l+a; + — + ^- + --- Hieraus folgt durch Koeffizientenvergleich a\ = 1, 2a2 = 1, 3a3 + a2 — - , 4a4 + 2a\a2 = - usw Sukzessive Lösung dieser Gleichungen und Einsetzen der gefundenen Koeffizienten in die Reihe liefert x2 x3 5 4 " = X + T-T-24S +--' ¦ B: Die gleiche Differentialgleichung mit der gleichen Anfangsbedingung kann auch folgendermaßen gelöst werden: Man setzt in der Differentialgleichung x = 0 und erhält y0' = 1 Außerdem ergibt sich y" = ex- 2yy\ y0" = 1, y'" = e* - 2y'2 - 2yy", y0'" = -1, y^ = e* - Sy'y" - 2yy'", </0D) = -5 Gemäß dem Satz von TAYLOR folgt y = x -\- — — — — -I . y0 k 3. Graphische Integration von Differentialgleichun- -^-^§^$ *\Ä $ gen 5r?r^^g\NXV^V^ ^^e graphiscne Integration von Differentialgleichungen ist ein Ver- ^-|>f^^^s^\ ^V fahren, das vom Begriff des Richtungsfeldes ausgeht (s. 9.1.1.1,3., .v S. 505). Die Integralkurve wird durch einen vom gegebenen An- _ ,_ ^- ^^ ^v^\ fangspunkt ausgehenden Polygonzug dargestellt (Abb.9.11), der aus kurzen Teilstrecken zusammengesetzt wird. Die Richtungen der x0 x Teilstrecken stimmen jeweils mit der Richtung des Richtungsfeldes 011 im Anfangspunkt der Teilstrecke uberein Dieser ist seinerseits zu- Abbildung 9.11 gldch Endpunkt der vorhergehenden Teilstrecke. 4. Numerische Integration von Differentialgleichungen Die numerische Integration von Differentialgleichungen wird in 19.4, S 931ff ausführlich behandelt Auf die numerische Integration der Differentialgleichung y' = f{x,y) ist man vor allem dann angewiesen, wenn sie nicht in den Spezialfällen enthalten ist, deren analytische Lösung in den vorausgehenden Abschnitten beschrieben worden ist, oder wenn f(x,y) zu kompliziert ist Das wird insbesondere dann der Fall sein, wenn f(x, y) nichtlinear von y abhängt
9 1 Gewöhnliche Differentialgleichungen 515 9.1.2 Differentialgleichungen höherer Ordnung und Systeme von Differentialgleichungen 9.1.2.1 Grundlegende Betrachtungen 1. Existenz einer Lösung 1. Zurückführung auf ein System von Differentialgleichungen Jede explizite Differentialgleichung n-ter Ordnung y{n) = f(x,y,y',. ,y(n-1)) (9.21a) kann durch Einführung der neuen Variablen yi = y\ y2 = y",...,yn-i = y{n-1) (9.2ib) auf ein System von n Differentialgleichungen 1. Ordnung Tx=V^ -dx- = y2--^x- = f{x>y'yi> -Vn~l) (921C) zurückgeführt werden. 2. Existenz eines Lösungssystems Das im Vergleich zu (9.21c) allgemeinere System von n Differentialgleichungen ^ = fi(x,y1:y2, ,j/n) (i = 1,2, .,n) (9 22a) besitzt ein eindeutig bestimmtes Lösungssystem yi = yi{x) (i = l,2,...,n), (9 22b) das in einem Intervall x0 — h < x < xo + h definiert und stetig ist und für x = x0 die vorgegebenen Anfangswerte yi(xo) = yi° (£=1,2,.. , n) annimmt, wenn die Funktionen fi(x, y\,y2, . , yn) bezüglich aller Variablen stetig sind und die folgende LlPSCHlTZ-Bedingung erfüllen. 3. Lipschitz-Bedingung Die Funktionen fc müssen für die Werte x, y» und yi + Ayi , die in einem gewissen Intervall in der Umgebung der gegebenen Anfangswerte liegen, den Ungleichungen |/i(a;,2/i +Ai/i,2/2 +Ay2>- -,2/n + Ayn) - fi(x,yuy2>...,yn)\ < K(lA^I + |Ajfe| + • • • + \Ayn\) (9.23a) mit einer gemeinsamen Konstanten K genügen (s. auch 9.1 1.1,2., S 505). Daraus folgt, vorausgesetzt die Funktion f{x,y,y',. , ?/n_1^) ist stetig und erfüllt die LlPSCHlTZ-Bedingung (9 23a), daß auch die Gleichung y{n) = f (x,y,y', ..,2/(n-1)) (9 23b) eine eindeutige Lösung besitzt, die die Anfangsbedingungen y = yo,y' = yo',- • • ,2/n-1^ = Wn_1^ für x = xo erfüllt und zusammen mit ihren Ableitungen bis einschließlich der (n — l)-ten Ordnung stetig ist 2. Allgemeine Lösung 1. Die allgemeine Lösung der Differentialgleichung (9.23b) enthält n unabhängige willkürliche Konstanten: y = y{x,CuC2i.. ,C„). (9.24a) 2. Geometrisch betrachtet, wird durch die Gleichung (9.24a) eine n-parametrige Schar von Integralkurven definiert Jede einzelne dieser Integralkurven, d.h. das Kurvenbild der entsprechenden partikulären Lösung, kann durch spezielle Wahl der willkürlichen Konstanten C\, C2,. , Cn erhalten werden. Wenn das partikuläre Integral den oben angegebenen Anfangsbedingungen genügen soll, dann müssen die Werte Ci, C2, . , Cn aus den folgenden Gleichungen ermittelt werden: y(xQ,Ci,...,Cn) = y0,
516 9. Differentialgleichungen ±y{x,cu ..,C„) = Vo , (9 24b) ~^,..,c„) = tt.("-,). Sollten diese Gleichungen für die willkürlichen Anfangswerte in einem bestimmten Gebiet einander widersprechen, dann ist die Lösung in diesem Gebiet nicht allgemein, d h , die Konstanten sind nicht unabhängig voneinander wählbar. 3. Auch die allgemeine Lösung des Systems (9 22a) enthält n willkürliche Konstanten. Diese allgemeine Lösung läßt sich auf zweierlei Weise darstellen, entweder aufgelöst nach den unbekannten Funktionen yi = F!(a:,Ci,...,Cn), jfc = F2(s,Ci,. . ,Cn),... tyn = Fn(x,Cu ... ,Cn) (9.25a) oder aufgelöst nach den willkürlichen Konstanten f\{x,yu.. ,yn) = Cu (p2{x,yi,...,yn) = C2i...,<pn{x,yi,...,yn) = Cn. (9.25b) Im Falle von (9 25b) ist jede Beziehung der Art <Pi(x,Vu ,yn) = Ci (9.25c) ein erstes Integral des Systems (9.22a) Das erste Integral kann unabhängig vom allgemeinen Integral als Beziehung der Art (9.25c) definiert werden. Dabei wird davon ausgegangen, daß (9.25c) zur Identität wird, wenn anstelle der 2/1,2/2,- , yn irgendeine partikuläre Lösung des gegebenen Systems mit einer durch diese partikuläre Lösung bestimmten willkürlichen Konstanten Ci eingesetzt wird. Wenn irgendein erstes Integral der Form (9.25c) bekannt ist, dann genügt die Funktion ifi(x, y\,.. , yn) der partiellen Differentialgleichung ?T + /i(z,J/i, • ,J/n)|^ + --• + /„(«, yi,.. ,y„)^ = 0. (925d) ox öyi öyn Umgekehrt, jede Lösung ^(x,yi,... ,yn) der Differentialgleichung (9.25d) liefert ein erstes Integral des Systems (9.22a) in der Form (9 25c). Das allgemeine Integral des Systems (9.22a) kann aus einem System von n ersten Integralen des Systems (9.22a) gebildet werden, für die die zugehörigen Funktionen ipi(x,yi, ,yn) (i = 1,2,. ,n) linear unabhängig sind (s 9 1 2 3,2., S 518). 9.1.2.2 Erniedrigung der Ordnung Eine der wichtigsten Methoden zur Integration von Differentialgleichungen n-ter Ordnung /(s,y,yV..,2/(n))=0 (9 26) ist die Substitution der Variablen, die auf einfachere Differentialgleichungen, insbesondere auf solche mit niedrigerer Ordnung fuhrt Man kann mehrere Fälle unterscheiden. 1. / = f(y, y',..., i/n)), d.h., x tritt nicht explizit auf. /(v,yV..,y(n))=<>. (9.27a) Durch die Substitution dy d2y dp /O07W Tx=P' d^=PdTy> ¦ (9-27b) kann die Ordnung der Differentialgleichung von n auf (n — 1) reduziert werden. ¦ Die Verringerung der Ordnung um 1 erfolgt für die Differentialgleichung yy" — y'2 = 0 mit der Substitution yf = p,p dp/dy = y", die auf ypdp/dy — p2 = 0 und y dp/dy — p = 0 führt und damit auf p = Cy = dy/dx , y = C\eCx . Durch Kürzung mit p geht keine Lösung verloren, da p = 0 die Lösung y = C\ liefert, die in der allgemeinen Lösung für C = 0 enthalten ist.
9.1 Gewöhnliche Differentialgleichungen 517 2. / = f(x, y',..., t/(n)), d h , y tritt nicht explizit auf: /(z,2/',..,3/(n))=0. ' (9.28a) Die Ordnung der Differentialgleichung kann durch die Substitution y'=p (9 28b) von n auf (n — 1) verringert werden. Wenn in der Ausgangsgleichung die ersten k Ableitungen fehlen, dann lautet die Substitution 3/(fc+1) = p (9.28c) ¦ Die Ordnung der Differentialgleichung y" — xy'" + (y'"K = 0 wird durch die Substitution y" = p erniedrigt, so daß sich die CLAlRAUTsche Differentialgleichung p — x-—H-r-) = 0 m^ der allge- C\X3 C\3x2 meinen Lösung p = C\X + C3 ergibt Daraus erhält man y = — h C2x + C3 . Aus der 6 2 9 F\ singulären Lösung der CLAiRAUTschen Differentialgleichung p = —r-x3'2 erhält man die singulare o/ö Lösung y = —-r-x7/2 4- C\x + C2 der zu lösenden Differentialgleichung. 315 3. / (x, y, y',..., y(n)) ist eine homogene Funktion (s. 2 18.2.5,4., S. 124) in y, y', y\... ,y(n): /(s,y,j/,...,y<n>) = 0. (9 29a) Eine Erniedrigung der Ordnung kann durch die Substitution * = -, d.h. y = eSzdx (9.29b) y erreicht werden. ¦ Die Differentialgleichung yy" — y'2 = 0 wird durch die Substitution z = y'/y mit der Ableitung dz yy" — vi2 — = = umgeformt. Die Ordnung wird dabei um 1 erniedrigt Man erhält z = C\, woraus dx yl In \y\ = dx + C2 folgt oder y = CeClx mit In \C\ = C2 • 4. / = f(x, y, y',..., yW) ist eine Funktion von x allein* y{n) = f(x). (9.30a) Die allgemeine Lösung erhält man durch n-malige Integration in der Form y = d + C2x + C3x2 + • • • + Cnxn~l + iP(x) (9.30b) mit *ix) = II'"If{xHdx)"= T^Ty. I /W(X-*)B_1 d* (9-30c) Hierbei ist zu beachten, daß x0 keine zusätzliche willkürliche Konstante ist, denn eine Änderung von xo zieht wegen Ck = W^yy(k'1){xo) (930d)
518 9 Differentialgleichungen eine Änderung von Ck nach sich. 9.1.2.3 Lineare Differentialgleichungen n-ter Ordnung 1. Klassifizierungen Eine Differentialgleichung der Form y^ + an.iy^-l) + an-2y(n-2) + • • • + axy' + a0y = F (9 31) heißt lineare Differentialgleichung n-ter Ordnung. Dabei sind F und die öj Funktionen von x, die in einem gewissen Intervall stetig sein sollen. Wenn die ao, ai,.. , an_i konstant sind, spricht man von einer Differentialgleichung mit konstanten Koeffizienten. Eine homogene lineare Differentialgleichung zeichnet sich durch F = 0 aus, eine inhomogene durch F ^ 0. 2. Fundamentalsystem von Lösungen Ein System voii n Lösungen y\, y2,... , yn einer homogenen linearen Differentialgleichung wird Fundamentalsystem genannt, falls diese Funktionen in dem betrachteten Intervall linear unabhängig sind, also ihre Linearkombination C\y\ + C2y2 -I 1- Cn2/n für kein Wertesystem der C\, C2, .., Cn , ausgenommen für C\ — C2 — • • • = Cn = 0, identisch verschwindet, d.h. für alle z-Werte in dem betreffenden Intervall. Die Lösungen y\, y2,.. , yn einer linearen homogenen Differentialgleichung bilden genau dann ein Fundamentalsystem, wenn ihre WRONSKI -Determinante W-- yi V2 ••- yn Vi V2 • • • Vn yi(r>-Vy2(n-l)...yn(n-l) (9.32) von Null verschieden ist. Für jedes Lösungssystem einer homogenen linearen Differentialgleichung gilt die Formel von LlOUViLLE: W(x) = W{x0)exp I - fai{x)dx\ (9.33) Aus (9.33) folgt, daß die WRONSKI-Determinante nur identisch verschwinden kann Das bedeutet Die n Lösungen yi, y2 ,... , yn der homogenen linearen Differentialgleichung sind genau dann linear abhängig, wenn nur an einer einzigen Stelle x0 des betrachteten Intervalls W(x0) = 0 gilt Wenn dagegen die Lösungen 2/1, y2,..., yn ein Fundamentalsystem von Lösungen bilden, dann lautet die allgemeine Lösung der linearen homogenen Differentialgleichung (9.31) y = ClVl + C2y2 + • • • + Cnyn . (9.34) 3. Erniedrigung der Ordnung Wenn eine partikuläre Lösung y\ einer homogenen Differentialgleichung bekannt ist, dann können die weiteren Lösungen durch den Ansatz y = yi{x)u(x) (9.35) aus einer homogenen linearen Differentialgleichung der Ordnung n — 1 für u'(x) bestimmt v/erden. 4. Superpositionssatz Wenn y\ und y2 zwei Lösungen der Differentialgleichung (9.31) für verschiedene rechte Seiten Fi und F2 sind, dann ist ihre Summe y — y\+y2 eine Lösung derselben Differentialgleichung mit der rechten Seite F = F\ + F2 . Daraus folgt, daß es zur Berechnung der allgemeinen Lösung einer inhomogenen Differentialgleichung ausreicht, zu irgendeiner ihrer partikulären Lösungen die allgemeine Lösung der zugehörigen homogenen Differentialgleichung zu addieren 5. Zerlegungssatz Hat die inhomogene Differentialgleichung (9.31) reelle Koeffizienten und hat ihre rechte Seite die komplexe Form F = Fi + iF2 mit den reellen Funktionen Fi und F2 , dann ist auch die Lösung y = yl-\- \y2 komplex. Diese komplexe Lösung setzt sich aus den zwei reellen Lösungen y\ und y2 der zwei inhomogenen Differentialgleichungen (9.31) mit den zugehörigen rechten Seiten Fi und F2 zusammen
9 1 Gewöhnliche Differentialgleichungen 519 6. Lösung der inhomogenen Differentialgleichung (9.31) mittels Quadraturen Wenn das Fundamentalsystem von Lösungen der zugehörigen homogenen Differentialgleichung bekannt ist, stehen die folgenden zwei Lösungsverfahren zur Verfügung- 1. Methode der Variation der Konstanten Die gesuchte Lösung wird in der Form y = Cij/i + C2y2 + • • • + Cnyn (9 36a) aufgeschrieben. Die Ci, C2, ¦, Cn werden nicht als Konstanten aufgefaßt, sondern als Funktionen von x. Danach wird die Erfüllung der Gleichungen Ci'yi + C2'y2 + --- + Cn'yn = 0, Ci V + C2'y2' + • • • + Cn V = 0, (9 36b) ei Vn-2) + c2Wn-2) + • • • + cnWn-2> = o gefordert. Einsetzen von y in (9 31) ergibt d Vn_1) + C2'y2{n-l) + • • • + Cn Vn-1) = F. (9.36c) Darauf folgt die Lösung des linearen Gleichungssystems (9.36b) und (9.36c) zur Bestimmung der C\ , C2,..., Cn', deren Integrale die C\, C2,..., Cn liefern. ¦ / + zr^-l/ ~ T^-y = x - 1. (9.36d) 1 — x 1 - x In den Intervallen x > 1 bzw x < 1 sind alle Voraussetzungen über die Koeffizienten erfüllt. Zuerst x 1 wird die homogene Gleichung y" + lf — y = 0 gelöst Eine partikuläre Lösung ist </?i = ex . 1 — sc 1 — x Der Ansatz ^2 = exu(x) ergibt für 1/B;) = v(x) die Differentialgleichung i;' + A + ) v = 0. Eine Lösung dieser Differentialgleichung ist v(x) = A - x]e- , und somit ist u{x) = Jv(x) dx = / A — x)e~x dx = xe~x . Damit ergibt sich die zweite Lösung (p2 = x Die allgemeine Lösung der homogenen Gleichung ist daher y(x) = C\ex + C2x. Variation der Konstanten ergibt jetzt: y(x) = ui(x)ex + u2(x)x, y'(x) = ui(x)ex + u2(x) + Ui(x)ex + u2(x)x , Ui'(x)ex + u2'{x)x = 0, y"(x) = ui(x)ex + ui(x)ex + u2'(x), ui(x)ex + u2(x) = x - 1, also w/(a:) = rce~x , ^'(a?) =-1, d h. U\{x) = -A 4- x)e"x + C\, w2(^) = -a? + C2 . Damit ist die allgemeine Lösung der inhomogenen Differentialgleichung: y(x) = -A + x2) + dex + (C2 - l)x = -A + x2) + Ci*e* + C2*x. 2. Methode von Cauchy In der allgemeinen Lösung y = ClVl + C2y2 + • • • + Cnyn (9.37a) der zu (9.31) gehörenden homogenen Differentialgleichung werden die Konstanten derart bestimmt, daß für den beliebigen Parameter a die Gleichungen y = 0, y' = 0,..., y^n~2^ = 0, ?/n_1) = F(a) für £ = a erfüllt sind Auf diese Weise erhält man eine spezielle Lösung der homogenen Differentialgleichung, die mit ip(x, a) bezeichnet werden soll, und X y= f (f{x, a) da (9 37b)
520 9 Differentialgleichungen ist dann eine partikuläre Lösung der inhomogenen Differentialgleichung (9.31), die an der Stelle x = x0 gemeinsam mit ihren Ableitungen bis zur Ordnung (n — 1) einschließlich verschwindet. ¦ Für die im Beispiel in 9 1 2.3,6., S. 519 mit der Methode der Variation der Konstanten gelöste Differentialgleichung (9 36d), für die y = C\ex + C2x die allgemeine Lösung der homogenen Differentialgleichung ist, folgt aus y(a) = C\ea+C2a = 0,y'(a) = C\ea+C2 = a—1 und damit (f(x,a) = ae~aex-x, so daß die partikuläre Lösung y(x) der inhomogenen Differentialgleichung mit y(x0) = y'(xo) = 0 lau- rx tet* y(x) = / (ae~aex — x)da = (x0 + l)ex~x° + (xq — l)x — x — 1. Hieraus kann man auch die JXQ allgemeine Lösung y(x) = C\*ex + C2x — (x2 + 1) der inhomogenen Differentialgleichung gewinnen. 9.1.2.4 Lösung linearer Differentialgleichungen mit konstanten Koeffizienten 1. Operatorenschreibweise Die Differentialgleichung (9 31) kann symbolisch in der Form Pn{D)y = (Dn + an^Dn-1 + an_2Dn~2 + • • + axD + a0) y = F (9.38a) geschrieben werden, wobei D ein Differentialoperator ist. Wenn die Koeffizienten ai konstant sind, dann ist Pn(D) ein gewöhnliches Polynom n-ten Grades hinsichtlich des Operators D 2. Lösungen der homogenen Differentialgleichung mit konstanten Koeffizienten Das Aufsuchen der allgemeinen Lösung der homogenen Differentialgleichung (9.38a) mit F = 0, d.h., Pn(D)y = 0 (9 39a) erfordert die Bestimmung der Wurzeln r\, r2,..., rn der zugehörigen charakteristischen Gleichung Pn{r) = rn + an-xrn-x + an.2rn~2 + • • • + a^ + a0 = 0 (9 39b) Jede Wurzel r» liefert eine Lösung enx der Gleichung Pn(D)y = 0. Tritt eine Wurzel r, mit der Vielfachheit k auf, dann sind xeriX, x2eTiX,.. , xk~1eriX ebenfalls Lösungen. Die Linearkombination aller dieser Lösungen ergibt die allgemeine Lösung der homogenen Differentialgleichung y = derix + C2er2X + • • • + eriX {ct + Ci+lx + • • • + Ci+k^xk-1) + • • • . (9.39c) Wenn die Koeffizienten a* reell sind, können komplexe Wurzeln der charakteristischen Gleichung nur paarweise konjugiert komplex auftreten. In diesem Falle sind z.B. für r\ = a + iß und r2 = et — iß in den betreffenden Gliedern der allgemeinen Lösungen die Funktionen eriX und er2X durch eax cos ßx und eax sin ßx zu ersetzen. Die dabei entstehenden Ausdrücke der Form C\ cos ßx + C2 sin ßx können auch in der Form A cos(ßx + </?) mit den Konstanten A und (p dargestellt werden. ¦ Zur Differentialgleichung y^ + y^ — y" — y = 0 gehört die charakteristische Gleichung r6 + r4 — r2 — 1 = 0 mit den Wurzeln r\ = 1, r2 = — 1, r3L = i, r5$ = —i. Die allgemeine Lösung kann in zwei Formen angegeben werden y = Ciex 4- C2e~x + (C3 + C4x) cosx + (C5 + C6x) sin z, y = dex + C2e"x + Ai cos(x + ^i) + xA2 cos(z + y?2) • 3. Satz von Hurwitz Bei verschiedenen Anwendungen, z.B. in der Schwingungslehre, ist es wichtig festzustellen, ob eine beliebige Lösung einer homogenen Differentialgleichung mit konstanten Koeffizienten für x —> +oo gegen Null strebt. Das ist stets dann der Fall, wenn die Realteile aller Wurzeln der charakteristischen Gleichung negativ sind Die Gleichung anxn + an_ixn_1 H \- a\X + a0 = 0 (9.40a)
9.1 Gewöhnliche Differentialgleichungen 521 hat nach dem Satz von HURWITZ genau dann nur Wurzeln mit negativem Realteil, wenn bei durchweg positiven Koeffizienten au sämtliche Determinanten Di=ai, D2 öi a0\ \Q>3 Q>2\ D3 = Ü\ CLq 0 a3 a2 ai a5 a4 a3 £>n = a\ a0 0 ... 0 a3 o2 ai . 0 0 0 0 ... an (9.40b) positiv sind. Der Bau der Determinanten Dk läßt sich so beschreiben, daß in der Haupt diagonale die Koeffizienten ai, a2, .., a^ stehen (k = 1,2,..., n) und daß in den Zeilen die Koeffizientenindizes von rechts nach links aufsteigende Zahlen durchlaufen Koeffizienten mit Indizes unterhalb Null und oberhalb n werden durch Nullen ersetzt. Für ein kubisches Polynom haben die Determinanten gemäß (9.40b) die folgende Gestalt: ¦¦ oi, D2 ai a2 I «3 «2 I ,03 CL\ do 0 a3 a2 ai 0 0 o3 4. Lösungen der inhomogenen Differentialgleichung mit konstanten Koeffizienten können durch Variation der Konstanten, mit der Methode von CAUCHY oder mit Hilfe der Operatorenmethode (s 9 2 2 3,5., S. 552) ermittelt werden. Eine partikuläre Lösung kann sehr schnell gefunden werden, wenn die rechte Seite von (9 31) eine spezielle Form hat. 1. Form: F(x) = Aeax, Pn(a) # 0. Eine partikuläre Lösung ist Aeax (9 41a) y Pn(<*) ' Wenn a eine m-fache Wurzel der charakteristischen Gleichung ist, d h wenn gilt Pn(a) = Pn'(a)= =Pn("-1>(a) = 0J Axme' (9.41b) dann ist y = (9.41c) eine partikuläre Lösung Diese Formeln können durch Anwendung des Zerle- gungssatzes auch verwendet werden, wenn F(x) = Aeax cosüjx oder Aeaxsmux (9.41d) ist Die zugehörigen partikulären Lösungen ergeben sich als Real- bzw Imaginärteil der Lösung derselben Differentialgleichung für F(x) = Aeax{cosux + isincjx) = Ae{ot+[u})x (9.41e) auf der rechten Seite ¦ A: Für die Differentialgleichung y" — 6y'+Sy = e2x ergeben sich die Polynome P(D) = D2 — 6D+8 mit PB) = 0 und P'(D) = 2D - 6 mit P'B) = 2 • 2 - 6 = -2 , so daß eine partikuläre Lösung lautet: y- xe" ~~2~ B: Die Differentialgleichung y" + y' + y = ex sin x führt auf die Gleichung (D2 + D + l)y = e1 (l+i)x Aus ihrer Lösung y P(l+i)x (l + iJ + (l + i) + l ex(cosx + isinx) 2 + 3i erhält man eine partikuläre Lösung
522 9 Differentialgleichungen e yx = — Bsinx — 3cosx) der Differentialgleichung. Dabei ist y\ der Imaginärteil von y. 2. Form: F(x) = Qn(x)eax , Qn(x) ist ein Polynom n-ten Grades. (9.42) Eine partikuläre Lösung kann immer in der gleichen Form gefunden werden, d.h. als Ausdruck y = R(x)eax . R(x) ist ein mit xm multipliziertes Polynom n-ten Grades, wenn a eine m-fache Wurzel der charakteristischen Gleichung ist Geht man von einem Lösungsansatz mit unbestimmten Koeffizienten des Polynoms R(x) aus und fordert man, daß er der gegebenen inhomogenen Differentialgleichung genügt, dann können die unbekannten Koeffizienten aus einem Satz linearer algebraischer Gleichungen bestimmt werden. Die Methode ist besonders in den Fällen F(x) = Qn(x) für a = 0 und F(x) = Qn(x)erx cosljx oder F(x) = Qn(x)erx sincjx für a = r ± iu anwendbar. Hier wird eine Lösung der Form y = xmerx[Mn(x) cosux + Nn(x) sina;2;] gesucht ¦ Die Wurzeln der zur Differentialgleichung y^ + 2y'" + y" = 6x 4- 2x sin x gehörenden charakteristischen Gleichung sind k\ = k2 = 0, k3 = k± = — 1. Da der Superpositionssatz gilt (s. 9.1.2.3,4., S. 518), können die partiellen Lösungen der inhomogenen Differentialgleichung für die einzelnen Summanden der rechten Seite der Reihe nach gesucht werden. Für den ersten Summanden liefert das Einsetzen des Ansatzes yx = x2(ax + b) in die rechte Seite 12a + 26 + 6ax = 6x, woraus folgt a = 1 und 6 = — 6. Für den zweiten Summanden liefert das gleiche Vorgehen y2 = [ex + d) sin x + (fx + g) cos x Die Koeffizientenbestimmung ergibt Bg + 2/ — 6c + 2/x) sin x — Bc + 2d 4- 6/ + 2cx) cos x = 2x sin x, also c = 0, d = —3, / = 1, g = — 1. Die allgemeine Lösung lautet folglich y = c\ + c2x - 6x2 + x3 + (csX + c±)e~x — 3 sin x + (x — 1) cos x 3. Eulersche Differentialgleichung: Die EuLERsche Differentialgleichung f^ ak(cx + d)V*> = F(x) (9.43a) fc=0 kann mit Hilfe der Substitution ex + d = e* (9 43b) auf eine lineare Differentialgleichung mit konstanten Koeffizienten zurückgeführt werden ¦ Die Differentialgleichung x2y" — 5xy' + Sy = x2 ist ein Spezialfall der EuLERschen Differentialgleichung für n = 2. Sie kann mit Hilfe der Substitution x = el in die im Beispiel A, 9 1.2.4,4., S 521 d 7j dii untersuchte lineare Differentialgleichung -r^-—6—+8y = e2t überführt werden. Die allgemeine Lösung dtz dt t x2 ergibt sich zu y = Cxe2t + C2e4t - -e2t = Cxx2 + C2x4 - — Ina; 9.1.2.5 Systeme linearer Differentialgleichungen mit konstanten Koeffizienten 1. Normalform Normalform nennt man den folgenden einfachen Fall eines Systems linearer Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten V\ = CLuyi + ax2y2 H h a\nyn , \ 2/2' = Ö2i2/i + ^222/2 + h a2nyn , I ,Q 44 , Vn = CLniVi + o,n2y2 H h annyn . J
9 1 Gewöhnliche Differentialgleichungen 523 Das Aufsuchen der allgemeinen Lösung eines derartigen Systems erfordert zuerst die Lösung der charakteristischen Gleichung an - r an ... ain I a2i a22-r a2n \ Q (g44b) flni ßn2 • ann - r I Zu jeder einfachen Wurzel r* dieser Gleichung gehört ein System partikulärer Lösungen yi = AieriX, y2 = A2er*x,. ,yn = AneriX, (9 44c) deren Koeffizienten Ak {k = 1,2,..., n) aus dem System homogener linearer Gleichungen fall - n)^l + 012^2 H h öln^n = 0 , (9.44d) OnlAi + Ön2^2 H h (önn ~ ^z)^n = 0 zu bestimmen sind. Da auf diese Weise nur die Verhältnisse Ak bestimmt werden können (s. Triviale Lösung und Fundamentalsystem in 4.4.2.1,2., S. 281), ist in dem so gewonnenen System partikulärer Lösungen für jedes r* eine willkürliche Konstante enthalten Wenn alle Wurzeln der charakteristischen Gleichung verschieden sind, enthält die Summe aller dieser partikulären Lösungen n voneinander unabhängige willkürliche Konstanten, so daß sich damit die allgemeine Lösung des Systems ergibt. Wenn irgendein r* eine m-fache Wurzel der charakteristischen Gleichung ist, dann entspricht dieser Wurzel ein System partikulärer Lösungen der Form j/i = Ax(x)eriX , 2/2 = A2{x)eriX i...iyn = An(x)eTiX , (9 44e) in dem die A\(x),. , An(x) Polynome sind, die maximal den Grad ra — 1 haben können Diese Ausdrucke werden mit unbestimmten Koeffizienten in das System von Differentialgleichungen eingesetzt. Danach erfolgt eine Division durch eTiX , und die Koeffizienten gleicher Potenzen von x auf der linken und der rechten Seite werden gleichgesetzt. Dadurch entstehen lineare Gleichungen für die unbekannten Koeffizienten, von denen ra frei wählbar sind. Die anderen Koeffizienten lassen sich durch diese ausdrücken. Auf diese Weise entsteht ein Lösungsanteil mit ra beliebigen Konstanten Der Grad der Polynome kann kleiner als ra — 1 sein Wenn speziell das System (9.44a) symmetrisch ist, d.h., wenn a^ = öa» gilt, dann reicht es aus, die Ai(x) = const zu setzen. Für komplexe Wurzeln der charakteristischen Gleichung können die betreffenden Glieder der allgemeinen Lösung genau so auf eine reelle Form gebracht werden, wie es für den Fall einer Differentialgleichung mit konstanten Koeffizienten gezeigt worden ist (s 9.1 2 4, S 520). ¦ Für das System yx' = 2yx + 2y2 - y3 , y2' = -2yx + Ay2 + y3 , y3' = -3yx + Sy2 + 2y3 lautet die charakteristische Gleichung |2-r 2 -1 I -2 4-r 1 =-(r-6)(r-lJ = 0. -3 8 2 —r| Für die einfache Wurzel rx = 6 erhält man -AAX + 2A2 - A3 = 0, -2A1 - 2A2 + A3 = 0, -3AX + 8Ä2 - 4^3 = 0. Daraus folgt Ax = 0, A2 = -A3 = Cx, yx = 0, y2 = Cxe6x, y3 = 2Cie6x Für die mehrfache Wurzel r2 = 1 erhält man yx = (Pxx + Qx)ex , y2 = (P2x + Q2)ex , y3 = (P3x + Q3)ex . Einsetzen in die Gleichungen liefert Pxx + (Px + Qx) = {2PX + 2P2 - P3)x + BQi + 2Q2 - Q3), P2x + (P2 + Q2) = (-2Pi + 4P2 + P3)x + {-2QX + 4Q2 + Q3), Psx + (P3 + Qs) = (~3Pi + 8P2 + 2P3)x + (-3Qi + 8Q2 + 2Q3), woraus folgt: Px = 5C2, P2 = C2, P3 = 7C2, Qi = 5C3 - 6C2 , Q2 = <?3, Q3 = 7C3 - 11C2. Die allgemeine Lösung lautet somit yx = EC2x + 5C3 — 6C2)ex , y2 = Cxe6x + (C2x + C3)ex , y3 = 2Cxe6x + GC2x + 7C3 - llC^e*.
524 9. Differentialgleichungen 2. Homogene Systeme linearer Differentialgleichungen 1. Ordnung mit konstanten Koeffizienten besitzen die allgemeine Form n n Y,aikyk' + J2bikyk = 0 (i = 1,2,... ,n). (9 45a) fc=i fe=i Wenn die Determinante det(a^) nicht verschwindet, d.h. det(oifc) ± 0, (9.45b) dann läßt sich das System (9 45a) auf die Normalform (9.44a) bringen. Der Fall det(a^) = 0 bedarf zusätzlicher Betrachtungen (s. [9.26]). Die Lösung kann auch von der allgemeinen Form aus und nach der gleichen Methode ermittelt werden, die bei der Normalform zur Anwendung kommt. Die charakteristische Gleichung hat dann die Form det(aikr + bik) = 0. (9 45c) Die Koeffizienten A{ in der Lösung (9.44c), die der einfachen Wurzel r,- entsprechen, werden in diesem Falle aus dem Gleichungssystem J2(aikrj-hbik)Ak = 0 (z = l,2,...,n) (9.45d) k=i bestimmt. Ansonsten entspricht die Lösungsmethode derselben, die im Falle der Normalform angewendet wurde. ¦ Die charakteristische Gleichung des Systems der zwei Differentialgleichungen 5yi + 4yi — 2y2 — y2 = Q,yi+ Syi -3y2 = 0 lautet. I 5r + 4 -2r - 11 0 2 . o a n 1 o L + 8 _3 = 2r^ + 2r - 4 = 0, n = 1, r2 = -2 . Die Koeffizienten A\ und A2 für r\ = 1 erhält^man aus 9A\ — 3A2 = 0, 9^4i — 3A2 = 0 bzw. A2 = 3Ai = 3Ci. Für r2 = — 2 ergibt sich analog A2 = 2A\ = 2C2. Die allgemeine Lösung lautet somit yi = dex + C2e~2x , y2 = 2>Cxex + 2C2e~2x . 3. Inhomogene Systeme linearer Differerentialgleichungen 1. Ordnung haben die allgemeine Form n n £ aikyk + Y, b*Vk = Fi{x) (i = 1,2,..., n). (9.46) fc=i fc=i 1. Superpositionssatz: Wenn y^ und y^ (j = 1,2,..., n) Lösungen inhomogener Systeme sind, die sich nur durch ihre rechten Seiten F^ bzw. F^ unterscheiden, dann ist yj = y^ + y^ (j = 1,2, ,n) auch eine Lösung dieses Systems, wobei aber für die rechten Seiten Fi(x) = F^(x) + F^2\x) gilt. Somit reicht es zur Gewinnung der allgemeinen Lösung des inhomogenen Systems aus, zur allgemeinen Lösung des zugehörigen homogenen Systems eine partikuläre Lösung des inhomogenen Systems zu addieren. 2. Die Variation der Konstanten kann z.B. benutzt werden, um eine partikuläre Lösung des inhomogenen Differentialgleichungssystems zu ermitteln. Dazu wird die allgemeine Lösung des homogenen Systems in das inhomogene System eingesetzt. Die Konstanten d, C2,..., Cn werden zu den unbekannten Funktionen C\{x), C2(x),. ., Cn(x). In den Ausdrücken für die Ableitungen yk treten neue Glieder mit Ableitungen der neuen unbekannten Funktionen Ck{x) auf. Beim Einsetzen in das gegebene System bleiben auf der linken Seite nur diese zusätzlichen Glieder übrig, weil sich die anderen gegenseitig kompensieren, denn die y\,y2, ., yn sind voraussetzungsgemäß eine Lösung des homogenen Systems. Man erhält also für die Ck'(x) ein inhomogenes System linearer algebraischer Gleichungen, das es zu lösen gilt. Nach n Integrationen findet man die Funktionen C\ (x), C2(x),..., Cn(x). Einsetzen in die Lösung des homogenen Systems anstelle der Konstanten liefert die gesuchte partikuläre Lösung
9 1 Gewöhnliche Differentialgleichungen 525 des inhomogenen Systems. ¦ Für das System aus zwei inhomogenen Differentialgleichungen 5yi + 4y\ — 2yJ — y2 — e~x , y\ + 8yi - 3?/2 = 5e-x lautet die allgemeine Lösung des homogenen Systems (s. 9.1.2.5,2., S. 524) y\ = C\ex + C2e~2x , y2 = 3C\ex + 2C2e~x . Einsetzen in die gegebenen Gleichungen und Auffassen von C\ undC2 als Funktionen von x ergibt 5CiW5C2V2x-6Cyex-4C2'e-2a: = e~x , Ciex+C2'e-2x = 5e~x oder C2'e-2x-Cie-x = e~x , Cl'ex+C2'e-2x = 5e~x . Daraus folgt 2Cx'ex = 4e~x , Ci = -e-2a;+const, 2C2fe~2x = 6e~x , C2 = 3ex + const Da eine partikuläre Lösung gesucht ist, werden alle Konstanten gleich Null gesetzt, was auf yi — 2e~x , y2 = Se~x fuhrt. Die allgemeine Lösung lautet somit yi = 2e~x + dex + C2e-2x , y2 = 3e~x + 3Ciex + 2C2e~2x 3. Die Methode der unbestimmten Koeffizienten ist besonders dann mit Vorteil einsetzbar, wenn die rechten Seiten aus speziellen Funktionen der Form Qn(x)eax bestehen. Die Anwendung erfolgt in Analogie zu dem beschriebenen Vorgehen für eine Differentialgleichung n-ter Ordnung (s. 9.1.2.4,4., S. 522) 4. Systeme 2. Ordnung Die angeführten Methoden können auch auf Systeme linearer Differentialgleichungen höherer Ordnung übertragen werden Für das System n n n ^aikyk"+ ^bikyk'+ YJCikVk = 0 (i = 1,2, ..,n) (9.47) fc=l ib=l jfe=l können insbesondere auch partikuläre Lösungen der Form y» = Aienx bestimmt werden. Dazu sind die Ti aus der charakteristischen Gleichung det(a^r2 + bikr + cik) = 0 und die Ai aus den zugehörigen linearen homogenen algebraischen Gleichungen zu ermitteln 9.1.2.6 Lineare Differentialgleichungen 2. Ordnung Zu dieser Klasse von Differentialgleichungen gehören viele spezielle Differentialgleichungen, die in den Anwendungen vorkommen und in in diesem Abschnitt behandelt werden. Ausführliche Darstellungen der Eigenschaften dieser Differentialgleichungen und ihrer Lösungsfunktionen s. [9.26]. 1. Allgemeine Methoden 1. Die inhomogene Differentialgleichung / + p(x)y' + q{x)y - F(x). (9.48a) a) Die allgemeine Lösung der zugehörigen homogenen Differentialgleichung, d h. F(x) = 0, lautet y = Cm + C2y2 (9 48b) Dabei sind y\ und 2/2 zwei linear unabhängige partikuläre Lösungen dieser Gleichung (s. 9 1 2 3,2., 5. 518) Wenn eine partikuläre Lösung y\ bekannt ist, dann kann die zweite y2 mit der aus der Formel (9 33) von LiouviLLE folgenden Gleichung . y2 = AyJe^-{P^dx (9 48c) J yr bestimmt werden, wobei A beliebig wählbar ist b) Eine partikuläre Lösung der inhomogenen Gleichung kann mit Hilfe der Formel y = 11F{iNXP {Jm d?)toWto® ~ W(x)»@] % (9 48d) Xo gewonnen werden, wobei y\ und 2/2 zwei partikuläre Lösungen der zugehörigen homogenen Differentialgleichung sind c) Eine partikuläre Lösung der inhomogenen Differentialgleichung kann auch durch Variation der Konstanten bestimmt werden (s 9 1 2 3,6., S. 519) 2. Die inhomogenee Differentialgleichung s(x)y" 4- p{x)y' + q(x)y = F(x) (9.49a)
526 9. Differentialgleichungen enthalte Funktionen s(x), p(x), q(x) und F(x), die Polynome sind oder Funktionen, die in einem gewissen Gebiet in konvergente Reihen nach Potenzen von (x — x0) entwickelt werden können, wobei s(x0) 7^ 0 sein muß. Die Lösungen dieser Differentialgleichung können dann ebenfalls nach Potenzen von (x — Xq) in Reihen entwickelt werden, die in demselben Gebiet konvergieren. Ihre Bestimmung erfolgt mit Hilfe der Methode der unbestimmten Koeffizienten. Die gesuchte Lösung wird als Reihe der Form y = a0 + a\(x - xq) 4- a2(x - x0J H (9 49b) angesetzt und in die Differentialgleichung (9 49a) eingesetzt. Gleichsetzen der Koeffizienten gleicher Potenzen von (x — Xo) liefert Gleichungen zur Bestimmung der Koeffizienten a0, a\, a2,. ¦ Zur Lösung der Differentialgleichung y" + xy = 0 wird y — a0 + a\X + a2x2 + a3x3 + • • •, y' = a\ + 2a2x + 3a3x2 + • • • und y" = 2a2 + 6a3x + • • • gesetzt Man erhält 2a2 = 0, 6o3 + a0 = 0,. Die Lösung dieser Gleichungen üefert a2 = 0, a3 = — —- , a^ = — ——- , 05 = 0,..., so daß sich die Lösungzuy = ao(i-±l + r±^-..?J +ai^_^_ + _^__...j ergibt 3. Die homogene Differentialgleichung x2y" + xp{x)yf + q(x)y = 0 (9.50a) kann für den Fall, daß sich die Funktionen p(x) und q(x) in konvergente Reihen von x entwickeln lassen, mit Hilfe der Methode der unbestimmten Koeffizienten gelöst werden. Die Lösungen haben die Form y = xr(a0 + d\x + a2x2 + • • •), (9 50b) deren Exponenten r aus der definierenden Gleichung r{r - 1) + p@)r + q@) = 0 (9 50c) bestimmt werden. Wenn die Wurzeln dieser Gleichung verschieden sind und ihre Differenz nicht ganzzahlig ist, dann ergeben sich zwei unabhängige Lösungen von (9 50a). Anderenfalls liefert die Methode der unbestimmten Koeffizienten nur eine Lösung. Dann kann mit Hilfe von (9.48b) eine zweite Lösung ermittelt werden oder wenigstens eine Form gesucht werden, aus der eine Lösung mittels der Methode der unbestimmten Koeffizienten gewonnen werden kann. ¦ Für die BESSELsche Differentialgleichung (9.51a) erhält man mit der Methode der unbestimmten 00 Koeffizienten nur eine Lösung der Form y\ = ^ akXn+2k (ao ^ 0), die bis auf einen konstanten Faktor fc=0 mit Jn(x) übereinstimmt Als zweite Lösung findet man wegen exp f — pdx) = - mit der Formel (9.48c) ^ = ^1 / 2nt 2k,2 = Avi [ ET:lCfkdx = BVl Ins + x~» £ dk** . J x • x2n (E akx2k) J xZn+i £Tj Die Bestimmung der Koeffizienten ck und dk aus den ak gestaltet sich schwierig. Man kann jedoch den letzten Ausdruck benutzen, um die Lösung mit der Methode der unbestimmten Koeffizienten zu ermitteln. Offensichtlich ist diese Form eine Reihenentwicklung der Funktion Yn(x) (9.52c). 2. Besselsche Differentialgleichung x2y" + xy' + (x2 - n2)y = 0 . (9.51a) 1. Definierende Gleichung ist in diesem Falle r(r - 1) + r - n2 = r2 - n2 = 0. (9.51b) Daraus folgt r = ±n . Einsetzen von y = xn(a0 + a\X H ) (9 51c)
9 1 Gewöhnliche Differentialgleichungen 527 in die Gleichung (9.51a) liefert für den zu Null gesetzten Koeffizienten von xn+k die Bestimmungsgleichung k{2n + k)ak + afc_2 = 0. (9.51d) Für k = 1 erhält man Bn + l)ai = 0. Für die Werte 2,3,... von k ergibt sich a0 a2m+i =0 (ra= 1,2, . ), a0 a2 = - Ö4 = 2-4-Bn + 2)Bn + 4) '' 2Bn + 2) ' ao beliebig. 2. Bessel- oder Zylinderfunktionen Die für a0 = 1 (9.51e) (Gammafunktion r s. 8.2.5,6., 2nr(n + l) S. 478) entstandene Reihe ist eine partikuläre Lösung der BESSELschen Differentialgleichung (9.51a) für ganzzahlige n Sie definiert die BESSEL- oder Zylinderfunktion n-ter Ordnung 1. Gattung Ux) ¦¦ Xn ( X2 X4 2nr(n + 1) V " 2Bn + 2) + 2 • 4 • Bn 4- 2)Bn + 4) /^\ n+2k = E 27 rj A:!r(n + k + 1) ' (9.52a) Die Kurvenbilder der Funktionen J0 und J\ zeigt die Abb.9.12 Die allgemeine Lösung der BESSELschen Differentialgleichung für nicht ganzzahlige n hat die Form y = CxJn(x) + C2J-n{x), (9 52b) wobei J-n(x) eine Reihe darstellt, die aus der Reihe für Jn(x) durch Ersetzen von n durch — n folgt. Für ganzzahliges n gilt J-n(x) = (-l)nJn(x). In der allgemeinen Lösung ist in diesem Falle J-n{x) durch die BESSELsche Funktion 2 Gattung Jm(x) cosm7r — J-m(x) Yn{x) = lim (9.52c) sinra7T auch WEBERsche Funktion genannt, zu ersetzen. Zur Reihenentwicklung von Yn(x) s. z.B. [9.26]. Die Kurvenbilder der Funktionen Y0 und Y\ zeigt die Abb.9.13. Abbildung 9.12 Abbildung 9.13 3. Bessel-Funktionen mit imaginären Variablen In manchen Anwendungen treten Bessel- Funktionen mit rein imaginären Variablen auf. Dabei werden gewöhnlich die Produkte i~nJn(ia:) be-
528 9. Differentialgleichungen trachtet, die mit In{x) bezeichnet werden- In(x) = i nJn(ix) ¦¦ ©¦ ^ ©- ^ ©¦ r(n + l) l!r(n + 2) 2!/> + 3) Hierbei handelt es sich um Lösungen der Differentialgleichung x2y" + zj/ - (x2 + n2)y = 0 Eine zweite Lösung dieser Differentialgleichung ist die MACDONALDsc/ie Funktion 7Tl-n(x) ~ In(x) 2 Kn(x) : (9.53a) (9 53b) (9 53c) sinwr Wenn n gegen eine ganze Zahl konvergiert, strebt dieser Ausdruck einem Grenzwert zu. Die Funktionen In(x) und Kn(x) werden auch modifizierte Bessel-Funktionen genannt. Die Kurvenbilder der Funktionen I0 und I\ zeigt die Abb. 9.14, die der Funktionen K0 und K\ die Abb. 9.15. Werte der Funktionen Jq(x) , J\(x), Yq{x) , Yi(x), Iq{x) , h(x), Kq(x) , K\(x) enthalten die Tabellen 21.11, S. 1094 \ 5 \ 4 \ 3" \ 2 -3 -2/ij; / -2- / -3 -4i -5- 1: .y 1 2 3 x 1.5 1.0 0.5 Abbildung 9.14 0.5 1.0 1.5 2.0 Abbildung 9.15 0.5 Abbildung 9.16 4. Wichtige Formeln für die Bessel-Funktionen / \ t / x 2n _ . . dJJx) Jn-l(x) + J„+i(z) = ./n(z) , —~. — Jn{x) + Jn-i(x) X Die Formeln (9.54a) gelten auch für die WEBER-Funktionen Yn(x) In-i(x) -In+i{x) = Kn+i{x) -Kn_i(x) ¦ 2nln(x) dln(x) x dx 2nKn(x) dKn{x) In-i{x) In(x), x ' dx Für ganzzahliges n gilt: tt/2 2 r J2n{x) — — I cos(xsin(^)cos2n^dv?, TT J 0 tt/2 2 /¦ J2n+i(x) = — / sin(xsin(/?)sinBn + l)ipd(f TT J -Kn.l(x)--Kn(x) x 1.0 (9.54a) (9 54b) (9.54c) (9 54d) (9 54e)
9 1 Gewöhnliche Differentialgleichungen 529 oder, in komplexer Form, Jn(x) = ^-t- / elx TT J 0 cos rup dip. Die Jn+i/2(x) können durch elementare Funktionen ausgedrückt werden. Insbesondere gilt* J\/2(x) — \l — sini, (9.55a) J_ 1/2B0 = \ —cosz. ' \ -KX (9.54f) (9.55b) Durch sukzessive Anwendung der Rekursionsformeln (9.54a) bis (9.54f) können die Ausdrücke für Jn+\/2(x) für beliebige ganzzahlige n aufgeschrieben werden. Für große Werte von x ergeben sich die folgenden asymptotischen Formeln: Jn(x) = < In(x) = - 7TX ex ^x h(-T-")+0(:)]' **"(:)]¦ "¦m-i/SN-t-")"®]- *•¦(')-i/i»-[1+0(j)]- (9.56a) (9 56b) (9.56c) (9 56d) Der Ausdruck O l - J bedeutet eine infinitesimale Größe der gleichen Ordnung wie — (s. Landau- Symbole, 2.1.4.9,4., S. 57) Weitere Angaben über BESSEL-Funktionen s. [21 1]. 3. Legendresche Differentialgleichung Bei Beschränkung auf den Fall reeller Veränderlicher und ganzzahliger Parameter n = 0,1, 2, .. hat die LEGENDREsche Differentialgleichung die Gestalt A - x2)y" - 2xy' + n(n + l)y = 0 oder (A - x2)y')' + n(n + \)y = 0. (9.57a) 1. Legendresche Polynome oder Kugelfunktionen 1. Art heißen die partikulären Lösungen der LEGENDREschen Differentialgleichung für ganzzahlige n, die sich über den Potenzreihenansatz y — ^2 avx" ermitteln lassen. Für \x\ < 00 und n = 0,1,2,... gilt: Bn)! Pn{x) ¦¦ 2n(n*J n(n-l) 2 n(n-l)(n-2)(n-3) 4 _ 2Bn-l) 2-4Bn-l)Bn-3) PB(x) = F(n +1,-11,1,-^) = ^ 1 dn{x2-l)n dxn (|x|<oo); (9.57b) (9.57c) wobei mit F die hypergeometrische Reihe (s. 9.1.2.6,4., S 531) bezeichnet wird. Die ersten acht Polynome haben die folgende einfache Form (s. auch Tabelle 21.12, S. 1096): Po(x) = 1, (9.57d) Pi(rr) = x, (9.57e) P2(x) = ^Cx2 - 1), (9.57f) P3(x) = iEx3 - 3x), (9.57g)
530 9. Differentialgleichungen &(x) = IC5x4 - 30x2 + 3), (9.57h) P5{x) = iF3x5 - 70a;3 + 15z), (9.57i) 8 8 p6(x) = -^B31x6-315x4 + 105x2-5),(9.57j) P7{x) = -^D29x7-693x5+315x3-35x) (9 57k) 16 16 Die Kurvenbilder von Pn(x) für Werte von n = 1 bis n = 7 sind in Abb.9.16 dargestellt Zahlenwerte können leicht mit dem Taschenrechner berechnet oder in Tabellen nachgesehen werden. 2. Eigenschaften der Legendreschen Polynome 1. Art a) Integraldarstellung: 1 TT TT Pn(x) = - [(x±c0B<py/*=ir<hp=- f— V n ... (9.58a) 7T 7 7T 7 (x ± COS (fVX - 1) + Das Vorzeichen kann in beiden Gleichungen beliebig genommen werden b) Rekursionsformel: (n + l)Pn+1{x) = {2n + l)xPn{x) - nPn-i(x) (n > 1; P0(x) = 1, Pi(x) - x), (9.58b) r/P (VI (x2 - 1)—^ = n[xPn(x) - Pn-i(x)] (n > 1). (9.58c) c) Orthogonalitätsrelation: i ( 0 für m ^ n, / Pn(x)Pm(x) dx = 2 = (9 58d) -i l 2n + 1 d) Nullstellensatz: Alle n Nullstellen von Pn(x) sind reell und einfach und liegen im Intervall (—1,1). e) Erzeugende Funktion: Die LEGENDREschen Polynome 1. Art können auch als Reihenentwicklung der Funktion i °° -7===== = J2Pn(x)rn (9 58e) Vi - 2rx + r2 ^o erzeugt werden. Weitere Angaben über die LEGENDREschen Polynome 1. Art s. [21 1] 3. Legendresche Funktionen oder Kugelfunktionen 2. Art Eine zweite partikuläre, von Pn(x) linear unabhängige Lösung Qn(x) der LEGENDREschen Differentialgleichung (9.57a) erhält man für -(n+l) |a;| > 1 durch die Potenzreihenentwicklung ^ bvxv ö (x) - 2>!J (w+1) (n+l n+_2 2n + 3. J_\ Qn[X}~ Bn+l)\X *\ 2 ' 2 ' 2 'x*J Bn+l) _ 2"(n!J ~ Bn+l)! (n + l)(n + 2)(n + 3)(n + 4) ,w+5) 2-4-Bn + 3)Bn + 5) -(n+i) , (n + l)(n + 2) (n+3) 2Bn + 3) (9 59a) Die für |x| < 1 gültige Darstellung von Q„(x) lautet: Qn(x) = \Pn{x) In 1±^ - £ JPfc-lf^Pn-fc^) . (9.59b) ^ 1_a; fc=lÄ Man bezeichnet die Kugelfunktionen 1. und 2. Art auch als zugeordnete oder assoziierte LEGENDREsc/ie Funktionen (s. auch 9.2.3.5,6.,4., S. 563).
9 1 Gewöhnliche Differentialgleichungen 531 4. Hypergeometrische Differentialgleichung Hypergeometrische Differentialgleichung heißt die Gleichung x(l - x)y" + [7 - (a + ß + l)x]y' - aßy = 0 , (9.60a) in der die a, ß und 7 Parameter sind. Sie beinhaltet eine große Zahl wichtiger Spezialfälle. 1 — z a) Für a = n + 1, ß = —n ,7 = 1 und x = —-— ergibt sich die LEGENDREsche Differentialgleichung. b) Für 7 7^ 0 oder 7 keine ganze negative Zahl ergibt sich als partikuläre Lösung die hypergeometrische Reihe oder hypergeometrische Funktion : ev a \ 1 _l_ a ¦ P ^ a(a + l)ß(ß+l) 2 F(alA7;x) = l + — , + ^-y-f-Tir, +... q(a + l) (q + nW + l) (/? + n)^ + .. ? (9>6Qb) l-2...(n + l)-7G + l). G + n) die für |x| < 1 absolut konvergiert. Die Konvergenz der hypergeometrischen Reihe hängt für x = ±1 von der Zahl £ = 7 — a — ß ab Für x = 1 konvergiert sie, falls ö > 0 ist, für S < 0 divergiert sie. Für x = -1 ergibt E < 0 absolute Konvergenz, — 1 < S < 0 bedingte Konvergenz und 6 < — 1 Divergenz. c) Für 2 — 7^0 oder ungleich einer ganzen negativen Zahl ergibt sich als partikuläre Lösung die Funktion y = xl~^F{a + 1 - 7, /? + 1 - 7,2 - 7; x) (9.60c) d) In einigen Fällen wird die hypergeometrische Reihe zu einer elementaren Funktion, z B F{l,ß,ß;x) = F{a,l,a,x) = —J—, (9.61a) F(-n,/?,/?, -x) = A + x)n , (9 61b) 1 — x F(l,l,2;-*) = ^, (9.61C) F(i,I,|^) = ~ (9.61d) lim Wl,/3,1,§ (9.61e) 5. Laguerresche Differentialgleichung Bei Beschränkung auf ganzzahlige Parameter (n = 0,1,2, .) und reelle Veränderliche hat die La- GUERREsc/ie Differentialgleichung die Form xy" + (a + 1 - x)y' + ny = 0 . (9.62a) Als partikuläre Lösungen ergeben sich die LAGUERRE.se/ien Polynome #>(,) = Ü^/L(e-,^). ± (» + f) (^ (9.62b) n w n! cfcnV ^{n-kj k* y ' Die Rekursionsformel für n > 1 lautet (n + lJL^Cx) - (-z + 2n 4- a + l)L™{x) - (n + aJZ&fr), (9 62c) L{°\x) = 1, L(!a) = 1 + a - x (9.62d) Als Orthogonalitätsrelation gilt für a > — 1: ( 0 für m 7^ n, m v ' n v ' I r(l + m furra = n. v ' 0 l V n / Mit T ist die Gammafunktion (s. 8.2.5,6., S. 478) bezeichnet. /
532 9. Differentialgleichungen 6. Hermitesche Differentialgleichung In der Literatur sind zwei Definitionsgleichungen gebräuchlich: a) Definitionsgleichung zu Variante 1: y" - xy' + ny = 0 (n = 0,1,2,...)- (9.63a) b) Definitionsgleichung zu Variante 2: y" - 2xy' + ny = 0 (n = 0,l,2, ..). (9.63b) Partikuläre Lösungen sind die ÜERMiTEschen Polynome, die enstsprechend in zwei Varianten auftreten, als Hen(x) zu Definitionsgleichung 1 und als Hn(x) zu Definitionsgleichung 2. a) Hermitesche Polynome zu Definitionsgleichung 1: x2 dn ( x2\ ^(x) = (-l)-eT_(e-TJ = xn- (f}xn~2 +1 • 3DV -1'3• 5(eV + • • * (n G N) (9.63c) Für n > 1 gelten die folgenden Rekursionsformeln: //en+i(rc) = xHen(x) — nHen-i(x), (9.63d) Heo(x) = 1, Hei(x) = x. (9.63e) Die Orthogonalitätsrelation lautet: +00 / e-*2'2Hem(x)Hen(x) dx = { ° _ ™r m ^ "' (9.63£) ^ ln!v27T rur m = n. —00 b) Hermitesche Polynome zu Definitionsgleichung 2: #„(*) = (-l)"e*2^(e-*2) (n€N). (9.63g) Der Zusammenhang mit den HERMiTEschen Polynomen zur 1. Definitionsgleichung lautet: Hen{x) = 2~n'2Hn (-j=\ (n G N). (9.63h) 9.1.3 Randwertprobleme 9.1.3.1 Problemstellung 1. Begriff des Randwertproblems Differentialgleichungen müssen in verschiedenen Anwendungen, z.B. in der mathematischen Physik (s. 9.2 3, S. 554), als sogenannte Randwertprobleme gelöst werden. Darunter versteht man Probleme, bei denen die gesuchte Lösung in den Endpunkten eines Intervalls der unabhängigen Variablen vorgegebenen Bedingungen genügen muß. Eine Spezifizierung ist das lineare Randwertproblem, das vorliegt, wenn eine Lösung einer linearen Differentialgleichung gesucht wird, die linearen Randbedingungen genügt. Im folgenden wird die Betrachtung auf lineare Differentialgleichungen 2. Ordnung beschränkt, für die lineare Randbedingungen vorgegeben sind. 2. Selbst adjungierte Differentialgleichung Selbstadjungierte Differentialgleichung wird die folgende wichtige Form der Differentialgleichungen 2. Ordnung genannt: \py'}' -qy + ^oy = f- (9.64a) Als lineare Randbedingungen werden die homogenen Bedingungen A0y{a) + BQy'{a) = 0, AlV(b) + Blt/(b) = 0 (9.64b)
9 1 Gewöhnliche Differentialgleichungen 533 p = exp vorgegeben. Die Funktionen p{x), p'(x), q(x), g(x) und f(x) sollen in dem endlichen Intervall a < x < b stetig sein. Im Falle eines unendlichen Intervalls ändern sich die Ergebnisse ganz wesentlich (s. [9.5]). Außerdem wird verlangt, daß p(x) > p0 > 0, g(x) > g0 > 0 gilt Die Größe A, ein Parameter der Differentialgleichung, ist konstant. Für / = 0 ergibt sich zum inhomogenen Randwertproblem das zugehörige homogene Randwertproblem Jede Differentialgleichung 2 Ordnung Ay" + By' + Cy + \Ry = F (9.64c) kann, falls in [a, b] A ^ 0 ist, durch Multiplikation mit p/A auf die selbstadjungierte Form (9.64a) gebracht werden. Dazu sind die Substitutionen Ui*)' '¦-$¦ -S <»«» erforderlich. Um eine Lösung zu finden, die den inhomogenen Bedingungen A0y(a) + B0y'(a) = C0 , AlV(b) + Blt/(b) = d (9.64e) genügt, geht man auf eine Aufgabe mit homogenen Bedingungen, aber geänderter rechter Seite der Differentialgleichung, zurück, indem man die unbekannte Funktion mit Hilfe der Substitution y = z + u ersetzt. Dabei ist u eine beliebige, zweimal differenzierbare Funktion, die die inhomogenen Randbedingungen erfüllt, während z eine neue unbekannte Funktion ist, die die zugehörigen homogenen Randbedingungen erfüllt. 3. Sturm-Liouvillesches Problem Für einen festen Wert des Parameters A gibt es zwei Fälle: 1. Das inhomogene Randwertproblem besitzt eine eindeutige Lösung bei beliebigem f(x), während das zugehörige homogene Problem lediglich die triviale, identisch verschwindende Lösung besitzt, oder: 2. Das zugehörige homogene Problem besitzt nichttriviale, d.h. nicht identisch verschwindende Lösungen Dann ist das inhomogene Problem nicht für beliebige rechte Seiten lösbar; im Falle der Existenz einer Lösung ist diese nicht eindeutig bestimmt. Die Werte des Parameters A, für die der zweite Fall eintritt, d.h. das homogene Problem eine nichttriviale Lösung hat, werden Eigenwerte des Randwertproblems genannt, die zugehörigen nichttrivialen Lösungen, seine Eigenfunktionen. Die Aufgabe, die Eigenwerte und Eigenfunktionen der Differentialgleichung (9.64a) zu bestimmen, nennt man das Sturm-LioUViLLEsc/ie Problem. 9.1.3.2 Haupteigenschaften der Eigenfunktionen und Eigenwerte 1. Die Eigenwerte des Randwertproblems (9.64a,b) bilden eine monoton wachsende Folge reeller Zahlen A0 < Ai < A2 < • • • < An < • • • , (9.65a) die gegen unendlich strebt. 2. Die Eigenfunktion, die zum Eigenwert An gehört, besitzt im Intervall a < x < b genau n Nullstellen. 3. Sind y{x) und z(x) zwei Eigenfunktionen, die zu demselben Eigenwert A gehören, dann unterscheiden sie sich nur durch einen konstanten Faktor c, d.h., es gilt* z(x) = cy{x). (9.65b) 4. Für zwei Eigenfunktionen yi(x) und 2/2(#) ? die den verschiedenen Eigenwerten Ai und A2 entsprechen, gilt die Orthogonalitätsrelation b Vi(x) y2(x) g(x) dx = 0, (9 65c) /> wobei q(x) das Gewicht der Orthogonalität genannt wird 5. Wenn in (9.64a) die Koeffizienten p(x) und q(x) durch p(x) > p{x) und q(x) > q{x) ersetzt werden, dann werden die Eigenwerte nicht kleiner, sondern es gilt An > An, wobei An und An die n-ten
534 9. Differentialgleichungen Eigenwerte der geänderten bzw. ungeänderten Gleichung sind. Wenn jedoch der Koeffizient q{x) durch q{x) > g(x) ersetzt wird, dann werden die Eigenwerte nicht größer, sondern es gilt An < An. Der n-te Eigenwert hängt hierbei stetig von den Koeffizienten der Gleichung ab, d.h., hinreichend kleinen Änderungen der Koeffizienten entsprechen beliebig kleine Änderungen des n-ten Eigenwertes. 6. Verkleinerungen des Intervalls [a, 6] ziehen keine Verkleinerung der Eigenwerte nach sich. 9.1.3.3 Entwicklung nach Eigenfunkt ionen 1. Normierung der Eigenfunktion Zu jedem An wird eine Eigenfunktion ipn(x) derart gewählt, daß gilt: b f[(pn(x)]2g{x) dx = l. (9.66a) a Man spricht dann von einer normierten Eigenfunktion. 2. Fourier-Ent wicklung Jeder im Intervall [a, b] definierten Funktion g(x) kann ihre FOVRIER-Reihe 9(x) ~ ^2 CnVnix), Cn= g(x) ipn{x) q{x) dx (9.66b) n=0 Ja nach den Eigenfunktionen des zugehörigen Randwertproblems zugeordnet werden, sofern die Integrale in (9.66b) sinnvoll sind. 3. Entwicklungssatz Die FOURIER-Reihe konvergiert absolut und gleichmäßig gegen g(x), wenn die Funktion g(x) eine stetige Ableitung besitzt und den Randbedingungen des zugehörigen Problems genügt. 4. Parsevalsche Gleichung Wenn das Integral auf der linken Seite einen Sinn hat, dann gilt stets r / [g{x)]2Q{x) dx =^2 cn2 (PARSEVALsche Gleichung). (9.66c) Die FOURIER-Reihe der Funktion g(x) konvergiert in diesem Falle im Mittel gegen g(x), d.h., es gilt N lim N—>oo a L ./ n2 9{X) ~ Yl CnVn(x) q(x) dx = 0. (9.66d) 9.1.3.4 Singulare Fälle Randwertprobleme des betrachteten Typs treten bei Anwendungen der FoURlERschen Methode zur Lösung von Aufgaben der theoretischen Physik häufig auf, aber mit dem Unterschied, daß in den Endpunkten des Intervalls [a, 6] Singularitäten der Differentialgleichungen vorkommen können, z.B. das Verschwinden von p(x). In solchen singulären Punkten werden den Lösungen gewisse Einschränkungen auferlegt wie z.B. Stetigkeit oder Endlichkeit oder unbeschränktes Wachstum, nicht höher als von einer bestimmten Ordnung. Solche Bedingungen spielen die Rolle von homogenen Randbedingungen (s. 9.2.3 3, S. 556). Außerdem tritt der Fall auf, daß bei einigen Randwertproblemen homogene Randbedingungen zu untersuchen sind, die die Werte der Funktion und ihrer Ableitung in entgegengesetzten Endpunkten des Intervalls miteinander verknüpfen Häufig sind dabei die Bedingungen V(fi) = y(b), p(a)y'(a)=p(b)y'(b) (9.67) vertreten, die im Falle p(a) = p(b) Periodizitätsbedingungen darstellen. Für Randwertprobleme mit diesen Bedingungen gilt alles, was oben ausgeführt wurde, ausgenommen die Behauptung (9.65b). Ausfuhrliche Darstellungen der Problematik s. [9.5].
9.2 Partielle Differentialgleichungen 535 9.2 Partielle Differentialgleichungen 9.2.1 Partielle Differentialgleichungen 1. Ordnung 9.2.1.1 Lineare partielle Differentialgleichungen 1. Ordnung 1. Lineare und quasilineare partielle Differentialgleichungen Die Gleichung X1p- + X2p- + -. + Xnp- = Y (9.68a) OXi OX2 OXn heißt lineare partielle Differentialgleichung erster Ordnung. Mit z wird eine unbekannte Funktion der unabhängigen Variablen X\, . ,xn bezeichnet, und die Xi,. , Xn, Y" sind vorgegebene Funktionen dieser Variablen Wenn die Funktionen Xi, ,Xn,Y auch noch von z abhängen, spricht man von einer quasilinearen partiellen Differentialgleichung Im Falle Y = 0 (9.68b) heißt die Gleichung homogen. 2. Integration der homogenen partiellen linearen Differentialgleichung Die Integration der homogenen partiellen linearen Differentialgleichung ist der Integration des sogenannten charakteristischen Systems dx1 = dx1= =dz„ (969a) X\ X2 Xn äquivalent Zur Lösung dieses Systems können zwei Wege eingeschlagen werden. 1. Man kann als unabhängige Variable ein beliebiges Xk auswählen, für das Xk ^ 0 gilt, so daß das System in die Form £ = | C-l,.,») (969b) übergeht 2. Bequemer ist es, unter Beibehaltung der Symmetrie eine neue unabhängige Variable t einzuführen, indem %-X, (9 69c) gesetzt wird Jedes erste Integral des Systems (9.69a) ist eine Lösung der homogenen linearen partiellen Differentialgleichung (9.68b) und umgekehrt, jede Lösung von (9 68b) ist ein erstes Integral von (9.69a) (s 9.1 2 1,2., S 515) Wenn hierbei n — 1 erste Integrale (fi(xi,...,xn) = 0 (i = l,2, ..,n-l) (9 69d) unabhängig sind (s. 9 1.2 3,2., S. 518), dann gilt z = *(<pli .,y>n-i). (9 69e) Dabei ist # eine beliebige Funktion der n - 1 Argumente <p» und eine allgemeine Lösung der homogenen linearen Differentialgleichung. 3. Integration der inhomogenen linearen und der quasilinearen partiellen Differentialgleichung Zur Integration der inhomogenen linearen und der quasilinearen partiellen Differentialgleichung (9.68a) wird die Lösung z in der impliziten Form V(xi, ..,xn,z) = C gesucht. Die Funktion V ist eine Lösung der homogenen linearen Differentialgleichung mit n + 1 unabhängigen Veränderlichen XW+xn+.. + X.*L + YWo, (9.70a) OX\ OX2 OXn OZ
536 9. Differentialgleichungen deren charakteristisches System dxi dx2 dxn dz ,n™u\ x7 = ^ = ---=x:=y (970b) charakteristisches System der ursprünglichen Gleichung (9 68a) genannt wird 4. Geometrische Darstellung und Charakteristiken des Systems Im Falle zweier unabhängiger Veränderlicher x\ = x und x2 = y mit p{x, y,z)-^ + Q{x, ^)/ = R(x' Viz) (9-71a) ist die Lösung z = f{x,y) eine Fläche im x, y, 2-Raum, die Integralfläche der Differentialgleichung genannt wird. Die Gleichung (9 71a) bedeutet, daß in jedem Punkt der Integralfläche z = f(x, y) der — , — , — 1 I orthogonal zu dem in diesem Punkt gegebenen Vektor (P, Q, R) ist dx dy ) Dabei nimmt das System (9 70b) die Form dx = dy = dz P(x,y,z) Q(x,y,z) R(x,y,z) } an. Daraus folgt (s. 13.1.3.5, S. 669), daß die Integralkurven des Systems, die auch die Charakteristiken des Systems genannt werden, die Vektoren (P, Q, R) berühren Daher liegt eine Charakteristik, die mit der Integralfläche z = /(x, y) einen Punkt gemeinsam hat, ganz in dieser Fläche Unter der Bedingung, daß der Existenzsatz gilt (s. 9.1.2 1,1.,2., S 515). verläuft durch jeden Punkt des Raumes eine Integralkurve des charakteristischen Systems, so daß die Integralflächen aus Charakteristiken bestehen 5. Cauchysches Problem Gegeben sind n Funktionen von n — 1 unabhängigen Variablen t\, t2, , £„_r xi = xi{t1,t2, . ,tn_i), x2 = x2(ti,t2, ,tn_i), , xn = xn(ti,t2, ,i„_i) (9 72a) Das CAUCHYsche Problem für die Differentialgleichung (9.68a) besteht darin, eine Lösung z = p(xi,x2,. ,xn) (9 72b) zu bestimmen, die beim Einsetzen von (9 72a) eine vorgegebene Funktion ip(ti,t2, , £n_i) ergibt (p[xi(ti,t2,. . ,tn_i), x2(tiJt2l ,£„_i),... , xn(tut2, ,£„_i)] = il>{h,t2, ,tn-\) (972c) Im Falle zweier Variabler reduziert sich das Problem auf das Aufsuchen einer Integralfläche, die durch eine gegebene Kurve verläuft. Wenn diese Kurve eine stetige Tangente hat und in keinem Punkt eine Charakteristik berührt, dann besitzt das CAUCHYsche Problem in einer gewissen Umgebung dieser Kurve stets eine eindeutige Lösung Dabei besteht die Integralfläche aus der Menge aller der Charakteristiken, die die gegebene Kurve schneiden Eine exaktere Formulierung des Satzes über die Existenz der Lösung des CAUCHYschen Problems s. [9 26]. dz ¦ A: Für die lineare inhomogene partielle Differentialgleichung 1 Ordnung G712 — ny)~^—h {nx — lz)— = ly — mx (l,m,n sind konstant) lauten die Gleichungen der Charakteristiken — oy mz — ny — = Die Integrale dieses Systems lauten lx+my+nz = C\ ,x2+y2+z2 = C2. Als Cha- nx — lz ly — mx rakteristiken ergeben sich Kreise, deren Mittelpunkte auf einer durch den Koordinatenursprung verlaufenden Geraden liegen, die zu /, m, n proportionale Richtungskosinusse besitzt Die Integralflächen sind Rotationsflächen mit dieser Geraden als Achse. ¦ B: Es ist die Integralfläche der linearen inhomogenen Differentialgleichung 1 Ordnung —— + -— = z dx dy
9.2 Partielle Differentialgleichungen 537 zu bestimmen, die durch die Kurve x = 0, z = <p(y) verläuft. Die Gleichungen der Charakteristi- dx du dz ken lauten — = — = — . Die durch den Punkt (x0,y0,zo) verlaufenden Charakteristiken sind y = x — Xo + yo, z = zoex~xo. Als Parameterdarstellung der gesuchten Integralfläche findet man y = x + yo, z = ex(f(y0), wenn x0 — 0, z0 = ip(yo) gesetzt wird. Die Elimination von y0 fuhrt auf z = ex(p(y - x). 9.2.1.2 Nichtlineare partielle Differentialgleichungen 1. Ordnung 1. Allgemeine Form der partiellen Differentialgleichung 1. Ordnung wird die implizite Gleichung *•(*„...,*„,*, |L,. .,g-)=0 (9.73a) genannt. 1. Vollständiges Integral heißt die Lösung z = (f(xi,..., xn\ öi,..., an), (9.73b) die von n Parametern ai, ., an abhängt und für deren Funktionaldeterminante (s 2.18.2 6,3., S. 124) mit den betrachteten Werten von #i,..., xn, z gelten muß: <%.„• -^x) (973c) d(ai,.. .,an) 2. Charakteristische Streifen Die Integration von (9.73a) wird auf die Integration des charakteristischen Systems dx_L= =dx^ = _dz _±i =... = _^ (9.7^) mit '-S^-s-»-»'-« '•=' "» <*"> zurückgeführt. Die Lösungen des charakteristischen Systems, die die zusätzliche Bedingung F{xu.. ,xn,z,Pl,...,pn)-0 (9.73f) erfüllen, heißen charakteristische Streifen. 2. Kanonische Systeme von Differentialgleichungen Manchmal ist es vorteilhafter, Differentialgleichungen zu betrachten, in denen die gesuchte Funktion z nicht explizit enthalten ist. Der Übergang zu einer derartigen Punktion kann durch Einfuhrung einer zusätzlichen unabhängigen Veränderlichen xn+i = z und einer unbekannten Funktion V(xi, ... ,xn, xn+i) erreicht werden. Für diese Funktion wird über die Gleichung V{xu...,xn,z) = C (9.74a) dz die gesuchte Funktion z(xi,X2, • •., xn) bestimmt. Dabei setzt man in (9.73a) anstelle von —— die Funk- OXi dV I dV tion — —— / — (i = 1,..., n) ein. Dann wird die Differentialgleichung (9.73a) nach einer belie- ÖXi I ÖXn+1 bigen partiellen Ableitung von V aufgelöst. Die dazugehörige unabhängige Veränderliche wird nach entsprechender Änderung der Numerierung der übrigen Variablen mit x bezeichnet. Schließlich bringt man die Gleichung (9.73a) in die Form dV dV p + H(xu...,xnix,pu...,pn) = 0, p=—,Pi = — (i = l,. .,n). (974b)
538 9. Differentialgleichungen und Das System der charakteristischen Differentialgleichungen geht so über in dxi _ dH dpi _ dH . _ dx dpi' dx dxi <W_^ dH_ <¥L-H ^P = _?K (9 74d) dx dpi ndpn ' dx dx Die Gleichungen (9 74c) stellen ein System von 2n gewöhnlichen Differentialgleichungen dar, das einer beliebigen Funktion H(x\, .,xn,x,p\,. ,pn) von 2n + 1 Variablen entspricht Man nennt es ein kanonisches System oder ein Normalsystem von Differentialgleichungen. Viele Aufgaben der Mechanik und der theoretischen Physik führen auf Systeme dieser Art Bei Kenntnis eines vollständigen Integrals V = <p{xi, ...,£„,£,ai,... ,an) + a (9 74e) der Gleichung (9 74b) kann die allgemeine Lösung des Normalsystems (9 74c) bestimmt werden, denn dtp dip die Gleichungen —— = bi, —— = Pi (i = 1,2, . ,n) mit In willkürlichen Parametern a* und b{ Oüi OXi definieren eine 2n-parametrige Lösung des Normalsystems (9.74c) 3. Clairautsche Differentialgleichung Wenn die gegebene Differentialgleichung auf die Form z = xipi + x2p2 + • • ¦ + xnpn + /(pi,p2, • • • ,pn), Vi = -Q- (* = 1, • ,") (9.75a) gebracht werden kann, man spricht dann von CLAiRAUTscher Differentialgleichung, gestaltet sich die Bestimmung des vollständigen Integrals recht einfach, denn ein vollständiges Integral mit den frei wählbaren Parametern 01, a2, .., an ist z = aiXi + a2x2 -\ Yanxn + /(ai,a2,. . ,an) (9.75b) ¦ Zweikörperproblem mit Hamilton-Funktion: Die Bewegung zweier materieller Punkte, die der NEWTONschen Gravitationswechselwirkung unterliegen sollen, erfolgt in einer Ebene Daher ist es vorteilhaft, einen der beiden Punkte in den Koordinatenursprung zu legen, so daß die Bewegungsgleichung die Form d^ = dV_ fy = dV k2 dt2 dx' dt* dy1 V^Ty* [ } annimmt. Führt man die HAMILTON-Funktion H = \^ + q2)-7^7 (976b) ein, dann geht das System (9 76a) in das Normalsystem dx_dH_ d^_dH_ &p___dH_ dq _ _dH_ dt dp 'dt dq dt dx ' dt dy X'V'P=~dt' q=~dt (9.76d) mit über. Die Differentialgleichung lautet nunmehr dz_ 1 dt +2 (dx) +(dy) y/x2 + y2 = 0 (9.76e)
9 2 Partielle Differentialgleichungen 539 Bei Einführung von Polarkoordinaten p, (p geht (9.76e) in eine neue Differentialgleichung über, deren Lösung in der Form rp / 2k2 b2 z = -at-bip + c- W2a + rdr (9.76f) J po V r r mit den Parametern a, 6, c dargestellt werden kann. Die allgemeine Lösung des Systems (9.76c) ergibt sich aus den Gleichungen !--*,, S = -,o. (9.76g) 4. Differentialgleichungen 1. Ordnung mit zwei unabhängigen Veränderlichen Für x\ = x, X2 — y, P\—p,Pi — q kann der charakteristische Streifen (s. 9.2.1.2,1.,2., S. 537) geometrisch als Kurve gedeutet werden, die sich dadurch auszeichnet, daß in jedem ihrer Punkte (x, y, z) ihre Tangentialebene p(£ — x) + q(r) — y) = (, — z definiert ist. Dadurch kann die Aufgabe, die Integralfläche der Gleichung zu bestimmen, die durch eine gegebene Kurve hindurchgeht, also das CAUCHYsche Problem zu lösen, auf eine andere Aufgabe zurückgeführt werden. Durch die Punkte der Anfangskurve sind die charakteristischen Streifen hindurchzulegen, deren zugehörige Ebene diese Kurve tangiert Man gewinnt die Werte p und q in den Punkten der Anfangskurve aus den Beziehungen F(x, y, z,p, q) = 0 und pdx + qdy = dz, die im Falle nichtlinearer Differentialgleichungen im allgemeinen mehrere Lösungen besitzen Damit sich bei Stellung des CAUCHYschen Problems eindeutige Lösungen ergeben, sind entlang der Anfangskurve zwei stetige Funktionen p und q festzulegen, die den obigen beiden Beziehungen genügen. Die Existenzbedingungen für die Lösung des CAUCHYschen Problems s [9 26]. ¦ Für die partielle Differentialgleichung pq = 1 und die Anfangskurve y = x3 , z = 2x2 kann entlang der Kurve p = x und q = 1/x gesetzt werden. Das charakteristische System besitzt die Form dx dy dz dp n dq — = q, — =P, — = 2pq, — = 0, — = 0. dt dt dt dt dt Der charakteristische Streifen mit den Anfangswerten Xq, yo, zq, po und qo für £ = 0 genügt den Gleichungen x = x0 + q0t, y = yo + Pot, z = 2pQqQt + z0, p = p0, q = q0. Für den Fall p0 = x0, qo = 1/xo lautet die Gleichung der zum charakteristischen Streifen gehörenden Kurve, die durch den Punkt (#0, yo, Zo) der Anfangskurve verläuft, x = Xo ^ , y = Xq3 + txo . z = 2t -f- 2x02 Xo Elimination der Parameter xo und t liefert z2 — Axy Für andere zulässige Werte von p und q längs der Anfangskurve hätte sich eine andere Lösung ergeben. Hinweis: Die Einhüllende einer einparametrigen Integralflächenschar ist ebenfalls eine Integralfläche. Unter Beachtung dieses Umstandes kann das CAUCHYsche Problem mit Hilfe des vollständigen Integrals gelöst werden. Dazu wird eine einparametrige Schar von Lösungen gesucht, die die Ebenen berühren, die in den Punkten der Anfangskurve gegebenen sind Dann ist noch die Einhüllende dieser Schar zu bestimmen. ¦ Für die CLAlRAUTsche Differentialgleichung z — px — qy + pq = 0 soll die Integralfläche bestimmt werden, die durch die Kurve y = x , z = x2 verläuft Das vollständige Integral der Differentialgleichung lautet z = ax + by — ab. Da entlang der Anfangskurve p = q = x gilt, bestimmt man mit der Bedingung a = b die erforderliche einparametrige Integralflächenschar. Nach Ermittlung der Einhüllenden erhält man z = -(x + yJ .
540 9. Differentialgleichungen 5. Lineare partielle Differentialgleichungen 1. Ordnung in vollständigen Differentialen Gleichungen dieser Art haben die Gestalt dz = fidxi + f2dx2 H h fndxn , (9.78a) wobei die /i, f2, , fn gegebene Funktionen der Variablen x\, x2,. ., xn, z sind. Man spricht von einer vollständig integrierbaren Differentialgleichung, wenn sich eine eindeutige Beziehung zwischen den X\, x2, .., xn, z angeben läßt, die einen frei wählbaren konstanten Faktor enthält, und die auf die Gleichung (9 78a) führt. Dann existiert eine eindeutige Lösung z = z(x\,x2,... ,xn) von (9.78a), die für die Anfangswerte Xi°, ., xn° der unabhängigen Veränderlichen einen vorgegebenen Wert z0 ergibt Daraus folgt für n = 2, X\ = x, x2 = y, daß durch jeden Raumpunkt eine und nur eine Integralfläche verläuft. Vollständige Integrabilität gibt es für die Differentialgleichung (9.78a) dann und nur dann, wenn die n(n — 1) 2 Beziehungen dfi , f dfi 9fk dfk ^ + Aä7 = ^ + /^ <a = 1' ¦ 'n) (9-78b) in allen Variablen xi,X2,...,xn,z identisch erfüllt sind. Wenn die Differentialgleichung in der symmetrischen Gestalt fidxi + • • • + fndxn = 0 (9 78c) gegeben ist, dann lautet die Bedingung für die vollständige Integrabilität für alle Kombinationen der Indizes i, j, k \ dh _ dfl\ +, tdh_ _ dh\ + .m _ dh\=0 1 \dxj dxkJ j \dxk dxi) \dxi dxj) Liegt vollständige Integrabilität vor, dann kann die Auflösung der Differentialgleichung (9 78a) auf die Integration einer gewöhnlichen Differentialgleichung mit n — 1 Parametern zurückgeführt werden 9.2.2 Lineare partielle Differentialgleichungen 2. Ordnung 9.2.2.1 Klassifikation und Eigenschaften der Differentialgleichungen 2. Ordnung mit zwei unabhängigen Veränderlichen 1. Allgemeine Form einer linearen partiellen Differentialgleichung 2 Ordnung mit zwei unabhängigen Variablen x , y und einer unbekannten Funktion u heißt eine Gleichung der Gestalt Ad2u nn d2u „d2u du du „ tn „n . A— + 2B—— + C— + a— + b— + cu = f , 9.79a ox2 oxoy oy2 ox oy wobei die Koeffizienten A, B, C, a, 6, c und das freie Glied / bekannte Funktionen von x und y sind Die Form der Lösung dieser Differentialgleichung hangt vom Vorzeichen der Diskriminante 6 = AC-B2 (9 79b) in einem betrachteten Gebiet ab. Man unterscheidet die folgenden Formen* 1. S < 0. Hyperbolischer Typ; 2. S = 0- Parabolischer Typ, 3. S > 0 Elliptischer Typ, 4. 6 ändert sein Vorzeichen: Gemischter Typ Eine wichtige Eigenschaft der Diskriminante 5 besteht darin, daß ihr Vorzeichen invariant ist gegen beliebige Transformationen der unabhängigen Variablen, z.B. bei der Einführung neuer Koordinaten in der x, y-Ebene. Somit ist auch der Typ der Differentialgleichung eine Invariante bezüglich der Wahl der unabhängigen Variablen
9 2 Partielle Differentialgleichungen 541 2. Charakteristiken der linearen partiellen Differentialgleichungen 2. Ordnung heißen die Integralkurven der Differentialgleichung Ady2 - 2Bdxdy + Cdx2 = 0 oder ^ = B± "f~S , (9.80) dx A Zu den drei Typen von Differentialgleichungen können hinsichtlich der Charakteristiken die folgenden allgemeinen Aussagen getroffen werden- 1. Hyperbolischer Typ Es existieren zwei Scharen reeller Charakteristiken 2. Parabolischer Typ Es existiert nur eine Schar reeller Charakteristiken. 3. Elliptischer Typ: Es existieren keine reellen Charakteristiken 4. Eine Differentialgleichung, die sich aus (9.79a) durch Koordinatentransformationen ergibt, besitzt die gleichen Charakteristiken wie (9 79a). 5. Wenn die Schar der Charakteristiken mit einer Schar der Koordinatenlinien zusammenfällt, dann fehlt in (9.79a) das Glied mit der zweiten Ableitung der unbekannten Funktion nach der betreffenden unabhängigen Variablen. Im Falle der Differentialgleichung vom parabolischen Typ fehlt hierbei auch noch das Glied mit der gemischten Ableitung. 3. Normalform oder kanonische Form Zur Transformation von (9.79a) in die Normalform der linearen partiellen Differentialgleichungen 2. Ordnung gibt es die folgenden Möglichkeiten. 1. Transformation in die Normalform Die Differentialgleichung (9 79a) kann durch die Einführung neuer unabhängiger Veränderlicher £ = (p(x,y) und r} = ifi(x,y) (9.81a) in Übereinstimmung mit dem Vorzeichen der Diskriminante (9.79b) auf eine der folgenden drei Normalformen gebracht werden. • = 0 , 6 < 0 , hyperbolischer Typ; (9 81b) ^ + ... = 0, S = 0, parabolischer Typ , (9.81c) ^0 , 0 0 , • = 0, ö > 0, elliptischer Typ. (9.81d) dt,1 dn2 Glieder, die keine partiellen Ableitungen 2. Ordnung der unbekannten Funktion enthalten, sind in (9 81b,c,d) durch Punkte angedeutet. 2. Transformation in die Normalform (9.81b) beim hyperbolischen Typ Wenn im hyperbolischen Fall zwei Charakteristikenscharen als Koordinatenlinienscharen im neuen Koordinatensystem (9 81a) gewählt werden, d.h , wenn für die Gleichungen der Charakteristikenscharen £i = ip(x, y), 771 = tp(x, y), mit (p(x, y) = const, ip(x, y) = const gesetzt wird, dann geht (9.79a) über in d2u Diese Form heißt ebenfalls Normalform der Differentialgleichung vom hyperbolischen Typ. Von hier gelangt man zur Normalform (9 81b) mit Hilfe der Substitution € = 6+»7i, ri = Zi-Th (9 81f) 3. Transformation in die Normalform (9.81c) beim parabolischen Typ Für die Schar £ = const wird die einzige in diesem Falle gegebene Charakteristikenschar gewählt, wobei für rj eine beliebige Funktion von x und y gewählt werden kann, die aber nicht von f abhängen darf 4. Transformation in die Normalform (9.81d) beim elliptischen Typ Wenn die Koeffizienten A(x, y), B(x, y), C(x, y) analytische Funktionen sind (s 14 1 2 1, S. 694), dann definiert die Gleichung d2u de" d2u d2u dr\2 d2u dr}2 d2u
542 9 Differentialgleichungen der Charakteristiken im elliptischen Falle zwei konjugiert komplexe Scharen von Kurven p(x, y) = const, ip(x, y) = const Wird f = (p + ip, 77 = i(ip — ip) gesetzt, dann geht die Gleichung in die Normalform (9.81d) über. 4. Verallgemeinerung Alle Aussagen zur Klassifizierung und Transformation auf die Normalform gelten auch für Gleichungen der allgemeineren Form ^,^ + «(,,^ + C(,,,)g + F(..^ g*)=0, ,982) in der die gesuchten Funktionen u und ihre partiellen Ableitungen du/dx und du/dy im Gegensatz zu (9.79a) nicht mehr nur linear auftreten. 9.2.2.2 Klassifikation und Eigenschaften der Differentialgleichungen 2. Ordnung mit mehr als zwei unabhängigen Veränderlichen 1. Allgemeine Form Eine Differentialgleichung dieser Art hat die Gestalt wobei die a^ gegebene Funktionen der unabhängigen Variablen sind und die Punkte in (9.83) Glieder bedeuten, in denen keine Ableitungen zweiter Ordnung der unbekannten Funktion u enthalten sind Im allgemeinen kann die Differentialgleichung (9.83) nicht durch Transformationen der unabhängigen Variablen auf eine einfache Normalform gebracht werden. Es gibt aber eine wichtige Klassifikation, die der in 9.2 2.1, S. 540 eingeführten ähnlich ist (s. [9 5]) 2. Lineare partielle Differentialgleichungen 2. Ordnung mit konstanten Koeffizienten Wenn die Koeffizienten a^ in (9.83) konstant sind, dann ist durch eine lineare homogene Transformation der unabhängigen Variablen eine Transformation auf die einfachere Normalform I>0 + - = O (984) möglich, in der sämtliche Koeffizienten «» gleich ±1 oder 0 sind. Man kann mehrere charakteristische Fälle unterscheiden. 1. Elliptische Differentialgleichung Alle Koeffizienten ac» sind von Null verschieden und haben dasselbe Vorzeichen Dann handelt es sich um eine elliptische Differentialgleichung. 2. Hyperbolische und ultrahyperbolische Differentialgleichung Alle Koeffizienten «» sind von Null verschieden, aber einer hat ein zu allen übrigen entgegengesetztes Vorzeichen. Dann handelt es sich um eine hyperbolische Differentialgleichung. Treten darüber hinaus von jeder Vorzeichenart wenigstens zwei auf, dann ist es eine ultrahyperbolische Differentialgleichung. 3. Parabolische Differentialgleichung Einer der Koeffizienten /^ verschwindet, die übrigen sind verschieden von Null und haben gleiches Vorzeichen. Dann handelt es sich um eine parabolische Differentialgleichung. 4. Einfach zu lösender Fall Ein relativ einfach zu lösender Fall liegt vor, wenn nicht nur die Koeffizienten der höchsten Ableitungen der unbekannten Funktion konstant sind, sondern auch die der ersten Ableitungen. Man kann dann die Glieder mit den ersten Ableitungen durch eine Variablensubstitution eliminieren, für die K{ ^ 0 ist Dazu setzt man ( lr&fc ^exp -öE-z* > (985)
9.2 Partielle Differentialgleichungen 543 wobei bk der Koeffizient von -— in (9.84) ist und die Summation über alle «» ^ 0 zu erfolgen hat dxk Auf diese Weise können alle elliptischen und hyperbolischen Differentialgleichungen mit konstanten Koeffizienten auf eine einfache Form gebracht werden: a) Elliptischer Fall: Av + kv = g. (9.86) d2v b) Hyperbolischer Fall: — - Av + kv = g. (9.87) Mit A wird der LAPLACE-Operator _ d2v d2v d2v . dxi2 dx22 dxn2 bezeichnet (s. 13.2.6.5, S. 678), mit der Zeit t als weitere unabhängige Variable 9.2.2.3 Integrationsmethoden für lineare partielle Differentialgleichungen 2. Ordnung 1. Methode der Variablentrennung Durch spezielle Substitutionen kann für viele Differentialgleichungen der Physik zwar nicht immer die Gesamtheit, jedoch eine Schar von Lösungen bestimmt werden, die von frei wählbaren Parametern abhängt. Lineare Differentialgleichungen, besonders 2. Ordnung, können oft mit Hilfe einer Substitution in der Form eines Produkt ansatzes U(XU . ..,£„) = (pi(x1)(p2(x2) • • • fn(Xn) (9.89) gelöst werden. Da das Ziel darin besteht, die Funktionen (fk(xk) getrennt, d.h. jede für sich aus einer gewöhnlichen Differentialgleichung zu bestimmen, in der nur noch die eine Variable Xk enthalten ist, spricht man für (9.89) auch vom Separations ans atz. In vielen Fällen gelingt diese Variablentrennung, nachdem der Lösungsansatz (9.89) in die gegebene Differentialgleichung eingesetzt wurde. Wenn hierbei die Lösung der gegebenen Differentialgleichung gewissen homogenen Randbedingungen genügen soll, dann kann es ausreichend sein, daß nur ein Teil der Funktionen (fi(xi), ^2(^2), • • •, ^Pn{xn) des Separationsansatzes bestimmte Randbedingungen zu erfüllen braucht. Aus den so bestimmten Lösungen ergeben sich durch Summationen, Differentiationen und Integrationen neue Lösungen. Die Parameter sind dabei so zu wählen, daß auch die restlichen Anfangs- und Randbedingungen erfüllt werden (s. Beispiele S 543 bis S. 550). Schließlich muß beachtet werden, daß die mit dieser Methode ermittelte Lösung, sei es in der Gestalt einer Reihe oder eines uneigentlichen Integrals, eine formale Lösung ist Das bedeutet, daß noch zu prüfen ist, ob die Lösung einen physikalischen Sinn ergibt, d h. z.B., ob sie konvergiert, ob sie die ursprüngliche Differentialgleichung und die Randbedingungen erfüllt, d.h. z.B., ob sie gliedweise differenzierbar ist und ob ein Grenzübergang bei Annäherung an den Rand existiert. In den in diesem Abschnitt dargelegten Beispielen sind die Reihen und die uneigentlichen Integrale konvergent, wenn die Funktionen, die die Anfangsbedingungen definieren, entsprechenden Einschränkungen unterworfen werden, z.B. der Forderung nach Stetigkeit der 2. Ableitung im ersten und zweiten Beispiel. ¦ A: Saitenschwingungsgleichung wird die lineare partielle Differentialgleichung 2. Ordnung vom hyperbolischen Typ £-"S <»¦> genannt, mit deren Hilfe die Schwingungen einer gespannten Saite beschrieben werden Die Aufgabe besteht darin, diese Gleichung unter den Anfangs- und Randbedingungen I du I u\ =f(x)> ^7 =¥>(*)> 4*=o = 0, u\x=l = 0 (9.90b) lt=o ot \t=o
544 9. Differentialgleichungen zu lösen Mit einem Separationsansatz der Form u = X(x)T(t) (9.90c) liefert Einsetzen in die gegebene Differentialgleichung (9.90a) die Gleichung T" X" ^ = X. (990d) Die Variablen sind getrennt, denn da die linke Seite nicht von x und die rechte nicht von t abhängt, ist jede Seite für sich eine konstante Größe. Die Konstante wird negativ gewählt und gleich — A2 gesetzt, da sich mit nichtnegativen Werten nur die triviale Lösung u(x, t) = 0 ergibt Man erhält die zwei linearen Differentialgleichungen X" + X2X = 0, (9.90e) T" + a2X2T = 0. (9 90f) Aus den Randbedingungen folgt X@) = X(l) = 0 Man sieht, daß X(x) eine Eigenfunktion des STURM-LiOUViLLEschen Randwertproblems ist und A2 der zugehörige Eigenwert (s. 9.1.3.1,3., S 533) Integration der Differentialgleichung (9.90e) für X und Berücksichtigung der Randbedingungen ergibt X(x) = Csin Xx mit sin XI = 0, also mit X=7^- = Xn (n = 1,2,...). (9 90g) Integration der Differentialgleichung (9.90f) liefert für jeden Eigenwert An jeweils eine partikuläre Lösung der ursprünglichen Differentialgleichung (9 90a). / nair . nair \ . nir un = [eincos —j—t + bnsin —— 11 sm —x (9 90h) Durch die Forderungen, daß für t = 0 oo r) °° u = ^2un zu f(x) wird (9.90i) und — ^ un zu (p(x), (9 90j) n=l ^ n=l ergibt sich mit Hilfe einer FOURIER-Reihenentwicklung nach Sinusfunktionen (s. S. 437) 2 fl ., v . nnx . . 2 fl . . . nirx , . rtrtl . an = T / f(x) sm ——dx, bn = / (p{x) sm ——dx . ¦ (9 90k) / Jo i nan Jo l ¦ B: Stabschwingungsgleichung wird die lineare partielle Differentialgleichung 2. Ordnung vom hyperbolischen Typ genannt, mit deren Hilfe die longitudinalen Schwingungen eines Stabes beschrieben werden, dessen eines Ende frei ist und auf dessen zweites, eingespanntes Ende im Anfangszeitpunkt eine konstante Kraft p wirkt Zu lösen ist die gleiche Differentialgleichung wie im Beispiel A, S 543, d h. d2u dt2 od2u mit den gleichen Anfangs-, aber nunmehr inhomogenen Randbedingungen: i F)ii \ 3ii A =/(*>• t£ =VW. (9-91b) ßZ \t=o ot \t=o ox du dx = 0 (freies Ende), x=0 = kp. x=l (9.91a) (9.91c) (9.91d) Diese Bedingungen können durch die homogenen Bedingungen ox\x=o ox\x=i
9.2 Partielle Differentialgleichungen 545 ersetzt werden, indem für u die neue unbekannte Funktion * = «-¥ (9-91f) eingeführt wird. Allerdings wird dann die Differentialgleichung inhomogen: S-'S + T5- <»»«» Die Lösung wird in Form der Summe z — v + w gesucht. Dabei genügt v der homogenen Differentialgleichung sowie den Anfangs- und Randbedingungen für z, d h. *| =/(*)-^-, %\ =¥>(*) (9-91h) lt=o 2 et lt=o tu genügt der inhomogenen Differentialgleichung und erfüllt die verschwindenden Anfangs- und Rand- Jen Ttt bedingungen. Daraus ergibt sich w = ——— . Eingehen in die Differentialgleichung mit dem Produktansatz v = X{x)T{t) (9.91i) ergibt wie in Beispiel A, S. 543 die gewöhnlichen Differentialgleichungen für die separierten Variablen: Y" T" X = ^ = -A2- (9.91J) Integration der Differentialgleichung für X und Einsetzen der Randbedingungen X'{0) = X'(l) = 0 liefert die Eigenfunktionen Xn = cos^ (9.91k) sowie die dazugehörigen Eigenwerte 2 2 An2 = ^- (n = 0,l,2,...). (9.911) Durch das gleiche Vorgehen wie in Beispiel A, S. 543 erhält man schließlich ka2pt2 kpx2 an, v^ / anirt bn . arnrt\ nirx ,n _ N u = ——. h -rr- + a0 + —b0t + > \an cos — 1 sin —— cos —— , (9.91m) 21 21 l ^~y \ In L ) L wobei an und bn (n = 0,1,2,...) die Koeffizienten der FOURIER-Reihenentwicklung für die Funktionen /(*) - ^7T- und — <P{x)im Intervall @,/) sind (s. 7.4.1 1,1., S. 437). 2 ait ¦ C: Membranschwingungsgleichung für Schwingungen einer runden, am Rande eingespannten Membran. Die Differentialgleichung ist linear, partiell und vom hyperbolischen Typ. Sie hat in kartesischen Koordinaten bzw. in Polarkoordinaten (s. 3.5.3.1,7., S. 215) die Form d2u d2u _ 1 d2u d2u Idu 1 d2u _ 1 d2u ( . dx2~Jtdy2~ = G^W' (9'92a) ^ + WpJr72W2 = ^~W' [ } Die Anfangs- und Randbedingungen lauten du u\t=0 = f(Pl<p), (9 92c) m = F{p,<p), (9.92d) w|p=Ä = 0. (9.92e) i*=o Einsetzen des Produktansatzes für die drei Variablen u = U{p)<P((p)T{t) (9.92f)
546 9 Differentialgleichungen in die Differentialgleichung in Polarkoordinaten liefert U" U' $" IT" x2 . n x Daraus ergeben sich in Analogie zu den Beispielen A, S. 543 und B, S. 544 die folgenden Differentialgleichungen. T" + a2A2T = 0, (9.92h) ?U\+ pU' + \y = -%- = S, (9.92i) bzw. <£>" + vH = 0. (9 92j) Aus den Bedingungen <Z>@) = <2>Btt) , <Z>'@) = <Z>'Btt) folgt: $(</?) = an cos n<^ + bn sin n</?, u2 = n2 (n = 0,1,2,...). (9 92k) n2 Aus [pU']' U = —X2pU und U(R) = 0 werden U und A bestimmt. Berücksichtigung der selbstverständlichen Bedingung der Beschränkung von U(p) für p = 0 und Substitution von \p = z ergibt z2U" + zU' + B2 - n2)U = 0, d.h. U(p) = •/„(*) = Jn f/x-|) , (9 921) wobei Jn die BESSELschen Funktionen sind (s. 9.1.2 6,2.,2., S. 527) mit A = — und Jn(p) = 0 Das Funktionensystem Unk{p) = Jn[pnk^j (fc = l,2, .) ' (9 92m) mit pnk als k-te positive Nullstelle der Funktion Jn(z) ist ein vollständiges System aller Eigenfunktionen des selbstadjungierten Problems vom STURM-LiOUViLLEschen Typ, die orthogonal mit dem Gewicht p sind. Die Lösung der Aufgabe wird in der Gestalt der Doppelreihe U = ^2 2 (ank cos nip + bnk sin mp) cos —jjf- n=0fc=l L K +(cnfc cos mp + dnk sin ny>) sin —j?-1 Jn (/^"öj (9.92n) angesetzt. Aus den Anfangsbedingungen folgt für t = 0 oo oo f p\ f(Pi<P) = J2 ^{ank cos mp + bnk sin n(p)Jn [ßnk-BJ , (9 92o) OO OO / \ F'( A <P) = £ S ~ET (°nk C0S n<^ + dnk Sin n<^) Jn ( MnA:  ) , (9 92p) n=0fc=l K \ HJ woraus sich ergibt , ank=«VJU{ßnk)h d{Pl fiP^^^Jn^n^pdp, (9.92q) ^=Tfl^2-,(fat) cdip r/(p-^ sin n^ (^ ä) p dp- (9 92r) Im Falle n = 0 ist die im Zähler stehende 2 durch eine 1 zu ersetzen. Zur Bestimmung der Koeffizienten D cnk und dnk wird /(p, y?) durch F(p, y?) in den Formeln für ank und 6njt ersetzt und mit multipliziert. aßnk
9.2 Partielle Differentialgleichungen 547 ¦ D: Dirichletsches Problem (s 13.5 1, S 691) für das Rechteck 0 < x < a,0<?/<6(Abb.9.17). Als Lösung der LAPLACEschen Differentialgleichung vom elliptischen Typ An = 0 (9.93a) wird eine Funktion u(x, y) gesucht, die auch die Randbedingungen u@,2/) = tpi{y), u(a,y) = (p2(y), w(x,0) = 4>i(x), u(x,b) = ip2(x) (9.93b) a x erfüllt. Als erster Schritt wird eine partikuläre Lösung für die Randbedingungen Abbildung 9.17 <Pi(y) = ^2B/) = 0 bestimmt. Einsetzen des Produktansatzes u = X(x)Y(y) (9 93c) in (9 93a) ergibt die Differentialgleichungen Y" V" äx=-Y = -)? (993d) mit dem Eigenwert A in Analogie zu den Beispielen A, S. 543 bis C, S. 545. Da X@) = X(a) = 0 gilt, ergibt sich X = Csin\x, \ = — = Xn (n=l,2,...). (9 93e) a Im zweiten Schritt wird die allgemeine Lösung der Differentialgleichung Y" - n n Y = 0 (9 93f) in der Form Y = an sinh —(b - y) + bn sinh —y (9.93g) a2 a a hingeschrieben. Daraus ergibt sich für die Randbedingungen n@, y) = u(a, y) = 0 eine partikuläre Lösung von (9.93a) in der Form [T17T 727T 1 TVK an sinh — (b — y) + bn sinh —y sin —x. (9 93h) a a ] a Im dritten Schritt wird die allgemeine Lösung als Reihe oo u=Y,un (9 93i) n=l angesetzt, so daß sich aus den Randbedingungen für y = 0 und y = b v^ ( • i n7r/, x , . , nir \ . rnr ,rt ^0.x u = > [an sinh —(o — y) + on sinh —y sin —x (9-9oj) „TiV a a ) a ergibt, mit den Koeffizienten 2 ra . nw 2 fa rnr . ,ftAon -/ ipi(x)siJi—xdx, bn = j- I ip2\x)sm—xdx (9.93k) n . nnb jo ¦ ' ¦ a . , nno j0 a sinn a sinn a a In Analogie dazu wird die Aufgabe für die Randbedingungen ipi(x) = 4>2(x) = 0 gelöst, die in der Summe mit (9.93J) die allgemeine Lösung von (9.93a) und (9.93b) bildet. ¦ E: Wärmeleitungsgleichung Die Wärmeausbreitung in einem homogenen Stab, dessen eines Ende im Unendlichen liegt, während das andere unter konstanter Temperatur gehalten wird, beschreibt die lineare partielle Differentialgleichung 2. Ordnung vom parabolischen Typ du 0d2u . „A . lTt=a2w' (9'94a> die im Gebiet 0<x<+oo,£>0 den Anfangs- und Randbedingungen u\t=0 = f(x\ u\x=0 = 0 (9.94b)
548 9. Differentialgleichungen genügt. Dabei soll angenommen werden, daß die Temperatur im Unendlichen Null beträgt. Der Separationsansatz u = X(x)T(t) , (9.94c) eingesetzt in (9.94a), liefert die Beziehung T" Y" lr = T = -A2- <"«> wobei der Parameter A in Analogie zu dem Vorgehen in den Beispielen A, S. 543 bis D, S. 547 eingeführt wird. Als Lösung für T(t) erhält man T(t) = Cxe~x2aH . (9.94e) Für X(x) ergibt sich mit der Randbedingung X@) = 0 X{x) = CsinXx (9.94f) und somit ux = CAe"A2a2f sin Xx, (9.94g) wobei A eine beliebige reelle Zahl sein kann. Die Lösung kann daher in der Form u(x, t) = (°° C{\)e-x2aH sin Xx dX (9.94h) Jo angesetzt werden. Aus der Anfangsbedingung u\t=o = f{x) folgt die Gleichung /»OO f(x) = / C(A) sin Xx dX, (9.94i) Jo die erfüllt ist, wenn für die Konstante 2 r°° C(X) = - f(s) sin Xsds (9.94J) 7T JO gesetzt wird (s. 7.4.1.1,1., S. 437). Einsetzen in (9.94i) ergibt u{x, t) = - l°° f{s) ( j°° e-x2aH sin Xs sin Xx dX\ ds , (9.94k) und nach Ersetzen des Produkts der Sinus- durch eine Differenz von Kosinusfunktionen (s B 123), 2.7.2.6, S. 82) und unter Benutzung von Formel B1.27) (s. 21 8.2, S. 1088) erhält man schließlich Jo 2aV7T' VttI (x - sJ (x + sf AaH - e 4a2t e <ta*i - e ds (9.941) 2. Riemannsche Methode zur Lösung des Cauchyschen Problems der hyperbolischen Differentialgleichung d2u du ,du „ . _ . —— + a— + b— + cu = F 9.95a oxoy ox oy 1. Riemannsche Funktion heißt die Funktion v(x, y; ^, rf), wobei £ und n als Parameter aufgefaßt werden, die der zu (9.95a) konjugierten homogenen Differentialgleichung d2v d(av) d(bv) _ dxdy dx dy und den Bedingungen v(x,77;£,rj) = exp b(s,r))ds\ , v(^:y;^,r}) = exp I a(£>,s)ds\ (9.95c)
9.2 Partielle Differentialgleichungen 549 genügt Allgemein haben lineare Differentialgleichungen 2. Ordnung und die zu ihnen konjugierten Differentialgleichungen die folgende Form. zJ aik a o dU + £&i|^ + cu = /(9.95d) und Y. d2(aikv) dxidxk ¦r- biv) dxi + cv = 0 (9.95e) 2. Riemannsche Formel wird die Integralformel genannt, mit deren Hilfe die Funktion u(£,t/) bestimmt wird, die der gegebenen Differentialgleichung (9.95a) genügt und die auf der vorgegebenen Kurve i (Abb.9.18) zusammen mit ihrer Ableitung nach der Richtung der Kurvennormalen (s 3.6 1 2,2., S. 233) vorgegebene Werte annimmt. u&v) = ^{uv)p + -(Hg- / QP buv + - 1 f du dv dx dx dx Abbildung 9.18 auv + - 1 f du dv\~\ ff 2{v^-ud-y)\dy+Irvdxdv- (9-95f) X U *' J PMQ Die glatte Kurve r (Abb.9.18) darf keine zu den Koordinatenachsen parallele Tangenten besitzen, d h , sie darf die Charakteristiken nicht berühren. Das Kurvenintegral in dieser Formel kann berechnet werden, da aus den Werten der Funktion und ihrer Ableitung nach einer nichttangentialen Richtung längs des Kurvenbogens die Werte beider partieller Ableitungen ermittelbar sind. Oft werden beim CAUCHYschen Problem anstelle der Normalenableitung auf der Kurve die Werte einer du partiellen Ableitung der gesuchten Funktion vorgegeben, z.B. — . Dann wird eine andere Form der dy RiEMANNschen Formel verwendet- w(£, rj) = (uv)p — I ( buv — tt— ) dx — j auv + v— ] dy + / / Fvdxdy. (9.95g) PMQ dy QP ¦ Telegrafengleichung nennt man die lineare partielle Differentialgleichung 2. Ordnung vom hyperbolischen Typ d2u n1 du d2u aW + 2bm+cu = dx-> (9 96a) mit den Konstanten a > 0, b und c, die das Fließen des elektrischen Stromes in Leitungen beschreibt Sie stellt eine Verallgemeinerung der Saitenschwingungsgleichung dar. Die unbekannte Funktion u(x, t) wird durch die Substitution u = ze~^a^ ersetzt, so daß (9.96a) übergeht in d2z 0d2z öfi-mmä^ + nz ( 2 1 2 b2- \ a az Durch die Substitutionen der unabhängigen Variablen i = —(mt + x), m r\ = —(mt - m x) (9.96b) (9.96c) erhält man schließlich die Normalform d£dr] 4 der linearen partiellen Differentialgleichung vom hyperbolischen Typ (s. 9.2.2 1,3., S. 541). Dieser Differentialgleichung muß die RiEMANNsche Funktion v(£,r);£o,r]o) genügen und für £ = £o sowie rj = ry0 (9.96d)
550 9. Differentialgleichungen den Wert Eins annehmen. Wenn in v = f(w) für w die Gestalt w = (Z-to)(ri-TK>) (9 96e) gewählt wird, dann ist f(w) eine Lösung der Differentialgleichung mit der Anfangsbedingung /@) = 1. Die Substitution w = a2 überfuhrt diese Differentialgleichung in die BESSELsche Differentialgleichung nullter Ordnung (s. 9.1.2.6,2.,2., S. 527) so daß die Lösung lautet v = /o [y/(t -&)(•?-»*))] • 0 96h) Eine Lösung der ursprünglichen Differentialgleichung (9.96a) mit den Anfangsbedingungen l ßzl A =/(*), 757 =g(x) (9.96i) l*=o ot \t=o kann erhalten werden, indem man den gefundenen Wert von v in die RiEMANNsche Formel einsetzt und zu den ursprunglichen Variablen zurückkehrt: *(*, t) = - [f(x - mt) + f(x + rot)] _ x+mt h (- JrnH2 -(s- xJ] nth (-JmH2 - {s - xJ) g(s)^ml L _ f{8) W ) ™ y/m2t2 -(s- xJ ds (9 96j) 3. Greensche Methode zur Lösung von Randwertproblemen für elliptische Differentialgleichungen mit zwei unabhängigen Variablen Diese Methode zeigt viel Ähnlichkeit mit der RiEMANNschen Methode zur Lösung des CAUCHYschen Problems für hyperbolische Differentialgleichungen. Bei der Lösung der Aufgabe, eine Funktion u(x, y) zu finden, die in einem vorgegebenen Gebiet der linearen partiellen Differentialgleichung 2. Ordnung vom elliptischen Typ d2u d2u du ,du „ . . M + W+a*c+% + ™ = } (9'97a) genügt und auf dem Rande dieses Gebiets vorgegebene Werte annimmt, wird als erster Schritt die GREENsc/ie Funktion G(x, y, £, 77) für dieses Gebiet bestimmt, wobei $ und rj als Parameter aufgefaßt werden. Die GREENsche Funktion muß die folgenden Bedingungen erfüllen: 1. Die Funktion G(x,y;^,r)) genügt im gegebenen Gebiet überall, ausgenommen den Punkt x = f, y = 7] der homogenen konjugierten Differentialgleichung 8^G + ^G_d{aGl_d{bG)+cG = Q dx2 dy2 dx dy 2. Die Funktion G(x, y; £, rj) ist von der Form U In - + V (9.97c) mit r = yj{x - £J + (y - vJ , (9.97d) wobei U im Punkt x = £, y — r\ den Wert Eins hat und die Funktionen U und V im gesamten Gebiet zusammen mit ihren Ableitungen bis zur 2. Ordnung einschließlich stetig sein müssen.
9.2 Partielle Differentialgleichungen 551 3. Die Funktion G(x, y, £, rf) wird auf dem Rande des betrachteten Gebiets gleich Null. Der zweite Schritt ist die Lösung des Randwertproblems mit Hilfe der GREENschen Funktion nach der Formel u(^ r]) = 7^J u{x, y)—G(x, y, £,n)ds-— Jj f(x, y)G(x, y\ £, n) dx dy, (9 97e) S D wobei D das betrachtete Gebiet bedeutet, S dessen Rand, auf dem die Funktion gegeben ist, und — on die Ableitung nach der Richtung der Innennormalen des Randes. Die Bedingung 3 hängt von der Art der zu lösenden Aufgabe ab. Wenn z.B. auf dem Rande des betrachteten Gebiets nicht die gesuchte Funktion selbst gegeben ist, sondern ihre Ableitung nach der Randnormalen, dann muß in Bedingung 3 die Forderung dG — - (a cos öl + b cos ß)G = 0 (9.97f) auf dem Rande erhoben werden Mit a und ß werden hierbei die Winkel bezeichnet, die die innere Normale des Randes mit den Koordinatenachsen bildet. Die Lösung lautet in diesem Falle u^=-Ud£Gds-lJJfGdxdy- (g) 5 D 4. Greensche Methode zur Lösung von Randwertproblemen mit drei unabhängigen Variablen Die Lösung der Differentialgleichung du ,du du r . ^0 . Au + a— + b— + c—+eu = f (9.98a) dx dy dz soll auf dem Rande des betrachteten Gebiets vorgegebene Werte annnehmen Dazu wird im ersten Schritt wieder die GREENschen Funktion konstruiert, aber mit dem Unterschied, daß sie nunmehr von den drei Parametern {, rj und ( abhängt. Die konjugierte Differentialgleichung, der die GREENsche Funktion genügt, ist von der Gestalt dx dy dz Als Bedingung 2 wird von G(x,y,z;£,r]X) die Form U- + V (9.98c) mit r=yj(x- £J + (y - vJ + (z - CJ (9.98d) gefordert Die Lösung der Aufgabe lautet U^0 = ljJud£ds-lJJJfGdXdydZ. (998e) S D Beiden Methoden, der RiEMANNschen und der GREENschen, ist gemein, daß zuerst eine spezielle Lösung der Differentialgleichung gesucht wird, mit deren Hilfe danach die Lösungen für beliebige Anfangsund Randbedingungen bestimmt werden. Der entscheidende Unterschied zwischen der RiEMANNschen und der GREENschen Funktion besteht darin, daß die erste nur von der Gestalt der linken Seite der Differentialgleichung abhängt, die zweite jedoch auch noch vom betrachteten Gebiet. Die Ermittlung der GREENschen Funktion ist sogar in den Fällen, in denen ihre Existenz gesichert ist, ziemlich schwierig, so daß die GREENsche Methode vorwiegend zur Untersuchung theoretischer Probleme eingesetzt wird. ¦ A: Konstruktion der GREENschen Funktion für das DiRiCHLETsche Problem der LAPLACEschen
552 9 Differentialgleichungen Differentialgleichung (s. 13 5 1, S. 691) Au = 0 (9 99a) für den Fall, daß das betrachtete Gebiet ein Kreis ist (Abb.9.19) Die GREENsche Funktion lautet r H (9.99b) Abbildung 9.19 wobei r = MP, p = OM, rx = MiP und R der Radius des betrachteten Kreises ist (Abb.9.19). Die Punkte M und Mi liegen in bezug auf den Kreis symmetrisch, d.h , beide Punkte liegen auf demselben Radiusstrahl, und es gilt UM • ÜMi = R2 . (9.99c) Mit der angegebenen Formel (9 97e) zur Lösung des Dirich- LETschen Problems ergibt sich nach Einsetzen der Normalenableitung der GREENschen Funktion und einigen Umformungen das PoiSSONsche Integral ufav) ¦ 2tt Jo R2- -u((p)d(p. (9 99d) R2 + p2 - 2Rpcos(ijj - ifY Die Bezeichnungen sind die gleichen wie oben Mit u(tp) werden die auf dem Kreisrand vorgegebenen Werte von u beschrieben Für die Koordinaten des Punktes M(£, rj) gilt: £ = pcosifj, rj = psmip. ¦ B: Konstruktion der GREENschen Funktion für das DiRiCHLETsche Problem der LAPLACEschen Differentialgleichung (s 13 5.1, S 691) Au = 0, (9.100a) für den Fall, daß das betrachtete Gebiet eine Kugel mit dem Radius R ist Die GREENsche Funktion hat die Form G(x,y,z-Z,r),C) = - - — , (9 100b) r T\p mit p = y/^2 + rj1 + C2 als Abstand des Punktes (£, 77, Q vom Kugelmittelpunkt, r als Abstand zwischen den Punkten (x, y, z) und (£, 77, Q und rx als Abstand des Punktes (x, y, z) zum symmetrischen Punkt des Punktes (£, 77, Q gemäß (9.99c), d.h. zum Punkt (—,—, — ) Das PoiSSONsche Integral ergibt V P P P sich bei Beibehaltung der Bezeichnungen von Beispiel A, S 543 zu R2-p2 Js 5. u^tjX)- -[[ 47T JJs -uds. (9 100c) Rr3 Operatorenmethoden Operatorenmethoden sind nicht nur zur Lösung gewöhnlicher Differentialgleichungen geeignet, sondern sie werden auch mit Erfolg zur Lösung partieller Differentialgleichungen eingesetzt (s. 15.1.6, S. 732). Sie beruhen auf einem Übergang von der gesuchten Funktion zu deren Transformierten (s. 15, S. 730). Dazu wird die gesuchte Funktion als Funktion einer der unabhängigen Variablen aufgefaßt, und bezüglich dieser Variablen wird die Transformation durchgeführt. Die übrigen Variablen werden dabei als Parameter aufgefaßt. Die Differentialgleichung zur Bestimmung der Transformierten der gesuchten Funktion enthält dann eine unabhängige Variable weniger als die ursprüngliche Differentialgleichung Im Spezialfall zweier unabhängiger Variabler in der ursprünglichen partiellen Differentialgleichung liefert dieses Verfahren eine gewöhnliche Differentialgleichung Wenn aus der so gewonnenen Differentialgleichung die Transformierte der gesuchten Funktion bestimmt werden kann, dann ergibt sich die gesuchte Funktion entweder durch Anwendung der Umkehrformel oder durch Aufsuchen der Lösung in einer Tabelle der Transformierten
9 2 Partielle Differentialgleichungen 553 6. Näherungsmethoden Zur Lösung konkreter Aufgaben mit Hilfe partieller Differentialgleichungen werden oft verschiedene Näherungsverfahren eingesetzt Dabei ist zwischen analytischen und numerischen Methoden zu unterscheiden. 1. Analytische Methoden ermöglichen die Bestimmung angenäherter analytischer Ausdrücke für die gesuchte Funktion 2. Numerische Methoden liefern Näherungswerte der gesuchten Funktion für bestimmte Werte der unabhängigen Variablen. Dazu verwendet man folgende Methoden (s 19.5, S. 938): a) Methode der flniten Differenzen, kurz Differenzenverfahren genannt: Die Differentialquotien- ten werden durch Differenzenquotienten ersetzt, so daß die Differentialgleichung einschließlich Anfangsund Randbedingungen in ein System von algebraischen Gleichungen umgewandelt wird. Eine lineare Differentialgleichung mit linearen Anfangs- und Randbedingungen wird so zu einem System linearer Gleichungen b) Methode der finiten Elemente, kurz FEM, für Randwertaufgaben: Der Randwertaufgabe wird eine Variationsaufgabe zugeordnet Die gesuchte Lösung wird durch einen Spline-Ansatz approximiert, nachdem das Definitionsgebiet der Randwertaufgabe in regelmäßige Teilgebiete zerlegt worden ist. Die Ansatzkoeffizienten werden durch Lösung einer Extremwertaufgabe bestimmt. c) Randintegralgleichungsmethode für spezielle Randwertaufgaben. Die Randwertaufgabe wird als äquivalentes Integralgleichungsproblem über dem Rand des Definitionsgebietes der Randwertaufgabe formuliert Dazu werden Integralsätze der Vektoranalysis, z.B. GREENsche Formeln, verwendet. Die verbleibenden Randintegrale werden mit Hilfe geeigneter Quadraturformeln numerisch gelöst. 3. Physikalische Methoden können auch zur numerischen Lösung von Differentialgleichungen eingesetzt werden. Dabei macht man von der Tatsache Gebrauch, daß recht unterschiedliche physikalische Erscheinungen mit ein und derselben Differentialgleichung beschrieben werden können. Um ein gegebenes Problem auf diesem Wege zu lösen, wird ein technisches Modell konstruiert, mit dessen Hilfe das gegebene Problem simuliert werden kann und an dem im Experiment Messungen vorgenommen werden, deren Werte die gesuchte Funktion darstellen. Da solche Modelle oft bewußt so konstruiert sind, daß die Parameter in weiten Grenzen eingestellt werden können, ist es möglich, auch die Differentialgleichung in weiten Gebieten der unabhängigen Veränderlichen zu untersuchen.
554 9. Differentialgleichungen 9.2.3 Partielle Differentialgleichungen aus Naturwissenschaft und Technik 9.2.3.1 Problemstellungen und Randbedingungen 1. Problemstellungen Die Modellierung und mathematische Erfassung verschiedener physikalischer Erscheinungen im Rahmen der klassischen theoretischen Physik, besonders in modellmäßig strukturlos oder kontinuierlich veränderlich angenäherten Medien, also in Gasen, strukturlos angenommenen Flüssigkeiten sowie Fest körpern und besonders in Feldern der klassischen Physik, führen auf partielle Differentialgleichungen, wie z B. die Wellengleichung (s 9.2.3.2, S. 555) und die Wärmeleitungsgleichung (s. 9 2 3.3, S. 556) Auch die nichtklassische theoretische Physik, die Quantenmechanik, die auf der Erkenntnis aufbaut, daß Medien und Felder diskontinuierliche Erscheinungen sind, wird von einer partiellen Differentialgleichung beherrscht, die geradezu eine dominierende Stellung einnimmt, von der SchrÖdinger- Gleichung Besonders häufig treten lineare partielle Differentialgleichungen 2 Ordnung auf, die auch in den modernen Ingenieur- und Naturwissenschaften große Bedeutung erlangt haben. 2. Anfangs- und Randbedingungen Die Lösung physikalischer, technischer und naturwissenschaftlicher Probleme erfordert gewöhnlich die Erfüllung zweier grundsätzlicher Anforderungen: 1. Die gesuchte Lösung hat nicht nur der Differentialgleichung zu genügen, sondern zusätzlich noch Anfangs- bzw. Randbedingungen. Dabei können Probleme auftreten, bei denen nur Anfangsbedingungen, nur Randbedingungen oder sowohl Anfangs- als auch Randbedingungen vorgegeben sind Die Gesamtheit aller Bedingungen muß die Lösung der Differentialgleichung eindeutig festlegen 2. Die gesuchte Lösung muß gegenüber kleinen Änderungen der Anfangs- und Randbedingungen stabil sein, d.h. sich beliebig wenig ändern, wenn die Änderungen dieser Bedingungen, oft auch Störungen genannt, hinreichend klein sind Man sagt dann, daß eine korrekte Problemstellung vorliegt. Erst wenn diese Bedingungen erfüllt sind, kann davon ausgegangen werden, daß das mathematische Modell des gegebenen Problems zur Beschreibung realer Erscheinungen geeignet ist Bei Differentialgleichungen des hyperbolischen Typs, auf die besonders Untersuchungen von Schwingungsvorgängen in kontinuierlichen Medien führen, ist z B das CAUCHYsche Problem korrekt gestellt. Dies bedeutet, daß auf einer Anfangsmannigfaltigkeit, d h auf einer Kurve oder Fläche, Werte der zu bestimmenden Funktion sowie ihrer Ableitungen in einer nichttangentialen, besonders der Normalenrichtung gegeben sind. Bei den Differentialgleichungen des elliptischen Typs, auf die besonders Untersuchungen von stationären Vorgängen und von Gleichgewichtsproblemen in kontinuierlichen Medien führen, ist die Stellung des Randwertproblems, d h die Vorgabe der Werte der zu bestimmenden Funktion auf dem Rande des betrachteten Variabilitätsgebiets der unabhängigen Variablen, korrekt Wenn das betrachtete Gebiet unbegrenzt ist, dann müssen von der zu bestimmenden Funktion geeignete Verhaltenseigenschaften beim unbegrenzten Wachstum der unabhängigen Variablen gefordert werden. 3. Inhomogene Bedingungen und inhomogene Differentialgleichungen Die Lösung homogener oder inhomogener linearer partieller Differentialgleichungen bei inhomogenen Anfangs- oder Randbedingungen kann auf die Lösung einer Gleichung zurückgeführt werden, die sich von der gegebenen lediglich durch das die unbekannte Funktion nicht mehr enthaltende freie Glied unterscheidet, jetzt aber bei homogenen Bedingungen. Dazu reicht es aus, die zu bestimmende Funktion durch eine Differenz zwischen ihr und einer beliebigen, zweimal differenzierbaren Funktion zu ersetzen, die die gegebenen inhomogenen Bedingungen erfüllt. Generell wird von der Erkenntnis Gebrauch gemacht, daß sich die Lösung einer linearen inhomogenen partiellen Differentialgleichung bei gegebenen inhomogenen Anfangs- oder Randbedingungen als Summe der Lösung der gleichen Differentialgleichung bei Nullbedingungen und der Lösung der entsprechenden homogenen Differentialgleichung bei den gegebenen Bedingungen darstellen läßt.
9.2 Partielle Differentialgleichungen 555 Zur Zurückführung der Lösung der linearen inhomogenen partiellen Differentialgleichung d2u — -L[u}=g(x,t) (9.101a) bei den homogenen Anfangsbedingungen l du I u\ =0, T- =0 (9 101b) auf die Lösung des C AUCHYschen Problems für die zugehörige homogene Differentialgleichung wird t u= f\p{x,t;T)dr (9 101c) o gesetzt. Dabei ist (p(x, t, r) die Lösung der Differentialgleichung g-LH = 0, (9101d) die den Randbedingungen I du I u\ =0' 757 =9{x,t) (9.101e) \t=T Öl \t=r genügt In diesen Gleichungen steht x symbolisch für die Gesamtheit der n Variablen x\, x2, .., xn des n-dimensionalen Problems Mit L[u] wird dabei ein linearer Differentialausdruck bezeichnet, der die du Ableitung — enthalten darf, nicht aber höhere Ableitungen nach t. 9.2.3.2 Wellengleichung Die Ausbreitung von Schwingungen als wellenförmige Erscheinung in einem homogenen Medium wird mit Hilfe der Wellengleichung ^-a2Au = Q(x,t) (9 102a) beschrieben, deren rechte Seite Q(x, t) verschwindet, wenn keine Störungskräfte auftreten Das Symbol x steht für die n Variablen xi, ,xn des n-dimensionalen Problems Der LAPLACE-Operator A ist dann wie folgt definiert: d2u d2u d2u dx\2 dx22 dxn Die Lösung der Wellengleichung ist die Wellenfunktion u Die Differentialgleichung (9.102a) ist vom hyperbolischen Typ. 1. Homogenes Problem Die Lösung des homogenen Problems mit Q(x,t) = 0 und den Anfangsbedingungen I du I u\ =tp(x), -jr- =il)(x) (9.103) lt=o ot \t=o wird für die Fälle n = 1 bis 3 durch die folgenden Integrale beschrieben. a) n = 3 (Kirchhoffsche Formel): Au=—2+—2+--- + —2- (9-102b) 1 u(XuX21X3it) = j ip(aua2,a3) ^^ y d ff (p(ai,a2,a3) , Eat) (Sat) (9.104a) wobei die Integration über die Kugeloberfläche 5at erfolgt, die mit (cti — X\J + («2 -X2J + @3 — X3J a2t2 angesetzt wird.
556 9 Differentialgleichungen b) n = 2 (Poissonsche Formel): 1 I" ff ip(auct2)da1da2 ,K x y/a2t2 - (ai - xxJ - {a2 - x2J ,-- 2 /// ^si^2^3 (9.105a) wobei die Integration über die Kreisfläche Kat erfolgt, die durch (ai — x\J + (a2 — x2J < a2t2 beschrieben wird. c) n = 1 (ö'ALEMBERTsche Formel): w(xi,t) = ^-^ 0 2~ I ^°^da- (9.104c) 2. Inhomogenes Problem Im Falle Q(x, t) ^ 0 sind auf den rechten Seiten der Formeln (9 104a,b,c) Korrekturglieder zu addieren- a) n = 3 (Retardiertes Potential): Für ein Gebiet K , das durch r < at mit r = yf(£i - XiJ + F - Z2J + (£3 - ^3J beschrieben wird, gilt: AzfJJ-L—- ^ b) n = 2: 1 in Q^r^dbär 2™g v«2(<-^J-te-^J-(&-^J wobei K ein Gebiet des £1, £2* r-Raumes ist, das durch die Ungleichungen 0 < r < t, (£1 — x\J + (£2 — X2J < a2(t — tJ definiert ist. c) n = 1: ^//Q(£,t)^t, (9 105c) V) wobei T das Dreieck 0 < r < t, |£ — x\\ < a\t — r\ bedeutet. In den angegebenen Formeln steht a für die Ausbreitungsgeschwindigkeit der Störung. 9.2.3.3 Wärmeleitungs- und Diffusionsgleichung für ein homogenes Medium 1. Dreidimensionale Wärmeleitungsgleichung Die Ausbreitung der Wärme in einem homogenen Medium wird durch die lineare partielle Differentialgleichung zweiter Ordnung vom parabolischen Typ ^¦-a2Au = Q{x,t) (9 106a) ot beschrieben, wobei A der LAPLACE-Operator ist (s 13.2.6.5, S. 678), hier beschränkt auf maximal drei Ausbreitungsrichtungen xi, x2, X3, beschreibbar auch durch den Ortsvektor r Wenn der Wärmestrom weder Quellen noch Senken besitzt, verschwindet die rechte Seite wegen Q(x, t) = 0. Das CAUCHYsche Problem kann folgendermaßen gestellt werden: Es ist eine für t > 0 beschränkte
9.2 Partielle Differentialgleichungen 557 Lösung u(x, t) zu suchen, wobei u\t=0 = f(x) sein soll Die Forderung nach der Beschränktheit sichert gleichzeitig die Eindeutigkeit der Lösung. Für die homogene Differentialgleichung mit Q(x,t) = 0 erhält man die Wellenfunktion +oo +oo +oo u(Xl'X2'X3'i) = (W^./// /(öl'tt2'a3) —oo —oo —oo ( {xi - et\J + {x2 - a2J + {x3 - a3J\ • exp I -- — — I daxda2da3 . (9 106b) Für die inhomogene Differentialgleichung mit Q(x,t) 7^ 0 ist auf der rechten Seite von (9.106b) der folgende Ausdruck zu addieren t r +oo +oo +oo , . f\ [ f f V(«l, ^2,^3) [2a^(t-t)Y dr. (9.106c) / (xi - aiJ + {x2 - a2f + (x3 - a3J\ * exp ^ ^^ J dalda2da, Die Aufgabe, u(x, t) für t < 0 zu bestimmen, wenn die Werte von u(x, 0) gegeben sind, kann so nicht gelöst werden, weil das CAUCHYsche Problem dann nicht mehr korrekt gestellt ist. Da die Temperatur zur Wärmemenge proportional ist, setzt man oft u = T(r, t) (Temperaturfeld) und a2 = Dw (Wärmediffusionskonstante oder Temperaturleitzahl) und erhält dT — - DWAT = Qw(r,t) (9 106d) 2. Dreidimensionale Diffusionsgleichung In Analogie zur Wärmeleitung wird die Ausbreitung einer Konzentration C in einem homogenen Medium durch die gleiche lineare partielle Differentialgleichung (9.106a) bzw. (9.106d) beschrieben, wobei Dw durch den dreidimensionalen Diffusionskoeffizienten Dq zu ersetzen ist. Die Diffusionsgleichung lautet- ßC — -DcAC = Qc(?,t). (9.107) Die Lösungen erhält man durch Symbolaustausch in den Wellengleichungen (9 106b) und (9.106c) 9.2.3.4 Potentialgleichung Potentialgleichung oder PoisSONsc/ie Differentialgleichung (s. 13.5.2, S. 691) wird die lineare partielle Differentialgleichung 2. Ordnung An = -Airg (9.108a) genannt, die die Bestimmung des Potentials u{x) eines skalaren Feldes ermöglicht, das von einer Punktfunktion g(x) erzeugt wird, wobei x für die Koordinaten x\, x2, x3 steht und A der LAPLACE-Operator ist Die Lösung, das Potential Um(x\, x2, x3) im Punkt M, wird in 13.5.2, S. 691 behandelt. Für die homogene Differentialgleichung mit g = 0 ergibt sich die LAPLACEsc/ie Differentialgleichung (s 13 5 1, S 691) Au = 0 (9.108b) Die Differentialgleichungen (9 108a und (9 108b) sind vom elliptischen Typ. 9.2.3.5 Schrödinger-Gleichung 1. Begriff der Schrödinger-Gleichung 1. Bestimmung und Abhängigkeiten Die SCHRÖDINGER-Gleichung, deren Lösungen, die Wellenfunktionen ip, die Eigenschaften eines quantenmechanischen Systems beschreiben, also die Eigenschaften der Teilchenzustände zu berechnen gestatten, ist eine partielle Differentialgleichung mit Ab-
558 9. Differentialgleichungen leitungen der Wellenfunktion 2. Ordnung für die Raumkoordinaten und 1. Ordnung für die Zeitkoordinate i h-~ = -|-A^ + U(x1,x2, x3,t)tl> = Hil> (9.109a) \Jv dt [TL H=2- + Uftt), p=T— =TV. (9.109b) 2m i ot i Hierbei sind A der LAPLACE-Operator, k = h/2ir die reduzierte PLANCKsche Konstante, i die imaginäre Einheit und V der Nablaoperator. Zwischen dem Impuls p eines freien Teilchens mit der Masse m und seiner Materiewellenlänge A besteht die Beziehung A = h/p 2. Besonderheiten a) In der Quantenmechanik werden allen meßbaren Größen Operatoren zugeordnet. Der in (9.109a) und (9.109b) auftretende HAMILTON-Operator H, („Hamiltonian"), der an die Stelle der Hamilton- Funktion des klassischen mechanischen Systems tritt (s 9 2 1.2,3., S. 538), stellt die Gesamtenergie des Systems dar, die in kinetische und potentielle Energie aufgeteilt wird Der erste Term in H ist der Operator für die kinetische Energie, der zweite der für die potentielle Energie. b) Die imaginäre Einheit tritt in der SCHRÖDINGER-Gleichung explizit auf Daher sind die Wellenfunktionen komplexe Funktionen. Für die Berechnung der beobachtbaren Größen sind die beiden reellen, in ipW+iipW enthaltenen Funktionen erforderlich. Das Quadrat \&\2 der Wellenfunktion, das die Aufenthaltswahrscheinlichkeit dw des Teilchens in jedem beliebigen Raumelement dV des betrachteten Gebietes beschreibt, unterliegt speziellen zusätzlichen Bedingungen. c) Jede spezielle Lösung hängt außer vom Potential der Wechselwirkung {Kraß) von den Anfangs- und Randbedingungen des gegebenen Problems ab. Im allgemeinen handelt es sich um lineare Randwertprobleme 2 Ordnung, deren Lösungen nur für die Eigenwerte physikalisch sinnvoll sind Sinnvolle Lösungen zeichnen sich dadurch aus, daß ihr Betragsquadrat überall eindeutig und regulär ist und im Unendlichen verschwindet. d) Auf Grund des Welle-Teilchen-Dualismus besitzen die Mikroteilchen gleichzeitig Wellen- und Teilcheneigenschaften, so daß die SCHRÖDINGER-Gleichung eine Wellengleichung (s 9.2.3 2, S 555) für die DE-BROGLiEschen Materie-Wellen ist. e) Die Einschränkung auf nichtrelativistische Probleme bedeutet, daß die Teilchengeschwindigkeit v sehr viel kleiner sein muß als die Lichtgeschwindigkeit c (v <£ c) Ausführliche Darstellungen der Anwendungen der SCHRÖDINGER-Gleichung sind in der Speziallitera- tur der theoretischen Physik dargestellt (s. z B. [9.5], [9.7], [9.15], [22.18]). In diesem Kapitel werden lediglich einige wichtige Beispiele betrachtet 3. Zeitabhängige Schrödinger-Gleichung Den allgemeinen nichtrelativistischen Fall eines spinlosen Teilchens mit der Masse m im orts- und zeitabhängigen Potentialfeld U(xi,X2,x3,t) beschreibt die zeitabhängige SCHRÖDINGER-Gleichung (9.109a). Die speziellen Bedingungen, denen die Wellenfunktion genügen muß, lauten: a) Die ^-Funktion muß beschränkt und stetig sein. b) Die partiellen Ableitungen dijj/dxi, dip/dx2 und dip/dx^ müssen stetig sein. c) Die Funktion \ip\2 muß integrierbar sein, also muß \ip(xux2,x3,t)\2dV < oo (9.110a) v gelten. Gemäß Normierungsbedingung muß die Wahrscheinlichkeit, das Teilchen im betrachteten Gebiet zu finden, gleich 1 sein. Dazu reicht (9.110a) aus, weil das Integral stets durch einen Faktor vor tp auf 1 gebracht werden kann. ///
9.2 Partielle Differentialgleichungen 559 A«^ + -2-(£ - U)V = 0. (9.111a) Eine Lösung der zeitabhängigen SCHRÖDINGER-Gleichung hat die Form il){x\,X2,x$,t) = \P(xi,x2,x3)exp l-i—t) . (9.110b) Der Zustand des Teilchens wird durch eine periodische Funktion von der Zeit mit der Kreisfrequenz üü = E/k beschrieben Wenn die Energie des Teilchens in dem Zustand den festen Wert E = const besitzt, dann hängt die Wahrscheinlichkeit dw, es in einem Raumelement dV zu finden, nicht von der Zeit ab: dw = \i/>\2 dV = W dV (9.110c) Man spricht vom stationären Zustand des Teilchens. 4. Zeitunabhängige Schrödinger-Gleichung Wenn das Potential U nicht von der Zeit abhängt, d.h. U = U(xi,X2, x$), dann genügt zur Beschreibung der Zustände die Wellenfunktion ^(zi, x<i, x3), der zeitunabhängigen SCHRÖDINGER-Gleichung. Man kann sie aus der zeitabhängigen SCHRÖDINGER-Gleichung (9.109a) mit dem Ansatz (9.110b) herleiten und erhält 2m, ~W In diesem ebenfalls nichtrelativistischen Fall ist die Energie des Teilchens, wobei p der Impuls des Teilchens ist. Die Wellenfunktionen &, die diese Differentialgleichung erfüllen, sind ihre Eigenfunktionen; sie existieren nur für bestimmte Energieeigenwerte E, die sich für das betrachtete Problem aus seinen spezifischen Randbedingungen ergeben Die Gesamtheit der Eigenwerte bildet das Energiespektrum des Teilchens. Wenn U ein Potential endlicher Tiefe ist, das im Unendlichen verschwindet, dann bilden die negativen Eigenwerte ein diskretes Spektrum. Ist das betrachtete Gebiet der gesamte Raum, dann kann als Randbedingung gefordert werden, daß & im LEBESGUEschen Sinne (s. 12.9.3.2, S. 658 und [8.9]) im gesamten Raum quadratisch integrabel sein muß. Ist das Gebiet endlich, z.B. eine Kugel oder ein Zylinder, dann kann als erste Randwertaufgabe z B ^ = 0 für den Rand gefordert werden. In dem speziellen Fall U{x) = 0 ergibt sich die HELMHOLTZsc/ie Differentialgleichung 2mE Als Randbedingung wird hier oft & = 0 am Rande gefordert. In einem endlichen Gebiet stellt (9.112a) die mathematische Ausgangsgleichung für akustische Schwingungen in gegebenen räumlichen Begrenzungen dar 5. Kräftefreie Bewegung eines Teilchens in einem Quader 1. Problemstellung Ein Teilchen mit der Masse m bewege sich kräftefrei in einem Quader mit undurchlässigen Wänden der Kantenlänge a, 6, c, so daß es sich in einem Potentialkasten befindet, der in alle drei Raumrichtungen wegen seiner Undurchlässigkeit unendlich hoch ist, d.h., die Aufenthaltswahrscheinlichkeit des Teilchens und damit die Wellenfunktion ^ verschwinden außerhalb des Kastens. Die SCHRÖDINGER-Gleichung und die Randbedingungen lauten für dieses Problem A^ + A^ = 0 (9.112a) mit dem Eigenwert A = —j- . (9.112b) Fp-tif Pp-tij Pß\D 2m dx* + W + w+lFE* = 0' (9-113a) * = 0 fur ^ = 0, y = b' (9113b) {x = 0, x = a, y = 0, y = b, z = 0, z = c. Lösungsansatz Mit dem Separationsansatz #(*, y, z) = Vx(x) Vy(y) Vz(z) (9.114a)
560 9 Differentialgleichungen zur Variablentrennung ergibt sich nach Einsetzen in (9.113a) ¥xl^ + ¥vW + ^^~~^ { ] Jedes der drei Glieder auf der linken Seite hängt nur von einer unabhängigen Variablen ab. Ihre Summe kann für beliebige x, y, z nur dann konstant gleich — B sein, wenn jedes einzelne Glied für sich konstant ist In diesem Falle kann die partielle Differentialgleichung in drei gewöhnliche Differentialgleichungen aufgespalten werden: f^ = -k^ d^ = -k2V ^ = -k2V - (9114c) dx* x X1 dy* y y' dz* z z- [ } Zwischen den Separationskonstanten —kx2, — A;y2, — kz2 besteht der Zusammenhang *2 kx2 + /cy2 + k2 = B, (9.114d) womit folgt £ = ^-(kx2 + fcy2 + k2). (9.114e) 3. Lösungen der drei Gleichungen (9.114c) sind die Funktionen #x — ^x sin kx x, Wy = Ay sin /cy ?/, \PZ = Az sin /^ 2; (9.115a) mit den Konstanten Ax, Ayi Az. Damit erfüllt & die Randbedingungen #r = 0für:r = 0,2/ = 0 und z = 0. Um die Bedingung & = 0 auch für £ = a, y = b und 2 = c zu erfüllen, muß sin kx a = sin ky b = sin kz c = 0 (9.115b) gelten, d.h., es müssen die Beziehungen Kx == 5 "'w ^ —i— ) &z z= W -LlOC) ab c erfüllt sein, in denen nx, ny und nz ganze Zahlen sind Für die Gesamtenergie erhält man damit 2ra (nx,ny,nz = ±l,±2,...), (9.115d) woraus folgt, daß Energieänderungen des Teilchens durch Austausch mit der Umgebung nicht kontinuierlich, sondern lediglich in Quanten möglich sind. Die Zahlen nx, ny und nz, die zu den Eigenwerten der Energie gehören, werden Quantenzahlen genannt. Nach der Berechnung des Konstantenprodukts AxAyAz aus der Normierungsbedingung (AxAyAzJ JfJ sin2 ^ sin2 ^M sin2 ZEM da: dy dz = 1 (9.l15e) 000 ergeben sich die vollständigen Eigenfunktionen des durch die drei Quantenzahlen charakterisierten Zu- standes zu ,r, l~8~ • ^^ • ^vy • ^^ /n 11 c*\ $W n„ n=\ -T" Sin Sin —^- SU1 . (9.115f) y V öoc a 0 c Die Eigenfunktionen verschwinden an den Wänden, wenn eine der drei Sinusfunktionen gleich Null ist Außer an den Wänden ist das immer dann der Fall, wenn die folgenden Beziehungen erfüllt sind. a 2a (nx — l)a nx nx »=-,-,., i^_^, (9.115g) y y _ c 2c nz ' nz nz (n, (nz nx -l)b ny -l)c
9.2 Partielle Differentialgleichungen 561 Somit gibt es nx — 1 bzw. ny — 1 bzw. nz — 1 Ebenen senkrecht zur x- bzw. j/- bzw. z-Achse, in denen & verschwindet. Diese Ebenen heißen Knotenebenen. 4. Spezialfall Würfel, Entartung Im Spezialfälle des Würfels mit a = b = c kann sich ein Teilchen in Zuständen befinden, die durch unterschiedliche linear unabhängige Eigenfunktionen beschrieben werden und die gleiche Energie besitzen Das ist der Fall, wenn die Summe nx2 + ny2 + nz2 in verschiedenen Zuständen den gleichen Wert hat Man spricht dann von entarteten Zuständen, und wenn es i Zustände mit gleicher Energie sind, von i-facher Entartung. Die Quantenzahlen nx, ny und nz können alle ganzen Zahlen durchlaufen, außer der Null. Letzteres würde bedeuten, daß die Wellenfunktion identisch Null ist, d.h., das Teilchen an keinem Ort innerhalb des Kastens existiert. Somit muß die Teilchenenergie endlich bleiben, selbst wenn die Temperatur des absoluten Nullpunktes erreicht ist. Diese Nullpunktstranslationsenergie beträgt für den Quader EQ = 7T2ft2 2m L2 + &2 + c27 (9.115h) 6. Teilchenbewegung im symmetrischen Zentralfeld (s. 13.1.2.2,2., S. 664) 1. Problemstellung Das betrachtete Teilchen bewegt sich in einem radialsymmetrisch, zentralsymmetrischen Potential V(r). Dieses Modell reproduziert die Bewegung eines Elektrons unter der elektrostatischen Anziehung eines positiv geladenen Kerns. Da es sich um ein kugelsymmetrisches Problem handelt, ist die Benutzung von Kugelkoordinaten zweckmäßig (Abb.9.20). Es gelten dann die Beziehungen (9.116a) r = y/x'2 + y2 + z2 , 0 Z v = arccos - , r y (p = arctan — , x = r sin $ cos <p y = r sin i? sin ip z = r cos ü, Abbildung 9.20 wobei r der Betrag des Radiusvektors ist, ß der Winkel zwischen Radiusvektor und 2-Achse (Polarwinkel) und ip der Winkel zwischen der Projektion des Radiusvektors auf die x, y-Ebene und der x-Achse (Azimutalwinkel). Für den LAPLACE-Operator ergibt sich A!£: d2& 2d& 1 d2& costf W 1 d2V dr2 r dr r2 dfl2 r2 sin i? d$ r2 sin2 $ dip2 so daß die zeit unabhängige SCHRÖDINGER-Gleichung lautet* r2 dr \ dr I r2 sin i? dti 1 d2& 2m + [E-V(r)]¥ = Q. (9.116b) (9.116c) r2 sin2 ß dip2 2. Lösungsansätze Eine Lösung wird mit dem Ansatz #(r, 0, ip) = Riir)^™^, ip) (9.117a) angestrebt, in dem Ri die nur vom Radius r abhängige radiale Wellenfunktion ist und Y™^, </?) eine nur von den beiden Winkeln abhängige Wellenfunktion Einsetzen von (9.117a) in (9.116c) liefert 2ra 1 d ( . dYf" r2 dr \ dr J YT+' r2 sin ß dd sin$- -[E-V(r)]R,Yr 1 R,+ d2Y? _ r2sin2$ dip2 (9.117b)
562 9 Differentialgleichungen Division durch RiY™ und Multiplikation mit r2 ergibt 1 d ( ndRi\ 2mr2m ¥„ xl 1 f 1 d ( . adY,m\ 1 d2Y,m) ,„„„, Die Gleichung (9 117c) kann nur erfüllt werden, wenn eine unabhängige Variation der Radiuskoordinate r auf der linken Seite der Gleichung und der Winkelkoordinaten tf, <p auf der rechten dieselbe Separationskonstante ergeben, d h , wenn die Seiten unabhängig voneinander sind und den gleichen konstanten Wert ergeben. Aus der partiellen Differentialgleichung mit drei unabhängigen Variablen ergeben sich dann eine gewöhnliche Differentialgleichung und eine partielle Differentialgleichung mit zwei unabhängigen Veränderlichen. Wird die Separationskonstante praktischerweise gleich /(/ + 1) gesetzt, dann erhält man die nur von r und vom Potential V(r) abhängige sogenannte Radialgleichung- 1 d ( 2dRi\ 2m E-V(r) '<l + 1)ft' = 0. (9 117d) 2mr2 Der winkelabhängige Anteil wird mit Hilfe des Ansatzes Ylm{tf,<p) = 0(ti)<P(iP) (9 117e) ebenfalls separiert. Einsetzen von (9 117e) in (9.117c) liefert Bezeichnet man die Separationskonstante zweckmäßigerweise mit m2 , dann lautet die sogenannte Polargleichung ^^)+l(l + l)-^ji = 0 (9.117g) G Sinti dtiy dtij und die Azimutalgleichung d2$ _ + m2$ = 0. (9.117h) difr Beide Gleichungen sind potentialunabhängig, gelten also für jedes zentralsymmetrische Potential. An die Lösung (9.117a) sind drei Forderungen zu stellen. Sie soll für r —> oo verschwinden, auf der Kugeloberfläche eindeutig sein und sich quadratisch integrieren lassen 3. Lösung der Radialgleichung Die Radialgleichung (9.117d) enthält neben dem Potential V(r) noch die Separationskonstante 1A + 1). Man substituiert Ul(r) = r - Rt(r), (9.118a) weil das Quadrat der Funktion ut(r) die letztlich gesuchte Aufenthaltswahrscheinlichkeit \ui(r)\2dr = \Ri(r)\2r2dr des Teilchens in einer Kugelschale zwischen r und r + dr angibt. Die Substitution führt auf die eindimensionale SCHRÖDINGER-Gleichung d2ui{r) 2m _^2_ + ^2" E-V(r) '*' + 1>Äa 2rar2 ui(r) = 0. (9.118b) Diese enthält das effektive Potential VeS = V(r) + Vl(l), (9.118c) das aus zwei Anteilen besteht Die Rotationsenergie wird Zentrifugalpotential genannt. Die physikalische Bedeutung von / als Bahndrehimpuls-Quantenzahl ergibt sich aus der Analogiebe-
9.2 Partielle Differentialgleichungen 563 trachtung zur klassischen Rotationsenergie eines rotierenden Teilchens mit dem Trägheitsmoment 0 = [ir2 und dem Bahndrehimpuls / = 0ü. l2 = l(l + l)h2, |f2| = hy/l(l + l). (9.118f) 4. Lösung der Polargleichung Die Polargleichung (9.117g), die beide Separationskonstanten 1A + 1) und m2 enthält, ist eine LEGENDREsche Differentialgleichung (9.57a) (s. 9 1.2.6,3., S 529). Ihre Lösung wird mit 6>zm($) bezeichnet und kann durch einen Potenzreihenansatz ermittelt werden. Endliche, eindeutige und stetige Lösungen ergeben sich nur für /(/ +1) = 0,2,6,12,. Daher gilt für / und m J = 0,l,2,. , \m\<l. (9119a) Somit kann m insgesamt die B/ + 1) Werte -/, H + 1), H + 2),...,(/ - 2), (/ - 1), l (9 119b) durchlaufen Für m/0 ergeben sich die zugeordneten LEGENDREschen Polynome, die wie folgt definiert sind /neos.) = <=£(! - ^^y . (9.119c) Als Spezialfall (/ = 0 , m = n, cos$ = x) erhält man die LEGENDREschen Polynome 1. Art (9.57c) (s. 9 1.2.6,3., S. 529) Die Normierung führt auf 0,m(#) = 21 + 1 {l m)\ p„(cos^ = Nrnprn(cos^ (g n9d) \ 2 (/ + m)! 5. Lösung der Azimutalgleichung Da die Teilchenbewegung im Potential V(r) auch im Falle der physikalischen Auszeichnung einer Raumrichtung, z B durch ein Magnetfeld, unabhängig vom Azimutalwinkel ist, spezifiziert man die allgemeine Lösung $ = a exp (i m <p) + ß exp (—i m ip) durch die Festlegung <Pm{ip) = Aexp{±imcp) , (9.120a) für die |^m|2 unabhängig von (p ist Aus der Forderung nach Eindeutigkeit *m(y> + 27r)==*ro(¥>) (9 120b) folgt, daß m nur die Werte 0, ±1, ±2, annehmen darf. Aus der Normierung f |#|2 dtp=l = \A\2 r dtp = 2tt\A\2 (9.120c) o folgt. <pm(lp) = -±=exp(im(p) (m = 0,±l,±2,. ). (9 120d) V27T Die Quantenzahl m wird magnetische Quantenzahl genannt 6. Gesamtlösung für die Winkelabhängigkeit In Übereinstimmung mit (9 117e) sind die Lösungen für die Polar- und die Azimutalgleichungen miteinander zu multiplizieren- y™(#, v?) = 0(<ß) $(<p) = —LA^P/^cos 0) exp (irrup) . (9 121a) V27T
564 9. Differentialgleichungen Die Funktionen Yj^iü, <p) sind die sogenannten Kugelflächenfunktionen. Wenn der Radiusvektor r am Koordinatenursprung gespiegelt wird (r —* -^r), gehen # in 7r — # und <p in cp + 7T über, so daß sich das Vorzeichen von Y™ ändern kann: YT(* ~ *,<P + tt) = (-I)'IT^. ¥>) • (9.121b) Daraus ergibt sich die Parität der betrachteten Wellenfunktion zu P = (-lI. (9.122a) 7. Parität Die Eigenschaft Paritat dient der Charakterisierung des Verhaltens der Wellenfunktion bei Rauminversion r —? —f (s. 4.3.5.1,1., S. 277). Diese wird mit dem Inversions- oder Paritätsoperator P durchgeführt: P#(r, t) = &{—r, t). Bezeichnet man den Eigenwert des Operators mit P, dann muß eine zweimalige Anwendung von P, d.h. PP?^(r, t), auf PP\P(r, t) = ^(r, t) fuhren, also auf die ursprüngliche Wellenfunktion. Daraus folgt: P2 = l, P = ±l. (9.122b) Man spricht von gerader Wellenfunktion, wenn sie bei Rauminversion ihr Vorzeichen nicht ändert, von ungerader Wellenfunktion, wenn sie es ändert. 7. Linearer harmonischer Oszillator 1. Problemstellung Harmonische Schwingungen entstehen, wenn die rücktreibende Kraft im Oszillator dem HoOKEschen Gesetz F = —kx genügt. Für Schwingungsfrequenz, Schwingungskreisfrequenz und potentielle Energie ergeben sich: i/=^-J-, (9.123a) «; *=!/-, (9.123b) Epot = \kx2 = %-x2. (9.123c) Z7T V m V rn 11 Durch Einsetzen in (9.112a) erhält die SCHRÖDINGER-Gleichung die Form d?& 2ra ~dx^Jr~W E ——mx 2 V = 0. (9.124a) Mit Hilfe der Substitutionen y = xxr^, (9.124b) A = ^, (9.124c) V h au wobei A ein Parameter und nicht die Wellenlänge ist, kann (9.124a) in die einfachere Form der We- BERschen Differentialgleichung d2& —- + (A-2/2)^ = 0 (9.124d) dy1 überfuhrt werden. 2. Lösungsansatz und Lösungsgang Für die WEBERsche Differentialgleichung erhält man mit Hilfe des Ansatzes *(y) = exp I -f- I H(y) (9.125a) eine Lösung. Differentiation führt auf HF = exp VT) W " ^ + {y " l)H\ • (9'l25b) Einsetzen in die SCHRÖDINGER-Gleichung (9.l24d) liefert d2H dH_ dy2 dy . -2y— + (\-l)H = 0. (9.125c) .2 <lf
9.2 Partielle Differentialgleichungen 565 Eine Lösung wird über den Reihenansatz 00 d H °° cP1 H °° H = J2aiVl mit -7- = ^2iaiyl~\ -fr = Z^(*~ 1)^~2 (9 126a) bestimmt Einsetzen von (9.126a) in (9.125c) ergibt 00 00 00 £ i(i - lJoijT2 - J] 2«^ + £ i(A - 1)^ = 0. (9.126b) x=2 t=l t=0 Durch Vergleich der Koeffizienten von yi erhält man die Rekursionsformel (j + 2)(j + l)aj+2 = [2j - (A - l)]flj- (j = 0,1,2,.. ) (9.126c) Die Koeffizienten aj für gerade Potenzen von y werden auf ao zurückgeführt, die Koeffizienten für ungerade Potenzen auf a\. Damit sind a0 und a\ frei wählbar 3. Physikalische Lösungen Gesucht ist die Aufenthaltswahrscheinlichkeit des betrachteten Teilchens in den verschiedenen Zuständen Diese wird mit Hilfe einer physikalisch sinnvollen, d h. normierbaren, für große Werte von y gegen null gehenden Eigenfunktion und quadratisch integrierbaren Wellenfunktion &(x) beschrieben. Die Exponentialfunktion exp(—y2/2) im Ansatz (9 125a) sorgt dafür, daß die Lösung &(y) für y —> cxD gegen null strebt, wenn die Funktion H(y) ein Polynom ist Daher müssen die Koeffizienten aj in (9.126a), beginnend von einem bestimmten n an, für alle j > n verschwinden: an ^ 0, an+\ = an+2 = an+3 = =0. Mit j — n lautet die Rekursionsformel (9.126c) jetzt a"+2 = , ^0w _^Lan. 9.127a (n + 2)(n + l) Für an ^ 0, an+2 = 0 kann sie nur erfüllt werden, wenn 2P 2n-(A-l) = 0, A= —= 2n + l (9.127b) hu gesetzt wird. Somit verschwinden durch die angegebene Wahl von A die Koeffizienten an+2, an+4,. . Damit auch die Koeffizienten an+i, an+3,. . verschwinden, muß an_i = 0 sein. Für die spezielle Wahl an = 2n, an_i = 0 erhält man die ÜERMiTEschen Polynome der 2. Definitionsgleichung (s. 9 1.2 6,6., S 532)). Die ersten sechs lauten: n = 0: #o = l; n = l- Hx = 2y; n = 2: H2 = -2 + 4y2; n = 3. H3 = -12y + 8y3; n = 4: H4 = 12 - 4Sy2 + 16y4; (9.127c) n = 5. H5 = 120y - 160y3 + 32y5. Die Lösung \P(y) für die Schwingungsquantenzahl n ergibt sich zu $n = Nne-y2/2Hn{y), (9.128a) wobei Nn der Normierungsfaktor ist. Man erhält ihn aus der Normierungsbedingung / &n2 dy = 1 zu 2 _ 1 /^ _.4 r~ 2/ /mö7 ^2= ^ /« mit ^=* / — (9.128b) Für die Eigenwerte der Schwingungsenergie ergibt sich als Quantisierungsbedingung aus der Bedingung für den Abbruch der Reihe mit (9.124c) En = hu)(n+]-} {n = 0,1,2,...). (9.128c) Das Spektrum der Energiezustände ist äquidistant. Der Summand +1/2 in der Klammer bedeutet, daß der quantenmechanische Oszillator im Unterschied zum klassischen auch im tiefsten energetischen Zustand mit n = 0 Energie besitzt, dieNullpunktsschwingungsenerqie.
566 9. Differentialgleichungen V(x)E(x)f Die Abb.9.21 zeigt eine graphische Darstellung des äquidistanten Spektrums der Energiezustände, die zugehörigen Wellenfunktionen % bis #5 sowie die Funktion der potentiellen Energie (9.123c). Die Punkte auf der Parabel der potentiellen Energie bezeichnen die Umkehrpunkte des klassischen Oszillators, die als Amplitude a = 1 2E aus der Energie E ¦ -rnußa2 berechnet werden. Die quantenmechanische Wahrscheinlichkeit, ein Teilchen im Intervall (x, x+dx) zu finden, ist durch dwqu = \&(x)\2 dx gegeben. Sie ist auch außerhalb dieser Punkte von Null verschieden. So Abbildung 9.21 liefert z.B. n = 1, also E = C/2)fkj, gemäß dwqx 2V^exp("A*2) dx, Maxima der Aufenthaltswahrscheinlichkeit bei - ±1 -+ /JL VA V rnu Für den entsprechenden klassischen Oszillator ergibt sich I 2E _ fW ' mu2 V mu' 2-max, kl — ^tß — =t\1 (9.128d) (9 128e) Die quantenmechanische Verteilungsdichte nähert sich für große Werte der Quantenzahl n in ihrem Mittelwert der klassischen. 9.2.4 Nichtlineare partielle Differentialgleichungen: Solitonen, periodische Muster und Chaos 9.2.4.1 Physikalisch—mathematische Problemstellung 1. Begriff des Solitons Solitonen — man spricht auch von solitären Wellen — sind physikalisch betrachtet impuls- oder auch stufenförmig lokalisierte Störungen eines nichtlinearen Mediums oder Feldes; die betreffende Energie ist auf ein enges Gebiet konzentriert Sie treten auf • • in Festkörpern, z.B. in anharmonischen Gittern, in JOSEPHSON-Kontakten, in Glasfasern und in quasi-eindimensionalen Leitern, • in Flüssigkeiten als Oberflächenwellen oder Spinwellen, • in Plasmen als LANGMUIR-Solitonen, • in linearen Molekülen, • in der klassischen und Quantenfeldtheorie. Solitonen haben sowohl Teilchen- als auch Welleneigenschaften; sie sind zu jedem Zeitpunkt örtlich lokalisiert, und der Bereich der Lokalisierung, bzw. der Punkt, um den herum die Welle lokalisiert ist, bewegt sich wie ein freies Teilchen; insbesondere kann es auch ruhen. Ein Soliton besitzt eine permanente Ausbreitungsstruktur: Auf Grund einer Balance zwischen Nichtlinearität und Dispersion ändern sich Form und Geschwindigkeit nicht. Mathematisch betrachtet, sind Solitonen spezielle Lösungen bestimmter nichtlinearer partieller Differentialgleichungen, die in Physik, Technik und angewandter Mathematik auftreten. Ihre Besonderheiten bestehen im Fehlen jeglicher Dissipation sowie darin, daß die nichtlinearen Terme nicht störungstheoretisch behandelt werden können. Wichtige Beispiele für Gleichungen mit Solitonenlösungen sind- a) Korteweg-de-Vries— (KdV)-Gleichung ut + 6uux 4- uxxx = 0, (9.129) b) nichtlineare Schrödinger-(NLS)-Gleichung i ut + uxx ± 2\u\2u = 0, (9.130)
9.2 Partielle Differentialgleichungen 567 c) Sinus-Gordon- (SG)-Gleichung utt - uxx + sinw = 0. (9.131) Mit x bzw. t als Index werden partielle Ableitungen bezeichnet, z.B. uxx = d2u/dx2 . In diesen Gleichungen wird der eindimensionale Fall betrachtet, d.h , es gilt u = u(x, t), wobei x die Ortskoordinate und t die Zeit repräsentieren. Die Gleichungen sind in skalierter Form angegeben, d.h., die beiden unabhängigen Variablen x und t sind hier dimensionslose Größen. Bei praktischen Anwendungen sind sie mit den für das jeweilige Problem charakteristischen, dimensionsbehafteten Größen (Länge und Zeit) zu multiplizieren. Analoges gilt für die Geschwindigkeit. 2. Wechselwirkung zwischen Solitonen Treffen zwei Solitonen, die sich mit verschiedenen Geschwindigkeiten bewegen, aufeinander, so tauchen sie nach einer Wechselwirkung wieder auf, als hätten sie sich ungestört durchdrungen, d.h , Form und Geschwindigkeit jedes Solitons bleiben asymptotisch erhalten, es tritt lediglich eine Phasenverschiebung auf. Zwei Solitonen können miteinander Wechsel wirken, ohne sich zu zerstören. Daher spricht man von elastischer Wechselwirkung. Letztere ist äquivalent mit der Existenz einer A^-Solitonen-Lösung, wobei TV die Anzahl der Solitonen ist. Bei der Lösung einer Anfangswertaufgabe zeigt sich, daß ein vorgegebener Anfangsimpuls u(x, 0) in Solitonen zerfällt, wobei deren Anzahl nicht von der Impulsform, sondern von der Impulsfläche /f^ u(x, 0) dx abhängt. 3. Periodische Muster und nichtlineare Wellen Solche nichtlinearen Erscheinungen treten in einer Reihe von klassischen dissipativen (d.h Reibung oder Dämpfung enthaltenden) Systemen auf, wenn eine äußere Kraft hinreichend groß ist Befindet sich z.B. eine Flüssigkeitsschicht im Gravitationsfeld, und wird sie von unten erwärmt, so entspricht die Temperaturdifferenz zwischen ihrem unteren und oberem Rand einer äußeren Kraft. Die höheren Temperaturen der unteren Schichten verringern deren Dichte und machen sie leichter als die oberen, so daß die Schichtung insgesamt instabil wird Bei hinreichend großer Temperaturdifferenz geht diese instabile Schichtung spontan in periodisch angeordnete Konvektionszellen über. Man spricht von Bi- furkation aus dem nur wärmeleitenden Zustand (ohne Konvektion) in die wohlgeordnete Rayleigh- BENARD-Konvektion. Eine Wegnahme der äußeren Kraft führt infolge der Dissipation zum Abklingen der Wellen (hier der zellularen Konvektion). Eine Verstärkung der äußeren Kraft stört die geordnete Konvektion bis hin zur turbulenten Konvektion (Chaos). Auch bei chemischen Reaktionen können derartige Phänomene auftreten Wichtige Beispiele für Gleichungen, die solche Phänomene beschreiben, sind: a) Ginsburg-Landau-(GGL)-Gleichung ut-u-(l + \b)uxx + A + \c)\u\2u = 0, (9 132) b) Kuramoto-Sivashinsky-(KS)-Gleichung ut + uxx + uxxxx + ux = 0. (9.133) Im Unterschied zu den oben genannten Gleichungen KdV, NLS und SG, die keine Dissipation enthalten, handelt es sich bei der GGL- und KS-Gleichung um nichtlineare dissipative Gleichungen. Neben raum-zeitlich periodischen Lösungen (nichtlineare Wellen) haben sie auch raum-zeitlich ungeordnete (chaotische) Lösungen Charakteristisch ist das Auftreten raum-zeitlicher Muster oder Strukturen einschließlich des Überganges zum Chaos. 4. Nichtlineare Evolutionsgleichungen Unter einer Evolutionsgleichung versteht man eine Gleichung, die die zeitliche Entwicklung einer physikalischen Größe beschreibt Beispiele für lineare Evolutionsgleichungen sind die Wellengleichung (s 9 2.3 2, S. 555), die Wärmeleitungsgleichung (s. 9.2.3.3, S. 556) und die SCHRÖDINGER-Gleichung (s 9 2.3 5,1., S. 557) Die Lösungen der Evolutionsgleichungen werden auch Evolutionsfunktionen genannt. Im Unterschied zu den linearen Evolutionsgleichungen enthalten die nichtlinearen Evolutionsgleichungen (9.129) bis (9.133) die nichtlinearen Terme uux, \u\2u, sin u und u\ Diese Gleichungen sind ausgenommen (9 132) parameterfrei Physikalisch betrachtet beschreiben nichtlineare Evolutionsgleichungen Strukturbildungen wie Solitonen (dispersive Strukturen) sowie periodische Muster und nichtlineare
568 9. Differentialgleichungen Wellen (dissipative Strukturen) 9.2.4.2 Korteweg-de-Vries-Gleichung 1. Auftreten Die KdV-Gleichung tritt auf bei der Behandlung von. Oberflächenwellen in flachem Wasser, anharmonischen Schwingungen in nichtlinearen Gittern, Problemen der Plasmaphysik und nichtlinearen elektrischen Netzwerken 2. Gleichung und Lösungen Die KdV-Gleichung für die Evolutionsfunktion u lautet ut + 6uux + uxxx = 0. (9 134) Sie hat die Soliton-Lösung u(x,t) ¦ 2cosh2 [±y/v(x - vt - <pj\ -2 0 2 x-vt-cp Abbildung 9.22 (9 135) Das KdV-Soliton (9.135) ist durch die zwei dimensionslosen Parameter (v > 0) und </? eindeutig bestimmt In Abb.9.22 ist v = 1 gewählt Ein typisch nichtlinearer Effekt besteht darin, daß die Solitongeschwindigkeit v die Amplitude und die Breite des Solitons bestimmt. KdV- Solitonen mit größerer Amplitude und geringerer Breite bewegen sich schneller als solche mit kleinerer Amplitude und größerer Breite Die Solitonphase ip beschreibt die Lage des Maximums des Solitons zur Zeit t = 0 Die Gleichung (9 134) besitzt auch N-Solitonenlösun- gen Eine solche N-Solitonenlösung läßt sich für t —? ±oo asymptotisch durch lineare Überlagerung von Ein- Solitonlösungen darstellen u(x,t) ~ ^2 un{x,t) • (9.136) Dabei ist jede Evolutionsfunktion un(x, t) durch eine Geschwindigkeit vn und eine Phase tp„ gekennzeichnet. Die Anfangsphasen <p~ vor der Wechselwirkung oder dem Stoßprozeß unterscheiden sich von den Endphasen nach dem Stoß ip+ , während die Geschwindigkeiten t>1} v2,. ., Vn keine Änderung erfahren, d.h., es handelt sich um eine elastische Wechselwirkung. Für TV = 2 besitzt (9.134) eine 2- Solitonenlösung. Sie läßt sich für endliche Zeiten nicht durch lineare Überlagerung darstellen und lautet mit kn = -y/vn und an = -y/v^(x - vnt - <pn) (n = 1,2). kje^ + /c|ea2 + (kx - AfcJe<Q1+a'> u(x,t) = 8- 2 + 1 (ki + k2f (fc2eai + k\ea>) 1 + eQi + ea* + [ -1 -1 ) e^+a^ ki +k>2 (9 137) Die Gleichung (9.137) beschreibt asymptotisch zwei für t —> — oo nicht wechselwirkende Solitonen mit den Geschwindigkeiten v\ = 4A:2 und v2 = 4k2, die nach einem Wechselwirkungsprozeß für t —? +oo wieder asymptotisch in zwei nichtwechselwirkende Solitonen mit denselben Geschwindigkeiten übergehen. Die nichtlineare Evolutionsgleichung wt + 6{wxJ + wxxx = 0 (9 138a)
9 2 Partielle Differentialgleichungen 569 hat mit w = -=r a)fur F(x,£) = l + eQ, eine Solitonlösung und b)für F(x,t) a = -y/v(x — v t — (p) 1 + eai + ea ki — k<2 Jai+a2) (9.138b) (9 138c) eine 2-Solitonenlösung. Mit 2wx = u ergibt sich aus (9.138a) die KdV-Gleichung (9.134). Die Gleichung (9.137) und der sich mit (9.138c) ergebende Ausdruck für w sind Beispiele für eine nichtlineare Superposition. Ersetzt man in (9.134) den Term +6uux durch — 6uux , so muß man die rechte Seite von (9.135) mit (—1) multiplizieren. Man spricht dann auch von einem Antisoliton. 9.2.4.3 Nichtlineare Schrödinger—Gleichung 1. Auftreten Die NLS-Gleichung tritt auf • in der nichtlinearen Optik, wo der Brechungsindex n von der elektrischen Feldstärke E abhängig ist, wie z.B. beim KERR-Effekt, bei dem n(E) = n0 + n2|E|2 mit no, n2 = const gilt, und • in der Hydrodynamik selbstgravitierender Scheiben, wo sie die Beschreibung von galaktischen Spiralarmen gestattet 2. Gleichung und Lösungen Die NLS-Gleichung für die Evolutionsfunktion u und ihre Solitonlösung lauten: \ut + uxx ± 2\u\2u = 0, (9.139) u(x,t) = 2rj exp(i[2£r + 4(£2-772)*-x]) cosh[2rj(x + 4£t - (f)} (9.140) '4' 6 x-vt-(p Hier ist u(x, t) komplex. Das NLS-Soliton ist durch die 4 dimensionslosen Parameter 77, £, ip und \ charakterisiert Die Einhüllende des Wellenpakets bewegt sich mit der Geschwindigkeit — 4£, die Phasengeschwindigkeit der eingehüllten Welle ist 2(t72 - £2)/£ Im Unterschied zum KdV-Soliton (9.135) können hier die Amplitude (über 77) und die Geschwindigkeit (über £) unabhängig voneinander gewählt werden. Die Abb.9.23 zeigt eine Darstellung des Realteiles von (9 140) mit v = —4£, 77 = 1/2 und { = 2/5 Im Falle von N wechselwirkenden Solitonen werden diese durch 4JV willkürlich wählbare Parameter charakterisiert. 77n, fn, <pn, Xn {n = 1,2,..., N). Abbildung 9.23 Falls die Solitonen verschiedene Geschwindigkeiten haben, zerfällt die N-Solitonenlösung asymptotisch für t ± 00 in eine Summe von N individuellen Solitonen der Form (9.140). 9.2.4.4 Sinus-Gordon—Gleichung 1. Auftreten Die SG-Gleichung entsteht aus der BLOCH-Gleichung für räumlich inhomogene quantenmechanische 2-Niveau-Systeme. Sie beschreibt die Ausbreitung • ultrakurzer Impulse in resonanten Lasermedien (selbstinduzierte Transparenz), • des magnetischen Flusses in großflächigen JOSEPHSON-Kontakten, d.h in Tunnelkontakten zwischen zwei Supraleitern und
570 9. Differentialgleichungen • von Spinwellen in supraflüssigem Helium-3 CHe). Die Solitonlösungen der SG-Gleichung können durch ein aus Pendeln und Federn bestehendes mechanisches Modell veranschaulicht werden Die Evolutionsfunktion geht stetig von 0 in einen konstanten Wert c über. Ausgehend vom englischen Wort „kink" für Stufe, nennt man daher die SG-Solüonen meist Kink-Solitonen Wenn umgekehrt die Evolutionsfunktion von dem konstanten Wert c nach 0 übergeht, werden sogenannte Antikink-Solitonen beschrieben. Mit Hilfe derartiger Lösungen können auch sich bewegende Domänenwände beschrieben werden. 2. Gleichung und Lösungen Die SG-Gleichung für die Evolutionsfunktion u lautet utt - uxx + sinw = 0 (9.141) Sie besitzt die folgenden Solitonlösungen. 1. Kink-Soliton u(x,t) = 4arctanexpG(x — x0 — vt)) , (9 142) 1 WM) wobei 7 = VT- : und -1 < v < +1 gilt. In Abb.9.24 ist das Kink-Soliton (9 142) der Gleichung (9.141) für v = 1/2 dargestellt. Das Kink- Soliton ist durch die zwei dimensionslosen Parameter v und Xo bestimmt, die Geschwindigkeit ist unabhängig von der Amplitude, die Zeit- und die Ortsableitung sind gewöhnliche lokalisierte Solitonen: Abbildung 9 24 = ux 27 (9 143) cosh y(x — Xo — vt) 2. Antikink-Soliton u(x,t) = 4 arctan exp(—7B; — xi — vt)) . (9.144) 3. Kink-Antikink-Soliton Mit v = 0 entsteht aus (9.142), (9 144) ein statisches Kink-Antikink- Soliton: u(x,t) = 4arctanexp(±7(x — x0)) (9 145) Weitere Lösungen von (9.141) sind: 4. Kink-Kink-Kollision sinh 72; u(x, t) = 4 arctan cosh *yvt 5. Kink-Antikink-Kollision [ 1 sinh jvt u(x, t) = 4 arctan [v cosh7a:J 6. Doppel- oder Breather-Soliton, auch Kink-Antikink-Dublett [ \/l — u2 sin ut u(x, t) = 4 arctan (9 146) (9.147) (9 148) ijj cosh Vi — u2x\ Die Gleichung (9.148) stellt eine stationäre Welle dar, deren Einhüllende mit der Frequenz uj moduliert ist. 7. Örtlich periodisches Kink-Gitter x — vt u(x, t) = 2 aresin ±sn kVT- + 7T (9 149a)
9.2 Partielle Differentialgleichungen 571 Zwischen Wellenlänge A und Gitterkonstante k besteht die Beziehung A = 4K(k)kVT^. (9.149b) Für k = 1, also A —> oo , ergibt sich u(x,t) = 4arctanexp(±7(x - vt)) , (9.149c) d.h wieder das Kink-Soliton (9.142) und das Antikink-Soliton (9.144) mit x0 = 0. Hinweis: sn x ist eine JACOBische elliptische Funktion mit dem Modul k und der Viertelperiode K (s 14.6.2,3., S. 727). snx = sin tp(x, k), (9.150a) siny?(x,fc) tt/2 x= f . q (9 150b) K(k)= f . , = . (9.150c) / yj(l-q2){l-k*q2) { Vl-^sm'e Die Gleichung (9.150b) geht aus A4.101b) (s. 14.6.2, S. 726) durch die Substitution sin^ = q hervor. Die Reihenentwicklung des vollständigen elliptischen Integrals ist als Gleichung (8.108) in 8.2.5,7., S. 479 angegeben. 9.2.4.5 Weitere nichtlineare Evolutionsgleichungen mit Solitonlösungen 1. Modifizierte Kd V-Gleichung ut ± ßu l*X ' '-''XXX — 0. (9.151) Die noch allgemeinere Gleichung (9.152) hat das Soliton (9.153) als Lösung . ut + upux + uxxx = 0 (9 152) w(^ t) : ±\v\(p+l)(p + 2) cosh2 y-py/\v\(x -vt- (^)J (9.153) 2. sinh-Gordon-Gleichung Utt — uxx 4- sinh u = 0. (9.154) 3. Boussinesq-Gleichung uxx - utt + (u2)xx + uxxxx = 0. (9.155) Sie tritt bei der Beschreibung nichtlinearer elektrischer Netzwerke als Kontinuumsnäherung der La- dungs-Spannungs-Beziehung auf. 4. Hirota-Gleichung ut + i3a\u\2ux + ßuxx + iauxxx + ö\u\2u = 0, aß = aS. (9.156) 5. Burgers-Gleichung ut — uxx-\-uux = 0. (9.157) Sie tritt bei der modellmäßigen Beschreibung der Turbulenz auf. Mit der HOPF-COLE-Transformation wird sie in die Diffusionsgleichung, also eine lineare Differentialgleichung, überfuhrt. 6. Kadomzev-Pedviashwili-Gleichung Die Gleichung (ut + 6uux + uxxx)x - uyy (9.158a) hat das Soliton d2 r 1 i i2l w(x, y, t) = 2— In — + \x 4- iky - 3k2t\ (9 158b) dx2 [k2 zur Lösung. Die Gleichung (9.158a) ist ein Beispiel für Solitonengleichungen mit einer größeren Zahl unabhängiger Variabler, z.B. zweier Ortsvariabler.
572 10 Variationsrechnung 10 Variationsrechnung 10.1 Aufgabenstellung 1. Extremum eines Integralausdrucks In der Differentialrechnung besteht eine wichtige Aufgabe darin, festzustellen, für welche x-Werte eine vorgegebene Funktion y{x) einen Extremwert hat In der Variationsrechnung lautet die entsprechende Frage: Für welche Funktionen nimmt ein bestimmtes Integral, dessen Integrand von dieser Funktion und deren Ableitungen abhängt, einen Extremwert an? In der Variationsrechnung wird demzufolge ein ganzer Funktionsverlauf y(x) gesucht, der einen Integralausdruck der Form b I[y] = J F(x,y(x),y'(x), ,y{n\x))dx A0 1) a zum Extremum macht, wenn y(x) eine bestimmte, genau charakterisierte Funktionenklasse durchläuft. Dabei können für die Funktionen y(x) und deren Ableitungen noch zusätzliche Bedingungen, sogenannte Rand- und Nebenbedingungen, gestellt werden. 2. Integralausdrücke der Variationsrechnung An Stelle der unabhängigen Variablen x können in A0.1) auch mehrere Variablen stehen. Die auftretenden Ableitungen sind dann partielle Ableitungen, und das Integral in A0.1) entspricht einem mehrfachen Integral In der Variationsrechnung werden hauptsächlich Aufgaben mit folgenden Integralausdrucken untersucht: b I[y] = JF{x,y(x)il/(x))dx1 A0.2) a b I[yuy2, • • •,2/n] = y F{x,2/iW, • • •,2/n(z),y[(x),...,y'n(x)) dx, A0 3) a b I[y] = y F(xt y(x),yf(x),. , y^(x)) dx , A0 4) o I[u] = F(x,y,u,ux,uy)dxdy. A0.5) n Die gesuchte Funktion ist u = u(x: y), und Q stellt einen ebenen Integrationsbereich dar. I[u] = /// F(x, y, z, u, ux,uy, uz) dx dy dz . A0 6) R Die gesuchte Funktion ist u = u(x, y, z), und R stellt einen räumlichen Integrationsbereich dar. Für die Lösungen eines Variationsproblems können zusätzliche Randbedingungen vorgegeben sein, die im eindimensionalen Fall an den Intervallrändern a und b bzw auf dem Rand des Integrationsgebietes Q. im zweidimensionalen Fall gelten sollen. Darüber hinaus können den Lösungen noch verschiedene Arten von Nebenbedingungen z.B. in Integralform oder als Differentialgleichung vorgeschrieben sein Ein Variationsproblem heißt von erster bzw. höherer Ordnung je nachdem, ob die Funktion F im Integralausdruck der Variationsaufgabe nur die erste Ableitung y' oder höhere Ableitungen y^ (n > 1) der Funktion y enthält. 3. Parameterdarstellung der Variationsaufgabe Ein Variationsproblem kann auch in Parameterdarstellung vorliegen. Für die Kurvendarstellung x = x(t), y = y(t) (a < t < ß) hat dann z B. der
10 2 Historische Aufgaben 573 Integralausdruck A0 2) die Form ß I[x,y} = J F{x{t),y(t),x{t),y(t)) dt A0.7) 10.2 Historische Aufgaben 10.2.1 Isoperimetrisches Problem Das allgemeine isoperimetrische Problem besteht darin, unter allen ebenen Flächenstucken mit vorgegebenem Umfang das flächengrößte zu bestimmen Die Lösung dieses Problems (ein Kreis mit dem vorgegebenen Umfang) soll auf die Königin DiDO zurückgehen, die der Sage nach bei der Gründung Karthagos nur soviel Land nehmen durfte, wie sie mit einer Stierhaut umschließen konnte. Sie schnitt die Haut in feine Streifen und legte sie zu einem Kreis zusammen Ein Spezialfall des allgemeinen isoperimetrischen Problems besteht in der Aufgabe, in einem kartesi- schen Koordinatensystem eine Verbindungskurve y = y(x) der Punkte A(a,0) und B(b,0) zu finden, die eine vorgegebene Länge / hat und mit der Verbindungsstrecke AB die größte Fläche umschließt (Abb.10.1). Die mathematische Formulierung lautet: Man bestimme eine einmal stetig differenzier- bare Funktion y{x), für die I[y] = / y(x) dx = max a gilt und die die Nebenbedingung b G[y} = Jyjl + y'2(x)dx = l a sowie die folgenden Randbedingungen erfüllt: y(a) = y(b) = 0. A0.8a) A0.8b) A0.8c) 0A(a,o) B(b,o) x Abbildung 10 1 P0(xo/ Yo) 0 x0 x Abbildung 10.2 10.2.2 Brachistochronenproblem Das Brachistochronenproblem wurde 1696 von J. BERNOULLI formuliert und beinhaltet die folgende Aufgabe: Der in einer vertikalen x,y-Ebene liegende Punkt Po(xo,yo) soll mit dem Koordinatenursprung durch eine Kurve y = y(x) so verbunden werden, daß ein längs dieser Kurve sich bewegender Massepunkt allein unter dem Einfluß der Schwerkraft in der kürzesten Zeit von P0 zum Ursprung gelangt (Abb. 10.2). Mit der Formel für die Fallzeit T ergibt sich die folgende mathematische Formulierung- Man bestimme eine einmal stetig differenzierbare Kurve y = y(x), für die T[y) = f VTT] yj2g(y0 - y) dx = min A0.9)
574 10. Variationsrechnung gilt (g Fallbeschleunigung) und die die Randbedingungen y@) = 0, y{x0) = yo A0.10) erfüllt. Man beachte, daß in A0 9) für x = x0 eine Singularität auftritt. 10.3 Variationsaufgaben mit Funktionen einer Veränderlichen 10.3.1 Einfache Variationsaufgabe und Extremale Als einfache Variationsaufgabe soll die folgende Aufgabe bezeichnet werden. Es sind Extremwerte von Integralausdrucken der Form b I[y} = JF(x,y(x),y\x))dx A0.11) a zu bestimmen, wenn y(x) alle zweimal stetig differenzierbaren Funktionen, die den Randbedingungen y(a) = A und y(b) = B genügen, durchläuft. Die Werte a, b und A, B sowie die Funktion F sind gegeben. Der Integralausdruck A0.11) ist ein Beispiel für ein sogenanntes Funktional, das dadurch gekennzeichnet ist, daß es jeder Funktion y(x) aus einer bestimmten Funktionenklasse eine reelle Zahl zuordnet. Nimmt das Funktional I[y] von A0.11) z.B für die Funktion yo(x) ein relatives Maximum an, dann gilt im > m (io i2) beim Vergleiche mit allen anderen zweimal stetig differenzierbaren Funktionen y , die den Randbedingungen genügen Die Kurve y = yo(x) wird als Extremale bezeichnet. Manchmal werden auch alle Lösungen der EULERschen Differentialgleichung der Variationsrechnung als Extremalen bezeichnet. 10.3.2 Eulersche Differentialgleichung der Variationsrechnung Für die Lösung der einfachen Variationsaufgabe erhält man eine notwendige Bedingung auf folgende Weise: Zur Extremalen y$(x), die durch A0 12) charakterisiert ist, konstruiert man sogenannte Vergleichsfunktionen y{x)=yo{x) + er}(x) A0.13) mit einer zweimal stetig differenzierbaren Funktion r](x), die den speziellen Randbedingungen rj(a) = 7](b) = 0 genügt. Mit e wird ein reeller Parameter bezeichnet. Setzt man A0 13) in A0 11) ein, dann erhält man an Stelle des Funktionais I[y] die von e abhängige Funktion b I(e) = jF(x,y0 + eri1i/0 + eri,)dx1 A0 14) a und die Forderung, daß y(x) das Funktional I[y] zu einem Extremum macht, geht in die Bedingung über, daß I(e) als Funktion von e für e = 0 einen Extremwert hat. Aus einer Variationsaufgabe wird dadurch eine Extremwert aufgäbe, für die die folgende notwendige Bedingung gelten muß: ^ = 0 für e = 0. ' A0 15) Unter der Voraussetzung, daß der Integrand F als Funktion von drei unabhängigen Variablen entsprechend oft partiell differenzierbar ist, erhält man mit Hilfe seiner TAYLOR-Entwicklung (s. 7.3.3.3, S. 434) m = J dF dF F{x, i/o, y'o) + 0-(z, Vo, y'o)t rj + —{x,y0, y'0)e rf + 0(e2) dx. A0 16)
10.3 Variationsauf gaben mit Funktionen einer Veränderlichen 575 Die notwendige Bedingung A0.15) führt auf br dF br dF und daraus folgt durch partielle Integration und Berücksichtigung der Randbedingungen für rj(x). /'(f-sH^ii*-0- (io-,8) i(%)-° dx \dy'j Aus Stetigkeitsgründen und da das Integral in A0.18) für jede der in Frage kommenden Funktionen T)(x) verschwinden soll, muß dF_ dy dx ' gelten. Die Gleichung A0.19) stellt eine notwendige Bedingung für die einfache Variationsaufgabe dar und heißt EuLERsc/ie Differentialgleichung der Variationsrechnung. Die Differentialgleichung A0.19) kann man auch in der Form ^L - °2F - &F ' - ^L " - o A0 20) dy dxdy' dydy' dy'2 schreiben. Es handelt sich um eine gewöhnliche Differentialgleichung 2. Ordnung, wenn Fy'y> ^ 0 ist. Die EuLERsche Differentialgleichung vereinfacht sich in folgenden Spezialfällen- 1. F(x, y, y') = F(y'), d.h., x und y treten nicht auf. Dann erhält man an Stelle von A0.19): -^ = 0 A0 21a) und ~ | -^- ) = 0 A0.21b) dy dx \dy'J 2. F(x,y,yf) = F(y, y'), d.h., x tritt nicht auf. Man betrachtet d („ ,dF\ dF , dF „ „dF ,d (dF\ , (dF d (dF\\ ,^nn x d~x (F~ylü) = ^y + Wy ~VW ~yTx (W) =y(-dy-Tx [W)) A022a) und erhält wegen A0.19) ^(F"^)=0, A0,22b) dh' F~y'W = C (c = const) (ia22c) als notwendige Bedingung für die Lösung der einfachen Variationsaufgabe im Falle F = F(y,y'). ¦ A: Für die kürzeste Verbindungslinie zweier Punkte Pi(a, A) und P2{b, B) in der x, ?/-Ebene muß gelten. I[y] = / \A + V'2 dx = min- A0.23a) Ja ¦(£)-&£=¦-• Aus A0.21b) folgt für F = F(y') = y/TTy17 dx\dy'J (^/TTT1N also y" = 0, d.h., die kürzeste Verbindungslinie ist die Gerade. ¦ B: Läßt man einen Kurvenbogen y(x), der die Punkte Pi(a,A) und P2{b,B) verbindet, um die x-Achse rotieren, dann entsteht eine Mantelfläche mit dem Flächeninhalt I[y] = 2?r I yyjl + y'2 dx. A0.24a) Ja
576 10 Variationsrechnung V = c\ Für welche Kurve y(x) ist der Flächeninhalt am kleinsten? Mit F = F(y, y') = 2nyy/l + y'2 folgt aus A0.22c). y = T&y/l + y'2 oder y'2 = (^-j — 1 mit C\ = r£- . Diese Differentialgleichung läßt sich durch Trennung der Variablen (s. 9 1.1.2,1., S 506) bzw. 9.2.2.3,1., S. 543 lösen, und man erhält cosh ( h c2) (ci, c2 = const), A0 24b) die Gleichung der sogenannten Kettenlinie (s 2.15.1, S. 108) Die Konstanten C\ und c2 sind mit Hilfe der Randbedingungen y(a) = A und y(x) = B zu bestimmen. Das erfordert die Lösung eines nichtlinearen Gleichungssystems (s 19.2.2, S. 923), für dessen Lösbarkeit weitere Untersuchungen notwendig sind 10.3.3 Variationsaufgaben mit Nebenbedingungen Darunter versteht man im wesentlichen isoperimetrische Probleme (s. 10.2.1, S. 573): Der einfachen Variationsaufgabe (s. 10.3 1, S 574), die durch das Funktional A0 11) gekennzeichnet ist, wird zusätzlich eine Nebenbedingung der Form b f G(x, y(x),y'(x))dx = 1 (/ = const) A0 25) a auferlegt, wobei die Konstante / und die Funktion G gegeben sind. Eine Methode zur Lösung solcher Probleme geht auf LAGRANGE zurück (Extremwerte mit Nebenbedingungen in Gleichungsform s auch 6 2 5.6, S. 419). Man setzt H(x,y(x),y'(x), A) = F(x,y(x)tl/(x)) + A(G(x}y(x),y'(x)) - l) , A0.26) wobei A ein Parameter ist, und behandelt jetzt die Aufgabe b H{x, y(x), y'(x), A) = extrem', A0.27) /' also eine Extremwertaufgabe ohne Nebenbedingung. Die zugehörige Eulersche Differentialgleichung lautet- dH d (dH\ n /inooX ^-TX(W)=0- A028) Ihre Lösung y = y(x, A) hängt noch von dem Parameter A ab, der durch Einsetzen von y(x, X) in die Nebenbedingung A0 25) bestimmt werden kann ¦ Für das isoperimetrische Problem A0.2 1) erhält man H{x,y(x),y'(x),X) = y + Xsjl + y'2 . A0 29a) Da in H die Variable x nicht vorkommt, erhalt man an Stelle der EuLERschen Differentialgleichung A0.28) analog zu A0.22c) die Differentialgleichung y + xJl + y12 - , V = ci bzw. ya = ^ ——^- (Cl = const), A0 29b) Vl + J/'2 Cl " y deren Lösung die Kreisschar (x - c2J + (y- ciJ = A2 (ci, c2, A const) A0.29c) darstellt. Die Werte c\, c2 und A sind aus den Bedingungen y(a) = 0 , y(b) = 0 und der Forderung, daß der Kurvenbogen zwischen A und B die vorgeschriebene Länge / hat, zu bestimmen. Für A ergibt sich
10.3 Variationsaufgaben mit Funktionen einer Veränderlichen 577 eine nichtlineare Gleichung, die iterativ durch ein geeignetes Näherungsverfahren gelöst werden muß. 10.3.4 Variationsaufgaben mit höheren Ableitungen Es werden zwei Aufgabenklassen betrachtet. 1. F = F(x, y, y', y") : Die Variationsaufgabe lautet- b I[y] = I F(x, y, y', y") dx = extrem! A0.30a) a mit den Randbedingungen y{a) = A, y(b) = B, y'(a) = Ä, y\b) = B', A0.30b) wobei die Zahlenwerte a, 6, A, B, A' und B' sowie die Funktion F gegeben sind. Analog zu Abschnitt 10.3.2 werden Vergleichsfunktionen y(x) = yo(x) + er]{x) niit 77@) = r](b) = rf(a) = rf(b) = 0 eingeführt, und man erhält die EvLERsche Differentialgleichung dF d fdF\ d2 (dF\ n ,inoi, ^-Tx(w) + d^W)=0 A0-31) als notwendige Bedingung für die Lösung des Variationsproblems A0.30a). Die Differentialgleichung A0.31) stellt eine Differentialgleichung 4. Ordnung dar Ihre allgemeine Lösung enthält 4 willkürliche Konstanten, die mit Hilfe der Randbedingungen A0.30b) bestimmt werden können. ¦ Für das Problem I[y] = [ (y - ay'2 - ßy2)dx = extrem! Jo mit gegebenen Konstanten a und ß gilt F = F(y, y', y") - Fy, = -2y', Fy,, = 2y", £ (Fy) = -2y", £, (Fv„) = chung lautet: yM+a>l/'-ßy = 0. A0 32a) = y - ay'2 - ßy2 . Daraus folgt Fy = -2ßy, -2?/4), und die EuLERsche Differentialglei- A0.32b) Das ist eine lineare Differentialgleichung 4. Ordnung mit konstanten Koeffizienten (s. S. 518). 2. F = F(x, y, y',..., y^) : In diesem allgemeinen Fall, bei dem das Funktional I[y] der Variationsaufgabe von den Ableitungen der gesuchten Funktion y bis zur Ordnung n (n> 1) abhängen soll, lautet die zugehörige EuLERsc/ie Differentialgleichung dF d (dF\ d2 (dF\ dn ( dF \ dy dx [dy'J + dx* \dy») '"+ ( 1} d^ [djW) ~ ' ( } deren Lösung Randbedingungen analog zu A0 30b) bis zur Ordnung n — 1 erfüllen müssen. 10.3.5 Variationsaufgaben mit mehreren gesuchten Funktionen Das Funktional der Variationsaufgabe habe die Form b ^[2/1,2/2, • ,2/n] = J F{x,yuy2,-..,yn,y'i,y'2,-'-,yn)dxi A0.34) a wobei die gesuchten Funktionen y\(x), 2/2(^O, • • •, yn(x) für x = a und x = b vorgegebene Werte annehmen sollen. Man wählt n zweimal stetig differenzierbare Vergleichsfunktionen y%(x) = yi0(x) + €i7]i(x) (i = 1,2,..., n), A0.35)
578 10. Variationsrechnung wobei die Funktionen r)i(x) in den Randpunkten verschwinden sollen Mit A0.35) geht A0 34) in /(e^ e2, .. , en) über, und aus den notwendigen Bedingungen _^ = 0 (« = 1,2,. .,n) A0 36) für Extremwerte von Funktionen von mehreren Veränderlichen ergeben sich die n EULERschen Differentialgleichungen dF__d_ (dF\ dF_ _ d_ fdF\ _ dF_ _ _^ f dF\ dyi dx \dy[J ' dy2 dx\dy'2) ' ' dyn dx\dy'n) deren Lösungen yi{x), y2(x),..., yn(x) die vorgegebenen Randbedingungen erfüllen müssen. 10.3.6 Variationsaufgaben in Parameterdarstellung Bei manchen Variationsaufgaben ist es zweckmäßig, die Extremale nicht in der expliziten Form y = y(x) anzugeben, sondern von deren Parameterdarstellung x = x{t), y = y(t) (ti<t< t2) A0.38) auszugehen, wobei t\ und t2 die den Punkten (a, A) und F, B) entsprechenden Parameterwerte sein sollen. Die einfache Variationsaufgabe (s. 10.3.1, S. 574) lautet dann I[x,y] = f F(x{t),y(t),x(t),y(t))dt = extrem! A0.39a) mit den Randbedingungen x(t1) = ai x(t2) = b, y(t1) = A, y(t2) = B A0.39b) Mit x und y werden, wie bei der Parameterdarstellung üblich, die Ableitungen von x und y nach dem Parameter t bezeichnet. Das Variationsproblem A0.39a) ist nur dann sinnvoll, wenn der Wert des Integrals von der Parameterdarstellung der Extremale unabhängig ist. Es gilt: Damit das Integral in A0.39a) von der Parameterdarstellung der Kurve, die die Punkte (a, A) und F, B) verbindet, unabhängig ist, muß F eine positiv homogene Funktion vom Homogenitätsgrad 1 (s 2.18 2.5,4., S. 124) bezüglich x und y sein, d h , es muß gelten- F(x, i/, fix, fiy) = ßF(x, y, x, y) (/* > 0). A0.40) Da die Variationsaufgabe A0.39a) als Spezialfall von A0.34) aufgefaßt werden kann, lauten die zugehörigen EULERschen Differentialgleichungen dF d (dF\ n dF d (dF\ n /1rt , , Diese sind nicht unabhängig voneinander, sondern äquivalent der sogenannten WEiERSTRASSschen Form der EULERschen Differentialgleichung. U-l£+M(^-^)=omit (ia42a) m - —— - -1-ltJL - L^L y2 dx2 xydxdy x2 dy2 Ausgehend von der Berechnung des Krümmungsradius R einer in Parameterdarstellung gegebenen Kurve (s. 3.6 1 1, S 232), erfolgt die Berechnung des Krümmungsradius der Extremalen unter Berücksichtigung von A0.42a) gemäß
10 4 Variationsaufgaben mit Funktionen von mehreren Veränderlichen 579 R = (x2 + y2f2 M (x2 + y2) ,2^3/2 A0.42c) xy-xy ¦ Das isoperimetrische Problem A0.8a bis 10.8c) (s. 10.2.1, S. 573) lautet in Parameterdarstellung I[x, y}= f2 y{t)x{t)dt = max A0.43a) mit G[x, y] = f* yjx2(t)+ y2(t)dt = 1 A0 43b) Diese Variationsaufgabe mit Nebenbedingung geht gemäß A0 26) mit H = H(x< y, x, y) = yx + Xy/x2 + y2 A0.43c) in eine Variationsaufgabe ohne Nebenbedingung über Man sieht, daß H die Bedingung A0.40) erfüllt, also eine positiv homogene Funktion vom Grade 1 ist. Weiterhin gilt M = ±HXI= ... A2.3/2, Hxv = l, Hxi = 0, A0.4M) y [x -\- y ) so daß man aus A0.42c) für den Krümmungsradius R = |A| erhält. Da A konstant ist, sind die Extre- malen Kreise 10.4 Variationsaufgaben mit Funktionen von mehreren Veränderlichen 10.4.1 Einfache Variationsaufgabe Eine der einfachsten Aufgaben mit Funktion von mehreren Variablen stellt das folgende Variationsproblem für ein Doppelintegral dar I[u] = // F(x,y,u(x,y),ux, uy) dx dy = extrem' x A0 44) G Dabei soll die gesuchte Funktion u = u(x, y) auf dem Rand r des Bereiches G gegebene Werte annehmen. Analog zu 10.3 2, S 574 werden Vergleichsfunktionen der Form u(x, y) = uo(x, y) + erj(x, y) A0.45) angesetzt, wobei uo(x,y) eine Lösung der Variationsaufgabe A0 44) ist und die vorgegebenen Randwerte annimmt, während n(x,y) die Bedingung rj(x, y) = 0 auf dem Rand T A0.46) erfüllt und wie Uo(x, y) entsprechend oft partiell differenzierbar ist. Die Größe e ist ein Parameter Durch u = u(x, y) wird eine Fläche beschrieben, die der Lösungsfläche uo{x, y) benachbart ist. Mit A0 45) geht I[u] in I(e) über, d.h., aus der Variationsaufgabe A0.44) wird eine Extremwertaufgabe, die die notwendige Bedingung ^ = 0 für e = 0 A0 47) de erfüllen muß. Daraus folgt die EuhERsche Differentialgleichung dF d (dF\ d (dF du dx \dux) dy \duy) als notwendige Bedingung für die Lösung der Variationsaufgabe A0 44) ¦ Eine unbelastete Membran, die am Rand F eines Bereiches G der x, y-Ebene eingespannt ist, überdeckt eine Fläche mit dem Inhalt h = ff dxdy. A0.49a)
580 10. Variationsrechnung Wird die Membran durch eine Belastung so deformiert, daß jeder Punkt eine Auslenkung u = u(x, y) in -^-Richtung erfährt, dann wird ihr Flächeninhalt nach der Formel h = ff yjl + ul + uldxdy A0.49b) G berechnet. Linearisiert man den Integranden in A0.49b) nach Taylor, dann erhält man die Beziehung h*h + \ff(ul + u2y) dx dy. A0.49c) G Für die potentielle Energie U der deformierten Membran gilt U = a(I2-Il) = ^ff(u2x + ul)dxdy, A0 49d) G wobei die Konstante o als Spannung der Membran bezeichnet wird. Auf diese Weise entsteht das sogenannte DiRiCHLETsc/ie Variationsproblem: Die Funktion u — u(x, y) ist so zu bestimmen, daß sie das Funktional I[u] = ff (u2x + ufj dx dy A0.49e) G zu einem Extremum macht und auf dem Rand T des ebenen Gebietes G verschwindet. Die zugehörige EuLERsche Differentialgleichung lautet d2u d2u ä? + ^ = °- A0-49f) Es handelt sich um die LAPLACEsche Differentialgleichung für Funktionen von zwei Variablen (s. 13.5 1, S. 691). 10.4.2 Allgemeinere Variationsaufgaben Es sollen zwei Verallgemeinerungen der einfachen Variationsaufgabe betrachtet werden. 1. F = F(x, y, u(x, i/), ux, uy, uxx, uxy, uyy) Das Funktional der Variationsaufgabe hängt von partiellen Ableitungen höherer Ordnung der gesuchten Funktion u(x,y) ab. Im vorliegenden Fall, in dem die partiellen Ableitungen bis zur 2. Ordnung einschließlich auftreten, lautet die EuLERsche Differentialgleichung: ^_ —f—^ °2 ( dF) \ ^ ( dF ) d2 ( dF)==0 A0r dux) dy \duy) dx2 \duxxJ dxdy \duxy) dy2 \duyyj 2. F = F{xu x2,..., xn, u(xu ..., xn), uXl,...,uXn) Im Falle einer Variationsaufgabe, bei der n unabhängige Variablen Xi,x2,... ,xn auftreten, lautet die EuLERsche Differentialgleichung: du t^xdxk \duXk) 10.5 Numerische Lösung von Variationsaufgaben Zur praktischen Lösung von Variationsproblemen werden im wesentlichen zwei Lösungswege verwendet. 1. Lösung der Eulerschen Differentialgleichung und Anpassung der gefundenen Lösung an die Randbedingungen Allerdings wird die exakte Lösung der EuLERschen Differentialgleichung nur in den einfachsten Fällen möglich sein, so daß man numerische Methoden zur Lösung von Randwertaufgaben bei gewöhnlichen
10 5 Numerische Lösung von Variationsaufgaben 581 bzw. partiellen Differentialgleichungen einsetzen muß (s. 19.5, S. 938 bzw. 20.1, S. 982). • 2. Direkte Methoden Direkte Methoden gehen unmittelbar von der Variationsaufgabe aus und verwenden nicht die Eu- LERsche Differentialgleichung. Das höchstwahrscheinlich älteste und bekannteste Verfahren dieser Art stellt das Ritz -Verfahren dar Es gehört zu den sogenannten Ansatzverfahren, die zur genäherten Lösung von Differentialgleichungen verwendet werden (s. 19.4.2.2, S 936 bzw. 19.5.2, S. 939), und soll an dem folgenden einfachen Beispiel demonstriert werden. ¦ Das isoperimetrische Problem / y'2(x) dx = extrem! A0.52a) bei / y2(x)dx = 1 und j/@) = y(l) = 0 A0 52b) Jo Jo ist numerisch zu lösen. Das zugehörige Variationsproblem ohne Integralnebenbedingung lautet gemäß 10.3.3, S. 576. I[y] = f [y,2(x)dx - Xy2{x)] = extrem! A0.52c) Als Ansatz für die Näherungslösung wird y(x) = axx(x - 1) + a2x2(x - 1) A0.52d) gewählt. Die beiden Ansatzfunktionen x(x — l) und x2(x — 1) sind linear unabhängig und erfüllen beide die Randbedingungen. Mit A0.52d) geht A0.52c) in /(ai,ai) = gfl? + ^a2 + 5ölß2 ~ A (^ai + y^a2 + 55öia2J A0 52e) über, und die notwendigen Bedingungen jß- = jU- = 0 ergeben das homogene lineare Gleichungssystem (H)-G-a)—¦ (i-s)-*(ä-m)—¦ Dieses System hat nichttriviale Lösungen, wenn die Koeffizientendeterminante verschwindet. Daraus folgt: A2-52A +420 = 0, d.h. Ai = 10,A2 = 42 A0.52g) Für A = Ai = 10 erhält man aus A0 52f) a2 = 0, a\ beliebig, so daß die zu Ai = 10 gehörende, normierte Lösung lautet: 3/ = 5,48x(a;-l) A0.52h) Zum Vergleich kann man die zur Variationsaufgabe A0 52f) gehörende EULERsche Differentialgleichung aufstellen. Man erhält die Randwertaufgabe j/' + Aj/ = 0 mit y@) = y(l)=0 A0 52i) mit den Eigenwerten Afc = /c27r2 (k = 1,2,...) und den Eigenlösungen y^ = Ck sin kirx . Für den Fall k = 1, d.h. Ai = 7T2 « 9,87, ergibt sich die normierte Eigenlösung y = V2sinirx, A0 52j) deren Verlaufsich nur unwesentlich von dem der Näherungslösung A0.52h) unterscheidet. Hinweis: Beim heutigen Stand der Computer- und Software-Entwicklung sollte man zur numerischen Lösung von Variationsproblemen vor allem die Methode der finiten Elemente (FEM) einsetzen. Die Grundzüge dieser Methode werden in 19.5.3, S. 940 bei der numerischen Behandlung von Differentialgleichungen beschrieben Dort wird der Zusammenhang zwischen Differential- und Variationsgleichungen, der z.B. durch EULERsche Differentialgleichungen oder Bilinearformen gemäß A9.145a,b) vermittelt wird, ausgenutzt. Auch die Gradientenverfahren, wie sie zur numerischen Behandlung von nichtlinearen Optimierungs-
582 10. Variationsrechnung aufgaben (s 18.2.7, S. 898) verwendet werden, können zur numerischen Lösung von Variationsaufgaben eingesetzt werden. 10.6 Ergänzungen 10.6.1 Erste und zweite Variation Bei der Herleitung der EULERschen Differentialgleichung mit Hilfe von Vergleichsfunktionen (s. 10 3 2, S. 574) wurde die TAYLOR-Entwicklung des Integranden von b I(e) = j F(x, y0 4- ery, y'0 + er/) dx A0.53) o nach den bezüglich e linearen Gliedern abgebrochen. Berücksichtigt man auch die quadratischen Glieder, dann erhält man rr1H' rih I dx I{e)-I{0) =ej ^(x,y0,y'0)r) + ^(x,j/0,l/iW 2 ° d2F d2F d2F Bezeichnet man als 1. Variation 61 des Funktionais I[y] den Ausdruck b i 51: t dF. M dF. ,. ,' 0-fo 2/o, y0)v + qj(x^^ Vo)v 2. Variation (S2/ des Funktionais I[y] den Ausdruck d2F, ,, 2 n a2F , ,. , d2F, ,. ,2 0-2-(^2/o,2/o>7 +2^77(^2/o,2/0m +^-72(^2/o,y0O? A0 54) dx und als A0.55) dx, A0 56) /(e) - 7@) &e5I+^-62I. A0 57) Mit Hilfe dieser Variationen lassen sich die verschiedenen Optimalitätsbedingungen für das Funktional I[y] formulieren (s. [10.6]) 10.6.2 Anwendungen in der Physik Die Variationsrechnung spielt in der Physik eine entscheidende Rolle So kann man die Grundgleichungen der NEWTONschen Mechanik aus einem Variationsprinzip herleiten und zur Jacobi-Hamilton- schen Theorie gelangen, aber auch in der Atomtheorie und der Quantenphysik hat die Variationsrechnung große Bedeutung. Dabei zeigte sich, daß eine Erweiterung und Verallgemeinerung der klassischen mathematischen Begriffe unbedingt notwendig ist. Deshalb muß heute die Variationsrechnung im Rahmen moderner mathematischer Disziplinen wie z.B. der Funktionalanalysis und der Optimierung betrachtet werden. In den voranstehenden Abschnitten konnte lediglich ein Einblick in den klassischen Teil der Variationsrechnung gegeben werden (s. [10.3], [10.4], [10.6]). und man kann dann schreiben: tesi + ^fii.
583 11 Lineare Integralgleichungen 11.1 Einführung und Klassifikation 1. Definitionen Unter einer Integralgleichung versteht man eine Gleichung, bei der eine zu bestimmende Funktion auch im Integranden eines Integrals auftritt. Für die Behandlung von Integralgleichungen gibt es keine einheitliche Vorgehens weise. Lösungsverhalten sowie Lösungsverfahren hängen von der speziellen Gestalt der Integralgleichung ab. Ist die gesuchte Funktion in allen Termen nur linear enthalten, dann spricht man von einer linearen Integralgleichung. Die allgemeine Form einer linearen Integralgleichung lautet: b(x) g(x)<p(x) = f(x) + \ J K{x,y)ip(y)dy, c<x<d. A11) a(x) Die Funktion ip(x) ist zu bestimmen, die Funktion K(x, y) heißt Kern der Integralgleichung und f(x) ihre Störfunktion. Diese Funktionen können auch komplexe Werte annehmen. Verschwindet die Funktion f(x) in dem betrachteten Bereich, d.h., ist f(x) = 0, dann ist es eine homogene Integralgleichung, andernfalls eine inhomogene Die Größe A ist ein im allgemeinen komplexwertiger Parameter. Zwei Spezialfälle von A11) haben besondere Bedeutung Sind die Integrationsgrenzen unabhängig von x, also konstante Größen, d.h. a(x) = a und b(x) = b, dann handelt es sich um eine FREDHOLMsche Integralgleichung A1 2a), A1.2b). lsta(x) = aundb(x) = x , so spricht man von einer VOLTERRAschen Integralgleichung A1.2c), A1.2d). Kommt die zu ermittelnde Funktion (p(x) nur unter dem Integral vor, d h ist g(x) = 0 , dann liegt eine Integralgleichung 1. Artvox A1.2a), A1.2c). Eine Integralgleichung 2. Artist durch g(x) = 1 gekennzeichnet A1 2b), A1 2d) b b 0 = f(xy+\JK(x,yMy)dy, A1.2a) <p(x) = f(x) + A f K{x,y)ip(y)dy, A1.2b) a a x x 0 = f(x) + A j K(x, y)<p(y) dy, A1.2c) <p(x) = f(x) + A f K(x, y)tp(y) dy A1.2d) a a 2. Zusammenhang mit Differentialgleichungen Es führen relativ wenige physikalische oder mechanische Aufgabenstellungen direkt auf eine Integralgleichung. Häufiger sind derartige Probleme mittels Differentialgleichungen beschreibbar Die Bedeutung der Integralgleichungen ist in erster Linie darin zu sehen, daß sich eine Reihe von Differentialgleichungen einschließlich der zugehörigen Rand- und Anfangsbedingungen in eine Integralgleichung überführen lassen ¦ Aus der Anfangswertaufgabe y'{x) = f(x, y) mit x > x0 und y(xo) = yo entsteht durch Integration in den Grenzen von x0 bis x y(x) = y0+ rm,y(Z))d£. A1.3) Jxq Die gesuchte Funktion y(x) tritt hier sowohl auf der linken Seite der Gleichung als auch im Integranden auf Die Integralgleichung A1 3) ist linear, wenn die Funktion /(£,y(£)) die Form /(£,r?(£)) = a@ " 2/@ + &@ nat' d-h-' die zugrundeliegende Differentialgleichung ist ebenfalls linear. Hinweis: In diesem Kapitel 11 werden nur Integralgleichungen 1. und 2. Art vom FREDHOLMschen und VOLTERRAschen Typ sowie einige singulare Intgralgleichungen betrachtet.
584 11 Lineare Integralgleichungen 11.2 Fredholmsche Integralgleichungen 2. Art 11.2.1 Integralgleichungen mit ausgearteten Kernen Wenn der Kern K(x,y) einer Integralgleichung eine Summe endlich vieler Produkte zweier Funktionen ist, wobei jeweils die eine Funktion nur von x und die andere nur von y abhängt, so spricht man von einem ausgearteten Kern oder einem Produktkern. 1. Lösungsansatz im Falle von Produktkernen Die Auflösung FREDHOLMscher Integralgleichungen 2 Art mit ausgearteten Kernen führt auf ein endlich dimensionales lineares Gleichungssystem. Man betrachte die Integralgleichung 6 ip(x) = f(x) + \jK(x,y)<p(y)dy mit A14a) K(x, y) = Qi(a;)A(j/) + a2(x)ß2(y) + . + an(x)ßn(y). A1 4b) Die Funktionen a\(x),.. , an(x) und ß\(x),. ., ßn(x) seien in dem Intervall [a, b) definiert und dort als stetig vorausgesetzt. Weiterhin sollen die Funktionen a.\(x),. ., an(x) voneinander linear unabhängig sein, d.h., die Beziehung £>*<**(*) = 0 A15) fc=i mit konstanten Koeffizienten ck ist nur mit C\ = c2 = ... = cn = 0 für alle x aus [a, b] erfüllt. Aus A1.4a) und A1 4b) folgt: b b ip{x) = f(x) + Aai(x) J ßi(y)<p(y) dy + ... + Xan(x) f ßn(y)<p(y) dy. A1 6a) a a Die auftretenden Integrale hängen nicht mehr von der Variablen x ab, sind also gewisse konstante Werte, die mit Ak bezeichnet werden sollen: 6 Ak = Jßk(y)<p(y)dy, k = l,.. ,n. A16b) a Die Lösungsfunktion (p(x) setzt sich, falls sie existiert, additiv aus der Störfunktion f(x) und einer Linearkombination der Funktionen ai(x),. , an(x) zusammen (p(x) = f(x) + XAiai(x) + XA2a2{x) + ... + XAnan(x). A1 6c) 2. Bestimmung der Ansatzkoeffizienten Die Koeffizienten j4i, . ., An können auf folgende Weise bestimmt werden. Die Gleichung A1.6c) wird mit ßk{x) multipliziert und anschließend bezüglich x in den Grenzen von a bis b integriert: b b b b Jßk{x)ip{x)dx = f ßk(x)f(x)dx + XAX f ßk{x)a!{x) dx + .. + XAn f ßk(x)an{x) dx. A1.7a) a a a a Die linke Seite dieser Gleichung ist nach A1.6b) gleich Ak . Mit den Abkürzungen b b h= ßk(x)f(x)dx und ckj = ßk(x)aj(x) dx A1 7b) a a erhält man für k = 1,..., n: Ak = bk + Ach^i + Xck2A2 + .. + XcknAn. A1.7c)
11 2 Fredholmsche Integralgleichungen 2. Art 585 Es ist möglich, daß die Integrale in A1.7b) nicht exakt ausgewertet werden können. In diesem Fall muß man eine Näherungsformel (s. 19.3, S. 925) anwenden Das lineare Gleichungssystem A1.7c) besteht aus n Gleichungen für die Unbekannten A\,...,An' (i- —Acoi Ai +A — Xcoo)Ao — .. —\co„ A„ = bo . A1 7d) Acn)i4i -XcuA2- . -Ac2i Ai +A - Xc22)A2 - -Xcni Ai -Xcn2 A2 - —Xcin An = bi -Xc2nAn = 02 +A - Xcnn)An = bn 3. Diskussion der Lösung, Eigenwerte und Eigenfunktionen Aus der Theorie linearer Gleichungssysteme ist bekannt, daß A1.7d) genau dann eine eindeutig bestimmte Lösung für Ai, ,An besitzt, wenn die Koeffizientendeterminante nicht verschwindet: | A - Acn) -Aci2 • -Xch -Xc2i A - Ac22) . -Ac2n | D(A) = ^0. A18) -Acni -Acn2 ... A - Acnn) | Offenbar ist D(A) nicht identisch gleich Null, denn es gilt D@) = 1 Darüber hinaus gibt es eine Zahl R > 0 mit -D(A) ^ 0 für |A| < R. Für weitere Untersuchungen sind zwei Fälle zu unterscheiden. 1. D(A) ^ 0 Es existiert genau eine Lösung der Integralgleichung, die durch A1.6c) gegeben ist, wobei sich die Koeffizienten ;4i, ,An als Lösung des Gleichungssystems A1.7d) ergeben. Handelt es sich bei A1.4a) um eine homogene Integralgleichung, d.h., ist f(x) = 0 , dann ist &i = b2 = ... = bn = 0. Das dann homogene Gleichungssystem A1 7d) hat nur die triviale Lösung A\ = A2 = ... = An = 0. Die homogene Integralgleichung ist nur für ip(x) = 0 erfüllt. 2. D(A) = 0. D(A) ist ein Polynom höchstens n-ten Grades und hat bekanntlich nicht mehr als n Wurzeln. Für diese Werte von A hat das homogene Gleichungssystem A1.7d) mit &i = b2 = ... = bn = 0 außer der trivialen Lösung noch nicht verschwindende Lösungen, so daß auch die homogene Integralgleichung neben der trivialen Lösung ip(x) = 0 noch weitere Lösungen der Form ip(x) = C ¦ (j4iai(a;) + A2a2(x) + ... + Anan(x)) (C beliebige Konstante) hat Aufgrund der linearen Unabhängigkeit der Funktionen ai(x),..., an(x) ist ip(x) nicht identisch Null. Die Nullstellen von D(A) nennt man Eigenwerte der Integralgleichung. Die zugehörigen, nicht identisch verschwindenden Lösungen der homogenen Integralgleichung heißen die Eigenfunktionen zum Eigenwert A . Zu einem Eigenwert können mehrere linear unabhängige Eigenfunktionen gehören. Für Integralgleichungen mit allgemeineren Kernen werden darüber hinaus alle diejenigen Zahlen A als Eigenwerte bezeichnet, für die die homogene Integralgleichung nichttriviale Lösungen besitzt. In verschiedenen Arbeiten wird A mit D(A) = 0 als charakteristische Zahl und ß = — als Eigenwert bezeichnet. A rb Dies resultiert aus der Integralgleichungsform n<p(x) = / K(x, y)(p{y) dy. Ja 4. Transponierte Integralgleichung Es bleibt noch zu untersuchen, unter welchen Bedingungen im Fall D(A) = 0 auch die inhomogene Integralgleichung eine Lösung besitzt. Zu diesem Zweck führt man die zu A1.4a) transponierte Integralgleichung ein- b il)(x) = g{x) + AI K(y, xI>(y) dy. A1.9a)
586 11. Lineare Integralgleichungen Es sei A ein Eigenwert und <p(x) eine Lösung der inhomogenen Integralgleichung A1.4a). Dann läßt sich zeigen, daß A auch Eigenwert der transponierten Gleichung ist. Man multipliziert beide Seiten von A1.4a) mit irgendeiner Lösung tp(x) der homogenen transponierten Integralgleichung und integriert anschließend über x in den Grenzen von a bis b: b b b / b \ f (p(x)ip(x) dx = f f(x)x/j(x)dx+ f f A f K(x,y)ip(x)dx\ (f(y)dy. A19b) o o a \ a / Da ip(y) = A / K(x, y)ip(x) dx vorausgesetzt war, erhält man die Forderung / f(x)ip(x) dx = 0 Insgesamt gilt also: Die inhomogene Integralgleichung A1.4a) ist für einen Eigenwert A genau dann lösbar, wenn die Störfunktion f(x) orthogonalzu. allen nicht verschwindenden Lösungen der homogenen transponierten Integralgleichung mit demselben A ist. Diese Aussage ist nicht auf Integralgleichungen mit ausgearteten Kernen eingeschränkt, sondern gilt auch für Integralgleichungen mit allgemeineren Kernen /+i (x2y + xy2 -xy)(f(y)dy, ai(x) = x2 , a2{x) = x, a3(x) = -x, ßi(y) = y, ß2(y) = y2 j ßz(y) — y • Die afc(x) sind linear abhängig Man formt deshalb die Integralgleichung [x2y + x(y2 — y)](f{y) dy Für diese Integralgleichung gilt ol\(x) = x2 , a2(x) = x, ßi{y) = y, ß2(y) = y2 — y • Falls eine Lösung (p(x) existiert, hat sie die Darstellung <p(x) = x + Aix^ + A2x. x3 dx = 0 , C12 = / x2 dx — - , b\ = / x2 dx = - , -i 7-i 3 7-i 3 /+i 2 r+1 2 f+l 2 (x4 - xs) dx = - , c22 = / {x3 - £2) dx = -- , b2 = / (x3 - x2) dx = -- -i 5 7-i 6 J-i 6 2 2 2 / 2\ 2 Damit lautet das System zur Bestimmung von A\ und A2: A\ — -A2 = - , —A\ + 1 + - L42 = — 3 3 5 V 3/ 3 !0 „ 2 , / x 10 2 2 10 o 5 Daraus ermittelt man Ai = — , ^42 = — tz und y?(_a;) = x + xr^ — =sc = — x + -x . ZI i Z1 / Z1 f ¦ B: <p(x) = x + A / sin(x + y)<p(y) dy , d h if (x, y) = sin(x + y) = sin x cos y + cos x sin y, </?(x) 7o = x + X sin x / cos y </?(?/) dy + X cos x / sin y <p(y) dy c\\ = / sinxcosxdx = 0, ci2 = / cos xdx = —, b\ = / xcosxdx = — 2, Jo 7o 2 7o c2i = / sin2 x dx = —, c22 = cos x sin x dx = 0, b2 = x sin x dx = 7r. 70 2 70 70 7T 7T Das System A1 7d) lautet also Ai — X—A2 = —2 , — A—A\ +A2 = tt . Es besitzt eine eindeutige Lösung für alle A mit D(A) = TT2 ^Tj ^ Tj-M _ \) = 1- X2— + 0. Dann ist Ax = —2 T , A2 = — L-, und die Integralgleichung hat die Lösung <^(x) = x 4- -4 1-A2^- 1-A2^- 4 4 A—— 2 I sin x + 7r(l — A) cosx Die 2 2 Eigenwerte der Integralgleichung sind Ai = — , A2 = . 7T 7T
11.2 Fredholmsche Integralgleichungen 2. Art 587 Die homogene Integralgleichung (p(x) = Xk sin(x + y)tp(y) dy hat somit mchttnviale Lösungen der Jo 2 Form (pk(x) = \k{Aismx + A2cosx) (k = 1,2). Für Ai = — ist Ai = A2, und mit einer beliebi- 7T 2 gen Konstanten A erhält man: <pi(x) = A(sinx + cos:r) Entsprechend ermittelt man für A2 = . TT tp2(x) — B(sin x — cos x) mit einer beliebigen Konstanten B . Hinweis: Das angegebene Lösungsverfahren ist besonders einfach, bleibt aber auf ausgeartete Kerne beschränkt. Die Methode kann jedoch auch für Integralgleichungen mit allgemeineren Kernen als Näherungsverfahren angewendet werden, indem man den Kern durch einen ausgearteten Kern hinreichend gut approximiert (s. [11.4] ,[11.6]) 11.2.2 Methode der sukzessiven Approximation, Neumann—Reihe 1. Iterationsverfahren Ahnlich dem PlCARD.se/ien Iterationsverfahren (s. 9.1.1.5,1., S. 513) zur Lösung gewöhnlicher Differentialgleichungen soll eine Methode zur iterativen Bestimmung der Lösung einer FREDHOLMschen Integralgleichung 2. Art angegeben werden Ausgehend von der Gleichung b <p(x) = f(x) + A f K(x, y)<p{y) dy , A1.10) a wird sukzessiv eine Folge von Funktionen (fo(x), <fi(x), <p2(x),. . ermittelt. Als erste Iterierte setzt man <po(x) = f(x). Alle folgenden <pn(x) erhält man mittels der Vorschrift: b <Pn{x) = f{x) + \JK(x,y)<pn-1{y)dy (n = l,2,..., <p0{x) = f{x)). A1 IIa) Führt man die Schritte im einzelnen aus, so ist zunächst b Vi (x) = f(x) + AI K(x, y)f(y) dy. A1.11b) Nach der angegebenen Iterationsvorschrift ist dieser Ausdruck anstelle von (p(y) in die rechte Seite von A1 10) einzusetzen Zur Vermeidung von Verwechslungen soll in A1.11b) die Integrationsvariable y in T] umbenannt werden. Man erhält- <p2(x) = f(x) + \J K(x, y) /(i/) + A J K(y,77OG7) dri A1.11c) = f(x) + \j K(x, y)f(y) dy + A2 Jf K(x, y)K(y, 77OG7) dy drj. A1 lld) a a a rb Führt man die Bezeichnungen K\(x, y) = K(x, y) und K2(x, y) = / K(x, £)!£(£, y) d£ ein und nennt Ja 77 wieder y, so kann y2(x) geschrieben werden als b b y2(x) = f(x) + A f Kfa y)f(y) dy + A2 J K2(x, y)f(y) dy (ll.lle)
588 11. Lineare Integralgleichungen Mit der Bezeichnung 6 Kn(x,y) = jK(x,Z)Kn-i(t,y)dt (n = 2,3,.. ) (ll.llf) a erhält man auf analoge Weise die Darstellung für die n-te Iterierte (pn(x): b b ipn(x) = f(x) + A J Kx(x, y)f(y) dy + ... + \n j Kn(x, y)f(y) dy. A1 11g) a a Der Ausdruck Kn(x, y) wird als n-ter iterierter Kern von K(x, y) bezeichnet. 2. Konvergenz der Neumannschen Reihe Zur Ermittlung der Lösung <p(x) ist die Potenzreihe bezüglich A oc * fW + Y,*1 Kn(xty)f(y)dy, A112) die sogenannte NEUMANNsche Reihe, auf Konvergenz zu untersuchen. Sind die Funktionen K(x, y) und f(x) beschränkt, d.h., es gelte \K(x,y)\<M {a<x<b, a<y<b) und |/(x)| < TV (o < x < b), A1.13a) so bildet die Reihe oo W£|AMF-a)|n A1.13b) n=0 eine Majorante für die Potenzreihe A1 12). Diese geometrische Reihe konvergiert für w <wh)- A1-13c) Die NEUMANNsche Reihe konvergiert also ebenfalls absolut und gleichmäßig für alle A, die A1.13c) erfüllen. Durch eine schärfere Abschätzung der Glieder der NEUMANNschen Reihe kann das Konvergenzintervall noch genauer angegeben werden. Danach konvergiert die NEUMANNsche Reihe für W< jbb 1 (ll-13d) V a a Diese Einschränkung an den Parameter A bedeutet nicht, daß für größere Werte von |A| generell keine Lösung existieren würde, sondern nur, daß die Lösung unter Umständen nicht durch die NEUMANNsche Reihe angegeben werden kann Den Ausdruck oo r(x,y;A) = X;An-1/Cn(x1j/) A114a) n=l bezeichnet man als Resolvente oder lösenden Kern der Integralgleichung Die Resolvente ermöglicht eine Lösungsdarstellung durch 6 ip(x) = f{x) + AI r(x, y; X)f(y) dy A1.14b) a ¦ Für die inhomogene FREDHOLMsche Integralgleichung 2. Art tp(x) = x + X / xy ip(y) dy erhält man Jo /**• 1 1 xy Ki(x,y) = xy, K2(x,y) = / xrjrjydy = -xy, K3(x,y) = -xy, .., Kn(x,y) = ——r und damit Jo 6 9 6n l
11 2 Fredholmsche Integralgleichungen 2. Art 589 (°° An\ ^ — . Mit der Schranke A1 13c) konvergiert die Reihe sicher für |A| < 1, wobei n=o 3n / \K{x,y)\ < M = 1 ist. Die Resolvente r(x,y,X) = —- ist jedoch eine geometrische Reihe, die sogar für |A| < 3 konvergiert. Damit erhält man aus A1 14b) (p(x) = x + A / - Jo 1 xy2 ¦A/3 v l-A/3 Hinweis: Ist für ein konkretes A die Bedingung A1.13d) nicht erfüllt, so kann ein stetiger Kern in zwei stetige Kerne zerlegt werden durch K(x, y) = Kl(x, y) + K2(x, y), wobei Kl(x, y) einen ausgearteten Kern darstellt und K2(x, y) so klein ist, daß A1.13d) für diesen Kern erfüllt ist. Auf diese Weise läßt sich für alle A , die keine Eigenwerte sind, eine exakte Lösungsmethode herleiten (s [11.7]). 11.2.3 Fredholmsche Lösungsmethode, Fredholmsche Sätze 11.2.3.1 Fredholmsche Lösungsmethode 1. Näherungslösung durch Diskretisierung Eine FREDHOLMsche Integralgleichung 2. Art b <p(x) = f(x) + xf K{x,y)ip(y)dy A1 15) a kann näherungsweise in Form eines linearen Gleichungssystems dargestellt werden Es sei vorausgesetzt, daß die Funktionen K(x, y) und f(x) für a < x <b, a < y <b stetig sind. Das Integral in A1 15) soll durch die linksseitige Rechteckformel (s 19 3 2.1, S. 926) angenähert werden Man könnte aber auch eine beliebige andere Quadraturformel (s 19.3, S. 925) anwenden Mit den äquidistanten Punkten yk = a + (k-l)h (fc = l,2,---,n, h= ^-^) A1.16a) n erhält man die Näherung <p{x) » f(x) + Xh [K(x, yiMyi) + .. + K(x, ynMyn)] • (H 16b) Man ersetzt in dieser Beziehung (p(x) durch eine Funktion Tp(x), die A1 16b) exakt erfüllt Jp(x) = f(x) + Xh [K(x, 2/iMi/i) + ... + K(x, yn)rp(yn)] • A1.16c) Zur Auswertung dieser Näherungslösung benötigt man die Funktionswerte der Funktion Tp(x) in den Stützstellen Xk = a+(k—l)h. Setzt man in A1 16c) nacheinander x = x\, x — X2, ..,x = xni so erhält man ein lineares Gleichungssystem für die n gesuchten Funktionswerte Tp(xk) ¦ Mit den Abkürzungen Kjk = K(xj,yk), (fk = Tp{xk), fk = f(xk) A1.17a) lautet dieses Gleichungssystem A - XhKn)<pi -XhK12 (p2 - -XhKln (pn = fx, -XhK2i <p\ +A - XhK22)^2 - • • • -XhK2n yn = f2 , -XhKni ipi -XhKn2 v?2 - • • • +A - XhKnn)ipn = fn. Das System besitzt die Koemzientendeterminante I A - XhKn) -XhK12 -XhKh Dn(A)r_| -XhK2l (l-XhK22) ... -XhK2n\ A1 17b) A1.17c) -XhKnl -XhKn2 ... {l-XhKnn)\ Diese Determinante hat dieselbe Struktur wie die Koeffizientendeterminante, die bei der Behandlung von Integralgleichungen mit ausgearteten Kernen auftritt. Das Gleichungssystem A1.17b) besitzt eine
590 11. Lineare Integralgleichungen eindeutige Lösung für alle A mit Dn(A) ^ 0 Diese Lösung besteht aus Näherungen für die Funktionswerte der gesuchten Funktion <p (x) in den Stützstellen Die Zahlen A mit Dn(A) = 0 sind Näherungen für die Eigenwerte der Integralgleichung. Die Lösung von A1 17b) läßt sich als Quotient darstellen (s CRAMERsche Regel, 4.4.2.3, S. 283). D*(A) Vk = ¦ i(f(xk) (fc = l,...,n). A1 18) D„(A) Dabei entsteht Dj(A) aus Dn(A), indem die fc-te Spalte durch /i, /2,..., fn ersetzt wird 2. Bestimmung der Resolvente Läßt man n gegen unendlich gehen, dann erhalten die Determinanten D£(A) und Dn(A) unendlich viele Zeilen und Spalten. Die Determinante D(A) = nlim)Dn(A) A1.19a) wird benutzt, um den lösenden Kern (Resolvente) r(x, y; A) (vgl. Abschnitt 11.2.2) in der Form D(z,y;A) r(x,y;\) = D(A) A1.19b) darzustellen. Es gilt die Aussage, daß alle Nullstellen von D(A) Polstellen von T(x, y, A) sind. Gleichzeitig sind die A mit D(A) = 0 genau die Eigenwerte der Integralgleichung A1.15). In diesem Fall besitzt die homogene Integralgleichung nicht verschwindende Lösungen, die Eigenfunktionen zum Eigenwert A. Die Kenntnis der Resolvente r(x, y; A) ermöglicht, falls D(A) ^ 0, eine explizite Lösungsdarstellung b b <p(x) = f(x) + A J r(x, y; A)/(y) dy = f(x) + —- J D(x, y, A)/(y) dy A1 19c) Zur Ermittlung der Resolvente nutzt man für die Funktionen D(x,y;A) und D(A) Potenzreihenentwicklungen bezüglich A: T(x,y;A): D(x,y;A) £(-!>"*.(*.*)¦*" D(A) £ (-l)ndn - Xn A1.20a) Es ist dabei do = 1, K0(x,y) = K(x,y). Die weiteren Koeffizienten lassen sich aus folgenden Rekursionsformeln gewinnen* 1 b b dn = - f Än-i(z,x)dx, Kn(x,y) = K{x,y)-dn- f K{x,t)#n-i(t,y)dt. A1 20b) a a ¦ A: ip(x) = sin x + A / sin x cos y ip(y) dy Die exakte Lösung dieser Integralgleichung lautet- Jo TT — Q mif -r. — H rr„ — _ „.„ _ _ 3 ' " 6 2 7T fi00) = ^ T smx Firr n = 3 mit x\ = 0 , x% — — , 2 — A 6 7T TT Xs = — , fi = — erhält man D3(A) = -* 1 12 y/3\7T 0 V^Att 24 3Att " 24 1 0 Att 24 v^Att -(•¦ \/3Att 24 192 12 v^tt 12 24 24 ist eine Näherung für den exakten Eigenwert A = 2. Aus der ersten Gleichung des Systems A1 17b) ermittelt man für /i = 0 das Ergebnis ipi = 0. Nach Einsetzen dieses Resultates lauten die zweite und i . ™ • , L v^AtA Att 1 3Att / \/3\ir\ \/3 ^. dritte Gleichung: 1 —— (£2 - — <^3 = - —_ (p2+[l —— \ tp3 = —- . Dieses System 24
11.2 Fredholms che Integralgleichungen 2. Art 591 1 F\ hat die Lösung <p2 = 7=— , ipz = -/=— . Speziell für A = 1 ist ipi = 0, ip2 = 0,915, ip$ = 2_V^X 2_V|rA 6 6 1, 585. Die exakten Lösungswerte lauten: <p(Q) = 0, y? ( — ) = 1, y>( — 1 =1, 732 . Um eine höhere Genauigkeit zu erreichen, muß die Anzahl der Stützstellen vergrößert werden. ¦ B: <p(x) = x + A / Dxy — x2)ip(y) dy, do = 1, -Ko(#> y) = 4xy — x2 , di = / 3x2 dx = 1, 7o Jo f1 4 4 1 f1 1 Ki(x,y) = Axy-x2- / D:c£-£2)Dft/-£2) dt = x + 2x2y--x2 --xy ,d2 = - / Äi(a?,a;)da; = — , 7o 3 3 2 7o 18 1 ri K2(a:5 y) = T77D^y — ar) — / K"(x, t)Ki(t, y) dt = 0. Damit sind auch d3, #3B;, y) und alle folgenden 18 Jo 4xy — x2 — \x + 2x2y — -x2 — -zxy\ A 1-A+- Größen 4 und Kk{x, y) gleich Null. r(z, y, A) = *= r^ —-— . Aus 1 - A + 18 A2 — = 0 ermittelt man die 2 Eigenwerte Ai^ = 9 ± 3\/7. Falls A kein Eigenwert ist, erhält man als 18 3zBA - 3Xx 4- 6) Jo * v~'y' ",J yyj ~y ~ A2 - 18A + 18 ' 11.2.3.2 Fredholmsche Sätze Zur FREDHOLMschen Integralgleichung 2. Art Lösung ip(x) = x + A / T(x, 2/; X)f(y) dy -- Jo <p(x) = f(x) + \j K(x, y)<p(y) dy A1.21a) a ist durch 6 i/>(x) = g(x) + AI K(y, x)i>(y) dy A1 21b) a eine zugehörige transponierte Integralgleichung gegeben. Zu diesem Paar von Integralgleichungen lassen sich folgende Aussagen treffen (s. 11 2 1, S. 584). 1. Eine FREDHOLMsche Integralgleichung 2. Art besitzt nur abzählbar viele Eigenwerte, welche sich nur im Unendlichen häufen können, d h., es existieren für jede reelle Zahl R nur endlich viele Eigenwerte Amit |A| < R. 2. Ist A kein Eigenwert von A1.21a), dann sind beide inhomogene Integralgleichungen für beliebige Störfunktion f(x) bzw. g(x) eindeutig lösbar, und die zugehörigen homogenen Integralgleichungen besitzen nur die triviale Lösung. 3. Ist A ein Eigenwert von A1.21a), dann ist A auch Eigenwert der transponierten Gleichung A1.21b). Beide homogene Integralgleichungen haben dann nicht verschwindende Lösungen, und die Anzahl linear unabhängiger Eigenfunktionen stimmt für beide Gleichungen überein. 4. Eine inhomogene Integralgleichung ist genau dann lösbar, wenn die Störfunktion zu allen Lösungen der homogenen transponierten Integralgleichung orthogonal ist, d.h. falls für alle Lösungen der Integralgleichung b b ip(x) = X f K(x,y)i/>(y)dy A1.22a) gilt f f(x)ip(x)dx = 0 A1.22b)
592 11. Lineare Integralgleichungen Aus diesen Sätzen folgt der FREDHOLMsc/ie Alternativsatz: Entweder die inhomogene Integralgleichung ist für beliebige Störfunktion f{x) lösbar oder die zugehörige homogene Gleichung besitzt nichttriviale Lösungen (s. [11 3], [11 7]). 11.2.4 Numerische Verfahren für Fredholmsche Integralgleichungen 2. Art Häufig wird eine FREDHOLMsche Integralgleichung 2. Art b ip(x) = f(x) + \J K(x, y)ip(y) dy A1.23) mit einem der in 11.2.1, S. 584, 11.2.2, S. 587, und 11.2.3, S. 589 beschriebenen Verfahren entweder gar nicht oder nur mit großem Aufwand exakt gelöst werden können. In einem solchen Fall müssen numerische Näherungsmethoden herangezogen werden Es sollen im folgenden drei Verfahrensklassen zur numerischen Lösung von Integralgleichungen des Typs A1.23) vorgestellt werden. Die Lösungsansätze führen häufig auf große lineare Gleichungssysteme mit voll besetzter Koeffizientenmatrix Zu deren Lösung eignen sich Mehrgitterverfahren (s [11.4]). 11.2.4.1 Approximation des Integrals 1. Semidiskretes Problem Zur Bearbeitung der Integralgleichung A1 23) wird das Integral durch einen Näherungsausdruck ersetzt. Derartige Näherungen bezeichnet man als Quadraturformeln. Sie haben die Form / f(x) dx « Q[aM(f) = £ ukf{xk), A1 24) d.h., anstelle des Integrals steht eine Summe mit Zahlen ujk gewichteter Funktionswerte an den Stützstellen Xk • Diewfc sind dabei (unabhängig von /) geeignet gewählt Damit kann A1.23) näherungsweise geschrieben werden: V>(x) « f{x) + \Q[aM{K{x, •)</>(•)) = /(*) + *Y,UkK(x1yk)tp(yk). A1.25a) fe=i Die Quadraturformel Q[a^{K{x, -)<p(-)) hängt dabei noch von der Variablen x ab Der Punkt im Argument der Funktion deutet an, daß die Quadraturformel bezüglich der unabhängigen Variablen y angewendet worden ist. Man geht über zur Gleichung Jp(x) = f(x) + A £ "kK(x, yk)<p(yk). A1 25b) fc=i Tp{x) bildet eine Approximation für die exakte Lösung (p(x) Man bezeichnet A1.25b) als ein semidiskretes Problem, da bezüglich der Variablen y zu diskreten Werten übergegangen wurde, während die Variable x noch beliebig wählbar ist. Wenn für eine Funktion Tp(x) die Gleichung A1.25b) für alle x G [a, b] gilt, ist diese natürlich auch an den Stützstellen x = xk erfüllt. n V(xk) = f(xk) + A Y,UjK{xk, yj)<p{yj) {k = 1,2,..., n). A1.25c) j=i Dies ist ein lineares Gleichungssystem, bestehend aus n Gleichungen für die n Unbekannten Jp(xk). Durch Einsetzen dieser Lösungswerte in A1.25b) ist die Lösung des semidiskreten Problems gegeben Die Genauigkeit und der Rechenaufwand dieses Verfahrens hängen von der Güte der Quadraturformel ab. Benutzt man z.B. die linksseitige Rechteckformel mit äquidistanten Stützstellen yk = xk = a +
11.2 Fredholmsche Integralgleichungen 2. Art 593 h{k-l),h = {b-a)/n, {k = 1,... ,rc): 6 n / K(x, y)ip(y)dy « £ /itf(x, yfcMj/fc), A1.26a) { k=l so erhält das System A1.25c) unter Verwendung der Bezeichnungen Kjk = K{xj,yk), fk = f(xk), (fk = Tp{xk) A1.26b) die Form- (l-\hKn)ipi -\hK12V2- ¦¦¦ -XhKin ipn = /1, -XhK2\ (pi +A - \hK22V2) - • • • -XhK2n <fn = S2 , /,, rt^ n A1.26c) -XhKni (pi -\hkn2 <p2- • • • +A - XhKnn)(pn = fn. Genau dieses System wurde schon bei der Untersuchung der FREDHOLMschen Lösungsmethode (s. 11.2 3.1, S. 589) hergeleitet. Da die linksseitige Rechteckformel aber nicht sehr genau ist, müssen für eine'gute Approximation des Integrals eine große Anzahl von Stützstellen einbezogen werden, wodurch die Dimension des Gleichungssystems wächst. Es empfiehlt sich daher, geeignetere Quadraturformeln heranzuziehen. 2. Nyström-Verfahren Beim Nyström- Verfahren verwendet man zur Approximation des Integrals die GAUSSschen Quadraturformeln (s. 19.3.3, S. 927). Zu deren Herleitung betrachte man das Integral b 1= f f{x)dx. A1.27a) a Man ersetzt den Integranden durch ein Polynom p(x) vom Grade n — 1, welches die Funktion f(x) in den n Stützstellen xk interpoliert: /\ shrt\*/ \ •* t ( \ {x-xx) ... (x-Xk-^ix-Xk+i) ... (x-xn) /110-x P(x) = 22 Lk(x)f{xk) mit Lk(x) = -± -j f- ^- —!- "- --r . A1.27b) fc=l [Xk -Xi) ... [Xk - Xk-l){Xk - Xk+i) ...{Xk- Xn) Für das so definierte Polynom p(x) gilt: P(xk) = f(xk) (k = l,...,n). Die Ersetzung des Integranden f(x) durch p(x) liefert die Quadraturformel b b n b n b I f(x) dx& I p(x) dx = J2 f(x*) I Lk(x) dx = ^2 ukf{xk) mit uk = I Lk(x) dx. A1.27c) a a fc=l a fc=l a Für die GAUSSschen Quadraturformeln ist die Wahl der Stützstellen nicht willkürlich, sondern erfolgt nach der Vorschrift: Xk = 2~^ + h~YLtk (fc = 1'2" -'n)- A128a) Die n Zahlen tk sind die n Nullstellen des LEGENDREschen Polynoms 1. Art (s. 9 1.2.6,3., S. 529)
594 11. Lineare Integralgleichungen Diese Nullstellen liegen alle im Intervall [—1, +1]. Die Koeffizienten uk können durch die Substitution x — Xk = —-—(t — tk) ermittelt werden* /l f {t — t Lk{x) dx = (b-a)-J _t (t-U). jt-tk-1)(t-tk+1)...(t-tn) )...{tk-tk.1)(tk-tk+1)...(tk-tn) dt A1.29) = (b- a)Ak. In Tabellell.l sind für n = 1,..., 6 die Nullstellen der LEGENDREschen Polynome 1. Art sowie die Gewichte Ak angegeben Tabelle 11.1 Nullstellen der LEGENDREschen Polynome 1. Art n 1 2 3 4 t U = 0 h = -0,5774 t2= 0,5774 tx = -0,7746 t2= 0 t3= 0,7746 ti =-0,8612 t2 = -0,3400 t3= 0,3400 U= 0,8612 A Ax = l Ax = 0,5 A2 = 0,5 Ax = 0,2778 A2 = 0,4444 A3 = 0,2778 Ax = 0,1739 A2 = 0,3261 A3 = 0,3261 A4 = 0,1739 n 5 6 t ii = -0,9062 t2 = -0,5384 *3= 0 ¦ t4 = 0,5384 t5 = 0,9062 *i = -0,9324 t2 = -0,6612 *3 = -0,2386 U = 0,2386 t5= 0,6612 *e = 0,9324 A AY =0,1185 A2 = 0,2393 A3 = 0,2844 A4 = 0,2393 A5 = 0,1185 Ai = 0,0857 A2 = 0,1804 A3 = 0,2340 A4 = 0,2340 A5 = 0,1804 A6 = 0,0857 x Z ¦ Die Integralgleichung ip(x) = cos ttx + — (ex +1) + / exy(p(y) dy ist näherungsweise nach dem Nyström-Verfahren für den Fall n = 3 zu lösen n = 3: Xl = 0,1127, z2 = 0,5, x3 = 0,8873, Ax = 0,2778, A2 = 0,4444, A3 = 0,2778, /i = 0,96214, f2 = 0,13087, /3 = -0,65251, tfn = 1,01278, K22 = 1,28403, X33 = 2,19746, #12 = üT2i = 1,05797, Kl3 = K31 = 1,10517, if23 = K32 = 1,55838. Das Gleichungssystem A1.25c) zur Ermittlung von c/?i, y?2 und cp3 lautet: 0,71864V?! - 0,47016c/>2 - 0,30702cp3 = 0,96214, -0,29390c/?i + 0,42938(^2 - 0,43292cp3 = 0,13087, -0,30702cpi - 0,69254(^2 + 0,38955t/?3 = -0,65251. Lösung des Systems: cpi = 0,93651, <p2 = -0,00144, (p3 = -0,93950. Die Werte der exakten Lösung in den Stützstellen sind: <p(xi) = 0,93797, ip(x2) = 0, (p(x3) = -0,93797. 11.2.4.2 Kernapproximation Man ersetzt den Kern K(x, y) durch einen Kern K(x, y) mit K(x, y) « K(x, y) für a < x < b, a <y <b Diesen Kern wählt man so, daß die resultierende Integralgleichung b Jp(x) = f{x) + \jK(x,y)<p{y)dy A1 30)
11 2 Fredholmsche Integralgleichungen 2 Art 595 möglichst einfach zu lösen ist 1. Tensorprodukt-Approximation Eine häufig verwendete Näherung für den Kern ist die Tensorprodukt-Approximation der Form K(x,y) « K(x,|/) = EEdjkaj(x)ßk(y) A1.31a) j=0 k=0 mit linear unabhängigen Funktionen a0(x), , an (x) bzw ß0(y), , ßn(y). Diese Funktionen werden vorgegeben, und die Koeffizienten djk können so bestimmt werden, daß die Doppelsumme den Kern in einem gewissen Sinne gut approximiert Umformung von A1.31a) mit ausgeartetem Kern ergibt j=0 Y,doMy) k=0 -- E aAxNj(y) mit sj(y) = E dJkßk{y). j=0 k=0 Somit kann das in 11 2 1, S. 584 vorgestellte Verfahren zur Lösung der Integralgleichung 0 jp{x) = f{x) + \J Y,aj(xNj(y) <p(y) dy A1.31b) A1.31c) zur Anwendung kommen Bei der Auswahl der Funktionen a0(x),... an(x) bzw. ßo(y), ., ßn{y) sollte beachtet werden, daß die Zahlen djk in A1 31a) einfach zu bestimmen sind und der Rechenaufwand zur Behandlung von A1 31c) gering bleibt. 2. Spezieller Spline-Ansatz Für eine spezielle Kernapproximation auf dem Integrationsintervall [a,b] = [0,1] wird ak(x) = ßk(x) ¦¦ l-n 0 ... k - 1 k + 1 rur < x < , sonst gewählt. Die Funktion ak(x) ist nur in dem Intervall 1 k + l n A1 32) , dem sogenannten Träger, ungleich Null (Abb. 11.1) KM Zur Bestimmung der Koeffizienten djk in A1 31a) betrachte man K(x,y) an den Stellen x = //n, y = i/n (l,i = 0,1,... ,n). Dann gilt °H-]<Mr n/ 1 für j = /, A;: 0 sonst A1.33) und folglich K(l/n, i/n) = du . Aus diesem Grund setzt man dK=-R[l-,i- \n n damit die Form K \ - , - | . Die Gleichung A1.31a) hat in n Abbildung 11 1 K(x> y) = tt^A^ -) <*j(*)ßk(v) ¦ A1 34) Die Lösung von A1.31c) hat bekanntlich die Darstellung Tp(x) = f(x) + A0a0(x) + ... + Anan(x). A1.35) Der Ausdruck ^0^o(^) + • • • + Anan{x) ist dabei ein Polygonzug, der an der Stelle xk = k/n den Wert Ak annimmt. Bei der Lösung von A1 31c) nach dem Verfahren für ausgeartete Kerne ergibt sich ein
596 11. Lineare Integralgleichungen lineares Gleichungssystem für die Zahlen A0, • .., An- A - Acoo)A) -Acoi Ai- ... -Ac0n An = b0 , -AcioA) +A - Acn^i) - ... -\cinAn = bi, A1.36a) -XCnQ Aq -\Cni Ai + A - \Cnn)An = bn Dabei ist rn ~\ cjk = J Sj(x)ak(x)dx = J £#f-,-Jaj(:r) ak(x)dx = K (-,-) / a0(x)ak(x)dx + ... + K ( -, - ) / an(x)ak(x)dx. \n nj J \n nj J A1.36b) Für die Integrale ergibt sich Ijk = JOij{x)ak{x)dx-- ( J_ 3n _2_ 3n J_ 6n 0 für j = 0, A; = 0 und j = n, k = n, für j = A;, 1 < j < n, für j = A: + 1, j = A: — 1, sonst. A1 36c) Die Zahlen bk in A1 36a) sind festgelegt durch i : = //(*) S'lMl^ dx. A1.36d) Werden die Zahlen Cjk aus A1.36a) zur Matrix C , die Werte K(j/n, k/n) zur Matrix B und die Werte Ijk zur Matrix A zusammengefaßt, und wird aus den Zahlen 60> • • • > bn der Vektor b und aus den gesuchten Zahlen A0,..., An der Vektor a gebildet, dann hat das Gleichungsystem A1 36a) in Matrizenschreibweise die Form (I - AC)a = (I - ABA)a = b. A1.36e) Falls die Matrix (I — ABA) regulär ist, hat dieses System eine eindeutige Lösung a = (j40, ..., An). 11.2.4.3 Kollokationsmethode Es werden n auf dem Intervall [a, b] linear unabhängige Funktionen y>i(x),..., (fn(x) vorgegeben. Mit diesen Funktionen bildet man eine Ansatzfunktion Tp(x) für die Lösung (f(x): (p(x) ttip(x) = ai(fi(x) + a,2<P2{x) + . + an(pn(x). A1.37a) Die Aufgabe besteht in der Bestimmung der Koeffizienten ai,..., an . Für eine so definierte Funktion ~ip{x) wird es im allgemeinen keine Werte ai,..., an geben, so daß damit die exakte Lösung der Integralgleichung A1.23) ip(x) — p(x) vorliegt. Deshalb gibt man sich im Integrationsintervall n Stützstellen Xi,...,xn vor und fordert, daß der Ansatz A1.37a) die Integralgleichung zumindest an diesen Stellen erfüllt: V{xk) = ai(pi(xk) + ... + an(fn(xk) A1.37b) b = f(xk) + \jK(xk,y) [anpi{y) + ... + an<pn{y)} dy {k = 1,... ,n). A1.37c)
11.2 Fredholms che Integralgleichungen 2 Art 597 Etwas umgeformt hat dieses Gleichungssystem die Gestalt' b Vi(%k) - A / K(xk,y)(fi(y)dy = f(xk) (fc=l, ,n) Definiert man die Matrizen /Pi(zi) '•• <Pn(xi)\ A= : : , B= \¥?l(xn) ••• ipn{xn)J und die Vektoren a = [ai. . , an]T, b= [/(xi),... ai + ...+ U /Al ••• ßm ¦ \ßnl-'-ßnn , /MV , „(xjb) - Ay K(xk,y)(pn{y)c A1 37d) mit /?jfc = f K{x^y)^k{y)dy A1 37e) A1 37f) dann kann das Gleichungssystem zur Bestimmung der Zahlen a1}. ., an in Matrizenform angegeben werden (A-AB)a = b A1.37g) tp{x) = y/x + / Jxyip(y) dy Ansatz: ip(x) = a1x2+a2x+a3 , (fi(x) = x2 , ip2(x) = x , ip$(x) = 1 Stützstellen- x\ = 0, x2 = 0,5, x3 = 1. DasC / 0 0 1 \ rleichungssys teir G- 5 7°' 'l B = i lautet / 0 0 0 \ yß V2 >/2 7 5 3 2 2 2 \ 7 5 3 i , h = a3 = 0, V2\ _5J3 + 5 a2 + (l-^)a 1 o 1 1 J" 2" / ° \ 1 272 1 2 Man erhält als Lösung dieses Systems a\ = —0,8197, a2 = 1,8092, a3 = 0 und somit ?(a;) = -0,8197x2 + 1,8092z, mit p@) = 0, ^@,5) = 0,6997, ^A) = 0,9895. Die exakte Lösung der Integralgleichung ist </?(#) = ^/x mit </?@) = 0, </?@, 5) = 0. 7071, <p(l) = 1. Soll in diesem Beispiel die Genauigkeit verbessert werden, dann empfiehlt es sich nicht, den Grad des Polynomansatzes zu erhöhen, da Polynome höheren Grades numerisch instabil sind. Es sind vielmehr verschiedene Spline-Funktionenansätze vorzuziehen, etwa der stückweise lineare Ansatz Tp(x) = a\ip\(x) + a2v?2(z) + • + &ny>n{x) mit den bereits in 11.2.4.2, S. 594 angeführten Funktionen 1- k x n k - 1 k + 1 für < x < . n n Vk{x) = i @ sonst Die Lösung (p(x) wird in diesem Fall durch einen Polygonzug Tp(x) angenähert Hinweis: Die Wahl der Lage der Stützstellen für das Kollokations verfahren ist prinzipiell ohne Beschränkung. Ist jedoch bekannt, daß die Lösungsfunktion in einem Teilintervall stark oszilliert, dann sollten in diesem Intervall die Stützstellen dichter gelegt werden.
598 11. Lineare Integralgleichungen 11.3 Fredholmsche Integralgleichungen 1. Art 11.3.1 Integralgleichungen mit ausgearteten Kernen 1. Formulierung der Aufgabe Zur Behandlung der FREDHOLMschen Integralgleichung 1. Art mit ausgeartetem Kern b ¦ f(x) = J(a1{x)ß1(y) + ... + an(x)ßn(y))<p{y)dy, c<x<d, A1.38a) a werden wie in 11.2, S. 584 die Konstanten b Aj = jßj(yMy)dy 0 = 1,2,. ..,n) A1.38b) eingeführt. Die Gleichung A1.38a) besitzt die Darstellung f{x) = Aiai{x) + ... + Anan{x), A1.38c) d.h., nur wenn f(x) eine Linearkombination der Funktionen a\(x),..., an(x) ist, hat die Integralgleichung eine Lösung. Ist diese Bedingung erfüllt, dann sind die Konstanten Ai,..., An bekannt. 2. Lösungsansatz Der Lösungsansatz <p(x) = aßi(x) +... + Cnßn(x) t A139a) mit den unbekannten Koeffizienten ci,..., Cn führt nach Einsetzen in A1.38b) auf die Beziehungen 6 6 Ai = c1Jßi(y)ß1(y)dy + ... + cnJßi(y)ßn(y)dy (i = 1,2,.. ,n). A1.39b) a a Nach Einführung der Bezeichnung b Kij = fßi(y)ßj(y)dy A1.39c) ergibt sich das folgende lineare Gleichungssystem zur Bestimmung der Koeffizienten ci,..., cn: Knd + ... + Klncn = Ai, A1.39d) KniCi + . . . + KnnCn = An 3. Lösungen Die Koeffizientenmatrix ist regulär, wenn die lineare Unabhängigkeit (s. 12.1.3, S. 619) der Funktionen /?1} (?/),..., ßn(y) vorausgesetzt wird. Die so ermittelte Lösung A1.39a) ist jedoch nicht die einzige Lösung der Integralgleichung. Im Gegensatz zur Integralgleichung 2. Art mit ausgeartetem Kern ist die homogene Integralgleichung immer lösbar. Ist (ph{x) eine solche Lösung der homogenen Gleichung und (p(x) eine Lösung von A1.38a), dann ist auch (p(x) + fh(x) eine Lösung von A1.38a). Um alle Lösungen der homogenen Gleichung zu bestimmen, wird die Gleichung A1.38c) mit f(x) = 0 betrachtet Werden die Funktionen ai(x),..., an(x) als linear unabhängig vorausgesetzt, dann ist die Gleichung genau dann erfüllt, wenn gilt: b Aj = Jßj(y)<p(y)dy = 0 (j = 1,2,... ,n), A1.40) a d.h., jede zu allen Funktionen ßj{y) orthogonale Funktion (ph{y) löst die homogene Integralgleichung.
11.3 Fredholms che Integralgleichungen 1. Art 599 11.3.2 Begriffe, analytische Grundlagen 1. Lösungsansatz Eine Reihe von Verfahren zur Lösung von FREDHOLMschen Integralgleichungen 1. Art b f{x) = JK{x1y)(p(y)dy, c<x<d, A141) geht von einer Darstellung der Lösung (p(y) als Funktionenreihe bezüglich eines Funktionensystems (ßn{y)) — {ßi(y), ß2{y), • • •} aus, d.h., es wird der Lösungsansatz ?(v) = £c;ftö/) A142) mit zunächst unbestimmten Koeffizienten Cj gewählt Bei der Wahl des Funktionensystems (ßn(y)) ist zu beachten, daß durch diese Funktionen der gesamte Raum der Lösungen erfaßt wird und die Koeffizienten Cj geeignet dargestellt werden können Aus Gründen der Übersichtlichkeit werden die nachfolgenden Ausführungen auf reellwertige Funktionen beschränkt. Alle Aussagen sind aber auf komplexwertige Funktionen übertragbar. Für die Begründung der darzulegenden Lösungsverfahren sind einige Forderungen an die Kernfunktion K(x,y) zu stellen (s. [11.3], [11.12]) Diese Forderungen werden stets als erfüllt angesehen. Zunächst werden einige Hilfsmittel erläutert. 2. Quadratische Integrierbarkeit Eine Funktion i/j(y) heißt quadratisch integrierbar im Intervall [a, b], falls gilt- b jmy)\2dy<oo. A143) a Insbesondere ist jede in [a, b] stetige Funktion auch quadratisch integrierbar Der Funktionenraum aller in [a, b] quadratisch integrierbaren Funktionen wird mit L2[a, b] bezeichnet. 3. Orthonormalsystem Zwei quadratisch integrierbare Funktionen ßi{y), ßj(y),y G [a, b] werden als orthogonal bezeichnet, falls für i ± j gilt: b Jßi(y)ßj(y)dy = 0 A144a) a Ein Funktionensystem (ßn(y)) im Raum L2[a, b] wird als Orthonormalsystem bezeichnet, wenn die Beziehungen b jßi{y)ßj(y)dy = {l [£ ^y A1.44b) a erfüllt sind Ein Orthonormalsystem ist überdies vollständig, wenn in L2[a, b] keine Funktion ß(y) ^ 0 existiert, die zu allen Funktionen dieses Orthonormalsystems orthogonal ist. Ein vollständiges Orthonormalsystem besteht aus abzählbar vielen Funktionen, die eine Basis des Raumes L2[a,b] bilden. Um aus einem Funktionensystem (ßn(y)) ein Orthonormalsystem (ß^(y)) zu ermitteln, kann das SCHMlDTsc/ie Orthogonalisierungsverfahren verwendet werden, das sukzessive für n = 1,2,.. die Koeffizienten 6ni, 6n2, ., bnn derart bestimmt, daß ß:(y) = Ebnjßj(y) (ii44c) normiert und zu allen Funktionen ßl(y),..., ßn-i(y) orthogonal ist.
600 11. Lineare Integralgleichungen 4. Fourier-Reihen Ist {ßn{y)) ein Orthonormalsystem und ip(y) € L2[a, b], dann heißt die Reihe OO E*Ä(y) = ^(y) A145a) die FOURIER-Reihe von ijj(y) bezüglich (ßn(y)), und die Zahlen dj sind die zugehörigen Fourier- Koeffizienten. Für diese gilt auf Grund von A1 44b) j ßk(vW(v) dy = Y.dij ßj(y)ßk(y) dy = dk (ll.45b) a J=l a Ist (ßn{y)) vollständig, dann gilt die PARSEVALsche Gleichung ? my)\2dy = j:\dj\2. A1.45c) 11.3.3 Zurückführung der Integralgleichung auf ein lineares Gleichungssystem Es soll ein lineares Gleichungssystem zur Berechnung der FOURIER-Koeffizienten der Lösungsfunktion ip(y) bezüglich eines Orthonormalsystems aufgestellt werden Dazu wird ein vollständiges Orthonormalsystem {ßn{y))^y £ [a,b] gewählt. Ein entsprechendes vollständiges Orthonormalsystem (an(x)) möge auch für das Intervall x € [c,d] vorliegen. Bezüglich des Systems (an(x)) besitzt die Funktion f(x) die FOURIER-Reihe t f(x) = ^2fiai(x) mit fi= (Xi{x)f(x)dx. A1 46a) i=l c Die Multiplikation der Integralgleichung A1 41) mit ai(x) und die anschließende Integration bezüglich x in den Grenzen von c bis d liefert: d b fi = J J K(x,y)ip(y)cti(x)dydx c a = jljK{x:y)ai(x)dx\ip(y)dy B = 1,2,...). A146b) Der Ausdruck in der geschweiften Klammer ist eine Funktion von y und möge die FOURIER-Darstellung dr / K(x,y)ai{x)dx = K^y) = J2Kijßj{y) A1 46c) c J=l b d mit Kij = / K(x,y)ai(x)ßj(y)dxdy a c besitzen. Mit dem FOURIER-Reihenansatz oo vB/) = Ec*A(y) A146d) fc=i erhält man f* = 11£ KvßAv) (E cA(v)) \ dy
11.3 Fredholms che Integralgleichungen 1 Art 601 OO OO p = T,EKiJck ßj(y)ßk(y)dy B = 1,2,..). A1.46e) 3=1 k=l Ja Auf Grund der Orthonormaleigenschaft A1 44b) ergibt sich das lineare Gleichungssystem h = Y,KiJcJ (< = 1,2,...). A1 46f) Das ist ein System mit unendlich vielen Gleichungen zur Bestimmung der FOURIER-Koeffizienten Ci, C2,... Die Koeffizientenmatrix K = ^n K12K13---\ K2\ K22 K2s • • • Ksi Ks2 -^33 • • * V A1 46g) wird als Kernmatrix bezeichnet. Die Zahlen ft und K^ (z, j = 1,2,...) sind bekannte Größen, aber von der Wahl der Orthonormalsysteme abhängig. <p(y) dy, 0 < x < TT Das Integral ist dabei im Sinne des CAUCHYschen cos y — cos x Hauptwertes zu verstehen Als vollständige Orthogonalsysteme verwendet man:, TT JO 1 2 1. a0(x) = —^ , ati(x) = \ — cos ix (z = 1,2 ...), V 7T V TT Nach A1.46d) ergibt sich für die Koeffizienten der Kernmatrix l 1 i2 f* rn sinysinjy , , n . ., rt x Äbj = -7=-\/-/ / -^« = 0 j = l,2, , V 7T 7T V 7T 70 Vo COS Z/ — COS X 2 1 /•*¦/•*¦ sin y sin zz/ cos z':r i.ßM = f- sinjy (j = 1,2, .) 2 1 f /,7r sin z/ sin iy cos z:r 2 fn . . f /"^ cos zx 1 . . Aj7 = — / / dxdy = — / sin y sin zy < / dx > az/ (z = 1,2, ). TTTTJo JO COS Z/- COS X 7T2 70 (/O COS Z/ —COS X J Für das innere Integral gilt die Beziehung i cos zx , sm iy dx = — TT— . sinz/ o cos v — cos x A1.47) 2 r f° Daraus folgt i^7- = — / sin jy sin iydy = < TT JO 1—1 für z 7^ j , für z = j Die FOURIER-Koeffizienten von f(x) lauten gemäß A1.46a) fi= f(x)oti(x) dx (z = 0,1,2, .). Jo Das Gleichungssystem lautet: 0 00 • -1 OO--- 0 -1 0 •• "\ /CA c2 c3 V ' / /7o\ h /s V / Auf Grund der ersten Gleichung be- sitzt das System nur dann eine Lösung, wenn gilt /o = / f(x)ao(x) dx = —= / f(x)dx — 0 Es ist JO y/TT JO /~2 oo 1 /•* -S/iSinjj/= - / 7T . j 7T 70 V5F- sinz/ cos z/ — cos x -f(x)dx.
602 11 Lineare Integralgleichungen 11.3.4 Lösung der homogenen Integralgleichung 1. Art Sind (p(y) bzw. <ph(y) beliebige Lösungen der inhomogenen bzw. homogenen Integralgleichungen b b f(x) = J K(x, y)ip(y) dy A1.48a) bzw. 0 = f K{x, y)<p\y) dy, A1.48b) a a dann ist auch die Summe <p(y) + (fh(y) eine Lösung der inhomogenen Integralgleichung Deshalb sollen zunächst alle Lösungen der homogenen Integralgleichung bestimmt werden. Diese Aufgabe ist identisch mit der Ermittlung aller nichttrivialen Lösungen des linearen Gleichungssystems oo Y,KijCj = Q (* = 1,2, ..)• A149) Da dessen Auflösung mitunter schwierig ist, kann das folgende Verfahren zur Berechnung der homogenen Lösungen herangezogen werden Liegt ein vollständiges Orthonormalsystem (an(x)) vor, dann werden die Funktionen d Kt(y) = f K(x, y)ai{x) dx (i = 1,2,...) A1.50a) c gebildet. Ist iph(y) eine beliebige Lösung der homogenen Gleichung, d.h., es gilt b JK(x,y)<ph(y)dy = 0, A150b) a dann ergibt sich nach Multiplikation dieser Gleichung mit oti{x) und anschließender Integration bezüglich x b d b 0 = I iph(y) J K(x,y)ai(x)dxdy = I iPh(y)Ki(y)dy • (i = 1,2,...), (H-öOc) a c a d.h., eine beliebige Lösung ph{y) der homogenen Gleichung muß orthogonal zu allen Funktionen Ki(y) sein. Wird das System (Kn(y)) durch das mit Hilfe einer Orthonormierung daraus hervorgehende System (K*(y)) ersetzt, dann lautet die Bedingung A1.50c) jetzt b J<ph(y)K*(y)dy = 0. A1.50d) Wird das System (K^(y)) zu einem vollständigen Orthonormalsystem ergänzt, dann erfüllt offensichtlich jede Linearkombination der ergänzten Funktionen die Bedingung A1.50d). Ist das Orthonormalsystem (K„(y)) bereits vollständig, dann existiert nur die triviale Lösung iph(y) = 0. In ganz entsprechender Weise kann auch das Lösungssystem der folgenden transponierten homogenen Integralgleichung bestimmt werden- d I K(x,y)ilj(x)dx = 0. A150e) c 1 f1* sin x / 2 ¦ - / (p(y) dy = 0, 0<x<7r. Orthonormalsystem: aAx) = \ — sin ix (i = 1,2, . ), 7T Jo COS y — COS X V TT 12 1 f* sinxsinzx , 2 1 r cos(z — l)x — cos(i + l)x _ . / / dx = \ —— I dx. Zweimalige Anwen- / 7T TT JO COS y — COS X y TT 2lT JO COS y — COS X Uv)
11.3 Fredholmsche Integralgleichungen 1 Art 603 * t, , x /2^1 /sinB-lJ/-sin(z + l)?/\ [2 , , ^ düng von A1.47 ergibt ^(y) = -\\--\— —. — = \ -cosiy (i = 1,2, . Das V 7T 2 y sin y y V TT System (Kn(y)) ist bereits orthonormiert. Die Punktion i£"oB/) — l/v^r vervollständigt dieses System. Die homogene Gleichung besitzt also nur die Lösungen (ph(y) = 1^/tt = c, (c beliebig) 11.3.5 Konstruktion zweier spezieller Orthonormalsysteme zu einem gegebenen Kern 1. Prinzipielle Vorgehensweise Im allgemeinen ist die Auflösung des in 11.3.3, S 600 aufgestellten unendlichen linearen Gleichungssystems nicht einfacher als die Lösung des Ausgangsproblems. Durch geeignete Wahl der Orthonormalsysteme (an(x)) und (ßn{y)) kann jedoch die Struktur der Kernmatrix K so beeinflußt werden, daß sich das Gleichungssystem einfach lösen läßt Das folgende Verfahren konstruiert zwei Orthonormalsysteme, die eine Kernmatrix liefern, deren Koeffizienten Kij nur für i = j und i = j + 1 ungleich Null sind. Mit der Methode des voranstehenden Abschnittes werden zunächst zwei orthonormierte Lösungssysteme {ßn(y)) bzw (aj|(a;)) der homogenen Integralgleichung bzw der dazu transponierten homogenen Gleichung bestimmt, d.h., alle Lösungen dieser zwei Integralgleichungen lassen sich durch Linearkombination der Funktionen ß„(y) bzw. ajj(a;) darstellen. Diese Orthonormalsysteme sind nicht vollständig. Mit dem folgenden Verfahren werden diese Systeme durch schrittweises Hinzufügen von Funktionen otj(x),ßj(y) (j — 1, 2,...) zu vollständigen Orthonormalsystemen ergänzt 2. Algorithmus Bestimmung einer normierten Funktion a\(x), die zu allen Funktionen aus (ajj(sc)) orthogonal ist Für j = 1,2, werden jeweils die folgenden Schritte durchlaufen 1. Berechnung der Funktion ßj(y) sowie einer Zahl Vj aus d vißi(y) = K(x,y)oti(x)dx bzw A1.51a) c d i/jßjiy) = JK(x,y)aj(x) dx - fij-ißj-iiy) (j ± 1), A1.51b) c wobei Vj immer ungleich Null und so zu bestimmen ist, daß ßj(y) normiert ist. ßj(y) ist orthogonal zu allen Funktionen ((/#(j/)), Afe),... ,ßj-i(y)) 2. Bestimmung der Funktion otj+i(x) sowie einer Zahl /ij aus b Hjaj+1{x) = J K(x,y)ßj(y)dy - i/jOLjix). A1 51c) a Es können zwei Fälle eintreten: a) iij ^ 0. Die Funktion olj+\{x) ist orthogonal zu allen Funktionen ((a^(x)), ai(sc), . , ctj(x)j . b) fij = 0. Die Funktion aj+i(x) ist nicht eindeutig bestimmt. Erneut werden zwei Fälle unterschieden bi) Das System najj(a;)), a\(x),..., otj{x)) ist vollständig Dann ist auch das System ((ßniy)), ßi(y) > ., ßj(y)) vollständig, und das Verfahren ist beendet b2) Das System f(aJ[C:)),Qi(i), ,ctj(x)) ist nicht vollständig Dann wird eine beliebige, zu diesen Funktionen orthogonale Funktion otj+i(x) gewählt Das Verfahren wird so lange wiederholt, bis die Orthonormalsysteme vollständig sind. Es ist möglich,
604 11. Lineare Integralgleichungen daß im Algorithmus von einem gewissen Schritt ab auch nach abzählbar unendlich vielen weiteren Schritten nicht der Fall b) eintritt Ist die dabei erzeugte abzählbar unendliche Folge von Funktionen ((a^(x)),ai(x),...] nicht vollständig, dann kann mit einer zu allen diesen Funktionen orthogonalen Funktion d\{x) das Verfahren neu gestartet werden Werden die durch das Verfahren ermittelten Funktionen aj(x),ßj(y) sowie die Zahlen i/j, fij geeignet umbezeichnet, dann läßt sich die resultierende Kernmatrix K folgendermaßen darstellen. K = /0 0 0 OK1 0 0 0 K2 \: •• Die Matrize n Km (m -\ ) M: ,(m) mit Km = 0 /4m) ut] 0 o /4m)^m) V A1 52) „(m) A1 53) (m = 1,2,...) sind endlich, wenn im Algorithmus nach endlich vielen Schritten der Fall ßjri) = 0 eintritt Dagegen sind sie unendlich, wenn für abzählbar unendlich viele Schritte j gilt fij 7^ 0 . Die Anzahl der Nullzeilen bzw Nullspalten in K entspricht der Anzahl der Funktionen in den Systemen (a^(x)) bzw {ß^iy)). Ein besonders einfacher Fall liegt vor, wenn die Matrizen Km nur eine Zahl i>i = vm enthalten, also alle Zahlen ^ gleich Null sind Mit den Bezeichnungen aus 11 3 3, S 600 ergibt sich für die Lösung des unendlichen Gleichungssystems unter der Voraussetzung von fj = 0 für olj(x) € (ajj(a;)) : c. f | für ft(y)*(Ä(y)), (beliebig für ßj{y) e (ß*(y)) 11.3.6 Iteratives Verfahren Zur Lösung der Integralgleichung b f(x)= f K(x,y)ip(y)dy, c<x<d, A154a) bildet man mit cto(x) = f(x) für n = 1,2,... die Funktionen d b ßn(y) = fK(xiy)an-1(x)dx A154b) und an{x) = f K(x,y)ßn(y)dy A154c) c a Existiert eine quadratisch integrierbare Lösung (p(y) von A1.54a), dann gilt: b b d J (f(y)ßn{y)dy = J J (p{y)K{x,y)an.1(x) dx dy a c d ¦ j f(x)an-i(x)dx (n = l,2, ) A1.54d) Durch Orthogonalisierung und Normierung der nach A1.54b,c) ermittelten Funktionensysteme erhält man die Orthonormalsysteme (a*(a;)) und (/3*(y)) Wird hierzu das SCHMiDTsche Orthogonalisie- rungsverfahren verwendet, dann besitzt ß^{y) die Darstellung «y) = EW(») (n = i,2,. .) A1 54e)
11.4 Volterrasche Integralgleichungen 605 Es wird nun angenommen, daß die Lösung (p(y) der Gleichung A1 54a) die Reihendarstellung oo VW = £<*.«(!/) A1.54£) besitzt. In diesem Fall gilt für die Koeffizienten cn unter Beachtung von A1.54d): cn= <p{y)ßn(y)dv = Ylb*j / (p(y)ßj(y)dv = J26»j / f(x)aj-i(x)dx• (n 54s) a 3=1 o J'=1 c Für die Existenz einer Lösungsdarstellung A1.54f) sind die folgenden Bedingungen notwendig und hinreichend d oo d oo 1. [[f(x)}2dx = Y,\[f(x)<(x)dx\2, A1.55a) 2. £|cn|2<oo. A1.55b) { n=ll{ n=l 11.4 Volterrasche Integralgleichungen 11.4.1 Theoretische Grundlagen Eine VOLTERRAsche Integralgleichung 2 Art hat die Gestalt <p(x) = f{x) + j K(x, y)ip(y) dy. A1.56) Die Lösungsfunktion (p(x) ist für Argumente x aus dem abgeschlossenen Intervall / = [a, 6] bzw. aus dem halboffenen Intervall / = [a, oo) gesucht Man kann folgende Aussage über die Lösung der VOL- TERRAschen Integralgleichung 2. Art treffen. Sind die Funktionen f(x) für x £ I und K(x, y) auf dem Dreiecksbereich x £ I und y G [a, x] als stetig vorausgesetzt, dann existiert genau eine, für x G / stetige Lösung <p(x) der Integralgleichung. Für diese Lösung gilt: ¥>(<») = /(«) A1-57) In vielen Fällen können VOLTERRAsche Integralgleichungen 1. Art in Integralgleichungen 2 Art überführt werden Die Aussagen zur Existenz und Eindeutigkeit der Lösung gelten dann in modifizierter Form 1. Umwandlung durch Differentiation Setzt man (p(x), K(x, y) und Kx(x, y) als stetig voraus, dann kann die Integralgleichung 1. Art X f(x) = JK(x,y)<p(y)dy A158a) a durch Differentiation nach dem Parameter x überführt werden in f(x) = K(x, x)ip(x) + J —K(x, y)<p(y) dy A1.58b) a Ist K(x, x) 7^ 0 für alle x G /, dann ist die Division der Gleichung durch K(x, x) möglich, wodurch eine Integralgleichung 2. Art entsteht. 2. Umwandlung durch partielle Integration Unter der Voraussetzung der Stetigkeit von <p(x). K(x,y) und Ky(x,y) kann das Integral in A1.58a) mittels partieller Integration ausgewertet werden. Mit der Substitution ftp{y)dy = ^(x) A1.59a)
606 11 Lineare Integralgleichungen ergibt sich /(*) = [K(x,y)i;(y)}lZxa - J (|^(a,!/)) 1>(v)dy = K(x,xI>(x)- J ^K(x,y)\il>(y)dy. A1.59b) Ist K(x, x) ^ 0 für x e I, dann fuhrt die Division durch K(x, x) auf die Integralgleichung 2. Art aus deren Lösung ip(x) durch Differentiation die Lösung (p(x) von A1.58a) ermittelt werden kann 11.4.2 Lösung durch Differentiation Für einige Klassen VoLTERRAscher Integralgleichungen gelingt es, durch Differentiation der Gleichung nach dem Parameter x das Integral zu beseitigen bzw. geeignet zu substituieren. Wird die Stetigkeit von K(x, y), Kx(x, y) und (p(x) sowie im Fall einer Integralgleichung 2 Art die Differenzierbarkeit von (f(x) vorausgesetzt, so ergibt die Differentiation von X X f(x) = JK(x,yMy)dy A160a) bzw. ip(x) = f(x) + J K(x,y)<p(y)dy A160b) a a nach dem Parameter x- xr r) f'(x) = K(x,x)(p(x) + J—K(xiy)<p(y)dy bzw. A1.60c) if/(x) = f'(x) + K{x, x)ip(x) + J -^K(x, y) <p(y) dy. A1 60d) a ¦ Gesucht ist eine Funktion ip(x) für x € 0, — ) als Lösung von / cos(x — 2y)(p(y) dy = -x sin x (I) rx 1 Zweimaliges Ableiten nach x liefert cp(x)cosx — / sin(x — 2y)ip(y)dy = -(sina; + xcosx) (IIa), Jo 2 rx l ip'(x)cosx — / cos(x — 2y)(f(y)dy = cosx — -xsinx (IIb) Das in (IIb) auftretende Integral ent- Jo 2 spricht der linken Seite der Integralgleichung (I). Das ergibt (p'(x) cosx = cosa; und, da cosx ^ 0 für x e 0, — J , ip'(x) = 1, also (p(x) = x + C. Zur Bestimmung der Konstanten C setzt man in (IIa) x = 0: <p@) = 0. Somit ist C = 0, und die Lösung von (I) lautet ip(x) = x Hinweis: Ist der Kern einer VOLTERRAschen Integralgleichung ein Polynom, so gelingt es mit der Methode der Differentiation immer, die Integralgleichung in eine lineare Differentialgleichung zu überführen. Ist dabei n der Grad der höchsten im Kern auftretenden x-Potenz, so erhält man durch (n + 1)- maliges Differenzieren nach x eine Differentialgleichung der Ordnung n im Falle einer Integralgleichung 1. Art bzw. der Ordnung n + 1 für eine Integralgleichung 2. Art. Dabei wird vorausgesetzt, daß sowohl (p(x) als auch f(x) entsprechend oft differenzierbar sind. ¦ / [2(x — yJ + l]cp(y)dy = x3 (F). Dreimaliges Differenzieren nach x ergibt ip(x) + 4 / (x — Jo Jo
11.4 Volterrasche Integralgleichungen 607 K{X,y) = {';^V) fV~*' (H.62a) v 'y/ ' n für y > x. y ' y)ip(y) dy = 3x2 (IFa), <p'(x) + 4 [* (p(y) dy = 6x (H'b), (f"(x) + 4y?(x) = 6 (II'c). Die allgemeine Jo 3 Lösung dieser Differentialgleichung lautet ip(x) = A sin 2x -f B cos 2a; + - . Setzt man in (IFa) bzw. (H'b) x = 0 ein, so erhält man <p@) = 0, <p'@) = 0 und somit ^4 = 0, B = —1,5. Die Lösung der 3 Integralgleichung (F) ist also <p(x) = -A — cos2x). 11.4.3 Neumannsche Reihe zur Lösung der Volterraschen Integralgleichungen 2. Art Die Lösung einer VOLTERRAschen Integralgleichung 2 Art kann mittels der NEUMANNschen Reihe (vgl. 11.2.2, S. 587) dargestellt werden. Liegt die Gleichung X <p(x) = f(x) + \J K(x, y)<p(y) dy A1.61) a vor, so wird formal gesetzt: \K{x, 10 Damit ist A1.61) identisch mit der FREDHOLMschen Integralgleichung b <p(x) = f(x) + \JK(x,y)<p(y)dy, A1 62b) a wobei auch b = oo gelten kann. Die Lösung besitzt die Darstellung oc * <p(x) = f(x) + E A" / Kn(x, y)f(y) dy. A1 62c) Die iterierten Kerne Ki, K2,... sind durch die folgenden Gleichungen definiert: 6 x K1(x,y) = K(x,y),K2(x1y) = JK(x,r])K(T]ly)dV = JK(x,r])K(r):y)dr],... A1.62d) a y und allgemein: X Kn(xyy) = jK(x,r])Kn_1(r],y)dr]. A1.62e) y Für die iterierten Kerne gilt ebenfalls Kj(x,y) = 0 für y > x (j = 1,2,...). Falls eine Lösung von A1 61) existiert, konvergiert die NEUMANNsche Reihe (im Gegensatz zum Fall einer FREDHOLMschen Integralgleichung) für beliebige Parameter A stets gegen diese Lösung. ¦ ip{x) = 1 + A r ex-y<p{y) dy. K^x, y) = K(x, y) = ex~y , K2{x, y) = f* e*-^-* drj = ex~y(x - y),. .,Kn(x,y) = ^-^(x-yr-1. oo \n Ermittlung der Resolvente- r(x,y;\) = ex~y V] —7(x - y)n = e(x-y)(A+1). Die angegebene Reihe konvergiert bekanntlich für alle Parameter A.
608 11. Lineare Integralgleichungen Man erhält ip{x) = 1 + A f* e(x-y)(A+1) dy = 1 + Ae(A+1)x [* e~(A+1)y dy, speziell für A = -1. <p(x) = Jo Jo l-x,\^-V <p(x) = ^ (l + Ae<A+1>*) . 11.4.4 Volterrasche Integralgleichungen vom Faltungstyp Besitzt der Kern einer VOLTERRAschen Integralgleichung die spezielle Form *(*.v>-{J(x"y) £ iilil: (»¦«•> dann können zur Lösung der Gleichungen X X Jk(x-y)<p(y)dy = f(x) A1.63b) bzw. <p(x) = f(x) + J k{x - y)<p{y)dy A163c) 0 0 die Eigenschaften der LAPLACE-Transformation genutzt werden. Falls die Lapl ACE-Transformierten C{(f(x)} = $(p), C{f(x)} = F(p) und £{k(x)} = K(p) existieren, dann lauten die transformierten Probleme unter Beachtung des Faltungssatzes (s. 15.2.1.2,11., S 736) K{p)<P{p) = F(p) A1.64a) bzw. <P(p) = F(p) + K(p)$(p) A1 64b) Daraus folgt sofort. *(p) = 7?§| AL64c) bzw- *fr) = i _ K(p)' AL64d) Die Rücktransformation liefert die Lösung ip(x) des Ausgangsproblems Durch Umformung des Ausdrucks für die LAPLACE-Transformierte der Lösung der Integralgleichung 2. Art gemäß ™ = T%j-Fv + rnm™ A164e) ergibt sich, falls der Ausdruck T*wrHv A164f) die Transformierte einer Funktion h(x) ist, die Lösungsdarstellung X <p(x) = f(x) + jh(x- y)f(y) dy. A1 64g) o Die Funktion h(x — y) ist der lösende Kern der Integralgleichung. ¦ ip(x) = fix) + / ex~yip(y) dy: $(p) = F(p) + <P(p), d.h., &(p) = ?——:F{p) Die Rücktrans- formation liefert ip(x). Aus H(p) = folgt h(x) = e2x Nach A1 64g) ergibt sich die Lösungsdar- p — 2 Stellung <p(x) = f(x) + j e2^ f{y) dy.
11.4 Volterrasche Integralgleichungen 609 11.4.5 Numerische Behandlung Volterrascher Integralgleichungen 2. Art Gesucht ist die Lösung der Gleichung X ip(x) = f(x) + I K(x, y)<p(y) dy A1.65) a für x aus dem Intervall / = [a, b]. Numerische Lösungsansätze bestehen darin, das Integral durch eine Quadraturformel zu approximieren. X jK(x,y)<p(y)dy « QM(K(x, )ip( )) A1.66a) Das Integrationsintervall und somit die Quadraturformel sind von x abhängig. Das wird durch den Index [a, x] von Q[a,x]{''') zum Ausdruck gebracht. Man erhält als Näherungsausdruck für A1 65) Tp{x) = /(*) + QM(K(x, .)<?(.)) • (H.66b) Die Funktion Tp(x) ist eine Näherung für die Lösung von A1.65). Die Anzahl und Lage der Stützstellen der Quadraturformel ist von x abhängig, wodurch deren Wahl stark eingeschränkt ist. Ist £ eine Stutzstelle von Q[ayX](K(x, .)p(.)), so müssen (K(x, f )v?(f)) und insbesondere lp(£) bekannt sein. Dies erfordert aber zuvor eine Auswertung der rechten Seite von A1.66b) für x = £, was einer Quadratur über dem Intervall [a, {] entspricht. Aus diesem Grund ist die Verwendung der häufig bevorzugten GAUSSschen Quadraturformeln nicht möglich. Man löst das Problem durch die Wahl von Stützstellen a = xq < X\ < ... < Xk < ¦.. und verwendet Quadraturformeln Q[a,xn} m& Stützstellen x$, x\, .. , xn Die Funktionswerte in den Stützstellen werden abkürzend bezeichnet durch cpk = p(xk) (k = 0,1,2,.. ). Für (f0 erhält man (vgl. 11.4.1, S. 605 Po = f{x0) = f(a), A1.66c) und damit: <px = f(Xl) + <2[a,Xl](tf(zi, .)jp(.)). A1.66d) Dabei hat Q[a,xi] die Stützstellen x0 und X\ und folglich die Gestalt Q[a,Xl){K(xu .)Jp(.) = w0K(xi,x0)ipo + wiK(xuxi)(pi A1.66e) mit geeigneten Koeffizienten vüq und wi. Setzt man dieses Verfahren fort, kann man die (pk nacheinander aus der allgemeinen Beziehung Vk = /(**) + Q[a,xk)(K(xk,.)</?(.)), k = 1,2,3,.. A1.66f) bestimmen. Die Quadraturformeln Q{a,xk] haben folgende Form: k Q[a,xk]{K(xk, .)jp(.) = Y,™jkK(xk,Xj)yj. A1 66g) j=0 Damit lautet A1.66f): k <Pk = f{xk) + Y^wJkK(xk,Xj)<Pj • A1.66h) j=o Die einfachste Quadraturformel ist die linksseitige Rechteckformel (s. 19.3.2.1, S. 926). Dabei ist Wjk = Xj+i - Xj für j < k und wkk = 0. A1.66i) Man erhält damit das System Po = f{a), Pi = f(xi) + (xi - Xo)K(xi,x0)(po , A1 67a) Pl = f(x2) + {Xi - Xq)K{x2, X0)po + [X2 - X1)K(X2, Xi)(fi
610 11 Lineare Integralgleichungen und allgemein Vk = f{xk) + 52{xj+i - Xj)K(xk,Xj)<pj 3=0 A1.67b) Eine etwas genauere Approximation des Integrals gewährleistet die Trapezformel (s 19.3 2 2, S 926). Die Stutzstellen seien zur Vereinfachung äquidistant, xk = a + kh, k = 0,1,2, b i g(x) dx •• \g{x0) + 2Y,g(xj)+g(xk) L i=l Angewandt auf A1.66f), ergibt das <A) = f(a), Vk = f(xk) + ¦ K(xk, x0)ip0 + K(xk, xk)ipk + 2J2 K(x*i xj)iPj A1 67c) A1.67d) A1.67e) Die jeweils zu berechnende Größe kommt dabei auch auf der rechten Seite vor. Die Gleichungen sind aber leicht nach den gesuchten Funktionswerten umzustellen Hinweis: Mit der angeführten Methode können auch nichtlineare Integralgleichungen näherungsweise gelöst werden. In diesem Fall wird bei Anwendung der Trapezformel zur Bestimmung der ipk jedesmal die Lösung einer nichtlinearen Gleichung erforderlich sein. Dies kann man umgehen, wenn man die Trapezformel nur auf das Intervall [a, xk-i] anwendet und das Intervall [xk-i, xk] mit der linksseitigen Rechteckformel behandelt Ist h genügend klein, wird dieser Quadraturfehler die Lösung nicht sehr beeinflussen (s. [11.4]) X ¦ Die Integralgleichung ip(x) = 2+ / (x — y)tp(y) dy soll nach der Vorschrift A1.66f) mit der linkssei- o tigen Rechteckformel näherungsweise gelöst werden. Als Stützstellen werden die äquidistanten Werte xk = k • 0,1 zugrunde gelegt, d h h = 0,1. <A) =2, <Pi = f{xi) + hK(xi,x0)<po = 2 + 0,1-0,1-2-2,02, <P2 = }{x2) + h(K(x2, x0)(fo + K{x2, xi)(fi) = 2 + 0,1@,2 • 2 + 0,1 • 2,02) = 2,0602 usw. In der Tabelle sind zum Vergleich die Werte der exakten Lösung sowie der Näherungslösungen, die mittels linksseitiger Rechteckformel und Trapezformel ermittelt wurden, aufgeführt. Die Berechnung erfolgte mit der Schrittweite h = 0,l. X 0,2 0,4 0,6 0,8 1,0 exakt 2,0401 2,1621 2,3709 2,6749 3,0862 Rechteckformel 2,0602 2,2030 2,4342 2,7629 3,2025 Trapezformel 2,0401 2,1620 2,3706 2,6743 3,0852
11 5 Singulare Integralgleichungen 611 11.5 Singulare Integralgleichungen Eine singulare Integralgleichung liegt vor, wenn der Integrationsbereich des die Gleichung bestimmenden Integrals unbeschränkt ist oder der Kern Singularitäten innerhalb des Integrationsbereiches besitzt. Es wird vorausgesetzt, daß die auftretenden Integrale als uneigentliche Integrale oder als CAUCH Ysche Hauptwerte existieren (s 8 2 3, S 470ff ) Singulare Integralgleichungen unterscheiden sich in Eigenschaften und Lösungsverhalten stark von „gewöhnlichen" Integralgleichungen. In den folgenden Abschnitten werden nur einige spezielle Problemstellungen betrachtet Umfassendere Darstellungen s [11.2], [11 3], [11 7] [11 8] p0 (xo >y0) W) Abbildung 11.2 11.5.1 Abelsche Integralgleichung Eine der ersten Anwendungen von Integralgleichungen auf physikalische Probleme wurde von Abel untersucht. In einer vertikalen Ebene bewege sich ein Massenpunkt entlang einer gewissen Kurve nur unter dem Einfluß der Schwerkraft vom Punkt Po(xo, Vo) zum Punkt Pi@,0) (Abb.11.2). Die Geschwindigkeit des Teilchens in einem Punkt der Kurve beträgt ds v = - = fig(i0 ¦y). A1-68) Durch Integration ermittelt man die Fallzeit in Abhängigkeit von y0: T(y0) = j ds o yjzgivo - y) Stellt man s als Funktion von y durch s = f(y) dar, so ist /¦J_ f'{y) A„ J V2l T(y0) = 1^9 Vvo-y A1.69a) A1.69b) Es besteht nun die Aufgabe, zu gegebener Fallzeit die Gestalt der Kurve als Funktion von y0 zu bestimmen Mit den Ersetzungen A1.69c) erhält man, indem noch die Variable y0 in x umbenannt wird, die VOLTERRAsche Integralgleichung 1 Art y/2g-T(yo) = F(yo) und f'(y) = <p(y) ™-/3 <p{y) A1.69d) mit 0 < öl < 1 A1.70) Es soll die etwas allgemeinere Gleichung behandelt werden Der Kern dieser Gleichung ist für y = x nicht beschränkt In A1 70) werden formal die Variable y in £ und die Variable x in y umbenannt. Damit wird erreicht, daß sich die Lösung in der Form kp = ip(x) ergibt Die Multiplikation beider Seiten der Gleichung A1 70) mit dem Term -y^ (x — y) und die anschließende Integration nach y in den Grenzen von a bis x führt auf die Gleichung ) i (f v(fl A . f M J{*-vY-a\Uv-t)"li(*-vI- ;dy A1.71a)
612 11. Lineare Integralgleichungen Die Vertauschung der Integrationsreihenfolge auf der linken Seite dieser Gleichung ergibt Das innere Integral ist mit der Substitution y = f + (x — Qu auswertbar: J (x - y)l~a{y - 0a ~ J wa(l - uy~a ~ sin(aTr) ' 1 • CJ Der gewonnene Ausdruck wird in A1.71b) eingesetzt. Die gesuchte Funktion tp(x) wird durch anschliessende Differentiation nach x bestimmt: , x sin(mr) d f f(y) , „ ,. *<x>—r^s/trf^*- A1Jld) J y/X — y ' 7T dx J y/X — y TT 11.5.2 Singulare Integralgleichungen mit Cauchy—Kernen 11.5.2.1 Formulierung der Aufgabe Gegeben ist die Integralgleichung a(IV(i)+-/^^V(j,)% = /(I), x€T. A172) 7T 1 J W — X r * r ist ein System endlich vieler glatter, doppelpunktfreier, geschlossener Kurven in der komplexen Ebene, die ein zusammenhängendes Innengebiet S+ mit 0 G S+ und ein Außengebiet S~ bilden. Dabei liegt S+ beim Durchlauf zur Linken von r. Für die Betrachtung von Kurvensystemen, bestehend aus stuckweise glatten, offenen oder geschlossenen Kurven s. [11.3]. Eine Funktion u(x) ist auf r Holder- stetig, falls für beliebige Paare x\, x<i G T gilt: \u{xx) - u(x2)\ <K\xx-x2f, 0</?<l, K>0. A1.73) Die Funktionen a(x), f(x) und (p(x) werden als HÖLDER-stetig mit dem Exponenten ß\ und K(x, y) bezüglich beider Argumente HÖLDER-stetig mit dem Exponenten ß2 > ß\ angenommen. Der Kern K(x,y)(y — x)_1 hat für x = y eine starke Singularität. Das Integral existiert aber als CAUCHYscher Hauptwert. Mit K(x, x) = b(x) und k(x,y) = (K(x,y) — K(x,x))/(y — x) ergibt sich A1.72) in der Form (&p)(x) := a(x)tp(x) + ^ / -^- dy + -^ / k(x, y)<p(y) dy = f(x), x G T. A1.74a) 7T1 J y — X 7T1 J r * r Der Ausdruck (£(/?) (x) beschreibt in verkürzter Form die linke Seite der Integralgleichung. C ist ein singulärer Operator. Die Kernfunktion k(x,y) ist nur schwach singulär. Es gelte zusätzlich die Normalitätsbedingung a(xJ — b(xJ /0,xEr. Die Gleichung (£o<p)(x) = a(x)<p(x) + ^ / ^-dy = f(x), x G T, A1.74b) 7T1 J y — X ist die zu A1.74a) zugeordnete charakteristische Gleichung. Der Operator £0 ist der charakteristische Teil des Operators C. Die zu A1.74a) transponierte Integralgleichung lautet*
11.5 Singulare Integralgleichungen 613 Tri y z-y tti 7 \ x-y j = g(y), 2/er (ii.74c) 11.5.2.2 Existenz einer Lösung Die Gleichung (C<p)(x) = f(x) besitzt genau dann eine Lösung (p(x), wenn für alle Lösungen ip(y) der homogenen transponierten Gleichung (£Tip)(y) = 0 die Orthogonalitätsbedingung /' f(y)^(v)dy = Q A1.75a) r erfüllt ist Entsprechend besitzt die transponierte Gleichung (£Tip)(y) = g(y) genau dann eine Lösung, wenn für alle Lösungen <p(x) der homogenen Gleichung (£ip)(x) = 0 gilt. f g(x)ip(x) dx = 0 . A175b) r 11.5.2.3 Eigenschaften des Cauchy-Integrals Die Punktion $(z) = J- [ rtvl dy, zeC A1.76a) Z7T \ J V — Z r y heißt Cauchy-Integral über r Für z £ T existiert das Integral im gewöhnlichen Sinne und stellt eine holomorphe Funktion dar (s. 14.1.2, S. 694). Es gilt <£(oo) = 0. Für z = x G T sei unter A1.76a) der CAUCHYsche Hauptwert CH<P)(x) = 7T^ f — dy, xer, A176b) 2n\J y - x r y verstanden Das CAUCHY-Integral $(z) ist von S+ bzw S~ stetig auf r fortsetzbar Die Grenzwerte bei Annäherung von z an x 6 f werden mit <P+{x) bzw #~(a;) bezeichnet. Es gelten die Formeln von Plemelj und Sochozki • <P+(x) = ^(x) + (H<p)(x), *-{x) = ~ip(x) + (Hip)(x). A1 76c) 11.5.2.4 Hilbertsches Randwertproblem 1. Zusammenhang Mit der Lösung der charakteristischen Integralgleichung hängt das HiLBERTsche Randwertproblem eng zusammen. Ist <p(x) eine Lösung von A1.74b), dann ist A1.76a) eine in S+ und S~ holomorphe Funktion mit #(oo) = 0 . Gemäß der Formeln von Plemelj und Sochozki A1.76c) gilt <p(x) = <P+(x) - $-(x), 2{H(p)(x) = <P+{x) + $-{x), xeT. A1.77a) Die charakteristische Integralgleichung lautet mit _,, N a(x) — b(x) . , N fix) ,.,., __. v G(x)=i^rm und M-4&kry A177b) <£+(x) = G{x)$-(x) + g(x), xeT. A1.77c) 2. HiLBERTsches Randwertproblem Gesucht ist eine in S+ und S~ holomorphe, im Unendlichen verschwindende Funktion $(z), die auf r die Randbedingung A1 77c) erfüllt Eine Lösung $(z) des HiLBERTschen Problems ist in der Form
614 11. Lineare Integralgleichungen A1.76a) darstellbar. Zufolge der ersten Gleichung von A1.77a) ist damit eine Lösung ip(x) der charakteristischen Integralgleichung bestimmt. 11.5.2.5 Lösung des Hilbertschen Randwertproblems 1. Homogene Randbedingungen $+(x) = G(x)$-{x) xeT. A178) Die Funktion log G(x) ändert ihren Wert bei einmaligem Durchlauf der Kurve i~} um den Wert 2ir iA<, wobei Xi eine ganze Zahl ist. Die Wertänderung von logG(x) bei einmaligem Durchlauf des gesamten Kurvensystems r beträgt dann n ^27TiAz = 27riK A179a) 1=0 Die Zahl k = J2?=o ^i w^ a^s Index des HiLBERTsc/iera Problems bezeichnet. Es wird die Funktion G0(x) = {x- a0)-KU(x)G{x) A1.79b) mit U(x) = {x- ai)Al(z - a2)A2 • • • (x - an)Xn A1.79c) gebildet, wobei üq £ S+ und a/ (/ = 1,..., n), aus dem Inneren von /} beliebig, aber fest gewählt sind. Ist r = r0 eine einfache geschlossene Kurve (n = 0), dann wird U(x) = 1 gesetzt. Mit erhält man folgende spezielle Lösung des homogenen HiLBERTschen Problems, auch Grundlösung genannt: x{z) = /n-^)^J(*) fi* *€£, {1179e) v ' \ (z — a0) Kexpl(z) für zeS . v ' Die allgemeinste Lösung des homogenen HiLBERTschen Problems, die nicht im Unendlichen verschwindet, lautet für k > 0 $h{z) = X(z)PK-1(z), 2€C, A1.80) mit einem beliebigen Polynom PK-\ (z) höchstens (k— l)-ten Grades. Für k < 0 existiert nur die triviale Lösung $h(z) = 0. Im Falle k > 0 besitzt das homogene HiLBERTsche Problem k linear unabhängige, im Unendlichen verschwindende Lösungen. 2. Inhomogene Randbedingungen Die Lösung des inhomogenen HiLBERTschen Problems lautet: <t>(z) = X(z)R(z)+Mz) A1.81) mit R{z) = JL / x+9^_ z) ¦ (H-82) Ist k, < 0, dann müssen für die Existenz einer Lösung überdies die Forderungen / r *+(y) erfüllt sein 11.5.2.6 Lösung der Charakter ist ischen Integralgleichung 1. Homogene charakteristische Integralgleichung Ist $h(z) die Lösung des zugeordneten homogenen HiLBERTschen Problems, dann folgt aus A1.77a) die Lösungsdarstellung der homogenen Integralgleichung <ph(x)=0i{x)-$i(xI xeT. A1.84a)
11.5 Singulare Integralgleichungen 615 Für k < 0 existiert nur die triviale Lösung (fh(x) = 0 . Für k, > 0 lautet die allgemeine Lösung iph(x) = [X+(x) - X-(x)]PK^{x) A1 84b) mit einem Polynom PK_i höchstens vom Grad n — 1. 2. Inhomogene charakteristische Integralgleichung Ist <P(z) die allgemeine Lösung des inhomogenen HiLBERTschen Problems, dann kann die Lösung der inhomogenen Integralgleichung nach A1.77a) bestimmt werden- tp{x) = <P+(x)-<P~(x) A1.85a) = X+(x)R+{x) - X~{x)R-(x) + <P£{x) - $J-(s), x e r. A1.85b) Die Anwendung der Formeln von Plemelj und Sochozki A1.76c) auf R(z) ergibt Hx) + \nX+)[Xh H [X) 2X+(x) Einsetzen von A1.85c) in A1 85a) liefert schließlich unter Beachtung von A1.76b) und g(x) = f(x)/(a(x) + b(x)) die Lösungsdarstellung: ^=kM>+(*£){x) • R~{x) - -sä+(*£) <*> • <» «*> WJ 2(a(x)+b(x))X+(x)n > +(*+(») - *-(,)) JL / (g(y) + Jff+(j/)(j/ _ x)dy + „»(«), x£r. A1.86a) Entsprechend A1.83) müssen im Fall k < 0 für die Existenz einer Lösung zusätzlich die folgenden Bedingungen erfüllt sehr / TT^-rM^7T7-T dy = 0 (ife = 0,l, . ,-« - 1). A1.87) 7 {a(y) + b(y))X+(y) U V ; V ; ¦ Gegeben ist die charakteristische Integralgleichung aip(x) -\ : I dy = f(x) mit den konstan- 7Ti J y — x ten Koeffizienten o und 6. Mit r ist eine einfache, geschlossene Kurve bezeichnet, d.h. r = fb (n = 0). a - 6 fix) Aus A1 77b) folgt G = r und g(x) = . Da B eine Konstante ist, ist folglich k = 0. Somit ist a + b a+b a-b _, —r,2 6 5+, + 6 n(x) = lundG0 = G=^. /W = log^|-L/J_dy=(l<«J <i + o a + o Z7T1 J y — z I q {a- 6 + _, ^Tb,zei> ' d.h. x+ = 2—£,x- = i. 1, zeS-, a + b Da k = 0 ist, besitzt das homogene HiLBERTsche Randwertproblem nur <Ph(z) — 0 als im Unendlichen verschwindende Lösung Gemäß der Lösungsdarstellung A1.86a) folgt X++X- e, , X+-X- 1 f f(y) , a r, , b 1 f f(y) 7 *{X) = 2(a + b)X+ f{x) + 2(a + b)X+ Vi / J^~x * = a^T*f{x) ' ^V V, / j^*"
616 12. Fiinktionalanalysis 12 Funktionalanalysis 1. Die Fiinktionalanalysis entstand, als man erkannte, daß viele Probleme aus verschiedenen Disziplinen, z.B. aus den Natur- und Technikwissenschaften und aus der Ökonomie, gemeinsame Strukturen aufweisen. Man entdeckte allgemeingültige Prinzipien, die in enger Wechselwirkung mit der mathematischen Analysis, der linearen Algebra, der Geometrie sowie anderer Gebiete der Mathematik entstanden und entwickelte eine einheitliche Begriffswelt. 2. Unendlichdimensionale Räume Viele Probleme, deren mathematische Formulierung auf unendliche Gleichungs- und Ungleichungssysteme, Differential- oder Integralgleichungen, Approxima- tions-, Variations- und Optimierungsprobleme u.a führt, sprengen den viel zu engen Rahmen des endlichdimensionalen Raumes und verlangen als natürliche Grundlage einen unendlichdimensionalen Raum, in dem sie im allgemeinen mit Hilfe einer Operatorenbeziehung formuliert, untersucht und gelöst werden können. 3. Lineare und nichtlineare Operatoren Waren es am Anfang der Formierung der Funktional- analysis - etwa in der ersten Hälfte dieses Jahrhunderts - vorwiegend lineare oder linearisierte Probleme, die die Entwicklung einer Theorie linearer Operatoren motivierten, so bestimmen in den letzten Jahrzehnten, hauptsächlich aus den Erfordernissen praktischer Anwendungen der Funktionalanalysis resultierend, auch immer mehr nichtlineare Phänomene und ihr Zusammenspiel mit den gut entwickelten linearen Methoden das aktuelle Bild der Funktionalanalysis, was zur Herausbildung der Theorie nichtlinearer Operatoren führte Charakteristisch ist eine zunehmende Orientierung auf Anwendungen bei der Lösung von Differentialgleichungen, bei den numerischen Methoden, in der Optimierung usw , wodurch Denkweisen und Methoden der Funktionalanalysis für Ingenieure und andere Anwender unverzichtbar werden. 4. Grundstrukturen Im vorliegenden Kapitel können nur die Grundstrukturen umrissen werden: die gebräuchlichsten Typen von Räumen und einige wenige Klassen von Operatoren in diesen Räumen Die abstrakte Begriffswelt wird an einigen Beispielen erläutert, die auch in anderen Kapiteln, teilweise eigenständig erörtert worden sind, deren Lösbarkeit oder Eindeutigkeit der Lösung dort aber nur postuliert oder im Einzelfalle speziell gezeigt werden konnte. Es wird ersichtlich, daß die Funktionalanalysis für derartige und weitere Fragestellungen aus ihrem abstrakten Verständnis heraus eine ganze Reihe von allgemeinen Zusammenhängen in der Form mathematischer Sätze zur Verfügung stellt, die den Anwender in die Lage versetzen, die Lösung konkreter Probleme in Angriff zu nehmen 12.1 Vektorräume 12.1.1 Begriff des Vektorraumes Eine nichtleere Menge V heißt Vektorraum oder linearer Raum über dem Körper K der Skalaren, wenn auf V die beiden Operationen — Addition der Elemente und Vielfachenbildung mit Koeffizienten aus K - wie folgt erklärt sind. 1. Für je zwei Elemente x, y G V gibt es ein Element z = x + y eV, ihre Summe, 2. für jedes x G V und jeden Skalar (Zahl) öGK gibt es ein Element ax G V, das Produkt aus x und dem Skalar a (oder besser, das a-Vielfache des Elements x), so daß die folgenden Eigenschaften, die Vektorraumaxiome (s. 5.3.7, S 327) für beliebige Elemente x,y,z G V und Skalare q,/9gK erfüllt sind (VI) x + {y + z) = (x + y) + z. A2 1) (V2) Es existiert ein Element 0 G V , das Nullelement, so daß x + 0 = x gilt A2 2) (V3) Zu jedem Vektor x existiert ein Vektor —sc, so daß x + (—x) = 0 gilt. A2 3) (V4) x + y = y + x A2.4) (V5) l-x = x, 0-x = 0. A2.5) (V6) a(ßx) = {aß)x A2 6)
12 1 Vektorräume 617 (V7) {a + ß)x = ax + ßx. A2 7) (V8) a{x + y) = ax + ay. A2.8) V heißt reeller bzw. komplexer Vektorraum, je nachdem, ob K der Körper R bzw. C der reellen bzw. der komplexen Zahlen ist. Die Elemente von V nennt man Punkte oder, in Anlehnung an die Lineare Algebra, auch Vektoren, wobei in der Funktionalanalysis, ohne die Verständlichkeit oder die Übersichtlichkeit zu beeinträchtigen, auf die Kennzeichnung x oder x verzichtet wird In einem Vektorraum V gibt es zu jedem x G V ein eindeutig bestimmtes „gegenüberliegendes" Element -x G V, so daß x + (—x) = 0 gilt, indem man —x = (—l)x setzt. Somit ist auf V auch die Differenz x — y zweier beliebiger Vektoren x,y G V als x — y = x-\- (—y) erklärt Daraus ergibt sich die eindeutige Lösbarkeit der Gleichung x + y = z für vorgegebene Elemente y und z . Die Lösung ist dann gleich x = z — y Aus den Axiomen (VI) bis (V8) ergeben sich die folgenden Eigenschaften: • das Nullelement ist eindeutig definiert, • falls ax = ßx und x ^ 0 , dann et = ß, • falls ax = ay und a/0, dann x = y , • —(ax) = a • (—x). 12.1.2 Lineare und affin—lineare Teilmengen 1. Lineare Teilmenge Linearer Unterraum, lineare Mannigfaltigkeit oder linearer Teilraum eines Vektorraums V heißt eine nichtleere Teilmenge Vo, wenn mit zwei beliebigen Elementen x, y G Vo und zwei beliebigen Skalaren q, ß G K ihre Linearkombination ax + ßy in Vo liegt Vo ist selbst wieder ein Vektorraum, genügt also den Axiomen (VI) bis (V8) Der Teilraum V0 kann mit V zusammenfallen oder auch nur aus dem Nullelement bestehen; in diesem Falle heißt er trivial 2. Affiner Teilraum Eine Teilmenge eines Vektorraumes V der Gestalt {xo + y.yGVo}, A2 9) wobei Xo G V ein fixiertes Element und Vo ein linearer Teilraum ist, heißt affin-linearer Teilraum oder affine Mannigfaltigkeit, die man (im Falle von xo ^ 0) als Verallgemeinerung einer nicht durch den Nullpunkt verlaufenden Geraden oder Ebene in R3 ansehen kann 3. Lineare Hülle Der Durchschnitt einer beliebigen Anzahl linearer Teilräume in V ist wiederum ein linearer Teilraum. Demzufolge existiert für jede nichtleere Teilmenge E C V ein kleinster linearer Teilraum lin(E) oder [E] in V, der E enthält, nämlich der Durchschnitt aller linearen Teilräume, in denen E enthalten ist. Die Menge lin(E) heißt lineare Hülle der Menge E. Sie ist mit der Menge aller (endlichen) Linearkombinationen QiXi+a2x2+ . +anxn, A2 10) die aus Elementen x\, x2, .., xn G E und Skalaren a\, a2, ., a;n G K gebildet werden, identisch 4. Beispiele für Vektorräume von Folgen ¦ A Vektorraum Kn: Seien n eine fixierte natürliche Zahl und V die Menge aller n-Tupel, d.h. aller endlichen aus n Gliedern bestehenden Folgen von Skalaren {(£i,..., £n) : & G K, i = 1,..., n} Die Operationen seien komponenten- oder gliedweise erklärt, d h , sind x = (£i,. . ,£n) und y = G71, , rjn) zwei beliebige Elemente aus V und a ein beliebiger Skalar, d.h. a G K , dann setzt man x + y = (Zi+Tju .,& + */„), A2.11a) a-x = (<*&,...,<*£„). A211b) Auf diese Weise erhält man den Vektorraum Kn , insbesondere also für n = 1 die linearen Räume R i oder C. i Dieses Beispiel kann in zweierlei Hinsicht verallgemeinert werden (s. Beispiele B und C)- i
618 12 Funktionalanalysis ¦ B Vektorraum s aller Zahlenfolgen: Nimmt man als Elemente unendliche Folgen x = {£n}^=i < (nEK und behält die gliedweise erklärten Operationen gemäß A2.11a) und A2.11b) bei, so erhält man den Vektorraum s aller Zahlenfolgen. ¦ C Vektorraum cp (auch c0o) aller finiten Zahlenfolgen: Es sei V die Menge aller Elemente aus s , die nur endlich viele von Null verschiedene Glieder besitzen. Die Anzahl der von Null verschiedenen Glieder ist im allgemeinen individuell vom Element abhängig Der so entstehende - wieder mit den gliedweise erklärten Operationen versehene - Vektorraum wird mit <p oder auch mit c0o bezeichnet und heißt Raum aller finiten Zahlenfolgen. ¦ D Vektorraum m aller beschränkten Folgen: Eine Folge x = {fn}SLi gehört zu m genau dann, wenn 3CX > 0 mit |fn| < Cx , Vn = 1,2,.. Man trifft häufig auch die Bezeichnung 1°° für diesen Vektorraum. ¦ E Vektorraum c aller konvergenten Folgen: Es gilt x = {£n}JS=i £ c genau dann, wenn es eine solche Zahl £0 € K gibt mit der Eigenschaft, daß für V e > 0 ein Index n0 = n0(e) existiert, so daß für alle n > n0 gilt |fn - f0| < e (s. 7.1.2, S. 421) ¦ F Vektorraum c0 aller Nullfolgen: Der Vektorraum c0 aller Nullfolgen, d h der Teilraum von c, der aus allen zu Null (£0 = 0) konvergenten Folgen besteht. ¦ G Vektorraum lp: Mit \p A < p < oo) ist der Vektorraum aller Folgen x = {^n}^=i bezeichnet, für die die Reihe X)S5ii |£n|p konvergiert. Daß die Summe zweier Folgen aus lp wieder eine Folge aus lp ist, d.h. eine konvergente Reihe aus den p-ten Potenzen der Absolutbeträge ihrer Glieder besitzt, folgt aus der MlNKOWSKlschen Ungleichung (s. 1.4.2.12, S. 33) Hinweis: Für die in den Beispielen A bis G eingeführten Vektorräume von Folgen gelten die folgenden Inklusionen: </?Cc0CcCmCs und <p C F C l9 C c0, wobei 1 < p < q < oo . A2.12) 5. Beispiele für Vektorräume von Funktionen ¦ A Vektorraum F(T): Sei V die Menge aller reell- oder komplexwertigen Funktionen auf einer Menge T, wobei für Funktionen die Operationen punktweise erklärt werden, d.h., sind x = x(t) und y = y(t) zwei beliebige Elemente aus V und a ein beliebiger Skalar, d.h. a € K , dann definiert man die Elemente x + y und a • x wie folgt: x + y = {x + y){t) = x(t) + y{t) V* G T, A2.13a) a-x = {ax){t) = a-x(t) MteT. A213b) Der auf diese Weise erhaltene Vektorraum wird mit T(T) bezeichnet. Teilräume dieses Vektorraumes sind u.a. die Räume in den folgenden Beispielen ¦ B Vektorraum B(T) oder M(T): Der Raum B(T) aller auf der Menge T beschränkten Funktionen. Häufig wird dieser Vektorraum auch mit M(T) bezeichnet Im Falle von T = N erhält man den Raum .M(N) = m aus Beispiel D im vorigen Abschnitt ¦ C Vektorraum C([a, 6]): Die Menge C([a, b]) aller auf dem Intervall [a, b] stetigen Funktionen (s 2 1 5.1, S. 58). ¦ D Vektorraum C(fe)([a, b]): Sei k G N , k > 1. Die Menge C(fc)([a, b]) aller Funktionen, die auf dem Intervall [a, b] A;-mal stetig differenzierbar sind (s. 6.1, S. 394-399), ist ein Vektorraum In den Randpunkten a und b des Intervalls [o, b] sind die Ableitungen als rechts- bzw. linksseitige zu verstehen. Hinweis: Für die in den Beispielen A bis D dieses Abschnitts bereitgestellten Vektorräume gelten im Falle von T — [a,b] die Teilraumbeziehungen C(k)({a,b}) C C{[a,b}) C B{[a,b}) C F([a,b}) A2.14) ¦ E Vektor-Teilraum C([a, b]): Für einen beliebig fixierten Punkt to E [a,b] bildet die Menge {x E C([a, b])- x(to) = 0} einen linearen Teilraum von C([a,b]).
12.1 Vektorräume 619 12.1.3 Linear unabhängige Elemente 1. Lineare Unabhängigkeit Eine endliche Teilmenge {x\, , xn} eines Vektorraumes V heißt linear unabhängig, wenn aus ol\X\ + • + ot-nXn — 0 immer a\ = • • • = an = 0 A2 15) folgt Anderenfalls heißt sie linear abhängig Hat man ct\ = • • - = an = 0 und X\,. ,xn beliebige Vektoren aus V, dann ist aufgrund der Vektorraumaxiome a\X\ + • • • + anxn trivialerweise das Null- element von V Lineare Unabhängigkeit der Vektoren x\, . , xn bedeutet die Darstellung des Nullele- ments 0 = a\Xi -\ \- anxn ausschließlich nur mit a\ = • • = an = 0 Dieser wichtige Begriff ist aus der linearen Algebra gut bekannt (s 5.3 7.1, S 327) und diente bereits zur Definition eines Fundamentalsystems von Lösungen für homogene Differentialgleichungen (s. 9 1.2.3,2., S. 518). Eine unendliche Teilmenge E C V heißt linear unabhängig, wenn jede endliche Teilmenge von E linear unabhängig ist. Anderenfalls heißt E wieder linear abhängig. ¦ Bezeichnet man mit e^ die Folge, deren Glieder bis auf das k-te alle gleich 0 sind und das A;-te Glied gleich 1 ist, dann liegt e^ im Raum (p und demzufolge in jedem Folgenraum Die Menge {ei, e2, ..} ist linear unabhängig in allen diesen Räumen. Im Raum C([0,7r]) ist z B. das Funktionensystem 1, sinnt, cosnt (n — 1, 2,3,...) linear unabhängig, wohingegen die Funktionen 1, cos 2t, cos21 linear abhängig sind (s. B.98), S 81) 2. Basis und Dimension eines Vektorraumes Eine linear unabhängige Teilmenge B aus V , die den gesamten Raum V erzeugt, d h. für die lin(B) = V gilt, nennt man (algebraische) Basis oder H.AMELsche Basis des Vektorraumes V (s. 5.3.7.2, S. 327). Also ist B = {x$ (GH} genau dann eine Basis von V , wenn sich jeder Vektor x G V in der Form x = S^€H asxz darstellen läßt, wobei die Koeffizienten a^ eindeutig bestimmt sind und lediglich eine endliche (von x abhängige) Anzahl von ihnen von Null verschieden ist Jeder nichttriviale Vektorraum V (d.h. V / {0}) besitzt wenigstens eine algebraische Basis, und zu jeder linear unabhängigen Teilmenge E aus V gibt es eine algebraische Basis von V , die E enthält Ein Vektorraum V heißt m-dimensional oder von der Dimension m, wenn es in ihm eine Basis aus m Vektoren gibt Das bedeutet, es existieren in V m linear unabhängige Vektoren, und jedes System von ra + 1 Vektoren ist linear abhängig. Ein Vektorraum heißt unendlichdimensional, wenn er keine endliche Basis besitzt, d.h , wenn es für jede natürliche Zahl m in V stets m linear unabhängige Vektoren gibt Bis auf den Raum Kn , dessen Dimension gleich n ist, sind alle anderen Vektorräume in den Beispielen B bis L unendlichdimensional Der Teilraum lin({l,t,t2}) C C([a,6]) ist dreidimensional Wie im endlichdimensionalen Falle haben auch in einem unendlichdimensionalen Vektorraum V zwei Basen stets die gleiche Mächtigkeit (Kardinalzahl), die man mit dim(y) bezeichnet. Die Dimension ist somit eine Invariante des Vektorraumes, hängt also nicht von der konkreten Auswahl einer algebraischen Basis ab. 12.1.4 Konvexe Teilmengen und konvexe Hülle 12.1.4.1 Konvexe Mengen Eine Teilmenge C eines reellen Vektorraumes V heißt konvex, wenn für jedes Paar von Vektoren x.y G C alle Vektoren der Form \x + A - X)y, 0 < A < 1 ebenfalls zu C gehören Mit anderen Worten, die Menge C ist konvex, wenn sie mit je zwei Elementen die gesamte Verbindungsstrecke {Ax + A-A)y 0<A<1}, A2.16) auch Intervall genannt, zwischen x und y enthält (Beispiele konvexer Mengen in R2 s die mit A und B bezeichneten Mengen in der Abb. 12.5) Der Durchschnitt beliebig vieler konvexer Mengen ist wieder eine konvexe Menge, wobei vereinbarungsgemäß die leere Menge als konvex angesehen wird. Demzufolge existiert zu jeder Teilmenge E C V eine kleinste konvexe Menge, die E enthält, nämlich der Durchschnitt aller konvexen und E enthaltenden
620 12 Funktionalanalysis Teilmengen von V Sie heißt konvexe Hülle der Menge E und wird mit co (E) bezeichnet, co (E) ist mit der Menge aller konvexen Linearkombinationen von Elementen aus E identisch, d.h., co(E) besteht aus allen Elementen der Form Ai^i H \- Xnxn , wobei X\, ., xn beliebige Elemente aus E sind und \ € [0,1] der Gleichung AH h A„ = 1 genügen. Lineare und affine Teilräume sind stets konvex 12.1.4.2 Kegel Eine nichtleere Teilmenge K eines (reellen) Vektorraums V nennt man einen (konvexen) Kegel, wenn sie den folgenden Bedingungen genügt* 1. AT ist eine konvexe Menge. 2. Aus x e K und A > 0 folgt Xx e K. 3. Aus x e K und —x € K folgt x = 0 Ein Kegel ist auch durch 3. zusammen mit aus x,y e K und , A, ß > 0 folgt Xx + fj,y e K A2.17) charakterisiert. ¦ A: Die Menge R" aller Vektoren x = (&,...,£«) mit nichtnegativen Komponenten ist ein Kegel in Rn. ¦ B: Die Menge C+ aller reellen stetigen Funktionen auf [a, b] mit nichtnegativen Werten ist ein Kegel im Raum C([a, b]). ¦ C: Die Menge aller reellen Zahlenfolgen {Cn}^=i mit nichtnegativen Gliedern (also £n > 0, Vn) ist ein Kegel in s. Analog ergeben sich Kegel in den Vektorräumen der Beispiele C bis G von S 617, wenn man jeweils die Menge der nichtnegativen Folgen in diesen Räumen betrachtet. ¦ D: Die Menge C C lp A < p < oo), bestehend aus allen Folgen {£n}5JLi, für die (X) £lSn|p<a (o>0) A2.18) gilt, ist eine konvexe Menge in lp, die offenbar kein Kegel ist. ¦ E: Beispiele aus R2 s. Abb. 12.1: a) konvexe Menge, kein Kegel, b) nicht konvexe Menge, c) konvexe Hülle Abbildung 12 1 12.1.5 Lineare Operatoren und Funktionale 12.1.5.1 Abbildungen Eine Abbildung T. D —? Y der Menge DcXin die Menge Y heißt • injektiv, wenn T(x) = T(y)=*x = y, • surjektiv, wenn für V y € Y ein x G D mit T(x) = y existiert, A2.19) A2 20)
12 1 Vektorräume 621 • bijektiv, wenn T sowohl injektiv als auch surjektiv ist D wird Definitionsbereich des Operators T genannt und mit Dt oder D(T) bezeichnet, während die Teilmenge {y E Y 3x E Dt mit Tx = y} aus Y Wertebereich des Operators T heißt und mit 1Z(T) oder Im(T) bezeichnet wird. 12.1.5.2 Homomorphismus und Endomorphismus Seien X und Y zwei Vektorräume über ein und demselben Körper K und D eine lineare Teilmenge aus X. Eine Abbildung T D —> Y heißt linear, lineare Transformation, linearer Operator oder Homomorphismus, wenn für beliebige x,y E D und a, ß E K stets gilt: T(ax + ßy) = aTx + ßTy . A2.21) Für einen linearen Operator T bevorzugt man in Anlehnung an lineare Funktionen die Bezeichnung Tx . während für allgemeine Operatoren T(x) steht. N(T) = {x E X Tx = 0} ist der Nullraum oder Kern des Operators T und wird mit Ker{T) bezeichnet Als Endomorphismus von X bezeichnet man eine lineare Abbildung des Vektorraumes X in sich Ist T eine injektive lineare Abbildung, so ist die aus K{T) durch y\—? x , so daß Tx = y , y E K(T) A2.22) definierte Abbildung T~l. 1Z(T) —> X linear und heißt Inverse oder Umkehrabbildung von T. Ist Y der Vektorraum K , so nennt man eine lineare Abbildung / X —> K ein lineares Funktional oder eine Linearform 12.1.5.3 Isomorphe Vektorräume Eine bijektive lineare Abbildung Tm X —> Y heißt Isomorphismus der Vektorräume X und Y. Die Räume nennt man im Falle der Existenz eines Isomorphismus isomorph. 12.1.6 Komplexifikation reeller Vektor räume Jeden reellen Vektorraum V kann man zu einem komplexen Vektorraum V erweitern Die Menge V besteht aus allen Paaren (x,y) mit x,y G V Die Operationen (Addition und Vielfaches mit einer komplexen Zahl a + ib G C) werden für diese Paaie wie folgt festgelegt. (xi.y1) + {x2,y2) = {xi +£2,3/1+2/2), A2 23a) (a + ib)(x, y) = (ax - by, bx + ay) A2.23b) Da insbesondere (.T, y) = (.r, 0) + @, y) und i(y, 0) = @ + il)(j/, 0) = @ • y - 1 • 0, \y + 0 • 0) = @, y) A2.24) gilt, kann für das Paar (x, y) nun auch x + \y geschrieben werden. Die Menge V ist damit ein komplexer Vektorraum, in dem die Menge V mit dem linearen Teilraum V0 = {(#, 0). x G V} identifiziert wird, also x als (x, 0) oder als x + i0 aufgefaßt wird Die beschriebene Prozedur nennt man Komplexifikation des Vektorraums V Eine linear unabhängige Teilmenge in V ist auch in V linear unabhängig Gleiches gilt für eine Basis in V , woraus sich dim(V) = dimiy) ergibt 12.1.7 Geordnete Vektorräume 12.1.7.1 Kegel und Halbordnung Ist in einem reellen Vektorraum V ein Kegel K fixiert, so kann für gewisse Paare von Vektoren aus V eine Ordnungsrelation eingeführt werden, indem man für x, y G V mit x — y G K einfach x > y oder y < x schreibt und sagt, daß x größer oder gleich y bzw y kleiner oder gleich x ist. Man nennt V oder genauer des Paar (V, K) einen durch den Kegel K geordneten oder teilweise geordneten Vektoriaum. Ein Element x nennt man dann positiv, wenn x > 0 oder, gleichbedeutend damit, x G K gilt Außerdem ist K = {x G V. x > 0} A2.25)
622 12 Funktionalanalysis Bereits am Beispiel des mit dem ersten Quadranten als Kegel K(= R+) geordneten Vektorraumes R2 wird eine typische Erscheinung in geordneten Vektorräumen ersichtlich, auf die mit den Begriffen ,,Halbordnung" oder „teilweise" bereits hingewiesen wurde, nämlich, daß nicht beliebige zwei Vektoren vergleichbar sein müssen. Die aus den Vektoren x = A, — 1) und y = @, 2) gebildeten Differenzen, also die Vektoren x — y = A, —3) und y — x = (—1,3), liegen nicht in K , so daß weder x > y noch x < y gilt Die durch einen Kegel in einem Vektorraum eingeführte Ordnung ist also lediglich eine teilweise oder partielle Es läßt sich zeigen, daß die Relation > die folgenden Eigenschaften besitzt @1) x>xVx£V (Reflexivität) A2.26) @2) Aus x > y und y > z folgt x > z (Transitivität). A2 27) @3) Aus x > y und a > 0, a G R folgt ax > ay A2.28) @4) Aus xi > yi und x2 > 2/2 folgt xx + x2 > y\ + 2/2 • A2 29) Umgekehrt, ist ein Vektorraum V mit einer Ordnungsrelation versehen, d.h., für gewisse Paare seiner Elemente ist eine binäre Operation > erklärt, die den Axiomen (Ol) bis @4) genügt, dann setzt man V+ = {x G V- x > 0} A2 30) und kann zeigen, daß V+ ein Kegel ist. Die jetzt durch V+ in V einführbare Ordnung >v+ ist identisch mit der vorhandenen Ordnung > ; folglich sind die beiden aufgezeigten Möglichkeiten der Einführung einer Ordnung in einem Vektorraum äquivalent. Ein Kegel K C X heißt erzeugend, wenn jedes Element x £ X als x = u — v mit u,v G K dargestellt werden kann. Man schreibt dafür auch X = K-K ¦ A: Die Ordnung im Raum s (s S. 618) wird durch den Kegel # = {z = {U~=r£n>0 Vn} A2 31) (s. Beispiel C aus A2 1.4)) eingeführt. In den Folgenräumen (s. A2 12)) betrachtet man die natürliche koordinatenweise Ordnung Sie ergibt sich mit Hilfe des Kegels, den man in einem solchen Raum als Durchschnitt von K (s A2.31)) mit dem jeweiligen Raum erhält Die positiven Elemente in diesen geordneten Vektorräumen sind dann jeweils die Folgen mit nicht negativen Gliedern Selbstverständlich können auch andere Kegel und damit auch von der natürlichen Halbordnung verschiedene Ordnungen in diesen Räumen betrachtet werden (s. [12.20], [12.22]) ¦ B: In den reellen Funktionenräumen T{T), B{T), C([a:b]) und C^([a,b]) (s. 12 1 2,5., S 618) erklärt man x > y für zwei Funktionen x und y durch x(t) > y(t) W eT bzw W G [a, b] die natürliche Ordnung, in der x > 0 gerade für eine auf T überall nichtnegative Funktion x steht. Die entsprechenden Kegel bezeichnet man üblicherweise wieder mit F+{T), B+(T) usw Es ist also beispielsweise C+ = C+(T) = F+{T)C)C(T) 12.1.7.2 Ordnungsbeschränkte Mengen Sei E eine beliebige nichtleere Menge eines geordneten Vektorraumes V. Ein Element z G V, für das x < z , V x G E gilt, heißt obere Schranke der Menge E Eine untere Schranke für E ist ein Element u eV mit u < x , V x G E . Für zwei Elemente x, y G V mit x < y definiert man die Menge [x,y] = {veV x<v<y} A2 32) und nennt sie Ordnungsintervall oder @)-Intervall. Offenbar sind x bzw. y untere bzw obere Schranke der Menge [x,y], wobei diese der Menge sogar angehören Eine Menge E C V heißt nun ordnungs- oder einfach (o)- beschränkt, wenn E Teilmenge eines Ordnungsintervalls ist, d h., wenn zwei Elemente u,z eV existieren, so daß u < x < z , V x G E oder, was äquivalent dazu ist, E C [w, z] gilt Eine von oben beschränkte bzw von unten beschränkte
12.1 Vektorräumt 623 Menge ist eine Menge, für die eine obere bzw. eine untere Schranke in V existiert. 12.1.7.3 Positive Operatoren Ein linearer Operator (s. [12.2], [12.20]) T: X —? Y des geordneten Vektorraums X = (X,X+) in den geordneten Vektorraum Y = (Y, Y+) heißt positiv, wenn gilt: T(X+)cY+, d.h. Tx>0 für alle x>0. A2.33) 12.1.7.4 Vektorverbände 1. Vektorverband Im Vektorraum R1 der reellen Zahlen sind die Begriffe (o)-Beschränktheit und Beschränktheit (im herkömmlichen Sinne) identisch. Es ist bekannt, daß jede von oben beschränkte Menge reeller Zahlen in R1 ihr Supremum - die kleinste aller oberen Schranken - besitzt Analog, wenn eine Menge reeller Zahlen von unten beschränkt ist, dann besitzt sie ihr Infimum - die größte aller unteren Schranken. In einem allgemeinen geordneten Vektorraum kann die Existenz von Supremum und Infimum im allgemeinen nicht einmal für endliche Teilmengen nachgewiesen, sondern muß per Axiom gefordert werden Ein geordneter Vektorraum V heißt Vektorverband oder linearer Verband (in der englischsprachigen Literatur auch RlESZ space bzw. vector lattice, in der russischsprachigen Literatur auch K-Lineal), wenn für zwei beliebige Elemente x, y G V ein Element z G V mit den folgenden Eigenschaften existiert: 1. x < z und y < z, 2. ist u G V mit x < u und y <u, dann gilt z <u. Ein solches Element z ist eindeutig bestimmt, wird mit x V y bezeichnet und das Supremum von x und y (genauer: Supremum der aus den Elementen x und y bestehenden Menge) genannt. In einem Vektorverband existiert zu je zwei Elementen x und y auch stets das Infimum, das mit xAy bezeichnet wird Zu Anwendungen positiver Operatoren in Vektorverbänden s. u. a. [12.3]. Ein Vektorverband, in dem jede nichtleere, von oben beschränkte Teilmenge E ein Supremum supB?) hat (analog, in dem jede nichtleere, von unten beschränkte Teilmenge ein Infimum inf(E') hat), heißt DEDEKiND-komplett oder if-Raum (KANTOROVICH-Raum). ¦ A: Im Vektorverband F([a, b]) (s. 12.1.2,5., S. 618) wird das Supremum von zwei Punktionen x,y punktweise nach der Formel (xVy)(t) = max{x(t),y(t)} V<€ [a,6] A234) berechnet. Im Falle von [a, b] = [0,1], x(t) = l-\t und y{t) = t2 (Abb.12.2) ergibt sich für t w \u\ J1 - §t, falls 0 < * < |, ,10Q-* (*v *)W = | 1», felis i < * < i. A2'35) ¦ B: Die Räume C([a,b]) und B([a,b]) (s. S. 618) sind ebenfalls Vektorverbände, während der geordnete Raum C^ ([a, b]) kein Vektor verband ist, da ^ das Minimum oder Maximum zweier Funktionen im allgemeinen eine Funk- t tion sein kann, die nicht in jedem Punkt aus [a, b] differenzierbar zu sein braucht. Ein linearer Operator T : X —> Y des Vektorverbandes X in einen Vektorverband Y heißt Vektorverbandshomomorphismus oder Homomorphismus Abbildung 12.2 der Vektorverbände, wenn für alle x, y G X gilt: T{x\/y)=Tx\/Ty und T{x Ay) = Tx ATy. A2.36) 2. Positiver und negativer Teil, Modul eines Elements Für ein beliebiges Element x eines Vektorverbandes V heißen die Elemente :r+ = :rV0, x_ = (-x)V0 und |x| = x+ + x_ A2.37)
624 12. Funktionalanalysis positiver Teil, negativer Teilund Modul des Elements x. Für jedes Element x G V sind die drei Elemente x+, x-, \x\ positiv, wobei die folgenden Beziehungen gelten x < x+ < \x\, x = x+ — £_, i+Ax_ = 0, \x\=x\/(—x), A2.38a) (x + y)+ < x+ + y+ , (z + 2/)_ < x. + y_ , |z + y| < |z| + \y\, A2.38b) aus x < y folgen x+ < y+ und £_>?/_ A2 38c) sowie bei beliebigem a > 0 (ax)+ = ax+, (ax)- = öi. , |ax|=a|x|. A2 38d) k x+(t) b 0 Abbildung 12.3 x (t) b ai/ lxl(t) b In den Vektorverbänden .F([a, 6]) und C([a, 6]) erhält man für eine Funktion x(t) ihren positiven und negativen Teil sowie ihren Modul mit Hilfe der folgenden Formeln (Abb. 12.3): n\ _ M*), falls XM ^°. X+W_\ 0, falls x(t)<0, 0, falls z(*) > ( r(t), falls z(£) < 0 ^ = {_x(:9'^*w>0* A2.39b) |x|(t) = |x(*)| Vt€[a,6] A2 39a) A2.39c) 12.2 Metrische Räume 12.2.1 Begriff des metrischen Raumes Auf einer Menge X sei jedem Paar von Elementen x.y E X eine reelle Zahl p(x, y) zugeordnet, so daß für beliebige Elemente x, y, z G X die folgenden Eigenschaften, die Axiome des metrischen Raumes, erfüllt sind: (Ml) p(x,y) > 0 und p{x,y) = 0 genau dann, wenn x = j (M2) p(x,y) = p(y,x) (M3) p(x,y) <p{x,z) + p{z,y) (Nichtnegativität), A2 40) (Symmetrie), A2 41) (Dreiecksungleichung). A2 42) Eine Funktion p • X x X —> R+ mit den Eigenschaften (Ml) bis (M3) heißt Metrik. Distanz oder Abstand auf der Menge X , und das Paar X = (X, p) heißt metrischer Raum Jede Teilmenge Y eines metrischen Raumes X = (X, p) kann auf natürliche Weise in einen (selbständigen) metrischen Raum verwandelt werden, indem man die Metrik p des Raumes X auf die Menge Y einschränkt, d h nur auf der Menge Y x Y betrachtet Der Raum (Y, p) heißt Teilraum des metrischen Raumes X. ¦ A: Die Mengen Rn und Cn , versehen mit der euklidischen Metrik p(x,y) ¦ \\J2\^-Vk\2 für zwei Punkte x = (£i,..., fn) und y = G71, rjn), sind metrische Räume. ¦ B: Die Funktion p{x,y) = max \£k - nk\ l<k<n A2 43) A2.44)
12.2 Metrische Räume 625 definiert für die Vektoren x = (£1,..., £n) und y = (r)\,.. .rjn) einen metrischen Raum in Rn und Cn, die so genannte Maximum-Metrik. Wenn x = (£1,..., £n) eine Näherung des Vektors x ist, dann ergibt sich die maximale Abweichung von x zu max |^ — £k\- l<k<n Die Metriken A2 43) und A2.44) liefern für den Fall n = 1 jeweils den Absolutbetrag \x - y\ in den Mengen R = R1 und C der reellen bzw. der komplexen Zahlen. Die Funktion pfay) = £l& ¦Vk\ A2 45) für die Vektoren x, y € Rn oder (Cn) definiert eine Metrik in Rn und Cn, die so genannte Maximalwert- Metrik Die Metriken A2 43), A2.44) und A2.45) reduzieren sich für n = 1 auf den absoluten Wert \x — y\ in R = R1 und C (die Mengen der reellen und komplexen Zahlen). ¦ C: Endliche 0-1-Folgen, z.B. 1110 und 010110, nennt man in der Kodierung Wörter. Zählt man die Stellen, an denen sich zwei gleich lange Wörter (der Länge n) unterscheiden, also x = (£i,..., £n), y = (?7i, • • •, Vn), 6fc, Vk € {0,1} , p(x, y) = Anzahl der k G {1,..., n} mit (k ¥" Vk, dann entsteht in der Menge aller Wörter der Länge n eine Metrik, der HAMMING-Abstand, z.B. p(A110), @100)) = 2. ¦ D: In der Menge m und ihren Teilmengen c und Co (s. A2.12)) definiert man eine Metrik durch p{x,y) = sup|&-7fc|. A2 46) k ¦ E: In der Menge \p A < p < oo) der Folgen mit absolut konvergenter Reihe £J5=i l£n|p betrachtet man die folgende Metrik- P(x,l \\Jl\in-Vn\P- \n=l F: In der Menge C([a, b]) betrachtet man die Metrik p{x,y)= max \x(t)-y(t)\. te[a,b] G: In der Menge C^([a, b]) definiert man als Metrik: A2.47) A2.48) p(x,y) = ^maxy\t)-y«\t)\. i=o *€(a<6l A2.49) ¦ H: In der Menge Lp(f2) A < p < oo) aller Aquivalenzklassen von fast überall auf einem beschränkten Gebiet Cl C Rn definierten LEBESGUE-meßbaren, zur p-ten Potenz summierbaren Funktionen (s 12.9, S. 655) ist eine Metrik definiert durch Pfay) ¦¦ J\x(t)-y(t)\PdfjL. A2 50) a) @,1) ¦)•£ {(x/y):1xV^D feöM b) @,1) ap Abbildung 12.4
626 12 Funküonalanalysis 12.2.1.1 Kugeln, Umgebungen und offene Mengen In einem metrischen Raum X = (X, p), dessen Elemente auch Punkte heißen, nennt man für eine reelle Zahl r > 0 und einen fixierten Punkt .xo die Mengen B(x0,r) = {xeX p(x,x0)<r}, A2 51) B(x0,r) = {x€X p(x,x0)<r] A2 52) offene bzw abgeschlossene Kugel mit dem Radius r und dem Zentrum xq Im Vektorraum R2 ergeben sich mit den Metriken A2.43). A2 44, A2 45) für x0 = 0 und r = 1 als Kugeln die in den Abb.l2.4a,b,c dargestellten Mengen Eine Teilmenge U eines metrischen Raumes X = (X. p) heißt Umgebung des Punktes x0 , wenn x0 mit einer ganzen offenen Kugel zu U gehört, also es 3r > 0 , so daß B(x0, r) C U gilt Eine Umgebung U des Punktes x bezeichnet man auch mit U(x). Offenbar ist jede Kugel auch Umgebung ihres Zentrums, eine offene Kugel ist sogar Umgebung jedes ihrer Punkte. Man nennt einen Punkt xq inneren Punkt einer Menge AcX, wenn x0 mit einer Umgebung zu A gehört, also es existiert eine Umgebung U von x0 mit Xo E U C A Schließlich heißt eine Teilmenge eines metrischen Raumes offen, wenn alle ihre Punkte innere Punkte sind. Die (bisher nur so benannten) offenen Kugeln in jedem beliebigen metrischen Raum, insbesondere alle offenen Intervalle aus R, sind die Prototypen offener Mengen Die Gesamtheit aller offenen Mengen genügt den folgenden Axiomen der offenen Mengen: • Sind Ga\/a € / offen, dann ist auch die Menge \JQei Ga offen. • Sind Gi, Gi,.. , Gn endlich viele, beliebig offene Mengen, dann ist auch die Menge HaUi Gu offen. • Die leere Menge 0 ist vereinbarungsgemäß offen Man nennt eine Teilmenge A eines metrischen Raumes beschränkt, wenn für ein gewisses Element x0 (das nicht unbedingt der Menge A angehören muß) und eine gewisse Zahl R > 0 die Menge A in der Kugel B{xq, R) liegt, wofür man auch p(x, xq) < R (V x E A) schreibt 12.2.1.2 Konvergenz von Folgen im metrischen Raum Seien X = (X,p) ein metrischer Raum, x0 6 X ein Punkt und {xn}™=l, xn G X eine Folge von Elementen in X Die Folge {xn}^=l heißt zum Punkt xq konvergent, wenn es zu jeder Umgebung U(x0) einen Index ^o = no(U) gibt, so daß V n > no die Beziehung xn € U gilt. Man schreibt für diesen Sachverhalt gewöhnlich xn —? Xo (n —? oo) oder lim xn = x A2 53) und nennt x0 den Grenzwert der Folge {ajn}^=i Der Grenzwert einer Folge ist eindeutig bestimmt Anstelle einer beliebigen (allgemeinen) Umgebung des Punktes x0 genügt es, lediglich offene Kugeln mit beliebig kleinem Radius heranzuziehen, so daß A2 53) äquivalent zu Folgendem ist. Für Ve > 0 (man hat dabei sofort die offene Kugel B(x0, e) im Sinn) gibt es einen Index n0 = n0(e), so daß V n > n0 die Ungleichung p(xn, x0) < £ gilt Damit bedeutet A2.53) genau p(xn, x0) —? 0 Mit den eingeführten Begriffen hat man die Möglichkeit, in konkreten metrischen Räumen den Abstand zwischen zwei Punkten anzugeben und die Konvergenz von Punktfolgen zu untersuchen, was etwa bei numerischen Verfahren oder bei der Approximation von Funktionen durch solche einer bestimmten Klasse (s z.B 19 6, S 945) von Bedeutung ist Im Raum Rn erweist sich die mittels einer der angegebenen Metriken festgelegte Konvergenz gerade als koordinatenweise Konvergenz. In den Räumen B{[a, b\) und C([a. b]) ist die durch A2 47) eingeführte Konvergenz genau die gleichmäßige Konvergenz der Funktionenfolge auf der Menge [a,b] (s 7 3 2, S 431) Im Raum L2(Q) ergibt sich die Konvergenz im (quadratischen) Mittel, d h. xn —> x0 genau dann, wenn / \xn — Xo\2 dp, —? 0 für n —> oo A2 54)
12.2 Metrische Räume 627 12.2.1.3 Abgeschlossene Mengen und Abschließung 1. Abgeschlossene Menge Eine Teilmenge F eines metrischen Raumes X heißt abgeschlossen, wenn X \ F eine offene Menge ist. Jede abgeschlossene Kugel in einem metrischen Raum, insbesondere jedes Intervall der Typen [a, b], [a, oo), (—oo, a] in R, ist eine abgeschlossene Menge Dual zu den Axiomen der offenen Mengen erfüllt die Gesamtheit aller abgeschlossenen Mengen eines metrischen Raumes folgende Eigenschaften: • Sind FaMa € I abgeschlossen, dann ist auch die Menge f)aei F<* abgeschlossen. • Sind Fi, , Fn endlich viele, beliebig abgeschlossene Mengen, dann ist auch die Menge (J5J=i Fk abgeschlossen. • Die leere Menge 0 ist vereinbarungsgemäß abgeschlossen. Die Mengen 0 und X sind sowohl offen als auch abgeschlossen Ein Punkt xq des metrischen Raumes X heißt Berührungspunkt der Menge A C X, wenn für jede Umgebung U(x0) U{x0)nA^Q A2.55) gilt Besteht dieser Durchschnitt darüber hinaus jeweils nicht nur aus dem einen Punkt Xq , dann heißt xq Häufungspunkt der Menge A. Ein Berührungspunkt, der kein Häufungspunkt ist, heißt isolierter Punkt. Ein Häufungspunkt von A muß somit nicht unbedingt zur Menge A gehören, z.B. der Punkt a im Verhältnis zur Menge A = (a, b], während ein isolierter Punkt notwendigerweise zur Menge A gehören muß Ein Punkt xo ist genau dann Berührungspunkt der Menge A, wenn es eine Folge {xn}™=l von Elementen xn aus A gibt, die zu Xo konvergiert, wobei xn = Xq , V n > n0 im Falle eines isolierten Punktes x0 gesetzt wird. 2. Abschließung Jede Teilmenge A eines metrischen Raumes X liegt offenbar in der abgeschlossenen Menge X Es exi- , stiert immer eine kleinste abgeschlossene Menge, die A enthält, nämlich der Durchschnitt aller abgeschlossenen Mengen aus X, die A enthalten. Diese Menge heißt abgeschlossene Hülle oder Abschließung der Menge A und wird_gewohnlich mit A bezeichnet. A ist mit der Menge aller Berührungspunkte von A | identisch, man erhält A aus der Menge A durch Hinzufügen aller ihrer Häufungspunkte Abgeschlossene [ Mengen sind gerade solche Mengen A , für die A = A gilt. Demzufolge erlauben sie eine Charakterisie- 1 rung durch Folgen in folgender Weise A ist abgeschlossen genau dann, wenn für eine beliebige Folge \ {xn}%Li von Elementen aus A, die im Raum X zu einem Element x0 (€ X) konvergiert, der Grenzwert xq zu A gehört | 12.2.1.4 Dichte Teilmengen und separable metrische Räume j Eine Teilmenge A eines metrischen Raumes X heißt überall dicht, wenn A — X gilt, mit anderen Worten, | jeder Punkt x G X ist Berührungspunkt der Menge A. Das bedeutet, für jedes x 6 X gibt es eine Folge | {xn} von Elementen aus A mit xn —? x j ¦ A: Nach dem WElERSTRASSschen Approximationssatz kann jede auf einem abgeschlossenem und I beschränktem Intervall [a, b] stetige Funktion beliebig genau in der Metrik des Raumes C([a, b]) , also j gleichmäßig, durch Polynome genähert werden Diesen Satz kann man nunmehr wie folgt formulieren: i Die Menge der Polynome auf [a, b] ist überall dicht in C([a, b\) ¦ B: Weitere Beispiele für überall dichte Mengen im Raum R sind die Mengen aller rationalen Zahlen Q und aller irrationalen Zahlen. Ein metrischer Raum X heißt separabel, wenn in X eine abzählbare überall dichte Teilmenge existiert I Eine abzählbare überalMichte Teilmenge in Rn ist zum Beispiel die Menge aller Vektoren mit rationalen Komponenten Separabel ist auch der Raum 1 = l1, eine abzählbare überall dichte Teilmenge ist z.B. die
628 12. Funktionalanalysis Menge aller Elemente der Form x = (n, r2, .., rN, 0,0,...), wobei r^ rationale Zahlen und N = N(x) eine beliebige naturliche Zahl ist. Der Raum m ist nicht separabel. 12.2.2 Vollständige metrische Räume 12.2.2.1 Cauchy-Folge Sei X — (X, p) ein metrischer Raum. Die Folge {xn}™=l mit xn E X, V n heißt CAUCHY-Fo/ge, fundamentale Folge oder manchmal auch noch konvergent in sich, wenn es für Ve > 0 einen Index no = no(e) gibt, so daß Vn, ra > n0 die Ungleichung p(xn,xm)<£ A2 56) gilt. Jede CAUCHY-Folge ist eine beschränkte Menge. Weiter gilt, daß jede konvergente Folge eine CAUCHY-Folge ist. Die Umkehrung gilt im allgemeinen nicht, wie das folgende Beispiel zeigt. ¦ Betrachtet man im Raum l1 die Metrik A2.46) des Raumes m sowie die offensichtlich für alle n = 1,2,... in l1 liegenden Elemente x(n) = A, \, \,. ., £, 0,0,.. ), dann ist die Folge {z(n)}£°=1 eine CAUCHY-Folge in diesem Raum. Würde die Folge {x^} konvergieren, dann müßte sie auch koordinatenweise konvergieren, und zwar zu dem Element x^ = A,-,-,.. , —, ,...). x^ liegt aber Z o 71 Tl "T" 1 oo y wegen Y^ - = +oo (s. 7 2.1 1,2., S. 422, harmonische Reihe) nicht in l1. 12.2.2.2 Vollständiger metrischer Raum Ein metrischer Raum heißt vollständig, wenn in ihm jede CAUCHY-Folge konvergiert. Die vollständigen metrischen Räume sind also gerade diejenigen, in denen das von den reellen Zahlen her bekannte CAUCHYsc/ie Prinzip gilt: Eine Folge konvergiert genau dann, wenn sie eine CAUCHY-Folge ist Jeder abgeschlossene Teilraum eines vollständigen metrischen Raumes ist (als selbständiger metrischer Raum aufgefaßt) vollständig In gewisser Weise gilt die Umkehrung: Ist ein Teilraum Y eines (nicht notwendigerweise vollständigen) metrischen Raumes X vollständig, so ist die Menge Y in X abgeschlossen. ¦ Vollständig metrische Räume sind z B.: m, \p A < p < oo), c, ß{T), C([a, b]), C(fc)([a, b]), LP(a,6) A <p<oo). 12.2.2.3 Einige fundamentale Sätze in vollständigen metrischen Räumen Die Wichtigkeit vollständiger metrischer Räume resultiert u.a. auch aus der Gültigkeit einer ganzen Reihe bedeutender Sätze und Prinzipien, die aus der reellen Analysis bekannt und nützlich sind und die man gern für den Fall unendlichdimensionaler Räume zur Verfügung haben möchte 1. Kugelschachtelungssatz Sei X ein vollständiger metrischer Raum. Ist ß(si; ri) D B(x2- r2) D • • • D B{xn; rn) D • • • A2 57) eine Folge von ineinandergeschachtelten abgeschlossenen Kugeln mit rn —? 0, dann ist der Durchschnitt aller dieser Kugeln nichtleer und besteht nur aus einem einzigen Punkt Gilt dieser Satz in einem metrischen Raum, so ist dieser vollständig. 2. Bairescher Kategoriensatz Sei X ein vollständiger metrischer Raum und {Fk}™=1 eine Folge von abgeschlossenen Mengen in X mit UjSLi Fk = X. Dann existiert mindestens ein Index k0 , für den die Menge Fk0 einen inneren Punkt enthält. 3. Banachscher Fixpunktsatz Sei F eine nichtleere abgeschlossene Teilmenge eines vollständigen metrischen Raumes (X,/o). Sei T: X —? X ein kontraktiver Operator auf F, d.h., es existiert eine Konstante q G @,1), so daß gilt p(Tx, Ty) < q p(x, y) für alle x,y G F. A2 58) Sei Tx 6 F für x E F vorausgesetzt. Dann gilt: a) Für einen beliebigen Startpunkt xq € F ist das Iterationsverfahren xn+1 =Txn (n = 0,l,2, .) A2.59)
12.2 Metrische Räume 629 unbeschränkt ausführbar, d.h , für jedes n gilt xn € F. b) Die Iterationsfolge {xn}™=0 konvergiert gegen ein Element x* G F. c) Es gilt Tx* = x*, d.h., x* ist ein Fixpunkt des Operators T. A2.60) d) Der einzige Fixpunkt von T in F ist x*. e) Es gilt die Fehlerabschätzung n p{x*,xn) < -—p(xi,x0). A2.61) Im Zusammenhang mit dem BANACHsc/ien Fixpunktsatz spricht man vom Prinzip der kontrahierenden Abbildung oder dem Kontraktionsprinzip. 12.2.2.4 Einige Anwendungen des Kontraktionsprinzips 1. Iterationsverfahren zur Lösung linearer Gleichungssysteme Das gegebene lineare (n, n)-Gleichungssystem ai\X\ +a\2x2 4-. • + a\nXi = &i, «21^1 +022^2 + + Ö2n^n = &2 , an\Xi +an2x2 + . + annxn = bn geht durch Umformung gemäß 19.2.1, S. 917 in das äquivalente Gleichungssystem x\ -A -- a\i)xi -\-a12X2 H +o>inXn=bi, x2 -a2\Xi -A - a22)x2 H +a2nxn = b2 , A2 62a) A2.62b) Xn -OnlXl +«n2^2 H ~A ~ CLnn)Xn — K über Dieses läßt sich mit dem Operator T* Kn —> Kn , definiert durch (n n \ T £i - ^aifc^fc + fei, . •, zn - $^ ^^ + M , A2 63) fc=l fc=l / in das Fixpunktproblem x = Tx A2 64) überführen, das im metrischen Raum Kn, versehen mit einer geeigneten Metrik, der euklidischen A2 43), der Metrik A2.44) oder der Metrik p(x,y) = £Li \xk - yk\ (vgl. mit A2.47)), betrachtet wird Ist eine der Zahlen !¦; E M2, mffi J2 M' ™a? Y, M A2.65) ,fc=i ^"jfi ^^i kleiner als 1, dann erweist sich T als kontrahierender Operator und besitzt nach dem BANACHschen Fixpunktsatz genau einen Fixpunkt, der der komponentenweise Grenzwert der Iterationsfolge mit beliebigem Startpunkt aus Kn ist 2. Fredholmsche Integralgleichungen Die FREDHOLMsche Integralgleichung (s. 11.2, S, 584) b tp(x) - I K(x, y)tp(y) dy = f(x), x e [a, b] A2 66)
630 12. Funktionalanalysis mit stetigem Kern K(x, y) und stetiger rechter Seite f(x) kann man iterativ lösen, indem sie mit Hilfe des Operators T: C([a, b}) —> C([a, 6]), definiert durch b T<p(x) = JK(xiy)<p(y)dy + f(x) Vy> € C([a,6]), A2 67) a in ein Fixpunktproblem Tip = tp im metrischen Raum C([a, b]) (Beispiel A aus Abschnitt 12.1.2, S. 617) überführt und der Fixpunktsatz angewendet wird, vorausgesetzt, es gilt maxa<x<t, J^ \K(x, y)\dy < 1. Die eindeutige Lösung erhält man als gleichmäßigen Grenzwert der Iterationsfolge {<pn}™=i mit <pn = T(pn-i, beginnend mit einer beliebigen Funktion (po(x) G C([a, b]). 3. Volt errasche Integralgleichungen Die VOLTERRAsche Integralgleichung (s 11 4, S 605) X <p(x) - I K(x, y)tp(y) dy = f(x), ie[a, b] A2.68) a mit stetigem Kern und stetiger rechter Seite kann man mit Hilfe des VOLTERRAschen Integraloperators X (V<p)(x) := I K(xt y)ip(y) dy V <p G C([a, b\) A2.69) a und Tip = f + VV als das Fixpunktproblem Tip = y? im Raum C([a, 6]) unter Anwendung des Fixpunktsatzes behandeln. 4. Satz von Picard-Lindelöf Es werde die Differentialgleichung x = f(t,x) A2 70) mit einer stetigen Abbildung f I x G —? Rn betrachtet, wobei / ein offenes Intervall aus R und G eine offene Teilmenge aus Rn sind. Die Abbildung / genüge bezüglich x einer LiPSCHlTZ-Bedingung (s. 9 1 1,2., S. 505), d.h., es gibt eine positive Konstante L mit p{f(t,x1),f(t,x2)) < Lp(xux2) V(*,xi),(t,x2) e I x G, A2 71) wobei p die euklidische Metrik in Rn bezeichnet (unter Verwendung der Norm, s. 12.3.1, gilt die Beziehung A2.81) p(x, y) = \\x - y\\ V x, y G Rn). Sei (t0, x0) e I x G ein beliebiger Punkt. Dann gibt es Zahlen ß > 0 und r > 0, so daß die Menge ü = {(£, x) eRx~Rn: \t-t0\ < ß, p(x, x0) < r} in / x G T liegt Seien M = maxn p(f(t, x), 0) und a = min{/5, —} . Dann existiert eine Zahl b > 0, so daß für jedes x G B mit B = {x G Rn. p(x, x0) < b} das Anfangswertproblem x = f(t,x)i x{t0) = x A2.72) genau eine (lokale) Lösung ip(t,x) besitzt, d.h. ip(t,x) = f(t,(p(t,x)) für V t : \t — t0\ < a und <p(to, x) = x. Die Lösung dieses Anfangswertproblems ist äquivalent zur Lösung der Integralgleichung t ip(t,x) = x+ f /(s,<p(s,x))ds, te[t0- a,t0 + a\. A2 73) Bezeichnet jetzt X die abgeschlossene Kugel {</?(£, x): d(ip(t, x), x0) < r} des in der Metrik d{<P,il>) = ft . max jW,!),^!)) A2 74) vollständigen metrischen Raumes C([to — a, to + a] x B , Rn), dann ist X mit der induzierten Metrik selbst ein vollständiger metrischer Raum Ist T* X —> X der durch t T<p(t, x) = x + / /(s, ip(s, x)) ds A2 75)
12 3 Normierte Räume 631 definierte Operator, dann ergibt sich die Lösung der Integralgleichung A2.73) als eindeutiger Fixpunkt des Operators T, der sogar iterativ erzeugt werden kann. 12.2.2.5 Vervollständigung eines metrischen Raumes Jeder beliebige, also im allgemeinen nicht vollständige metrische Raum X kann vervollständigt werden, genauer, es existiert ein metrischer Raum X mit folgenden Eigenschaften: 1. X enthält einen zu X isometrischen (s. 12.2.3,2., S. 631) Teilraum Y 2. Y ist überall dicht in X 3. X ist ein vollständiger metrischer Raum. 4. Ist Z ein beliebiger metrischer Raum mit den Eigenschaften 1. bis 3., dann sind Z und X isometrisch Der dadurch bis auf Isometrie eindeutig bestimmte vollständige metrische Raum heißt die Vervollständigung des Raumes X. 12.2.3 Stetige Operatoren 1. Stetige Operatoren Sei T: X —? Y eine Abbildung des metrischen Raumes X = (X, p) in den metrischen Raum Y = (Y, p) T heißt stetig im Punkt Xq 6 X, wenn für jede Umgebung V = V(yo) des Punktes y0 = T(xo) eine Umgebung U = U(x0) existiert, so daß gilt: T{x)eV \/xeU. A2.76) T heißt stetig auf der Menge A C X, wenn T in jedem Punkt der Menge A stetig ist. Äquivalente Eigenschaften zur Stetigkeit auf X sind* a) Für einen beliebigen Punkt x G X und eine beliebige Folge {zn}£Li, xn eX mit xn —? x gilt stets T(xn) —? T(x), also p(xn,x0) —> 0 impliziert p(T(xn),T(xo)) —> 0 b) Für eine beliebig offene Teilmenge G C Y ist das Urbild T~1(G) eine offene Teilmenge in X c) Für eine beliebige abgeschlossene Teilmenge F C Y ist das Urbild T~X(F) eine abgeschlossene Teilmenge in X. d) Für eine beliebige Teilmenge AcX gilt T(Ä) C T(A). 2. Isometrische Räume Existiert für zwei metrische Räume X = (X, p) und Y = (Y, p) eine bijektive Abbildung T mit der Eigenschaft p(x1y) = p(T(xIT(y)) Vx,y€X, A2.77) dann heißen die Räume x und Y isometrisch und T eine Isometrie. 12.3 Normierte Räume 12.3.1 Begriff des normierten Raumes 12.3.1.1 Axiome des normierten Raumes Sei X ein Vektorraum über dem Körper K . Eine Funktion || • || • X —> R^ heißt Norm auf dem Vektorraum X und das Paar X = (X, || • ||) normierter Raum über dem Körper K , wenn für beliebige Elemente x, y e X und beliebiges a G K die folgenden Eigenschaften, die Axiome des normierten Raumes, erfüllt sind (Nl) ||x|| > 0 und ||x|| = 0 genau dann, wenn x = 0, A2 78) (N2) ||az|| = H • ||z|| (Homogenität), A2.79) (N3) \\x + y\\ < \\x\\ + ||y|| (Dreiecksungleichung) A2 80) Mit Hilfe der Festlegung p(xty) = \\x-yl x,yeX A2 81)
632 12 Funktionalanalysis kann jeder normierte Raum in einen metrischen Raum so umgewandelt werden, daß die Metrik A2 81) zusätzlich noch die mit der Struktur des Vektorraums verträglichen Eigenschaften p(x + z,y + z) = p{x,y), zeX A2.82a) p{ax,ay) = \a\p{x,y), a6K. A2.82b) besitzt Somit stehen in einem normierten Raum sowohl die Eigenschaften eines Vektorraums als auch die eines metrischen Raumes - durch A2 82a) und A2.82b) verträglich, aufeinander abgestimmt - zur Verfügung. Daraus ergibt sich, daß man die meisten lokalen auf einen Punkt bezogenen Untersuchungen mit den Einheitskugeln 5@;l) = {xGX: \\x\\ < 1} und ß@,1) = {x € X : \\x\\ < 1} A2 83) vornehmen kann, da sich B(x,r) = {yeX \\y - x\\ < r} = x + rß@; 1) VxGl und Vr>0 A2.84) ergibt. Außerdem sind die Operationen im zugrunde liegenden Vektorraum stetig, d h , aus xn^x, yn^y<, OLn^a folgen xn + yn —> x + y, anxn —> ax, ||a;n||-* ||x|| A2 85) Für konvergente Folgen schreibt man anstelle von A2.53) in normierten Räumen lkn-zo||—>0 (n—>oo). A2 86) 12.3.1.2 Einige Eigenschaften normierter Räume In der Klasse aller linearen metrischen Räume sind gerade diejenigen normierbar, d h , mit Hilfe der Metrik kann durch ||z|| = p(x, 0) eine Norm eingeführt werden, deren Metrik den Bedingungen A2 82a) und A2 82b) genügt. Zwei normierte Räume X und Y heißen normisomorph, wenn es eine bijektive, lineare Abbildung T X —> Y mit || Tz || = ||z|| gibt Seien || • ||i und || • H2 zwei Normen auf einem Vektorraum X, die X zu dem normierten Raum Xi bzw. X2 machen. Die Norm || • ||i heißt stärker als die Norm || • H2 , wenn es eine Zahl 7 > 0 mit ||x||2 < 7||#||i Vx G X gibt In diesem Falle impliziert die Konvergenz einer Folge {xn}^=1 zu x im Sinne der Norm || • ||i, also ||xn — x||i —? 0 , ihre Konvergenz zu x im Sinne der Norm jl • ||2 , also ||xn — x||2 —*¦ 0. Zwei Normen || • || und || | • || | nennt man äquivalent, wenn es zwei Zahlen 71 > 0 , 72 > 0 gibt, so daß für V x G X 7i||aj|| < |||z||| < 72||a;II gilt. Auf einem endlichdimensionalen Vektorraum sind alle Normen äquivalent. Unter einem Teilraum eines normierten Raums versteht man einen abgeschlossenen linearen Teilraum 12.3.2 Banach—Räume Ein vollständiger normierter Raum heißt B AN ACH -Raum Jeder normierte Raum X kann zu einem BANACH-Raum X auf der Grundlage der Vervollständigungsprozedur aus 12.2.2.5, S 631 und der natürlichen Fortsetzung seiner algebraischen Operationen und der Norm auf X vervollständigt werden. 12.3.2.1 Reihen in normierten Räumen In einem normierten Raum kann man Reihen von Elementen betrachten Das bedeutet- für eine gegebene Folge {xn}™^ von Elementen xn G X bildet man die neue Folge {s^jfcLi mit Hilfe der Partialsummen si = xi, s2 = xi +x2, ..,sk = Xi-\ \-xk = sfc_i +xk, . A2 87) Wenn die Folge {sfc}j£Li konvergiert, d.h || sk — s ||—? 0 {k —> 00) für ein gewisses s G X, dann ist eine konvergente Reihe definiert. Der Grenzwert A: lim Yxn = s A2.88)
12.3 Normierte Räume 633 heißt dann Summe der Reihe, wofür man auch s = Y^=\ %n schreibt. Eine Reihe J2%Li xn heißt absolut konvergent, wenn die Zahlenreihe ]CS£=i ll^nll konvergiert. Im BANACH-Raum ist jede absolut konvergente Reihe konvergent, wobei für ihre Summe ||s|| < Y^=i \\xn\\ gilt. 12.3.2.2 Beispiele von Banach-Räumen ¦ A : Kn mit ||z|| = ( £ l&N " , wenn 1 < p < oo , lldl = max IfJ, wenn p = oo. A2.89a) l<fc<n Die so entstehenden normierten Räume auf ein und demselben Vektorraum Kn bezeichnet man oft mit lp(n) A < p < oo) und nennt sie für 1 < p < oo im Falle von K = R euklidische Räume und im Falle von K = C unitäre Räume ¦ B . m mit ||a;|| = sup|&| A2.89b) k ¦ C : c und c0 mit der Norm aus m. A2 89c) ¦ D: P mit ||a;||= (£|fn|pJ A < p < oo) A2 89d) ¦ E : C([a,b\) mit ||z|| = max \x{t)\. A2.89e) te[a,b] ¦ F. Lp((a,b)) (l<p<oo) mit ||x|| = ( [ \x(t)\pdt\ . A2.89f) k M G C(k){[a,b}) mit \\x(t)\\ = £ max \xil){t)\ A2 89g) 12.3.2.3 Sobolew-Räume Sei Q C Rn ein beschränktes Gebiet, d h eine offene zusammenhängende Menge, mit hinreichend glattem Rand dQ. Für n = 1 oder n = 2,3 stelle man sich Ü etwa als ein Intervall (a, b) oder eine konvexe Menge vor Eine Funktion / Q —? R nennt man A:-mal stetig differenzierbar in dem abgeschlossenen Gebiet Q, wenn / auf ü fc-mal stetig differenzierbar ist und jede ihrer partiellen Ableitungen einen Grenzwert besitzt, d.h., wenn x zu einem beliebigen Randpunkt von Q konvergiert Mit anderen Worten, jede ihrer partiellen Ableitungen ist stetig auf den Rand von ü fortsetzbar und ist eine stetige Funktion auf Q . In diesem Vektorraum wird (für p e [1, oo)) und dem LEBESGUE-Maß A im Rn (s. 12 9 1,2., S 657) die folgende Norm eingeführt: ll/IU,= 11/11 =\[\f(x)\»d\+ £ [\D°f\pd\\ . A290) Der entstandene normierte Raum wird mit Wk,p(Cl) oder auch mit W£(Q) bezeichnet (im Unterschied zu dem mit einer ganz anderen Norm versehenen Raum C^([a, b])). Hier bedeutet a einen Multiindex, d.h. ein geordnetes n-Tupel («i,. , an) von nichtnegativen ganzen Zahlen, wobei die Summe der Komponenten von a mit |a| = ai + a2 + \- an bezeichnet wird Für eine Funktion f(x) = /(£i,. ., fn) mit x = (f1}..., fn) € tt nutzt man - wie in A2.90) - die verkürzte Schreibweise
634 12. Funktionalanalysis Der normierte Raum Wh,p(Q) ist nicht vollständig. Seine Vervollständigung wird mit Wk,p(ü) oder im Falle von p = 2 mit Hfc(Sl) bezeichnet und heißt Sobolew-Raum 12.3.3 Geordnete normierte Räume 1. Kegel im normierten Raum Sei X ein reeller normierter Raum mit der Norm || • ||. Ein Kegel X+ C X heißt solid, wenn X+ eine Kugel (mit positivem Radius) enthält ¦ Die üblichen Kegel in den Räumen R, C([a, b]), c sind solid, die in den Räumen Lp([a, b\) (s 12 4. S 635) und lp A < p < oo) nicht Ein Kegel X+ heißt normal, wenn die Norm in X semimonoton ist, d.h., es existiert eine Konstante M > 0 , so daß 0 < x < y =? ||z|| < M\\y\\ A2 92) gilt. Ist X ein mit Hilfe eines Kegels X+ geordneter BANACH-Raum, dann ist jedes (o)-Intervall genau dann normbeschränkt, wenn der Kegel X+ normal ist. ¦ Die Kegel der Vektoren mit nichtnegativen Komponenten und der nichtnegativen Funktionen in den Räumen Rn, m, c, c0, C, \p und LP sind normal. Ein Kegel heißt regulär, wenn jede monoton wachsende, von oben beschränkte Folge xi < x2 < • • • < xn < • • • < z A2 93) eine CAUCHY-Folge in X ist. In einem BANACH-Raum ist jeder abgeschlossene reguläre Kegel normal ¦ Die Kegel in Rn , lp und Lp für 1 < p < oo sind regulär, die in C und m nicht. 2. Normierte Vektor verbände und Banach-Verbände Sei X ein Vektor verband, der gleichzeitig ein normierter Raum ist X heißt normierter Verband oder normierter Vektorverband (s. [12 18], [12 22], [12.25], [12.26]), wenn die Norm der Bedingung \x\ < \y\ impliziert ||z|| < \\y\\ \/x,yeX (Monotonie der Norm) A2.94) genügt. Ein vollständiger (bezüglich der Norm) normierter Verband heißt BANACH- Verband. ¦ Die Räume C([a,6]), 17, \p, B([a, b}) sind Banach-Verbände 12.3.4 Normierte Algebren Ein Vektorraum X über K heißt eine Algebra, wenn zusätzlich zu den Operationen, die im Vektorraum X erklärt sind und den Axiomen (VI) bis (V8) (s. 12 1.1, S 616) genügen, für je zwei Elemente x, y G X ihr Produkt x -y eX oder in der vereinfachten Schreibweise, xy , erklärt ist, so daß für beliebige x, y, z G X und a G K die folgenden Eigenschaften erfüllt sind (Al) x{yz) = (xy)z, A2 95) (A2) x(y + z)=xy + xz, A296) (A3) (x + y)z = xz + yz, A2.97) (A4) a{xy) = {ax)y = x{ay). A2 98) Eine Algebra ist kommutativ, wenn stets xy = yx gilt. Ein linearer Operator (s A2 21)) T: X —? Y der Algebra X in die Algebra Y heißt Algebren-Homomorphismus, wenn für alle X\, £2 £ X gilt. T(xi - x2) = Txx • Tx2 . A2.99) Eine Algebra X heißt normierte Algebra bzw. eine BANACH-^/^eöra, wenn sie ein normierter Vektorraum bzw ein BANACH-Raum ist und die Norm die (zusätzliche) Eigenschaft ||x-y||<||x||-||y|| A2 100) besitzt. In einer normierten Algebra sind alle Operationen stetig, d h., außer A2 85) gilt für xn —? x und yn —> y auch noch xnyn —> xy (s [12 23]).
12 4 Hilbert-Räume 635 Jede normierte Algebra kann zu einer BANACH-Algebra vervollständigt werden, indem man das Produkt auf ihre Normvervollständigung unter Berücksichtigung von A2.100) fortsetzt ¦ A: C([a, b]) mit der Norm A2.89e) und der für stetige Funktionen üblichen (punktweisen) Multiplikation. ¦ B: Der Vektorraum W([0,2ir]) aller in eine absolut konvergente FOURIER-Reihe zerlegbaren komplexen auf [0,27r] stetigen Funktionen x(t), d h. oo x(t)= £ cnemt, A2.101) n=—oo mit der Norm \\x\\ = ^^„^ \cn\ und der gewöhnlichen Multiplikation ¦ C: Der Raum L(X) aller beschränkten linearen Operatoren auf dem normierten Raum X mit der Operatorennorm und den üblichen algebraischen Operationen (s. 12.5.1 2, S. 640), wobei unter dem Produkt T-S zweier Operatoren die Nacheinanderausführung, also der durch TS(x) = T(S(x)), x G X definierte Operator verstanden wird. ¦ D: Der Raum Ll(—oo, oo) aller absolut summierbaren meßbaren Funktionen auf der reellen Achse (s. 12.9) mit der Norm ||x|| = r \x(t)\dt, A2.102) /oo x(t — s)y(s) ds -oo verwendet 12.4 Hilbert-Räume 12.4.1 Begriff des Hilbert-Raumes 12.4.1.1 Skalarprodukt Ein Vektorraum V über dem Körper K (meistens wird K = C betrachtet) heißt Raum mit Skalarprodukt oder Innenproduktraum oder Prä-HlLBERT-Raum, wenn jedem Paar von Elementen x,y G V eine Zahl (x,y) £ K, das Skalarprodukt von x und y, zugeordnet ist, so daß für beliebige Elemente x,y,z € V und beliebiges a G K die folgenden Bedingungen, die Axiome des Skalarprodukts, erfüllt sind (Hl) (x, x) > 0 , (insbesondere (x, x) reell) und (x, x) = 0 genau dann, wenn x = 0, A2.103) (H2) (qx, y) = a(x, y), A2.104) (H3) (x + y,z) = (x, z) + (y, z), A2.105) (H4Hr,j/) = (y,s) A2.106) (Mit ö7 ist die zu u konjugiert komplexe Zahl bezeichnet, die in A.135c) durch lü* gekennzeichnet wurde.) Im Falle von K = R, also eines reellen Vektorraums, ist (H4) einfach die Kommutativitätsforderung für das Skalarprodukt. Aus den Axiomen ergeben sich sofort zusätzlich noch die Eigenschaften (x,ay) = ä(x,y) und (x,y + z) = (x,y) + (x,z) A2 107) 12.4.1.2 Unitäre Räume und einige ihrer Eigenschaften Mit Hilfe des Skalarprodukts kann man in einem Prä-HlLBERT-Raum durch die Festlegung ||z|| = ^x) A2 108) eine Norm erzeugen. Ein normierter Raum H = (H, || • ||) heißt unitär, wenn man in ihm ein Skalarprodukt einführen kann, das mit der Norm durch A2.108) verknüpft ist. Im unitären Raum gelten
636 12. Funktionalanalysis aufgrund des Vorhandenseins des Skalarprodukts und der Verknüpfung A2 108) die folgenden bemerkenswerten Eigenschaften 1. Dreiecksungleichung: l|z + 2/H2<(NI + lh/llJ- A2 109) 2. Cauchy-Schwarz-Ungleichungoder Schwarz-Bunjakowski-Ungleichung (s. auch S. 31): \(x,y)\<y/^x)y/(^y) A2.110) 3. Parallelogrammgleichung: In der Klasse aller normierten Räume charakterisiert sie die unitären Räume. ll* + I/f + lk-I/f = 2(||xf + ||y||2). A2 111) 4. Stetigkeit des Skalarprodukts: xn -»• x, yn^y impliziert (xn,yn) -> (x,y) A2.112) 12.4.1.3 Hilbert-Raum Ein vollständiger unitärer Raum heißt HlLBERT -Raum. Als BANACH-Räume besitzen die Hilbert- Räume auch deren Eigenschaften (s. 12.3.1, S. 631,12.3.1 2, S. 632,12 3 2, S 632) Hinzu kommen noch die eines unitären Raumes 12 4 12, S. 635. Unter einem Teilraum eines HiLBERT-Raumes versteht man einen abgeschlossenen linearen Teilraum ¦ A: l2(n), l2 und L2([a, b]) mit den Skalarprodukten (x,y) = Eöwfc, &y) = E» und (*>y) = f *(*)*/(*)<** A2113) k=i fc=i Ja ¦ B: Der Raum H2(Q) mit dem Skalarprodukt (/,<?) = [f(x)W)dx+ £ fDaf(x)D^)dx A2 114) ¦ C: Sei ip(t) eine auf [a, b] meßbare und positive Funktion Der komplexe Raum L2 ([a, b], (p) aller meßbaren Funktionen, die auf [a, b] mit dem Gewicht </? quadratisch summierbar sind, wird ein Hilbert- Raum, wenn das folgende Skalarprodukt betrachtet wird rb x(t)y(t)(p(t) dt. A2.115) (x,y)= f Ja 12.4.2 Orthogonalität Zwei Elemente x, y eines HiLBERT-Raumes (die Begriffe dieses Abschnitts haben auch in Prä-HlL- BERT-Räumen bzw. in unitären Räumen Sinn) H heißen orthogonal (man schreibt dafür xly), wenn (sc, y) = 0. Für eine beliebige Teilmenge A C H ist die Menge A1 = {xeH. (x,y) = 0 VyeA} A2 116) aller Vektoren, die zu jedem Vektor aus A orthogonal sind, ein (abgeschlossener linearer) Teilraum von H und heißt Orthogonalraum zu A oder orthogonales Komplement von A Man schreibt A ± B, wenn (x, y) = 0 V x € A und V y G B gilt. Besteht A nur aus dem Element x , dann schreibt man x ± B 12.4.2.1 Eigenschaften der Orthogonalität Der Nullvektor ist zu jedem Vektor aus H orthogonal. Es gilt: a) x _L y und x ± z impliziert x ± (ay + ßz) für beliebige q, ß G C b) Aus x ±yn und yn —> y folgt x _L y . c) x ± A genau dann, wenn x ± lin(A), wobei lin(A) die abgeschlossene lineare Hülle der Menge A bezeichnet.
124 Hilbert-Räume 637 d) Ist x _L A und A eine fundamentale Menge, d.h., lin(A) ist überall dicht in H , dann ist x = 0 . e) Satz des Pythagoras: Sind die Elemente x\, . , xn paarweise orthogonal, also xk _L xi für k ^ l, dann ist II X>*f = £ IM2 A2-117) fc=l k=\ f) Projektionssatz: Ist H0 ein Teilraum von H , dann ist jeder Vektor x € H eindeutig in der Form x = x' + x", x'gH0,xH0 A2.118) darstellbar g) Approximationsproblem: Weiter gilt ||x'|| = p(x, H0) = infyGH0{||^ — y\\} , so daß das Problem ||s - 2/|| - inf, yeU0 A2 119) in H0 mit x' eindeutig lösbar ist H0 kann dabei sogar durch eine konvexe, abgeschlossene nicht leere Teilmenge aus H ersetzt werden. Das Element x' heißt Projektion des Elements x auf H0 , besitzt den kleinsten Abstand von x (zu H0), und der Raum H ist orthogonal zerlegbar: H = H0 0 H^ . 12.4.2.2 Orthogonale Systeme Eine Menge {x^ £ G E} von Vektoren aus H heißt orthogonales System, wenn es den Nullvektor nicht enthält und x% _L x^ , £ ^ 77, also (a^, xv) = 5^v gilt, wobei s, H5 £ !*;¦ A2-12°) das KRONECKER-Symbol bezeichnet. Ein orthogonales System heißt orthonormaloder orthonormiert, wenn auch noch \\x^\\ = 1 V£ gilt. In einem separablen HiLBERT-Raum kann ein orthogonales System aus höchstens abzählbar vielen Elementen bestehen. Im weiteren ist daher stets E = IN . ¦ A: Das System —7=, —?=cost, —=smt, —=cos2£, —r=sin2£, ... A2.121) y/27r \/n y/n y/if 0r im reellen Raum L2([—7r, ir]) und das System -^=emi (n = 0,±l,±2,...) A2.122) V27T im komplexen Raum L2([-7r, tt]) sind orthonormale Systeme Diese beiden Systeme heißen trigonometrisch ¦ B: Die LEGENDREschen Polynome 1 Art (s 9.1.2 6,3., S. 530) pn(t) = j^l(t2-m (« = 0,1,.. ) A2.123) atn bilden ein orthogonales System von Elementen im Raum L2 ([—1,1]) Das entsprechende orthonormale System ist dann P-(t) = \ln+\j^iPn(t) A2.124) ¦ C: Die HERMlTEschen Polynome (s 9 1 2.6,6., S 532, 9 2 3.5,7., S 565) gemäß der 2. Definition der HERMlTEschen Differentialgleichung (9 63b) Hn(t) = e'2^e-t2 (n = 0,l,. .) A2.125) bilden ein orthogonales System im Raum L2((—oo, oo))
638 12. Funktionalanalysis ¦ D: Im Raum L2(@, oo)) bilden die LAGUERREschen Polynome ein orthogonales System (s. 9.1.2.6, 5., S. 531) Jedes orthogonale System ist linear unabhängig, denn der Nullvektor war von vornherein ausgeschlossen worden Umgekehrt, hat man ein System X\,X2, xn, .. von linear unabhängigen Elementen in einem HiLBERT-Raum H , dann existieren nach dem GRAM-SCHMiDTschen Orthogonalisierungs- verfahren Vektoren e\, ß2,. ., en, ., die ein orthonormales System bilden und die bis auf einen Faktor mit Modul 1 eindeutig bestimmt sind 12.4.3 Fourier—Reihen im Hubert—Raum 12.4.3.1 Bestapproximation Seien jetzt H ein separabler HiLBERT-Raum und {en. n= 1,2, ..} A2.126) ein fixiertes orthonormales System in H Für ein Element x £ H heißen die Zahlen cn = (x,en) FOURIER-Koeffizienten des Elements x bezüglich des Systems A2 126) Die (formale) Reihe oo £ cnen A2 127) n=l nennt man FouRlER-iüez/ie des Elements x bezüglich des Systems A2 126), (s. 7.4.1.1, S. 437). Die rite Partialsumme der FOURIER-Reihe eines Elements x besitzt die Eigenschaft der Bestapproximation, d.h., bei festem n ergibt unter allen Vektoren aus Hn = lin({e\,..., en}) die n-te Partialsumme der FOURIER-Reihe, also das Element <7n = i>,efc)efcl A2 128) k=i den kleinsten Wert für \\x — ]CJLi ctkCkW i d.h. ||x — an|| < \\x — Y%=i ^k^k\\ ¦ Darüber hinaus ist x — crn orthogonal zu Hn , und es gilt die BESSELsche Ungleichung oo £|cn|2<N|2, cn = (x,en) (n = l,2, ..)• • A2 129) 12.4.3.2 Parsevalsche Gleichung, Satz von Riesz-Fischer Die FOURIER-Reihe eines beliebigen Elements x £ H konvergiert stets, und zwar zur Projektion des Elements x auf den Teilraum H0 = lin({en}^=1). Hat ein Element x G H die Darstellung x = Y^fLi an^n, dann sind an die FOURIER-Koeffizienten von x. Ist {a„}J°=1 eine beliebige Zahlenfolge mit der Eigenschaft Y^fLi \an\2 < oo, dann existiert in H genau ein Element x, dessen FOURIER- Koeffizienten gerade die Zahlen an sind und für das die Abgeschlossenheitsrelation oder PARSEVALsche Gleichung oo oo £l(z,e„)|2 = £KI2 = NI2 A2-130) gilt (Satz von Riesz-Fischer) Ein orthonormales System {en} in H heißt vollständig, wenn es keinen vom Nullvektor verschiedenen Vektor y gibt, der zu allen Vektoren en orthogonal ist, es heißt Basis, wenn jeder Vektor x € H als x = X^i ctnen dargestellt werden kann, d.h. an = (x, en), und x ist gleich der Summe seiner Fourier- Reihe. In letzterem Falle sagt man auch, x hat eine FOURIER-Entwicklung. Die folgenden Aussagen sind äquivalent a) {en} ist eine fundamentale Menge in H. b) {en} ist vollständig in H .
12.5 Stetige lineare Operatoren und Funktionale 639 c) {en} ist eine Basis in H . d) Für V x, y e H mit den entsprechenden FOURIER-Koeffizienten cn und dn (n = 1,2,.. ) gilt: (z,y) = f>n4. A2 131) n=l e) Für jeden Vektor x G H gilt die PARSEVALsche Gleichung A2.130) ¦ A: Das trigonometrische System A2.121) ist eine Basis im Raum L2([—7r, 7r]). ¦ B: Das System der normierten LEGENDREschen Polynome A2.124) Pn(t) (n = 0,1,.. ) ist vollständig und bildet demzufolge eine Basis im Raum L2([—1,1]). 12.4.4 Existenz einer Basis. Isomorphe Hubert—Räume In jedem separablen HiLBERT-Raum existiert eine Basis. Daraus ergibt sich, daß jedes orthonormale System zu einer Basis ergänzt werden kann. Zwei HiLBERT-Räume Hi und H2 heißen isometrisch oder isomorph als HiLBERT-Räume, wenn es eine lineare, bijektive Abbildung T: Hi —>• H2 mit der Eigenschaft (Tx, Ty)u2 = (x, y)^ (also eine das Skalarprodukt und wegen A2.108) auch die Norm erhaltende Abbildung) gibt. Es gilt: Zwei beliebige unendlichdimensionale separable HiLBERT-Räume sind stets isometrisch, also insbesondere ist jeder solche Raum isometrisch zu dem separablen Raum l2 . 12.5 Stetige lineare Operatoren und Funktionale 12.5.1 Beschränktheit, Norm und Stetigkeit linearer Operatoren 12.5.1.1 Beschränktheit und Norm linearer Operatoren Seien X = (X, || • ||) und Y = (Y, || • ||) normierte Räume. Die Kennzeichnung der Norm im Raum X, etwa durch jj • ||x , wird im weiteren weggelassen, da aus dem jeweiligen Kontext erkenntlich ist, in welchem Raum die Norm betrachtet wird. Ein beliebiger Operator T: X —> Y heißt beschränkt, wenn eine reelle Zahl A > 0 existiert mit ||T(x)|| < A||x|| (VxeX). A2.132) Ein beschränkter Operator mit der Konstanten A „dehnt" jeden Vektor höchstens um das A-fache und überführt jede beschränkte Menge aus X in eine beschränkte Menge aus Y , insbesondere ist das Bild der Einheitskugel aus X in Y beschränkt. Für die Beschränktheit eines linearen Operators ist die letzte Eigenschaft charakteristisch. Ein linearer Operator ist genau dann stetig (s. 12.2.3, S 631), wenn er beschränkt ist. Die kleinste Konstante A, für die A2.132) noch gilt, heißt Norm des Operators T und wird mit ||T|| bezeichnet, d h ||T|| := inf{A > 0 : ||Tx|| < A||z||, x <= X} . A2.133) Für einen stetigen linearen Operator gelten ||T|| = sup ||Tx|| = sup ||Tx|| = sup ||Tx|| A2.134) ||x||<l ||x||<l ||s||=l und außerdem die Abschätzung ||r*|| < ||T|| ¦ ||*|| (Vxex). A2135) ¦ Im Raum C([a, b\) mit der Norm A2.89d) ist der mittels der auf dem Quadrat {a < s, t < b} stetigen komplexwertigen Funktion K(s,t) definierte Operator (Tx)(s) = y{s) = fb K(s, t)x(t) dt (s € [a, b}) A2.136) Ja
640 12 Funktionalanalysis ein beschränkter linearer Operator, der C([a, b]) in C([a, b]) abbildet. Für seine Norm gilt rb \\T\\ = max / \K{s,t)\dt. A2 137) s€[a,b] Ja 12.5.1.2 Raum linearer stetiger Operatoren Für zwei lineare (stetige) Operatoren S, T X —? Y sind die Summe S 4- T und das Vielfache aT punktweise erklärt U{x) = S(x) + T(x), (<*T)(x) = a T(x), VxGX VaGK. A2.138) Die Menge L(X, Y), häufig auch mit B(X, Y) bezeichnet, aller linearen stetigen Operatoren T aus X in Y wird so ein Vektorraum, auf dem sich ||T|| A2 133) als Norm erweist Dadurch wird L(X, Y) ein normierter Raum und, falls Y ein BANACH-Raum ist, sogar ein BANACH-Raum. Insbesondere sind also die Axiome (VI) bis (V8) und (Nl) bis (N3) erfüllt. Ist Y = X, dann kann man für zwei beliebige Elemente 5, T G L(X, X) = L(X) = B(X) durch (ST)(x) = S{Tx) (VxGX) A2 139) das Produkt definieren, das den Axiomen (Al) bis (A4) aus 12.3.4, S. 634 sowie der Verträglichkeitsbedingung A2.100) mit der Norm genügt und so L(X) zu einer (im allgemeinen nichtkommuta- tiven) normierten und, falls X BANACH-Raum ist, zu einer BANACH-Algebra macht Damit sind für jeden Operator T G L(X) die Potenzen T° = I,Tn = Tn~lT {n = 1,2,. .) A2 140) definiert, wobei / der identische Operator Ix = x (V x G X) ist. Es gilt l|T-|| < ||T||" (n = 0,l,...), A2 141) und außerdem existiert stets der (endliche) Grenzwert r(T) = lim y/\\Tn\\ , A2.142) der Spektralradius des Operators T heißt und den Beziehungen r(T) < \\T\\t r(Tn) = [r(T)]n , r(aT) = |a|r(T), r{T) = r{T*) A2.143) genügt, wobei T* der zu T adjungierte Operator ist (s. 12.6, S. 646 und A2 159), S. 643) Im Falle der Vollständigkeit von L(X) hat der Operator (XI — T)~l für |A| > r(T) die Darstellung in Form der NEUMANNschen Reihe (AJ-T)-1 = A~1/ + A-2T+. . + \~nTn-1 + .. , A2.144) die für |A| > r(T) in der Operatornorm von L(X) konvergiert 12.5.1.3 Konvergenz von Operatorenfolgen 1. Punktweise Konvergenz einer Folge von linearen stetigen Operatoren Tn- X —? Y zu einem Operator T: X —> Y liegt vor, wenn in Y gilt. Tnx —>Tx (\/xeX). A2 145) 2. Gleichmäßige Konvergenz Die übliche Norm-Konvergenz einer Folge von Operatoren {Tn}™=l im Raum L(X, Y) zu T, also \\Tn - T\\ = sup \\Tnx - Tx\\ —? 0 (n -? oo) A2 146) IMI<i ist die gleichmäßige Konvergenz auf der Einheitskugel von X. Sie impliziert die punktweise Konvergenz während die Umkehrung im allgemeinen nicht gilt 3. Anwendungen Konvergenz von Quadraturformeln, wenn die Anzahl n der Stützstellen gegen oo geht, Permanenzprinzip von Summations- und Limitierungsverfahren u a 12.5.2 Lineare stetige Operatoren in Banach—Räumen Die Räume X und Y seien jetzt als BANACH-Räume vorausgesetzt
12.5 Stetige lineare Operatoren und Funktionale 641 1. Satz von Banach-Steinhaus (Prinzip der gleichmäßigen Beschränkheit) Der Satz cha-. rakterisiert die punktweise Konvergenz einer Folge von linearen stetigen Operatoren zu einem linearen stetigen Operator durch die beiden Bedingungen a) Für jedes Element aus einer überall dichten Teilmenge DcX hat die Folge {Tnx} einen Grenzwert in Y und b) mit einer Konstanten C gilt ||Tn|| < C, Vn. 2. Satz von der offenen Abbildung Der Satz besagt, daß ein linearer stetiger Operator, der X auf Y abbildet, offen ist, d.h., das Bild T(G) ist eine offene Menge in Y für jede offene Menge G aus X 3. Satz vom abgeschlossenen Graphen (Closed Graph Theorem) Ein Operator T. Dt —? Y mit Dt C X heißt abgeschlossen, wenn aus xn G Dt , xn —> x0 in X und Txn —* yo in Y stets Xq G Dt und y0 = Txq folgen. Notwendig und hinreichend dafür ist die Abgeschlossenheit des Graphen des Operators T im Raum X x Y, d h. der Menge rT = {(x,Tx): xeDT}, A2.147) wobei (x, y) hier die Bezeichnung für ein Element der Menge X x Y ist. Es gilt: Ist T ein abgeschlossener Operator mit abgeschlossenem Definitionsbereich Dt , dann ist T stetig. 4. Satz von Hellinger und Toeplitz Sei T ein linearer Operator in einem HlLBERT-Raum H. Wenn (x, Ty) = (Tx, y) für alle x, y G H gilt, so ist T stetig 5. Satz von Krein und Losanowskij über die Stetigkeit positiver linearer Operatoren Sind X = (X, X+, II • II) und Y = (Y, Y+, || • ||) geordnete normierte Räume, wobei X+ ein erzeugender Kegel ist, dann ist die Menge L+ (X, Y) aller positiven linearen und stetigen Operatoren T, d.h. T(X+) C Y+ , ein Kegel in L(X, Y). Dann besagt der Satz von M.G. Krein, G.J. Losanowskij (s. [12 20])- Sind X und Y geordnete BANACH-Räume mit abgeschlossenen Kegeln X+ und Y+ und erzeugendem X+ , dann folgt aus der Positivität eines linearen Operators seine Stetigkeit. 6. Inverser Operator Seien X und Y beliebige normierte Räume und T* X —> Y ein linearer, nicht unbedingt stetiger Operator. Dann besitzt T einen stetigen Inversen T~l: Y —? X, wenn T(X) = Y und mit einer Konstanten m > 0 für alle x G X die Abschätzung \\Tx\\ > m||x|| gilt. Man hat dann sogar IIT-11| <^ Im Falle von BANACH-Räumen X, Y gilt der 7. Satz von Banach über die Stetigkeit des inversen Operators Ist T ein linearer stetiger bi- jektiver Operator von X auf Y, dann ist der inverse Operator T~l stetig Als wichtige Anwendungen ergeben sich daraus beispielsweise die Stetigkeit von (XI — T)_1 bei In- jektivität und Surjektivität von XI — T, was bei der Untersuchung des Spektrums eines Operators (s. 12.5.3.2, S. 643) von Bedeutung ist, sowie die 8. Stetige Abhängigkeit der Lösung sowohl von der rechten Seite als auch von den Anfangswerten bei Anfangswertproblemen für lineare Differentialgleichungen. Das soll an der folgenden Anfangswertaufgabe gezeigt werden. ¦ Das Anfangswertproblem x{t)+pi(t)x(t)+p2(t)x(t) = q(t), te[a,b], x{t0) = f, x{t0) = £, *0 e [a,b] A2.148a) mit den Koeffizienten Pi(t),p2(t) G C([a, b]) besitzt für jede rechte Seite q(t) G C([a,b]) und jedes Zahlenpaar £, £ genau eine Lösung x aus C2([a, b]), die im folgenden Sinne stetig von q(t), £ und £ abhängt Sind qn(t) G C([a, b]) und gilt für V n xn(t) +Pi(t)xn(t)+p2(t)xn(t) = qn{t), xn{a) = fn , xn(a) = £n , A2 148b) dann gilt Qn(t)-^q{t) in C([a,6]),| £n —> f, > implies that xn —+ x in the space C2([a, b]). A2.148c) ?n-e J
642 12. Funktionalanalysis 9. Methode der sukzessiven Approximation zur Lösung einer Gleichung der Form x-Tx = y A2 149) mit einem stetigen linearen Operator T im BANACH-Raum X bei vorgegebenem y Sie besteht darin. ausgehend von einer beliebigen Anfangsnäherung x0 , eine Folge {xn} von Näherungslösungen nach der Vorschrift xn+i=y + Txn (n = 0,l, .) A2.150) zu erzeugen, die in X zur Lösung x* von A2.149) konvergiert. Die Konvergenz der Methode, also xn —? x*, basiert auf der Konvergenz der Reihe A2 144) mit A = 1. Sei ||T|| < q < 1. Dann gelten die folgenden Aussagen: a) Der Operator I — T besitzt einen stetigen Inversen mit ||G — T)-1|| < und die Gleichung A2.149) hat genau eine Lösung für beliebiges y b) Die Reihe A2.144) konvergiert und ihre Summe ist der Operator (I — T)~l. c) Das Verfahren A2.150) konvergiert für einen beliebigen Anfangswert x0 zur eindeutigen Lösung x* der Gleichung A2.149), falls die Reihe A2.144) konvergiert. Dabei gilt die Abschätzung \\xn-x*\\ < j£--\\Txo - x0\\ (n=l,2,.. ). A2.151) Analog (s. Kapitel 11.2.2, S. 587 und [12.9]) behandelt man Gleichungen der Typen x-iiTx = y, Xx-Tx = y, /z,AgK. A2.152) 12.5.3 Elemente der Spektraltheorie linearer Operatoren 12.5.3.1 Resolventenmenge und Resolvente eines Operators Bei Untersuchungen zur Lösbarkeit von Gleichungen ist man bestrebt, das Problem auf die Form (/ -T)x = y A2 153) mit einem Operator T von möglichst kleiner Norm zu bringen, da diese wegen A2.143) und A2.144) für eine funktionalanalytische Behandlung besonders zugänglich ist Um mit der Theorie auch große Werte von ||T|| zu erfassen, untersucht man in einem komplexen BANACH-Raum X die gesamte Schar von Gleichungen {XI-T)x = y (xGX), (AgC). A2.154) Sei T ein linearer, im allgemeinen unbeschränkter Operator im BANACH-Raum X Die Menge g(T) aller komplexen Zahlen, für die {XI — T)~l G B{X) = L(X) gilt, heißt Resolventenmenge und der Operator R\ = R\{T) = {XI — T)-1 Resolvente Sei jetzt T ein beschränkter linearer Operator in einem komplexen BANACH-Raum X. Dann gelten die Aussagen: 1. Die Menge g(T) ist offen. Genauer, ist A0 G g(T) und genügt A € C der Ungleichung IA-AoK^, A2,55) dann existiert R\ , und es gilt Rx = Rx, + (A - AoX + (A - A0)X + .. = £(A - Ao)*-1^ A2 156) fc=l 2. {A G C • |A| > ||T||} C q{T) Genauer, für V A G C mit |A| > ||T|| existiert Rx und ITT2 * = -Ä-Ä*-v- (m57) 3. \\RX - R\0\\ -+ 0 , wenn A -+ A0 (A, A0 G g(T)), und \\RX\\ -+ 0, wenn A -* oo (A G g(T)) \\R\ — R\0 D2 II n xx 4. — —- — Rx\\ —> 0 , wenn A —» A0 A — An
12 5 Stetige lineare Operatoren und Funktionale 643 5. Für ein beliebiges Funktional / G X* und beliebiges x G X ist F(X) = f(R\(x)) eine holomorphe Funktion auf g(T). 6. Für beliebige A , jjl G g(T), A ^ ß gilt: RXR^ = RßRx = Rx~R» . A2.158) A — ja 12.5.3.2 Spektrum eines Operators 1. Spektrum, Definition Die Menge o(T) = C \ g(T) heißt Spektrum des Operators T Da / — T offenbar genau dann einen stetigen Inversen (und demzufolge die Gleichung A2.153) immer eine Lösung, die stetig von der rechten Seite abhängt) besitzt, wenn 1 G g(T), ist eine möglichst umfassende Kenntnis des Spektrums cr(T) des Operators erforderlich Aus den Eigenschaften der Resolventenmenge folgt sofort, daß das Spektrum a(T) eine abgeschlossene Teilmenge von C ist, die im Kreis {A: |A| < ||T||} liegt, wobei in vielen Fällen a(T) deutlich kleiner als dieser Kreis ist. Für jeden linearen stetigen Operator auf einem komplexen BANACH-Raum ist das Spektrum nicht leer, und es gilt die Formel r(T)= sup |A|. A2.159) AGct(T) Genauere Angaben über das Spektrum sind für viele gebräuchliche Klassen von Operatoren möglich. Ist T ein Operator in einem endlichdimensionalen Raum X und hat die Gleichung (XI — T)x = 0 nur die triviale Lösung (d.h , XI -T ist injektiv), dann folgt bereits A G g(T) (d.h., XI — T ist surjektiv) Hat diese Gleichung in irgendeinem BANACH-Raum eine nichttriviale Lösung, dann ist der Operator XI -T nicht injektiv und (XI — T)~l im allgemeinen nicht definiert Die Zahl A G C heißt Eigenwert des linearen Operators T, wenn die Gleichung Xx = Tx eine nichttriviale Lösung besitzt Alle diese Lösungen heißen Eigenvektoren oder, falls X ein Funktionenraum ist (was in Anwendungen offenbar zutrifft), Eigenfunktionen des Operators T zu A . Der von ihnen aufgespannte Teilraum heißt der Eigenraum zu A . Die Menge crp(T) aller Eigenwerte von T heißt Punktspektrum des Operators T. 2. Vergleich mit der linearen Algebra, Residualspektrum Ein wesentlicher Unterschied zwischen dem endlichdimensionalen Fall, der im wesentlichen in der Linearen Algebra betrachtet wird, und der Situation im unendlichdimensionalen Fall, mit dem sich die Funktionalanalysis befaßt, besteht zumindest an dieser Stelle darin, daß in ersterem stets o~(T) = o-p(T) gilt, während in letzterem das Spektrum in der Regel Punkte enthält, die keine Eigenwerte von T sind. Ist XI — T injektiv und surjektiv, dann gilt wegen des Satzes über die Stetigkeit des Inversen (s. 12.5.2,7., S 641) A G g(T). Im Kontrast zum endlichdimensionalen Fall, bei dem die Surjektivität automatisch aus der Injektivität folgt, muß im unendlichdimensionalen Falle weitaus differenzierter vorgegangen werden. Die Menge ac(T) aller A G cr(T), für die XI - T injektiv und Im(XI - T) dicht in X liegt, heißt stetiges oder kontinuierliches Spektrum und die Menge aT(T) aller der A , mit injektivem XI — T und nichtdichtem Wertebereich, heißt Rest- oder Residualspektrum des Operators T. Für einen beschränkten linearen Operator T im komplexen BANACH-Raum X gilt die disjunkte Vereinigung a(T) = ap(T) U ac(T) U <rr(T). A2.160) 12.5.4 Stetige lineare Funktionale 12.5.4.1 Definition Für Y = K nennt man eine lineare Abbildung lineares Funktional oder Linearform. Im weiteren wird in einem HiLBERT-Raum der komplexe, in allen anderen Situationen fast ausschließlich der reelle Fall betrachtet. Der BANACH-Raum L(X, K) aller stetigen linearen Funktionale heißt Dual, Dualraumoder adjungierter Raum von X und wird mit X* (manchmal auch mit X') bezeichnet. Der Wert (aus K) eines
644 12. Funktionalanalysis linearen stetigen Punktionais / G X* auf einem Element x G X wird mit f(x), häufig aber auch - um den für die Dualitätstheorie ausschlaggebenden Gedanken der bilinearen Verknüpfung von X und X* hervorzuheben - mit (x, /) bezeichnet (vgl. auch mit dem Satz von RlESZ über die linearen stetigen Funktionale im HiLBERT-Raum im nächsten Abschnitt) ¦ A: Seien t1} £2, • • •, tn fixierte Punkte des Intervals [a, b] und ci, C2,..., cn reelle Zahlen. Durch /(*) = £<**(**) A2.161) fc=i ist ein lineares stetiges Funktional auf dem Raum C([a, b]) mit der Norm ||/|| = Y%=i \ck\ definiert. Ein Spezialfall von A2.161) ist für ein fixiertes t G [a, b] das (^-Funktional St(x) = x{t) (x G C{[a, b])). A2.162) ¦ B: Mit einer auf [a, b] summierbaren Funktion <p(t) A2.9.3.1) ist rb f(x) = / <p(t)x(t) dt A2 163) Ja ein lineares stetiges Funktional auf C([a, b]) und auf B([a, b]) jeweils mit der Norm ||/|| = f% \ip(t)\dt 12.5.4.2 Stetige lineare Funktionale im Hubert—Raum, Satz von Riesz Im HiLBERT-Raum H definiert jedes Element y G H mittels f(x) = (x,y) ein lineares stetiges Funktional mit der Norm ||/|| = \\y\\. Und umgekehrt, ist / ein lineares stetiges Funktional auf H , dann existiert genau ein Element y G H , so daß gilt: f(x) = (x,y) (VxGH). A2164) Die Räume H und H* sind nach diesem Satz isomorph, weshalb man sie identifiziert. Der Satz von RlESZ enthält einen Hinweis darauf, wie man die Orthogonalität in einem beliebigen normierten Raum einfuhren kann. Seien A C X und A* C X*. Dann nennt man die Mengen ,4-L = {/G X:/(x) = 0 VxeA*} und A^ = {x G X. f{x) = 0 V/Gß} A2 165) jeweils das orthogonale Komplement oder den Annulator zu A bzw. A*. 12.5.4.3 Stetige lineare Funktionale in Lp Sei p > 1. Man nennt q den zu p konjugierten Exponenten, wenn - + - = 1 gilt, wobei man q = oo im p q Falle p = 1 setzt. ¦ Aufgrund der HÖLDERschen Ungleichung für Integrale (s. 1.4.2.11, S. 32) kann das Funktional A2 163) auch auf den Räumen Z^Qa, b]) A < p < oo) (s. 12.9.4, 659) betrachtet werden, falls ip G Lq{[a, b\) mit - + - = 1 ist. Seine Norm ist dann V Q 11/11 = M = f \J«Mt)l]dtr M!S l<^°°> A2.166) ( vrai sup,€[0N] \(p(t)|, falls p = 1 (bezüglich der Definition von vraisup \(p\ s. A2.218), S. 659) Zu jedem linearen stetigen Funktional / im Raum Lp([a, b]) gibt es ein (bis auf seine Aquivalenzklasse) eindeutig bestimmtes Element y G L<*{[a, 6]), so daß b / b \q f(x) = (x,y) = jx(t)W)dt, xeL*> und ||/|| = \\y\\q = l J \y{t)\*dt I A2.167)
12 5 Stetige lineare Operatoren und Funktionale 645 gelten Für den Fall p = oo s [12.18]. 12.5.5 Fortsetzung von linearen Funktionalen 1. Halbnorm Eine Abbildung p: X —> R eines Vektorraumes X heißt Halbnorm, wenn sie die folgenden Eigenschaften besitzt: (HN1) p(x)>0, A2.168) (HN2) p(ax) = \a\p(x), A2 169) (HN3) p(x + y) < p(x) + p(y) A2 170) Ein Vergleich mit 12 3.1, S. 631 zeigt, daß eine Halbnorm genau dann eine Norm ist, wenn p(x) = 0 nur für x = 0 gilt. Sowohl für theoretische innermathematische Fragestellungen als auch für praktische Belange in vielen Anwendungen der Mathematik hat sich das Problem der Erweiterung eines auf einem linearen Teilraum Xo C X gegebenen linearen Funktionais auf den gesamten Raum - um triviale und uninteressante Fälle auszuschließen - unter Beibehaltung gewisser „guter" Eigenschaften als eines der fundamentalsten Ergebnisse herauskristallisiert Die Lösung dieses Problems wird garantiert durch den 2. Fortsetzungssatz von Hahn-Banach (analytische Form) Sei X ein Vektorraum über K und p eine Halbnorm auf X. Seien X0 ein linearer (komplexer, falls K = C und reeller, falls K = R) Teilraum von X und /o ein lineares (komplexwertiges, falls K = C und reellwertiges, falls K = R) Funktional auf X0 , welches der Bedingung \fo(x)\<p(x) VxGXq A2.171) genügt Dann existiert ein lineares Funktional / auf X mit folgenden Eigenschaften f(x) = f0(x) VzeXo, \f(x)\<p(x) VzGX. A2.172) Somit ist / die Fortsetzung des Funktionais /o auf den gesamten Raum X unter Beibehaltung der Abschätzung A2 171) Wenn Xo ein linearer Teilraum eines normierten Raumes X ist und /o ein stetiges lineares Funktional auf X0 , dann ist p(x) = ||/0|| • ||a:|| eine Halbnorm auf X mit A2 171), so daß sich sofort die Variante des Satzes von HAHN-BANACH über die Fortsetzung stetiger linearer Funktionale ergibt. Zwei wichtige Konsequenzen aus letzterem sind die „Reichhaltigkeit" des dualen zu einem normierten Raum. Für jedes Element i /0 gibt es ein Funktional / G X* mit f(x) = \\x\\ und ||/|| = 1 sowie den folgenden Sachverhalt. Für jeden linearen Teilraum X0 C X und Xo £ X0 mit dem Abstand d = infxGx0 \\x ~ xo\\ > 0 gibt es ein / G X* mit f(x) = 0 VzeXo, f(x0) = l und ||/|| = ^. A2-173) 12.5.6 Trennung konvexer Mengen 1. Hyperebenen Eine von X verschiedene lineare Teilmenge L des (reellen) Vektorraumes X heißt Hyperteilraum oder Hyperebene durch 0 wenn ein Xo G X existiert, mit dem X = lin(xo,L) gilt. Mengen der Gestalt x + L sind affin-lineare Mannigfaltigkeiten (s. 12 1 2, S. 617) Ist dabei L ein Hyperteilraum, so nennt man sie Hyperebenen. Es besteht der folgende enge Zusammenhang zwischen Hyperebenen und linearen Funktionalen- Einerseits ist der Kern /-1@) = {x G X. f(x) = 0} eines linearen Funktionais / auf X ein Hyperteilraum in X, und für jede Zahl A G R existiert ein x\ G X mit f(x\) = A und /-1(A) = X\ + f~l@) Andererseits existiert zu einem Hyperteilraum LcX, einem Xq £ L und A ^ 0, A G R stets ein eindeutig bestimmtes lineares Funktional / auf X mit /-1@) = L und f(x0) = A. Die Abgeschlossenheit von /_1@) im Falle eines normierten Raums X ist äquivalent zur Stetigkeit des Funktionais / . 2. Geometrische Form des Satzes von Hahn-Banach Seien X ein normierter Raum, x0 G X und L ein linearer Teilraum von X. Dann gibt es zu jeder nichtleeren konvexen offenen Menge K, die
646 12 Funktionalanalysis sich mit der affin-linearen Mannigfaltigkeit {x0 + L} nicht schneidet, eine abgeschlossene Hyperebene H mit {x0 + L} C H und H n # = 0. 3. Trennung konvexer Mengen Man nennt zwei Teilmengen A, B eines reellen normierten Raumes X durch eine Hyperebene trennbar, wenn ein Funktional / G X* existiert, so daß gilt: sup/(z)<inf/(</). A2.174) xeA y€ß /_1(q) mit a = supxeA f(x) ist dann die trennende Hyperebene, was nichts anderes besagt, als daß die Mengen in den verschiedenen Halbräumen {x G X: f{x) < a} und {x € X- f(x) > a} A2 175) liegen. In den Abb-en.l2.5b,c sind zwei Fälle der Trennung durch eine Hyperebene dargestellt Entscheidend für die Trennung zweier Mengen ist weniger ihre Disjunktheit In Abb. 12.5a sind zwei Mengen E und B dargestellt, die nicht trennbar sind, obwohl E und B disjunkt sind und B konvex Vielmehr ist die Konvexität der Mengen von Bedeutung, da nicht ausgeschlossen ist, daß beide zu trennenden Mengen gemeinsame Punkte besitzen, durch die die Hyperebene verläuft. Abbildung 12 5 Es gilt: Ist A eine konvexe Menge eines normierten Raumes X mit nichtleerem Inneren Int(A) und B C X eine nichtleere konvexe Menge mit Int(A) n B = 0, dann sind A und B trennbar. Die Bedingung Int(A) ^ 0 kann in diesem Trennungssatz nicht weggelassen werden (s. [12 3], Beispiel 4.47). Ein (reelles) lineares Funktional / G X* heißt Stützfunktional an die Menge A im Punkt xq G A, wenn es eine solche Zahl A G R gibt, für die f(x0) = X und A C {x G X : f(x) < X} gilt. /_1(^) heißt dann Stützhyperebene im Punkt xq an A. Für eine konvexe Menge K mit nichtleerem Inneren existiert in jedem ihrer Randpunkte ein Stützfunktional. Hinweis: Auf der Trennbarkeit konvexer Mengen beruht der Beweis der KUHN-TUCKER-Bedingun- gen (s Abschnitt 18.2, S. 889), aus denen sich praktische Verfahren zur Bestimmung des Minimums eines konvexen Optimierungsproblems herleiten lassen (s. [12.5]) 12.5.7 Bidualer Raum und reflexive Räume Der duale Raum X* eines normierten Raums X ist mit ||/|| = sup^^ |/(x)| ebenfalls ein normierter Raum, so daß (X*)* = X**, der Bidual oder der zweite adjungierte Raum zu X, betrachtet werden kann. Die kanonische Einbettung J: X —? X** mit Jx = Fx, wobei Fx(f) = f{x) (V / G X*) A2.176) erweist sich als Normisomorphie (s. 12.3.1, S. 631), weswegen X mit dem Teilraum J(X) C X** identifiziert wird. Ein BANACH-Raum heißt reflexiv, wenn J(X) = X** gilt, die kanonische Einbettung also eine surjektive Normisomorphie ist. ¦ Alle endlichdimensionalen BANACH-Räume sowie alle HiLBERT-Räume sind reflexiv, ebenso die Räume Lp A < p < oo), während C([a, b]), ^([0,1]), c0 Beispiele nichtreflexiver Räume sind. 12.6 Adjungierte Operatoren in normierten Räumen 12.6.1 Adjungierter Operator zu einem beschränkten Operator Für einen linearen stetigen Operator T X —? Y (X, Y normierte Räume) ordnet man jedem g G Y* durch f(x) = g{Tx) V x G X ein Funktional / G X* zu. Auf diese Weise entsteht ein linearer stetiger
12.6 Adjungierte Operatoren in normierten Räumen 647 Operator T* Y*—>X\ {T*g)(x) = g(Tx) (V^eY* VxeX), A2 177) der adjungierter Operator zu T heißt und die folgenden Eigenschaften besitzt (T + S)* = T* + S*, {ST)* = S*T*, ||T*|| = ||T||, wobei für die linearen stetigen Operatoren T • X —? Y und S : Y —> Z (X, Y, Z normierte Räume) der Operator ST : X —> Z auf natürliche Weise durch ST(x) = S(T(a;)) definiert ist. Mit den in 12.1.5, S. 620 und 12.5.4.2, S. 644 eingeführten Bezeichnungen bestehen für einen Operator T G B(X, Y) die folgenden Identitäten: Im(T) = Ker{T*)L, Im(T*) = Ker(T)^ , A2.178) wobei die Abgeschlossenheit von Im(T) die Abgeschlossenheit von Im(T*) impliziert. Der Operator T** • X** —? Y**, den man als (T*)* aus T* gewinnt, heißt zweiter adjungierter Operator zu T und hat die Eigenschaft: Ist Fx G X**, dann gilt wegen (T**(Fx))g = Fx(T*g) = {T*g){x) = g(Tx) = FTx(g), x G X,g G Y* die Beziehung T**FX = FTx G Y**. Der Operator T**: X** -+ Y** ist also eine Erweiterung von T. Im HiLBERT-Raum H kann auf Grund des RiESZschen Satzes der adjungierte Operator mit Hilfe des Skalarprodukts (Tx, y) = (x, T*y), x, y G H eingeführt werden, wobei sich wegen der Identifizierung von H und H** neben (AT)* = AT* und I* = I sogar T** = T ergibt. Ist T bijektiv, so ist es auch T*, und es gilt (T*)-1 = (T-1)*. Für die Resolventen von T und T* gilt die Beziehung \R>,(T)r = Rj(T'), A2 179) woraus sich für das Spektrum des adjungierten Operators a(T*) — {A: A G cr(T)} ergibt. ¦ A: Sei T ein Integraloperator mit stetigem Kern (Tx)(s) = [b K(s,t)x(t)dt, A2.180) Ja der im Raum Lp([a, b]) A < p < oo) betrachtet wird. Der zu T adjungierte Operator ist ebenfalls ein Integraloperator (T*g)(t)= [bK*(t,s)yg(s)ds A2 181) Ja mit dem Kern if *(s, t) = K(t, s), wobei yg das gemäß A2.167) zu g G (Z^)* existierende Element aus L9 ist. ¦ B: Im endlichdimensionalen komplexen Vektorraum ist der adjungierte zu einem durch die Matrix A = (ciij) repräsentierten Operator gerade durch die Matrix A* mit a*j = <ä]i definiert. 12.6.2 Adjungierter Operator zu einem unbeschränkten Operator Seien X und Y reelle normierte Räume und T ein linearer (nicht unbedingt beschränkter) Operator mit dem (linearen) Definitionsbereich D(T) C X und Werten in Y. Für ein fixiertes Funktional g G Y* ist dann der Ausdruck g(Tx), der offenbar linear von x abhängt, sinnvoll, so daß die Frage nach der Existenz eines wohlbestimmten Funktionais / G X* mit der Eigenschaft f(x)=g(Tx) VxeD(T) A2 182) steht Sei D* C Y* die Menge aller der g G Y*, für die bei einem gewissen / G X* die Darstellung A2.182) gilt. Ist D(T) = X, dann ist / zu vorgegebenem g eindeutig bestimmt, so daß ein linearer Operator / = T*g mit D(T*) = D* als Definitionsbereich entsteht Für beliebige x G D{T) und g G Y* gilt dann g{Tx) = (T*g)(x) VxGX, Vg G D{T). A2.183) Der Operator T* ist sogar abgeschlossen und heißt adjungiert zu T. Die Natürlichkeit dieses allgemeinen Zugangs ergibt sich daraus, daß D(T*) = Y* genau dann gilt, wenn T auf D(T) beschränkt ist. In
648 12. Funktionalanalysis diesem Falle ist T* £ B(Y\ X*) und ||T*|| = ||T||. 12.6.3 Selbstadjungierte Operatoren Ein Operator T G B(H) heißt selbstadjungiert, wenn T* = T In diesem Falle ist für jedes x G H die Zahl (Tz, x) reell. Es gelten ||T|| = sup \(Tx,x)\ A2 184) ||x||=l und mit m — m(T) = inf ||sc||==i(T,a;, a;) und M = M(T) = sup||x||=1(Tx,x) rn(T)\\x\\2 < (Tx,x) < M(T)\\x\\2 und ||T|| = r(T) = max{|m|,M} A2.185) Das Spektrum eines selbstadjungierten (beschränkten) Operators liegt im Intervall [m, M], wobei gilt m,M G cr(T) 12.6.3.1 Positiv definite Operatoren In der Menge aller selbst adjungierten Operatoren aus B(H) kann durch T > 0 genau dann, wenn (Tx, i)>0 VieH, A2 186) eine partielle Ordnung eingeführt werden, wobei ein Operator T mit T > 0 positiv (definit) heißt Für einen selbstadjungierten Operator T gilt (mit Hilfe von (Hl) aus 12.4 1 1, S 635) (T2x,x) — (Tx, Tx) > 0, so daß T2 positiv definit ist. Jeder positiv definite Operator T besitzt seine Wurzel d.h., es existiert genau ein positiv definiter Operator W mit W2 = T Darüber hinaus ist der Vektorraum der selbstadjungierten Operatoren ein Vektorverband (s 12 1 7.4, S. 623), wobei die Operatoren |T| = >/r2, T+ = h\T\+T), T~ = h\T\-T) A2 187) für die Spektralzerlegung und Spektral- bzw. Integraldarstellung von selbstadjungierten Operatoren mit Hilfe eines STIELTJES-Integrals Bedeutung erlangen (s 8.2 3, S 470 sowie [12.1], [12.12], [12 13]. [12.15], [12 18], [12.21]) 12.6.3.2 Projektoren im Hilbert-Raum Sei H0 ein Teilraum eines HlLBERT-Raums H Dann ist nach dem Projektionssatz (s 12.4 2, S 636) für jedes x G H seine Projektion x' auf H0 und demzufolge ein Operator P mit Px — x' von H auf H0 definiert. P heißt Projektor auf H0 Offenbar ist P linear, stetig, und es gilt ||P|| = 1 Ein stetiger linearer Operator P in H ist genau dann ein Projektor (auf einen geeigneten Unterrraum), wenn gilt a) P = P*, d.h., P ist selbstadjungiert, und b) P2 = P, d.h., P ist idempotent. 12.7 Kompakte Mengen und kompakte Operatoren 12.7.1 Kompakte Teilmengen in normierten Räumen Eine Teilmenge A eines normierten Raumes * X heißt • kompakt, wenn jede Folge von Elementen aus A eine konvergente Teilfolge enthält, deren Grenzwert in A liegt, • relativkompakt oder präkompakt, wenn ihre Abschließung (s 12 2 1 3, S 627) kompakt ist, d.h , jede Folge von Elementen aus A enthält eine (nicht unbedingt zu einem Element aus A) konvergente Teilfolge. In der Analysis ist dies gerade der Satz von Bolzano-Weierstrass, weshalb man sagt, eine solche Menge besitze die Bolzano-Weierstrass -Eigenschaß. Jede kompakte Menge ist abgeschlossen und beschränkt. Umgekehrt, ist der Raum X endlichdimensio- nal, dann ist jede solche Menge auch kompakt. Die abgeschlossene Einheitskugel im normierten Raum *Fur die eingeführten Begriffe genügt es, X als metrischen (oder noch allgemeineren) Raum vorauszusetzen Diese Allgemeinheit wird im weiteren aber nicht erforderlich sein
12.7 Kompakte Mengen und kompakte Operatoren 649 X ist genau dann kompakt, wenn X endlichdimensional ist. Zur Charakterisierung von relativkompakten Mengen in metrischen Räumen (Satz von HAUSDORFF über die Existenz eines endlichen ^-Netzes) sowie in den Räumen s , C (Satz von Arzela-Ascoli) und Lp A < p < oo) s. [12.18]. 12.7.2 Kompakte Operatoren 12.7.2.1 Begriff des kompakten Operators Ein beliebiger Operator T' X —> Y des normierten Raums X in den normierten Raum Y heißt kompakt, wenn das Bild T(A) jeder beschränkten Menge AcX eine relativkompakte Menge in Y ist. Ist der Operator T zudem noch stetig, dann heißt er vollstetig. Jeder kompakte lineare Operator ist beschränkt und demzufolge vollstetig. Für die Kompaktheit eines linearen Operators genügt es zu fordern, daß er die Einheitskugel aus X in eine relativkompakte Menge in Y überführt. 12.7.2.2 Eigenschaften linearer kompakter Operatoren Eine sequentielle Charakteristik der Kompaktheit eines Operators aus B(X, Y) ist die folgende: Für jede beschränkte Folge {£n}55=i aus X enthält die Folge {Txn}<^:=1 eine konvergente Teilfolge. Eine Linearkombination kompakter Operatoren ist wieder kompakt Ist einer der Operatoren U G B(W, X), T G B(X, Y), S G B(Y, Z) kompakt, dann sind es auch die Operatoren TU und ST. Falls Y ein Banach- Raum ist, hat man die folgenden wichtigen Aussagen 1. Konvergenz Konvergiert eine Folge von kompakten Operatoren {Tn}^=1 im Raum i?(X, Y), dann ist der Grenzwert ebenfalls ein kompakter Operator. 2. Satz von Schauder Ist T ein linearer stetiger Operator, dann sind T und T* gleichzeitig kompakt (oder nicht) 3. Spektraleigenschaften eines kompakten Operators T in einem (unendlichdimensionalen) BANACH-Raum X- Die Null gehört zum Spektrum. Jeder von Null verschiedene Punkt des Spektrums a(T) ist ein Eigenwert mit endlichdimensionalem Eigenraum Xa = {x G X: (XI — T)x = 0} , und V e > 0 liegen außerhalb des Kreises {|A| < e} stets nur endlich viele Eigenwerte von T, wobei einzig die Null Häufungspunkt der Menge der Eigenwerte sein kann Ist A = 0 kein Eigenwert von T, dann ist T~l im Falle seiner Existenz unbeschränkt 12.7.2.3 Schwache Konvergenz von Elementen Eine Folge {xn}™=l von Elementen des normierten Raumes X heißt schwach konvergent zu einem Element Xq , wenn für jedes / G X* die Beziehung f{xn) —> f(x0) gilt (Schreibweise: xn —^ x0). Offenbar hat man: xn —> xo impliziert xn —^ Xq Ist Y ein weiterer normierter Raum und T: X —> Y ein stetiger linearer Operator, dann gilt. a) xn —^ xq impliziert Txn —^ Txq , b) ist T kompakt, dann impliziert xn —*¦ Xq sogar Txn —> Txq . ¦ A: Jeder endlichdimensionale Operator ist kompakt. Daraus folgt, daß der identische Operator in einem unendlichdimensionalen Raum nie kompakt sein kann (s. 12.7.1, S. 648) ¦ B: Sei X = l2 und T der durch die unendliche Matrix j tu t\2 ti3 ^21 ^22 ^23 «31 • • v • • ¦ (oo oo \ Yl tlkXk, • • • , ]C tnkXki • • • ) A2.188) *=1 fc=l / gegebene Operator in l2 . Gilt £^n=i |^nfc|2 = M < oo , dann ist T ein kompakter Operator von l2 in l2 mit||T||<M. ¦ C: Der Integraloperator A2.136) erweist sich als kompakter Operator in den Räumen C([a,b\) und
650 12 Funktionalanalysis Lp (a,b) A <p< oo). 12.7.3 Fredholmsche Alternative Sei T ein kompakter linearer Operator in einem BANACH-Raum X. Es werden die folgenden Gleichungen 2 Art mit einem Parameter A ^ 0 betrachtet. x - XTx = y, x- XTx = 0, A2 189a) f-\Vf = 9i f-XTf = Q. A2189b) Es gelten: 1. dim(Ker(I — AT)) = dim(Ker(I — AT*)) < oo , d.h , die homogenen Gleichungen haben stets dieselbe endliche Anzahl von linear unabhängigen Lösungen 2. Im{\I -T) = Ker(XI-T*)L und § Im(XI - T*) = Ker(XI - T)L 3. Im(XI - T) = X genau dann, wenn Ker(XI - T) = 0. 4. Die FREDHOLMsche Alternative (auch RiESZ-SCHAUDER-Theorem genannt), d.h a) Entweder die homogene Gleichung besitzt nur die triviale Lösung In diesem Falle gilt A G g(T). der Operator (XI — T)_1 ist beschränkt, und die inhomogene Gleichung besitzt genau eine Lösung x = (XI — T)~ly für beliebiges y G X. b) Oder die homogene Gleichung besitzt wenigstens eine nichttriviale Lösung In diesem Falle gilt. A ist ein Eigenwert von T, also A G cr(T), und die inhomogene Gleichung besitzt eine (nicht eindeutige) Lösung genau dann, wenn die rechte Seite y der Bedingung f(y) = 0 für jede Lösung / der adjungierten Gleichung T*f = Xf genügt. In letzterem Fall erhält man jede Lösung der inhomogenen Gleichung in der Form x = Xq + h , wobei x0 eine feste Lösung der inhomogenen Gleichung und h G Ker(XI — T) ist Lineare Gleichungen der Gestalt Tx = y mit kompaktem Operator T nennt man von 1 Art. Ihre Behandlung ist im allgemeinen etwas schwieriger (s. [12 12], [12 21]) 12.7.4 Kompakte Operatoren im Hubert—Raum Sei T : H —? H ein kompakter Operator Dann ist T Grenzwert (in £?(H)) einer Folge von endlichdi- mensionalen Operatoren. Die Nähe zum endlichdimensionalen Fall ersieht man u.a aus folgendem Ist C ein endlichdimensionaler Operator und T = I — C, dann folgt aus der Injektivität von T die Existenz von T~l und T G B(H) Ist C ein kompakter Operator, dann sind äquivalent. 1. es 3T_1 und ist stetig, 2. x ± 0 => Tx ^ 0, d.h , T ist injektiv, 3. T(H) = H, d.h., T ist surjektiv. 12.7.5 Kompakte selbstadjungierte Operatoren 1. Eigenwerte ' Ein kompakter selbstadjungierter Operator T ^ 0 besitzt wenigstens einen (von Null verschiedenen) Eigenwert. Genauer, T hat immer einen Eigenwert A mit |A| = ||T||. Die Menge der Eigenwerte von T ist höchstens abzählbar. T hat die Darstellung T = J2k ^kP\k » wobei A^ die verschiedenen Eigenwerte von T und P\ den Projektor auf den Eigenraum Ha bezeichnen Man sagt in diesem Zusammenhang auch, daß der Operator T diagonahsiert werden kann Daraus ergibt sich Tx = Y,k ^k(x, ^k)^k für jedes x G H , wobei {e/t} das orthonormierte System der Eigenvektoren von T ist Wenn A ^ a(T) und t/GH, dann hat die Lösung der Gleichung (XI-T)x = y die Form x = R\(T)y = Sfc(A-Afc)-1B/,efc)efc 2. Satz von Hilbert-Schmidt Ist T ein kompakter selbstadjungierter Operator im separablen HlLBERT-Raum H , dann gibt es in H eine Basis aus den Eigenvektoren von T. §Hier ist die Orthogonalität im BANACH-Raum (s 12 5 4 2, S 644) gemeint
12 8 Nichtlineare Operatoren 651 Die sogenannten Spektral-(abbildungs-)sätze (s. [12.9], [12.11], [12 13], [12.15], [12 16], [12 21]) kann man als die Verallgemeinerung des Satzes von Hilbert-Schmidt auf den nichtkompakten Fall selbst- adjungierter (beschränkter oder unbeschränkter) Operatoren auffassen 12.8 Nichtlineare Operatoren In der Lösungstheorie nichtlinearer Operatorengleichungen zieht man im wesentlichen Methoden heran, die auf den folgenden Prinzipien beruhen. 1. Prinzip der kontrahierenden Abbildung, Banachscher Fixptfnktsatz (s. 12 2.2.3, S. 628 und 12.2 2 4. S. 629 Zu weiteren Modifizierungen und Varianten dieses Prinzips s [12 9], [12 12], [12 15], [12 21] 2. Verallgemeinerung des Newton-Verfahrens (s 18 2.5.2, S 895 und 19.1.1 2, S 912) auf den unendlichdimensionalen Fall. 3. Schaudersches Fixpunktprinzip 4. Leray-Schauder-Theorie. Mit Methoden, die auf den Prinzipien 1 und 2 basieren, ergeben sich umfassende Informationen über die Lösung, wie Existenz, Eindeutigkeit, Konstruktivität u.a., während die Untersuchungsmethoden, die auf den Prinzipien 3 und 4 basieren, im allgemeinen „nur" die qualitative Aussage der Existenz einer Lösung gestatten Bei zusätzlichen Eigenschaften des Operators s. jedoch 12.8 6, S. 654 und 12.8.7, 5. 655. 12.8.1 Beispiele nichtlinearer Operatoren Für nichtlineare Operatoren gilt der in 12 5.1, S. 639 für den linearen Fall erwähnte Zusammenhang zwischen Stetigkeit und Beschränktheit im allgemeinen nicht mehr Bei der Behandlung nichtlinearer Operatorengleichungen, z B nichtlinearer Randwertprobleme oder Integralgleichungen, treten häufig die folgenden nichtlinearen Operatoren auf. 1. Nemytskij-Operator Seien ü eine meßbare Teilmenge aus Rn (s 12 9.1, S. 655) und /. £1 x R —? R eine Funktion von zwei Variablen f(x,s), die bezüglich x für fast alle s stetig und bezüglich s für alle x meßbar ist (CARATHEODORY-Bedingungen) Der nichtlineare Operator J\f auf T(£l) (Mu)(x) = f[x,u(x)} (x e Q) A2 190) heißt NEMYTSKU-Operator Er ist stetig und beschränkt, falls er aus LP(Q) in Lq(Q) mit - + - = 1 abbildet. Dies ist zum Beispiel der Fall, wenn |/(z,s)|<a(a;) + 6|s|? mit a(x) € Lq(ü) (b > 0) A2 191) gilt oder /:OxR —? R stetig ist. Nur in Ausnahmefällen ist der Operator J\f kompakt. 2. Hammerstein-Operator Seien fi eine relativkompakte Teilmenge au^R71^/ eine den CARATHEODORY-Bedingungen genügende und K(x,y) eine stetige Funktion auf fixfi. Der nichtlineare Operator H auf F{ü) (Hu)(x) = f K(x, y)f[y, u(y)] dy (x € O) A2 192) n heißt Hammerstein -Operator Mit dem linearen von K als Kern erzeugten Integraloperator /C (Ku)(x) = f K{x, y)u(y) dy (x e Q) A2 193) n kann H in der Form H = K • N geschrieben werden. Genügt nun der Kern K(x,y) der Bedingung \K(x,y)\qdxdy<oo A2.194) / und die Funktion / der Bedingung A2.191), dann ist H ein stetiger und kompakter Operator auf Lp(ü)
652 12. Funktionalanalysis 3. Urysohn-Operator Seien ÜcR" meßbar und K(x, y,s). OxflxR —? R eine Funktion von drei Variablen, dann heißt der nichtlineare Operator U auf T(Q) (Uu)(x) = f K[x, y, u(y)] dy (x G Q) A2 195) URYSOHN-Operator. Erfüllt der Kern K die entsprechenden Bedingungen, dann ist U ein stetiger und kompakter Operator in C(Q) bzw. in Lp(fi). 12.8.2 Differenzierbarkeit nichtlinearer Operatoren Seien X, Y BANACH-Räume, D C X eine offene Menge und T D —? Y. Der Operator T heißt F'rechet-differenzierbar im Punkt x G D, wenn ein (im allgemeinen von der Stelle x abhängiger, linearer stetiger) Operator L G B(X, Y) existiert, so daß T(x + h)-T(x) = Lh + u(h) mit \\u(h)\\ = o(\\h\\) A2.196) oder in äquivalenter Schreibweise ^PWWzM A2197) llfcll-o \\h\\ gilt, d.h. Ve > 0 36 > 0, so daß \\h\\ < S die Ungleichung \\T(x + h) - T(x) - Lh\\ < e\\h\\ impliziert Der Operator L, den man gewöhnlich mit T'(x), T'(x,-) oder T'(x)(-) bezeichnet, heißt Frechet- Ableitung des Operators T im Punkt x . Den Wert dT(xi h) = T'(x)h nennt man Frechet-Differential des Operators T im Punkt x (für den Zuwachs h) Die Bezeichnungen „weisen den Platz für das Argument aus", auf das die Ableitung des Operators angewendet werden kann. Aus der Differenzierbarkeit eines Operators in einem Punkt folgt seine Stetigkeit in diesem Punkt. Ist T G 5(X, Y), also selbst bereits linear und stetig, dann ist T in jedem Punkt x differenzierbar, und die Ableitung ist gleich T. 12.8.3 Newton-Verfahren Seien X, D wie im vorhergehenden Abschnitt und T: D —> X Unter der Voraussetzung der Differenzierbarkeit von T in jedem Punkt der Menge D ist ein Operator T'\ D —? B(X, Y) definiert, der jedem x G D das Element T'(x) G -B(X, Y) zuordnet. Der Operator V sei auf D stetig (in der Operatornorm), in diesem Falle sagt man, T ist stetig differenzierbar auf D Die Menge D enthalte eine Lösung x* der Gleichung T(x) = Q. A2 198) Weiter sei nun Y = X vorausgesetzt, sowie daß für jedes x G D der Operator T'(x) stetig invertierbar ist, also \T'(x)]~l in B(X) liegt. Für ein beliebiges Element xq G D vermutet man wegen A2 196), daß die Elemente T(xq) = T(xq) — T(x*) und T'(xq)(xo — x*) „nahe" beieinander liegen und demzufolge die Lösung der linearen Gleichung, also (unter den gemachten Voraussetzungen) X!=x0- [T'ixoT^xo), A2 199) das gesuchte Element x* approximiert. Auf diese Weise konstruiert man, ausgehend von x0 , die sogenannte NEWTONsche Näherungsfolge xn+1 = xn- [T\xn)]-lT{xn) (n = 0,1, . ). A2.200) Die Begründung für das beschriebene Vorgehen wird durch eine Reihe von Sätzen, die sich im Allgemeinheitsgrad oder in der Anpassung an spezielle Situationen der gemachten Voraussetzungen unterscheiden, geliefert, von denen exemplarisch nur der folgende zitiert werden soll, aus dem die wesentlichen Eigenschaften und Vorteile des Verfahrens erkennbar werden Es gibt zu Ve G @,1) eine Kugel B = B(xo] 5), 8 = S(e), so daß alle xn in B liegen und die Newton- Folge zur Lösung x* von A2.198) konvergiert. Darüber hinaus gilt ||ain — £o|| < ^n||^o — x*\\ Das modifizierte Newton- Verfahren erhält man, wenn man in der Formel A2.200) stets den Operator [T'(xo)]-1 anstelle von [T'^)]-1 benutzt. Für weitere Abschätzungen der Konvergenzgeschwindigkeit
12.8 Nichtlineare Operatoren 653 und zur (im allgemeinen sensiblen) Abhängigkeit des Verfahrens vom Startpunkt xo s [12.7], [12 13], [12.15], [12.21]. ¦ Jacobi- oder Funktionalmatrix Sei auf einer offenen Menge DcRn ein nichtlinearer Operator T = F . D —> Rm durch m nichtlineare Koordinatenfunktionen Fi, F2,..., Fm der n unabhängigen Variablen X\,x2l... ,xn gegeben. Dann gilt- F(x) = (Fi(x) \ F2(x) \Fm(x)) eRm Vz = (xi,x2,...,xn) eD. A2 201a) dFi Falls für die Koordinatenfunktionen Fi (i = 1, 2,..., m) die partiellen Ableitungen —— (k = 1,2, ., oxk n) auf D existieren und stetig sind, dann ist die Abbildung (der Operator) F in jedem Punkt aus D differenzierbar und ihre Ableitung im Punkt x = (#i, x2, ., xn) G D ist der lineare Operator F'{x) • FT —> FT mit der Darstellung { dFx{x) dFjjx) dx\ dx2 dF2(x) ÖF2{x) F'(x) = dxi dx2 dFx{x) \ dxn dF2(x) dxn dFm(x) dFm(x) \ dxi dx2 dFm(x) dxn A2.201b) / Die Ableitung F'(x) ist eine Matrix vom Typ (m, n). Sie heißt Jacobi- oder Funktionalmatrix. Als Spezialfall tritt sie z B beim NEWTON-Verfahren zur iterativen Lösung von nichtlinearen Gleichungssystemen (s. 19.2.2.2, S. 924) oder bei der Beschreibung der Unabhängigkeit von Funktionen (s 2 18 2 6, 3., S 124) auf Im Fall m = n kann zur Funktionalmatrix der sogenannte Jacobian (JACOBI-Determi- nante) oder die sogenannte Funktionaldeterminante gebildet werden, die abkürzend mit D(F!,F2,. .,Fn) A2.201c) D(x1,x2,...,xn) bezeichnet und bei der Lösung verschiedener (häufig innermathematischer) Probleme eingesetzt wird. 12.8.4 Schaudersches Fixpunktprinzip Sei T ein nichtlinearer Operator, der auf einer Menge D eines BANACH-Raumes X definiert ist und in X abbildet Die nichttriviale Frage nach der Existenz wenigstens einer Lösung der Gleichung x = T(x) wird wie folgt beantwortet: Ist X = R und D = [—1,1], dann hat bekanntlich jede stetige Funktion, die D in D abbildet, einen Fixpunkt in D Ist X ein beliebiger endlichdimensionalemormieTter Raum (dimX > 2), dann gilt der BROUWERsche Fixpunktsatz. 1. Brouwerscher Fixpunktsatz Sei D eine nichtleere abgeschlossene beschränkte konvexe Teilmenge eines endlichdimensionalen normierten Raumes Ist T ein stetiger Operator, der D in sich abbildet, dann hat T (wenigstens) einen Fixpunkt in D Die Antwort im Falle eines beliebigen unendlichdimensionalen BANACH-Raumes gibt der Schau- DERsche Fixpunktsatz. 2. Schauderscher Fixpunktsatz Sei D eine nichtleere abgeschlossene beschränkte konvexe Teilmenge eines BANACH-Raumes. Ist der Operator Tm D —> X stetig und kompakt (also vollstetig) und bildet D in sich ab, dann hat T (wenigstens) einen Fixpunkt in D.
654 12 Funktionalanalysis Mit Hilfe dieses Satzes kann man beispielsweise zeigen, daß das Anfangswertproblem A2.70) für t > 0 immer noch eine lokale Lösung besitzt, wenn die rechte Seite lediglich als stetig vorausgesetzt wird. 12.8.5 Leray—Schauder—Theorie Für die Existenz von Lösungen der Gleichungen x = T(x) und (I + T)(x) = y , mit jeweils vollstetigem Operator T, ist auf der Grundlage tiefliegender Eigenschaften des Abbildungsgrades ein weiteres Prinzip entdeckt worden, das etwa für Existenzbeweise bei nichtlinearen Randwertproblemen erfolgreich eingesetzt wird. Die hier angeführten Resultate dieser Theorie sind für praktische Belange vielfach die geeignetsten, wobei Formulierungen gewählt wurden, die ohne Erwähnung des Abbildungsgrades auskommen. Satz vcm Leray-Schauder Seien D eine offene beschränkte Menge eines rellen BANACH-Raumes X und T: D:—> X ein vollstetiger Operator. Sei y G D ein solcher Punkt, daß x + XT(x) ^ y für alle x e dD und A € [0,1] gilt, wobei OD den Rand der Menge D bezeichnet Dann hat die Gleichung (/ + T)(x) = y wenigstens eine Lösung. In Anwendungen erweist sich häufig auch die folgende Variante dieses Satzes als vorteilhaft: Sei T ein vollstetiger Operator auf dem BANACH-Raum X Wenn die Lösungen der Gleichungsschar x = XT{x) (A<E[0,1]) A2.202) eine gleichmäßige Aprioriabschätzung gestatten, d.h. 3c > 0, so daß VA und Vrr , die A2 202) genügen, die Ungleichung ||x|| < c gilt, dann besitzt die Gleichung x = T{x) eine Lösung. 12.8.6 Positive nichtlineare Operatoren Der erfolgreiche Einsatz des SCHAUDERschen Fixpunktsatzes erfordert die Auswahl einer Menge mit den entsprechenden Eigenschaften, die vom betrachteten Operator in sich abgebildet wird In Anwendungen, insbesondere in der Lösungstheorie nicht linearer Randwertprobleme, handelt es sich meistens um geordnete normierte (aus Funktionen bestehende) Räume und nicht selten um positive, d.h den betreffenden Kegel invariant lassende, oder isoton wachsende Operatoren, d.h solche T, für die x < y => T(x) < T(y) gilt Wenn Verwechslungen (s. etwa 12.8.7, S 655) ausgeschlossen sind, nennt man solche Operatoren auch monoton Seien jetzt X = (X, X+, || • ||) ein geordneter BANACH-Raum mit abgeschlossenen Kegel X+ und [a, b] ein Ordnungsintervall aus X. Ist X+ normal und gilt T([a, b]) C [a, b] für einen vollstetigen (nicht notwendigerweise isotonen) Operator T, dann besitzt T wenigstens einen Fixpunkt in [a, b] (Abb.12.6b) b' a [y / ^ / a 1 z y=x y=f( ~) X b) Abbildung 12.6 Ein weiterer Vorteil der Betrachtungen in geordneten Räumen besteht darin, daß für einen isoton wachsenden Operator T, der auf einem (O)-Interval [a, b] des Raumes X definiert ist und (lediglich) die Eckpunkte a, b in [a, b] abbildet, also den beiden Bedingungen T(a) > a und T(b) < b genügt, automatisch T([a, b]) C [a, b] gilt. Darüber hinaus sind die beiden durch "*~ x0 = a und xn+1 = T(xn) (n > 0) bzw. y0 = b und yn+l = T(yn) {n > 0) A2.203) wohldefinierten (d.h. xn,yn € [a, b], n > 0) Folgen monoton wachsend bzw. fallend, d.h. a = xq < x\ < ... < xn< ... und b = yo > yi > .. .yn > ... . Ein Fixpunkt x* bzw x* des Operators T heißt
12 9 Maß und Lebesgue-Integral 655 minimal bzw. maximal, wenn für jeden Fixpunkt z von T die Ungleichung x* < z bzw z < x* gilt Es gelten nun die folgenden Aussagen (Abb. 12.6a)): Seien X ein geordneter BANACH-Raum mit abgeschlossenem Kegel X+ und T D —> X, D C X ein stetiger isoton wachsender Operator. Sei [a, b] C D mit T(a) > a und T(b) < b. Dann gilt T([a, b]) C [a, b], und der Operator T besitzt einen Fixpunkt in [a, 6], wenn eine der folgenden Bedingungen erfüllt ist- a) X+ ist normal und T kompakt, b) X+ ist regulär Die wie in A2.203) definierten Folgen {xn}™=0 und {yn}%Lo konvergieren dann zum minimalen bzw. maximalen Fixpunkt von T in [a, b]. Das Konzept der Ober- und Unterlösungen basiert auf diesen Resultaten (s. [12 17], [12.13], [12.14]) 12.8.7 Monotone Operatoren in Banach—Räumen 1. Spezielle Eigenschaften Ein beliebiger Operator T:öcX —> Y (X, Y normierte Räume) heißt demistetig im Punkt Xq G D, wenn für jede (in der Norm von X) zu x0 konvergente Folge {xn}%Li C D die Folge {T(xn)}^=l in Y schwach zu T(xo) konvergiert. T heißt demistetig auf der Menge D , wenn T in jedem Punkt Von D demistetig ist. In diesem Abschnitt wird eine andere Verallgemeinerung des aus der reellen Analysis bekannten Monotoniebegriffs eingeführt Seien jetzt X ein reeller BANACH-Raum, X* sein Dual, D C X und T • D —? X* ein nichtlinearer Operator. Dann heißt T monoton, wenn für V x, y G D die Ungleichung (T(x) — T(y),x — y) > 0 gilt. Ist X = H ein HlLBERT-Raum, dann ist das Skalarprodukt gemeint, während im Falle eines beliebigen BANACH-Raumes bezüglich der Bezeichnung auf 12.5.5, S. 645 verwiesen wird. Der Operator T heißt streng monoton, wenn es eine Konstante c > 0 gibt, so daß (T(x) - T(y), x — y) > c\\x — y\\2 für V x, y G D gilt. Ein Operator T: X —? X* heißt koerzitiv, wenn hm v ;, , ; = oo gilt IMI-oo ||x|| 2. Existenzaussagen für Lösungen von Operatorengleichungen mit monotonem Operator können hier nur exemplarisch angegeben werden: Ist der Operator T, der einen reellen separablen BANACH- Raum X in X*, (Dt = X) abbildet, monoton, demistetig und koerzitiv, dann hat die Gleichung T(x) = f für beliebiges / € X* eine Lösung. Ist zudem der Operator T streng monoton, dann ist die Lösung sogar eindeutig, in diesem Falle existiert also der inverse Operator T-1. Für einen monotonen demistetigen Operator T: H —? H im HlLBERT-Raum H mit Dt = H gilt Im(I + T) = H , wobei (/ + T)_1 stetig ist. Wenn T als streng monoton vorausgesetzt wird, dann ist T~l bijektiv mit stetigem T~l. Konstruktive Näherungsmethoden für die Lösung der Gleichung T(x) = 0 mit monotonem Operator T im HlLBERT-Raum basieren auf der Idee des Galerkin-Verfahrens (s. 19.4.2 2, S. 936 oder [12.11], [12 21]) Mit dieser Theorie kann man mehrdeutige Operatoren T: X —? 2X* behandeln, auf die der Monotoniebegriff durch (/ — g,x - y) > 0, V x,y G DT und / G T(x),g G T(y) verallgemeinert wird (s. [12.14]). 12.9 Maß und Lebesgue-Integral 12.9.1 Sigma-Algebren und Maße Ausgangspunkt für den Begriff eines Maßes ist eine Verallgemeinerung der Begriffe der Länge eines Intervalls in R, des Flächeninhalts und des Volumens einiger Teilmengen aus R2 und R3 Diese Verallgemeinerung wird benötigt, um möglichst viele Mengen „messen" zu können und möglichst viele Funktionen „integrierbar zu machen" Beispielsweise hat das Volumen eines n-dimensionalen Quaders Q = {xeRn: ak<xk<bk {k = 1,2,... ,n)} den Wert f[(bk - ak). A2.204) k=l
656 12. Funktionalanalysis 1. cr-Algebra Sei X eine beliebige Menge. Ein nichtleeres System A von Teilmengen aus X heißt a- Algebra, wenn gilt. a) A G A impliziert X \ A G A und ^ A2.205a) b) Ai, A2i..., An, .eA impliziert \J AneA. A2 205b) n=l Jede cr-Algebra enthält die Mengen 0 und X, mit abzählbar vielen Mengen auch deren Durchschnitt sowie mit zwei Mengen_auch jeweils deren Differenzmengen. Im weiteren bezeichne R die durch die Elemente {—oo} und {+00} erweiterte Menge (erweiterte Zahlengerade) R, wobei die Rechenregeln und Ordnungseigenschaften aus R in natürlicher Weise auf R 00 übertragen werden. Die Ausdrücke (±00) + (tcxd) und — sind dabei nicht zugelassen, während 0 • (+00) 00 und 0 • (—00) den Wert 0 erhalten. 2. Maß _ Eine auf einer cr-Algebra A definierte Funktion fi: A —> R+ = R U +00 heißt Maß, wenn a) ß(A) > 0 (VAeA), A2.206a) b) /i@) = 0, A2.206b) / 00 \ 00 c) Au A2, ¦ ¦ ¦ An,. .€A,AknAt = $(kji l) impliziert p, MJ An = £ ß{An). A2.206c) a(A) = { Die Eigenschaft c) heißt a-Additivität des Maßes Ist fi ein Maß auf A und sind A,B £ A, A C B, dann ist n(A) < ß(B) {Monotonie). Wenn An G A (n = 1,2, .) und Ax C A2 C • • •, dann \x (U£=i An) = limn-.oo fi(An) (Stetigkeit von unten). Seien A eine cr-Algebra von Teilmengen aus X und fi ein Maß auf A. Das Tripel X = (X, A, /i) heißt Maßraum, und die Mengen aus A heißen meßbar oder A-meßbar. ¦ A: Seien X eine endliche Menge {xi, x2,..., xn} , A die cr-Algebra aller Teilmengen von X, und sei jedem x^ (k = 1,..., N) eine nichtnegative Zahl pk zugeordnet. Dann ist die für jede Menge A € A, A = {xni, xn2, , xnk} durch ß(A) = pni + pn2 + • • • + pnk auf A definierte Funktion ein Maß, das (wegen /i(X) = Pi + • • • + Pn < oo) nur endliche Werte annehmende sogenannte Zählmaß ¦ B: Dirac-Maß: Seien A eine a-Algebra von Teilmengen einer Menge X und a ein beliebig fixierter Punkt aus X. Durch ist auf A ein Maß definiert. Es heißt (auf a konzentrierte) S-Funktion. Offensichtlich gilt Sa(A) — öa(XA) = Xa{o) , (s. 12.5.4, S 643), wobei \a die charakteristische Funktion der Menge A bezeichnet. ¦ C: Lebesgue-Maß: Seien X ein metrischer Raum und B(X) die kleinste cr-Algebra von Teilmengen aus X, die alle offenen Mengen von X enthält B(X) existiert als der Durchschnitt aller cr-Algebren, die die Gesamtheit aller offenen Mengen enthalten, und heißt die BöRELsche o-Algebra von X Jedes Element aus ß(X) heißt BOREL-Men^e (s [12 6]) Sei jetzt X = Rn (n > 1). Mit Hilfe einer Erweiterungsprozedur kann man eine <7-Algebra und darauf ein Maß konstruieren, das auf der Menge aller Quader aus Rn mit dem Volumen übereinstimmt Genauer: Es existiert eine eindeutig bestimmte cr-Algebra A von Teilmengen aus Rn und ein eindeutig bestimmtes Maß A auf A mit den folgenden Eigenschaften a) Jede offene Menge aus Rn gehört zu A, mit anderen Worten: B(Rn) C A b) Aus A e A, X(A) = 0 und B C A folgen B e A und \{B) = 0 l c) Ist Q ein Quader, dann ist Q € A, und es gilt X(Q) = nU=i(frfc — afc) d) A ist translationsinvariant, d.h., für jeden Vektor x G Rn und jede Menge A G A gelten x + A = {x + y: y G A} € A und X(x + A) = \{A).
12.9 Maß und Lebesgue-Integral 657 Die Elemente aus A heißen Lebesgue-meßbare Teilmengen von Rn . A ist das (n-dimensionale) Le- besgue-Maß in Rn Hinweis: Man sagt p. der Maß- und Integrationstheorie, daß eine Behauptung (Eigenschaft, Bedingung) bezüglich eines Maßes ß fast überall oder ß-fast überall auf einer Menge X gilt, wenn die Menge, auf der sie nicht erfüllt ist, das Maß Null hat Man schreibt dafür f.ü. bzw. /x—f.ü.^ Also, ist etwa A das LEBESGUE-Maß auf R, sind A, B zwei disjunkte Mengen mit R = A U B und ist / eine Funktion auf R mit f(x) = 1 ix G A und f(x) = 0 V x G B, dann ist / = 1, A-f.ü. auf R genau dann, wenn A(ß) = 0. 12.9.2 Meßbare Funktionen 12.9.2.1 Meßbare Funktion _ Sei A eine cr-Algebra von Teilmengen einer Menge X. Eine Funktion /: X —? R heißt meßbar, wenn für beliebiges a G R die Menge f~l((a, +oo]) = {x • x G X, f(x) > a} in A liegt. Eine komplexwertige Funktion g + \h heißt meßbar, wenn beide Funktionen g und h meßbar sind. Ist A die cr-Algebra der LEBESGUE-meßbaren Mengen aus Rn und /: Rn —? R eine stetige Funktion, dann ist die Menge /_1((a:,-t-oo]) = /_1((a;, +oo)) nach 12.2.3, S. 631 für jedes a G R offen und / damit meßbar. 12.9.2.2 Eigenschaften der Klasse der meßbaren Funktionen Der Begriff der meßbaren Funktion erfordert kein Maß, sondern eine cr-Algebra Seien A eine cr-Algebra von Teilmengen der Menge X und f,g,fn-X —> R meßbare Funktionen. Dann sind auch die folgenden Funktionen (s. 12 1.7.4, S 623) meßbar: a) af für jedes a G R, f • g\ b)/+, /-, l/l, fVgundfAg; c) / + 9i falls in keinem Punkt von X ein Ausdruck der Form (±oo) + (Too) vorkommt; d)sup/n,' inf/n, limsup/n(=limn_00supA;>n/fc), liminf/n; e) der punktweise Grenzwert lim /n, im Falle seiner Existenz; f) wenn / > 0 und p G R, p > 0, dann ist fp meßbar. Eine Funktion /• X —> R heißt elementar oder simpel, wenn es eine (endliche) Anzahl von paarweise n disjunkten Mengen A\,..., An G A und reelle Zahlen ot\,. ., an gibt, so daß f = Y^ ®kXk gilt, wobei \k k=i die charakteristische Funktion der Menge A^ bezeichnet. Offenbar ist jede charakteristische Funktion einer meßbaren Menge und somit jede elementare Funktion meßbar. Interessant ist, daß jede meßbare Funktion beliebig genau durch Elementarfunktionen approximiert werden kann: Für jede meßbare Funktion / > 0 existiert eine monoton wachsende Folge von nichtnegativen Elementarfunktionen, die punktweise zu / konvergiert. 12.9.3 Integration 12.9.3.1 Definition des Integrals Sei (X, A, fi) ein Maßraum Das Integral fx f dß (oder auch mit / / dß bezeichnet) für meßbare Funktionen / wird schrittweise wie folgt definiert 1. Mit / sei eine Elementarfunktion / = £ &kXk bezeichnet. Dann setzt man fc=i /fdß = jrakß{Ak). A2.208) J k=\ 2. Ist / X —> R (/ > 0), dann setzt man f fdp = s\xp< f gdß: g Elementarfunktion mit 0 < g(x) < f{x), \fx G X j . A2 209) ^Hier und im weiteren ist f ü eine Abkürzung für „fast überall"
658 12 Funktionalanalysis 3. Ist /: X —? R und /+, /_ positiver bzw. negativer Teil von / , dann setzt man j fdß = j f+dß- f f.dß A2 210) unter der Bedingung, daß wenigstens eines der Integrale auf der rechten Seite endlich ist, um den unbestimmten Ausdruck oo — oo zu vermeiden 4. Für eine komplexwertige Funktion / = g + \h setzt man, falls für die Funktionen <?, h die nach A2.210) definierten Integrale endlich sind, f fdß = fgdß + i Ihdß. A2.211) 5. Kann für eine meßbare Menge A und eine Funktion / nach den angegebenen Festlegungen das Integral der Funktion f\A definiert werden, dann setzt man j fdß = J fxAdß. A2 212) A Das Integral einer meßbaren Funktion ist im allgemeinen eine Zahl aus R. Eine Funktion /. X —? R nennt man integrierbar oder summierbar über X bezüglich ß, wenn sie meßbar ist und f\f\dß < oo gilt. 12.9.3.2 Einige Eigenschaften des Integrals Sei (X, A, ß) ein Maßraum und seien f,g.X —? R meßbare Funktionen und a,/3eR 1. Ist / integrierbar, dann ist / f.ü. endlich, d.h. ß{x G X \f{x)\ = +00} = 0. 2. Ist / integrierbar, dann gilt \J f dß\ < J \f\ dß 3. Ist / integrierbar und / > 0 , dann gilt / / dß > 0 4. Ist 0 < g(x) < f(x) auf X und / integrierbar, dann ist g integrierbar, und es gilt / gdfi < f f dß 5. Sind /, g integrierbar, dann ist aj+ßg integrierbar, und es gilt f{af+ßg) dß = a J f dfi-\-ß f gdß. 6. Sind /, g integrierbar auf A G A, d.h., es existieren die Integrale fA f dfi und fA g dfi (s A2.212)). mit fAf dß = fAgdfi, dann gilt / = g ß-iü auf A Ist X = Rn und A das LEBESGUE-Maß, dann spricht man vom (n-dimensionalen) LEBESGUE-Integral (s auch 8.2.3,3., S. 471). Im Falle n = 1 und A = [a, b] ist für jede stetige Funktion / auf [a, b] sowohl das RlEMANN-Integral /a6 f(x) dx (s. 8 2 1.1,5., S 458) als auch das LEBESGUE-Integral f[ab] f d\ definiert. Beide Werte sind endlich und stimmen überein. Mehr noch, ist / eine auf [a, b] beschränkte RlEMANN- integrierbare Funktion, dann ist sie auch LEBESGUE-integrierbar (integrierbar im LEBESGUEschen Sinne), wobei die Werte beider Integrale identisch sind (Natürlichkeit des LEBESGUE-Integrals). Die Menge der LEBESGUE-integrierbaren Funktionen ist aber wesentlich umfassender als die Menge aller RiEMANN-integrierbaren Funktionen und besitzt eine Reihe von Vorteilen, die sich insbesondere bei Grenzübergängen unter dem Integral zeigen. 12.9.3.3 Konvergenzsätze In den folgenden drei Aussagen seien alle betrachteten Funktionen als LEBESGUE-rneßbar vorausgesetzt. 1. Satz von B. Levi über die monotone Konvergenz Sei {/n}5S=i eine f.ü. monoton wachsende Folge nichtnegativer integrierbarer Funktionen mit Werten in R. Dann gilt lim f fndß= f lim fndß. A2.213) n—kx> J J n—>oc x '
12.9 Maß und Lebesgue-Integral 659 2. Satz von Fatou Sei {/n}£Li eine Folge nichtnegativer R-wertiger meßbarer Funktionen. Dann gilt / lim inf fn dp < lim inf f fndp. A2 214) 3. Satovon Lebesgue über dominante oder majorisierte Konvergenz Sei {/n} eine Folge von meßbaren Funktionen, die auf X f.ü. zu einer Funktion / konvergiert. Wenn es eine solche integrierbare Funktion g mit |/n| < g f.ü. gibt, dann ist / integrierbar und es gilt lim j fndp = y(lim/„) dp. A2.215) 4. Satz von Radon-Nikodym 1. Voraussetzungen Seien (X, A, p) ein cr-endlicher Maßraum, d.h., es existiert eine Folge {An}, An E A, so daß X = lJSS=i An und p(An) < oo, Vn gilt. In diesem Falle heißt das Maß a-endlich. Es heißt endlich, wenn p(X) < oo , und Wahrscheinlichkeitsmaß, wenn p(X) = 1 gilt. Eine auf A gegebene reelle Funktion (p heißt absolutstetig bezüglich p, wenn p{A) = 0 die Gleichung <p(A) = 0 impliziert. Die Bezeichnung dafür ist tp -< p. Für eine integrierbare Funktion / ist die auf A definierte Funktion <p(Ä) = fAf dp cr-additiv und absolutstetig bezuglich des Maßes p. Fundamental für viele theoretische Untersuchungen und praktische Anwendungen ist die Umkehrung dieses Fakts- 2. Satz von Radon-Nikodym Seien eine cr-additive Funktion (p und ein Maß p auf einer a-Algebra A gegeben und sei (p -< p . Dann existiert eine /i-integrierbare Funktion / so, daß für jede Menge A e A die Beziehung tp(A) = f fdß A2.216) A gilt. Die Funktion / ist dabei bis auf ihre Aquivalenzklasse eindeutig bestimmt, und (p ist nichtnegativ genau dann, wenn / > 0 /i-f ü. 12.9.4 LP-Räume Sei (X, A, ß) ein Maßraum und p eine reelle Zahl 1 < p < oo. Für eine meßbare Funktion / ist |/|p ebenfalls meßbar, so daß NPU)=(J\f\PdßY A2.217) definiert (und möglicherweise gleich +oo) ist. Eine meßbare Funktion /• X —? R heißt zur p-ten Potenz integrierbar, p-fach integrierbar oder p-fach summierbar, wenn Np(f) < +oo gilt oder, äquivalent dazu, wenn \f\p integrierbar ist. Für jedes p mit 1 < p < +oo bezeichnet man mit Cp(p) oder CP(X) oder ganz ausführlich mit £P(X, A, p) die Menge aller zur p-ten Potenz bezüglich /i auf X summierbaren Funktionen, wobei für p = 1 die vereinfachte Bezeichnung £(X) vereinbart wird und für p = 2 die Funktionen quadratisch summierbar heißen. Mit C°°(p) bezeichnet man die Menge aller meßbaren /z-f.u. beschränkten Funktionen auf X und definiert das wesentliche Supremum einer Funktion / als Noo{f) = vrai sup/ = inf{a <E R . |/(ar)| < a p-Lü.} . A2 218) Mit den üblichen Operationen für meßbare Funktionen und unter Berücksichtigung der MlNKOWSKI- Ungleichung für Integrale (s 1.4.2 12, S. 33) ist Cp(p) für alle p, 1 < p < oo, ein Vektorraum und Np(-) eine Halbnorm auf Cp . Mit der Vereinbarung, / < g zu schreiben, wenn f(x) < g(x), p-i.ii gilt, wird Cp sogar ein Vektorverband Zwei Funktionen /, g G Cp(p) nennt man äquivalent (oder deklariert man als gleich), wenn / = g /i-f.ü. auf X Auf diese Weise werden Funktionen, die //-f.ü. übereinstimmen, identifiziert. Somit gewinnt man (mittels Faktorisierung der Menge £P(X) nach dem linearen
660 12 Funktionalanalysis Teilraum iVr *(())) eine Menge von Aquivalenzklassen, auf die kanonisch die algebraischen Operationen und die Ordnung übertragen werden können, so daß sich wieder ein Vektorverband ergibt, der jetzt mit /^(X, ß) oder LPdi) (und entsprechend ausfuhrlicher) bezeichnet wird. Seine Elemente heißen nach wie vor Funktionen, obwohl sie in Wirklichkeit Klassen äquivalenter Funktionen sind. Von Bedeutung ist nun, daß ||/||p = Np(f) auf Lp(/i) eine Norm ist (/ steht dabei für die aus der Funktion / hervorgegange Aquivalenzklasse, die im weiteren einfach wieder mit / bezeichnet wird), und (Lp(//), ||/||p) für alle p mit 1 < p < +oo ein Banach-Verband mit vielen guten Verträglichkeitsbedingungen zwischen Norm und Ordnung, bei p = 2 mit (/, g) = f fgdß als Skalarprodukt sogar ein HiLBERT-Raum wird (s. [12.15]) Häufig wird für eine meßbare Teilmenge ficRn der Raum LP(Ü) betrachtet. Seine Definition bereitet wegen Schritt 5 bei der Einführung des Integrals aber keine Schwierigkeiten. Die Räume LP{Q., X) (A bezeichnet das n-dimensionale LEBESGUE-Maß) ergeben sich auch als Vervollständigung (s. 12.2.2.5, S. 631 und 12 3.2, S. 632) des mit der Integralnorm \\x\\p = (j' \x\p d\)p A < p < oo) versehenen nichtvollständigen normierten Raumes C(Q) aller stetigen Funktionen auf der Menge Ü C Rn (s. [12 21]). Sei X eine Menge von endlichem Maß, d.h. ß(X) < +oo , und gelte für pi,p2 die Beziehung 1 < p\ < P2 < +00. Dann gelten LP2(X, fi) C i/^X, ß) und mit einer nicht von x abhängenden Konstanten C = C(pi,p2,ß(X)) > 0 für x E LP2 die Abschätzung \\x\\\ < C||x||2, wobei \\x\\k die Norm des Raumes LPfc(X, //) (A; = 1,2) bezeichnet. 12.9.5 Distributionen 12.9.5.1 Formel der partiellen Integration Für ein beliebiges (offenes) Gebiet flCR" bezeichnet Cq°(Q) die Menge aller in ü beliebig oft diffe- renzierbaren Funktionen ip mit kompaktem Träger, d h., die Menge supp(</?) = {x E fi : (p(x) ^ 0} ist kompakt in Rn und liegt in Q., während mit L}oc(Q) die Menge aller bezüglich des LEBESGUE-Maßes im Rn lokalsummierbaren Funktionen, d.h. aller (Klassen von äquivalenten) auf 0, meßbaren Funktionen / mit fu \f\ d\ < +O0 für jedes beschränkte Gebiet u C Q, bezeichnet wird. Die beiden Mengen sind (mit den natürlichen algebraischen Operationen) Vektorräume. Es gilt Lp(ü) C Ljoc(Q) für 1 < p < oo und für beschränktes Q auch L]oc{ü) = L^Q). Faßt man die Elemente aus Ck(fl) als die von ihnen in Lp(ü) erzeugten Klassen auf, so gilt bei beschränktem Q die Inklusion Ck(Q) C 1^@) , wobei Ck(ü) sogar dicht liegt. Ist 17 unbeschränkt, so liegt (in diesem Sinn) die Menge Q°(ft) dicht in L*(fi). Die Formel der partiellen Integration hat für eine vorgegebene feste Funktion / E Ck(£l) und eine beliebige Funktion ip € Cq°(J7) wegen Da(p |an = 0 die Gestalt / f{x)Daip(x) d\ = (-l)|a| j <p{x)Daf{x) dX A2.219) für V a mit |a| < k , die man als Ausgangspunkt für den Begriff der verallgemeinerten Ableitung einer Funktion / E L]oc{0) nehmen kann 12.9.5.2 Verallgemeinerte Ableitung Sei / E L\oc(Q) . Wenn es eine Funktion g aus L]oc(Q) gibt, so daß für V y? E C^{0) bezüglich eines Multiindex a die Gleichung f f(x)Daip{x) dX = (-l)|a| f g(x)<p(x) dX A2 220) n gilt, dann heißt g verallgemeinerte Ableitung, Ableitung im Sinne von Sobolew oder Distributionsableitung der Ordnung a von / , wofür man, wie im klassischen Falle, g = Daf schreibt.
12.9 Maß und Lebesgue-Integral 661 Im Vektorraum Co°(f2) definiert man die Konvergenz einer Folge {y?fc}j£i zuip € C™(Q) wie folgt: , ( a) 3 eine kompakte Menge K C Vi mit supp(</?fc) C K Vn , ^k ^ ° ' \ b) Da(^A; —> -öa^ gleichmäßig auf X für jeden Multiindex a A2 221) Die Merige C™(Q) mit dieser Konvergenz von Folgen nennt man Grundraum, bezeichnet ihn mit V(Q) und nennt seine Elemente häufig Testfunktionen. 12.9.5.3 Distribution Ein lineares Funktional £ auf V(Q), das im folgenden Sinne stetig (s. 12.9.5.3, S. 631) ist. (fk, ip E V(Sl) und <pk —>ip implizieren £((pk) —> £((p) A2 222) heißt verallgemeinerte Funktion oder Distribution. ¦ A: Ist / e L}oc(Q) , dann ist *A<P) = (/> <f) = j f(*Mx) dX , y> G Z>(fl) A2 223) n eine Distribution. Derartige mit Hilfe von lokalsummierbaren Funktionen gemäß A2.223) erzeugte Distributionen nennt man regulär Zwei reguläre Distributionen sind genau dann gleich, d.h. £f(ip) = £g(ip) V ip e V(Q), wenn / = g f.ü bezüglich A ¦ B: Sei a 6 f2 ein beliebig fixierter Punkt. Dann ist £sa(ip) = <p(a) , V? £ V(ü) ebenfalls ein lineares stetiges Funktional auf V(Cl), also eine Distribution, die man DiRACsche Distribution, (^-Distribution oder ^-Funktion nennt. Da £sa von keiner lokalsummierbaren Funktion erzeugt werden kann (s [12 12], [12.27]), stellt sie ein Beispiel einer nichtregulären Distribution dar Die Gesamtheit aller Distributionen bezeichnet man mit V(Q) . Aus einer allgemeineren als der in 12 5.4, S 643 angedeuteten Dualitätstheorie ergibt sich V{tl) als der Dualraum von V(Q) Streng genommen wäre also V*(Q) zu schreiben Im Raum D'(f2) lassen sich viele Operationen unter seinen Elementen und mit Funktionen aus C°°(Q) definieren, u.a. die Ableitung einer Distribution oder die Faltung zweier Distributionen, die ihn nicht nur für theoretische Untersuchungen, sondern vor allem auch für viele Anwendungen aus Elektrotechnik, Mechanik usw prädestinieren. Wegen eines Überblicks und einfacher Beispiele für zahlreiche Verwendungsmöglichkeiten verallgemeinerter Funktionen s. [12.12], [12.27] Hier wird lediglich der Begriff der Ableitung einer verallgemeinerten Funktion betrachtet 12.9.5.4 Ableitung einer Distribution Ist £ eine gegebene Distribution, dann heißt die Distribution Da£, definiert durch (Da£){cp) = (-l)\ak(Da<p), (ip e D(Ü)), A2 224) die distributioneile Ableitung der Ordnung a von £. Seien / eine stetig differenzierbare Funktion, etwa auf R (damit ist / lokalsummierbar auf R und / als Distribution auffaßbar), /' ihre klassische Ableitung und D1 f ihre distributionelle Ableitung der Ordnung 1 Dann gilt (D1/, <p) = f f'(x)<p{x) dx , A2.225a) Jr woraus durch partielle Integration (Dlf, <p) = -f f(x)<f/(x) dx = -(/, <p') A2.225b) JR folgt Im Falle einer regulären Distribution £f mit / G Ljoc(Q) erhält man wegen (D*t,)(<p) = (-l)Mt,(ir<p) = (-lp jaf(x)D^d\ A2.226)
662 12 Funktionalanalysis die verallgemeinerte Ableitung der Funktion / im Sinne von Sobolew (s. A2.220)) ¦ A: Für die der offenbar lokalsummierbaren HEAVISIDE-Funktion *(*) = {££*? 8' <12-227) zugeordnete reguläre Distribution erhält man als Ableitung die nichtreguläre ^-Distribution. ¦ B: Bei der mathematischen Modellierung von technischen und physikalischen Problemen treten häufig (in gewisser Hinsicht idealisierte) auf einen Punkt konzentrierte Einwirkungen, wie „punktförmige" Kräfte, Nadelimpulse, Stoßvorgänge usw. auf, die mathematisch ihren Ausdruck in der Verwendung der 8- oder HEAVISIDE-Funktion finden, beispielsweise in der Form mSa als Massendichte für eine im Punkt a @ < a < l) eines Balkens der Länge / konzentrierte Punktmasse m. Die Bewegungsgleichung eines Feder-Masse-Systems, auf das zum Zeitpunkt to eine momentane äußere Kraft der Größe F einwirkt, hat die Form x + u2x = F6to. Mit den Anfangsbedingungen x@) = F x@) = 0 ist x(t) = — sin(u(t — to)H(t — t0) die Lösung.
663 13 Vektoranalysis und Feldtheorie 13.1 Grundbegriffe der Feldtheorie lß.1.1 Vektorfunktion einer skalaren Variablen 13.1.1.1 Definitionen 1. Vektorfunktion einer skalaren Variablen t wird ein Vektor a genannt, wenn seine Komponenten Funktionen von t sind a = a(t) = ax(t)ex + Oy(t)ey + az(t)ez. A3 1) Die Begriffe Grenzwert, Stetigkeit und Differenzierbarkeit lassen sich von den Komponenten des Vektors a(t) auf den Vektor selbst übertragen. 2. Hodograph einer Vektorfunktion Faßt man die Vektorfunktion a(t) als Orts- oder Radiusvektor r = r(t) eines Punktes P auf, dann beschreibt dieser bei Änderung von t eine Raumkurve (Abb. 13.1). Man bezeichnet diese Raumkurve auch als Hodograph der Vektorfunktion a(t). P j? ^-30 ¦25 Abbildung 13 1 Abbildung 13.2 13.1.1.2 Ableitung einer Vektor funkt ion Die Ableitung von A3.1) nach t ist eine neue Vektorfunktion von t: dax(t) _> day(t) _ daz(t) _ ~dTGx + ~dTey + ~dTez Abbildung 13.3 da v ä(t + At)-ä(t) — = hm dt At-o At dr A3.2) Die Ableitung — des Radiusvektors stellt geometrisch betrachtet einen Vektor dar, der in die Richtung dt der Tangente des Hodographen im Punkt P weist (Abb. 13.2). Seine Länge hängt von der Wahl des Parameters t ab. Wenn t die Zeit ist, dann beschreibt f(t) die Bewegung des Punktes P im Raum, dr während — Größe und Richtung der Geschwindigkeit dieser Bewegung angibt. Ist t = s die Bogenlänge dt der Raumkurve, gemessen von einem bestimmten Kurvenpunkt an, dann gilt 13.1.1.3 Differentiationsregeln für Vektoren — f"±b± ^1 - — ± — + — dt dt dt dt d . . dip _ da -(^a) = -a + ^ d - _ dtä-c -db dt dt dt d ._ ,-. da. ,- _ dh — axb =-xb + ax-- dt K 'dt dt (</? skalare Funktion von t), (die Faktoren dürfen nicht vertauscht werden), A3 3a) A3 3b) A3.3c) A3.3d)
664 13 Vektoranalysis und Feldtheorie It^ = f/ft (Kettenregel) (!3 3e) Ist |a(£)| = const, d h a2(£) = a(£) • a(t) = const, dann folgt aus A3.3c) a • — = 0, d.h , — und a (JLL (ZT stehen senkrecht zueinander Beispiele für diesen Sachverhalt sind: ¦ A: Radius- und Tangentenvektor eines Kreises in der Ebene und ¦ B: Orts- und Tangentenvektor einer Kurve auf der Kugel. Der Hodograph ist dann eine sphärische Kurve . 13.1.1.4 Taylor—Entwicklung für Vektorfunktionen ^ f x -./ x , da h2 d2ä hn dnä , n x a(i+A) = a(t)+,_ + __ + ...+___ A34) Die Entwicklung einer Vektorfunktion in eine TAYLOR-Reihe hat nur Sinn, wenn die Reihe konvergiert Die Konvergenz dieser Reihe wird ebenso wie die jeder beliebigen anderen Reihe mit vektoriellen Gliedern nach der gleichen Methode bestimmt wie die Konvergenz einer Reihe mit komplexen Gliedern (s 14 3.2, S. 713). Man kann die Konvergenz einer Reihe mit vektoriellen Gliedern auf die Konvergenz von Reihen mit skalaren Gliedern zurückführen. Das Differential einer Vektorfunktion a(£) wird definiert durch: da da = —At A3 5) dt 13.1.2 Skalarfelder 13.1.2.1 Skalares Feld oder skalare Punkt funkt ion Wird jedem Punkt P eines Raumteiles ein Zahlenwert (Skalar) U zugeordnet, dann schreibt man U = U(P) A3 6a) und bezeichnet A3 6a) als Skalarfeld. ¦ Beispiele für Skalarfelder sind Temperatur, Dichte, Potential usw. eines Körpers. Man kann ein skalares Feld U =*U(P) auch durch U = U{r) A3 6b) beschreiben, wobei r der Ortsvektor des Punktes P bei fest gewähltem Pol 0 ist (s 3 5 1.1,6., S. 186). 13.1.2.2 Wichtige Fälle skalarer Felder 1. Ebenes Feld wird ein Feld genannt, das ausschließlich für die Punkte einer Ebene im Raum definiert ist. 2. Zentralfeld Wenn eine Funktion in allen Punkten P gleichen Abstandes von einem Mittelpunkt C(Fi), dem Feldpol, gleiche Werte annimmt, dann spricht man von einem zentralsymmetrischen Feld oder auch Zentral- bzw. Kugelfeld. Die Funktion U hängt dann lediglich vom Abstand CP = |r| ab. U = f(\r\) A3.7a) ¦ Das Feld der Intensität einer punktförmigen Strahlungsquelle, z.B. das Feld der Lichtstärke, wird mit |r| als Abstand von der Strahlungsquelle beschrieben durch: [7 = 4 (c = const) • A3 7b) 3. Axialfeld Wenn eine Funktion in allen Punkten gleichen Abstandes von einer Geraden, der Feldachse, den gleichen Wert besitzt, dann spricht man von einem zylindersymmetrischen bzw axial-
13 1 Grundbegriffe der Feldtheorie 665 symmetrischen Feld, oder kurz von einem Axialfeld 13.1.2.3 Koordinatendarstellung von Skalarfeldern Wenn die Punkte eines Raumteiles durch ihre Koordinaten gegeben werden, z.B durch kartesische, Zylinder- oder Kugelkoordinaten, dann erhält man zur Beschreibung des zugehörigen skalaren Feldes A3 6a) im allgemeinen eine Funktion dreier Veränderlicher: U = <P(x,y,z), U = &{p,(p,z) oder E/= x(r,tf,y>). A3.8a) Im Falle eines ebenen Feldes genügt eine Funktion zweier Veränderlicher Für kartesische oder Polarkoordinaten hat sie die Form. U = <P(x,y) oder U = V(p,(p) A3.8b) Es wird vorausgesetzt, daß die Funktionen in A3 8a) und A3 8b) im allgemeinen stetig sind, ausgenommen einige Unstetigkeitspunkte, -kurven oder -flächen Die Funktionen lauten a) für ein Zentralfeld: U = U(^jx2 + y2 + z2) = U{^p2 + z2) = U(r), b) für ein Axialfeld: U = U(^Jx2 + y2) = U(p) = U(r sintf). A3 9a) Die Untersuchung von zentralen Feldern führt man am besten unter Zuhilfenahme von Kugelkoordinaten durch, von axialen Feldern mit Hilfe von Zylinderkoordinaten 13.1.2.4 Niveauflächen und Niveaulinien 1. Niveaufläche nennt man die Gesamtheit aller Punkte im Raum, für die die Funktion A3.6a) einen konstanten Wert U = const . A3 10a) annimmt Unterschiedliche Konstanten C/0, CA, C/2,... liefern unterschiedliche Niveauflächen. Durch jeden Punkt verläuft genau eine Niveaufläche, ausgenommen Punkte, in denen die Funktion nicht definiert ist. In den drei bisher benutzten Koordinatensystemen lauten die Niveauflächengleichungen U = $(x, y, z) = const, U = #(p, (/?, z) = const, U = x(r, #, <p) = const. A3 10b) ¦ Beispiele für Niveauflächen verschiedener Felder A: U = c r = cxx + cyy + czz. Parallele Ebenen. B: U = x2 + 2y2 + 4z2: Ähnliche Ellipsoide in Ahnlichkeitslage. C: Zentralfeld Konzentrische Kugeln. D: Axialfeld• Koaxiale Zylinder 2. Niveaulinien ergeben sich in ebenen Feldern anstelle der Niveauflächen. Sie genügen der Gleichung U = const A3.11) Es ist üblich, die Niveaulinien in bestimmten gleichmäßigen [/-Abständen darzustellen, wobei der betreffende [/-Wert an die zugehörige [/-Linie geschrieben wird (Abb. 13.3) ¦ Beispiele sind die Isobaren auf Wetterkarten und die Höhenlinien auf geographischen Karten. In speziellen Fällen können die Niveauflächen in Punkte oder Linien entarten, die Niveaulinien in isolierte Punkte. y 1 ¦ Die Niveaulinien der Felder a) U = xy, b) U = — , c) U = r2 , d) U = - zeigt Abb. 13.4 xz r 13.1.3 Vektorfelder 13.1.3.1 Vektorielles Feld oder vektorielle Punktfunktion Wird jedem Punkt P eines Raumteiles ein Vektor V zugeordnet, so schreibt man V - V(P) A3 12a) und bezeichnet A3.12a) als Vektorfeld
666 13. Vektoranalysis und Feldtheorie ¦ Beispiele für Vektorfelder sind das Geschwindigkeitsfeld der Teilchen einer strömenden Flüssigkeit sowie Kraft- und Feldstärkefelder. Ein Vektorfeld V = V(P) kann auch durch V = V(r) A3 12b) beschrieben werden, wobei f der Ortsvektor des Punktes P bei fest gewähltem Pol 0 ist. Ein ebenes Vektorfeld zeichnet sich dadurch aus, daß alle r-Werte und alle V-Werte jeweils in einer Ebene liegen (s. 3 5 2, S. 195). 1 234 432 1 d) Abbildung 13.4 13.1.3.2 Wichtige Fälle vektorieller Felder 1. Zentrales Vektorfeld Alle Vektoren V liegen auf Geraden, die durch einen bestimmten Punkt, das Zentrum, verlaufen (Abb. 13.5a). Wird der Koordinatenursprung in das Zentrum gelegt, dann kann das Feld mit Hilfe von V = /(r)F A3.13a) definiert werden, da alle Vektoren die Richtung des Radiusvektors r besitzen. Oft ist es von Vorteil, dieses Feld durch die Formel ¦¦<p(r)- A3 13b) zu beschreiben, wobei (p(f) die Länge des Vektors V angibt und - der Einheitsvektor ist.
13.1 Grundbegriffe der Feldtheorie 667 a) b) Abbildung 13.5 2. Sphärisches Vektorfeld Das sphärisches Vektorfeld ist der Spezialfall des zentralen Vektorfeldes, in dem die Länge des Vektors V nur vom Abstand |r| abhängt (Abb. 13.5b). ¦ Beispiele sind das NEWTONsc/ie und das CoULOMBsc/ie Kraftfeld einer Punktmasse bzw einer elektrischen Punktladung: Al c - c r V = —r = (c = const). A3 14) Der Spezialfall eines ebenen sphärischen Vektorfeldes wird Kreisfeld genannt. 3. Zylindrisches Vektorfeld a) Alle Vektoren V liegen auf Geraden, die auf einer bestimmten Geraden, der Achse, senkrecht stehen und durch diese hindurchgehen, und b) alle Vektoren V für Punkte, die gleichen Abstand von der Achse haben, besitzen gleiche Beträge und sind entweder auf die Achse hin- oder von ihr weggerichtet (Abb. 13.5c) Wird der Koordinatenursprung auf die Achse gelegt, die durch den Vektor c vorgegeben ist, dann kann dieses Feld durch die Formel V = ip(p)— mit P A3 15a) r * = c x (r x c) A3.15b) beschrieben werden. Dabei ist r * die Projektion von r auf die Ebene, die auf der Achse senkrecht steht. Jeder Schnitt dieses Feldes mit Ebenen, die senkrecht auf der Achse stehen, ergibt gleichartige Kreisfelder. 13.1.3.3 Koordinatendarstellung von Vektorfeldern 1. Vektorfeld in kartesischen Koordinaten Das Vektorfeld A3 12a) kann mit Hilfe dreier ska- larer Felder V\{v), V2(r) und V3(r) definiert werden, die als Koeffizienten des Vektors V bei seiner Zerlegung in drei beliebige inkomplanare Vektoren ei, e2 und e3 aufzufassen sind. V = Viei + V2e2 + V3e3 A3 16a) Wählt man für diese drei Vektoren die Einheitsvektoren der drei Koordinatenachsen i, j und k, und drückt man die Koeffizienten Vi, V2, V3 in kartesischen Koordinaten aus, dann gilt V = K(x, y, z)i + Vy(Xi y, z)j + Vz{x, y, z)Ü. A3.16b) Somit kann das Vektorfeld mit Hilfe dreier skalarer Funktionen von drei skalaren Veränderlichen definiert werden
668 13. Vektoranalysis und Feldtheorie 2. Vektorfeld in Zylinder- und Kugelkoordinaten Kugelkoordinaten (=k), bzw. er (= -), Die Einheitsvektoren der Zylinder- und A3.17a) sind Tangenten an die Koordinatenlinien in jedem Punkt (Abb. 13.6, 13.7). Sie bilden in dieser Reihenfolge jeweils ein orthogonales Rechtssystem. Die Koeffizienten müssen dann als Punktionen der entsprechenden Koordinaten gegeben sein: V = Vp(p, tp, z)ep + Vyip, <p, z)ev + Vz{p, (p, z)ez , V = Vr{r, 0, <p)er + V^(r, #, ip)ev + V* (r, 0, <^)eV A3.17b) A3.17c) Beim Übergang von einem Punkt zu einem anderen ändern zwar die Koordinatenvektoren ihre Richtung, sie stehen aber stets senkrecht aufeinander Abbildung 13.6 Abbildung 13.7 Abbildung 13.8 13.1.3.4 Übergang von einem Koordinatensystem zu einem anderen Siehe auch Tabelle 13.1. 1. Darstellung der kartesischen Koordinaten durch Zylinderkoordinaten Vx = Vp cos (p — VpSimp, ¦ Vp sin (p + Vv cos (p, Vz ¦ 2. 3. 4. 5. Darstellung der Zylinderkoordinaten durch kartesische Koordinaten Vp = Vx cos (p + Vy sin (p, V^ =—Vx sin (p + Vy cos ip, VZ = VZ Darstellung der kartesischen Koordinaten durch Kugelkoordinaten Vx — Vr sin ß cos (p — Vp sin ip + Vq cos (p cos ß , Vy = Vr sin $ sin ip + V<p cos y> + V# sin y? cos d , V2 = K-costf-T^sintf. Darstellung der Kugelkoordinaten durch kartesische Koordinaten Vr — Vx sin # cos 9? + V^ sin i9 sin y? + Vz cos # , V<? = Vx cos # cos ip + VJ, cos $ sin ip — Vz sin d , V^, = — Vx sin (/? + yy cos <p Darstellung des sphärischen Vektorfeldes durch kartesische Koordinaten V = <p{yjx2 + y2 + z2)(xi + j/J+ zi) . A3.18) A3.19) A.3.20) A3.21) A3.22)
• 13.1 Grundbegriffe der Feldtheorie 669 6. Darstellung des zylindrischen Vektorfeldes durch kartesische Koordinaten V = y{\lx2 + y2){xi + yi) A3.23) Untersuchungen in Kugelfeldern führt man vorteilhafterweise unter Verwendung von Kugelkoordinaten durch, d h mit V = V(r)er , Untersuchungen in Zylinderfeldern unter Verwendung von Zylinderkoordinaten, d h mit V = V((p)e<p Für ebene Felder (Abb. 13.8) gilt V = Vx(x, y)\ + Vy(x, 2/)j = Vp(p, ip)ep + Vv(p, (p)^ , für Kreisfelder V = ip(y/x2 + y2)(xi + 2/j) = <p(p)ep A3.24) A3.25) Tabelle 13 1 Zusammenhang zwischen den Komponenten eines Vektors in kartesischen, Zylinder- und Kugelkoordinaten Kartesische Koordinaten V = Vxe* + Vyey + Vzez vx Vy Vz Vx cos <p + Vy sin tp —Vx sin <p + Vy cos (p vz Vx sin "d cos <p + Vy sin $ sin (f + Vz cos ß Vx cos fl cos (p + Vy cos flsiiMp — Vz sin fl —Vx sin (f -f Vy cos (/? Zylinderkoordinaten V^ + V^eJ, + Kei = V"p cos yj - V(p sin v? = Vp sin y> + V^, cos <p = V2 = ^p = ^ = K - 1/pSintf+ V;costf = V^ cos $ — Vz sin $ = vv Kugelkoordinaten Vrer + V^eJ 4- V^elp = K sin ^ cos ip + Vß cos $ cos <p - Vp sin <p = Vr sin # sin <p + 14 cos $ sin <p + V^ cos cp = Vr cos $ — Vß sin $ = Vr sin # + V# cos $ = v» = Vr cos i9 — V& sin i? = K = vd = v* 13.1.3.5 Feldlinien Für das Vektorfeld V(r) (Abb.13.9) heißt eine Kurve C Feldlinie, wenn der Vektor V(r) in jedem Kurvenpunkt P ein Tangentenvektor ist. Durch jeden Punkt eines Feldes verläuft eine Feldlinie Die Feldlinien schneiden einander nicht, ausgenommen solche Punkte, in denen die Funktion V nicht definiert ist oder verschwindet Die Differentialgleichungen der Feldlinien eines Vektorfeldes V, das in kartesischen Koordinaten gegeben ist, lauten Abbildung 13 9 dx dy a) allgemein: — = — dz V'' A3.26a) b) für ein ebenes Feld: ^ = ^ A3.26b) Zur Lösung dieser Differentialgleichungen s. 9 1.1 2,1., S. 506 bzw. 9.2 1.1,2., S. 535. ¦ A: Die Feldlinien eines Zentralfeldes sind Geraden, die vom Zentrum zum Feldpunkt verlaufen
670 13 Vektoranalysis und Feldtheorie ¦ B: Die Feldlinien des Vektorfeldes V = c x r sind Kreise, die in einer senkrecht auf dem Vektor c stehenden Ebene liegen. Ihr Mittelpunkt liegt auf einer zu c parallelen Achse. 13.2 Räumliche Differentialoperationen 13.2.1 Riehtungs— und Volumenableitung 13.2.1.1 Richtungsableitung eines skalaren Feldes Die Richtungsableitung des skalaren Feldes U = U(r) in einem Punkt P mit dem Ortsvektor r nach einem Vektor c (Abb. 13.10) ist definiert als Grenzwert des Quotienten 0U_ de - lim £-+0 U(r + ec)-U(f) A3 27) U(f) in einem Punkt r nach der Richtung des Einheitsvektors c° Wenn die Ableitung des Feldes U ¦ von c mit 7-^7: bezeichnet wird, dann besteht zwischen den Ableitungen der Funktion nach dem Vektor acu c und nach seinem Einheitsvektor c ° in ein und demselben Punkt die Beziehung g-wg. '<9c° tung c ° vom Punkt r aus anwächst Unter allen Ableitungen in einem Punkt nach den verschiedenen Richtungen der Einheitsvektoren besitzt die Ableitung —— den größten Wert. Dabei ist n der Normaleneinheitsvektor zur Niveaufläche, auf der der Punkt r liegt Zwischen den Richtungsableitungen bezüglich n und einer beliebigen Richtung c° besteht der Zusammenhang Die Ableitung -^p^ nach dem Einheitsvektor ist ein Maß für die Stärke, mit der die Funktion U in Rich- dU de0 dU 0 dU ¦ -r-=r cosfc , n) = —— cos u> - dn an : c° • gradU (s. A3.34), 13.2 2.2, S. 672) dV(?) A3.29) Abbildung 13.10 Abbildung 13.11 13.2.1.2 Richtungsableitung eines vektoriellen Feldes In Analogie zur Richtungsableitung eines skalaren Feldes gibt es die Richtungsableitung eines Vektorfeldes Die Richtungsableitung des Vektorfeldes V = V(r) in einem Punkt P mit dem Ortsvektor f (Abb. 13.11) nach einem Vektor a ist definiert als Grenzwert des Quotienten V(r + ea)-V(r) dV_ da ¦ lim - e-vO A3.30)
13 2 Räumliche Differentialoperationen 671 Wenn die Ableitung des Vektorfeldes V = V(r) in einem Punkt r nach der Richtung des Einheitsvek- dV tors a° von a mit -^——r bezeichnet wird, dann gilt: aau £-«£¦ ........ "**" In kartesischen Koordinaten, d.h., V = Vxex + Vyey + Vzez , a = axex + ayey 4- azez, gilt: &V — = [a. • grad) v = (a • grad vx jex + (a • grad vy jCy In allgemeinen Koordinaten gilt &V_ _ da ~ 1 (a • grad)V = (a • grad Vx)e*x + (a • grad Vy)e*y + (a • grad Vz)ez . A3.32a) ;n Koordinat< (a • grad) V (rot (V x a) + grad (a • V) + adiv V - Vdiva - a x rot V - V x rota). A3 32b) 13.2.1.3 Volumenableitung oder räumliche Ableitung Als Volumenableitung eines Skalarfeldes U = U(r) oder eines Vektorfeldes V in einem Punkt r werden drei Größen bezeichnet, die folgendermaßen gewonnen werden: 1. Einhüllung des Punktes r des Skalarfeldes oder des Vektorfeldes durch ein geschlossene Fläche £ . Diese Fläche lasse sich vektoriell durch die Parameterdarstellung r = r(u, v) = x(u, v)e*x + y(u, v)e^ + z(u, v)ez beschreiben, so daß das zugehörige vektorielle Flächenelement -» dr dr dS = — x—dudv A3 33a) du ov lautet 2. Integration über die geschlossene Fläche E. Dabei werden die folgenden drei Typen von Integralen betrachtet: \ud§, §V-dS, (/j()VxdS A3.33b) (£) (E) (E) 3. Bestimmung der Grenzwerte Hv§Ud§> ^oV$*-dS, limi#VxrfS A3.33c) (E) (E) (E) Dabei wird mit V das Volumen des Raumteiles bezeichnet, der den Punkt r im Innern enthält und dessen Oberfläche die geschlossene Fläche E ist Die Grenzwerte A3.33c) werden als Volumenableitungen bezeichnet und führen in der angegebenen Reihenfolge auf die Begriffe Gradient eines Skalarfeldes sowie Divergenz und Rotation eines Vektorfeldes. 13.2.2 Gradient eines Skalarfeldes 13.2.2.1 Definition des Gradienten Gradient wird ein Vektor genannt, der jedem Punkt eines Skalarfeldes U = U(r) zugeordnet werden kann (in Zeichen grad [/), und der die folgenden Eigenschaften hat: 1. grad U hat die Richtung der Normalen der jeweiligen Niveaufläche U = const, 2. grad U ist in Richtung wachsender Funktionswerte von U orientiert, 3. |grad£/| = -7—7, d.h., der Betrag von gradt/ stimmt mit der Richtungsableitung der Funktion U in
672 13 Vektoranalysis und Feldtheorie Normalenrichtung überein In den folgenden zwei Abschnitten werden zwei verschiedene Definitionen betrachtet. 13.2.2.2 Gradient und Richtungsableitung Die Richtungsableitung der skalaren Feldfunktion U nach dem Einheitsvektor c° ist gleich der Projektion des Vektors grad U auf die Richtung des Einheitsvektors c°: J^ = c°.gradC/, A3 34) d h., die Richtungsableitung ist als Skalarprodukt des Richtungsvektors mit dem Gradienten des Feldes beschreibbar. 13.2.2.3 Gradient und Volumenableitung Jedem Punkt r eines skalaren Feldes U = U(f) kann der Vektor Gradient U als Volumenableitung des skalaren Feldes zugeordnet werden- UdS grad U = lim (-^—— . A3.35) Dabei ist V das Volumen eines Raumteiles, der den betrachteten Punkt r enthält und die geschlossene Fläche E zur Oberfläche hat. 13.2.2.4 Weitere Eigenschaften des Gradienten 1. Der absolute Betrag des Gradienten ist in den Punkten größer, in deren Umgebung die Feldliniendichte größer ist. 2. Der Gradient verschwindet (grad/7 = 0), wenn sich in dem betrachteten Feldpunkt ein Maximum oder Minimum von U befindet Dort entarten die Niveauflächen bzw Niveaulinien zu einem Punkt 13.2.2.5 Gradient des Skalarfeldes in verschiedenen Koordinaten 1. Gradient in kartesischen Koordinaten grad u = dV^lA- + OU^VA J+ ^iM k. A3 36) ox oy dz 2. Gradient in Zylinderkoordinaten (x = pcos ip , y = ps'mip, z — z) grad U = gradp Uep + grad^, Ue^ + grad2 Uez mit A3.37a) grad^ = i|' grad"a = ^' grad^ = lr A3-37b) 3. Gradient in Kugelkoordinaten (x = r sin # cos <p , y = r sin # sin ip , z = r cos #) grad U = gradr Uer + grad^ Ue# + grad^ Ue^ mit A3 38a) 4. Gradient in allgemeinen orthogonalen Koordinaten (£, 77, £) Mit r(£, 77, C) = xfo 77, C)f + 2/K, *?, C)J+ *K, »7, C)k gilt grad U = grad^ Ue$ + grad^ [/en + grad^ Ue^ , wobei sich ergibt. A3.39a) grad.C/ = 1 dU , „ 1 ö£/ , Tr 1 W 3£> grad^f/ V grad^: dC A3.39b)
13.2 Räumliche Differentialoperationen 673 13.2.2.6 Rechenregeln Im folgenden wird angenommen, daß c und c konstant sind. grad c = 0, grad (U\ + U2) = grad U\ + grad [/2, grad (cU) = c grad U. grad (UiU2) = C/igrad U2 + /72grad CA, grady?(C/) = -r^grad U . au grad(V1.V2) = (V1 grad (r • c) = c. ) V2 + (V2 • grad) Vi + Vi x rot V2 + V2 x rot Vi. 1. Differential eines skalaren Feldes als totales Differential der Funktion U J TT ~ dU J 0U J 3U J du = grad U • dr = -7— dx + ^— dy + -^— a^. ax ay az 2. Ableitung einer Funktion [/ längs einer Raumkurve r(t) dJU__dl^dx dü_dy_ dU_dz^ dt dx dt dy dt dz dt 3. Gradient des Zentralfeldes gradf/(r) = [/(r)- r gradr = - (Kugelfeld), (Feld von Einheitsvektoren). A3 40) A3.41) A3 42) A3 43) A3 44) A3 45) A3.46a) A3.46b) 13.2.3 Vektorgradient Der Zusammenhang A3.32a) legt die Bezeichnung dV — = a • grad (Vxex + Vyey + Vzez) = a • grad V A3.47a) nahe, wobei grad V Vektorgradient heißt. Aus der Matrizenschreibweise von A3 47a) folgt, daß der Vektorgradient als Tensor mit Hilfe einer Matrix darstellbar ist: / dVx dVx ÖVX \ / dVx dVx ÖVX \ (a-grad) V = dx dy dz dVydVydVy dx dy dz dv^dv^dVz \ dx dy dz ) ay ) , A3.47b) az grad V = dx dy dz dVy dVy dVy dx dy dz dV^dV^dV, \ dx dy dz ) A3.47c) Tensoren dieser Art spielen in den Ingenieurwissenschaften eine Rolle, z.B. bei der Beschreibung von Spannungen (S. 271) und Elastizitäten (S 271). 13.2.4 Divergenz des Vektorfeldes 13.2.4.1 Definition der Divergenz Zu einem Vektorfeld V(r) läßt sich ein skalares Feld, das Feld seiner Divergenz, angeben. Im Punkt r ist die Divergenz als Volumenableitung des Vektorfeldes definiert: V-dS div V = lim (£) A3 48)
674 13. Vektoranalysis und Feldtheorie Man bezeichnet die Divergenz eines Vektorfeldes auch als spezifische Ergiebigkeit oder Quelldichte, denn sie gibt, falls V ein Strömungsfeld beschreibt, die Flüssigkeitsmenge an, die in dem betreffenden Punkt des Feldes V je Volumen- und Zeiteinheit neu entsteht Im Fall div V > 0 spricht man vom Vorhandensein einer Quelle, im Fall div V < 0 vom Vorhandensein einer Senke. 13.2.4.2 Divergenz in verschiedenen Koordinaten 1. Divergenz in kartesischen Koordinaten **-s*?+f <•»»•> mit V(z, y, z) = Vx\ + VJ + Vzk. A3 49b) Das Skalarfeld div V ist durch das Skalarprodukt aus Nablaoperator und Vektor V gemäß divV = V-V A3.49c) darstellbar und zeichnet sich daher durch Translations- und Drehungsinvarianz, also skalare Invarianz aus (s. S. 273) 2. Divergenz in Zylinderkoordinaten divV = i-^^ + i^ + -^ A3 50a) mit V{p,<p,z) = Vpep + Vtpefp + Vzez. A3.50b) Divergenz in Kugelkoordinaten div v = 1 d(r2K) 1 djsmWt) r2 dr rsiwd dfi mit V(r, tf, </?) = Vrer + Vße$ + V^ 1 c% rsint? dip 4. Divergenz in allgemeinen orthogonalen Koordinaten divV = ^) + ^ D [dt mit r(£, 77, C) = x& 77, C)?+ y{£, V, C)f + z{£, ry, C)k, v'l + ac Ol D = <9r <9r <9r d^dr]dC = dr dr dr] dr und V(f, 77, C) = V€e€ + V^ + Vcec A3.51a) A3.51b) A3.52a) A3 52b) A3.52c) A3 52d) 13.2.4.3 Regeln zur Berechnung der Divergenz divc = 0, div (Vi + V2) = div Vi + div V2 , div (cV) = cdiv V div (UV) = U div V -I- V • grad U I insbesondere div( rc) = div (Vi x V2) = V2 • rot Vi - Vi ¦ rot V2. 13.2.4.4 Divergenz eines Zentralfeldes divr = 3, divip(r)r = 3<p{r) + np (r) A3.53) A3 54) A3 55) A3 56)
13.2 Räumliche Differentialoperationen 675 13.2.5 Rotation des Vektorfeldes 13.2.5.1 Definitionen der Rotation 1. Definition Zu einem Vektorfeld V(r) läßt sich durch Bildung der negativ genommenen Volumenableitung ein vektorielles Feld, das Feld seiner Rotation, bilden (in Zeichen: rot V , curl V oder mit Hilfe des Nablaoperators VxV): VxdS dSx V rotV = lim (S) = lim (S) A3.57) iW VdF ttV=lim *- s*o S 2. Definition Zu einem Vektorfeld V(r) läßt sich ein zweites Vektorfeld, seine Rotation bilden, indem die folgenden Schritte durchgeführt werden: a) Aufspannen eines kleinen FJächenstückes S (s. Abb. 13.12) um den Punkt P. Dieses Flächenstück soll durch den Vektor S beschrieben werden, der in die Richtung der Normalen n zeigt und dessen Betrag gleich dem Inhalt des Flächenstückes ist. Der Rand des Flächenstückes sei mit K bezeichnet b) Umlaufintegral-Berechnung <b V • dv längs der J{K) Randkurve K dieses Flächenstücks. c) Grenzwert-Untersuchung lim ^ bei die Lage des Flächenstückes ungeändert bleibt. d) Änderung der Lage des Flächenstückes mit dem Ziel, einen Maximalwert des gewonnenen Grenzwertes zu ermitteln. Das zugehörige Flächenstück habe den Flächeninhalt Smax und die Randkurve ¦t*-max • V • dv, wo- (K) Abbildung 13 12 e) Bestimmung des Vektors rot V im Punkt r, dessen Betrag gleich dem gefundenen Maximalwert ist und dessen Richtung mit der Normalen des Flächenstückes zusammenfällt Es gilt dann- V- dr (tfmax) rotV = lim I I sm„-+o 5max A3 58a) Die Projektion von rot V auf die Flächennormale n des ursprünglichen Flächenstücks mit dem Inhalt S, d h die Komponente des Vektors rot V in beliebig vorgegebener Richtung n = 1, ergibt sich zu » V-dr 1 • rot V = rot/ V = lim W A3 58b) Die Feldlinien des Feldes rot V werden Wirbellinien des Vektorfeldes V genannt.
676 13 Vektoranalysis und Feldtheorie 13.2.5.2 Rotation in verschiedenen Koordinaten 1. Rotation in kartesischen Koordinaten «M*-£)+I(£-£)+((£- dVx dy i j k d_ d_ d_ dx dy dz Das Vektorfeld rot V ist durch das Vektorprodukt aus Nablaoperator und Vektor V gemäß rotV = V x V darstellbar. 2. Rotation in Zylinderkoordinaten rot V = rotpVe^ 4- rot^Ve^ 4- rotz Ve2 mit . ,7 \3VX dvv - dv„ 8v, . .-. lfd.... dvp mit p dip dz * dz dp 3. Rotation in Kugelkoordinaten rot V = rotr Ver 4- rot^ Ve^ 4- rot^Ve^ rotr V = —— — (sint% - -^ rsini? [dfl * dip 1 dVr 1Ö/TM roW V = ^-^-^- ~ -jr r% , r sm üö^ r or p (dp d(p rot, ^ = ^{£w)-£>- I <9r 4. Rotation in allgemeinen orthogonalen Koordinaten rot V = rot^ Ve^ + rot^ Ve^ 4- rot^ Ve<; mit rote V = _1_ D rot.V^i rot<r V = dti\ kl d_ d_ "-K( dr dr] dr \df k -). "<)] 4 5 > ?«, v, C) = x(f, 17, C)i + y«, u, C)T+ z«, fj, C)k; D = df dt df dr] df 13.2.5.3 Regeln zur Berechnung der Rotation rot (Vi + V2) = rot Vi + rot V2 , rot (cV) = c rot V . rot (UV) = f/rot V + grad U x V. rot (Vi x V2) = (V2 • grad)Vi - (Vi • grad)V2 4- Vi div V2 - V2 div Vi. A3.59a) A3 59b) A3.60a) A3.60b) A3 61a) A3 61b) A3.62a) A3 62b) A3.62c) A3.63) A3 64) A3.65)
13 2 Räumliche Differentialoperationen 677 13.2.5.4 Rotation des Potentialfeldes Aus dem Integralsatz von Stokes (s 13 3 3.2, S 687) folgt, daß die Rotation eines Potentialfeldes gleich Null ist rot V = rot (grad U) - Ö. A3 66) Das folgt auch aus A3.59a) für V = gradC/, wenn die Voraussetzungen des SCHWARZschen Vertau- schungssatzes erfüllt sind (s. 6.2.2.2,1., S. 411) ¦ Für r = xi + yj + zk mit r = |r| = y/x2 + y2 + z2 gilt rot r = 0 und rot ((p(r)r) = 0 , wobei ip(r) eine differenzierbare Funktion von r ist. 13,2.6 Nablaoperator, Laplace—Operator 13.2.6.1 Nablaoperator Nablaoperator wird ein symbolischer Vektor V genannt, der häufig zur Darstellung von räumlichen Differentialoperationen benutzt wird und dessen Einführung Berechnungen in der Vektoranalysis vereinfacht In kartesischen Koordinaten gilt v = lr+|^+l£ A3-67) Die Komponenten des Nablaoperators sind als partielle Ableitungsoperatoren aufzufassen, d.h., das Symbol — schieibt die partielle Ableitung nach x vor, wobei die anderen Variablen als Konstanten ox betrachtet werden Die Formeln für die räumlichen Differentialoperatoren in kartesischen Koordinaten ergeben sich durch formale Multiplikation dieses Vektoroperators mit dem Skalar U oder dem Vektor V Für die Operatoren Gradient, Vektorgradient, Divergenz und Rotation gilt* grad U = VU (Gradient vonU (s 13 2 2 1, S 671)), A3.68a) grad V = V V (Vektorgradient von V (s 13 2.3, S. 673)), A3.68b) div V = V • V (Divergenz von V (s 13 2.4 1, S 673)), A3 68c) rot V = V x V (Rotation von V (s 13 2.5 1, S 675)). A3.68d) 13.2.6.2 Rechenregeln für den Nablaoperator 1. Wenn V vor einer Linearkombination Yl a>iXi steht, in der die a. Konstanten und die Xi Punktfunktionen sind, und zwar unabhängig davon, ob es sich um skalare oder vektorielle Funktionen handelt, dann gilt- V(J2aiXi) = Y,ai\7Xi A3 69) 2. Wenn V vor einem Produkt aus skalaren oder vektoriellen Funktionen steht, dann wird der Operator auf jede dieser Funktionen nacheinander angewendet, über die der Operation unterworfene Funktion wird das Zeichen J, gesetzt und anschließend das Ergebnis gemäß I I I V(XYZ) = V( X YZ) + V(X Y Z) + V{XY Z) A3 70) addiert. Daraufhin werden die auf diese Weise erhaltenen Produkte nach den Regeln der Vektoralgebra derart umgeformt, daß nach dem Operator V nur der mit dem Zeichen [ gekennzeichnete Faktor steht Nach Abschluß der Rechnung wird das Zeichen weggelassen ¦ A: div (t/V) = V(C/V) = V( U V) + V(U\) = V -VU + UV -V = V • grad U + C/div V.
678 13. Vektoranalysis und Feldtheorie I i ¦ B: grad (ViV2) = V(VXV2) = V( Vi V2) + V(Vi V2 ). Gemäß b(äc) = (ab)c + a x (b x c) erhält man: grad (ViV2) = (V2V)Vi + V2 x (V x Vi) + (ViV)V2 + Vi x (V x V2) = (V2grad )Vi + V2 x rot Vi + (Vlgrad )V2 + Vi x rot V2 . 13.2.6.3 Vektorgradient Der Vektorgradient grad V kann mit Hilfe des Nablaoperators gemäß gradV = VV A3 71a) dargestellt werden. Für den im Zusammenhang mit dem Vektorgradienten vorkommenden Ausdruck (ä-v)Vgiit 2(a • V) V = rot (V x a) + grad (aV) + adiv V - Vdiv a-axrotV-Vxrota. A3.71b) Außerdem gilt für r = xi + y] + zk. (ä-V)r = a A3.71c) 13.2.6.4 Zweifache Anwendung des Nablaoperators Es gilt für jedes Feld V: 1. V(Vx V) = divrotV = 0, A3.72) 2. V x (VC/) = rot grad U = Ö, A3.73) 3 V(W) = divgradC/ = AU. A3 74) 13.2.6.5 Laplace—Operator 1. Definition Das Skalarprodukt des Nablaoperators mit sich selbst wird LAPLACE-Operator genannt: A = V • V = V2 . A3 75) Der LAPLACE-Operator ist kein Vektor. Er schreibt die Summierung der zweiten partiellen Ableitungen vor und kann sowohl auf skalare als auch auf vektorielle Funktionen angewandt werden Die Form des LAPLACE-Operators bleibt bei Translation und/oder Rotation des Koordinatensystems unverändert 2. Darstellung des Laplace—Operators in verschiedenen Koordinaten In den folgenden Formeln erfolgt die Anwendung des LAPLACE-Operators auf die skalare Ortsfunktion U(t) . Das Ergebnis der Anwendung ist dann ein Skalar. Bei Anwendungen auf vektorielle Ortsfunktionen V(r) ist das Ergebnis der Anwendung AV ein Vektor mit den Komponenten AVX , AVy , AVZ. 1. Laplace—Operator in kartesischen Koordinaten x d2u d2u d2u /10 . AU(X, y,,) = _ + _ + _. A3.76) 2. Laplace-Operator in Zylinderkoordinaten n 13/ dU\ 1 d2U d2U /in . ^*'*) = WrV%) + 7W + ä*- A3-77) 3. Laplace-Operator in Kugelkoordinaten WM*) = \§- (r*d-f) + -r^ UM) + ^^ A3.78) r2 or \ dr J r2 sm •& oft \ oti ) r2 sin"' d dip2
13.2 Räumliche Differentialoperationen 679 d öd D \dr dU ) ( d d Vor/ 2dr, ) 1 \ 1 D JöC y dU\ ~2d(\ dr dr drj dr A[7KIT7,C) = S ?K, »7,0 = *K, r/, C)F+ i/K, 17, Ol + z(t ry, C)k, A3.79b) D = 3. Spezielle Verknüpfungen von Nablaoperator und Laplace-Operator V(V-V) = grad div V, V x (V x V) = rot rot V, V(V • V) - V x (V x V) = AV, wobei mit A3.79a) A3 79c) AV = (V • V)V = AVxi + AVy + AVzk d2Vv . &VV\? d2Vx d2Vx d2Vx dx2 dy2 dz2 \dx2 y2 + dz2 N+l ßx2 + d2Vz d2Vz d2Vz\ r A3.80) A3.81) A3 82) A3.83) 13.2.7 Übersicht zu den räumlichen Differentialoperationen 13.2.7.1 Prinzipielle Verknüpfungen und Ergebnisse für Differentialoperatoren Tabelle 13.2 Prinzipielle Verknüpfungen bei den Differentialoperatoren Operator Gradient Vektorgradient Divergenz Rotation Laplace- Operator Symbol grad/7 grad V divV rotV AU AV Verknüpfung VC/ vv v-v Vx V (V-V)C/ (V • V)V Argument Skalar Vektor Vektor Vektor Skalar Vektor Ergebnis Vektor Tensor 2. Stufe Skalar Vektor Skalar Vektor Bedeutung maximaler Anstieg Quellen bzw. Senken Wirbel Potentialfeldquellen 13.2.7.2 Rechenregeln für Differentialoperatoren Im folgenden gilt- £/, U\, £/2 sind skalare Funktionen; c ist eine Konstante; V, Vi, V2 sind vektorielle Funktionen grad {U\ + E/2) = grad U\ + grad C/2 (U,Ui,U2 skalare Funktionen), grad (cU) = cgrad U (c Konstante), grad (UiU2) = Ui grad U2 + U2 gradUx. gmdF{U) = F'(U)gmdU div (Vi + V2) = div Vi + div V2 (V, Vi, V2 vektorielle Funktionen) A3.84) A3.85) A3 86) A3.87) A3.88)
680 13. Vektoranalysis und Feldtheorie div (cV) = c div V div (UV) = V • grad U + U div V rot (Vi + V2) = rot Vi + rot V2 rot (cV) = crot V. rot (UV) = UrotV-Vx grad U divrotV = 0 rot grad U = Ö (Nullvektor). div grad U = AU rot rot V = grad div V — A V div (Vi x V2) = V2 • rot Vi - Vi • rot V2 A3 89) A3.90) A3 91) A3 92) A3 93) A3 94) A3 95) A3 96) A3.97) A3 98) 13.2.7.3 Vektoranalytische Ausdrücke in ^artesischen, Zylinder- und Kugelkoordinaten Tabelle 13.3 Vektoranalytische Ausdrücke in kartesischen, Zylinder- und Kugelkoordinaten Kartesische Koordinaten Zylinderkoordinaten Kugelkoordinaten ds = df e^dx + Gydy + ezdz epdp + eippdip + ezdz erdr + e^rdd + e^r sin ddy gradf/ _dU ^dU ^dU e*dx+Gydy+ezdz ^dU_ ^ldU_ ^dU_ dp ßd(p dz _dU ^ldU _ 1 dU er"ä~+ e^~^l"+ ev—:—Z~ä~ 1 or r ov r sin v oy \ divV dVx dVy dVz dx dy dz ld_ pdp (pVP) + p dip dz r2 dr rsrnfloti 1 ÖK, rsin^ dip rotV dVy dz dx +e-z (9}^_dV1 z \ dx dy dz +ey p dip dV, dz +G^ ^ dz dp _ 1 rsin$ _(V;sintf)___ löVp _1 +e„, 1 dVr d sin$ dip dr (rVt) • öVr' AU d2U d2U d2U dx2 dy2 dz2 ld_( dU\ 1 d2U pdp \ dp J p2 dip2 d2U + dz2 1 d 0dU 2 dr \ dr r^sin 1 1 d ( ' 9 d2u idv2
13.3 Integration in Vektorfeldern 681 13.3 Integration in Vektorfeldern Integrationen in Vektorfeldern erfolgen meist in kartesischen, Zylinder- und Kugelkoordinaten Oft ist über Kurven, Flächen oder Volumina zu integrieren Die dazu erforderlichen Linien-, Flächen- und Volumenelemente sind in Tabelle 13.4 zusammengestellt. Tabelle 13.4 Linien-, Flächen- und Volumenelemente in kartesischen, Zylinder- und Kugelkoordinaten dr dS dv^ *) Kartesischc Koordinaten e"^ dx + G~*y dy + g"z dz gx dy dz + Gy dx dz +gz dx dy dx dy dz Gx Gy X Gz Gy GZ X Gx Gz — Gx X Gy e* eJ \1 i = j Die Indizes i und j stehen stel Zylinderkoordinaten Gp dp + G~^pdip + gz dz Gp pdipdz + Gp dp dz +gz p dp d(p p dp d(p dz Gp = Gm X Gz Gin — Gz X Gp Gz — Gp X Gm vertretend für x, y, z bzw. Kugelkoordinaten g"t dr + g~$ r dd + G^r sin d dip Gr r2 sin $ dd d(p +g# r sin d dr d(p -\-Gm r dr dd r2 sin $ dr dfl dip Gr — e^ x Gm G<ß — Gm X Gr Gm — er x e$ e-e -1° '*•»' e. «, |i i = j p, (p,z bzw. r, $,<£>. Für das Volumen wurde hier abweichend von der üblichen Praxis das Symbol v gewählt, um Verwechlungen mit dem Betrag der Vektorfunktion |V| = V zu vermeiden 13.3.1 Kurvenintegral und Potential im Vektorfeld 13.3.1.1 Kurvenintegral im Vektorfeld 1. Definition Kurven- oder Linienintegral einer Vektorfunktion V(r), genommen über ein Bo- genstück AB (Abb. 13.13), nennt man den Skalar P= / V(r)-dr. A3 99a) AB 2. Berechnung dieses Kurvenintegrals in fünf Schritten a) Einteilung des Weges AB (Abb. 13.13) durch Zwischenpunkte ^i(?i), A2 (r2), . , An_i(rn_i) (A = A0, B = An) in n kleinere Teilbogenstücke, die durch die Vektoren r* — F;_i = AF;_i angenähert werden. b) Wahl von Punkten P; mit den Radiusvektoren r*, die im Innern oder auf dem Rande eines jeden Teilbogenstückes liegen können. c) Skalare Multiplikation der Funktionswerte V(ri) in den so ausgewählten Punkten mit Ari_i d) Addition aller auf diese Weise erhaltenen n Produkte n e) Berechnung des Grenzwertes der erhaltenen Summe ^ V(ri) • Arj_i für Ari_i —? 0 , also für n —? oo
682 13. Vektoranalysis und Feldtheorie Wenn der Grenzwert existiert und von der Wahl der Punkte A{ und P* unabhängig ist, dann wird er als Kurvenintegral fv-dr = Hm JTV{Ti) • Ar,_ AB A3 99b) bezeichnet. Die Existenz des Kurvenintegrals A3.99a,b) ist gesichert, wenn die Vektorfunktion V(r) und das Bogenstuck AB stetig sind und wenn letzteres stetige Tangenten besitzt. Eine Vektorfunktion V(r) ist stetig, wenn die zu ihrer Beschreibung notwendigen drei skalaren Funktionen, ihre Komponenten, stetig sind. A=A Abbildung 13 13 Abbildung 13.14 13.3.1.2 Bedeutung des Kurvenintegrals in der Mechanik Wenn V(r) ein Kraftfeld darstellt, d h. V(r) = F(r), dann ist A3.99a) die Arbeit, die die Kraft F verrichtet, wenn ein Massenpunkt m längs des Weges AB bewegt wird (Abb. 13.13,13.14). 13.3.1.3 Eigenschaften des Kurvenintegrals ¦dr. / V(r) • dr = / V(r) •(*?+/ V(r) ¦ ABC AB BC f V(r) • dr = - / V(r) • dr (Abb. 13.14) AB BA J [V(r) + W(r)] • dr = f V(r) • dr + J W(r) • dr . AB AB AB J ÖV(r)-dr = c fv(r)-dr. A3.100) A3.101) A3 102) A3 103)
13 3 Integration in Vektorfeldern 683 13.3.1.4 Kurvenintegral in kartesischen Koordinaten In kartesischen Koordinaten gilt* / V(f) -df=f {Vx dx + Vydy + Vz dz) A3.104) AB AB 13.3.1.5 Umlauf integral eines Vektorfeldes Umlaufintegral eines Vektorfeldes nennt man ein Kurvenintegral dieses Feldes, das über einen geschlossenen Integrationsweg genommen wird Wird der skalare Wert mit P und der Weg auf der geschlossenen Kurve mit K bezeichnet, dann gilt. p = i V(r) • dx A3 105) 13.3.1.6 Konservatives oder Potentialfeld 1. Definition Von einem konservativen Feld oder einem Potentialfeld spricht man, wenn der Wert P des Kurvenintegrals A3.99a) in einem Vektorfeld nur von der Lage der Punkte A und B abhängt und nicht vom konkreten Integrationsweg zwischen diesen beiden Punkten. Der Zahlenwert des Umlaufintegrals in einem konservativen Feld ist stets gleich Null > V(F)-dr = 0 A3.106) Ein konservatives Feld zeichnet sich immer durch Wirbelfreiheit aus: rotV = Ö. A3 107) Umgekehrt ist diese Gleichung die notwendige und hinreichende Bedingung dafür, daß das Feld konservativ ist Dazu muß weiterhin vorausgesetzt werden, daß die partiellen Ableitungen der Feldfunktion nach den enthaltenen Koordinaten stetig sind und der Definitionsbereich von V einfach zusammenhängend ist. Für ein dreidimensionales Feld hat dieser, Integrabilitätsbedingung genannte Zusammenhang (s. 8 3 4 2, S 486) in kartesischen Koordinaten die Form dy dx dz dy ' dx dz 2. Potential eines konservativen Feldes, seine Potentialfunktion oder kurz sein Potential nennt man die skalare Stammfunktion r ip(r) = Jv(r)-dr A3.109a) ?0 Sie ergibt sich in einem konservativem Feld bei fixiertem Anfangspunkt A(r0) und veränderlichem Endpunkt B(t) als Integral ip(r)= fv(r)-df A3.109b) AB Hinweis: Zu beachten ist, daß im Unterschied dazu in der Physik als Potential tp*(r) einer Funktion V(r) im Punkt r eine Größe verstanden wird, die das entgegengesetzte Vorzeichen besitzt ¥ '(r) = - fv(r)-dr = -tp(r). A3 110) 3. Zusammenhang zwischen Gradient, Kurvenintegral und Potential Wenn die Beziehung V(r) = gradt/(f) gilt, dann ist U(r) das Potential des Feldes V(r), und umgekehrt ist V(r) ein Po-
684 13. Vektoranalysis und Feldtheorie tentialfeld oder konservatives Feld. In der Physik ist in Übereinstimmung mit A3 110) das negative Vorzeichen zu berücksichtigen. 4. Berechnung des Potentials eines konservativen Feldes Ist die Funktion V(r) in kartesischen Koordinaten gegeben, V = Vxi + Vyj + Vzk, dann gilt für das vollständige Differential ihrer Potentialfunktion • dU = Vx dx + Vy dy + Vz dz A3.111a) Dabei müssen die Koeffizienten 14, V^, 14 der Integrabilitätsbedingung A3.108) genügen. Die Bestimmung von U erfolgt über das Gleichungssystem £-"¦¦ f="•> £-"¦¦ Praktischerweise berechnet man das Potential durch Integration über drei zu den Koordinatenachsen parallele, Anfangs- und Endpunkt der Integration miteinander verbindende Strecken (Abb. 13.15). U ¦ Abbildung 13.15 r /v dr = U(x0,yo,zo)+ Vx(x,y0,z0)dx J JXQ ?0 + [yVy{x,y,z0)dy+ f' Vz{x,y,z)dz . A3 112) 13.3.2 Oberflächenintegrale 13.3.2.1 Vektor eines ebenen Flächenstückes Die vektorielle Darstellung des Oberflächenintegrals allgemeiner Art (s. 8.5 3, S. 502) erfordert die Zuordnung eines Vektors S zu einem ebenen Flächenstück S, der senkrecht auf dieser Fläche steht und dessen Betrag gleich dem Flächeninhalt von S ist. Den Fall eines ebenen Flächenstückes zeigt die Abb. 13.16a Die positive Richtung von S wird gemäß der Rechten-Hand-Regel (auch Rechtsschraube genannt) mit dem der geschlossenen Umrandungskurve K bei gegebenen Umlaufsinn festgelegt Blickt man vom Vektorursprung in Richtung Vektorspitze, dann soll der Drehsinn der Umrandungskurve mit dem des Uhrzeigers übereinstimmen Durch diese Wahl des positiven Umlaufsinnes auf der Umrandungskurve wird gleichzeitig festgelegt, welche Fläche die Außenseite ist, d.h. die Seite, von der aus der Vektor abgetragen wird Diese Festlegungen können auf beliebig gekrümmte Flächenstücke übertragen werden, die von einer geschlossenen Randkurve eingegrenzt werden (Abb. 13.16b,c) Abbildung 13 16
13 3 Integration in Vektorfeldern 685 13.3.2.2 Berechnung von Oberflächenintegralen Die Berechnung von Oberflächenintegralen in Skalar- oder Vektorfeldern kann unabhängig davon, ob S von einer geschlossenen Kurve umrandet ist oder selbst eine geschlossene Fläche darstellt, in fünf Schritten erfolgen. a) Einteilung des Flächenstückes S, auf dem die Außenseite durch den Umlaufsinn der Umrandungskurve bestimmt ist (Abb.13.17), in beliebige n Teilflächenstücke ASi derart, daß jedes dieser Teilflächenstücke durch ein ebenes Flächenstück angenähert werden kann Jedem Flächenstück AS* wird gemäß A3 33a) der Vektor ASi zugeordnet Im Falle einer geschlossenen Fläche wird der positive Umlaufsinn der Randkurve so festgelegt, daß die positive Seite, auf der der Vektor ASi beginnt, die Außenfläche ist b) Auswahl eines beliebigen Punktes Pi mit dem Ortsvektor fj im Innern oder auf dem Rande jedes Teilflächenstückes c) Bildung des Produktes U(f[) AS; im Falle des skalaren Feldes und V(fj) • ASi oder V(f!) x ASi im Falle eines vektoriellen Feldes. d) Addition der für die Teilflächenstücke gebildeten Produkte. e) Bildung des Grenzüberganges ASi —> 0 für n —? oo . Dabei sollen die Teilflächenstücke in dem in 8 4 1.1,1., S 488 für die Berechnung des Doppelintegrals angegebenen Sinne gegen Null streben Wenn der jeweilige Grenzwert existiert und von der Zerlegung von S in Teilflächenstücke sowie von der Wahl der Punkte Pi unabhängig ist, dann erhält man die in 13.3.2.3, S. 685 angegebenen Oberflächenintegrale zt Abbildung 13.17 Abbildung 13.18 13.3.2.3 Oberflächenintegrale und Fluß von Feldern 1. Fluß eines skalaren Feldes lim ^C/(ri)ASi= / U(r) dS n—>oo A3.113) 2. Skalarer Fluß eines Vektorfeldes Q= lim £v(rO-ASi= f V(f) • dS A3.114) n—>o> (S)
686 13. Vektoranalysis und Feldtheorie 3. Vektorfluß eines Vektorfeldes R = lim £ V(?0 x AS* = / V(r) x d§. A3.115) n—>oo 13.3.2.4 Oberflächenintegrale in kartesischen Koordinaten als Oberflächenintegrale 2. Art fud§= ffudydzi+ [[Udzdx]+ ffudxdyk A3116) (S) (Syz) (Szx) (Sxy) fv-d§= [fvxdydz+ f[vydzdx+ ffvzdxdy A3.117) («5) (Syz) (Szx) (Sxy) JvxdS = JJ{Vzi-Vyk)dydz+ j j(v£-VzX)dzdx+ JJ(Vyi- Vj)dxdy A3 118) (S) (Syz) (Szx) (Sxy) Die Existenzsätze für diese Integrale können in Analogie zu dem in 8.5.2.1,4., S. 501 angegebenen formuliert werden. Bei der Berechnung der Zweifachintegrale werden zunächst die Projektionen von S auf die Koordinatenebenen gebildet (Abb. 13.18), wobei eine der Variablen x, y oder z durch die beiden anderen mit Hilfe der Flächengleichung für S ausgedrückt werden muß Hinweis: Integrale über eine geschlossene Fläche werden durch die Darstellungsweise UdS=(fhUdS, 6V-dS= ffiV-dS, iV xdS= (ff)V xdS A3119) (S) (S) E) (S) (S) (S) gekennzeichnet ¦ A: Es ist P = / xyz d§ zu berechnen, wobei über das Ebenenstück x + y + z = lzu integrieren (S) ist, das zwischen den drei Koordinatenebenen eingeschlossen ist Die obere Seite soll die positive sein. P= //(l — V — z)yzdydziJr (l — x — z)xzdzdxj+ / / A - x — y)xydxdyk\ (Syz) (Szx) (Sxy) / / A — y — z)yz dydz = / / A — y — z)yz dy dz = —— . In Analogie dazu berechnet man die J J Jo Jo 120 (Syz) beiden anderen Integrale. Das Ergebnis lautet. P = tt^(* + j + k) ¦ B: Es ist Q = / r • d§ = xdydz-\- ydzdx+ zdxdy über das gleiche Ebenenstück (S) (Syz) (Szx) (Sxy) wie in A zu integrieren: xdydz= / A — x — y) dy dx = - Die beiden anderen Integrale (svz) werden in Analogie dazu berechnet. Das Ergebnis lautet Q = tt + tt + tt — t: • ¦ C: Es ist R = rxd§= (xi + y] + zi.) x (dy dz\ + dz dx'} + dx dy k) zu berechnen, wobei über (S) (S)
13.3 Integration in Vektorfeldern 687 das gleiche Ebenenstück wie in A zu integrieren ist: Die Ausführung der Rechnung liefert R = Ö. 13.3.3 Integralsätze 13.3.3.1 Integralsatz und Integralformel von Gauß 1. Integralsatz von Gauß Der Integralsatz von GAUSS liefert den Zusammenhang zwischen einem Volumenintegral über ein Volumen v, das von einem Feld V durchsetzt ist, und einem Oberflächenintegral über die dieses Volumen umschließende Fläche S. Die Orientierung der Fläche sei so festgelegt (s. 8.5.2.1,1., S. 499), daß die Außenseite die positive Seite ist Die vektorielle Feldfunktion V soll stetig sein, ihre ersten partiellen Ableitungen sollen existieren und stetig sein. S)V-dS= fffdwVdv. A3.120a) (S) (v) Der skalare Fluß des Feldes V durch die geschlossene Fläche S ist gleich dem Integral der Divergenz von V über das von S umschlossene Volumen v In kartesischen Koordinaten gilt: jj) (Vxdydz + Vydzdx + Vzdxdy) = JJJ (^ + ^ + ^ j dxdydz. A3 120b) 2. Integralformel von Gauß Im ebenen Falle der Einschränkung auf die x, y-Ebene geht der Integralsatz von GAUSS in die Integralformel von GAUSS über Sie liefert den Zusammenhang zwischen einem Linienintegral und dem dazugehörigen Flächenintegral: jj]^dQ^_dPpyY\ dxdy= f[P{Xty)dx + Q{Xiy)dy]m (m21) Mit B ist eine ebene Fläche bezeichnet, die die Berandung K besitzt. P und Q sind stetige Funktionen mit stetigen partiellen Ableitungen 1. Ordnung. 3. Sektorformel Sektorformel wird ein wichtiger Spezialfall der GAUSSschen Integralformel genannt, mit dessen Hilfe ebene Flächen berechnet werden können. Für Q = x , P = —y folgt: fdxdy = - i[xdy-y dx] A3.122) (B) (K) ii> 13.3.3.2 Integralsatz von Stokes Der Integralsatz von Stokes liefert den Zusammenhang zwischen einem Oberflächenintegral über die gekrümmte und orientierte Fläche S, in der das Vektorfeld V definiert ist, und dem Umlaufintegral über die Randkurve K der Fläche S. Der Umlaufsinn von K wird so gewählt, daß der Umlaufsinn der Berandung des Oberflächenelements mit der Flächennormalen eine Rechtsschraube bildet (s. 13.3.2.1, S 684) Die vektorielle Feldfunktion V sei stetig und besitze stetige partielle Ableitungen 1. Ordnung //¦ rotV-dS= f V-dr. A3123a) (S) (K) Der vektorielle Fluß der Rotation durch eine Fläche 5, die von der geschlossenen Kurve K umrandet wird, ist gleich dem Umlaufintegral des vektoriellen Feldes V über die Kurve K.
688 13. Vektoranalysis und Feldtheorie In kartesischen Koordinaten gilt' j(Vxdx + Vydy + Vzdz) (K) Im ebenen Falle geht der Integralsatz von Stokes ebenso wie der von GAUSS in die Integralformel A3 121) von Gauss über. 13.3.3.3 Integralsätze von Green Die GREENschen Integralsätze liefern Zusammenhänge zwischen jeweils einem Raum- und einem Flächenintegral. Sie ergeben sich aus der Anwendung des GAUSSschen Satzes auf die Funktion V = U\ grad U2 ? wobei U\ und U2 skalare Feldfunktionen sind und v das von der Fläche S eingeschlossene Volumen. ffJ{U1AU2 + grad U2 • grad U1)dv= S}Ui grad U2 • d§, A3 124) («) (S) [[[(U1AU2 - C/2AC/1) dv = $(C/i grad U2 - U2 grad Ui) • d§ A3 125) (v) (S) Speziell für U\ = 1 gilt. /TV" AC/ dv = $grad £/ • dS A3 126) («) E) In kartesischen Koordinaten hat der 3 GREENsche Satz die folgende Form (vgl A3 120b)) Q2rr <&TT o2r ffffd2U d2U d2U\ _, M(dU J J dU J _, dt/ J \ /10 ^ Jff[-d?+w+-d?)dv=f {^dydz^dzdx^dxdy) A3127) («) V * 7 E) V * ' ¦ A: Berechnung des Linienintegrals I = <k (x2y3 dx + dy + zdz) mit K als Schnittkurve zwischen (K) dem Zylinder x2 + y2 = a2 und der Ebene 2 = 0. Nach dem Satz von Stokes erhält man. 2-k a 6 /= j)W-dT= /7rotV-dS = - I I Sx2y2dxdy = -3 / f r5 cos2 ip sin2 ipdr dp =-^-tr mit (AT) E) E*) v>=0r=0 rot V = — 3x2y2k, dS = kdxdy und der Kreisfläche S*' x2 + y2 < a2 . ¦ B: Gesucht ist der Fluß J = i V • d§ im Strömungsfeld V = x3i + y3j + z3k durch die Oberfläche (S) S der Kugel x2 + y2 + z2 = a2. Der Satz von Gauss liefert: 2-k -K a 1= i\'d§= [ff divVdv = 3 fff{x2+y2+z2)dxdydz = S f f f r* sind dti dr dp = — a57r E) (w) (w) <^=0ö=0r=0 ¦ C: Wärmeleitungsgleichung: Die zeitliche Änderung des Wärmeinhaltes Q eines Raumteiles v, der keine Wärmequellen enthalten soll, ergibt sich zu: —- = CQ~^~ dv (c spezifische Wärmekapazität, (v) q Dichte, T Temperatur), während die damit verbundene zeitliche Änderung des Wärmeflusses durch
13 4 Berechnung von Feldern 689 du ff - die Oberfläche S von v durch — = X grad T • dS (A Wärmeleitzahl) angegeben wird. Anwendung (S) des Satzes von Gauss auf das Oberflächenintegral ergibt aus / / / (v) dT cg—- -div(AgradT) dv = 0 dT die Wärmeleitungsgleichung cA— = div (AgradT), die im Falle eines homogenen Körpers (c, g, X dT Konstanten) die Gestalt — = a2AT hat dt 13.4 Berechnung von Feldern 13.4.1 Reines Quellenfeld Reines Quellenfeld oder wirbelfreies Quellenfeld wird ein Feld Vi genannt, dessen Rotation überall Null ist. Ist die Quelldichte q(f) , dann gilt: divVi = g(f), rotVi=Ö A3 128) In diesem Falle besitzt das Feld ein Potential U, das in jedem beliebigen Punkt P bestimmt ist durch die Poissonsehe Differentialgleichung Vi = grad U, div grad U = AU = q(f). A3 129a) (In der Physik gilt meist Vi = —grad U.) Die Berechnung von U erfolgt über • div V(f*)di;(f*) w-iiir- r - r* A3.129b) Die Integration erfaßt den gesamten Raum (Abb. 13.19). Die Divergenz von V muß differenzierbar sein und für sehr große Abstände hinreichend schnell abnehmen rri! bzw. qa m2bzw. q2 Abbildung 13.19 bzw. Abbildung 13.20 13.4.2 Reines Wirbelfeld oder quellenfreies Wirbelfeld Reines Wirbelfeld wird ein Feld V2 genannt, manchmal auch solenoides Vektorfeld, dessen Divergenz überall gleich Null ist; dieses Feld ist also quellenfrei Ist die Wirbeldichte w(r), dann gilt: divV2 = 0, rotV2 = w(r). A3.130a)
690 13. Vektoranalysis und Feldtheorie Die Wirbeldichte w(r) kann nicht beliebig gegeben sein, sondern muß der Gleichung div w = 0 genügen. Mit dem Ansatz V2(r) = rotÄ(r), divÄ = 0, dh rotrotÄ-w A3 130b) ergibt sich gemäß A3.97) graddivÄ- AÄ = w, dh AÄ =-w. A3.130c) Somit genügt A(r) formal der PoiSSONschen Differentialgleichung wie das Potential U eines wirbelfreien Feldes Vi und heißt deshalb Vektorpotential. Für jeden beliebigen Punkt P gilt dann V2 = rotÄ mit &=j-[[[ |^5^!| M**) A3 130d) (v) Die Bedeutung von r ist die gleiche wie in A3 129b); die Integration erfolgt über den gesamten Raum. 13.4.3 Vektorfelder mit punktförmigen Quellen 13.4.3.1 Coulomb-Feld der Punktladung Das COULOMB -Feld ist ein wichtiges Beispiel für ein wirbelfreies Feld, das überall, ausgenommen den Ort der Punktladung, den Quellort, auch solenoid, d h. quellenfrei ist (Abb. 13.20) Die COULOMB- Kraft wirkt anziehend für Ladungen #1,G2 mit ungleichen Vorzeichen, abstoßend für Ladungen mit gleichen Vorzeichen Die Feld- und die Potentialgleichungen lauten E = -^r, U = -- in der Physik auch - A3131a) Der skalare Fluß ist 47re bzw. 0, je nachdem, ob die Fläche S eine Quelle e einschließt oder nicht: E-dS = Jq71' A3.131b) (S) Die Größe e wird Ergiebigkeit oder Intensität der Quelle genannt. 13.4.3.2 Gravitationsfeld der Punktmasse Das Gravitationsfeld der Punktmasse ist ein zweites Beispiel für ein wirbelfreies und gleichzeitig überall, außer am Ort der Punktmasse, solenoides Feld Man spricht auch vom NEWTONschen Feld Alle Überlegungen, die für das COULOMB-Feld gelten, sind analog auf das NEWTONsche Feld anwendbar 13.4.4 Superposition von Feldern 13.4.4.1 Diskrete Quellenverteilung In Analogie zur Überlagerung physikalischer Felder überlagern sich auch die Vektorfelder der Mathematik. Der Superpositionssatz lautet- Haben die Vektorfelder V„ die Potentiale Uv , so hat das Vektorfeld V = EV„ das Potential U = YÄJV Für n diskrete Quellpunkte mit den Ergiebigkeiten ev (y = 1,2, .., n), deren Felder sich überlagern, kann man daher das resultierende Feld durch algebraische Addition der Potentiale Uv bestimmen- V(r) - -grad Tu» mit Uv = *\ , A3.132a) u=\ lr - VA Dabei ist r wieder der Ortsvektor des Aufpunktes, während r„ die Ortsvektoren der Quellpunkte sind. Treten wirbelfreie Felder Vi und quellenfreie Felder V2 gemeinsam auf und handelt es sich dabei um überall stetige Felder, dann gilt. i///iS,'!«-)-»///|Si^' 47T A3.132b)
13 5 Differentialgleichungen der Feldtheorie 691 Erstreckt sich das Vektorfeld ins Unendliche, dann ist die Bestimmung von V(r) eindeutig, wenn V(r) für r = |r| —> oo genügend stark verschwindet Die Integration erfolgt über den gesamten Raum. 13.4.4.2 Kontinuierliche Quellenverteilung Wenn die Quellen über Linien, Flächen oder räumliche Bereiche kontinuierlich verteilt sind, dann treten an die Stelle der endlichen Ergiebigkeiten eu infinitesimale, die der Dichte der Quell Verteilung entsprechen, und an die Stelle der Summen Integrale über die Quellbereiche Im Falle einer stetigen räumlichen Verteilung der Quellergiebigkeit ist die Quelldichte q(r) = div V . Ahnliches gilt für das Potential eines durch Wirbel erzeugten Feldes. Im Falle einer stetigen räumlichen Wirbelverteilung ist die Wirbelflußdichte durch w(r) = rot V festgelegt 13.4.4.3 Zusammenfassung Ein Vektorfeld ist durch die Angabe seiner Quellen und Wirbel im gesamten Raum vollständig und eindeutig bestimmt, falls alle diese Quellen und Wirbel im Endlichen liegen. 13.5 Differentialgleichungen der Feldtheorie 13.5.1 Laplacesche Differentialgleichung Die Aufgabe der Bestimmung des Potentials U eines Vektorfeldes Vi = grad U, in dem keine Quellen enthalten sind, führt gemäß A3 128) mit q(r) = 0 auf div Vi = divgradt/ = Af/= 0, ' A3 133a) d h auf die LAPLACEsche Differentialgleichung. In kartesischen Koordinaten gilt. d2U d2U d2U AU=w+W + ^ = ° A3133b) Alle Funktionen, die dieser Differentialgleichung genügen, stetig sind und stetige partielle Ableitungen erster und zweiter Ordnung besitzen, werden LAPLACEsc/ie oder harmonische Funktionen genannt Es werden drei grundlegende Fälle von Randwertaufgaben unterschieden* 1. Randwertaufgabe (für das Innengebiet) oder DiRiCHLETsc/ies Problem- Gesucht wird eine Funktion U(x, y, z), die im Inneren eines gegebenen räumlichen bzw. ebenen Gebietes harmonisch ist und auf dem Rand des Gebietes vorgegebene Werte annimmt 2. Randwertaufgabe (für das Innengebiet) oder NEUMANNsc/ies Problem- Gesucht wird eine Funktion U(x,y,z), die im Inneren eines gegebenen Gebietes harmonisch ist und deren Normalenableitung - auf dem Rand des Gebietes vorgegebene Werte annimmt 3. Randwertaufgabe (für das Innengebiet): Gesucht wird eine Funktion U(x, y, z), die im Inneren eines Gebietes harmonisch ist, wobei auf dem Rand des Gebietes der Ausdruck aU + ß-7T- (a, ß = const, a2 + ß2 ^ 0) vorgegebene Werte annimmt. on 13.5.2 Poissonsche Differentialgleichung Die Aufgabe der Bestimmung des Potentials U eines Vektorfeldes Vi = grad U , in dem Quellen enthalten sind, führt gemäß A3 128) mit q(r) ^ 0 auf dn
692 13. Vektoranalysis und Feldtheorie div Vi = div grad U = AU = q(r) ^ 0, A3.134a) d.h auf die PoisSONsc/ie Differentialgleichung. In kartesischen Koordinaten gilt. Arr d2U d2U d2U „o ,0.1.x AU=w+w+^- A3-134b) Die LAPLACEsche Differentialgleichung A3 133b) ist somit ein Spezialfall der PoiSSONschen Differentialgleichung A3.134b). Die Lösung ist das NEWTON-Potential (für Punktmassen) oder das COULOMB-Potential (für Punktladungen) »-llliyW' deren Potential U(r) für betragsmäßig größer werdende r-Werte hinreichend stark gegen Null strebt (s. [13 1]). Die Integration erfolgt über den gesamten Raum. Zur PoiSSONschen Differentialgleichung können die gleichen drei Randwertbedingungen wie für die Lösung der LAPLACEschen Differentialgleichung formuliert werden. Die erste und dritte Randwertaufgabe sind eindeutig lösbar, an die zweite müssen noch spezielle Bedingungen gestellt werden (s [9 5]).
693 14 Funktionentheorie 14.1 Funktionen einer komplexen Veränderlichen 14.1.1 Stetigkeit, Differenzierbarkeit 14.1.1.1 Definition der komplexen Funktion Analog zu den reellen Funktionen kann man komplexen Werten z = x + \y ebenfalls komplexe Werte w = u + i v zuordnen, wobei u = u(x, y) und v = v(x, y) Funktionen zweier reeller Veränderlicher sind Man schreibt w = f(z). Durch die Funktion w = f(z) wird die komplexe z-Ebene in die komplexe iu-Ebene abgebildet. Die Begriffe Grenzwert, Stetigkeit und Ableitung einer Funktion w = f(z) einer komplexen Veränderlichen werden formal in Analogie zu den Funktionen einer reellen Veränderlichen definiert 14.1.1.2 Grenzwert der komplexen Funktion Grenzwert einer Funktion f(z) heißt eine komplexe Zahl w0, wenn für z gegen z0 die Funktion f(z) gegen w0 strebt- wo = lim f(z). A4 la) z-+z0 Dazu ist erforderlich, daß sich eine beliebig kleine positive Zahl e angeben läßt, für die es eine reelle positive Zahl 5 derart gibt, daß für jede beliebige komplexe Zahl z , ausgenommen höchstens die Zahl Zq selbst, die Ungleichungen \z0 — z\ < 6, erfüllt sind A4 lb) \w0-f{z)\<e A4.1c) a) v| z-Ebene x 0 b) Abbildung 14 1 w-Ebene u Die geometrische Bedeutung geht aus Abb. 14.1 hervor Einem beliebigen Punkt z, ausgenommen höchstens den Punkt z0 selbst, der innerhalb eines Kreises mit dem Mittelpunkt Zq und dem Radius 8 liegt, entspricht in der w-Ebene, in die die Funktion w = f(z) abbildet, ein Punkt w, der in einem Kreis mit dem Mittelpunkt w0 und dem Radius e liegt. Die Flächen mit den beliebig kleinen Radien nennt man auch die beliebig kleinen Umgebungen U£(w0) und Uö(zq) . 14.1.1.3 Stetigkeit der komplexen Funktion Eine Funktion w = f(z) heißt an der Stelle z0 stetig, wenn es zu jeder vorgegebenen, beliebig kleinen Umgebung U£(w0) eines Punktes w0 = f(z0) der w-Ebene eine Umgebung Us(z0) des Punktes z0 der 2-Ebene gibt, deren durch w = f(z) vermittelte Bildpunkte ganz in U£(wq) liegen. Wie in Abb. 14.1 dargestellt, ist U£(w0) z.B. ein Kreis mit dem Radius e um den Punkt w0 . Es gilt dann lim f(z) = f(zo) oder \imf(z0 + S) = f(z0). d—»U A4 2) Der Grenzwert der Funktion w ist gleich dem Funktionswert der unabhängigen Variablen. 14.1.1.4 Differenzier bar keit der komplexen Funktion Eine Funktion w = f(z) heißt an der Stelle z differenzierbar, wenn der Differenzenquotient Aw = f(z + Az)-f{z) Az Az für A z —? 0 einem vom Annäherungsweg unabhängigen Grenzwert zustrebt. Dieser Grenzwert wird mit f'{z) bezeichnet und Ableitung der Funktion f(z) genannt ¦ Die Funktion f(z) = Re z = x ist im Punkt z = z0 nicht differenzierbar, denn bei Annäherung an A4 3)
694 14 Funktionentheorie den Punkt Zq längs einer Parallelen zur x-Achse strebt der Differenzenquotient gegen den Wert Eins, dagegen bei Annäherung längs einer Parallelen zur y-Achse gegen den Wert Null. 14.1.2 Analytische Funktionen 14.1.2.1 Definition der analytischen Funktion Eine Funktion f(z) heißt in einem Gebiet G analytisch, regulär oder holomorph, wenn sie in allen Punkten von G differenzierbar ist Randpunkte von G, in denen f'(z) nicht existiert, sind singulare Punkte von f(z). Die Funktion f(z) = u(x, y)+iv{x, y) ist genau dann in G differenzierbar, wenn u und v stetige partielle Ableitungen nach x und y in G besitzen und dort die CAUCHY-RiEMANNsc/ieri Differentialgleichungen gelten: du _ dv du _ dv dx dy' dy dx' Real- und Imaginärteil einer analytischen Funktion genügen für sich der LAPLACEschen Differentialgleichung Au(x,y) = ^ + ^ = 0, A4.5a) A „(*,„) = g + 0 =0 A4.5b) Die Ableitungen der elementaren Funktionen einer komplexen Veränderlichen werden nach den gleichen Formeln berechnet wie die Ableitungen der entsprechenden Funktionen einer reellen Veränderlichen. ¦ A: f(z) = z3 , f'(z) = Sz2; ¦ B: f(z) = sinz, f'(z) = cosz. 14.1.2.2 Beispiele analytischer Funktionen 1. Funktionenklassen Die elementaren algebraischen und transzendenten Funktionen sind mit Ausnahme einzelner isolierter singulärer Punkte in der gesamten z-Ebene analytisch Sie besitzen in allen regulären Punkten Ableitungen beliebig hoher Ordnung. ¦ A: Die Funktion w = z2 mit u = x2 — y2 , v = 2xy ist überall analytisch. ¦ B: Die Funktion, w = u + iv , definiert durch die Gleichungen u = 2x + y , v = x + 2y, ist in keinem Punkt analytisch. ¦ C: Die Funktion f(z) = z3 mit f'(z) = 3z2 ist analytisch. ¦ D: Die Funktion f(z) = sin z mit f'(z) = cos z ist analytisch. 2. Ermittlung der Funktionen u oder v Wenn die Funktionen u und v jede für sich der LAPLACEschen Differentialgleichung genügen, sind sie harmonische Funktionen (s 13 5 1, S 691). Ist eine der beiden harmonischen Funktionen bekannt, z.B u, dann kann die zweite bis auf eine additive Konstante als konjugierte harmonische Funktion v mit Hilfe der CAUCHY-RiEMANNschen Differentialgleichung ermittelt werden* f du 7 . , . dtp (du d r du , \ , . ^ „ = /-„„ + „(*) mt £ = -^- + -J-dyj A4 6) Analog kann u ermittelt werden, wenn v bekannt ist. 14.1.2.3 Eigenschaften analytischer Funktionen 1. Betrag einer analytischen Funktion Für den Betrag oder Absolutbetrag einer analytischen Funktion, auch Modul genannt, gilt: \w\ = \f(z)\ = y/[u(x,y)]2 + [v(x,y)}2 = <p(x,y). A4.7) Die Fläche \w\ = (p(x, y) heißt ihr Relief, d.h., \w\ ist die Applikate zu jedem Punkt z = x + \y, also der Abstand von der z-Ebene
14 1 Funktionen einer komplexen Veränderlichen 695 ¦ A: Der Modul der Punktion sin z = sinx coshy + i cosx sinhy beträgt | sin z\ = y sin2 x + sinh2 y. Das Relief zeigt die Abb. 14.2a ¦ B: Das Relief der Funktion w = e1//z zeigt die Abb.14.2b Die Reliefs vieler analytischer Funktionen sind in [14 8] abgebildet Abbildung 14 2 2. Nullstellen Da der Absolutbetrag einer Funktion positiv ist, liegt das Relief stets oberhalb der z-Ebene, ausgenommen alle Punkte, in denen \f(z)\ = 0 gilt, also f(z) = 0 Man nennt z-Werte, für die f(z) = 0 ist, die Nullstellen der Funktion f(z). 3. Beschränktheit Eine Funktion heißt in einem gegebenen Gebiet beschränkt, wenn die Bedingung |/(z) | < N erfüllt werden kann, wobei N eine konstante positive Zahl N ist. Im entgegengesetzten Falle, wenn es keine derartige Zahl N gibt, heißt die Funktion nicht beschränkt 4. Satz über den Maximalwert Wenn w = f(z) in einem abgeschlossenen Gebiet eine analytische Funktion ist, dann liegt das Maximum ihres Betrages auf dem Rande 5. Satz über die Konstanz (Satz von Liouville) Wenn w = f(z) in der gesamten Ebene analytisch und beschränkt ist, dann ist diese Funktion eine Konstante f(z) = const. 14.1.2.4 Singulare Punkte Wenn eine Funktion w = f(z) in der Umgebung eines Punktes z = a analytisch ist, d.h. im Innern eines beliebig kleinen Kreises mit dem Mittelpunkt a, ausgenommen a selbst, dann hat / eine Singularität in a Es gibt drei Typen von Singularitäten: 1. f(z) ist beschränkt in der Umgebung von a. Dann existiert der Grenzwert w = lim f(z) Setzt man f(a) = w, dann wird f(z) analytisch auch in a In diesem Falle hat / eine hebbare Singularität in a (s. 14.3 5 1, S 715) (Analogie zur hebbaren Singulatität einer Funktion einer reellen Veränderlichen s 2 1 5 3,3., S 59 ) 2. Gilt lim |/B)| = 00 , dann hat / einen Pol (s 14.3.51, S. 715) Über Pole verschiedener Ordnung s 14.3.öVs. 715. 3. Hat / weder eine hebbare Singularität noch einen Pol, dann hat / eine wesentliche Singularität In diesem Falle existiert für jedes komplexe w eine Folge zn —> a mit f(zn) —» w ¦ A: Die Funktion w = besitzt im Punkt a einen Pol. z — a
696 14- Funktionentheorie ¦ B: Die Funktion w = e1^ besitzt im Punkt 0 einen wesentlich singulären Punkt (Abb. 14.2b) 14.1.3 Konforme Abbildung 14.1.3.1 Begriff und Eigenschaften der konformen Abbildung 1. Definition Unter einer konformen Abbildung versteht man die Abbildung der z- in die w-Ebene mit Hilfe einer analytischen Funktion w = f(z) in allen Punkten z , in denen f'(z) ^ 0 ist w = f(z) = u + iv, f'(z)?0. A48) Die konforme Abbildung besitzt die folgende Haupteigenschaft: ( dx\ Alle Linienelemente dz = ( , j im Punkt z erfahren bei der Überführung in Linienelemente dw = ( , 1 im Punkt w dieselbe Streckung im Verhältnis u = \f'(z)\ und dieselbe Drehung um den Winkel a = arg f'(z). Dadurch werden geometrische Gebilde in einem infinitesimalen Gebiet in ähnliche Figuren transformiert, behalten also ihre Form bei (Abb.14.3). Geometrische Gebilde endlicher Abmessungen werden zwar verzerrt dargestellt, die Schnittwinkel zwischen den Kurven bleiben aber erhalten, u.a. auch die Orthogonalität der Kurvenscharen (Abb. 14.4). .^fcj, x 0 b) Abbildung 14.3 Abbildung 14.4 Hinweis: Konforme Abbildungen haben in der Physik, Elektrotechnik, Hydro- und Aerodynamik sowie in anderen Anwendungsgebieten der Mathematik weite Verbreitung gefunden. 2. Konforme Abbildung durch affine Differentialtransformation Die Zuordnung zwischen dz und dw geschieht durch die affine Differentialtransformation du , du , du = — dx + — dy ox dy und in Matrizenschreibweise dw = Adz mit A dv . dv . dv = — dx + — dy dx dy = (u* uv\ \VXVy) A4.9a) A4 9b) Wegen der CAUCHY-RlEMANNschen Differentialgleichungen hat A die Gestalt der Drehungs-Strek- kungsmatrix mit a als Streckungsfaktor (s 35.2.2,2.,S. 196). . (ux —vx \ _ / cos a —sin a \ = \vx ux ) ~ \sina cosay ux = vy = a cos a, —uv = vx = a sin a, A4 10b) A4.10d) A4 10a) * = l/'tol = ^l + ul = jvl + vl, A4 10c) a = arg f(z) = arg (ux + ivx). A4 10e)
14-1 Funktionen einer komplexen Veränderlichen 697 3. Orthogonale Systeme Die Koordinatenlinien x — const und y = const der z-Ebene werden durch konforme Abbildungen in zwei orthogonale Kurvenscharen transformiert Allgemein kann mit Hilfe der analytischen Funktionen eine Vielfalt orthogonaler Systeme krummliniger Koordinaten generiert werden. In der Umkehrung gilt, daß zu jeder konformen Abbildung ein orthogonales Kurvennetz existiert, das in ein orthogonales kartesisches Koordinatensystem abgebildet wird ¦ A: Im Falle u = 2x + y , v = x + 2y (Abb. 14.5) ist die Orthogonalität gestört. b) Abbildung 14 5 ¦ B: Im Falle w = z2 bleibt die Orthogonalität erhalten, ausgenommen den Punkt z = 0 wegen w' = 0 Die Koordinatenlinien gehen in zwei Scharen konfokaler Parabeln über (Abb. 14.6), der 1 Quadrant der z-Ebene in die obere Hälfte der u>-Ebene Abbildung 14.6 14.1.3.2 Einfachste konforme Abbildungen In diesem Abschnitt werden neben den Transformationen und ihren wichtigsten Eigenschaften die Kurvenbilder isometrischer Netze der 2-Ebene angegeben, d.h. solcher Netze, die in ein orthogonales kartesisches Netz der w Ebene übergehen. Dabei sind die Ränder solcher ^-Gebiete durch Schraffur gekennzeichnet, die auf die obere Hälfte der w-Ebene abgebildet werden Schwarz dargestellte Gebiete gehen durch die konforme Abbildung in ein Quadrat der u>-Ebene mit den Koordinateneckpunkten @,0), @,1), A,0) und A,1) über (Abb.14.7) 1. Lineare Funktion Für die konforme Abbildung in der Form der linearen Transformation w = az + b A4 IIa) kann die Transformation in den drei Schritten durchgeführt werden: a) Drehung der Ebene um den Winkel a = arga gemäß: w\ = eiaz , A4 IIb) b) Streckung mit dem Faktor \a\ Wz = \a\wi, A4 11c)
698 14 Funktionentheorie c) Parallelverschiebung um b: ¦w2 + b. A4.11d) Insgesamt geht dabei jede Figur in eine geometrisch ähnliche Figur über. Die Punkte z\ = oo und z2 — für a 7^ 1, b ^ 0 gehen in sich selbst über und heißen deshalb Fixpunkte. Die Abb. 14.8 1 — a zeigt das orthogonale Netz, das in das orthogonale kartesische Netz übergeht. y 0> u Abbildung 14.7 yt y^\^K V-P<? ^•^v» "^\nx X Abbildung 14.8 Abbildung 14 9 2. Inversion Bei der Inversion genannten konformen Abbildung 1 A4 12) geht ein Punkt z der 2-Ebene mit dem Radius r und dem Argument ip in einen Punkt w der w-Ebene mit dem Radius 1/r und dem Argument —(p über. Die orthogonalen Netze der Transformation zeigt Abb.14.9. Die Transformation A4.12) beschreibt eine Spiegelung am Einheitskreis und eine Spiegelung an der reellen Achse (Abb. 14.10). Kreise gehen in Kreise über, wobei Geraden als Grenzfälle zu den Kreisen gerechnet werden (Radius —* oo) Wegen \w\ = l/\z\ geht der Einheitskreis der z-Ebene in den Einheitskreis der u>-Ebene über Alle Punkte im Innern des Einheitskreises |<z| = 1 werden zu Punkten des Außengebietes von \w\ = 1 und umgekehrt (Abb.14.11). Der Punkt z = 0 geht in w = oo über Die Punkte 2 = 1 und z — —\ sind Fixpunkte. Hinweis: Allgemein wird eine geometrische Transformation als Spiegelung an einem Kreis mit dem Radius r bezeichnet, wenn ein Punkt P2 mit dem Radius r2 im Innern des Kreises mit dem Radius r auf einen Punkt Px auf der Verlängerung des gleichen Radiusvektors OP außerhalb des Kreises abgebildet wird und für den Radius OF = r\ = r2/r2 gilt (Abb. 14.10). Punkte, die im Innern des Kreises liegen, werden zu äußeren Punkten und umgekehrt. 3. Gebrochenlineare Funktion Für die konforme Abbildung in der Form der gebrochenlinearen Funktion az + b w = ; cz + d kann die Transformation in drei Schritte zerlegt werden: a) Lineare Funktion w\ = cz + d. 1 b) Inversion w2 — Wi c) Lineare Funktion o bc — ad - H w2 c c A4 13a) A4 13b) A4 13c) A4 13d)
14-1 Funktionen einer komplexen Veränderlichen 699 Es werden wieder Kreise in Kreise überführt (Kreisverwandtschafl), wobei Geraden als Kreise mit r —> oo aufgefaßt werden. Fixpunkte dieser konformen Abbildung sind die beiden Punkte, die der quadratischen Gleichung z — az + b —— genügen. cz-\- d Abbildung 14.10 Abbildung 14.11 Sind die Punkte z\ und z2 Spiegelpunkte in bezug auf den Kreis K\ der z-Ebene, dann sind ihre Bildpunkte w\ und w2 in der iu-Ebene ebenfalls Spiegelpunkte in bezug auf den Bildkreis K2 von K\. Das orthogonale Netz, das in das orthogonale kartesische Netz der w-Ebene übergeht zeigt Abb.14.12. Abbildung 14.12 Abbildung 14.13 Abbildung 14.14 4. Quadratische Funktion Die konforme Abbildung mittels der quadratischen Funktion w = z2 A4.14a) lautet in Polarkoordinaten und als Funktion von x und y: w = p2e[2if, A4.14b) w = u + 'w = x2 -y2 + 2ixy. A4.14c) Aus der Darstellung in Polarkoordinaten ist ersichtlich, daß bereits die obere Hälfte der z-Ebene auf die volle w-Ebene abgebildet wird, d.h., die gesamte z-Ebene geht in die zweifach überdeckte w-Ebene über. Die Darstellung in kartesischen Koordinaten zeigt, daß die Koordinaten der w-Ebene u = const und v = const aus den in der z-Ebene zueinander orthogonalen Hyperbelscharen x2 — y2 = u und 2xy = v hervorgehen (Abb. 14.13). Fixpunkte dieser konformen Abbildung sind z = 0 und z = 1 An der Stelle z = 0 ist die Abbildung nicht konform.
700 14- Funktionentheorie 5. Quadratwurzel Die konforme Abbildung in der Form der Quadratwurzel aus z , w = ^z, A415) überführt die gesamte z-Ebene entweder in die obere oder untere Halbebene der w -Ebene, d.h , die Funktion ist doppeldeutig. Die Koordinaten der w-Ebene gehen aus zwei zueinander orthogonalen Scharen konfokaler Parabeln mit dem Brennpunkt im Nullpunkt der z-Ebene und mit der positiven bzw negativen reellen Koordinatenhalbachse als Achse hervor (Abb. 14.14) Fixpunkte der Abbildung sind z = 0 und z = 1 Im Punkt z = 0 ist die Abbildung nicht konform 6. Summe aus linearer und gebrochenlinearer Funktion Die konforme Abbildung ¦!(»;) (k const, reell; k > 0) kann mit Hilfe der Polarkoordinatendarstellung z gemäß A4.8) zu p+\ COS (f , smip A4.16a) p el f und Trennung von Real- und Imaginärteil A4 16b) umgeformt werden Kreise mit p ¦ Ellipsen -5- + TT = 1 mit a z a2 b2 po = const der z-Ebene (Abb. 14.15a) gehen in die konfokalen JP0 + - 2 V Po Po- A4 16c) der w-Ebene über (Abb. 14.15b) Brennpunkte sind die Punkte ±k der reellen Achse. Für den Ein- heitskreis mit p = po — 1 entartet die Ellipse der w-Ebene in die zweifach durchlaufene Strecke (—fc, +fc) der reellen Achse. Sowohl das Innere als auch das Äußere des Einheitskreises wird auf die volle w-Ebene mit dem Schnitt (—k, -\-k) abgebildet, so daß die Umkehrfunktion zweideutig ist w + y/w2 — k2 2 = 1 Die Geraden (p — (pQ der z-Ebene (Abb. 14.15c) werden in die konfokalen Hyperbeln u2 iP" — - — = 1 mit öl = k cos (p0 , ß = k sin <p0 a.2 ß2 mit den Brennpunkten ±k abgebildet (Abb.14.15d) Die den Koordinatenhalbachsen der z-Ebene durchlaufenen Intervalle (—00 , A4 16d) A4 16e) — , 7T, -7T) entsprechenden Hyperbeln arten in die Achse u = 0 und in die hin und zurück -k) und (k , 00) der reellen Achse aus. Abbildung 14 15
14-1 Funktionen einer komplexen Veränderlichen 701 yjjp=i Abbildung 14.15 Abbildung 14.16 7. Logarithmus Die konforme Abbildung in der Form der Logarithmusfunktion w = Lnz A4.17a) lautet in Polarkoordinaten: M = lnp, v = (p + 2hir (ifc = 0,±l,±2, ). A4 17b) Aus der Darstellung in Polarkoordinaten erkennt man, daß die Koordinatenlinien u = const und v = const aus den konzentrischen Kreisen um den Nullpunkt der z-Ebene und aus den Strahlen, die durch den Nullpunkt der 2-Ebene verlaufen, hervorgehen (Abb. 14.16) Das isometrische Netz ist ein polares Netz. Die Logarithmusfunktion Lnz ist unendlich vieldeutig (s A4.73c) in 14.5.2,2., S 721) Beschränkt man sich auf den Hauptwert In z von Lnz (—tt < v < +7r), dann geht die gesamte z- Ebene in einen Streifen der w-Ebene über, der von den Geraden v — ±7r begrenzt wird, wobei die Gerade v = +7r mit eingeschlossen ist. (u,v) 0 b) Abbildung 14 17 8. Exponentialfunktion Die konforme Abbildung in der Form der Exponentialfunktion (s. auch 14.5.2,1., S. 720) w = ez A4 18a) lautet in Polar koordinaten. w = peixp. A4.18b) Mit z = x + i y folgt* p = ex und 1p = y. A4 18c) Wenn y die Werte von —ir bis +7r durchläuft und x von — oo bis +oo variiert, dann durchläuft p die Werte 0 bis oo und ip von — tt bis n . Ein Parallelstreifen der Breite 27r der z-Ebene wird auf die gesamte w-Ebene abgebildet (Abb.14.17) 9. Schwarz-Christoffel-Formel Durch die SjCHWARZ-CHRiSTOFFELsche Formel : = C,/ dt {t-w1)^{t-w2)a*'--(t-wn)a ¦ + C2 A4.19a) wird das Innere eines Polygons mit den n Außenwinkeln oji7t, a27r, .., an7r der 2-Ebene auf die obere tu-Halbebene abgebildet (Abb.l4.18a,b). Mit W{ sind die den Ecken des Polygons zugeordneten Punkte der reellen Achse der w-Ebene bezeichnet, mit t die Integrationsvariable. Der orientierte, also durch eine Richtung ausgezeichnete Rand des Polygons geht bei der Abbildung in die orientierte reelle Achse der u>-Ebene über. Für große Werte von t verhält sich der Integrand wie 1/t2 und ist im Unendlichen regulär.
702 14 Funktionentheorie Abbildung 14.18 Da die Summe aller Außenwinkel eines n-Ecks gleich 2ir ist, gilt: n £ a„ = 2 . A4 19b) u=\ Die komplexen Konstanten C\ und C2 bewirken eine Drehstreckung und eine Verschiebung, hängen aber nicht von der Form, sondern nur von Größe und Lage des Polygons in der 2-Ebene ab. Ist ein Polygon vorgegeben, dann lassen sich drei Punktepaare Zi,Wi (i = 1, 2,3) willkürlich zuordnen Ordnet man einem Eckpunkt des Polygons in der z-Ebene, z.B. z = Zi, einen unendlich fernen Punkt der w-Ebene, also w\ = ±oo zu, dann ist der Faktor (t—Wi)ai wegzulassen Wenn das Polygon ausartet. z.B. dadurch, daß sich ein Eckpunkt im Unendlichen befindet, dann ist der zugehörige Außenwinkel gleich 7T, also a^ = 1, d.h., das Polygon wird zum Halbstreifen. Abbildung 14.19 ¦ A: Für die Abbildung des in Abb. 14.19a skizzierten Gebietes der 2-Ebene wird die in der nebenstehenden Tabelle für £ au = 2 angegebene Zuordnung dreier Punkte gewählt (Abb.l4.19a,b). Die Abbildungsformel lautet* z = C\ I - _1/2 = 2Ci (y/w — arctan v^J = i— (y/ü) — arctan y/wj . A B C Zu 00 0 CO 0LV 1 -1/2 3/2 wv -1 0 00 pe* 1 zu setzen- \d - ¦- d lim / -l + pe1^) ipe[<f>d<p pe[f> ¦¦Cm, Bei der Bestimmung von C\ ist t ¦ d.h,Ci = i-. TT Daß die Konstante Ci — 0 ist, geht aus der Zuordnung „z = 0 —? w — 0" hervor ¦ B: Abbildung eines Rechtecks Eckpunkte des abzubildenden Rechtecks seien 2lf4 = ±K, 22,3 = ±K + \K'. Die Punkte Z\ und z2 sollen in die Punkte w\ — 1 und w2 = 1/fc mit @ < k < 1) der reellen Achse übergehen, zA und 23 sind Spiegelpunkte zu z\ und z2 bezüglich der imaginären Achse Nach dem SCHWARZschen Spiegelungsprinzip (s. 14.1.3 3, S. 703) müssen ihnen die Punkte it>4 = —1 und tü3 = — 1/k entsprechen (Abb.l4.20a,b). Damit lautet die Abbildungsformel für ein Rechteck (a\ = «2 = <*3 = CK4 = 1/2) der oben skizzierten Lage: z = C\ I Jo yj{t - wi)(t - w2)(t - w3)(t - w4)
14-1 Funktionen einer komplexen Veränderlichen 703 Ci [ dt »('-i) . Punkt z = 0 entspricht Punkt u; = 0 und Punkt z = \K Punkt w = oo rw Mit Ci = 1/fc wird z = / dt ^/(l - ^2)A — A;2t2) ^ y/l-k2sm2-d 7o dtf F(y>, fc) (Substitution- t ¦¦ sin??, w = siiap) F(<p, fc) ist das elliptische Integral 1. Gattung (s. 8.1.4.3, S. 453). Daß die Konstante C2 = 0 ist, geht aus der Zuordnung „z = 0 —» u; = 0" hervor. Z3 Z*, 0 Y' 0 i z2 ,Zl , X vi T -1 b) w40 Abbildung 14.20 14.1.3.3 Schwarzsches Spiegelungsprinzip 1. Sachverhalt Ist eine komplexe Punktion f(z) in einem Gebiet G analytisch, zu dessen Rand ein Stück einer Geraden gi gehört, ist sie auf g\ stetig und bildet sie die Gerade g\ auf eine Gerade g[ ab, dann werden Punkte, die symmetrisch zu g\ liegen, auf Punkte abgebildet, die symmetrisch zu g[ liegen (Abb.14.21) ^ Quelle ^Quelle 'G'\ ^ ^ —^^ Rand Abbildung 14.21 Quelle Abbildung 14.22 Senke Abbildung 14.23 2. Anwendungen Die Anwendung dieses Prinzips vereinfacht die Berechnung und Darstellung von ebenen Feldern mit geradlinigen Begrenzungen: Ist der gerade Rand eine Stromlinie (isolierender Rand in Abb. 14.22), dann sind alle Quellen als Quellen, alle Senken als Senken und alle Wirbel als entgegengesetzt drehende Wirbel zu spiegeln. Ist der gerade Rand eine Potentiallinie (stark leitender Rand in Abb. 14.23), dann sind alle Quellen als Senken, alle Senken als Quellen und alle Wirbel als gleichsinnig drehende Wirbel zu spiegeln 14.1.3.4 Komplexe Potentiale 1. Begriff des komplexen Potentials Es wird ein Feld V = V(x, y) in der x, y-Ebene mit den stetigen und differenzierbaren Komponenten vx(x, y) und vy(x, y) des Vektors V für den quellenfreien und den wirbelfreien Fall betrachtet. -* UV UV a) Quellenfreies Feld mit div V = 0, d.h., -^- + —- = 0* Das ist die Integrabilitätsbedingung für dx oy die Differentialgleichung der Feld- oder Stromfunktion &(x,y) d\P = —vv dx + vx ¦- 0, A4.20a) und es gilt vx = — , dx ' A4.20b) Für zwei Punkte Pi, P2 des Feldes V ist die Differenz \P(P2) - &(P\) ein Maß für den Vektorfluß durch
704 14- Funktionentheorie eine Kurve, die die Punkte P\ und P^ verbindet, falls diese Kurve ganz im Feld verläuft -* -? öv uv b) Wirbelfreies Feld mit rot V = 0 , d h , — -^ = 0: Das ist die Integrabiltätsbedingung für dx dy die Differentialgleichung der Potentialfunktion $(x, y) - vx dx + vy dy = 0 , A4.21a) d$ d$ und es gilt vx = -p— , vv = -^- . A4 21b) dx oy Die Funktionen 0 und & genügen den Cauchy- RiEMANNschen Differentialgleichungen (s 14 1 2 1. S 694), und jede für sich erfüllt die LAPLACEsche Differentialgleichung (A 0 = 0 , A & = 0) Man faßt <P und ^ zu der analytischen Funktion W = f{z)=$(xiy) + iV{x,y) A4 22) zusammen und bezeichnet diese Funktion als komplexes Potential des Feldes V Danach ist — <P(x, y) das Potential des Vektorfeldes V im Sinne der in der Physik und Elektrotechnik üblichen Bezeichnungsweise (s 13 3 1 6, Hinweis S. 683) Die Linien & und 0 bilden ein orthogonales Netz Für die Ableitung des komplexen Potentials und den Feldvektor V gelten die Beziehungen: dW dz dx dy dW dz = f'{z) =VX + Wy A4 23) 2. Komplexes Potential des homogenen Feldes Die Funktion W = az A4 24) liefert bei reellem a das komplexe Potential eines Feldes, dessen Potentiallinien parallel zur y-Achse und dessen Feldlinien parallel zur x Achse verlaufen (Abb. 14.24). Für komplexes a ergibt sich lediglich eine Drehung des Feldes (Abb. 14.25) -+- vP=const 0=const Abbildung 14 24 4/=const O=const Abbildung 14.25 3. Komplexes Potential von Quelle und Senke Das komplexe Potential eines Feldes, das durch eine Quelle der Ergiebigkeit e > 0 im Punkt z = z0 erzeugt wird, lautet W = —\n(z-z0) Für eine Senke der gleichen Intensität gilt: A4 25) W = -—\n(z-zo). Z7T A4.26)
14-1 Funktionen einer komplexen Veränderlichen 705 Die Feldlinien verlaufen radial vom Punkt z = zq aus, während die Potentiallinien konzentrische Kreise um den Punkt z0 bilden (Abb. 14.26) 4. Komplexes Potential eines Quelle-Senke-Systems Für eine Quelle im Punkt z\ und eine Senke im Punkt z2, beide mit gleicher Intensität, ergibt die Überlagerung das komplexe Potential W = — In — 2tt z- z2 A4.27) Die Potentiallinien # = const bilden Apollonische Kreise bezüglich z\ und z2, die Feldlinien & = const stellen Kreise durch z\ und z2 dar (Abb. 14.27). 4/=const 0=const ¥=const G>=const Abbildung 14.26 Abbildung 14 27 5. Komplexes Potential des Dipols Das komplexe Potential eines Dipols mit dem Dipolmoment M > 0 im Punkt z0 , dessen Achse mit der reellen Achse den Winkel a bildet (Abb.14.28), lautet W - Meic 2ir(z - Zq) A4.28) 6. Komplexes Potential eines Wirbels Wenn \r\ die Intensität eines Wirbels für reelles r ist und sich sein Zentrum im Punkt zQ befindet, gilt. W=—\n(z-z0). Z7T1 A4.29) Im Vergleich zu Abb. 14.26 sind die Rollen von Feld- und Potentiallinien vertauscht. Für komplexes r ergibt A4 29) das Potential einer Wirbelquelle, deren Feld- und Potentiallinien je eine Spiralenschar liefern, die zueinander orthogonal verlaufen (Abb. 14.29). 14.1.3.5 Superpositionsprinzip 1. Superposition komplexer Potentiale Ein von mehreren Quellen, Senken und Wirbeln erzeugtes Feld ergibt sich rechnerisch durch additive Überlagerung der durch sie erzeugten Einzelfelder, d h durch Addition ihrer komplexen Potentiale bzw. Stromfunktionen. Mathematisch gesehen ist das durch die Linearität der LAPLACEschen Differentialgleichungen A $ = 0 und A $ = 0 möglich 2. Erzeugung neuer Felder 1. Integration Die Erzeugung neuer Felder aus den komplexen Grundpotentialen kann außer durch Addition auch durch Integration mit Hilfe von Belegungsfunktionen erfolgen. ¦ Auf einem Linienstück / sei eine Wirbelbelegung mit der Dichte g(s) vorgegeben. Für die Ableitung des komplexen Potentials ergibt sich dann ein Integral vom CAUCHYschen Typ (s. 14 2 3, S 711): dW_ = J_ r g(s)ds = 1 r g*(Q dz 2iriJ z-C(s) 2m J z - ( c A4.30)
706 14 Funktionentheorie Abbildung 14.28 Abbildung 14 29 wobei f (s) die komplexe Parameterdarstellung der Kurve l mit der Bogenlänge s als Parameter ist 2. Maxwellsches Diagonal verfahren Sind zwei Felder mit den Potentialen $i und #2 zu überlagern, dann zeichnet man ihre Potentiallinienbilder [[$i]] und [[#2]] derart, daß von einer Potentiallinie zur nächsten der Wert des Potentials in beiden Systemen um denselben Wert h springt, und orientiert die Linien so, daß die höheren <£-Werte jeweils zur Linken liegen In dem von [[#1]] und [[#2]] gebildeten Netz ergeben die Linien, die im Zuge der Maschendiagonalen verlaufen, das Potentiallinienbild [[#]] eines Feldes, dessen Potential # = #1 + <P2 oder $ = &i - <P2 ist Das Bild [[#1 4- $2]] erhält man, wenn die orientierten Maschenseiten gemäß Abb. 14.30a wie Vektoren addiert werden, das Bild [[#1 — #2]], wenn sie wie Vektoren subtrahiert werden (Abb.14.30b) Im zusammengesetzten Bild springt der Wert des Potentials beim Übergang von einer Potentiallinie zur nächsten ebenfalls um den Wert h (Stufenwert). 02+h 02+h Abbildung 14.30 ¦ Feld- und Potentiallinienbild einer Quelle und einer Senke mit dem Intensitätsverhältnis |ei|/|e2| = 3/2 (Abb.l4.31a,b). 14.1.3.6 Beliebige Abbildung der komplexen Zahlenebene Eine Funktion w = f(z = x + \y) = u(x,y) + \v(x,y) A4.31a) gilt als definiert, wenn die zwei Funktionen u = u(x,y) und v = v(xiy) reeller Veränderlicher definiert und bekannt sind. Die Funktion f(z) braucht nicht analytisch zu sein, wie das bei der konformen Abbildung gefordert wird. Die Funktion w definiert eine neue komplexe Zahlenebene. Man sagt, sie bildet die 2-Ebene in die w-Ebene ab, d h , jeder Punkt zu wird in einem ihm entsprechenden Punkt wv abgebildet a) Transformation der Koordinatenlinien Koordinatenlinien transformieren sich gemäß y = c —? u = u(x, c), v = v(x, c), x ist Parameter ; x = C\ —? u = it(ci, y), v = v(ci,y), y ist Parameter A4 31b)
14-2 Integration im Komplexen 707 a) b) Abbildung 14 31 b) Transformation geometrischer Gebilde Geometrische Gebilde wie Kurven oder Gebiete der z- Ebene transformieren sich zu Kurven oder Gebieten der u>-Ebene, also zu gleichartigen geometrischen Gebilden. x = x(t), y = y(t) —? u = u(x(t),y(t)), v = v(x(t),y(t)), t ist Parameter A4 31c) ¦ Für u = 2x + y,v = x + 2y gehen die Geraden y = c über in u = 2x + c, v = x + 2c, also in die u 3 Geraden v = - + -c Die Geraden x = c\ gehen über in die Geraden v = 2u — 3ci (Abb.14.5) Die schraffierte Fläche in Abb. 14.5a wird auf die schraffierte Fläche in Abb. 14.5b abgebildet c) Riemannsche Fläche Ist die Funktion w = f(z) mehrdeutig, wie z.B. die Funktionen Vfz, Ln2 , Aresin z, Arctan z, so erfolgt die Abbildung auf eine entsprechende Anzahl übereinander liegender Ebenen. Jedem Funktionswert der z- Ebene entspricht ein Punkt auf einer dieser Ebenen. Die Ebenen sind durch Kurven miteinander verbunden; ihre Gesamtheit wird mehrblättrige RiEMANNsc/ie Fläche genannt (s. [14.16]). ^u ¦ w = \ß: Überstreicht der Radiusvektor z = re1<p ^—^^ die volle z-Ebene, d.h. 0 < </? < 2n , dann überstreicht /^¦'''' ,'-^ ^y£> ""~""^^\ der zugehörige Radiusvektor w = ge1^ = y/re^2 , d.h. v['r~ ~ ~ ~ ~ - - J^-'~'SS^k^S ^ 0 < ^ < 27T, nur die obere u>-Halbebene. Erst bei ei- VV v^^iS-^^' yj nem zweiten Durchlauf der z -Ebene wird die volle w- ^^>^>^ -^jp^"*''' ^*^^^ Ebene durchlaufen Diese Zweideutigkeit von w = y/z ^^^TpQgff "^^^^^ bezüglich z wird dadurch behoben, daß man zwei z- Ebenen übereinanderlegt und längs der aufgeschnitte- Abbildung 14.32 nen negativen reellen Achse gemäß Abb. 14.32 miteinander verbindet. Die so entstehende Fläche heißt RiEMANNsche Fläche der Funktion w = y/z Der Nullpunkt heißt Verzweigungspunkt. Der Wertevorrat von w = yfz liegt in entsprechender Weise auf der zweiblättrigen RiEMANNschen Fläche ausgebreitet 14.2 Integration im Komplexen 14.2.1 Bestimmtes und unbestimmtes Integral 14.2.1.1 Definition des Integrals im Komplexen 1. Bestimmtes komplexes Integral Die Funktion f(z) sei stetig in einem Gebiet G, in dem eine Kurve K die Punkte A und B verbinden soll Die Kurve K wird zwischen den Punkten A und B durch
708 14- Funktionentheorie beliebige Teilpunkte z\ in n Teilbogen zerlegt (Abb. 14.33). Vi Auf jedem Teilbogenstück greift man einen Punkt Q heraus und bildet n X)/(Ci)^«i mit Azi = Zi-Zi-i A4.32a) Existiert der Grenzwert lim^/^)^ A4.32b) "ff n—>oo *¦—' t=l mit A zi —> 0 für n —> oo unabhängig von der Wahl der Abbildung 14.33 Zwischenpunkte Q , dann wird durch diesen Grenzwert das bestimmte komplexe Integral B 1= I f(z)dz = (K)jf(z)dz A4.33) ^ A AB längs der Kurve K zwischen den Punkten A und B , dem Integrationsweg, definiert 2. Unbestimmtes komplexes Integral Ist das bestimmte Integral vom Integrationsweg unabhängig (s 14.2.2, S 710), so gilt: F(z) = f f{z)dz + C mit F'{z) = f(z) A4.34) Dabei ist C eine im allgemeinen komplexe Integrationskonstante Die Funktion F(z) wird unbestimmtes komplexes Integral genannt. Die unbestimmten Integrale der elementaren Funktionen einer komplexen Veränderlichen werden nach den gleichen Formeln berechnet wie die Integrale der entsprechenden Elementarfunktionen einer reellen Veränderlichen. A: I sinzdz = -cosz + C. ¦ B: /ezdz = ez + C. usammenhang von bestimmtem und ang zwischen dem bestimmten und unbest B J f(z) dz = J f(z) dz = F(zB) - F(zA) 3. Zusammenhang von bestimmtem und unbestimmtem komplexen Integral Der Zusammenhang zwischen dem bestimmten und unbestimmten komplexen Integral wird durch die Formel B A4 35) A AB vermittelt. 14.2.1.2 Eigenschaften und Berechnung komplexer Integrale 1. Vergleich mit dem Kurvenintegral 2. Art Das bestimmte komplexe Integral besitzt die gleichen Eigenschaften wie das Kurvenintegral 2. Art (s. 8 3.2, S 482): a) Umkehrung der Richtung des Integrationesweges führt zur Vorzeichenänderung des Integrals. b) Bei Zerlegung des Integrationsweges in mehrere Teilabschnitte ist der Wert des gesamten Integrals gleich der Summe der Integral werte über die einzelnen Teilwege. 2. Abschätzung des Integralwertes Wenn die Funktion f(z) für die z-Werte des Integrationsweges AB mit der Länge s eine positive Zahl M nicht übertrifft, dann gilt. //« dz <Ms mit \f(z)\<M. A4.36)
14-2 Integration im Komplexen 709 3. Berechnung komplexer Integrale in Parameter darstellung Sind der Integrationsweg AB (oder die Kurve K) in der Form x = x(t), y = y(t) A4 37) und die t-Werte für den Anfangs- und den Endpunkt als tA und tß gegeben, dann kann das komplexe bestimmte Integral über zwei reelle Kurvenintegrale berechnet werden Dazu wird der Integrand in Real- und Imaginärteil aufgespaltet, und man erhält B B B (K) / f(z) dz = (udx — v dy) + i (v dx + u dy) A A A tß tß = f[u(t)x'(t) - v(t)y'{t)\ dt + i f[v{t)x'(t) + u(t)y'(t)] dt A4 38a) tA tA mit f(z) = u(x,y) + \v{x,y), z = x + iy. A4 38b) fB Die Schreibweise (K) / f(z) dz bedeutet, daß das bestimmte komplexe Integral längs der Kurve K Ja zwischen den Punkten A und B zu berechnen ist. Häufig wird für denselben Sachverhalt die Schreibweise / f(z)dz bzw. / f{z)dz verwendet. AB (z — Zo)n dz (n € Z) Die Kurve K sei ein Kreis mit dem Radius r0 um den Punkt z0: -/<¦ (K) x = xo + r0 cos t, y = y0 + r0 sin t mit 0 < t < 2n Dann gilt für alle Punkte z der Kurve K z = x + \y = Zq + r0(cos t + isin t), dz = r0(— sin t + icost) dt. Durch Einsetzen dieser Werte und eine f-2-K Umformung nach der Formel von Moivre erhält man. / = rj+1 / (cos n£+i sin nt)(— sin t+i cos t) dt Jo = r0"+1 /o2'[i cos(n + l)t - sm(n + l)t] dt = { ^. g£ lt~_\\ 4. Unabhängigkeit vom Integrationsweg Das Integral A4 33) einer Funktion einer komplexen Veränderlichen, die in einem einfach zusammenhängenden Gebiet definiert ist und die zwei feste Punkte A(za) und B(zb) miteinander verbindet, kann unabhängig vom Integrationsweg sein Notwendige und hinreichende Bedingung dafür ist, daß die Funktion in diesem Gebiet analytisch ist, d h , daß sie den CAUCHY-RlEMANNschen Differentialgleichungen A4.4) genügt. Dann gilt A4.35). Ein einfach zusammenhängendes Gebiet besitzt eine einzige geschlossene, doppelpunktfreie Randkurve. 5. Komplexes Integral über einen geschlossenen Weg Wenn die Integration einer Funktion f(z), die in einem einfach zusammenhängenden Gebiet analytisch ist, über einen geschlossenen Integrationsweg K erfolgt, der dieses Gebiet begrenzt, dann ist der Wert des Integrals gemäß dem Integralsatz von Cauchy gleich Null (s 14 2 2, S. 710)- f{z)dz = 0. A4.39) Wenn dieses Gebiet singulare Punkte enthält, dann ist der Wert des Integrals mit Hilfe des Residuensatzes zu berechnen (s 14.3.5.5, S 716). ¦ Für die Funktion f(z) = mit einem singulären Punkt bei z = a ergibt sich der Wert des z — a Integrals für den geschlossenen, im Gegenuhrzeigersinn um a durchlaufenen Weg (Abb. 14.34) zu
710 14. Funktionentheorie dz = 2?ri. (K) 14.2.2 Integralsatz von Cauchy, Hauptsatz der Funktionentheorie 14.2.2.1 Integralsatz von Cauchy für einfach zusammenhängende Gebiete Wenn eine Funktion f(z) in einem einfach zusammenhängenden Gebiet analytisch ist, dann gelten die folgenden zwei äquivalenten Aussagen: a) Das über eine geschlossene Kurve K erstreckte Integral ist gleich Null. <ff(z)dz = 0. A4.40) b) Der Wert des Integrals / f(z) dz ist unabhängig von der die Punkte A und B verbindenden Kur- Ja ve Dieser Sachverhalt wird Integralsatz von Cauchy, auch Hauptsatz der Funktionentheorie genannt 14.2.2.2 Integralsatz von Cauchy für mehrfach zusammenhängende Gebiete Wenn K, Ki, K2, ..., Kn einfach geschlossene Kurven derart sind, daß die Kurve K alle Kv [y — 1,2,..., n) einschließt, aber die Kv sich nicht gegenseitig einschließen oder schneiden, und wenn ferner f(z) in einem Gebiet G analytisch ist, das alle Kv und das Gebiet zwischen K und den Kv enthält, d h mindestens in dem in Abb. 14.35 schraffiert gezeichneten Gebiet, dann gilt <j> f(z)dz= j f(z)dz+ $ f{z)dz + . .+ $ f(z)dz, (K) A4 41) (Kl) (K2) (Kn) falls die Kurven K, Ki, .. , Kn sämtlich im gleichen Sinne, z.B. gegen den Uhrzeigersinn, durchlaufen werden. Dieser Satz dient zur Berechnung von Integralen über geschlossene Kurven K , die auch singulare Punkte der Funktion f(z) einschließen (s 14.3.5.5, S. 716). Abbildung 14.34 Abbildung 14.35 Abbildung 14 36 /z-\ —. dz ist zu berechnen, wobei K eine den Nullpunkt und den Punkt z = — 1 z(z + 1) (K) umschließende Kurve sein soll (Abb. 14.36) Nach dem Integralsatz von Cauchy kann man zunächst das Integral über K durch die Summe der Integrale über K\ und K2 ersetzen, wobei K\ ein Kreis um den Nullpunkt mit dem Radius r\ = 1/2 und K2 ein Kreis um den Punkt z = — 1 mit dem Radius r2 = 1/2 sein soll. Der Integrand läßt sich durch Partialbruchzerlegung vereinfachen, und man erhält
14 3 Potenzreihenentwicklung analytischer Funktionen 711 ¦1 z(z + 1) dz = 2 dz 2 dz z + l dz z dz = 0 + 47ri - 27ri - 0 = 27ri (Zur Integration (K) (Ki) (K2) {Kx) (K2) vergleiche man das Beispiel in 14.2.1.2,3., S. 709.) 14.2.3 Integralformeln von Cauchy 14.2.3.1 Analytische Funktion innerhalb eines Gebietes Ist f(z) auf einer geschlossenen Kurve K und in dem von ihr umschlossenen einfach zusammenhängenden Gebiet analytisch, dann gilt für jeden inneren Punkt z dieses Gebietes (Abb.14.37) die Darstellung (K) " /(O d( (Cauchysehe Integralformel), A4.42) wenn £ die Kurve K im Gegenuhrzeigersinn durchläuft Somit lassen sich die Funktionswerte einer analytischen Funktion im Innern eines Gebietes durch die Funktionswerte auf dem Rande des Gebietes ausdrücken Aus A4.42) ergeben sich Existenz und Integraldarstellung der n-ten Ableitung einer in einem Gebiet G analytischen Funktion: /<»>(*) = i^ <f -J^L-dC A4 43) J w 2?ri 7 (C - z)n+l s v ' (K) Eine analytische Funktion ist demnach beliebig oft differenzierbar. Im Unterschied dazu folgt im Reellen aus der einmaligen Differenzierbarkeit nicht die wiederholte Differenzierbarkeit. Die Gleichungen A4.42) und A4 43) werden CAUCHYsc/ie Integralformeln genannt. 0 Abbildung 14 37 Abbildung 14 38 14.2.3.2 Analytische Funktion außerhalb eines Gebietes Wenn eine Funktion f(z) im gesamten Teil der Ebene außerhalb des geschlossenen Integrationsweges K analytisch ist, dann werden die Werte der Funktion f(z) und ihrer Ableitungen in einem Punkt z dieses Gebietes mit Hilfe der gleichen CAUCHYschen Formeln A4 42), A4 43) dargestellt, aber die Kurve des geschlossenen Integrationsweges K ist nunmehr im Uhrzeigersinn zu durchlaufen (Abb. 14.38) Mit Hilfe der CAUCHYschen Integralformeln können die Werte einiger bestimmter reeller Integrale berechnet werden (s. 14.4, S. 717). 14.3 Potenzreihenentwicklung analytischer Funktionen 14.3.1 Konvergenz von Reihen mit komplexen Gliedern 14.3.1.1 Konvergenz einer Zahlenfolge mit komplexen Gliedern Eine unendliche Folge komplexer Zahlen z\, z2,..., zn, . hat den Grenzwert z (z = lim zn), wenn, beginnend bei einem gewissen n, die Ungleichung \z — zn\ < £ für eine beliebig kleine positive Zahl
712 14 Funktionentheorie e erfüllt werden kann. D.h. von einem gewissen n an liegen alle Punkte, die die Zahlen zn,zn+i, . darstellen, innerhalb eines Kreises mit dem Radius e und dem Mittelpunkt in z . ¦ Der Grenzwert lim { tyä} = 1 gilt für beliebiges a Unter dem Ausdruck { tya) versteht man hier den Wert der Wurzel, der das kleinste Argument besitzt (Abb. 14.39) i 2- 1 0 t a = za / ,*Va = z9 / s'l**~^ "^ = z3 v i y x , .2 i+* .2 .3 2 i+H IT" .2 .3 .4 i+k+h + i 2 4 8 0 fY i X Abbildung 14 39 Abbildung 14.40 14.3.1.2 Konvergenz einer unendlichen Reihe mit komplexen Gliedern Eine Reihe a\ + a2 H t-an-\ mit komplexen Gliedern an konvergiert gegen eine Zahl 5, die Summe der Reihe, wenn gilt. s= lim (ai + a2 H h an). A4.44) Verbindet man die Punkte, die durch die Zahlen sn = a\ + a2 + • • • + an in der 2-Ebene gegeben sind, durch einen Polygonzug miteinander, dann bedeutet Konvergenz der Reihe die Annäherung des Polygonzugendes an die Zahl s •2  '4 -2 -3 ¦ A:i + ^ + ^ + ^ + -.. ¦B:i+^ + ^ + ... (Abb.14.40). Man spricht von absoluter Konvergenz (¦ B), wenn auch die Reihe der Absolutbeträge ihrer Glieder |ai| + \a2\ + |a3| + • • • konvergiert, von bedingter Konvergenz (¦ A), wenn die Reihe konvergiert, die Reihe ihrer Absolutglieder jedoch divergiert. Wenn die Glieder einer Reihe gemäß /!(«) + /»(*) + ¦••+ /»(*) + • ' A4-45) variable Funktionen fi(z) sind, dann wird durch die Reihe für die 2-Werte eine Funktion von z definiert, für die die Reihe konvergiert. 14.3.1.3 Potenzreihen im Komplexen 1. Konvergenz Eine Potenzreihe im Komplexen hat die Gestalt P(z - z0) = a0 + ai(z - zq) + a2(z - z0J -\ \- an(z - z0)n + ¦ A4.46a) wobei zq ein fester Punkt der Zahlenebene ist und die Koeffizienten av reelle oder komplexe Konstanten sind Für Zq = 0 geht die Potenzreihe in die Form P{z) = a0 + axz + a2z2 + • • • + anzn + • • • A4 46b) über. Konvergiert die Potenzreihe P(z - z0) für einen Wert z\, dann konvergiert sie absolut und gleichmäßig für alle Punkte z jedes abgeschlossenen Kreises innerhalb des Kreises um z0 mit dem Radius r = \z1- z0\ 2. Konvergenzkreis Die Grenze zwischen dem Konvergenzbereich und dem Divergenzbereich einer Potenzreihe ist ein eindeutig bestimmter Kreis, der Konvergenzkreis. Man bestimmt seinen Radius wie im Reellen, falls die Grenzwerte lim 1 oder = lim n—KX> «n+1 A4 47)
14 3 Potenzreihenentwicklung analytischer Funktionen 713 existieren Wenn die Reihe überall divergiert, ausgenommen den Punkt z = z0 , dann ist r = 0 , konvergiert sie überall, dann ist r = oo Das Verhalten der Potenzreihe für Punkte auf dem Rand des Konvergenzkreises ist von Fall zu Fall zu untersuchen. oo zn ¦ Die Potenzreihe P(z) = Yl — mit dem Konvergenzkreisradius r — 1 divergiert für z = 1 (harmo- n=i n nische Reihe) und konvergiert für z = — 1 (nach dem Kriterium von LEIBNIZ für alternierende Reihen (s 7 2 3 3,1., S 426)) Auch für alle weiteren Punkte des Einheitskreises \z\ = 1 mit Ausnahme des Punktes z = 1 ist die Reihe konvergent 3. Ableitungen von Potenzreihen und Konvergenzkreis Jede Potenzreihe stellt innerhalb ihres Konvergenzkreises eine analytische Funktion f(z) dar. Die Ableitungen dieser Funktion erhält man durch gliedweise Differentiation der Potenzreihe. Die abgeleiteten Reihen haben denselben Konvergenzkreisradius wie die ursprüngliche Reihe 4. Integrale von Potenzreihen und Konvergenzkreis Die Potenzreihenentwicklung des Integrals / /(C) d( erhält man durch gliedweise Integration der Potenzreihe von f(z). Der Konvergenz- radius bleibt dabei erhalten 14.3.2 Taylor-Reihe Jede im Innern eines Gebietes G analytische Funktion f(z) kann für jeden Punkt z0 in G eindeutig in eine Potenzreihe der Form f(z) = Y^an(z- zQ)n (Taylor-Reihe) A4.48a) n=0 entwickelt werden, wobei der Konvergenzkreis der größte Kreis um zq ist, der noch ganz dem Gebiet G angehört (Abb. 14.41). Für die im allgemeinen komplexen Koeffizienten an der Potenzreihe gilt an = t^M, A4.48b) n\ Die TAYLOR-Reihe kann daher in der Form M = /(*) + ^(* - *) + ^(* - *oJ + • ¦ ¦ + ^^{z -*>)» + ... A4 48c) geschrieben werden. Innerhalb ihres Konvergenzkreises ist jede Potenzreihe die TAYLOR-Entwicklung ihrer Summenfunktion ¦ Beispiele für TAYLOR-Entwicklungen sind die Reihendarstellungen der Funktionen e2, sin 2, cos 2, sinh z und cosh z in 14 5 2, S. 720ff. Abbildung 14 41 Abbildung 14.42 Abbildung 14 43
714 14 Funktionentheorie 14.3.3 Prinzip der analytischen Fortsetzung Es wird der Fall betrachtet, daß die Konvergenzkreise K0 um z0 und K\ um z\ zweier Potenzreihen oo oo fo(z) = J2an(z-zo)n und fi(z) = y£bn(z-z1)n A4 49a) n=0 n=0 ein gewisses Gebiet gemeinsam haben (Abb. 14.42) und daß in diesem gilt: fo(z) = fi(z) A4 49b) Dann sind die beiden Potenzreihen die zu den Punkten z0 und z\ gehörenden TAYLOR-Entwicklungen ein- und derselben analytischen Funktion f(z). Die Funktion f\(z) heißt analytische Fortsetzung der nur in K0 definierten Funktion fo(z) in das Gebiet K\ hinein. oo ¦ Die geometrischen Reihen fo(z) = J^ zn mit dem Konvergenzkreis K0 (r0 = 1) um z0 = 0 und Tl=0 1 °° (z — \\n fi(z) = : Y^ (•; :) mrfc dem Konvergenzkreis K\ {t\ = y/2) um z\ — i haben jede in ih- 1 ~ 1 n=0 \1 — !/ rem Konvergenzkreis und in dem gemeisamen (in Abb. 14.42 doppelt schraffierten) Konvergenzgebiet dieselbe für z ^ 1 analytische Funktion f(z) = 1/A — z) als Summe Daher ist fi(z) analytische Fortsetzung von fo(z) aus Kq in K\ hinein (und umgekehrt). 14.3.4 Laurent—Entwicklung Jede Funktion f(z), die im Innern eines Kreisringes zwischen zwei konzentrischen Kreisen mit dem Mittelpunkt z0 und den Radien 7*1 und r2 analytisch ist, kann in eine verallgemeinerte Potenzreihe, die LAURENT-Reihe, entwickelt werden: + —— + a0 + öi(z - zo) + a2{z - z0J + • • • + ak{z - z0)k + • • • . A4.50a) z — zq Die im allgemeinen komplexen Koeffizienten an sind eindeutig durch die Formel ^ = hJj^Sr^^ (» = 0.±1,±2,...) A4.50b) bestimmt. Mit K ist irgendein geschlossener Integrationsweg bezeichnet, der innerhalb des Kreisringgebiets 7*1 < 1^1 < r2 liegt und im Gegenuhrzeigersinn durchlaufen wird (Abb. 14.43). Ist das Gebiet G der Funktion f(z) umfassender als der Kreisring, dann ist der Konvergenzbereich der Laurent -Reihe der größte in G enthaltene Kreisring um z0. ¦ Für die Funktion f(z) = -, —7 -r , die im Ringgebiet 1 < \z\ < 2 analytisch ist, soll eine (z-l)(z-2) LAURENT-Reihenentwicklung bezüglich zq = 0 angegeben werden. Dazu kann man die Funktion f(z) durch Partialbruchzerlegung auf die Form f(z) = bringen. Durch einfache Umformung können diese beiden Terme als geometrische Reihen dargestellt werden, die gemeinsam in dem Ringgebiet 1 < \z\ < 2 konvergieren. Man erhält- f( x _ 1 _ _^ l__ _ _ Ä 1_ _ 1 ~ fzy /W"(z-l)(z-2)- {,_!_) 2(l-Z-Y k* 2^UJ
14-3 Potenzreihenentwicklung analytischer Funktionen 715 14.3.5 Isolierte singulare Stellen und der Residuensatz 14.3.5.1 Isolierte singulare Stellen Wenn eine Funktion f(z) in der Umgebung eines Punktes z0 analytisch ist, nicht aber in z0 selbst, dann heißt z0 eine isolierte singulare Stelle der Funktion f(z). Ist f(z) in der Umgebung von z0 in die LAURENT-Reihe oo /(«)= £ "»(*-*>)" A4.51) n~—oo entwickelbar, dann können die isolierten singulären Stellen nach dem Verhalten der LAURENT-Reihen eingeteilt werden- 1. Enthält die LAURENT-Reihe keine Glieder mit negativen Potenzen von (z — zq) , wobei an = 0 für n < 0 gilt, dann geht die LAURENT-Entwicklung in die TAYLOR-Reihe mit den aus der CAUCHYschen Integralformel folgenden Koeffizienten an = hJ^~ *)~n-1rtod^ = ^r A4 52) (K) über. Die Funktion f(z) ist dann auch im Punkt Zq analytisch, wenn f(zo) = ao ist oder wenn zq eine hebbare Singularität ist. 2. Enthält die LAURENT-Reihe endlich viele Glieder mit negativen Potenzen von (z — zq) , wobei gelten soll am ^ 0, alle an = 0 für n < m < 0 , dann spricht man von einer außerwesentlichen Singularität im Punkt z0 oder einem Pol der Ordnung m oder Pol der Vielfachheit ra, durch Multiplikation mit (z — Zo)m , aber keiner niedrigeren Potenz, geht f(z) in eine Funktion über, die in zq und Umgebung analytisch ist f(z) = - ( z + - j hat an der Stelle z = 0 einen Pol 1. Ordnung. 3. Enthält die LAURENT-Reihe unendlich viele Glieder mit negativen Potenzen von (z — zq) , dann ist zq ein wesentlich singulärer Punkt der Funktion f(z) Bei Annäherung an einen Pol wächst \f{z)\ über alle Grenzen. Bei Annäherung an eine wesentlich singulare Stelle kommt f(z) jeder beliebigen komplexen Zahl c beliebig nahe. 00 1 1 ¦ Die Funktion f(z) = el/z, deren LAURENT-Reihe f(z) = J^ —r— lautet, hat an der Stelle z = 0 71=0 U- ZTl eine wesentliche Singularität. 14.3.5.2 Meromorphe Funktionen Hat eine sonst holomorphe Funktion für endliche Werte von z nur Pole als singulare Stellen, dann heißt sie meromorph. Eine meromorphe Funktion läßt sich immer als Quotient zweier analytischer Funktionen darstellen ¦ Beispiele für in der ganzen Ebene meromorphe Funktionen sind die rationalen Funktionen, die nur eine endliche Zahl von Polen besitzen, sowie solche transzendenten Funktionen wie tan z und cot z . 14.3.5.3 Elliptische Funktionen sind doppelperiodische Funktionen, deren einzige Singularitäten Pole sind, d.h., es sind meromorphe Funktionen mit zwei unabhängigen Perioden (s. 14 6, S 724ff.). Sind die beiden Perioden lü\ und U2 , die in einem nichtreellen Verhältnis stehen, dann gilt. f(z + mu>i + ntü2) = f(z) (m, n = 0, ±1, ±2,...; Im (—) ^ 0). A4.53) Der Wertevorrat von f(z) liegt in einem Periodenparallelogramm mit den Punkten 0, U\, u\ -\-üü2,uJ2
716 14- Funktionentheorie 14.3.5.4 Residuum Den Koeffizienten a_i der Potenz (z — zq)~1 in der LAURENT-Entwicklung von f(z) bezeichnet man als Residuum der Funktion f(z) im singulären Punkt z0 a-i = Res/W|,=^ = 2^7^/@*. Das zu einem Pol ra-ter Ordnung gehörende Residuum kann mit der Formel 1 o_i = Kßsf(z)\ z=zo ~ Ä2, (m - 1)' dz -lf(z)(z-z0y A4.54a) A4 54b) berechnet werden Wenn die Funktion als Quotient gemäß f(z) = tp(z)/ip(z) dargestellt werden kann, wobei die Funktionen (p(z) und i/j(z) im Punkt z = Zq analytisch und zq eine einfache Wurzel der Gleichung ijj(z) = 0 sein soll, so daß V>Bo) = 0 , ift'(z0) ^ 0 ist, dann ist der Punkt z = Zq ein Pol 1. Ordnung der Funktion f(z). Mit A4.54b) ergibt sich Res (p(z) *w. Wenn z0 eine m-fache Wurzel der Gleichung tß(z) = 0 ist, d.h., wenn ip(zo) = ^'(zq) = • = 0 , ip^(zo) 7^ 0 ist, dann ist der Punkt z = z0 ein m-facher Pol der Funktion f(z) 14.3.5.5 Residuensatz A4 54c) Mit Hilfe der Residuen kann man den Wert eines Integrals über einen geschlossenen Weg berechnen der isolierte singulare Punkte umschließt (Abb. 14.44) Ist die Funktion f(z) in einem einfach zusammenhängenden Gebiet G , das von der geschlossenen Kurve K begrenzt wird, mit Ausnahme der endlich vielen Punkte z0, zuz2,. ., zn eindeutig und analytisch, dann ist der Wert des im Gegenuhrzeigersinn über den geschlossenen Weg genommenen Integrals gleich dem Produkt aus 27ri und der Summe der Residuen in allen diesen singulären Punkten- j f(z)dz = 2mJTR™f(z)\z= A4 55) (K) ¦ Die Funktion f(z) = ez/(z2 + 1) hat die Pole 1. Ordnung z\^ = ±i. Die zugehörigen Residuen haben die Summe sin 1. Daher gilt, wenn K ein Kreis um den Nullpunkt mit dem Radius r > 1 ist, ez (K) z2 + l - dz = 2m sin 1 Abbildung 14 44 Abbildung 14 45
14 4 Berechnung reeller Integrale durch Integration im Komplexen 7VI 14.4 Berechnung reeller Integrale durch Integration im Komplexen 14.4.1 Anwendung der Cauchyschen Integralformeln Mit Hilfe der CAUCHYschen Integralformeln kann man die Werte einiger bestimmter reeller Integrale bestimmen. ¦ Die Funktion f(z) = ez, (s. 14.5.2,1., S. 720) die in der gesamten z-Ebene analytisch ist, wird gemäß CAUCHYscher Integralformel A4.42) dargestellt, wobei der Integrationsweg K ein Kreis mit dem Mittelpunkt in z und dem Radius r sein soll Die Kreisgleichung lautet £ = z + relip . Man erhält gemäß A4 42) 7I f P< 77! /V=2tt e{z+Tex*) n\ ,2tt ... <? = 7T-. <P „ \ ^ d( = -^ / JL——ireWdtp = ^— / e^cos^rsm^-m^ SQ 2tti J (C- z)n+1 2tti J<p=o rn+1el^n+1) ^ 2?rrn Jo (K) daß 2irrn r2n , s r2* c2lx = / ercos,+,(rsm,-n,) ^ = / grcoB^r^^ gin )] d +j / erCOS^[sin(r SUl </>-n(^)] dtp n\ Jo Jo Jo r2iT 27rrn Da der Imaginärteil gleich Null ist, ergibt sich / ercosip cos(r sin <p — rnp) dip = —r- 7o n! 14.4.2 Anwendung des Residuensatzes Mit Hilfe des Residuensatzes können eine Reihe bestimmter Integrale von Funktionen einer Veränderlichen berechnet werden Wenn f(z) eine Funktion ist, die in der gesamten oberen Halbebene einschließlich der reellen Achse analytisch ist, ausgenommen die singulären Punkte z\, z2,. ,zn, die oberhalb der reellen Achse liegen sollen (Abb.14.45), und wenn die Null eine Wurzel der Gleichung f(l/z) = 0 von der Vielfachheit m > 2 ist (s 1.6.3.1,2., S. 43), dann gilt: +°° n / f(x)dx = 27ri]TRes/B)Ul • A4.56) _ i=l / + OO firjß / 1 \ — Die Gleichung / ( - 1 = -00 (i + xiy \xj 00 A + x2K bJ \xj ( 1\3 (x2 + l) ('?*) ^3 = 0 besitzt die sechsfache Wurzel x = 0. Die Funktion w — ttt hat in der oberen Halbebene den A + z2K einzigen singulären Punkt z — i, der ein Pol mit der Vielfachheit 3 ist, denn die Gleichung A + z2K = 0 hat zwei dreifache Wurzeln bei i und —i. Das Residuum berechnet sich gemäß A4.54b) zu Res A + *2KU 2\dz2 (z-if A + z2) 2^3 Ausi?(rri) -5^ + 0- = "<« + «>- folgt Res üdöv; =G{z + i)|-i = w = -^ •und mit A456); £Tf{x) dx =2vi (-ä1) = 3 -7T Weitere Anwendungen der Residuentheorie s. z.B. [14.18]. 8 14.4.3 Anwendungen des Lemmas von Jordan 14.4.3.1 Lemma von Jordan In vielen Fällen lassen sich reelle uneigentliche Integrale mit unbeschränktem Integrationsgebiet durch komplexe Integrale über geschlossene Wege berechnen. Um dabei immer wiederkehrende Abschätzun-
718 14- Funktionentheorie gen zu vermeiden, benutzt man das Lemma von JORDAN, das sich auf Integrale der Form f f(z)eiazdz A4 57a) (Kr) bezieht, wobei Kr der in der oberen Halbebene der z-Ebene gelegene Halbkreisbogen um den Nullpunkt mit dem Radius R ist (Abb. 14.46). Das Lemma von JORDAN unterscheidet folgende Fälle: a) öl > 0: Strebt f(z) in der oberen Halbebene und auf der reellen Achse für z —* oo gleichmäßig gegen Null und ist a > 0 eine positive Zahl, dann gilt für R —? oo / f(z)eiQZdz-+0. A4.57b) (Kr) b) öl = 0: Strebt der Ausdruck zf(z) für z —> oo gleichmäßig gegen Null, dann gilt die Aussage A4.57b) auch im Falle a = 0. c) öl < 0: Liegt der Halbkreis unterhalb der reellen Achse, dann gilt die entsprechende Aussage auch für öl < 0. d) Der Satz gilt auch, wenn es sich statt um einen vollen Halbkreis um einen Teilbogen handelt e) Der entsprechende Sachverhalt liegt für Integrale der Form / '«¦ eaz dz A4 57c) (*£) vor, wenn KR einen Halbkreis bzw. Teilbogen in der linken Halbebene mit a > 0 darstellt, bzw in der rechten mit a < 0 -R 0 -R 0 R x R x I R Abbildung 14 48 Abbildung 14.46 Abbildung 14.47 14.4.3.2 Beispiele zum Lemma von Jordan 1. Berechnung des Integrals / — dx. o Dem gesuchten reellen Integral wird auf folgende Weise ein komplexes Integral zugeordnet: R . R R R iax f xsmax . f xsmax f xcosax f xeax 2l / ~T^—5" dx = l T";—5"dx + / ~^T>—2" dx = / ~^~>—2 dx J x2 + a2 J x2 + a? J x2 + a2 J x2 + a2 0 > v ' -R -R -R gerade Funktion ' ^ ~ ' = 0 (ungerader Integrand) /zeiaz — dz . Die Kurve K be- z2 + a2 (K) steht aus dem oben definierten Halbkreisbogen Kr und dem Stuck der reellen Achse zwischen —R und R (R > \a\) Der komplexe Integrand hat in der oberen Halbebene nur die singulare Stelle z = a\
14 4 Berechnung reeller Integrale durch Integration im Komplexen 719 / zeiaz Nach dem Residuensatz gilt: I = <p — dz = 2m lim J Z2 + O? *-»ai (K) zl + a ;{z-ai) n . ,. zelKJ = Z7T1 lim z-^ai Z + a\ /zeiaz f xelotx —z dz + —z dx = 7rie~aa . Aus lim / ergibt sich unter Beachtung Z2 + 0? J X2 + 0? R-+oo (Kr) -R oo des Lemmas von JORDAN: / — dx = —e~aa (a > 0, a > 0). J xl 4- al 2 o Auf ähnliche Weise wurden weitere Integrale der Tabelle 21.8, S. 1086 berechnet. 2. Integralsinus (s. auch 8.2.5,1., S. 477) oo . nennt man das Integral / dx. Untersucht wird in Analogie zum vorangegangenen Beispiel das J x o fe[z komplexe Integral / — dz mit der Kurve K gemäß Abb. 14.47. Der Integrand des komplexen Inte- e1" —z z 27ri, also / grals hat an der Stelle z = 0 einen Pol 1 Ordnung, so daß / = 27ri lim2^0 R . 2rr [z 2i / — dx + i / eir(cosv?+isin*) dif + / — dz = 2tt1 . Führt man die Grenzübergänge R -» oo , r -> 0 *• t KR durch, wobei der Integrand des zweiten Integrals für r —> 0 bezuglich ^> gleichmäßig gegen 1 konvergiert (d h , der Grenzübergang r —? 0 kann unter dem Integralzeichen vollzogen werden), dann erhält man unter Beachtung des Lemmas von Jordan: n. fsmx , rt . /'sinx , 7T ,, , ,n, 2i / dx + 7Ti = 27Ti, also / dx = - . A4.58) 7 a: 7x2 o o • 3. Sprungfunktion Unstetige, reelle Funktionen kann man mit Hilfe komplexer Integrale (sog. »Hakenintegrale" nach der Form des Integrationsweges) darstellen. Die folgende spezielle Sprungfunktion ist ein Beispiel. i , Jtz ( 1 ' für t > 0, F(t) = — / — dz = { 1/2 für t = 0, A4.59) 27ri_:L z [0 für t<0. Das Symbol -w-» bezeichnet einen Integrationsweg längs der reellen Achse (| R |—> oo) unter Umgehung des Nullpunktes (Abb. 14.47) Deutet man t als Zeit, dann stellt die Funktion <P(t) = cF(t—to) eine Größe dar, die zur Zeit t = to von 0 über den Wert c/2 auf den Wert c springt (s auch HEAVISIDE-Funktion in 15.2 1 3,1., S. 737). Sie wird in der Elektrotechnik zur Darstellung plötzlich auftretender Strom- oder Spannungsstöße verwendet. 4. Rechteckimpuls Ein weiteres Beispiel für die Anwendung des Hakenintegrals ist die Darstellung des Rechteckimpulses: i ,. p\{b-t)z i f A{a-t)z @ für t < a und t > b, V(t) = — / dz-— / dz=\l für a<t<b, A4.60) 27ri_i^ z 27ri_i_ z { 1/2 für t - o und t = b.
720 14- Funktionentheorie 5. Fresnelsche Integrale Zur Herleitung der FRESNEL.se/ien Integrale oo oo fsin{x2)dx = fcos(x2)dx = -zyfüp. A4.61) 0 0 wird das Integral / = / e~z dz mit dem in Abb. 14.48 skizzierten geschlossenen Integrationsweg un- K fR _ 2 tersucht. Nach dem Integralsatz von Cauchy gilt / = -^i + ^H + ^in ~ 0 m^ h = \ e * dz, Jjj = \R T *e-R2{cos2ip+'xsSxi2*)+^d<p, l™ = e* f°e[r2dr = -^2(l + i) i / sinr2 dr - f cosr2d,r\ Jo Jr 2 [ Jo Jo \ ptt/4 2 Abschätzung von /jj Unter Beachtung von |i| = |eir| = 1 (r reell) gilt: |/jj| < R e~R cos2tp d^> = 2 Jo Y 2 L v 2 Jo Y 2 Ja sina Y jy f> 1 p—R?cosa / ,_\ < —e~R cosa -\ ( 0 < a < — ) . Führt man den Grenzübergang lim / durch, dann 2 2#sina V 2/ & & tf-oo lassen sich die Integrale h und Tjt auswerten, lim^^oo h = -y/ir, lim /tt = 0, und durch Trennung 1 11 2 ä—>oo von Real- und Imaginärteil erhält man die angegebenen Formeln A4.61) 14.5 Algebraische und elementare transzendente Funktionen 14.5.1 Algebraische Funktionen 1. Definition Von einer algebraischen Funktion w einer komplexen Variablen z spricht man, wenn die Funktion das Ergebnis endlich vieler algebraischer Operationen mit diesen Veränderlichen und eventuell noch mit endlich vielen Konstanten ist Ganz allgemein kann eine komplexe algebraische Funktion w(z) wie ihr reelles Analogon implizit als Polynom (HZ™1™711 + a2zm2wn2 + • • • 4- akzmkwnk = 0 * A4 62) definiert werden Solche Funktionen müssen sich durchaus nicht immer nach w auflösen lassen. 2. Beispiele algebraischer Funktionen Lineare Funktion- w = az + b, A4.63) Inverse Funktion, w = - , A4 64) Quadratische Funktion: w = z2 , A4 65) Quadratwurzelfunktion: w = Vz2 — a2 , A4 66) Gebrochen lineare Funktion: w = . A4.67) z - i 14.5.2 Elementare transzendente Funktionen Die komplexen transzendenten Funktionen werden ebenso wie die algebraischen Funktionen in Analogie zu den entsprechenden reellen transzendenten Funktionen definiert Eine ausführliche Darstellung findet man in [21.1] oder [21.11] 1. Natürliche Exponentialfunktion z z z e2 = 1+l! + 2T + ¥ + "-- A468)
14 5 Algebraische und elementare transzendente Funktionen 721 Die Reihe konvergiert in der gesamten z-Ebene. a) Rein imaginärer Exponent iy: Gemäß der EuLERschen Relation (s. 1.5.2.4, S. 36) gilt: eiy = cos y -f i sin y mit em = -1. A4 69) b) Allgemeiner Fall z = x + i y. ez = ex+\y = exjy = e^(C0S2/ + isiny), d.h., A4.70a) Re(ez) = excosy, Im(e2) = ex siny, \ez\ = ex , arg(e2) = y. A4.70b) c) Exponentialform einer komplexen Zahl (s. 1.5.2.4, S. 36)- a + i6 = peiv. A4 71a) d) Periode der Funktion ez: Die Periode der Funktion ez ist 2?ri- ez = ez+2klvi (k = 0, ±1, ±2,.. ) A4.71b) Speziell gilt- e° = e2fc7ri = 1, e{2k+1)ni = -1. A4.71c) e) EuLERsche Relation für komplexe Zahlen. eiz = cosz-\-isinz, A4.72a) e~iz = cosz - isin^. A4.72b) 2. Natürlicher Logarithmus w = Lnz, falls z = ew. A4.73a) Wegen z = pelip kann man schreiben: Lnz = lnp + i(<p + 2fc7r) und A4.73b) Re(Lnz) = lnp, Im (Ln z) = y> + 2A: tt (jfc = 0, ±1, ±2,. ). A4.73c) Da Lnz eine mehrdeutige Funktion ist (s. 2.8 2, S. 85), gibt man gewöhnlich nur den Hauptwert des Logarithmus ln z an: \nz = \np + iip (-7T < y> < +tt) . A4.73d) Die Funktion Ln z ist für alle komplexen Zahlen definiert, ausgenommen die Null 3. Allgemeine Exponentialfunktion az = ezLna (a^O). A4.74a) Die Funktion az ist eine mehrdeutige Funktion mit dem Hauptwert az = ez[na A4.74b) 4. Trigonometrische Funktionen und Hyperbelfunktionen sinz = 2.e = z - ||- + |j- , A4.75a) ei, + -iz z2 z4 cosz = = !-_ + _-..., A4 75b) ez - e~z z3 z5 i*A»n \ sinhz = = z + — + — + ... , A4 76a) cosh2 = £l^£Z==l + £! + £j + .... A4.76b) Alle vier Reihen konvergieren in der gesamten Ebene, alle vier Funktionen sind periodisch. Die Periode der Funktionen A4.75a,b) ist 2ir, die der Funktionen A4.76a,b) 2iri. Für rein imaginäres Argument lauten die Ausdrücke dieser Funktionen: sin i y = i sinh y, A4.77a) cos i y = cosh y, A4.77b) sinh i y = i sin y, A4 78a) cosh i y = cos y. A4 78b)
722 14 Funktionentheorie Die Umrechnungsformeln für die trigonometrischen Funktionen und die Hyperbelfunktionen einer reellen Veränderlichen B 7 2), B 9 3) gelten auch für Funktionen einer komplexen Veränderlichen. So erfolgt die Berechnung der Funktionen sin z , cos z , sinh z und cosh z für das Argument z = x + i y mit Hilfe der Formeln sin(a + b), cos(a + b), sinh(a + b) und cosh(a -f b). ¦ cos(a: + iy) = cos £ cos i £/ — sinxsiniy = cos a: cosh y — i sin a: sinh y. A4.79) Daraus folgt: Re (cos z) = cos Re (z) cosh Im (z), A4.80a) Im (cos z) = - sin Re (z) sinh Im (z). A4.80b) Die Funktionen tan z , cot z , tanh z und coth z werden mit Hilfe der folgenden Formeln bestimmt: tanz = smz cos z ' cot z = A4.81a) tanh 2: sinh z cosh z ' coth z ¦¦ cosh z sinh z A4.81b) 5. Inverse trigonometrische Funktionen und inverse Hyperbelfunktionen Diese Funktionen sind ebenso unendlich vieldeutig und können mit Hilfe des Logarithmus durch die folgenden Formeln dargestellt werden: Aresin z = — i Ln (i z + v7! — z2), Arccos z — —i Ln (z + Vz2 — 1), Arctan2 iLnl±!£, 2i I-12' A4 82a) A4.83a) A4.84a) Arsinh z = Ln (z + Vz2 + 1), Arcosh z = Ln (z -f yz2- Artanh z ¦ i), Arccot z - 1T iz + l -— Ln: -\ 2i iz-1 A4.85a) Arcoth; 1T l + z '¦ ~Ln- , 2 \-z' 1T z + l ^Ln . 2 2-1 A4.82b) A4.83b) A4 84b) A4 85b) Die Hauptwerte der inversen trigonometrischen und inversen Hyperbelfunktionen drückt man mit denselben Formeln und mit Hilfe des Hauptwertes des Logarithmus ln z aus* aresin z = — i ln(i z + v7! — z2), arccos z = -i \n(z + Vz2 — 1), aretanz = arccot z ¦ 1, 1 + \z -- — In — , 2i \-\z 1 . i* + l = — — In: 7 2i \z-\ ^44.86a) A4.87a) A4.88a) A4.89a) arsinhz = ln(z + \/z2 + 1), arcoshz = lnB + Vz2 — 1), artanhz = - ln , 2 \-z arcothz = - ln 2 z-\ A4 86b) A4 87b) A4 88b) A4.89b) 6. Real- und Imaginärteile der trigonometrischen und Hyperbelfunktionen Tabelle 14 1 Real- und Imaginärteile der trigonometrischen und Hyperbelfunktionen w = f(x + iy) sin(x ± iy) cos(x ± iy) tan(x ± iy) sinh(x ± iy) cosh(a: ± iy) tanh(.T ± iy) Realteil Re (w) sin x cosh y cos x cosh y sin 2a: cos 2a: + cosh 2y sinh a: cos y cosh a: cos y sinh 2a: cosh 2.t + cos 2y Imaginärteil Im (w) ± cos x sinh y qF sin a: sinh y sinh 2y cos 2a: + cosh 2y ± cosh x sin y ± sinh x sin y ¦ sin 2y cosh 2a: + cos 2y
14-5 Algebraische und elementare transzendente Funktionen 723 7. Absolutbeträge und Argumente der trigonometrischen und Hyperbelfunktionen Tabelle 14.2 Absolutbeträge und Argumente der trigonometrischen und Hyperbelfunktionen w = f(x + iy) sin(x ± iy) cos(x ± iy) sinh(:r ± iy) cosh(x ± iy) Betrag \w\ y sin2 x + sinh2 y y cos2 x + sinh2 y y sinh2 x + sin2 y yj sinh2 x + cos2 y Argumentarg w ± arctan(cot x tanh y) =F arctan(tan x tanh y) ± arctan(coth x tan ?/) ± arctan(tanh x tan y) 14.5.3 Beschreibung von Kurven in komplexer Form Eine komplexe Funktion von einer reellen Veränderlichen t kann auch in Parameterform dargestellt werden. z = x(t) + iy(t) = f(t). A4.90) Bei Änderungen von t durchlaufen die Punkte z eine Kurve z(t). Im folgenden sind die Gleichungen und dazugehörigen graphischen Bilder für Gerade, Kreis, Hyperbel, Ellipse und logarithmische Spirale angegeben. 1. Gerade a) Gerade durch einen Punkt (zi, <p) (ip Schnittwinkel mit der x-Achse), (s. Abb. 14.49a) z = zi+teiv A4 91a) b) Gerade durch zwei Punkte (zi, z2) (s Abb. 14.49b): z = zi +t(z2 - Zi). A4 91b) 2. Kreis a) Radius r, Mittelpunkt im Koordinatenursprung (s. Abb. 14.50a): z = re . b) Radius r, Mittelpunkt im Punkt z0 (s Abb. 14.50b) z — z0 + relt aH x b)ÖI Abbildung 14.49 a) b) Ö| Abbildung 14.50 3. Ellipse a) Ellipse, Normalform — + — = 1 (s. Abb.14.51a)- a? b2 z = a cos t + i6 sin t A4.93a) oder z = ce[t + de~ A4.92a) A4 92b) A4 93b)
724 14- Funktionentheorie mit a + b a — b C= 2 ' = 2 ' A4.93c) d.h., c und d sind beliebige reelle Zahlen b) Ellipse, allgemeine Form (s. Abb. 14.51b)- Der Mittelpunkt befindet sich im Punkt z\, die Achsen sind um einen Winkel gedreht. z = zx + ce" + de~'lt. A4 94) Mit c und d sind beliebige komplexe Zahlen bezeichnet, die die Länge der Ellipsenachsen und ihre Drehung bestimmen. yf a) b) Abbildung 14 51 x2 y2 4. Hyperbel, Normalform = 1 (s. Abb. 14.52): a2 b2 z = a cosh t + \b sinh t oder wobei c und c konjugiert komplexe Zahlen sind- a + \b _ a — ib c=—^—5 c=—-—. 2 ' 2 5. Logarithmische Spirale (s. Abb. 14.53): z = aeibt, wobei a und b beliebige komplexe Zahlen sind Abbildung 14.52 A4.95a) A4.95b) S~ A4 95c) V A4.96) i ^ J. W Abbildung 14 53 14.6 Elliptische Funktionen 14.6.1 Zusammenhang mit elliptischen Integralen Integrale der Form (8.24), mit dem Integranden R(x, JP(x)), lassen sich, abgesehen von Ausnahmefällen, nicht in geschlossener Form integrieren, wenn P(x) ein Polynom dritten oder vierten Grades ist, sondern sind als elliptische Integrale numerisch zu berechnen (s. 8 1.4 3, S 453). Die Umkehrfunktionen der elliptischen Integrale sind die elliptischen Funktionen Sie sind den trigonometrischen Funktionen ähnlich und können als deren Verallgemeinerung angesehen werden. Um das am speziellen Fall zu zeigen, wird / A - t2)-^ dt -- (N < i) A4.97)
14 6 Elliptische Funktionen 725 gesetzt und beachtet, daß a) zwischen der trigonometrischen Funktion u = sin x und dem Hauptwert ihrer Umkehrfunktion der Zusammenhang u = sin x <$ x = aresin u für 7T 7T 2 ~ ~ 2 ' -1 < W< 1 A4.98) besteht und daß b) das Integral A4.97) gleich aresin u ist. Die Sinusfunktion kann somit als Umkehrfunktion des Integrals A4 97) aufgefaßt werden. Analoges gilt für die elliptischen Integrale. I Die Schwingungsdauer des mathematischen Pendels mit der an einem masselosen, nicht dehnbaren Faden der Länge / befestigten Masse ra (Abb. 14.54) kann mit Hilfe einer nichtlinearen Differentialgleichung 2. Ordnung, die sich als Bewegungsgleichung aus dem Gleichgewicht der an der Masse angreifenden Kräfte ergibt, berechnet werden. d2rd q -— + 7sintf = 0 mit tf@) = dt1 l tf0 , tf(o) = 0 oder — :2^4(costf) A4 99a) / dt Zwischen Pendellänge l und Auslenkung s aus der Ruhelage besteht der Zusammenhang s = W , also s = W und 's = W Die an der Masse angreifende Kraft F = mg, wobei g die Fallbeschleunigung ist, spaltet, bezogen auf die Bahnkurve, in eine Normalkomponente Fn und eine Tangentialkompo- nente Ft auf (Abb. 14.54) Die Normalkomponente Fn = mg cos $ wird von der Fadenspannung im Gleichgewicht gehalten Da sie senkrecht auf der Bewegungsrichtung steht, liefert sie keinen Beitrag zur Bewegungsgleichung. Die Tangentialkomponente Ft steht mit der entgegengesetzt gleich großen Tangentialkraft im Gleichgewicht: Ft = ms = mW = — rag sin $. Die Tangentialkomponente zeigt immer zur Ruhelage hin. Durch Trennung der Variablen erhält man. t-t« = de 9J0 ^2(cose-costf0) A4 99b) Dabei bedeutet t0 die Zeit, bei der das Pendel zum ersten Mal durch die tiefste Lage geht, d h , es gilt i)(to) = 0. Mit 0 ist die Integrationsvariable bezeichnet Nach einigen Umformungen mit Hilfe der Substitution sin - ¦ k sin i/j , k = sin — erhält man die Gleichung t-t0 = J- r -j= # y 1 — k2sin2 ip l-F(k,ip) A4 99c) Dabei ist F(k,ip) ein elliptisches Integral 1. Gattung (s. (8 27a) in 8.1.4.3,1., S 454). Der Ausschlagwinkel d = $(£) ist eine periodische Funktion der Periode 2T mit '-£'(*!)-/;*• A4 99d) wobei K ein vollständiges elliptisches Integral 1 Gattung darstellt (Tabelle 21.9, S. 1091). Mit T ist die Schwingungsdauer des Pendels bezeichnet, d h die Zeit zwischen zwei Umkehrpunkten, für die dti 1— — = 0 gilt Für kleine Auslenkungen mit sin d « d wird T = InJl/g
726 14- Funktionentheorie IM 17 rvv \ \ \ \ \ \ ^,"—•«* 2K\ cnx dnx ^ ^'' • ^/ / / / / /3K / / V / snx X /4K 0I+C02 Abbildung 14.54 Abbildung 14.55 Abbildung 14.56 14.6.2 Jacobische Funktionen 1. Definition Aus der Darstellung (8.26a) und (8.27a) für das elliptische Integral 1. Gattung F(k,ip) folgt für 0 < k< 1 ^ = A - k2 sin2 (p)-i > 0, A4.100) d h., F(k, ip) ist bezüglich ip streng monoton, so daß die zu rtih ¦¦ u((p) A4.101a) inverse Punktion y = am(fc, u) = <p{u) A4.101b) "^/tTt di\) { \j\ - k2 sin2 ip existiert Sie wird als Amplitudenfunktion bezeichnet Mit ihrer Hilfe werden die sogenannten JACO- Bischen Funktionen wie folgt definiert snu = sin ip = sin am(A:, u) (sinus amplitudinis), A4.102a) cnw = cos (p = cos am(A;, u) (cosinus amplitudinis), dm/ = Vi - k2sn2u (delta amplitudinis). A4.102b) A4.102c) 2. Meromorphe und doppelperiodische Funktionen Man kann die JACOBlschen Punktionen in die komplexe z-Ebene analytisch fortsetzen. Die Punktionen snz , cnz und dnz sind dann meromorphe Punktionen (s 14 3.5 2, S. 715), d h , sie besitzen außer Polstellen keine weiteren Singularitäten Außerdem sind sie doppelperiodisch: Jede dieser Punktionen f(z) hat genau 2 Perioden u\ und uü2 mit f{z + u1) = f(z), f(z + u2) = f{z) A4103) Dabei sind u\ und u2 zwei beliebige komplexe Zahlen, deren Quotient nicht reell ist Aus A4.103) folgt die allgemeine Formel f{z + mw1+mj2) = f(z), A4 104) wobei m und n beliebige ganze Zahlen sind Meromorphe doppelperiodische Punktionen heißen elliptische Funktionen Die Menge {z0 + aiui + a2u2: 0 < au a2 < 1} A4.105) mit beliebigen festen z0 G C heißt Periodenparallelogramm der elliptischen Funktion. Ist diese im Periodenparallelogramm (Abb. 14.56) beschränkt, dann ist sie eine Konstante. ¦ Die JACOBlschen Funktionen A4.102a) und A4.102b) sind elliptische Funktionen. Die Amplitudenfunktion A4.101b) ist keine elliptische Funktion
14 6 Elliptische Funktionen 727 3. Eigenschaften der Jacobischen Funktionen Mit den Substitutionen k'2 = l-k2, tf' = F(A^), tf = F(*,|) A4.106) lassen sich für die JACOBlschen Funktionen die in Tabelle 14.3 aufgeführten Eigenschaften angeben, wobei m und n beliebige ganze Zahlen sind. Den Verlauf von snz, cnz und dnz findet man in Abb. 14.55 Außerhalb ihrer Polstellen gelten für die JACOBlschen Funktionen die folgenden Beziehungen: 1. sn22 + cn22=l, k2sn2z + dn2z = 1, A4 107) 2. sn(u + v) = (snu)(cnv)(dnv) + (snv)(cnu)(dnu) 1 — k2(sn2u)(sn2v) Tabelle 14 3 Perioden, Nullstellen und Pole der JACOBlschen Funktionen snz cnz dnz Perioden u\, co>2 4K,2iK' AK,2(K + iK') 2K,AiKf Nullstellen 2mK + 2n\K' Bm + \)K + 2mA"' Bm + l)K + Bn + l)\K' Pole ^ \2mK + {2n + l)iK' ) A4.108a) cn(w + v) = dn(u + v) = (cnu)(cnv) — (snit)(dim)(sm;)(diiv) 1 — k2(sn2u)(sn2v) (dnu)(dnv) — k2(snu)(cnu)(snv)(cnv) 1 — k2(sn2u)(sn2v) 3. (sn*)' - {cnz)(dnz), A4.109a) A4.108b) A4.108c) (cnz)' = -{snz)(dnz), A4.109b) (dnz)' = -k2(snz)(cnz) A4.109c) Weitere Eigenschaften der JACOBlschen und weiterer elliptischer Funktionen s. [14.10], [14 18] 14.6.3 Thetafunktionen Zur Berechnung der JACOBlschen Funktionen verwendet man die Thetafunktionen 0i(*, q) = 2g* f](-l)V(n+1) sinBn + \)z , 02B, q) = 2tf* J2 Qn{n+1) cosBn + l)z n=0 oo ti*(z,q) = l + 2Y,<r2 cos 2nz, 71=1 OO •&t(z,q) = 1 + 2 5^(-l)V2 cos2n2 . A4.110a) A4 110b) A4.110c) A4.110d)
728 14 Funktionentheorie Ist \q\ < 1 (q komplex), dann konvergiern die Reihen A4.110a) bis A4.110d) für alle komplexen Argumente z . Bei konstantem q verwendet man häufig die Abkürzungen M*)'=M™,q) (* = 1,2,3,4). A4111) Damit haben die jACOBischen Funktionen die folgenden Darstellungen: V2ü:y und #,#' gemäß A4 106). 14.6.4 Weierstrasssche Funktionen Von Weierstrass sind die Funktionen p(z) = p(z,uuu2), A4.113a) CO*) = C(z,uuW2), A4.113b) GB) = aB:,a;i,cj2) A4.113c) eingeführt worden, wobei u\ und a>2 zwei beliebige komplexe Zahlen darstellen, deren Quotient nicht reell ist. Man setzt Umn = 2{muJi + nuj2), A4.114a) wobei m und n beliebige ganze Zahlen sind, und definiert P(Z,UUUJ2) = Z-2 + Y,' [(Z - "rnn)-2 ~ ""*] . A4.114b) Dabei deutet der Strich am Summenzeichen an, daß das Wertepaar m = n = 0 ausgenommen ist Die Funktion p(z,Lüi,u2) hat folgende Eigenschaften: 1. Sie ist eine elliptische Funktion mit den Perioden u\ und lü2 . 2. Die Reihe A4.114b) konvergiert für alle z ^ umn. 3. Die Funktion p(z,lüi,lü2) genügt der Differentialgleichung - 92P ~ 93 A4.115a) mit g2 = 60 £ 'u^n , g3 = 140 £'«,-« A4.115b) Die Größen g2 und #3 werden als Invarianten von p(z,lüi,lü2) bezeichnet 4. Die Funktion w = p(z,u>i,uj2) ist die Umkehrfunktion zu dem Integral 00 z= [-—£==. A4.116) 5. p(u + v) = - p'(u)-p» <u)-p(u). A4.117) p(u) - p(v) Die WEiERSTRASSschen Funktionen C(^) = Z-1 + E ' [(* " "rnn)-1 + ^ + U^z] , A4.118a)
14 6 Elliptische Funktionen 729 a(z) = zexp ( f k(t) - r1] dt) = z ft ' (l - —) exp (— + -^-) A4.118b) sind nicht doppelperiodisch, also keine elliptischen Funktionen. Es gelten folgende Beziehungen: 1. C(z) = -p(z), C(*) = 0n<7(*)), A4.119) 2. £(-*) = -C(«), *(-*) - -*(*), A4 120) 3. C(z + 2wi) = C(«) + 2C(wi), C(* + 2cj2) = C(^) + 2C(wa), A4 121) 4. C(* + t;) = du) + CM + ^i"*?? • A4 122) 2 p(w) - p(v) 5. Jede elliptische Funktion ist eine rationale Funktion der WEiERSTRASSschen Funktionen p(z) und ((z).
730 15. Integraltransformationen 15 Integraltransformationen 15.1 Begriff der Integraltransformation 15.1.1 Allgemeine Definition der Integraltransformationen Unter einer Integraltransformation versteht man einen Zusammenhang zwischen zwei Funktionen f(t) und F(p) der Form +oo F(p)= J K(p,t)f{t)dt. A5 1a) —oo Die Funktion f(t) heißt Originalfunktion, ihr Definitionsbereich Originalbereich Die Funktion F(p) nennt man Bildfunktion, ihren Definitionsbereich Bildbereich. Die Funktion K(p, t) heißt der Kern der Transformation. Während es sich bei t um eine reelle Veränderliche handelt, ist p = a + icj eine komplexe Variable. Eine abgekürzte Schreibweise erhält man durch Einführung des Symbols T für die Integraltransformation mit dem Kern K(p, t)- F{p) = T{f{t)}. A51b) Man spricht kurz von T-Transformation. 15.1.2 Spezielle Integraltransformationen Für unterschiedliche Kerne K(p, t) und unterschiedliche Definitionsbereiche erhält man unterschiedliche Integraltransformationen. Die verbreitetsten sind die LAPLACE-Transformation, die Laplace- CARSON-Transformation sowie die FOURIER-Transformation. In Tabelle 15.1 ist ein Überblick über Integraltransformationen von Funktionen einer Veränderlichen gegeben. Hinzu kommen heute vor allem bei der Bilderkennung oder bei der Charakterisierung von Signalen noch weitere Transformationen wie die Wavelet-Transformation, die Gabor-Transformation und die Walsh- Transformation (s. 15.6, S 763fT) 15.1.3 Umkehrtransformationen In den Anwendungen ist die Rücktransformation einer Bildfunktion in die Originalfunktion von unmittelbarem Interesse. Man spricht auch von Umkehrtransformation oder inverser Transformation. Bei Benutzung des Symbols T_1 schreibt sich die Umkehrung der Integraltransformation A5 lb) gemäß f(t) = T-i{F(p)}. A5 2a) Der Operator T-1 heißt der zu T inverse Operator, so daß gilt T~l{T{f(t)}} = f(t) A5.2b) Die Bestimmung der Umkehrtransformation bedeutet, die Lösung der Integralgleichung A5.1a) zu suchen, in der die Funktion F(p) gegeben ist und die Funktion f(t) gesucht wird Wenn eine Lösung existiert, kann sie in der Form f(t) = T-'lFip)} A5.2c) geschrieben werden. Die explizite Bestimmung der inversen Operatoren für die verschiedenen Integraltransformationen, d h. für verschiedene Kerne K(p, t), gehört zu den grundlegenden Problemen der Theorie der Integraltransformationen Der Anwender benutzt zur Lösung seiner Probleme vor allem die in entsprechenden Tabellen angegebenen Korrespondenzen von zusammengehörigen Bild- und Originalfunktionen (Tabelle 21.14.1, 21.14.2, 21.14.3 und 21.14.4).
15 1 Begriff der Integraltransformation 731 Tabelle 15.1 Übersicht über Integraltransformationen von Punktionen einer Veränderlichen Transformat ion Laplace- Transformation Zweiseitige Laplace- Transformation Endliche LAPLACE- Transformation Laplace- Carson- Transformation FOURIER- Transformation Einseitige FOURIER- Transformation Endliche Fourier- Transformation FOURIER- Kosinus- Transformation FOURIER-Sinus- Transformation Mellin- Transformation Hankel- Transformation z/-ter Ordnung Stieltjes- Transformation Kernii:(p,t) f 0 für t < 0 \ e~pt für t > 0 e-Pt @ für * < 0 l e~pt für 0 < t < a { 0 für t > a @ für t < 0 \ pe~pt für t > 0 e-iu,t f 0 für t < 0 \ e~iu)t für * > 0 ( 0 für t < 0 i e-iw^ für 0 < * < a [O für £ > a f 0 für t < 0 JRe(eiu") für «>0 f 0 für t < 0 | Im (eiujt) für t > 0 f 0 für t < 0 t*"-1 für t>0 f 0 für t < 0 t tJ^Ccrt) für £>0 @ für t < 0 ] —!— für t > 0 Symbol oo C{f(t)} = Je-"'f(t)dt 0 +oo Al{/(*)} = / e-p'/(*)* —oo Ca{f(t)} = Je-ptf(t)dt 0 oo C{/(*)} = Jpe-ptf(t)dt 0 +oo ^{/(*)} = / e~^f(t)dt —oo *H/«} = je-^f(t)dt 0 a Fa{f{t)} = je-^}(t)dt 0 oo Fc{f(t)} = J f{t) COS Ut dt 0 fs{f(t)} = ]f(t)smutdt 0 oo M{f(t)} = ff-if(t)dt 0 oo Hv{f(t)} = JtJu{cjt)f(t)dt 0 0 ^ Bemerkung p = er + ia; 4i{/(*)JW} = £{/(*)} wobei , , / 0 für * < 0 JW ~ \ l für t > 0 Die CARSON-Trans- formation kann auch als zweiseitige oder endliche Transformation auftreten. p = a -\-ilü a = 0 p = o + \uj a = 0 p = a + \u a = 0 p = o~ + \u cr = 0 p = er + iu; er = 0 p = a + iu u = 0 J^ot) = BESSEL-Funk- tion erster Art z/-ter Ordnung
732 15. Integraltransformationen 15.1.4 Linearität der Integraltransformationen Sind fi(t) und f2{t) transformierbare Funktionen, dann gilt r{hh(t) + hh{t)} = hT{h{t)} + k2T{f2(t)}, A5 3) wobei ki und k2 beliebige Zahlen sein können Das bedeutet, daß eine Integraltransformation eine lineare Operation auf der Menge T der T-transformierbaren Funktionen darstellt. 15.1.5 Integraltransformationen für Funktionen von mehreren Veränderlichen Integraltransformationen für Funktionen von mehreren Veränderlichen werden auch Mehrfach-Integraltransformationen genannt (s. [15.14]) Am verbreitetsten sind die zweifache LAPLACE-Transforma- tion, d.h. die LAPLACE-Transformation für eine Funktion von zwei Veränderlichen, die zweifache La- PLACE-CARSON-Transformation und die zweifache FOURIER-Transformation. Mit dem Symbol C für die LAPLACE-Transformation lautet die Definitionsgleichung oo oo F{p,q) = C2{f(x,y)} = j j e-'*->*f{x,y)dxc A5 4) =0y=0 15.1.6 Anwendungen der Integraltransformationen 1. Prinzipielle Bedeutung Neben der großen theoretischen Bedeutung, die Integraltransformationen in solchen grundlegenden Gebieten der Mathematik wie der Theorie der Integralgleichungen und der Theorie der linearen Operatoren besitzen, haben sie ein breites Anwendungsfeld bei der Lösung praktischer Probleme in Physik und Technik gefunden. Methoden mit dem Einsatz von Integraltransformationen werden häufig Operatorenmethoden genannt. Sie eignen sich zur Lösung von gewöhnlichen und partiellen Differentialgleichungen, von Integralgleichungen und Differenzengleichungen. 2. Schema der Operatorenmethode Das allgemeine Schema des Einsatzes der Operatorenmethode mit Integraltransformation ist in Abb. 15.1 dargestellt. Die Lösung eines Problems wird nicht auf direktem Wege durch unmittelbare Lösung der Ausgangsgleichung gesucht; man strebt sie vielmehr über eine Integraltransformation an. Die Rücktransformation der Lösung der transformierten Lösung führt dann auf die Lösung der Ausgangsgleichung. Aufgabe Gleichung der Aufgabe Lösung der Gleichgung Ergebnis Transformation Lösung über die Transformation Inverse Transformation I transformierte Gleichung Lösung der transformierten Gleichung ? Abbildung 15.1 Die Anwendung der Operatorenmethode zur Lösung gewöhnlicher Differentialgleichungen besteht in den folgenden drei Schritten: 1. Übergang von einer Differentialgleichung für die unbekannte Punktion zu einer Gleichung für ihre Transformierte 2. Auflösung der erhaltenen Gleichung im Bildbereich, die im allgemeinen keine Differentialgleichung mehr ist, sondern eine algebraische Gleichung, nach der Bildfunktion
15 2 Laplace-Transformation 733 3. Rücktransformation der Bildfunktion mit Hilfe von T_1 in den Originalbereich, d h Bestimmung der Originalfunktion Die Schwierigkeit der Operatorenmethode liegt oft nicht in der Lösung der Gleichung, sondern im Übergang von der Funktion zur Transformierten und umgekehrt 15.2 Laplace-Transformation 15.2.1 Eigenschaften der Laplace—Transformation 15.2.1.1 Laplace-Transformierte, Original- und Bildbereich 1. Definition der Laplace-Transformation Die LAPLACE-Transformation C{f(t)} = je-"tf(t)dt = F(p) A5 5) ordnet einer gegebenen Funktion f(t) der reellen Veränderlichen t, Originalfunktion genannt, eine andere Funktion F(p) der komplexen Veränderlichen p zu, die Bildfunktion genannt wird. Dabei wird vorausgesetzt, daß die Originalfunktion f(t) in ihrem Definitionsbereich t > 0, dem Originalbereich, stückweise glatt ist und für t —> oo nicht stärker als eat mit a > 0 gegen oo strebt. Der Definitionsbereich der Bildfunktion F(p) wird Bildbereich genannt. Häufig wird in der Literatur die LAPLACE-Transformierte auch in der WAGNERschen oder LAPLACE- CARSONschen Form Cw{f(t)}=pje-"tf(t)dt = pF(p) A5.6) eingeführt (s. [15 15]) 2. Konvergenz Das LAPLACE-Integral £{f(t)} konvergiert in der rechten Halbebene Rep > a (Abb. 15.2) Die Bildfunktion F(p) ist dann dort eine analytische Funktion mit den Eigenschaften 1. lim F(p)=0. A5.7a) Rep—»oo Jede Bildfunktion muß diese notwendige Bedingung erfüllen. 2. lim pF(p) = A, A5.7b) falls die Originalfunktion f(t) einen endlichen Grenzwert lim f(t) = A besitzt Impf f(t)=sin(at) Abbildung 15.2 Abbildung 15.3 3. Inverse Laplace-Transformat ion (Rücktransformation) Aus der Bildfunktion erhält man die Originalfunktion mit Hilfe der Umkehrformel C+IOO für t > 0, für t < 0 . {ISA
734 15 Integraltransformationen Der Integrationsweg dieses komplexen Integrals ist die Parallele Kep = c zur imaginären Achse, wobei Rep = c> a gilt Ist die Stelle t = 0 eine Sprungstelle, d h ist lim f(t) ^ 0 , dann gibt das Integral dort den Mittelwert -/(+0) an 15.2.1.2 Rechenregeln zur Laplace—Transformation Unter Rechenregeln versteht man im Zusammenhang mit Integraltransformationen die Abbildung von Operationen im Originalbereich auf andere Operationen im Bildbereich Im folgenden werden Originalfunktionen stets mit kleinen Buchstaben bezeichnet, die jeweils zugehörigen Bildfunktionen mit den entsprechenden großen Buchstaben. 1. Additions- oder Linearitätssatz Die LAPLACE-Transformation einer Summe ist gleich der Summe der LAPLACE-Transformierten, wobei konstante Faktoren vor das LaplACE-Integral gezogen werden können (Ai, , An Konstanten): £{Ai/i(*) + A2/2(«) + • • 4- \nfn(t)} = \lF1(p) + A2F2(p) + • • • + XnFn(p). A5 9) 2. Ähnlichkeitssätze Die LAPLACE-Transformierte von f(at) (a > 0, a reell) ergibt eine LAPLACE-Transformierte, die gleich der Transformierten der durch a dividierten Originalfunktion ist, aber mit dem Argument p/a. C{f(at)} = -f(-) (o > 0, reell). A5 10a) In Analogie dazu gilt für die Rücktransformation F^ = lc{fQ}- A510b) Die Abb. 15.3 zeigt die Ahnlichkeitstransformation am Beispiel einer Sinusfunktion ¦ Berechnung der LAPACE-Transformierten von f(t) = sin(o;t). Die Korrespondenz für die Sinusfunktion lautet C{sin(ut)} = F(p) = l/(p2 + 1). Die Anwendung des Ahnlichkeitssatzes liefert £{sm(ut)} = F(p/u>) = - l = -^-—2 Lü (p/LüJ + 1 P2 + Lü2 3. Verschiebungssätze 1. Verschiebung nach rechts Die LAPLACE-Transformierte einer um a (a > 0) nach rechts verschobenen Originalfunktion ist gleich der LAPLACE-Transformierten der nicht verschobenen Originalfunktion, multipliziert mit dem Faktor e~ap- C{f(t-a)} = e-a?F(p) A5 11a) 2. Verschiebung nach links Die LAPLACE-Transformierte einer um a nach links verschobenen Originalfunktion ist gleich der mit dem Faktor eap multiplizierten Differenz aus der LAPLACE-Trans- a formierten der nicht verschobenen Originalfunktion und dem Integral / f(t) e~pt dt o C{f(t + a)} = eap [f(P) - £e-ptf(t)dtj . A5 IIb) Die Abb. 15.4 und 15.5 zeigen die Rechtsverschiebung einer Kosinusfunktion und die Linksverschiebung einer Geraden 4. Dämpfungssatz Die LAPLACE-Transformierte einer mit dem Faktor e~bt gedämpften Originalfunktion ist gleich der LAPLACE-Transformierten mit dem Argumentp + b (b beliebig komplex): C{e-btf(t)} = F(p + b). A5.12)
15.2 Laplace-Transformation 735 Abbildung 15.4 Abbildung 15 5 5. Differentiation im Originalbereich Wenn die Ableitungen /'(£), /"(£), • ., f^{t) für t > 0 existieren und die höchste auftretende Ableitung von f(t) eine Bildfunktion besitzt, dann haben auch die niedrigeren Ableitungen einschließlich f(t) eine Bildfunktion, und es gilt: £{/'(*)} = pF(p)-/(+0), £{f"(t)} = p>F(p)-f(+0)p-f(+0l C{f{n)(t)} = pnF(p) - /(+0)p"-1 - /'(+0)^-2 - - /(n-2)(+0)p - /(n-1}(+0) mit /W(+0)=tlimo/M(«). A5.13) Aus der Gleichung A5.13) ergibt sich die folgende Darstellung des LAPLACE-Integrals, die zur genäherten Berechnung von LAPLACE-Integralen genutzt werden kann* A5.14) 6. Differentiation im Bildbereich C{tnf(t)} = (-irF^(p). A5.15) Die n-te Ableitung der Bildfunktion ist gleich der LAPLACE-Transformierten der mit (—t)n multiplizierten Originalfunktion f(t): C{(-l)ntnf(t)} = F^(p) (n=l,2,...). A5 16) 7. Integration im Originalbereich Die Bildfunktion eines Integrals über die Originalfunktion ist gleich der Bildfunktion der Originalfunktion, multipliziert mit l/pn (n > 0). CUdnJdT2.. J f(Tn)dTn\=jj^^CU(t-T)Wf(T)dT\ = ±F(p). A5.17a) ialfall des gewöhn {/H-i Im Originalbereich heben sich Differentiation und Integration gegenseitig auf, wenn die Anfangswerte verschwinden 8. Integration im Bildbereich ci^\ = jdp1jdp2 J F(pn)dpn = —^—J(z-p)n-1F(z)dz. A5.18) Im Spezialfall des gewöhnlichen einfachen Integrals gilt: C\f i(r)dr\ = -F(p). A5 17b)
736 15. Integraltransformationen Diese Formel gilt nur, wenn f(t)/tn eine LAPLACE-Transformierte besitzt. Dazu muß f(x) für t —? 0 genügend stark gegen Null streben Als Integrationsweg kann ein beliebiger, von p ausgehender Strahl gewählt werden, der mit der reellen Achse einen spitzen Winkel bildet. 9. Divisionssatz Im Spezialfall n = 1 von A5 18) gilt: «{f}-7™*. A5 19) /(*) Damit das Integral A5.19) existiert, muß der Grenzwert lim existieren. 10. Differentiation und Integration nach einem Parameter df(t,a)\ dF(p,a) da da A5 20a) Cl f f(t,a)da\= j F{t,a) )da. A5.20b) Mit Hilfe dieser Formeln kann man manchmal LAPLACE-Integrale aus bereits bekannten berechnen 11. Faltung 1. Faltung im Originalbereich Als Faltung zweier Funktionen fi(x) und f2(x) bezeichnet man das Integral /i */2 = //i(r) - f2(t-r)dr A5 21) Die Gleichung A5 21) wird auch einseitige Faltung im Intervall @, t) genannt. Eine zweiseitige Faltung tritt bei der FOURIER-Transformation (Faltung im Intervall (—oo, oo)) auf (s. 15.3.1.3,9., S 752). Die Faltung A5.21) besitzt die Eigenschaften a) Kommutatives Gesetz: fx * f2 = f2 * /i, A5.22a) b) Assoziatives Gesetz: (/i * f2) * /3 = /i * (f2 * f-s), A5 22b) c) Distributives Gesetz: (/x + f2) * /3 = /i * h + h * h ¦ A5.22c) Abbildung 15.6 Im Bildbereich entspricht der Faltung die gewöhnliche Multiplikation: £{/i * f2} = F1(p) • F2(p). A5 23) In Abb. 15.6 ist die Faltung zweier Funktionen graphisch dargestellt Man kann den Faltungssatz zur Bestimmung der Originalfunktion wie folgt benutzen- 1. Faktorisierung der Bildfunktion F(p) = fl(p) • F„(p) 2. Ermittlung der Originalfunktionen fi(t) und f2(t) der Bildfunktionen F\(p) und F2(p) gemäß Tabelle 3. Bildung der Originalfunktion durch Faltung von fi(t) mit f2(t) im Originalbereich gemäß f(t) = fi{t) * f2(t), die zur gegebenen Bildfunktion F(p) gehört.
15.2 Laplace-Transformation 737 2. Faltung im Bildbereich (komplexe Faltung) rci+ioo 2?ri C{fi{t) - f2(t)} = ^ j F1{z).F2{p-z)dz, xi-ioo X2+ic>0 - f F1(p-z)-F2(p)dz A5.24) Die Integration erfolgt längs einer Parallelen zur imaginären Achse. Im ersten Integral müssen x\ und p so gewählt werden, daß z in der Konvergenzhalbebene von £{/i} liegt und p — z in der Konvergenzhalbebene von C{f2} . Entsprechendes gilt für das zweite Integral. 15.2.1.3 Bildfunktionen spezieller Funktionen 1. Sprungfunktion Der Einheitssprung bei t = t0 wird durch die Sprungfunktion (Abb. 15.7) (s. auch 14 4.3 2,3., S. 719), auch HEAViSiDEsc/ie Sprung-oder Einheitsfunktion genannt, «(*-*>)={5 £'*<*,• (fo>0) A525) vermittelt ¦ A: /(*) = u{t - t0) sinut, F(p) = e"*oP £— (Abb.15.8) pz + uz B: f(t) = u{t - t0) srncü {t - t0), F{p) = e~toP p2 +u2 l\ f(t) U(t-tn) u(t-t0) sin cot (Abb.15.9) 1ff(t) u(t-t0) sin co(t-t0) Abbildung 15 7 Abbildung 15.8 Abbildung 15 9 2. Rechteckimpuls Ein Rechteckimpuls der Höhe 1 und der Breite T (Abb. 15.10) entsteht durch Überlagerung zweier Sprungfunktionen in der Form @ für t < to , uT{t - to) = u{t - to) - u{t - to - T) = l 1 für to < * < *o + T, { 0 für t > t0 + T; A5 26) £{uT(t - to)} - e-**(l - e-T*>) A5 27) 3. Impulsfunktion (Diracsche Delta-Funktion) (s. auch 12.9.5, S. 662) Die Impulsfunktion 5(t - t0) ist anschaulich als Grenzfall eines Rechteckimpulses der Breite T und der Höhe 1/T an der Stelle t = to interpretierbar (Abb. 15.11): S(t - to) = Hm ~[u(t - to) - u(t -to- T)]. A5.28)
738 15 Integraltransformationen ff(t) K(t) lt uT(t-tp) T| 0 tn Abbildung 15 10 Für eine stetige Funktion h{t) gilt b jh(t)S(t-t0)dt=S[^to^ Abbildung 15.11 falls t0 innerhalb (a, b), falls t0 außerhalb (a, b). Beziehungen der Art du{t — to) 8(t -t0) = - dt C{5(t-t0)} = e-t»p (*0>0) A5.29) A5 30) werden im allgemeineren Sinne in der Distributionstheorie untersucht (s 12 9 5 3, S. 661). 4. Stückweise differenzierbare Funktionen Die Bildfunktionen stückweise differenzierbarer Funktionen lassen sich mit Hilfe der E-Funktion leicht angeben Wenn f(t) stückweise differenzierbar ist und an den Stellen tv (y = 1,2,..., n) die Sprünge au hat, dann ist ihre erste Ableitung in der Form dfit) dt ¦¦ fs(t) + a!Ö(t - *i) + a26{t - t2) + • • • + an5(t - tn) A5 31) darstellbar, wobei in den Bereichen, in denen f(t) differenzierbar ist, f's(t) die gewöhnliche Ableitung von f(t) bedeutet Wenn Sprünge erst in den Ableitungen auftreten, gelten für diese ganz entsprechende Formeln. Auf diese Weise lassen sich die Bildfunktionen zu Kurvenzügen, die sich aus Parabelbögen beliebig hoher Ordnung zusammensetzen (empirisch gefundene Kurven wird man meist durch solche einfachen Funktionen annähern), ohne großen Rechenaufwand angeben. Bei formaler Anwendung von A5.13) sind im Falle einer Sprungstelle die Werte /(+0), /'(+()), gleich Null zu setzen. - b für 0 < t < t0 , sonst, A: f(t) = / at + l 10 (Abb.15.12), f'(t) = aut0(t) + bS{t) - {at0 + b)S{t - t0), WM} = -A " e"i0P) + b - (ato + b) e'^ ; P ¦ B: f(t) = £{f(t)} ¦¦ ¦ + b- \P + at0 + b | 2«o- 10 für 0 < t < t0 , - * für *o < * < 2*o . (Abb.15.13) , f'(t) ¦¦ für t>2t0, C für 0 < t < t0 , 1 für t0<t<2t0, (Abb.15.14), 0 für t > 2*o , (!_e-toPJ /"(*) = 6(t)-6(t-t0)-ö(t-to)+6(t-2t0); £{f"(t)} = l-2e"^+e-2^ ; £{f(t)} = 2 IEt/to für 0<*<*0, -E(t-T)/t0Z T-V<t~<T\ (Abb.15.15); 0 sonst.
15.2 Laplace-Transformaüon 739 f(t) 1 0 'f'(t) to 2tö . t Abbildung 15 12 Abbildung 15 13 Abbildung 15 14 IE/t0 für 0 < t < c0 , 0 für c0 < c <T-c0, (c>T), ,AUU-K-Äv -E/to für T-co<c<T, (Abb.15.16); 0 sonst, /"(«) = !^S(t)-f-S(t-t0)~6(t-T+t0)+^5(t-T); £{/"(<)} = §¦ f 1 - e"*» - e-<T-">>* + e*] , Co to CO *o Co L Ell- e~toP)( 1 - e-(T-*°)p) f(t) tn .t*'« Itn T-tn T Abbildung 15 15 D: /(*) = { t - t2 für 0 < t < 1, 0 sonst, (Abb.15.17); /'(*) = {J Abbildung 15.16 1 - 2* für 0 < * < 1, sonst, (Abb.15.18); f"(t) = -2ul{t) + 6(t) + 6{t-l), o i 4- p-p 2 n — p~p) arm = -fr - o +1+e-, c{m} = ±±£_ - 2-^j , 1/4 f(t) 1/2 1 t Abbildung 15 17 Abbildung 15 18 5. Periodische Funktionen Die Bildfunktion einer periodischen Funktion f*(t) mit der Periode T, die durch periodische Fortsetzung einer Funktion f(t) entsteht, ergibt sich aus der Laplace- Transformierten von f(t), multipliziert mit dem Periodisierungsfaktor (l-e-Tp)-1. A5.32)
740 15. Integraltransformationen ¦ A: Die periodische Fortsetzung von f(t) aus Beispiel B (s. oben) mit der Periode T = 2£0 ergibt (l _ e-top\2 i i _ e-top /•« mit arm = i_—L. r_5; = ^^^. ¦ B: Die periodische Fortsetzung von f(t) aus Beispiel C (s. oben) mit der Periode T ergibt f*(t) mit _ g(l-e-^)(l-e-Cr-^) M/W|- W2A_e-rp) 15.2.1.4 Diracsche Delta-Funktion und Distributionen Bei der Beschreibung gewisser technischer Systeme durch lineare Differentialgleichungen treten häufig u(t) und S(t) als Stör- oder Eingangsfunktion auf, obwohl die in 15.2.1.1, S. 733 geforderten Voraussetzungen für die eindeutige Lösbarkeit nicht erfüllt sind: u(t) ist unstetig, 6{t) ist im Sinne der klassischen Analysis nicht definierbar. Einen Ausweg zeigt die Distributionstheorie durch die Einführung der sogenannten verallgemeinerten Funktionen (Distributionen), unter die sich z.B. die bekannten stetigen, reellen Funktionen und 8(t) einordnen lassen, wobei die notwendigen Differenzierbarkeitseigenschaften gewährleistet sind. Die Distributionen gestatten verschiedene Darstellungen Zu den bekanntesten gehört die von L. SCHWARTZ eingeführte stetige reelle Linearform (s. S. 660 und [12.14]) Den periodischen Distributionen lassen sich analog zu den reellen Funktionen FOURIER-Koeffizienten und FOURIER-Reihen eindeutig zuordnen (s 7 4, S 437). 1. Approximationen der Delta-Funktion Analog zu A5.28) kann die Impulsfunktion ö(t) durch einen Rechteckimpuls der Breite e und der Höhe l/e (e > 0) approximiert werden. /(^) = {o/£S:K>$: («33a) Weitere Beispiele für die Approximation von 6(t) sind Glockenkurven (s 2.6.3, S. 73) und Lorentz- Funktionen (s 2 11.2, S. 95) /(t,e) = _L=e-Ä (e>0), A5 33b) £V2n ^'£) = ^2 (£>°)- A533c) Allen diesen Funktionen sind die folgenden Eigenschaften gemeinsam oo 1. f f(t,e)dt = l. A5.34a) 2. /(—t, e) = f(t, e), d h , es sind gerade Funktionen. A5 34b) 3. Mm/(t,e) = {~^* = 5: A5.34c) 2. Eigenschaften der Delta-Funktion Wichtige Eigenschaften der ^-Funktion im Hinblick auf ihre Anwendung sind x+a 1. f f(t)S(t -x)dt = f{x) (/ stetig, a > 0). A5.35) x—a 2. ö{ax) = -6{x) (a > 0). A5.36) a
15 2 Laplace-Transformation 741 3. 5 (g(x)) = JT 1 S(x - xt) mit g(x{) = 0 und gf(x{) ^ 0 (i = 1,2, , n), A5.37) d h die Nullstellen von g(x) müssen einfach sein. Dabei sind sämtliche Nullstellen von g(x) zu berücksichtigen 4. n-te Ableitung der Delta-Funktion: Nach n-maliger partieller Integration erhält man aus x+a f{n\x) = f fin)(t) S(t - x) dt A5.38a) x—a eine Vorschrift für die ro-te Ableitung der 5-Funktion x+a (-l)nf{n\x) = J f(t) 6{n){t -x)dt. A5 38b) x—a 15.2.2 Rücktransformation in den Originalbereich Für die Rücktransformation in den Originalbereich stehen folgende Wege zur Verfügung. 1. Benutzung einer Tabelle zusammengehöriger Original- und Bildfunktionen, auch Korrespondenzen genannt (s Tabelle 21.13, S. 1097) 2. Zurückführung auf bekannte Korrespondenzen durch Umformung (s. 15 2.2.2, S. 741 und 15 2 2 3, S 742). 3. Auswertung der Umkehrformel (s. 15 2.2 4, S. 743). 15.2.2.1 Rücktransformation mit Hilfe von Tabellen Die Benutzung der Tafeln wird hier an einem Beispiel aus Tabelle 21.13, S 1097 demonstriert. Weitere ausführliche Tafeln sind in [15.3] enthalten F(P) = TT-r^TT-äT ^ F^P) • F2(P), C~1{F1{p)} = £-1 {^r^ \ = ^sin^ = /i(*)> 1 (p + C)(p2 + UJ2) " iVr/ ^V^/5 ~ r U^J *" \p2-\-LÜ2\ U) " C 1{F2(p)} = C l < > = e rf = /2(t) Durch Anwendung des Faltungssatzes A5 23) erhält man: f(t) =C-1{Fl(p).F2(p)} /•< /•' _c(t_T)smujT 1 /csmut-ucosut A = / /i W • /2(* -r)dr= e c[t T) dr = + e 15.2.2.2 Partialbruchzerlegung 1. Prinzip Häufig treten in den Anwendungen Bildfunktionen der Form F(p) = H(p)/G(p) auf, wobei G(p) ein Polynom in p darstellt Hat man die Originalfunktionen zu H(p) und 1/G(p) gefunden, dann erhält man die gesuchten Originalfunktionen zu F(p) durch Anwendung des Faltungssatzes 2. Einfache reelle Nullstellen von G(p) Hat die Bildfunktion l/G(p) nur einfache Pole pu (y = 1.2, , n), dann gilt für sie die Partialbruchzerlegung 1 n 1 W)=^G>(Pv)(p-p„) A5-39) Daher lautet die zugehörige Originalfunktion ^-^{mhtö^rr A540) 3. Heavysidescher Entwicklungssatz Ist die Zählerfunktion H(p) ebenfalls ein Polynom von p, aber von niedrigerem Grade als G(p), dann erhält man die Originalfunktion zu F(p) mit Hilfe der nach
742 15. Integraltransformationen Heavyside benannten Formel /W = E^H^* A5-41) 4. Komplexe Nullstellen Treten komplexe Wurzeln im Nenner auf, dann kann man den Heavysi- DEschen Entwicklungssatz in der gleichen Weise anwenden. Man kann auch jeweils konjugiert komplexe Glieder, die im Falle komplexer Nullstellen stets vorhanden sein müssen, zu einem quadratischen Ausdruck zusammenfassen, dessen Rücktransformation wie auch im Falle mehrfacher Nullstellen von G(p) mit Hilfe der Tabelle der Korrespondenzen durchgeführt werden kann. ¦ FW = t .!¦ wV 2^ . d-h" #(P) = 1» G(P) = (P + C)(P2 + ^2) i G'(P) = 3P2 + 2PC + ^ • Die (p + c){pl +uz) Pole pi = — c, p2 = iio, ps = —ioJ sind sämtlich einfach Nach dem HEAVisiDEschen Satz erhält man /(«) * -M 1 1 uj2 + c2 2cj(o; — ic) 2u (u + ic) spondenztafel F(p) = ÜJZ + CZ 1 c — p ¦ + p + C p2 +ÜJ' f(t) = —s ö U c* + — sinwt - coswt Die ur + c2 L o; J 71=0 beiden Ausdrücke für /(£) sind identisch. 15.2.2.3 Reihenentwicklungen Um f(t) aus F(p) zu gewinnen, versucht man bisweilen, F(p) in eine Reihe F(p) = £ Fn(p) zu entwickeln, deren Glieder Fn(p) bekannte Bildfunktionen sind, d.h. Fn(p) = C[fn(t)]. 1. F(p) - eine absolut konvergente Reihe Wenn F(p) in eine für |p| > R absolut konvergente Reihe der Form f(P) = ££ A5.42) n=0P entwickelt werden kann, wobei die An eine beliebig aufsteigende Zahlenfolge 0 < A0 < Ai < • • • < An < ...<..._? oo bilden, so ist eine gliedweise Rücktransformation möglich: /(*) = EflnrnM- A543) n=0 1 \Än) Mit r ist die Gammafunktion (s. 8.2.5,6., S. 478) bezeichnet. Speziell erhält man für An = n + 1, =o n! Außerdem ist eine Abschätzung in der Form \f(t)\ < Cec,t|, (C, c reelle Konstanten) möglich. d.h. F(p) = J2 "* , die Reihe /(£) = £ ~~^T~ ^n > die für alle reellen und komplexen t konvergiert. 1 1 / 1 V1/2 °° /_I\ 1 ¦ F(p) = . - = - ( 1 + — ) = Y[ o o , n • Nach glied weiser Transformation in den Vl+T P\ PJ > ^o\ n J P2n+1 oo / 1\ ±2n oo /_i\n , + \2n Oberbereich erhält man f(t) = ^ B fe) = Yl \\2 (ö) = ^°W (BESSEL-Funktion n=o \ n / Bn) n=o(n-) ^2' 0-ter Ordnung). 2. F(p)- eine meromorphe Funktion Ist F(p) ist eine meromorphe Funktion, die sich als Quotient zweier ganzer, also in überall konvergente Potenzreihen entwickelbare Funktionen ohne gemeinsame Nullstellen darstellen läßt, und die daher in eine Summe aus einer ganzen Funktion und unendlich
15 2 Laplace-Transformation 743 vielen Partialbrüchen zerlegbar ist, dann gilt der Zusammenhang -. c+iyn n -i - J e*»F(PLp=5>e»'t- — J <PF<P)dp. 2m A5.44) (Kn) Dabei sind die pv {y = 1,2,.. , n) Pole 1 Ordnung der Funktion F(p), die bv die zugehörigen Residuen (s 14 3 5 4, S 716), die yv gewisse Ordinaten und Kv gewisse Kurvenzüge, etwa Halbkreise in der in Abb. 15.19 angedeuteten Art. Die Lösung f(t) erhält man in der Form oo 1 /" /(*) = E *>»<?"* > wenn ^ I etpF(p) dp -> 0 2?ri A5.45) (Kn) für y —> oo strebt, was allerdings nicht immer leicht nachzuweisen ist. .-— l (fä 7n 73 72 7i X -7i 2 3 -7n 7' B^ CTT^ \ *N jco ^ J -jco -~p_ 7n X n Abbildung 15.19 Abbildung 15 20 In manchen Fällen, wenn z.B. der rationale Anteil der meromorphen Funktion F(p) identisch Null ist, bedeutet das eben gewonnene Ergebnis eine formale Übertragung des HEAVYSlDEschen Entwicklungssatzes auf meromorphe Funktionen. 15.2.2.4 Umkehr integral Die Umkehrformel C+ij/n / etpF(p)dp A5 46) /(*)= lim -^ stellt ein Integral mit komplexem Weg über eine in gewissen Gebieten analytische Funktion dar, auf das solche Methoden der Integration im Komplexen wie die Residuenrechnung oder die Verformung des Integrationsweges nach dem Satz von CAUCHY anwendbar sind P F(p): ''+UJ- -e ^ ist wegen des Anteiles y/p doppeldeutig Deshalb wird folgender Integrationsweg gewählt (Abb.15.20): 2?ri (K) p2 + u2 .|...+|... + |... + |... + |... = £Rese*F(p): e avw/2 cos(a;t - Qy^) • Nach dem Lemma von JORDAN (s. 14.4.3, S. 717) verschwinden die Integralteile über AB und CD für yn —*¦ oo. Auf dem Kreisbogen EF (Radius e) bleibt der Integrand beschränkt, (und die Länge des Integrationsweges konvergiert gegen Null für £ —> 0; daher verschwindet dieser Integralbeitrag Es bleibt das Integral über die beiden horizontalen Strecken BE und FC zu untersuchen, wobei das obere (p = reln) und untere (p = re~m) Ufer der negativen reellen Achse zu berücksichtigen sind-
744 15 Integraltransformationen F(p)etpdp = - e~tr- -e~ia^rdr, / F{p)etpdp = e~tr- -eia^ dr -oo Jo rl + or Jo Jo rl + ujz Damit erhält man endgültig: 15.2.3 Lösung von Differentialgleichungen mit Hilfe der Laplace—Transformation Schon aus den Rechenregeln für die LAPLACE-Transformation (s. 15.2 1 2, S. 734) ist zu erkennen, daß durch Anwendung der LAPLACE-Transformation komplizierte Operationen im Originalbereich wie Differentiation oder Integration durch einfache algebraische Operationen im Bildbereich ersetzt werden können. Dabei müssen allerdings, z.B. bei der Differentiation, noch Anfangsbedingungen berücksichtigt werden Von dieser Tatsache macht man bei der Lösung von Differentialgleichungen Gebrauch 15.2.3.1 Gewöhnliche Differentialgleichungen mit konstanten Koeffizienten 1. Prinzip Die Differentialgleichung n-ter Ordnung y{n\t) + cn_! y{n-l\t) + • • • + Cl y'(t) + c0 y(t) = f(t) A5 47a) mit den Anfangswerten y{+0) = y0, J/'(+0) = yf0,... ,y(n-1)(+0) = y^'^ Sent durch LAPLACE- Transformation in die Gleichung J2 ckPkY(p) -Y,ck SV-"-1!^ = F{p) (Cr, = 1) A5.47b) k=0 fc=l i/=0 n über. Dabei ist G(p) = ^2 CkP — 0 die charakteristische Gleichung der Differentialgleichung (s. 4 5 2 1. k=0 S. 287 und 9.1.2.4, S. 520). 2. Differentialgleichung 1. Ordnung Original- und Bildgleichung lauten. y'{t) + coy(t) = f(t), y(+0) = y0i A5 48a) (p + cq) Y(p) - y0 = F(p), A5 48b) wobei Co = const gilt Für Y(p) ergibt sich dann Y{p) = m±JH A5.48c) P + co ' Spezialfall: Für f(i) = X eM* (A, ß const) erhält man A5 49a) Y(p) = 7 ^7 T + ~^- . A5-49b) (p-li)(p + co) p + co' v ; y(t) = -$—4* + (y0 - —M e~CQt A5 49c) 3. Differentialgleichung 2. Ordnung Original- und Bildgleichung lauten- y"{t) + 2ay'(t) + 6j/(t) = /(*), j/(+0) = </0, </(+0) = y0. A5 50a) (p2 + 2ap + b) Y(p) - 2ay0 - (py0 + y'0) = F(p) A5.50b) Für y(p) ergibt sich dann F(P) + Ba + P)yo + y'0 KFJ p2 + 2ap + 6 K J
15 2 Laplace-Transformation 745 Fallunterscheidungen: a) b < a2 - G{p) = (p — &i)(p — a2) (ai - a2 reeü" i ai ¥" a2), A5 51a) q{t) = (eait - ea2t) A5 51b) 0L\ — «2 b) b = a2. G(p) = (p-aJ, A5.52a) q(t) = teat. A552b) c) b>a2. G{p) hat komplexe Nullstellen, A553a) 1 q(t) = , e~ai sin Vb - a2t A5 53b) yb — a2 Die Lösung y(t) erhält man dann durch Faltung der Originalfunktionen des Zählers von Y(p) mit q(t) Die Anwendung der Faltung wird man zu vermeiden und die rechte Seite möglichst direkt zu transformieren suchen ¦ Die Bildgleichung für die Differentialgleichung y"(t) + 2y'(t) + I0y(t) = 37 cos 3t + 9e~l mit y0 = 1 , , nl -,. x p + 2 37p 9 und y0 = 0 lautet Y(p) = p2 + 2p + 1Q + {p2 + g)(^ + 2p + 1Q) + {p + l){p2 + 2p + 1Q) • Durch Partialbruchzerlegung des zweiten und dritten Terms der rechten Seite, wobei man die quadra- —p tischen Ausdrücke nicht in Linearfaktoren zerlegt, erhält man die Darstellung Y(p) = —z— — — & 6 Kyj p2 + 2p + 10 7-r— — 4- -r-^ 7 + -r-z—^T + i t und nach gliedweiser Transformation (s Tafel der Kor- (p2 + 2p+10) (p2 + 9) (p2 + 9) (p+1) 6 V respondenzen 21.13, S 1097) die Lösung y(t) = (— cos 3t — 6 sin 3t)e~* + cos 3t + 6 sin 3t + e~l 4. Differentialgleichung n-ter Ordnung Die charakteristische Gleichung G(p) = 0 dieser Differentialgleichung habe nur einfache Wurzeln ai,a2,...,an) von denen keine gleich Null ist. Für die Störfunktion f(t) können zwei Fälle betrachtet werden 1. Ist die Störfunktion f(t) gleich der in der Praxis häufig auftretenden Sprungfunktion u(t), dann lautet die Lösung: ««={5 £! < o; (is ^) *> -w)+t ^kf" ¦ A5-54b) 2. Für eine allgemeine Störfunktion f(t) erhält man die Lösung y(t) aus A5 54b) in Gestalt der Du- HAMELschen Formel, die die Faltung (s. 15.2.1 2,11., S. 736) benutzt: m = dtly{t~ T)/(r) dT = It[y * /] A5-55) o 15.2.3.2 Gewöhnliche Differentialgleichungen mit veränderlichen Koeffizienten Differentialgleichungen, deren Koeffizienten Polynome in t sind, eignen sich besonders für die Anwendung der LAPLACE-Transformation Nach Anwendung der Gleichung A5.16) erhält man zwar im Bildbereich wieder eine Differentialgleichung, ihre Ordnung kann jedoch niedriger sein. Sind speziell die Koeffizienten Polynome 1 Grades, dann ist die Differentialgleichung im Bildbereich von 1 Ordnung und dadurch meist leicht lösbar. d2f df t—- H dt2 dt Die Transformation im Bildbereich ergibt
746 15. Integraltransformationen ~[p2F(p)-pf@)-f@)]+pF(p)-f@)-^-==0 oder 1-=—JL-F{p). pdp jC.^1*)l = pC{u(x,t)}-u(x,+0), /Vdp l ——- = — log Jp2 + 1 + log C, pl + 1 v C F(p) — . . (C Integrationskonstante), F(t) = CJo(t) (s. Beispiel S. 742 unten). VP + 1 15.2.3.3 Partielle Differentialgleichungen 1. Allgemeine Vorgehensweise Die Lösung einer partiellen Differentialgleichung ist eine Funktion mindestens zweier Variabler: u = u(x, t). Da die LAPLACE-Transformation eine Integration bezüglich einer Variablen darstellt, ist die andere Variable bei der Transformation als konstant zu betrachten oo £{u(x,t)} = f e-ptu(x,t)dt = U(x,p). A5.56) o Auch bei der Transformation von Ableitungen bleibt x fest. , j du(x, )&ult)\ A557) dp\ = ^W1'*^ " «(*.+°)P- ««(*.+<>) Für die Ableitungen nach x ist vorauszusetzen, daß sie mit dem LAPLACE-Integral vertauschbar sind Damit erhält man im Unterbereich eine gewöhnliche Differentialgleichung Außerdem sind die Rand- und Anfangsbedingungen in den Bildbereich zu transformieren 2. Lösung der eindimensionalen Wärmeleitungsgleichung für ein homogenes Medium 1. Problemstellung Die eindimensionale Wärmeleitungsgleichung mit verschwindendem Störglied und für ein homogenes Medium sei in der Form uxx ~ a~2ut = uxx-uy = 0 A5 59a) in dem Grundgebiet 0<£<oo,0<:r</ und mit den Anfangs- und Randbedingungen u(x,+0) =u0(x), u(+0,£) = a0{t), u{l-0,t) = a^t) A5 59b) gegeben Die Zeitkoordinate wurde durch die Substitution y = at ersetzt Wie die dreidimensionale Wärmeleitungsgleichung (s. 9.2.3.3, S. 556), so ist auch A5.59a) vom parabolischen Typ. 2. Laplace-Transformation Die Bildgleichung lautet d2U — =pU-u0{x), A5.60a) die Randbedingungen sind C/(+0,p) = A0(p), U(l - 0,p) = Ax(p) A5.60b) Die Lösung der Bildgleichung lautet dann U{x,p) = cYex^> + c2e~x^. A5 60c) Es ist von Vorteil, zunächst zwei Partikulärlösungen U\ und U2 mit den Eigenschaften tfi@,p) = l, C/i(Z,p) = 0, A5 61a) C/2@,p) = 0, U2(l,p) = l, A5 61b) herzustellen, d h
15.3 Fourier- Transformation 747 U^'P)= e^-e-'Vr ¦ A5-61c) Ut(x,p)= t,vf_r,)j. A5.61d) Die gesuchte Lösung der Bildgleichung hat dann die Form U(x,p) = A0(p) Ux{x,p) + Al(p) U2(x,p) A5.62) 3. Rücktransformation Die Rücktransformation ist im Falle / —> oo besonders einfach und liefert C/(x,p) = ao(p)e-^, A5 63a) u{x,t) = ^= f ^'^ exp (~\ dr A5.63b) 15.3 Fourier-Transformation 15.3.1 Eigenschaften der Fourier—Transformation 15.3.1.1 Fourier-Integral 1. Fourier-Integral in komplexer Darstellung Grundlage der FOURIER-Transformation ist das FOURIER-Integral, auch Integralformel von FOURIER genannt. Falls eine nichtperiodische Funktion f(t) in einem beliebigen endlichen Intervall den DiRiCHLETschen Bedingungen genügt (s. 7.4 1.2,3., S 438) und außerdem das Integral +oo +oo +oo / |/(t)| dt A5 64a) konvergiert, dann gilt /(*) = —-/"/" e1^'^ f {r) dwdr A5.64b) — OO — OO —OO in jedem Punkt, in dem die Funktion f(t) stetig ist, und /(t + 0)t/(*-0) = i 7 du, 7/(r) cos u, (i - r) dr A5 64c) 2 TT J J 0 -oo in den Unstetigkeitsstellen 2. Äquivalente Darstellungen Andere äquivalente Formen der Darstellung des FOURIER-Inte- grals A5 64b) sind +oo +oo 1. f(t) = ~ J J f(r)cos[uj(t-T)}dudT A565) 2. f(t) = / [a(u) cos cot + fc(u;) sincjt] diu mit den Koeffizienten A5.66a) o +00 +00 a(u;) = - / f(t)cosiütdt, A5 66b) &(<j) = - / f (t)sinwtdt. A5 66c) TT J TT J —00 —00 00 3. f(t)= f A(u) cos [ujt + iP{üj)} du A5.67) 0 4. /(*) = /" i4(w) sin [ut + y?((j) ] du A5.68)
748 15. Integraltransformationen Dabei gelten die folgenden Beziehungen: A(u) = yja2{u) + b2(u;), A5 69a) <p(u) = V>M + ^ , A5 69b) cos^(o;) = -^4, A5.69c) sin^(w) = -^4-, A5 69d) cos <p(u) = ^r, A5.69e) sin ip(cü) = -^. A5 69f) 15.3.1.2 Fourier-Transformation und Umkehrtransformation 1. Definition und Existenz der Fourier-Transformat ion Die FOURIER-Transformation ist eine Integraltransformation der Form A5.1a), die aus dem FOURIER- Integral A5.64b) dadurch entsteht, daß man +oo F(u)= f e-'WTf(T)dT A5 70) —oo substituiert. Damit erhält man den folgenden Zusammenhang zwischen der reellen Originalfunktion f(t) und der im allgemeinen komplexen Bildfunktion F(u). +oo }{t) = — j e^F{uü)dw. A5 71) —oo In der Kurzschreibweise verwendet man das Zeichen T. +oo F(w) = T{ f(t) } = J «-•"«/(*) * • A5 72) — OO Die Originalfunktion f(t) heißt FoURlER-transformierbar, wenn das Integral A5.70), also ein uneigentliches Integral mit dem Parameter u , existiert. Wenn das FOURI ER-Integral nicht als gewöhnliches uneigentliches Integral existiert, ist es als CAUCHYscher Hauptwert zu verstehen (s. 8.2.3.3,1., S. 474) Die Bildfunktion F(u) nennt man auch Fourier-Transformierte; sie ist beschränkt, stetig und strebt für \u\ —* oo gegen Null: lim F(uj) = 0 A5.73) M—oo Existenz und Beschränktheit von F(u) folgen direkt aus der offensichtlich gültigen Ungleichung +oo +oo |F(w)| < / |e-«"*/(*)l dt < J |/(t)| dt. A5.74) —oo —oo Für die Stetigkeit von F(u>) und die Eigenschaft F(u) —> 0 für \u\ —* oo ist die Existenz der FOURIER- Transformierten eine hinreichende Bedingung. Diese Aussage wird häufig in folgender Form benutzt- Wenn die Funktion f(t) in (—oo , oo) absolut integrierbar ist, dann ist ihre FOURIER-Transformierte eine stetige Funktion von u , und es gilt A5.73). Die folgenden Funktionen sind nicht FoURlER-transformierbar: konstante Funktionen, beliebige periodische Funktionen (z.B. sin ut, cos ut), Potenzfunktionen, Polynome, Exponentialfunktionen (z.B eat, Hyperbelfunktionen). 2. Fourier—Sinus- und Fourier—Kosinus—Transformation In der FouriER-Transformation A5.72) kann der Integrand in Sinus- und Kosinusfunktionen zerlegt werden Dann ergibt sich die FOURIER-Sinus- bzw. -FoURlERKosinus-Transformation.
15.3 Fourier-Transformation 749 1. Fourier-Sinus-Transformation Ff \(üj) = Fs{ f(t) } = f f(t) sin (wt) dt. A5 75a) o 2. Fourier-Kosinus-Transformation oo Fc(uj) = Tc{ f(t) } = I f{t)cos(lüt)dt. A5 75b) 0 3. Umrechnungsformeln Zwischen der FOURIER-Sinus- A5 75a) und der FOURIER-Kosinus- Transformation A5 75b) einerseit und der FOURIER-Transformation A5.72) andererseits bestehen die folgenden Umrechnungsformeln FM = H f(t) } = rc{ f(t) + f(-t) } - \F,{ f(t) - f(-t) }, A5 76a) F5(a>) = ^{/(|t|)signi}, A5.76b) Fc(o,) = ^{/(t)}. A5.76c) Für gerade bzw ungerade Funktionen f(t) ergibt sich die Darstellung /(*) gerade. T{ f(t) } = 2TC{ f(t) } , A5 76d) f(t) ungerade- T{ f(t) } = -2iJ^s{ f{t) } A5 76e) 3. Exponentielle Fourier-Transformation Im Unterschied zu F(u) gemäß A5.72) wird +oo Fe{u) = re{f(t)} = - f e^f(t) dt A5.77a) —oo exponentielle FOURIER-Transformation genannt Es gilt F{u) = 2Fe(-w). A5.77b) 4. Tabellen der Fourier-Transformation Auf Grund der Formeln A5.76a.b,c) brauchen entweder keine speziellen Tabellen für Korrespondenzen der FOURIER-Sinus- und FOURIER-Kosinus-Transformation bereitgestellt zu werden, oder man tabelliert die FOURIER-Sinus- und FOURIER-Kosinus-Transformationen und berechnet daraus mit Hilfe von A5.76a,b,c) F(u) In Tabelle 21.14.1, s S 1103 und Tabelle 21.14.2, S. 1109) sind die FOURIER-Sinus-Transformation Tb und die FOURIER-Kosinus-Transformation Tc tabelliert, darüber hinaus in Tabelle 21.14.3, S 1114) für einige Funktionen die FOURIER-Transformationen T und in Tabelle 21.14.4, S 1116 für einige Funktionen die exponentiellen Fourier-Transformationen Te. ¦ Die Funktion des unipolaren Rechteckimpulses f(t) = 1 für \t\ < t0, f(i) = 0 für \t\ > t0 (A 1) (Abb.15.21) erfüllt die Voraussetzungen der Definition des FOURI ER-Integrals A5.64a). Man 1 f+to 2 erhält für die Koeffizienten gemäß A5 66b,c) a(u>) = — I cos utdt = —sin ujto und b{u) = 7T J-to 7TLÜ 1 f+to . , ^ / a ^x , , ^ / ~~ N „, N 2 f°° Sin Lü t() COS Lü t , , . „* - / sin ujtdt = 0 (A 2) und damit gemäß A5.66a) f(t) = - / du (A.3). 7T J-to TT Jo Lü 5. Spektralinterpretation der Fourier-Transformation In Analogie zur FOURIER-Reihe einer periodischen Funktion erfährt das FOURIER-Integral für eine nichtperiodische Funktion eine einfache physikalische Interpretation Eine Funktion f(t), für die das FOURIER-Integral existiert, kann gemäß A5 67) und A5 68) als Summe sinusoidaler Schwingungen mit der sich stetig ändernden Frequenz lü in der Form A(Lü)duj sm[Lüt + (p(Lü)}, A5 78a) A(üj) du cos [ut + tp(u)] A5.78b) dargestellt werden Der Ausdruck A(lü) du gibt die Amplitude der Teilschwingungen an und (p(u) und
750 15 Integraltransformationen f(t) -t0 0 Abbildung 15 21 Abbildung 15 22 i>(uj) deren Phasen Für die komplexe Schreibweise trifft die gleiche Interpretation zu Die Funktion f(t) ist eine Summe (bzw. Integral) von lü abhängigen Summanden des Typs _1_ 2^ F(u)duelu 1 A5 79) wobei die Größe —F(uj) sowohl die Amplitude als auch die Phase aller Teilvorgänge festlegt Diese spektrale Interpretation des FOURIER-Integrals und der FOURIER-Transformation bedeutet einen großen Vorteil für die Anwendung in Physik und Technik Die Bildfunktion A5.80a) F(u>) = |F(cj)|e^(u;) bzw \F(u)\ eiv(w) nennt man Spektrum oder Frequenzspektrum der Funktion f(t), die Größe \F{lj)\ =ttA(lü) A5 80b) das Amplitudenspektrum und ip(u) bzw tp(u) das Phasenspektrum der Funktion f(t). Zwischen dem Spektrum F(u) und den Koeffizienten A5 66b,c) besteht die Beziehung F(u) = n[a(u)-ib(u)], A5 81) woraus sich die folgenden Aussagen ergeben: 1. Ist f(t) eine reelle Funktion, dann ist das Amplitudenspektrum F(u) eine gerade und das Phasenspektrum eine ungerade Funktion von uj 2. Ist f(t) eine reelle und gerade Funktion, dann ist ihr Spektrum F(u) reell, ist f(t) reell und ungerade, dann ist das Spektrum F(u) imaginär ¦ Setzt man das Ergebnis (A.2) für den unipolaren Rechteckimpuls in 15.3.1.2,4., S. 749 in A5.81) ein, dann ergibt sich für die Bildfunktion F(u) und für das Amplitudenspektrum \F(u)\ (Abb.15.22) F(u) = F[f(t)] = 7ra{u) - 28mtJt° (A.3), \F(u>)\ = 2\8mU,t°\ (A.4). Die Berührungspunkte des Amplitudenspektrums |F(a;)| mit der Hyperbel — ergeben sich für u t0 üü 0,1,2. .) ±Bn + l)- in 15.3.1.3 Rechenregeln zur Fourier-Transformation Wie bei der Lapl ACE-Transformation bereits bemerkt, versteht man unter Rechenregeln im Zusammenhang mit Integraltransformationen die Abbildung gewisser Operationen im Originalbereich auf andere Operationen im Bildbereich. Wenn vorausgesetzt wird, daß die beiden Funktionen f(t) und g(t) im Intervall (—oo , oo) absolut integrierbar sind und ihre FOURIER-Transformierten F(u) = T{f{t)} und G(u>) = F{g(t)} A5 82) gebildet werden können, dann gelten die folgenden Regeln.
15.3 Fourier-Transformation 751 1. Additions-oder Linearitätssatz Sind a und ß zwei Koeffizienten aus (—00,00), dann gilt: T{ af(t) + ßg(t) } = aF(u) + ßG(u) A5.83) 2. Ähnlichkeitssatz oder Maßstabsveränderung Für a ^ 0 und reell gilt F{f(t/a)} = \a\F{au). A5.84) 3. Verschiebungssatz Für q^O, reell und ß reell gilt F{ f(at + ß) } = A/a) eißuj/aF(u/a) oder A5.85a) ^{/(^-^o)} = e-iwtoF(cj) A5.85b) Ersetzt man in A5.85b) to durch —10 , dann ergibt sich F{f(t + to)} = Ju}toF(u). A5.85c) 4. Dämpfungssatz Für a > 0 , reell und /? G (-00, 00) gilt T{ eißtf{at) } = {l/a)F{(u - ß)/a) oder A5.86a) F{J"otf(t)} = F(Lü-u0). A5.86b) 5. Differentiation im Bildbereich Ist tnf(t) FoURiER-transformierbar, dann gilt f{tnf{t)} = inFin){u), A5.87) wobei mit F^(uj) die n-te Ableitung von F(u) bezeichnet ist. 6. Differentiation im Originalbereich 1. Erste Ableitung Ist eine Funktion f(t) stetig und absolut integrierbar in (—00, 00) und strebt sie für t —> ±00 gegen Null und existiert, ausgenommen gewisse Punkte, überall die Ableitung f'(i), die in (—00,00) absolut integrierbar sein muß, dann gilt F{f(t)} = uF{ /(*)}. A5.88a) 2. n-te Ableitung Stellt man in der Verallgemeinerung des Satzes für die 1. Ableitung an alle weiteren Ableitungen bis zur (n — l)-ten /(n-1) die gleichen Anforderungen, dann gilt T{ /<"»(*) } = («m /(«)}• A5.88b) Diese Differentiationsregeln werden bei der Lösung von Differentialgleichungen angewendet (s. 15.3.2, S. 754). 7. Integration im Bildbereich Wenn die Funktion tnf(t) G (—00,00) absolut integrierbar ist, dann besitzt die FOURIER-Transfor- mierte der Funktion f(t) n stetige Ableitungen, die mit Hilfe von dkF(u;) _ 7° dk +°° dwk I ä7 [e""f/W] dt = ()fc / e-^/Wd* A5.89a) bestimmt werden Dabei ist k = 1,2,..., n, und es gilt: lim ^M = 0. A5 89b) u;^±oo düJk Unter den gemachten Voraussetzungen folgt aus diesen Beziehungen Htnf{t)}=in^m_^ A5.89c)
752 15. Integraltransformationen 8. Integration im Originalbereich und Parsevalsche Formel 1. Integrationssatz Wenn die Voraussetzung +oo ( t \ I f(t) dt = 0 A5.90a) erfüllt ist, dann gilt T \ f f(t) dt \ = —F{u) A5 90b) -OO l-CXD ) 2. PARSEVALsche Formel Wenn die Funktion f(t) sowie ihr Quadrat im Intervall (—00,00) inte- grierbar sind, dann gilt +00 +00 / \f(t)\2dt = - j \F(u)\2dw. A5 91) — OO —OO 9. Faltung Die zweiseitige Faltung +00 Mt) * Mt) = / Mr)Mt - r) dr A5 92) —oo bezieht sich auf das Intervall (—00,00) und existiert unter der Voraussetzung, daß die Funktionen fi(t) und f2(t) im Intervall (—00,00) absolut integrierbar sind. Wenn fi(t) und f2(t) beide für t < 0 verschwinden, dann ergibt sich aus A5.92) die einseitige Faltung fi(t) * f2(t) = \ l^T)f^-T)dT für *><>, A5.93) l 0 für t < 0 Diese ist somit ein Spezialfall der zweiseitigen Faltung. Während die FOURIER-Transformation die zweiseitige Faltung benutzt, verwendet die LAPLACE-Transformation die einseitige Faltung. Für die FOURIER-Transformation der zweiseitigen Faltung gilt H Mt) * Mt)} = H Mt)} • H Mt)}, A5 94) wenn die Integrale +00 +00 j\h(t)\2dt und f\f2{t)\2dt A5 95) —00 —00 existieren, d.h , die Funktionen und ihre Quadrate im Intervall (—00,00) integrierbar sind /+00 f(r)f(t — t) dr (A.l) für die Funktion des -00 unipolaren Rechteckimpulses (A.l) in 15 3 1 2,4., S 749 zu berechnen /to rt+to f(t -r)dT= / }{t) dr (A 2) gilt, ergibt sich für t < -2t0 und t > 2t0 ip{uj) = 0 -to Jt-to rt+to und für -2t0 <t<0 i/j(t) = dr = t + 2t0 (A 3) J-to fto In Analogie dazu ergibt sich für 0 < t < 2t0 ip{t) = / dr = -t + 2t0 (A.4) Jt-to Zusammengefaßt erhält man für diese Faltung (Abb. 15.23) (t + 2t0 für -2£0 < t < 0 , ij,(t) = f(t) * f(t) = l-t + 2to für 0 < t < 2t0 , (A 5) k 0 für \t\ > 2t0 . Für die FOURI ER-Transformierte erhält man mit (A.l) aus dem Beispiel für den unipolaren Rechteckimpuls (s. 15 3 1 2,4., S. 749 und Abb.15.21)
15.3 Fourier-Transformation 753 *(w) = H m } = F{ f(t) */(*)=[ F(u) ]2 = 4 und für das Amplitudenspektrum der Funktion f(t) |ir(a;)| = 2|?l5^| und|F(o;)|2: VW sin u t0 -2t0 0 2tn t ) - (A.6) (A7) , -2t0 0 -1 Abt q>(t) i |2*ö * )ildung 15 24 Abbildung 15.23 10. Vergleich von Fourier- und Laplace-Transformation Zwischen FOURIER- und LAPLACE-Transformation besteht ein enger Zusammenhang, der dadurch gegeben ist, daß sich die FOURIER-Transformation als Spezialfall der LAPLACE-Transformation für den Fall p = iu ergibt. Daraus folgt, daß jede FouRiER-transformierbare Funktion auch Laplace- transformierbar ist, während das Umgekehrte nur für einen kleineren Kreis von Funktionen f(t) möglich ist. Tabelle 15.2 enthält einen Vergleich einer Reihe von Eigenschaften der beiden Integraltransformationen Tabelle 15.2 Vergleich der Eigenschaften von Fourier- und LAPLACE-Transformation Four ier-Transfor mat ion F(u) = r{f{t)}= /V'(*)rf< -oo u ist reell, physikalisch deutbar, z B als Frequenz. Ein Verschiebungssatz. Intervall. (—oo,+oo) Lösung von Differentialgleichungen, die Probleme mit diesem zweiseitigem Definitionsbereich beschreiben, z.B. die Wellen-Gleichung. Differentiationssatz enthält keine Anfangswerte. Konvergenz des FOURIER-Integrals hängt nur von f(t) ab. Genügt der zweiseitigen Faltung Laplace-Transformation oo F(p) = C{f(t),p} = Je-^f(t)dt 0 p ist komplex, p = r + ix. Zwei Verschiebungssätze Intervall- [ 0, oo) Lösung von Differentialgleichungen, die Probleme mit diesem einseitigen Definitionsbereich beschreiben, z.B. die Wärmeleitungs-Gleichung Differentiationssatz enthält Anfangswerte. Konvergenz des LAPLACE-Integrals wird durch den Faktor e~pt verbessert. Genügt der einseitigen Faltung. 15.3.1.4 Bildfunktionen spezieller Funktionen ¦ A: Welche Bildfunktion gehört zur Originalfunktion f(t) = e-"'*', Rea > 0 (A 1)? Unter Berück- /+A e-^t-a\t\dt = ¦A /.' r+A ,. x -(iu;-a)*|0 e-i">-*)t dt + / e-{*>+a)t dt = _Z I i h iu — a e-(iw+o)t \uj + a -l + e(ia;~aM 1 -(iuj+a)A vjj + a (A.2). Da \e aA\ < e ARea und Rea > 0 ist, existiert der Grenzwert für A -* oo, so daß sich ergibt F(u,)=.F{e-«M} = -j^_(A.3)
754 15. Integraltransformationen ¦ B: Welche Bildfunktion gehört zur Originalfunktion f(t) = e a\ Re o > 0? Die Funktion ist nicht FoURiER-transformierbar, weil der Grenzwert A —> oo nicht existiert ¦ C: Es ist die FOURIER Transformierte für den bipolaren Rechteckimpuls (Abb.15.24) r 1 für -2t0 < t < 0 , ip(t) = { -1 für 0<t <2*0, (Cl) 1 0 für |*| > 2*o gesucht, wobei </?(*) durch die im Beispiel in 15 3 1.2,4., S 749 für den unipolaren Rechteckimpuls als (A 1) angegebene Gleichung ausgedrückt werden soll. Es ist ip(t) = f(t + *0) — f{t — *o) (C 2) Durch die FOURIER-Transformation gemäß A5.85b), A5 85c) erhält man $(u) = T{ ip{t) } = eiujt°F{uj) - . . . 2 sin lü to c?' CO ^.sinjWo (C4) e-iu,toF(uj), (C.3) woraus mit (A 1) folgt- <f>{u)) = (ei(Wo ¦ Lü Lü ¦ D: Bil-dfunktion einer gedämpften Schwingung Die in Abb. 15.25a dargestellte gedämpfte Scliwin- f * * > 0' Deschri^ben. Zur Vereinfachung der 3(-Q+iwo)t ermitt0it e-iute(-a+iUo)tdt = gung wird durch die Funktion fit) = \ _at . 66 J K ' \ e at cos üü0t Rechnung wird die FOURIER-Transformation der komplexen Funktion f*(t) — /•ex Es gilt f(t) = Re (/* (*)) Die FOURIER-Transformation liefert T{ /*(*)} = / Jo r Jo p(-«+(w -"o)itdt = -atp\(u> -öl + i(u;0 — lü) 1 a + i(a;o - u) ¦ i^o — u>) Das Ergebnis ist die a2 + (lü - üj0J ——-^ - (Abb.15.25b) (s auch 2 11 2. a2 + (u> - u;0J S 95)) Einer gedämpften Schwingung im Zeitbereich entspricht ein einziger Peak im Frequenzbereich Lorentz- oder Breit-Wigner Kurve T{ f(t) } ¦ )) Ein ltfW b) 0| Abbildung 15 25 Abbildung 15.26 15.3.2 Lösung von Differentialgleichungen mit Hilfe der Fourier—Transformation Ein wichtiger Anwendungsbereich der FOURIER-Transformation ist analog zur LAPLACE-Transfor- mation die Lösung von Differentialgleichungen, weil diese durch die genannten Integraltransformationen eine einfache Form erhalten Im Falle von gewöhnlichen Differentialgleichungen entstehen algebraische Gleichungen, im Falle von partiellen Differentialgleichungen gewöhnliche 15.3.2.1 Gewöhnliche lineare Differentialgleichungen Die Differentialgleichung für |*| < t0 , für \t\ > t0 , d.h. mit der Funktion f(t) von Abb.15.21, wird durch die FouriER-Transformation T{y{t)} = Y(u) y'(t) + ay(t) = f(t) mit /(*) = A für jo für A5.96a) A5 96b)
15 3 Fourier-Transformation 755 in die algebraische Gleichung kj Y + oY = 2smujt° A5.96c) überführt, so daß sich Y(u) = 2 Sm ^° . A5.96d) uj u(a + vjj) ergibt. Die Rücktransformation führt auf „(t)=^{y(w)} = ^'B-2^1 = 17^^^ A5.96e) und vW = @ i \l ¦!_e-a(t+to)j "e-o(t-t0) _ e-a(t-to)l für für für —00 < t < —t0, -t0<t< +*o, *0 < * < CXD . A5 96f) Die Funktion A5 96f) ist in Abb. 15.26 graphisch dargestellt. 15.3.2.2 Partielle Differentialgleichungen 1. Allgemeine Vorgehensweise Die Lösung einer partiellen Differentialgleichung ist eine Funktion mindestens zweier Variablen: u — u{x% t). Da die FOURIER-Transformation eine Integration bezüglich einer Variablen darstellt, ist die andere Variable bei der Transformation als konstant zu betrachten. Hier wird x festgehalten und die Transformation bezüglich t durchgeführt +00 T{u(x,t)}= f e-[uJtu(x,t)dt = U{x,u). A5 97) —00 Auch bei der Transformation von Ableitungen bleibt eine Variable fest, hier wieder t dM^'t} } = (i^)"^{ <x,t)} = (iw)» U{x,w). A5.98) Für die Ableitungen nach x ist vorauszusetzen, daß sie mit dem FOURIER-Integral vertauschbar sind: Damit erhält man im Bildbereich eine gewöhnliche Differentialgleichung. Außerdem sind die Rand- und Anfangsbedingungen in den Bildbereich zu transformieren. 2. Lösung der eindimensionalen Wellengleichung für ein homogenes Medium 1. Problemstellung Die eindimensionale Wellengleichung mit verschwindendem Störglied und für ein homogenes Medium lautet: uxx — utt — 0 A5 100a) Wie die dreidimensionale Wellengleichung (s. 9 2.3 2, S 555), so ist auch A5 100a) eine partielle Differentialgleichung vom hyperbolischen Typ. Das CAUCHYsche Problem sei durch die Anfangsbedingungen u{x, 0) = f(x) (-00 < x < 00), ut{x, 0) = g(x) @ < t < 00) A5.100b) korrekt gestellt 2. Fourier-Transformation Zur Lösung wird die FOURIER-Transformation bezüglich x durchgeführt, wobei die Zeitkoordinate konstant gehalten wird* F{u(x,t)} = U{u,t) A5.101a)
756 15. Integraltransformationen Daraus ergibt sich: (\uJU(u,t) - d2U^t) = 0 mit A5.101b) ?{ U(x, 0) } = U(ui, 0) = T{ f(x) } = F{u), A5.101c) T{ Ut(x, 0) } = U'{u, 0) = T{ g{x) } = G{u) A5 101d) uj2U + U" = 0. A5 101e) Das Ergebnis ist eine gewöhnliche Differentialgleichung für die nun wieder als Veränderliche zu betrachtende Zeitkoordinate t mit dem Parameter u der Bildfunktion. Die allgemeine Lösung dieser bekannten Differentialgleichung mit konstanten Koeffizienten lautet U(uj,t) = de"* + C2e~'lujt. A5 102a) Mit Hilfe der Anfangsbedingungen U{lj, 0) = C1+C2 = F(u) , U\u, 0) = iu d - iu C2 = G{u) A5 102b) lassen sich die Konstanten C\ und C2 bestimmen: C^JlFM + ^-GM], C2 = \[F{u)--G{u)). A5 102c) Z \U Z ILO Die Lösung ergibt sich zu U{u,t) = \[F{lj) + ^-G{uj)]eiu;t + \[F(lü) - ^G(u)}e~'iuJt. A5.102d) 2 iu 2 \u 3. Rücktransformation Zur Rücktransformation der Funktion F(u) kann der Verschiebungssatz, T{ f{ax + b) } = 1/a • eib"/aF{u/a), A5.103a) mit Vorteil eingesetzt werden, woraus sich ergibt F~l{ eiu,tF(u) } = f(x + t), T-l{e-{^F{uj)} = f{x- t) A5.103b) Die Anwendung der Integrationsregel r\ j f(r)dr l = -F(w) liefert A5.103c) X X X+f r^-GMe'^U J F-1{G(Lj)e["t}dT= J g(T + t)dr= f g(z)dz A5 103d) —oo — oo -oo nach Substitution s + t = z und analog x-t T~x l-—G{Lj)e-[ut\ = - f g(z)dz. A5.103e) —oo Die endgültige Lösung im Originalbereich lautet somit 1 1 • x+t «(*>t) = ^f{x + *) + -f(x -t)+ J g{z)dz. A5 104)
15 4 Z-Transformation 757 15.4 Z-Transformation In Natur und Technik kann man zwischen kontinuierlichen und diskreten Vorgängen unterscheiden Während sich von den kontinuierlichen Vorgängen viele durch Differentialgleichungen beschreiben lassen, führen diskrete Vorgänge häufig auf Differenzengleichungen Zur Lösung von Differentialgleichungen eignen sich besonders FOURIER- und LAPLACE-Transformationen, zur Lösung von Differenzengleichungen wurden andere, angepaßte Operatorenmethoden entwickelt. Die bekannteste ist die Z- Transformation, die in engem Zusammenhang mit der LAPLACE-Transformation steht 15.4.1 Eigenschaften der Z—Transformation 15.4.1.1 Diskrete Funktionen Ist eine Funktion f(t) @ < t < oo) nur für diskrete Argumente tn — nT (n = 0,1,2, . , T > 0 , T const) bekannt, so setzt man f(nT) = fn und bildet die Folge {/n} Eine solche entsteht z B in der Elektrotechnik durch „Abtastung" einer Funktion f(t) in den diskreten Zeitpunkten tn Ihre Wiedergabe erfolgt dann häufig als Treppenfunktion (Abb.15.27) Die Folge {/n} und die nur für diskrete Argumente definierte 0 T 2T 3T ••• "t Funktion f(nT), die als diskrete Funktion bezeichnet wird, sind äquivalent. Für die Folge {/n} wird keine Konvergenz Abbildung 15.27 für n —? oo gefordert. 15.4.1.2 Definition der Z-Transformation 1. Originalfolge und Bildfunktion Der Folge {/n} wird die unendliche Reihe f(*) = E/» [-) A5105) n=0 V ZJ zugeordnet. Falls diese Reihe konvergiert, sagt man, die Folge {/„} ist Z-transformierbar, und schreibt F(z) = Z{fn) A5 106) Man nennt {/n} Originalfolge, F(z) Bildfunktion Mit z ist eine komplexe Variable bezeichnet, mit F(z) eine komplexwert ige Funktion. ¦ fn = 1 (n = 0,1, 2,...). Die zugehörige unendliche Reihe lautet oo /1 Nn A5 107) Sie stellt bezüglich 1/z eine geometrische Reihe dar, die für - < 1 gegen die Reihensumme F(z) = z lll \ konvergiert, für - > 1 aber divergiert. Das bedeutet, die Folge {1} ist Z-transformierbar für |1| < 1, d h für alle Punkte außerhalb des Einheitskreises \z\ = 1 der 2-Ebene. 2. Eigenschaften Da die Bildfunktion F(z) gemäß A5.105) eine Potenzreihe bezüglich der komplexen Veränderlichen 1/z ist, folgt aus den Eigenschaften von Potenzreihen im Komplexen (s. 14 3.1.3, S 712) a) Für eine Z-transformierbare Folge {/n} gibt es eine reelle Zahl R, so daß die Reihe A5 105) absolut konvergiert für \z\ > l/R und divergiert für \z\ < 1/R. Für \z\ > 1/Rq > 1/R ist die Reihe sogar gleichmäßig konvergent R ist der Konvergenzradius der Potenzreihe A5.105) bezüglich 1/z Konvergiert die Reihe für alle \z\ > 0 , so setzt man R = oo . Für nicht Z-transformierbare Folgen setzt man R = 0 b) Ist {/n} Z-transformierbar für |^| > 1/R, dann ist die zugehörige Bildfunktion F(z) eine analytische
758 15 Integraltransformationen Funktion für \z\ > l/R und gleichzeitig die einzige Bildfunktion von {/n}- Für die Umkehrung gilt: Ist F(z) eine analytische Funktion für \z\ > l/R und auch für z = oo regulär, dann gibt es zu F(z) genau eine Originalfolge {/n}. Dabei heißt F(z) regulär für z = oo, wenn F(z) eine Potenzreihenentwicklung der Form A5.105) besitzt und F(oo) = /o gilt. 3. Grenzwertsätze Analog zu den Grenzwerteigenschaften der Bildfunktion der LAPLACE-Trans- formation (A5.7a),A5.7b) in 15.2.1.1,2., S. 733) gelten für die Z-Transformation die folgenden Grenzwertsätze a) Wenn F(z) = Z{fn} existiert, dann ist fo=limoF(z) A5 108) Dabei kann z auf der reellen Achse oder längs eines beliebigen Weges nach oo verlaufen. Da die Reihen z{F{z)-h} = h + h-z+fz^ + --- , A5.109) z2 {f(z) - /o - /,i} = /„ + /3i + /,! + ... , A5 110) offensichtlich ebenfalls Z-Transformierte sind, erhält man analog zu A5.108): h = lim z {F(z) - /<,}, h = lim z2 \f(z) - f0 - h-) , A5 111) z-kx> z-*oo y %) Auf diese Weise kann man die Originalfunktion {/n} aus ihrer Bildfunktion F(z) bestimmen b) Wenn lim fn existiert, so ist ' n—*oo lim fn = lim (z - l)F(z). A5 112) Man kann den Wert von lim fn aus A5.112) aber nur ermitteln, wenn man weiß, daß der Grenzwert existiert, denn die obige Aussage ist nicht umkehrbar ¦ fn = (-1)" (n = 0,1,2,...). Daraus folgt Z{fn} = -?— und lim {z - 1)—^ = 0, aber Z + 1 z->l+0 z + 1 lim (—l)n existiert nicht. n—>oox 15.4.1.3 Rechenregeln Für die Anwendung der Z-Transformation ist es wichtig zu wissen, wie sich gewisse Operationen an den Originalfolgen in entsprechenden Operationen an den Bildfunktionen widerspiegeln und umgekehrt. Im folgenden sei F(z) = Z{fn} für \z\ > l/R. 1. Translation Man unterscheidet eine Vorwärts- und eine Rückwärtsverschiebung. 1. Erster Verschiebungssatz: Z{fn-k} = z~kF{z) {k = 0,1,2,...), A5.113) dabei wird /n_fc = 0 für n — k < 0 festgelegt jfc-i r /i\H 2. Zweiter Verschiebungssatz: Z{fn+k} = zk \F(z) - J2 U ( " ) (A; = 1,2,...) .A5.114) 2. Summation Für|z|>max(l,i) gilt: 2^1»] = ^^) A5.115)
15 4 Z-Transformation 759 3. Differenzenbildung Für die Differenzen A/„ = /„+i - /„ , Amfn = A(Am-Vn) (m = 1,2, .. ; A°fn = /„) A5 116) gilt die Regel Z{Afn} = (z-l)F(z)-zf0, Z{A2fn} = (z-lJF(z)-z(z-l)f0-zAf0, Z{Akfn} = (z-l)kF(z)-zkE(z-l)k-^1A^fo. u=0 A5 117) 4. Dämpfung Für A ^ 0, beliebig komplex, \z\ > —- gilt: £{An/n} = F g) A5.118) 5. Faltung Als Faltung zweier Folgen {/„} und {gn} bezeichnet man die Operation fn*9n = itf*9n-„. A5.119) i/=0 Existieren die Z-Transformierten Z{fn} = F(z) für |A| > l/i?i und Z{gn} = G(z) für \z\ > 1/R2, dann gilt Z{fn * 5n} = F{z)G{z) A5.120) für |j2r| > max ( —- , — ) Die Beziehung A5.120) wird auch als Faltungssatz der Z-TVansformation V R\ R2 ) bezeichnet. Er entspricht der Vorschrift für die Multiplikation zweier Potenzreihen 6. Differentiation der Bildfunktion Z{nfn} = -z^-. A5 121) Durch wiederholte Anwendung von A5.121) lassen sich auch Ableitungen höherer Ordnung von F(z) bestimmen 7. Integration der Bildfunktion Unter der Voraussetzung fQ = 0 gilt ^|=J^pdf A5 122) ' z 15.4.1.4 Zusammenhang mit der Laplace—Transformation Beschreibt man eine diskrete Funktion f(t) (s 15 4.1.1, S 757) als Treppenfunktion, dann gilt f(t) = f(nT) = fn für nT <t<{n + l)T (n = 0,l,2, . ; T > 0, T const). A5 123) Auf diese stückweise konstante Funktion läßt sich die LAPLACE-Transformation (s S 733) anwenden, und man erhält für T = 1* 00 "+1 00 -np _ -(n+l)p 1 _ p-p 00 £{/(*)} = F(p) = Y, / he-* dt = j: fn- = i—L_ •£ }ne-n*. A5 124) n=0 Jn n=0 P P n=0
760 15. Integraltransformationen Die unendliche Reihe in A5.124) wird auch als diskrete Laplace-Transformation bezeichnet und mit dem Symbol V gekennzeichnet. oo V{f(t)} = V{fn} = Efne-np A5 125) n=0 Setzt man in A5.125) eP = z, dann stellt V{fn} eine Reihe nach absteigenden Potenzen von z dar, eine sogenannte LAURENT -Reihe (s. S 714). Mit der Substitution ep = z , die zu dem Namen Z-Transformation geführt hat, erhält man schließlich aus A5.124) den folgenden Zusammenhang zwischen Laplace- und Z-TYansformation im Falle von Treppenfunktionen: pF(p) = (l - ;) F(z) A5.126a) bzw pC{f(t)} = (l - £) Z{fn} . A5.126b) Auf diese Weise lassen sich Korrespondenzen der Z-Transformation (s. Tabelle 21.15, S. 1117) in Korrespondenzen der LAPLACE-Transformation (s. Tabelle 21.13, S. 1097) für Treppenfunktionen umrechnen und umgekehrt. 15.4.1.5 Umkehrung der Z-Transformat ion Die Umkehrung der Z-Transformation oder kurz Rücktransformation besteht darin, zu einer gegebenen Bildfunktion F{z) die zugehörige, eindeutige Originalfolge {/n} zu finden. Man schreibt dann Z-l{F(z)} = {/„} A5 127) Für die Rucktransformation gibt es verschiedene Möglichkeiten. 1. Benutzung von Tabellen Wenn die Funktion F(z) in der Tabelle explizit nicht vorkommt, kann man versuchen, durch Umformungen und durch Anwendung der Rechenregeln zu Funktionen zu gelangen, die in Tabelle 21.15, S 1117 vorhanden sind. 2. LAURENT-Reihe von F(z) Wegen der Definition A5.105) gelingt eine Rücktransformation sofort, wenn für F(z) eine Reihenentwicklung in 1/z bekannt ist oder sich ermitteln läßt 3. TAYLOR-Reihe von F I — j Da F ( - ) eine Reihe nach aufsteigenden Potenzen von z ist, ergibt sich wegen A5 105) nach der TAYLOR-Formel 1 dn /1 \ I fn = -T7-F[-)\ (n = 0,l,2, ..). A5 128) J n\ dzn \zJ\z=o v ' 4. Anwendungeines Grenzwertsatzes Mit Hilfe der Grenzwerte A5.108) und A5.111) kann man die Originalfolge {/„} aus ihrer Bildfunktion F(z) unmittelbar bestimmen 2z ¦ F(z) = -, rz rr . Es sollen die voranstehenden vier Methoden angewendet werden. v ; (z-2){z- lJ 6 1. Durch Partialbruchzerlegung (s 1.1 7 3, S. 15) von F(z)/z erhält man Funktionen, die in der Tabelle 21.15, S. 1117 enthalten sind. F{z) 2 A B C — = (z-2)(z-l)>=—2 + {z^iy + —l- .D™**** nz) = ^-^y2-^ und fn = 2(T-n-l) fürn>0. 2. Durch Division geht F(z) in die folgende Reihe nach absteigenden Potenzen von z über: F^=«.-Jih-2 - 4+4+22?+54+ii47+ (i5-i29> Daraus liest man unmittelbar fo = fi = 0, f2 = 2, /3 = 8, /4 = 22, /5 = 52, /6 = 114, . ab, aber man erhält keinen geschlossenen Ausdruck für das allgemeine Glied fn
15 4 Z-Transformation 761 3. Zur Bildung von F l - ) und den in A5 128) benötigten Ableitungen geht man zweckmäßigerweise von der Partialbruchzerlegung von F(z) aus und erhält: F(I) = 2 _ 2z _ 2 dh m W i-22 A-2J 1-2' w dF(;) 4 4z 4 dF(;) V^Z. = _ _ _ d h \*1- = 0 für 2 = 0 <*2 A-22J A-2K A-2J' * * ^2 U ^ * U ' d2F t) _ 16 122 12 , . ^F(j) d.h. —-ff1- =4 für 2 = 0 , d22 A-22K A-2L A-2K' ' ' dz2 cte3 A - 22L A - 2M A - z)A dz3 Unter Berücksichtigung der Formeln in A5.128) ergibt sich /o, /i, /b, /3, 4. Die Anwendung der Grenzwertsätze (s S 758) unter Beachtung der BERNOULLisc/ien Regel (s S 56) ergibt- /o = lim F(z) = lim -^— = 0, JU z-+oo V ; ^oo23 -422 + 52 - 2 /x = lim z(F(z) - /o) = lim f = 0 , z-oc z^oo 23 - 422 + 52 - 2 / 1\ 223 /2 = lim 22 FB) - /o - /!- = lim 3 . - _ = 2, z-^oo V 2/ 2^00 23 - 422 + 52 - 2 h = lim 23 (f(z) - /o - /i- - /2i) = Hm 23 (- 22 z^oo V 2 22/ 2^°° \2 ¦ 422 + 52 - 2 Auf diese Weise läßt sich die Originalfolge {/n} sukzessiv bestimmen. 15.4.2 Anwendungen der Z—Transformation 15.4.2.1 Allgemeine Lösung linearer Differenzengleichungen Eine lineare Differenzengleichung fc-ter Ordnung mit konstanten Koeffizienten hat die Form akVn+k + afc_i2/n+fc_i H h a2yn+2 + ai2M+i + öo2/n = 9n (n = 0, 1, 2 .) A5.130) Dabei ist k eine natürliche Zahl. Die Koeffizienten a» (i = 0,1,. ., k) sind gegebene reelle oder komplexe Zahlen und hängen nicht von n ab Es gelte a0 ^ 0 und a^ ^ 0 . Die Folge {#n} ist gegeben, die Folge {yn} ist gesucht. Zur Bestimmung einer speziellen Lösung von A5 130) werden die Werte 2/0,2/1,.. • ,2/fc-i vorgegeben Dann kann man aus A5 130) für n = 0 den nächsten Wert $/* ausrechnen Aus 2/1, 2/2, • • •, 2/fc ergibt sich dann aus A5.130) für n = 1 der Wert 2/fc+i • Auf diese Weise kann man alle Werte 2/n rekursiv ausrechnen Mit Hilfe der Z-Transformation läßt sich jedoch für yn eine allgemeine Darstellung angeben Dazu wendet man den 2. Verschiebungssatz A5 114) auf A5.130) an und erhält- akzk [Y(z) - 2/0 - yiz~l yk-iz-{k-l)] + • • • + alZ[Y(z) - y0] + a0Y(z) = G(z) A5 131) Dabei bedeutet Y(z) = 2{yn} und G(z) — Z{gn} • Setzt man weiterhin a,kZk + ük-\yk~l H h a\Z + a0 = p(^), so lautet die Lösung der sogenannten Bildgleichung A5.131) yw-^GW+j^S*j^- A5132)
762 15. Integraltransformationen Wie bei der Behandlung von linearen Differentialgleichungen mit der LAPLACE-Transformation hat man auch bei der Z-Transformation den Vorteil, daß die Anfangswerte in die Bildgleichung eingehen und daher bei der Lösung automatisch berücksichtigt werden. Aus A5.132) gewinnt man dann die gesuchte Lösung {yn} = Z~l{ Y(z)} durch Rücktransformation gemäß 15.4.1.5, S 760 15.4.2.2 Differenzengleichung 2. Ordnung (Anfangswertaufgabe) Die Differenzengleichung 2. Ordnung lautet: yn+2 + aiyn+1 + a0yn = gn A5.133) Als Anfangswerte sind yo und y\ gegeben. Mit Hilfe des 2. Verschiebungssatzes erhält man zu A5 133) die Bildgleichung z2 \y(z) - y0 - yii] + alZ[Y(z) - y0] + a0Y{z) = G(z). A5.134) Setzt man z2 + axz + a0 = p(z), dann lautet die Bildfunktion Y(z) = -j-Mz) + y0Z-^A +yz A5 135) p(z) p(z) p(z) Das Polynom p(z) habe die Nullstellen a\ und a2, für die a\ ^ 0 und a2 ^ 0 gelte, weil sonst ao = 0 wäre und sich die Differenzengleichung auf eine solche 1 Ordnung reduzieren würde. Durch Partial- bruchzerlegung und Anwendung der Tabelle 21.15, S. 1117 der Z-Transformation ergibt sich aus ( ) für aj ^ ö2 , _ o>i — ct2 \z — o>i z — a2J PB) 1 G^M für «, = «,, 2fel = W = (^f fÜrai^2' A5136a) IPWJ { nar1 für ai = a2. Wegen po = 0 ist nach dem zweitem Verschiebungssatz z~1{£)}=z~1{zi)}={p^} (i5i36b) und nach dem 1. Verschiebungssatz '1 z z IptoJ ( w {Pn-l}. A5 136c) z p(z) J Dabei ist p-\ = 0 zu setzen. Mit Hilfe des Faltungssatzes erhält man die Originalfolge mit 3/n = ]C Vn-lQn-u + 2/o(Pn+l + «lPri) + 2/lPl • A5 136d) Wegen p_i = p0 = 0 ergibt sich daraus mit A5 136a) ^n = £ 0n-„- ~ yo — + ai~ + 2/i~ - . A5 136e) ^5 ai - a2 \ c*i - a2 a?i - a2 / ai - a2 Diese Form läßt sich noch wegen a\ = — (a\ + a2) und a0 = c^a^ (s. Wurzelsätze von Vieta in 1.6.3 1,3., S 44) noch zu 2/n = E &»-*— yoöo^ — + yi-1 A5 136f) ^2 ai - a2 ai - a2 «i - ^2
15.5 Wavelet-Transformation 763 vereinfachen Für oti = a2 erhält man analog n yn = Y. 9n-u{v - l)oT2 " 2/oöo(n - 1K~2 + 3/inaf A5 136g) v=2 Bei der Differenzengleichung 2 Ordnung läßt sich die Rücktransformation der Bildfunktion Y(z) auch ohne Partialbruchzerlegung durchführen, wenn man Korrespondenzen wie z.B. z 1 n_1sinh6n :2 — 2az cosh b + a? ) sinh n benutzt und auch hier den 2 Verschiebungssatz anwendet. Mit der Substitution a\ = —2a cosh b, a0 = a2 lautet die Originalfolge zu A5 135)- -{; A5 137) 1 sinh b A5.138) \^gn-vau 2sinh(i/ — l)b — yoansmh(n — l)b + yian x smhnb . L=2 J Diese Formel ist gunstig für eine numerische Auswertung besonders dann, wenn oo und a\ komplexe Zahlen sind. Hinweis: Die hyperbolischen Funktionen sind auch für komplexe Argumente definiert 15.4.2.3 Differenzengleichung 2. Ordnung (Randwertaufgabe) In den Anwendungen kommt es häufig vor, daß die Werte yn der Differenzengleichung nur für endlich viele Indizes 0 < n < N gesucht sind. Im Falle einer Differenzengleichung 2. Ordnung A5.133) werden dann in der Regel die beiden Randwerte yo und y^ vorgegeben Zur Lösung dieser Randwertaufgabe geht man von der Lösung A5.136f) der entsprechenden Anfangswertaufgabe aus, wobei an Stelle des unbekannten Wertes y\ jetzt y^ einzuführen ist. Dazu setzt man in A5.136f) n = N , dann kann man yi in Abhängigkeit von y0 und y^ ausrechnen: _ 1 Vi jv 7j ( N- ¦<*2 !) + Vn{(Xi ~ a2) - ^(^1 1 ~ &2 1)9n-u A5.139) Man setzt diesen Wert in A5 136f) ein und erhält Vn = 1 OL\ — OL2 EK-^)».-- ax -ata? - aj? ^ ^(or1 - «r1)^-. al a2 A5 140) Die Lösung A5.140) hat nur dann einen Sinn, wenn af — a2 ^ 0 gilt Andernfalls hat das Randwertproblem keine allgemeine Lösung, sondern es treten in Analogie zu den Randwertaufgaben bei Differentialgleichungen Eigenwerte und Eigenfunktionen auf. 15.5 Wavelet-Transformation 15.5.1 Signale Geht von einem physikalischen Objekt eine Wirkung aus, die sich ausbreitet und mathematisch z.B. durch eine Funktion oder eine Zahlenfolge beschreiben läßt, dann spricht man von einem Signal. Unter Signalanalyse versteht man die Chrakterisierung eines Signals durch eine Größe, die für das Signal typisch ist Mathematisch bedeutet das: Die Funktion oder Zahlenfolge, die das Signal beschreibt, wird auf eine andere Funktion oder Zahlenfolge abgebildet, die die typische Eigenschaft des Signals besonders gut erkennen läßt. Bei solchen Abbildungen können allerdings auch Informationen verloren gehen.
764 15. Integraltransformationen Die Umkehrung der Signalanalyse, d.h. die Wiedergewinnung des Ausgangssignals, wird als Signalsynthese bezeichnet. Der Zusammenhang zwischen Signalanalyse und Signalsynthese wird am Beispiel der FOURIER-Trans- formation besonders deutlich. Ein Signal f{t) (t Zeit) werde durch die Frequenzen u , die in ihm enthalten sind, charakterisiert Dann beschreibt die Formel A5 141a) die Signalanalyse, die Formel A5 141b) die Signalsynthese F(w): 7 VW«> 1 ^ A5 141a) f(t) = — I e-'FM du. A5.141b) 15.5.2 Wavelets Der FOURIER-Transformation fehlt eine Lokalisierungseigenschaft, d.h ändert sich ein Signal an einer Stelle, dann ändert sich die Transformierte überall, ohne daß durch „einfaches Hinsehen" die Stelle der Änderung gefunden werden kann. Der Grund liegt darin, daß die FOURIER-Transformation ein Signal in ebene Wellen zerlegt. Diese werden durch trigonometrische Funktionen beschrieben, die beliebig lange mit derselben Periode schwingen Bei der Wavelet-Transformation dagegen wird eine fast beliebig wählbare Funktion ip , das Wavelet (kleine lokalisierte Welle), zur Analyse eines Signals verschoben und gestaucht. Beispiele für Wavelets sind Haar-Wavelet (Abb.15.28a) und Mexikanischer Hut (Abb.15.28b) A Haar-Wavelet: A für ip = < -1 für 0 sonst 0<x < i, \<x<l, ¥(t)| 1 A5 142) B Mexikanischer Hut: 1>(x) = --^-e-*2/2 A5 143) ! 1 1*1 dx2 (l-x2)e~ a) B'/2 A5 144) t b) Abbildung 15 28 Allgemein gilt- Als Wavelet kommen alle Funktionen ip in Frage, die quadratisch integrierbar sind und deren FOURIER-Transformierte ^(u) gemäß A5.141a) zu einem positiven endlichen Integral *MI J \u> M du A5 145) führen Im Zusammenhang mit Wavelets sind die folgenden Eigenschaften und Definitionen wichtig- 1. Für den Mittelwert von Wavelets gilt- jm dt = 0. Als k-tes Moment eines Wavelets tp bezeichnet man das Integral / tki){t)dt. ßk ¦¦ A5.146) A5.147) Die kleinste positive natürliche Zahl n, für die /in ^ 0 gilt, heißt Ordnung des Wavelets ijj. ¦ Für das HAAR-Wavelet A5 142) gilt n = 1, für den mexikanischen Hut A5.144) n = 2. 3. Falls fik = 0 für alle k gilt, ist ip von unendlicher Ordnung. Wavelets mit beschränktem Träger
15.5 Wavelet-Transformation 765 haben stets eine endliche Ordnung. 4. Ein Wavelet der Ordnung n ist orthogonal zu allen Polynomen vom Grade < n — 1. 15.5.3 Wavelet—Transformat ion Zu einem Wavelet ip(t) kann man mit Hilfe eines Parameters a eine ganze Schar von Funktionen bilden- Ut) = -U* (-) (a?0). A5.148) Im Falle \a\ > 0 wird die Ausgangsfunktion ijj(t) gestaucht. Im Falle a < 0 wird zusätzlich eine Spiegelung vorgenommen. Der Faktor \/J\a\ ist ein Skalierungsfaktor. Mit Hilfe eines zweiten Parameters b können die Funktionen ipa{t) noch verschoben werden Man erhält dann die zweiparametrige Kurvenschar ^o6=JL^[*Jl5] (o,& reell; a ^ 0). A5 149) ' J\a\ V * ) Der reelle Verschiebungsparameter b charakterisiert den Zeitpunkt (bzw den Ort), während der Parameter a die Ausdehnung der Funktion ipa,b{t) angibt Die Funktion ipa,b{t) wird im Zusammenhang mit der Wavelet-Transformation als Basisfunktion bezeichnet Die Wavelet-Transformation einer Funktion f(t) ist wie folgt definiert: c" - '¦ ~ : ¦t~b C^/(o, b)=c j fma,b(t) dt = -jL J f(t)if> I — I dt. A5 150a) -oo V'0'-00 Für die Rücktransformation gilt: oo oo /(*) = c I J C^f(t)^a,b(t)-dadb. A5 150b) Dabei ist c eine Konstante, die vom speziellen Wavelet ip abhängt ¦ Unter Verwendung des HAAR-Wavlets A5 144) erhält man für b < t < b + a/2 ^,A_J:) = 4 -1 für b + a/2<t<b + a, 0 sonst und damit nit 1 / rb+a/2 rb+a \ C+f(a1b) = -=[ f(t)dt- f(t)dt) yj\a\ \Jb Jb+a/2 ) \f\ö\ B rb+a/2 2 rb+a \ = V -/ nt)dt-- f(t)dt) A5.151) 2 \a Jb a Jb+a/2 J Der Wert A/,/(a, b) gemäß A5 151) stellt eine Differenz von Mittelwerten der Funktion f{t) über zwei benachbarten Intervallen der Länge — um den Punkt b dar. Bemerkungen: 1. In den Anwendungen spielt die dyadische Wavelet-Transformation eine große Rolle. Als Basisfunktionen verwendet sie die Funktionen AAt) = -^ (^F) • A5152)
766 15. Integraltransformationen d h die verschiedenen Basisfunktionen ergeben sich aus einem Wavelet ip(t) durch Verdoppeln oder Halbieren der Breite und durch Verschieben um ganzzahlige Vielfache der Breite 2. Als orthogonales Wavelet bezeichnet man ein Wavelet ip(t), bei dem die gemäß A5 152) erzeugten Basisfunktionen eine orthogonale Basis bilden. 3. Besonders gute numerische Eigenschaften haben DAUBECHIES-Wavelets. Das sind orthogonale Wa- velets mit einem kompakten Träger, d.h sie sind nur auf einem Teil der Zeitachse von Null verschieden Für sie gibt es aber keine geschlossene Darstellung (s [15 10]). 15.5.4 Diskrete Wavelet—Transformation 15.5.4.1 Schnelle Wavelet-Transformation Man kann davon ausgehen, daß die Integraldarstellung A5.150b) hochgradig redundant ist und somit das Doppelintegral ohne Informationsverlust durch eine Doppelsumme ersetzt werden kann Das wird bei der konkreten Anwendung der Wavelet-Transformation berücksichtigt. Man benötigt dazu: 1. eine effiziente Berechnung der Transformation, was auf das Konzept der Multi-Skalen-Analyse führt sowie 2. eine effiziente Berechnung der Rücktransformation, d.h. eine effiziente Rekonstruktion von Signalen aus ihrer Wavelet-Transformation, was auf das Konzept der Frames führt Für beide Konzepte muß auf die Literatur verwiesen werden (s [15.10], [15.1]). Hinweis: Der große Erfolg der Wavelets in den verschiedenen Anwendungsgebieten, z.B. • bei der Berechnung physikalischer Größen aus Meßreihen, • bei der Bild- oder Spracherkennung sowie • bei der Datenkompression im Rahmen der Nachrichtenübertragung beruht auf seinen „schnellen Algorithmen". Analog zur FFT (Fast FOURIER-Transformation, s S 955) spricht man hier von FWT (Fast Wavelet-Transformation). 15.5.4.2 Diskrete Haar—Wavelet-Transformation Als Beispiel für eine diskrete Wavelet-Transformation wird die Ha AR-Wavelet-Transformation beschrieben: Von einem Signal sind die Werte fc (i = 1,2,. ., N) gegeben. Aus diesen werden die Detailwerte di (i = 1,2, ., N/2) wie folgt berechnet: s. = -L(/2-_1 + /2i), di = -^(/2i-i-/2i) A5 153) Die Werte di werden abgespeichert, während auf die Werte Si die Vorschrift A5.153) angewendet wird, d h in A5.153) werden die Werte fc durch die Werte Sj ersetzt. Diese Vorgehensweise wird fortgesetzt, so daß sich aus *!"+1) = ^ D-1: + 4?») , <T" = ^ D"i, - 4->) A5 154) schließlich eine Folge von Detailvektoren mit den Komponenten di ergibt. Jeder Detailvektor enthält Informationen über Eigenschaften des Signals Hinweis: Für große Werte von N konvergiert die diskrete Wavelet-Transformation gegen die Integral- Wavelet-Transformation A5.150a) 15.5.5 Gabor—Transformation Zeit-Frequenz-Analyse nennt man die Charakterisierung eines Signals bezüglich der in ihm enthaltenen Frequenzen und der Zeitpunkte, zu denen diese Frequenzen auftreten. Dazu wird das Signal in zeitliche Abschnitte (Fenster) aufgeteilt und anschließend nach FOURIER transformiert. Man spricht deshalb auch von einer „gefensterten FOURIER-Transformation" WFT (Windowed FOURIER-Transformation).
15.6 Walsh-Funktionen 767 Die Fensterfunktion ist so zu wählen, daß sie ein Signal außerhalb eines Fensters ausblendet Von GABOR wurde als Fensterfunktion g(t) = -jL-e~2a* A5.155) verwendet (Abb.15.29). Diese Wahl kann damit erklärt werden, daß g(t) mit der „Gesamtmasse 1" um den Punkt t = 0 konzentriert ist und die Fensterbreite als konstant (etwa 2<r) angesehen werden kann. g(t) I Die GABOR-Transformation einer Funktion f(t) ist dann von 0.04 -I ¦ der Form -0.04 Qf(u, s)= I f(t)g(t - s)e-^ dt. A5 156) Sie gibt an, mit welcher komplexen Amplitude die Grund- f_3Q ' 0 ' ' 30 t Schwingung elut während des Zeitintervalls [s — er, s + a] in / vertreten ist, d.h , tritt die Frequenz u in diesem Intervall auf, Abbildung 15.29 dann besitzt sie die Amplitude |£/(u;, s)|. 15.6 Walsh-Funktionen 15.6.1 Treppenfunktionen Bei der Approximation von Funktionen spielen orthogonale Funktionensysteme, z.B. spezielle Polynome oder trigonometrische Funktionen, eine wichtige Rolle, weil sie glatt, d.h. hinreichend oft differenzierbar in dem betrachteten Intervall sind. Es gibt aber auch Probleme, z.B die Übertragung der Bildpunkte eines gerasterten Bildes, für deren mathematische Behandlung glatte Funktionen nicht geeignet sind, sondern sich Treppenfunktionen, also stückweise konstante Funktionen besser eignen. WALSH-Funktionen sind sehr einfache Treppenfunktionen. Sie nehmen nur die zwei Funktionswerte -1-1 und —1 an Diese zwei Funktionswerte entsprechen zwei Zuständen, so daß WALSH-Funktionen besonders einfach in Computern realisiert werden können. 15.6.2 Walsh-Systeme Analog zu den trigonometrischen Funktionen werden periodische Treppenfunktionen betrachtet. Man verwendet das Intervall / = [0,1) als Periodenintervall und unterteilt es in 2n gleichlange Teilintervalle. Sei Sn die Menge der periodischen Treppenfunktionen mit der Periode 1 über einer solchen Intervallteilung Die zu Sn gehörenden Treppenfunktionen kann man als Vektoren eines endlichdimensionalen Vektorraumes auffassen, denn jede Funktion g G Sn wird durch ihre Werte go, <7i, #2, • • •, 92n-i in den Teilintervallen bestimmt und kann demzufolge als Vektor aufgefaßt werden: gT = @o,0i,02,- -,02«-i). A5.157) Die zu Sn gehörenden WALSH-Funktionen bilden mit einem geeigneten Skalarprodukt eine orthogonale Basis in diesem Raum. Die Basisvektoren können auf verschiedene Weise numeriert werden, so daß man sehr viele WALSH-Systeme erhält, die aber alle dieselben Funktionen enthalten. Es zeigt sich aber, daß drei Systeme zu bevorzugen sind: WALSH-KRONECKER-Funktionen, Walsh-Kaczmarz- Funktionen und WALSH-PALEY-Funktionen. In Analogie zur FOURIER-Transformation wird die Walsh- Transformation aufgebaut, wobei die Rolle der trigonometrischen Funktionen von den WÄLSH-Funktionen übernommen wird. Man erhält z.B. WALSH-Reihen, WALSH-Polynome, WALSH-Sinus- und WALSH-Kosinus-Transformationen, WALSH- Integrale, und analog zur schnellen FOURIER-Transfornmation gibt es die schnelle WÄLSH-Transforma- tion Für eine Einfuhrung in Theorie und Anwendung der WALSH-Funktionen s. [15 6].
768 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 16 Wahrscheinlichkeitsrechnung und mathematische Statistik Wahrscheinlichkeitsrechnung und mathematische Statistik befassen sich mit den Gesetzmäßigkeiten des zufälligen Eintretens bestimmter Ereignisse aus einer vorgegebenen Ereignismenge bei Versuchen im allgemeinsten Sinne. Dabei wird vorausgesetzt, daß diese Versuche unter unveränderten Bedingungen beliebig oft wiederholt werden können. Ihre Anwendung finden diese Gebiete der Mathematik bei der statistischen Beurteilung von Massenerscheinungen Die mathematische Behandlung von Zufallserscheinungen wird auch unter dem Begriff Stochastik zusammengefaßt 16.1 Kombinatorik Aus den Elementen einer Menge lassen sich häufig auf eine bestimmte Weise neue Mengen zusammenstellen Die Art und Weise einer solchen Zusammenstellung führt auf die Begriffe Permutation (Anordnung), Kombination (Auswahl) und Variation. Beim Begriff der Variation werden Anordnung und Auswahl vereinigt, indem bei der Auswahl von Elementen auf deren Reihenfolge geachtet wird Die Grundaufgabe der Kombinatorik besteht darin, die Anzahl der Auswahl- oder Anordnungsmöglichkeiten zu ermitteln. 16.1.1 Permutationen 1. Definition Permutation nennt man eine Anordnung von n Elementen in einer bestimmten Reihenfolge. 2. Anzahl der Permutationen ohne Wiederholung Für die Anzahl Pn der Permutationen von n verschiedenen Elementen gilt Pn = n« A6 1) ¦ In einem Hörsaal wurde eine Reihe mit 16 Sitzplätzen von genau 16 Studenten besetzt. Es gibt 16' Möglichkeiten für die Sitzordnung 3. Anzahl der Permutationen mit Wiederholung Für die Anzahl Pn^ der Permutationen von n Elementen, darunter k gleichen (k < n), gilt Pn(fc) = Jj A6 2) ¦ Eine Reihe von 16 Sitzplätzen im Hörsaal wird von 16 Studenten mit ihren Taschen belegt. Unter den 16 Taschen befinden sich 4 gleiche. Dann gibt es 16'/4' Möglichkeiten für die Anordnung der Taschen 4. Verallgemeinerung Für die Anzahl pn^^ >fcm) der Permutationen von n Elementen, eingeteilt in m Gruppen mit jeweils h\, &2, • • •, km gleichen Elementen (fci + fo + • + km = n), gilt p"kiM',km)=ni. r! 1.1 • (i63) h]k2\ kj ¦ Aus den fünf Ziffern 4, 4, 5, 5, 5 können P5^2'3^ = —— = 10 verschiedene fünfstellige Zahlen gebildet werden. 16.1.2 Kombinationen 1. Definition Kombination nennt man eine Auswahl von k Elementen aus n Elementen ohne Beachtung der Reihenfolge Man spricht auch von einer Kombination k-tev Klasse und unterscheidet zwischen Kombinationen ohne und mit Wiederholung
16.1 Kombinatorik 769 2. Anzahl der Kombinationen ohne Wiederholung Für die Anzahl Cn^ der Möglichkeiten, aus n verschiedenen Elementen k Elemente ohne Beachtung der Reihenfolge auszuwählen, gilt Cjk) =[!) mit 0<k<n (s. Binomialkoeffizient in 1 1.6 4,3., S 13), A6.4) wobei jedes der n Elemente höchstens einmal in einer Kombination auftreten darf. Man spricht deshalb auch von einer Kombination ohne Wiederholung. ¦ Es gibt I I = 27405 Möglichkeiten, aus 30 Teilnehmern einer Wahlversammlung einen 4köpfigen Wahlvorstand ohne Zuordnung der Funktionen zusammenzustellen 3. Anzahl der Kombinationen mit Wiederholung Für die Anzahl der Möglichkeiten, aus n verschiedenen Elementen k Elemente ohne Beachtung der Reihenfolge, aber bei Zulassung beliebig vieler Wiederholungen jedes der Elemente auszuwählen, gilt CnW=ln + k-l\ A65) Eine andere Formulierung lautet, daß die Anzahl der Möglichkeiten betrachtet wird, aus n verschiedenen Elementen je k zusammenzustellen, wobei die k Elemente nicht verschieden zu sein brauchen (k + 6 — l\ I verschiedene Würfe möglich. Für 2 Würfel gilt demzufolge W 16.1.3 Variationen 1. Definition Variation nennt man eine Auswahl von k Elementen aus n verschiedenen Elementen unter Beachtung der Reihenfolge. Das bedeutet: Variationen sind Kombinationen mit Beachtung der Reihenfolge. Deshalb ist auch bei den Variationen zwischen Variation ohne und mit Wiederholung zu unterscheiden. 2. Anzahl der Variationen ohne Wiederholung Für die Anzahl Vn^k) der Möglichkeiten, aus n verschiedenen Elementen k unter Beachtung der Reihenfolge auszuwählen, gilt Vn{k) = Jfc'(?) = n(n - l)(n - 2)... (n - k + 1) (k<n) A6.6) ¦ Wieviel Möglichkeiten gibt es, in einer Wahlversammlung mit 30 Teilnehmern einen 4köpfigen Wahlvorstand, bestehend aus dem Vorsitzenden, seinem Stellvertreter und dem 1. und 2. Wahlhelfer zusammenzustellen? Die Antwort lautet I .14' = 657720 (> 3. Anzahl der Variationen mit Wiederholung Wenn von den n verschiedenen Ausgangselementen in einer Variation einzelne auch mehrfach auftreten dürfen, dann spricht man von einer Variation mit Wiederholung. Für ihre Anzahl gilt Vn{k) = nk . A6.7) ¦ A: Beim Fußball-Toto sind für 12 Spiele 312 verschiedene Tips möglich. ¦ B: Mit der digitalen Einheit Byte, die aus 8 Bits besteht, können 28 = 256 verschiedene Zeichen dargestellt werden, was in der bekannten ASCII-Tabelle zum Ausdruck kommt.
770 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 16.1.4 Zusammenstellung der Formeln der Kombinatorik Tabelle 16.1 Zusammenstellung der Formeln der Kombinatorik Art der Auswahl bzw. Zusammenstellung von k aus n Elementen Permutationen Kombinationen Variationen Anzahl der Möglichkeiten ohne Wiederholungen (k <n) Pn = n' (n = k) *» - G) ...» . «(;) mit Wiederholungen (k<n) pik) - 5l ^ = ("T1) Vn{k) = nk 16.2 Wahrscheinlichkeitsrechnung 16.2.1 Ereignisse, Häufigkeiten und Wahrscheinlichkeiten 16.2.1.1 Ereignisse 1. Ereignisarten Alle Ergebnisse eines Versuches, bei dem bestimmte Bedingungen eingehalten werden und bei dessen Ablauf das Resultat im Rahmen verschiedener Möglichkeiten ungewiß ist, werden in der Wahrscheinlichkeitsrechnung als Ereignisse bezeichnet und in der sogenannten Ereignismenge A zusammengefaßt Man unterscheidet das sichere, das unmögliche und das zufällige Ereignis Das sichere Ereignis tritt bei jeder Wiederholung eines gegebenen Versuches innerhalb einer Ereignismenge ein, das unmögliche bei keinem Versuch, das zufällige Ereignis kann eintreten oder auch nicht Alle möglichen einander ausschließenden Ausgänge eines Versuches heißen seine Elementarereignisse. Bezeichnet man die Ereignisse innerhalb einer Ereignismenge A mit A,B,C, .., insbesondere das sichere Ereignis mit / , das unmögliche Ereignis mit O , so gelten die in Tabelle 16.2 definierten Verknüpfungen 2. Rechenregeln Es gelten die folgenden Rechenregeln, die den Rechenregeln der Schaltalgebra (BoOLEsche Algebra) analog sind l.a) 2. a) 3. a) 4. a) 5. a) 6. a) 7.a) 8. a) A + B = B + A, A + A = A, A + (B + C) = {A + B) + C, A + 'Ä=Ii A{B + C) = AB + AC, A + B = AB, B- A = B~Ä, A{B-C) = AB-AC, A6 8) A6 10) A6 12) A6 14) A6 16) A6 18) A6.20) A6.22) l.b) 2. b) 3. b) 4. b) 5.b) 6. b) 7.b) 8. b) AB = BA AA = A A(BC) = (AB)C AÄ = 0 A + BC = {A + B){A + C). ÄB = ^ + ß. Ä = I-A. AB-C={A-C){B-C). A6 9) A6.11) A6 13) A6 15) A6.17) A6.19) A6.21) A6.23)
16.2 Wahrscheinlichkeitsrechnung 771 Tabelle 16.2 Verknüpfungen zwischen Ereignissen Bezeichnung 1. Entgegengesetztes Ereignis zu A. 2. Summe der Ereignisse A undB 3. Produkt der Ereignisse A und 5. 4. Differenz der Ereignisse A undB- 5. Aufeinander folgende Ereignisse- 6. Elementares Ereignis- 7. Zusammengesetztes Ereig- 8. Einander ausschließende Ereignisse A und B: Schreibweise ~Ä A + B AB A-B ACB E AB = 0 Bedeutung A tritt genau dann ein, wenn A nicht eintritt. A + B tritt genau dann ein, wenn entweder A oder B eintritt, oder wenn beide Ereignisse zusammen eintreten AB tritt genau dann ein, wenn sowohl A als auch B eintritt A — B tritt genau dann ein, wenn A eintritt und B nicht eintritt. ACB heißt, daß das Eintreten des Ereignisses A das Eintreten des Ereignisses B zur Folge hat. E läßt sich nicht als Summe A + B mit E ^ A und E ^ B darstellen. Ereignis ist nicht elementar Die Ereignisse A und B können nicht gemeinsam auftreten. 9. a) OCA, A6.24) 9. b) ACI. A6 25) 10. Ans ACB folgt a) A = AB A6 26) und b) B = A + BA und umgekehrt. A6 27) 11. Vollständiges System: Ein System von n Ereignissen A{ (i = 1,2,... ,n) heißt vollständig, wenn gilt: a) AiAk = 0 (i^k) A6.28) undb) Ax + A2 + • ¦ • + Ak = I. A6 29) 1. Münze 2 Münze Zahl An A2i Wappen An A22 ¦ A: Werfen zweier Münzen Elementarereignisse: Siehe nebenstehende Tabelle Zusammengesetzte Ereignisse 1. Erste Münze zeigt Zahl oder Wappen: An + Ai2 = I. 2. Gleichzeitiges Auftreten von Zahl und Wappen bei der ersten Münze: AnAi2 = O . 3 Erste Münze Zahl, zweite Münze Wappen: AnA22 ¦ B: Brenndauer von Glühlampen. Elementarereignis An Die Brenndauer t genügt der Ungleichung (n - l)At < t < nAt (n = 1, 2,.. , At > 0 , beliebige Zeiteinheit). Zusammengesetztes Ereignis A- Die Brenndauer ist höchstens gleich nAt, d.h. A = ^ Av. 16.2.1.2 Häufigkeiten und Wahrscheinlichkeiten 1. Häufigkeiten Es sei A ein Ereignis der zu einem Versuch gehörenden Ereignismenge A Tritt bei n-maliger Wiederholung des Versuches das Ereignis A n^-mal ein, so heißt ua die Häufigkeit, ua/ti = Ha die relative Häufigkeit des Ereignisses A Die relative Häufigkeit genügt gewissen einfachen Gesetzmäßigkeiten, die man als Grundlage für eine axiomatische Definition des Begriffes Wahrscheinlichkeit P(A) des Ereignisses A in der Ereignismenge A benutzt. (Der Buchstabe P steht für „probability", das englische Wort für Wahrscheinlichkeit.)
772 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 2. Definition der Wahrscheinlichkeit Eine reelle Funktion P, definiert auf einer Ereignismenge A, heißt Wahrscheinlichkeit, wenn sie die folgenden Eigenschaften erfüllt: 1. Für jedes Ereignis A E A gilt 0 < P(A) < 1, 0 < hA < 1. A6 30) 2. Für das unmögliche Ereignis O und das sichere Ereignis / gilt P@) = 0, P(I) = 1, ho = 0, /*/ = 1. A6.31) 3. Schließen die Ereignisse A € A und B G A einander aus (AB = O), so ist P(A + B) = P{A) + P(P), hA+B = hA + hB. A6.32) 3. Rechenregeln für Wahrscheinlichkeiten 1 AusßCi folgt P(B) < P{A). A6.33) 2. P(A) + P(Ä) = 1. A6.34) 3a. Für endlich viele, paarweise einander ausschließende Ereignisse Ai (i = 1,... ,n; AiAk = 0, i±k), gilt P(A, + • • • + A^ = P(Ax) + • • • + P(A„). A6.35) 3b. Speziell für n = 2: P(Ai + j42) = P(Ai) + P(A2). 4a. Für beliebige Ereignisse Ai (i = 1,..., n) gilt P(i4x + • • • + An) = P(Ai) + • • • + P(An) ~ P(A,A2) P{AXAn) -P(A2A3) P(A2An) P(An.lAn) +P{AlA2Az) + • • • + P(AxA2An) + • • • + P(An-2An_1An) - +(-l)n~1P(^1A2 ... An). A6 36a) 4b. Speziell für n = 2: P(j4i + i42) = P(AX) + P(A2) - P{AXA2). A6.36b) 5. Gleichwahrscheinliche Ereignisse: Sind alle Ereignisse Ai (i = 1,2,.. ,n) eines vollständigen Ereignissystems gleichwahrscheinlich, so gilt P{Ai) = - . A6.37) n Ist A als Summe von m (m < n) der gleichwahrscheinlichen Ereignisse .A* (i = 1,2,..., n) darstellbar, so sagt man, daß m Ereignisse für das Eintreten von A gunstig sind, und es gilt dann P(A) = — . A6.38) n 4. Beispiele für Wahrscheinlichkeiten ¦ A: Für die Wahrscheinlichkeit P(A), mit einem idealen Würfel eine 2 zu würfeln, gilt P(A) = - 6 ¦ B: Wie groß ist die Chance, beim Zahlenlotto „6 aus 49" vier Richtige zu tippen? Es gibt (Vj Möglichkeiten für 4 Richtige von 6 gezogenen Zahlen. Dann bleiben noch f4^6) = D23) Möglichkeiten für die falschen Zahlen. Insgesamt können D69J verschiedene Tips abgegeben werden Somit erhält man für die Wahrscheinlichkeit P(A4), einen Vierer zu tippen ^ = ^ = ä = «-
16.2 Wahrscheinlichkeitsrechnung 773 Analog erhält man für die Wahrscheinlickeit P{A6), 6 Richtige zu treffen P(A6) = JL = 0,715 • 1(T7 = 7,15 • 10~6 %. ¦ C: Wie groß ist die Wahrscheinlichkeit P(A) dafür, daß unter k Personen 2 am gleichen Tag Geburtstag haben, wobei die_Geburtsjahre nicht übereinstimmen müssen ? Man betrachtet zunächst A: Alle k Personen haben an verschiedenen Tagen Geburtstag. Es gilt* P(Ä) - — 365~1 365~2 365 - A: + 1 ^ ' ~ 365 ' 365 365 ' 365 Daraus folgt FW^l-P(^) = l-365-364-363365VC65-fc + ^ M . , . k I 10 20 23 30 60 Numerische Auswertung d.eser Formel: P(A) | 0,117 0,411 0,507 0,706 0,994 Man sieht, ab 23 Personen ist die Wahrscheinlichkeit, daß davon 2 am gleichen Tag Geburtstag haben, größer als 50 % 16.2.1.3 Bedingte Wahrscheinlichkeiten, Satz von Bayes 1. Bedingte Wahrscheinlichkeit Die Wahrscheinlichkeit für das Eintreten des Ereignisses B unter der Bedingung, daß das Ereignis A bereits eingetreten ist, die sogenannte bedingte Wahrscheinlichkeit P(B/A) oder P&(B), wird definiert durch P{B/A) = ^P(^" P(^°- A639> Es gilt- 1. Falls P(A) ^ 0 und P(B) ^ 0, so ist nm=?(Am A64oa) P(B) P(A) ' [ } 2. Falls P(AlA2A3 . . 4n) ^ 0, so ist P{AlA2. An) = P(A1)P(A2/Al)...P(An/A1A2...An_1). ' A6.40b) 2. Unabhängige Ereignisse Unabhängige Ereignisse A und B liegen vor, wenn P(A/B) = P{A) und P(B/A) = P(B) A6 41a) erfüllt ist Für sie gilt P(AB) = P(A)P{B). A6 41b) 3. Ereignisse in einem vollständigen Ereignissystem Wenn A eine Ereignismenge ist und die Ereignisse B{ € A mit P(Bi) > 0 (i = 1,2, , n) ein vollständiges Ereignissystem bilden, dann gilt für jedes Ereignis A G A: 1. Satz von der vollständigen Wahrscheinlichkeit P(A) = J2P(A/B,)P(Bl) A6 42)
774 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 2. Satz von Bayes p{Bk/A) - /wfc)m) . A643) ZPiA/BtWBi) i=l ¦ Von 3 gleichartigen Maschinen eines Betriebes produziert die erste 20 %, die zweite 30 % und die dritte 50 % der Gesamtproduktion. Dabei verursacht die erste 5 %, die zweite 4 % und die dritte 2 % Ausschuß ihrer eigenen Produktion. Zwei typische Fragen der Qualitätskontrolle sind dann- a) Mit welcher Wahrscheinlichkeit ist ein zufällig dem Lager entnommenes Stück Ausschuß? b) Wie groß ist die Wahrscheinlichkeit dafür, daß ein zufällig gefundenes Ausschußstuck z B von der ersten Maschine produziert wurde? Man wählt folgende Bezeichnungen: • Aii Produkt der z-ten Maschine (z = 1,2,3) mit P{AX) = 0,2 , P(A2) = 0,3, P(A3) = 0,5 Weiter gilt: • AiAj = 0, Ai + A2 + As = / • • A: Ausschußstück aus der gesamten Produktion. • P(A/Ai) Ausschußwahrscheinlichkeit der ersten Maschine 0,05; analog gilt P(A/A2) = 0,04 und P(A/AS) = 0,02. Damit können die gestellten Fragen wie folgt beantwortet werden a) P(A) = PiA^PiA/A,) + P(A»)P(A/At) + P(A3)P(A/A3) = 0,2-0,05+ 0,3-0,04+ 0,5-0,02 = 0,032. 16.2.2 Zufallsgrößen, Verteilungsfunktion Um die Methoden der Analysis in der Wahrscheinlichkeitsrechnung einsetzen zu können, braucht man die Begriffe Variable und Funktion. 16.2.2.1 Zufallsveränderliche Eine Menge von Elementarereignissen möge sich dadurch beschreiben lassen, daß eine Größe X unter Zufallsbedingungen Werte x aus einem reellen Bereich R annehmen kann. D h., jedes zufällige Ereignis eines gewissen Versuches soll durch eine reelle Zahl x charakterisiert werden Dann werden alle zufälligen Ereignisse dieses Versuches durch die Variable X beschrieben, die Zufallsgröße oder Zufallsveränderliche genannt wird. Besteht R aus endlich oder abzählbar unendlich vielen Werten, dann spricht man von einer diskreten Zufallsgröße; besteht R aus der ganzen reellen Zahlengeraden oder aus Teilintervallen, dann spricht man von einer kontinuierlichen Zufallsgröße. ¦ A: Ordnet man im Beispiel A, S 771 den Ereignissen An, A\2, A2\ bzw A22 die Werte 1, 2, 3 bzw 4 zu, so ist damit eine diskrete Zufallsgröße X definiert. ¦ B: Die Brenndauer T einer aus einem Produktions vorrat willkürlich herausgegriffenen Glühlampe ist eine kontinuierliche Zufallsveränderliche. Das Elementarereignis T = t tritt ein, wenn die Brenndauer T gleich der Zeit t ist. 16.2.2.2 Verteilungsfunktion 1. Verteilungsfunktion und ihre Eigenschaften Die Verteilung der Zufallsveränderlichen X wird durdh die Verteilungsfunktion beschrieben: F(x) = P(X <x) für - oo < x < oo . A6.44) Sie gibt an, mit welcher Wahrscheinlichkeit die Zufallsgröße X einen Wert zwischen — oo und x annimmt. Die Verteilungsfunktion hat die folgenden Eigenschaften- 1. F(-oo) =0, F(+oo) = 1.
16.2 Wahrscheinlichkeitsrechnung 775 2. F(x) ist eine nicht fallende Funktion von x . 3. F(x) ist rechtsseitig stetig Hinweis: In verschiedenen Darstellungen wird auch, abweichend von der DIN-Vorschrift, die Definition F(x) = P(X < x) verwendet 2. Verteilungsfunktion bei diskreten und kontinuierlichen Zufallsgrößen Diskrete Zufallsgröße: Eine diskrete Zufallsveränderliche X , die die Werte Xi (i = 1,2, ) mit den Wahrscheinlichkeiten P(X — Xi) = Pi (i = 1,2,...) annimmt, hat die Verteilungsfunktion F(*)=£ft. A6.45) Xi<X Kontinuierliche Zufallsgröße: Bei einer kontinuierlichen Zufallsgröße ist die Wahrscheinlichkeit dafür, daß sie einen bestimmten Wert Xi annimmt, gleich 0. Man betrachtet daher die Wahrscheinlichkeit dafür, daß X in einem endlichen Intervall [a, b] liegt. Läßt sich diese mit Hilfe einer Funktion f(t), der Wahrscheinlichkeitsdichte, in der Form 0 P(a<X<b) = Jf(t) dt darstellen, dann spricht man von einer stetigen Verteilungsfunktion X F{x) = P(X <x) = f f(t)dt A6.46) A6.47) und einer stetigen Zufallsgröße. Hinweis: Wenn keine Verwechslung mit der oberen Integrationsgrenze möglich ist, wird häufig die Integrationsveränderliche anstelle von t mit x bezeichnet 3. Flächeninterpretation der Wahrscheinlichkeit Durch die Einführung der Verteilungsfunktion und der Wahrscheinlichkeitsdichte in A6.44) und A6 46) kann die Wahrscheinlichkeit P(X < x) = F(x) als Flächeninhalt interpretiert werden, und zwar als Inhalt der Fläche zwischen Dichtefunktion f(t) und der Abszisse im Intervall — oo < t < x (Abb. 16.1a). M S 0 > iL :a 7? > t t b) Abbildung 16.1 Häufig wird eine Wahrscheinlichkeit a vorgegeben Gilt P{X>x) = a, A6.48) dann nennt man die zugehörige Abszisse x = xa Quantil oder auch Fraktil der Verteilung (Abb. 16.1b). Das bedeutet. Der Flächeninhalt unter der Dichtefunktion f(t) rechts von xa ist gleich a. Hinweis: In der Literatur wird allerdings auch die Fläche links von xa zur Definition des Quantiis verwendet. In der mathematischen Statistik wird für kleine Werte a (z.B. a = 5% oder a = 1%) manchmal
776 16 Wahrscheinlichkeitsrechnung und mathematische Statistik der Begriff Irrtumswahrscheinlichkeit verwendet. Die dazugehörigen Quantile sind für die wichtigsten praktischen Verteilungen tabelliert worden (Tabellen 21.16, S. 1120 bis Tabelle 21.20, S 1127) 16.2.2.3 Erwartungswert und Streuung, Tschebyscheffsche Ungleichung Zur groben Charakterisierung einer Verteilung werden vor allem die beiden Parameter fi (Mittelwert) und o2 (Streuung) einer Zufallsgröße X verwendet In Anlehnung an die Mechanik kann dabei der Mittelwert als Abszisse des Schwerpunktes einer Fläche interpretiert werden, die von der Kurve der Dichtefunktion f(x) und der x-Achse begrenzt wird. Die Streuung stellt dann ein Maß für die Abweichung der Zufallsgröße X vom Mittelwert fi dar. 1. Erwartungswert Wenn g{X) eine Funktion der Zufallsveränderlichen X ist, so ist auch g{X) eine Zufallsveränderliche Als ihr Erwartungswert wird definiert* 1. Diskreter Fall: E(g{X)) = J2 9(xk)Pk - A6 49a) k +oo 2. Stetiger Fall: E(g(X)) = f g(x)f{x) dx. A6.49b) oo -+00 Vorauszusetzen ist dabei die Konvergenz der Reihe J^ \g(xk)\Pk bzw des Integrals / \g(x)\f(x) dx k=i J-°° Den Erwartungswert der Zufallsgröße X selbst erhält man mit g{X) = X zu +oo fix = E(X) = ^ XkPk bzw. / xf(x)dx, A6 50a) k so daß wegen A6 49a,b) u. a. auch gilt: E(aX + b) = apx + b (a,b const) A6.50b) 2. Momente n-ter Ordnung Man führt weiter ein: 1. das Moment n-ter Ordnung E(Xn) , A6 51a) 2. das zentrale Moment n-ter Ordnung E((X — ßx)n) ¦ A6.51b) 3. Streuung und Standardabweichung Speziell für n = 2 wurden die äquivalenten Ausdrücke Streuung, Varianz und Dispersion eingeführt. J2(x* ~ Vxfpk bzw. E((X - fixJ) = D\X) =o*x = {^ n A6 52) )dx j{x-ßx?f{x)c Die Größe ox wird Standardabweichung genannt Es gelten die folgenden Beziehungen- D2(X) = ax = E(X2) - fi\ , D2{aX + b) = a2D2{X) A6 53) 4. Gewogenes und arithmetisches Mittel Im diskreten Fall ergibt sich als Erwartungswert der Zufallsgröße X gemäß A6.50a) das gewogene Mittel E{X) - pizi + ... + pnxn A6.54) der Werte rci,. ., xn mit den Wahrscheinlichkeiten pk (k = 1,.. , n), Gewichte genannt. Bei Gleichverteilung ist pi = p2 = • • = Pn = l/n 5 und E(X) wird zum arithmetischen Mittel der Werte Xk : E{x) = Xl+X2 + ...+Xn_ (i655)
16.2 Wahrscheinlichkeitsrechnung 777 Im kontinuierlichen Fall erhält man bei Gleichverteilung der Zufallsgröße X über dem endlichen Intervall [a, b] die Dichtefunktion A6.56) tl \ I für a < x < b, fw = < b-a ~ ~ ( 0 sonst, daraus folgt: EiX) = J-[xdx = ±±±, v ' b-aJ 2 4 = (b-af 12 A6 57) JLZ, 5. Tschebyscheffsche Ungleichung Hat die Zufallsveränderliche X den Erwartungswert \x und die Standardabweichung o, so gilt für beliebiges A > 0 die TsCHEBYSCHEFFsc/ie Ungleichung- P(\X-fi\>\a)<±. A6.58) Danach ist es sehr unwahrscheinlich, daß Werte der Zufallsveränderlichen X um ein Vielfaches der Standardabweichung vom Erwartungswert jjl entfernt liegen (A groß). 16.2.2.4 Mehrdimensionale Zufallsveränderliche Ein Zufallsvektor X = (X\, X2,.. , Xn) liegt vor, wenn jedes Elementarereignis darin besteht, daß n Zufalls veränderliche X\,.. ,Xn n reelle Zahlenwerte X\, ,xn annehmen (s auch Zufallsvektor in 16.3.1.1,4., S. 793). Die zugehörige Verteilungsfunktion wird durch F(xu ...,zn) = P(Xi <xu...,Xn< xn) A6.59) beschrieben. Sie heißt stetig, wenn eine Funktion f(t\, , tn) existiert, so daß F(xu.. ,xn)= J ••• I /(*i, .,*„)cfti dtn A660) —oo —oo gilt. Die Funktion f(t\, .., tn) heißt die Dichte der Verteilung oder Verteilungsdichte Läßt man einige der Variablen x\,. ,xn nach Unendlich streben, so erhält man sogenannte Randverteilungen. Genauere Untersuchungen und Beispiele findet man in [16 4] und [16 26] Von unabhängigen Zufallsveränderlichen X\,. , Xn spricht man, wenn gilt F{xu.. ,xn) = F1{x1)F2{x2)...Fn{xn), f{tu .,*n) = /i(*i) fn{tn) A6.61) 16.2.3 Diskrete Verteilungen 1. Zweistufige Grundgesamtheit Handelt es sich um eine zweistufige Grundgesamtheit mit zwei Klassen von Elementen, von denen die eine Klasse M Elemente mit der Eigenschaft A enthält, die andere N — M Elemente, die die Eigenschaft A nicht besitzen, dann lassen sich bei der Frage nach den Wahrscheinlichkeiten P(A) = p und P{A) = 1 — p zwei Fälle der zufälligen Entnahme von Elementen betrachten, der eine mit Zurücklegen der n gezogenen Elemente, der andere ohne Zurücklegen der gezogenen n Elemente Die gezogenen n Elemente, darunter k mit der Eigenschaft A , werden Stichprobe genannt, n ist der Umfang der Stichprobe. Man kann diesen Sachverhalt mit Hilfe des Urnenmodells illustrieren 2. Urnenmodell In einem Gefäß befindet sich eine große Anzahl schwarzer und weißer Kugeln. Gefragt ist nach der Wahrscheinlichkeit dafür, daß sich unter n gezogenen Kugeln k schwarze befinden. Wird jede gezogene Kugel nach der Feststellung ihrer Farbe wieder zurückgelegt, dann ergibt sich für die Wahrscheinlichkeit
778 16 Wahrscheinlichkeitsrechnung und mathematische Statistik dafür, daß sich unter den gezogenen n Kugeln k schwarze befinden, eine Binomialverteilung. Werden die gezogenen n Kugeln nicht zurückgelegt, dann ergibt sich eine hypergeometrische Verteilung 16.2.3.1 Binomialverteilung Sind bei einem Versuch nur die beiden Ereignisse A und A möglich und sind die zugehörigen Wahrscheinlichkeiten P(A) = p und P(A) = 1 — p, so ist W£(k)= ( Jp*(l-p)n-fc (fc = 0,l,2,...,n) A6 62) die Wahrscheinlichkeit dafür, daß bei n-maliger Wiederholung des Versuches das Ereignis A genau k- mal eintritt. Bei jedem Ziehen eines unabhängigen Elements aus der Grundgesamtheit gilt M — N - M P(A) = -, P(A) = —R- = l-p = q. A663) Die Wahrscheinlichkeit, bei den ersten k Ziehungen ein Element_mit der Eigenschaft A zu ziehen und bei den darauffolgenden n — k ein Element mit der Eigenschaft A , ist pk(l — p)n~k , da die Ergebnisse der Ziehungen unabhängig voneinander sind. Dabei ist die Reihenfolge der Ziehung der Elemente ohne Bedeutung, da die Kombinationen $"«(£*}! A664) die gleiche Wahrscheinlichkeit haben und auch zu einer Stichprobe mit dem Umfang n mit k Elementen der Eigenschaft A führen Eine Zufallsveränderliche Xn , bei der P(Xn = k) = W£(k) ist, heißt binomialverteilt mit den Parametern n und p. Es gilt. 1. Erwartungswert und Streuung E(Xn) = fi = n-p1 A6.65a) D2{Xn) = a2 = n ¦ p(l - p) A6.65b) 2. Approximation der Binomialverteilung durch die Normalverteilung Ist Xn binomialverteilt, so ist ^p(^o^^)-w,jA^]dt- (i665c) Demnach läßt sich die Binomialverteilung für große n näherungsweise durch eine Normalverteilung (s. 16.2.4 1, S 780) mit den Parametern fix = E(Xn) und a2 = D2(Xn) ersetzen Dies ist mit im allgemeinen ausreichender Genauigkeit möglich, wenn np > 4 und n(l — p) > 4 ist 3. Rekursionsformel Für praktische Rechnungen ist die folgende Rekursionsformel der Binomialverteilung nützlich: w;{k +1) = ^| •v- ¦ w;(k). A6 65d) 4. Summe von binomialverteilten Zufallsgrößen Sind Xn und Xm mit den Parametern n,p bzw. m,p binomialverteilte Zufallsveränderliche, so ist die Zufallsveränderliche X = Xn + Xm ebenfalls binomialverteilt, und zwar mit den Parametern n + m,p In Abb.l6.2a,b,c sind drei Binomialverteilungen für die Fälle n = 5 , p = 0, 5 ; 0,25 und 0,1 dargestellt. Die Abbildung zeigt auch, daß sich in Übereinstimmung mit der Symmetrie der Binomialkoeffi- zienten für p = q = 0,5 eine Symmetrie der Binomialverteilung ergibt Mit der Entfernung des Wertes p von 0,5 nimmt diese Symmetrie ab.
16.2 Wahrscheinlichkeitsrechnung 779 0.7 4 0.6 4 0.5 4 0.4 4 03 4 0.2 -I 0.1 -| 0.0 p=0.25 b) 0 12 3 4 5 Abbildung 16.2 0.7 4 0.6-i 0.5 0.4 0.3 i 0.2 0.1 0.0 p=0.10 c) 0 12 3 4 5 16.2.3.2 Hypergeometrische Verteilung Wie bei der Betrachtung der Binomialverteilung liege eine zweistufige Grundgesamtheit mit zwei Klassen von Elementen vor, von denen die eine Klasse M Elemente mit der Eigenschaft A enthält, die andere N — M Elemente, die die Eigenschaft A nicht besitzen. Im Unterschied zu dem auf die Binomialverteilung führenden Fall mit Zurücklegen der gezogenen Kugeln des Urnenmodells wird jetzt der Fall ohne Zurücklegen betrachtet Die Wahrscheinlichkeit dafür, daß sich unter n gezogenen Kugeln k schwarze befinden, ist gegeben durch P(X = k) = W^N(k) N -M' -k :) mit 0<k<n, k<M , n-k<N - M . A6.66a) Die Wahrscheinlichkeiten p und q berechnet man gemäß A6.63). Eine Zufallsgröße X , die der Verteilung A6 66a) genügt, heißt hypergeometrisch verteilt. Es gilt Erwartungswert und Streuung (M\ (N - M k ) \ n — k /i = E(X) : fc=0 M A6 67a) a2 = D2{X) = E{X2) M 2. Rekursionsformel [E(x)\2=j:k2 k=0 N-n N- (* D) / M\N-n V ~~NJ N-l (n-k){M-k) (k + l)(N-M-n + k + l) wnMAk). A6.67b) A6 67c) In Abb.l6.3a,b,c sind drei hypergeometrische Verteilungen für die Fälle ./V = 100, M = 50, 25 und 10 für n = 5 dargestellt, was den Fällen p = 0,5, 0,25 und 0,1 der Abb. 16.2a,b,c entspricht. In diesen Beispielen sind keine signifikanten Unterschiede zwischen Binomial- und hypergeometrischer Verteilung zu erkennen.
780 16. Wahrscheinlichkeitsrechnung und mathematische Statistik p=0.50 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 b) p=0.25 ±_ 0 12 3 4 5 Abbildung 16.3 0.7 H 0.6 0.5 0.4 0.3 0.2 -I 0.1 i 0.0 p=0.10 0 12 3 4 5 c) 16.2.3.3 Poisson-Verteilung Die Verteilung einer diskreten Zufalls veränderlichen X , bei der P(X-. (ä; = 0,1,2, ,A>0) ist, heißt PoiSSON- Verteilung mit den Parametern A . Es gilt 1. Erwartungswert und Streuung D2(X) : E{X) = \, A6 69a) :A. A6 ( A6.69b) 2. Summe von Poisson-verteilten Zufallsgrößen Sind X\ und X2 unabhängige, PoiSSON-verteilte Zufallsveränderliche mit den Parametern Ai bzw A2, so ist auch X = X\ + X2 eine poissonverteilte Zufallsveränderliche mit dem Parameter A = Ax + A2 3. Rekursionsformel fk + 1^ X -^ A6 69c) A fc + 1 4. Zusammenhang zwischen Poisson- und Binomialverteilung Die PoiSSON-Verteilung geht aus einer Folge von binomialverteilten Zufallsveränderlichen Xn mit den Parametern n,p durch den Grenzübergang n —» oo hervor, wenn man p (p —+ 0) mit n so variiert, daß np = A = const bleibt. Für p < 0,08, n > 1500p kann die Binomialverteilung meist mit ausreichender Genauigkeit durch die PoiSSON-Verteilung ersetzt werden, deren Auswertung einfacher ist Zahlenwerte für die PoiSSON-Verteilung enthält die Tabelle 21.16, S 1120 In Abb.l6.4a,b,c sind drei PoiSSON-Verteilungen für A = np = 2,5 ; 1,25 und 0, 5 dargestellt, d h für Parameter, die denen der Abb. 16.2 und Abb. 16.3 entsprechen 5. Anwendungen (s auch Poisson-Prozesse in 16.2.6.2, S 791) Durch eine PoiSSON-Verteilung lassen sich z.B beschreiben Anzahl der Kunden, die in einem bestimmten Zeitintervall einen Laden besuchen, Anzahl der Druckfehler in einem Buch, Rate der radioaktiven Zerfälle 16.2.4 Stetige Verteilungen 16.2.4.1 Normalverteilung 1. Verteilungsfunktion und Dichte Eine Zufallsveränderliche X mit der Verteilungsfunktion 1 P(X <x) = F{x) = aV2n i _(*-mJ e 2a2 dt A6 70a)
16.2 Wahrscheinlichkeitsrechnung 781 1 0.7- 0.6- 0.5- 0.4- 0.3- 0.2- O.l-i nn J u.u t X=2.5 1 1 1 iiiii Dl 2 3 4 5 k ? 0.7 - 0.6 - 0.5 - 0.4 - 0.3 -; 0.2 H 0.1 ] nn J u.u -¦ ( ) X=125 Ii. L 2 3 4 5 k , 0.7- 0.6 i 0.5 A 0.4 i 0.3 H 0.2 J 0.1 - 0.0 -1 ( i ^=0.50 1 1 i 3 12 3 4 k a) b) Abbildung 16.4 heißt normalverteilt, genauer (/i, o-2)-normalverteilt. Die Funktion /« = c) 1 _I£zali . _ A6 70b) <7V27T heißt die Dichte der Normalverteilung. Sie nimmt an der Stelle t = ji ihr Maximum an und hat Wendepunkte bei ii ± er (s. B.59) und Abb. 16.5a) t b) Abbildung 16 5 2. Erwartungswert und Streuung ergeben sich für die Parameter /i und a2 der Normal Verteilung zu: (*-mJ 1 r (s-M, H = E(X) = —= / xe~ *> dx und : D\X) = E[(X - fiJ} = —= / (x - ßfe- '£ dx C7V27T J A6.71a) A6.71b) Sind die Zufallsveränderlichen X\ und X2 unabhängig und normalverteilt mit den Parametern (ii, G\ I bzw /i2 , G2 , so ist auch die Zufallsveränderliche X = k\Xi + Ä/2^2 (&i5 &2 reell, const) normalverteilt j mit den Parametern fi = ki/ii + /c2/i2 , 0 = y ^i2ci2 + fc22c722. I Durch die Substitution r = ^ in A6.70a) läßt sich die Wahrscheinlichkeit P(a < X < b) über die I normierte Normalverteilung $(x) wie folgt berechnen (b — n } a P{a<X<b) = < $ p?) A6.72)
782 16 Wahrscheinlichkeitsrechnung und mathematische Statistik 16.2.4.2 Normierte Normalverteilung, Gaußsches Fehlerintegral 1. Verteilungsfunktion und Dichte Aus A6.70a) erhält man für \x = 0 und er2 = 1 die Verteilungsfunktion P(X <x)= <P(x) = —= / e" 2 dt= / ip{t) dt A6.73a) v 2tt J J —oo —oo der normierten Normalverteilung Ihre Dichtefunktion ¥>(*) = ^e^ A6 73b) beschreibt die GAUSSsche Glockenkurve (Abb. 16.5b) Die @,1)-NormalVerteilung $(x) liegt tabelliert vor (Tabelle 21.17, S 1122), und zwar hier nur für positive Argumente x , da für negative Argumente der Zusammenhang <P(-x) = 1 - <P{x) A6 74) genutzt werden kann. 2. Wahrscheinlichkeitsintegral Das Integral <P(x) wird auch Wahrscheinlichkeitsintegral oder GAVSSsches Fehlerintegral genannt In der Literatur findet man dafür auch die folgenden Definitionen: 1 } tl 1 $0(x) = -7= / e" 2 dt = $(x) - - , A6 75a) V2tt Jq 2 9 °r erf (x) = -= e~t2 dt = 2 • ^(v^x) (wegen erf (x) s 8 2 5,5., S. 478). A6 75b) v o 16.2.4.3 Logarithmische Normalverteilung 1. Verteilungsfunktion und Dichte Die stetige Zufallsgröße X , die alle positiven Werte annehmen kann, besitzt eine logarithmische Normalverteilung (auch Lognormalverteilung genannt) mit den Parametern pi und o\ , wenn die Zufallsgröße Y mit y = logX A6 76) normalverteilt ist mit den Parametern {iL und a\ . Die Zufallsgröße X hat demzufolge die Dichte @ für *<0, /(*) = j Jogc_ / (logt_-^\ A6 77a) und die Verteilungsfunktion ( 0 für x < 0 , F(x) = _1_ l0F M^H m ftlr „. ^ n A6.77b) —7= / exp ( —^-—r^r^— ) dt für x > 0 Bei praktischen Anwendungen wird als Logarithmus entweder der natürliche oder der dekadische Logarithmus verwendet. 2. Erwartungswert und Streuung Für Erwartungswert und Streuung der Lognormal Verteilung erhält man, wenn der natürliche Logarithmus verwendet wird: ß = exp f pL + -± J , g1 = (exp g\ - l) exp B/iL + o|) A6 78)
16.2 Wahrscheinlichkeitsrechnung 783 3. Bemerkungen a) Die Dichtefunktion der Lognormalverteilung ist links durch Null begrenzt und läuft rechts flach aus. Die Abb.16.6 zeigt die Dichte der Lognormalverteilung für verschiedene Werte von ßL und <jl- Dabei wurde der naturliche Logarithmus verwendet. b) Man beachte: \il und g\ sind Erwartungswert und Streuung der transformierten Zufallsgröße Y = logX , während /t und a2 gemäß A6.78) Erwartungswert und Streuung der Zufallsgröße X sind. c) Die Verteilungsfunktion F(x) der Lognormalverteilung kann mit Hilfe der Verteilungsfunktion <P(x) der normierten Normalverteilung (s. A6.2.4.2), S 782) berechnet werden, denn es gilt: F(x) = £ log z-/xL &L A6.79) d) Die Lognormalverteilung wird häufig bei Lebensdaueranalysen von ökonomischen, technischen und biologischen Vorgängen angewendet. e) Während die Normalverteilung mit der additiven Überlagerung einer großen Anzahl voneinander unabhängiger zufälliger Ereignisse in Zusammenhang gebracht werden kann, ist es bei der Lognormalverteilung das multiplikative Zusammenwirken vieler zufälliger Einflüsse. f(t)' 1,5 1,0 0,5 0 L / \ |iL=ln 0,5; gl=0,5 V ^\^ jyO;oL=l 0,5 1,0 1,5 2,0 2,5 t 2,0 1,5 1,0 0,5 0 \A.=2 0,5 v^_ 1,0 1,5 2,0 t Abbildung 16.6 Abbildung 16.7 16.2.4.4 Exponentialverteilung 1. Dichte und Verteilungsfunktion Eine stetige Zufallsgröße X genügt der Exponentialverteilung mit dem Parameter A (A > 0), wenn sie die Dichte (s Abb.16.7) /(*) = 0 für t < 0, Xe~xt für t > 0 und damit die folgende Verteilungsfunktion hat: F(x)= f f(t)dt= ° 0 für x < 0, ¦ e~Xx für x > 0 A6.80a) A6 80b) 2. Erwartungswert und Streuung der Exponentialverteilung sind: 1 o 1 A' A2" A6.81)
784 16 Wahrscheinlichkeitsrechnung und mathematische Statistik Angewendet wird die Exponentialverteilung zur Beschreibung folgender Vorgänge: Dauer von Telefongesprächen, Lebensdauer des radioaktiven Zerfalls, Arbeitszeit einer Maschine zwischen zwei Stillständen, Lebensdauer von Bauelementen oder Lebewesen. 16.2.4.5 Weibull-Verteilung 1. Dichte und Verteilungsfunktion Die stetige Zufallsgröße X genügt einer Weibull-Verteilung mit den Parametern a und ß (a > 0, ß > 0), wenn ihre Dichte durch [0 für t<0, . a-l f(t)- a (t_ exp für t>0 A6 82a) und ihre Verteilungsfunktion durch '0 für x < 0, F(x): 1 — exp für x > 0 A6.82b) gegeben sind 2. Erwartungswert und Streuung ,=/,r(i+i), ^tKH2K)] Mit r(x) wird dabei die Gammafunktion (8.105a), S. 478 bezeichnet. oo r(x)= fe^e^dt für x >0. o In A6.82a) ist a der Formparameter und ß der Maßstabsparameter (Abb. 16.8, Abb. 16.9). A6.83) A6 84) f(tI 1,0 0,5 0 i \ ß=1 y \ot=l \ / a=0,5s^^>(^^v\ 0,5 1,0 1,5 2,0 2,5 t 2 3 4 Abbildung 16.8 Abbildung 16 9 Bemerkungen: a) Für a = 1 geht die WEIBULL-Verteilung in die Exponentialverteilung mit dem Parameter A = über 1
16.2 Wahrscheinlichkeitsrechnung 785 b) Die Weibull-Verteilung gibt es auch als dreiparametrige Verteilung, wenn zusätzlich der Parameter 7 als sogenannter Lageparameter eingeführt wird. Die Verteilungsfunktion lautet dann: F(x) = 1 - exp x — 7 A6.85) c) Die Weibull-Verteilung wird besonders in der Zuverlässigkeitstheorie angewendet, weil sie in sehr flexibler Weise die Funktionsdauer von Bauteilen oder Baugruppen beschreiben kann. 16.2.4.6 %2-Verteilung 1. Dichte und Verteilungsfunktion Es seien Xi, X2,. ., Xn n unabhängige, @,1)-normalverteilte Zufalls veränderliche. Dann heißt die Verteilung der Zufallsveränderlichen X2 = X12 + X22 + --. + Xn2 A6.86) X2-Verteilung mit dem Freiheitsgrad n. Ihre Verteilungsfunktion wird mit Fxi(x) bezeichnet, die zugehörige Dichtefunktion mit fx*{t) Es gilt: 1 ™ _ i _i -U e 2 für t > 0, fAt) = \ 22r(%) A6 87a) ,0 für K0 X Fx2{x) = P{x2 <x) = 7-pr- ft2~ le~2 dt {x > 0). ' A6.87b) 2. Erwartungswert und Streuung E(x2) = n, A6.88a) D2(X2) = 2n. A6.88b) 3. Summe von Zufallsveränderlichen Sind Xi und X2 unabhängige Zufallsveränderliche, die je einer x2~Verteilung mit n bzw. m Preiheitsgraden genügen, so ist die Zufallsveränderliche X = Xi + X2 x2_verteilt mit n + m Freiheitsgraden. 4. Summe von normalverteilten Zufallsveränderlichen Sind Xi, X2 ,..., Xn unabhängige, @, a)-normalverteilte Zufallsveränderliche, so besitzt X =JTX? die Dichte /(*) = ^/x2 (J^j , A6 89) X =-t^ die Dichte /(*) = -Jx, (%) , A6 90) ' i=l X ¦ 1 n 2t /' /2 N Y^X2 die Dichte f(t) = -fx2 - ) . A6 91) N»£ a' \a 5. Quantile Für die Quantile (s. 16.2.2.2,3., S. 775) xl m der X2~Verteilung mit dem Freiheitsgrad m (Abb.16.10) gilt P{X>xlm) = a. A6.92) Quantile der x2-Verteilung sind in Tabelle 21.18, S 1124, zu finden. 16.2.4.7 Fisher-Verteilung 1. Dichte und Verteilungsfunktion Sind Xi und X2 unabhängige, x2~verteilte Zufallsveränderliche mit rai bzw. rri2 Freiheitsgraden, dann
786 16 Wahrscheinlichkeitsrechnung und mathematische Statistik fx2(t)| 0 v2 A „ ,a t Abbildung 16.10 Abbildung 16 11 heißt die Verteilung der Zufallsveränderlichen F -*/*» •*• Tni,7Tl2 / FiSHER-Verteilung oder F-Verteilung mit den Freiheitsgraden rai, m2 Es gilt* fp(t) - i /mi\m!/2 /m2xm2/2 r /mi ra^N v 2 2; ,21 _ 1 t 2 L r(?M!?)(?.+?y?+ V 2 ELL _|_ 2212. 2 0 für * > 0 , für t < 0 Für x < 0 gilt FF(z) = P{Fmum2 < x) = 0; für x > 0 gilt FF(x) = P(Fmim2 < x) m2^ 2 v 2 2 t/- t 2 dt mi _i_ mg. • 2 2. Erwartungswert und Streuung ra2 ¦& \-Fmi,m,2 ) — 1712 — 2 ' A6.95a) 2m22(mi +m2 - 2) ^(^im8) = mi(m2 -2J(m2-4) ' A6 93) A6 94a) A6 94b) A6 95b) 3. Quant ile Die Quantile (s 16 2.2.2,3., S. 775) famim2 der FiSHER-Verteilung (Abb.16.11) sind in Tabelle 21.19, S. 1125 zu finden. 16.2.4.8 Student-Verteilung 1. Dichte und Verteilungsfunktion Ist X eine @,1)-normalverteilte Zufallsveränderliche und Y eine von X unabhängige Zufallsveränderliche, die x -verteilt ist mit m = n — 1 Freiheitsgraden, so heißt die Verteilung der Zufallsgröße T X /Y/m Student -Verteilung oder t-Verteilung mit m Freiheitsgraden Es gilt- (m+l\ 1 fs(t) = ¦ . -m ¦(?) f,+ ro+1 *2\~ A6.96) A6.97a)
16.2 Wahrscheinlichkeitsrechnung 787 Fs{x) = P(T<x)= f fs(t) dt = V l J I dt ^K)' A6.97b) 0 t iL a,m * > t a) 2. Er wart ungs wert und Streuung E(T) = 0 (m > 1), A6 98a) 3. Quant ile Abbildung 16.12 D2(T) : ra-2 (m > 2). A6 98b) P(T > tatm) = öl A6 99a) oder P( |T| > tQ/2,m) = a. A6.99b) Die Quantile der Student-Verteilung sind in Tabelle 21.20, S. 1127 zu finden. Das Einsatzgebiet der Student-Verteilung, die von Gösset unter dem Pseudonym Student eingeführt wurde, sind Stichproben mit geringem Umfang n, für die nur Schätzwerte des Mittelwertes und der Standardabweichung angegeben werden können. Die Standardabweichung der Grundgesamtheit ist in A6 98b) nicht mehr enthalten. 16.2.5 Gesetze der großen Zahlen, Grenzwertsätze Die Gesetze der großen Zahlen geben Zusammenhänge zwischen der relativen Häufigkeit ua/u eines zufälligen Ereignisses A und deren Wahrscheinlichkeit P(Ä) bei einer großen Anzahl von Wiederholungen des Versuches wieder. 16.2.5.1 Gesetz der großen Zahlen von Bernoulli Bei beliebig vorgegebenen Zahlen £ > 0 und n > 0 ist p(\^-P{A)\<e)>l- \\ n I / ¦v, A6 100a) wenn n > 1 4e2r) A6.100b) Weitere Gesetze dieser Art s [16 6], [1621]. ¦ Wievielmal muß man würfeln, um mit einer Wahrscheinlichkeit von mindestens 95 % daraufschließen zu können, daß sich die Wahrscheinlichkeit des Auftretens der Augenzahl Sechs von der beobachteten relativen Häufigkeit höchstens um den Betrag 0,01 unterscheidet? Es ist e = 0,01 und r\ = 0,05 , also 4e2r/ = 2 • 10~5 , und somit muß nach dem BERNOULLischen Gesetz der großen Zahlen n > 5 • 104 sein. Diese Zahl ist sehr groß Man kann n verkleinern, wenn man die Verteilungsfunktion kennt (s. [16.10])
788 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 16.2.5.2 Grenzwertsatz von Lindeberg—Levy Wenn die unabhängigen Zufallsveränderlichen Xx,.. , Xn derselben Verteilung mit dem Erwartungswert /i und der Streuung a2 genügen, dann strebt die Verteilungsfunktion Fn(y) der zufälligen Veränderlichen 1 n Yn = U <=1; r- A6 101) für n —? oo gegen eine @,1)-NormalVerteilung, d.h , es ist 1 } tl lim Fn(y) = -= / e" 2 dt. A6.102) —oo Die Ersetzung von Fn(y) durch die @,1)-NormalVerteilung ist praktisch für n > 30 möglich (s [16.1] Weitere Grenzwertsätze s. [16 6], [16.10], [16.21]. ¦ Einer laufenden Produktion von Widerständen werden 100 Stück entnommen. Es sei bekannt, daß sämtliche Widerstandswerte unabhängig sind und derselben Verteilung mit der Streuung o2 — 150 genügen. Der Mittelwert der 100 Widerstände sei x = 1050 Q,. In welchem Bereich liegt mit einer Wahrscheinlichkeit von 99 % der Erwartungswert /i der Verteilung? Es ist P(\Y\ < X) = P{-X < Y < X) = P{Y < X) - P(Y < -X). Man kann annehmen (s. A6.101)), daß die Zufalls veränderliche Y = —j—j= einer @,1) -Normal Verteilung genügt Somit ist P(Y < —X) = cr/y/n 1 - P{Y < X) und damit P(\Y\ < X) = 2P(Y < X) - 1. Diese Wahrscheinlichkeit soll 99 % sein. Damit gilt P(Y < X) = <2>(A) = 0,995. Aus der Tabelle 21.17, S. 1122 für die normierte Normal Verteilung entnimmt man dazu A = 2,58 Wegen a/y/TÖÖ — 1,225 gilt daher mit der Wahrscheinlichkeit 99 %: |1050-/i| < 2,58 • 1,225 , d.h. 1046,8 ft < \i< 1053,2 tt 16.2.6 Stochastische Prozesse und stochastische Ketten Eine wirklichkeitsnahe Beschreibung von Vorgängen in der Natur, in der Technik und in der Wirtschaft kann in vielen Fällen nur mit Hilfe von Zufallsgrößen erfolgen, deren Verhalten zeitabhängig ist. ¦ Der Stromverbrauch in einer Stadt zu einem festen Zeitpunkt t ist zufälligen Schwankungen unterworfen, abhängig von den Gewohnheiten der Haushalte und der Industrie Damit kann der Stromverbrauch als stetige Zufallsgröße X aufgefaßt werden. Variiert man die Beobachtungszeit t, so bleibt der Stromverbrauch eine stetige Zufallsgröße, wird aber gleichzeitig zu einer Funktion der Zeit. Die Analyse zeitabhängiger Zufallsgrößen mit den Methoden der Stochastik führt auf stochastische Prozesse, für die es eine umfgangreiche Literatur gibt (s. z.B. [16 7], [16 14], [16.5], [16.8], [16 18], [16 16]). Im folgenden kann nur ein Einblick gegeben werden. 16.2.6.1 Grundbegriffe, Markoffsche Ketten 1. Stochastische Prozesse Eine Menge von Zufallsgrößen, die von einem Parameter abhängen, wird als stochastischer Prozeß bezeichnet. Unter dem Parameter kann man sich im allgemeinen die Zeit t vorstellen, so daß die Zufallsgröße mit Xt und der stochastische Prozeß durch die Menge {Xt\t G T} A6 103) dargestellt werden können. Dabei wird die Menge der Parameterwerte als Parameterraum T, die Menge der Werte der Zufallsgrößen als Zustandsraum Z bezeichnet. 2. Stochastische Ketten Sind bei einem stochastischen Prozeß sowohl der Zustandsraum als auch der Parameterraum diskret, d.h., die Zustandsgröße Xt und der Parameter t können nur endlich viele oder abzählbar unendlich
16 2 Wahrscheinlichkeitsrechnung 789 viele Werte annehmen, dann spricht man von einer stochastischen Kette. Bei einer stochastischen Kette können demzufolge sowohl die Zustände als auch die Parameterwerte durchnumeriert werden: Z = {l,2,...,i,i + 1, . ,} A6.104) T = {t0ltu. ,*m,Wi.- •} mit 0<t0<*i < ..<*m<Wi<-- • A6105) Die Zeitpunkte t0, t\,... müssen nicht äquidistant sein. 3. Markoffsche Ketten, Übergangswahrscheinlichkeiten Hängt bei einer stochastischen Kette die Wahrscheinlichkeit eines Ereignisses Xtm+1 nur vom Zustand zum Zeitpunkt tm ab, so spricht man von einer MARKOFFschen Kette, d h , es gilt P(Xtm+i = Wil^o = io,Xtl = ix-, -,Xtrn = im) = P{Xtm+1 = im+i\Xtm = im) für alle m G {0,1,2. ..} und für alle i0, iu . ., im+1 e Z . A6 106) Es seien eine M ARKOFFsche Kette sowie die zwei Zeitpunkte tm und tm+i gegeben Die bedingten Wahrscheinlichkeiten P(Xtm+1 = J\Xtm =i)= Pij(tm, Wi) A6 107) heißen Ubergangswahrscheinlichkeiten Die Übergangswahrscheinlichkeit gibt an, mit welcher Wahrscheinlichkeit der Zustand Xtni = i bei tm in den Zustand Xtm+l = j bei tm+\ übergeht. Ist der Zustandsraum einer MARKOFFschen Kette endlich, d.h. Z = {1,2,..., TV} , so lassen sich die Ubergangswahrscheinlichkeiten Pij{t\)t2) zwischen den Zuständen zum Zeitpunkt £i und t<i in einer quadratischen Matrix P(ti,t2), der sogenannten Übergangsmatrix, darstellen: P(*i,*2) = ( Pu(ti,t2) P2l(tUt2) Pn(tut2) P22(tl,t2) PlN(ti,t2) \ P2N(tUt2) A6 108) \VNl(tut2) PN2(tUt2) •• PNN{tuh)J Die Zeitpunkte t\ und t2 müssen nicht aufeinanderfolgende Zeitpunkte sein. 4. Homogene Markoffsche Ketten Hängen bei einer MARKOFFschen Kette mit endlichem Zustandsraum die Ubergangswahrscheinlichkeiten A6.107) nicht von der Zeit ab, d h , es gilt Pij{tm,tm+l) =Pij, A6 109) dann spricht man von einer homogenen MARKOFFschen Kette. Zu einer homogenen MARKOFFschen Kette mit dem endlichen Zustandsraum Z = {1, 2, , N} gehört daher die Ubergangsmatrix /Pii P21 P\2 P22 \PN\ PN2 PlN \ P2N PNN' mit 1 pij > 0 für alle i,j und N 2- ^2 Pij — 1 fur a^e i A6 110a) A6.110b) A6 110c) Wegen der Unabhängigkeit von t stellt p^ die Übergangswahrscheinlichkeit vom Zustand i in den Zustand j während einer beliebigen Zeiteinheit dar ¦ Die Anzahl der belegten, von einer Telefonzentrale abgehenden Leitungen kann durch eine homogene MARKOFFsche Kette modelliert werden Zur Vereinfachung wird angenommen, daß nur zwei Leitun-
790 16. Wahrscheinlichkeitsrechnung und mathematische Statistik gen vorhanden sind. Es gibt also die Zustände i = 0,1,2. Die Zeiteinheit sei z.B. 1 Minute. Für die Übergangsmatrix p^ wird die folgende Belegung angenommen: /0,7 0,3 0,0\ (Pij)= 0,2 0,5 0,3 (*,i = 0,1,2). \0,1 0,4 0,5/ In der Matrix (pij) erhält man die 1. Zeile für i = 0. Demzufolge ist das Matrixelement p^ = 0,3 B. Zeile, 3. Spalte) die Wahrscheinlichkeit dafür, daß zur Zeit tm zwei Leitungen belegt sind, falls zur Zeit tm-i eine Leitung belegt war. Hinweis: Jede quadratische Matrix P = (p^) vom Typ (N,N) mit den Eigenschaften A6.110b), A6.110c) wird als stochastische Matrix bezeichnet Ihre Zeilenvektoren heißen stochastische Vektoren Bei einer homogenen MARKOFFschen Kette hängen zwar die Übergangswahrscheinlichkeiten nicht von der Zeit ab, aber die Verteilung der Zufallsgrößen Xt zu einem Zeitpunkt ist durch die Wahrscheinlichkeiten N P(Xt = i) = Pi(t) (i = l,2,...,W) A6.111a) mit £#(*) = 1 A6.111b) i=l gegeben, da sich der Prozeß zum Zeitpunkt t mit Sicherheit in irgend einem der Zustände befindet. Die Wahrscheinlichkeiten A6.111a) können zu dem Wahrscheinlichkeitsvektor p=(pi(t)Mt),..-,PN(t)T) A6.112) zusammengefat werden Der Wahrscheinlichkeitsvektor p ist ein stochastischer Vektor. Er beschreibt die Verteilung auf die Zustände der homogenen MARKOFFschen Kette zum Zeitpunkt t. 5. Wahrscheinlichkeitsvektor und Übergangsmatrix Die Übergangsmatrix P einer homogenen MARKOFFschen Kette gemäß A6.110a,b,c) sei bekannt Ausgehend von der Wahrscheinlichkeitsverteilung zum Zeitpunkt t soll die Wahrscheinlichkeitsverteilung zum Zeitpunkt t + \ berechnet werden, d.h., aus P und p(t) ist p(t + 1) zu bestimmen. Es gilt- p(t + l) = p(t)-P A6.113) und weiter p(t + k) = p(t) • Pfc A6.114) Bemerkungen: 1. Aus A6.114) folgt für t = 0 p(fc) = p@)Pfc , A6.115) d.h, eine homogene MARKOFFsche Kette ist durch die Anfangsverteilung p@) und die Übergangsmatrix P bestimmt 2. Sind die Matrizen A und B stochastische Matrizen, dann ist auch die Matrix C = AB eine stochastische Matrix Daraus folgt: Da P eine stochastische Matrix ist, sind auch die Potenzen Pfc stochastische Matrizen. ¦ Ein Teilchen verändere seine Lage (Zustand) Xt A < x < 5) längs einer Geraden zu den Zeitpunkten t = 1,2,3,. nach der folgenden Vorschrift: 1. Von den Punkten x = 2,3,4 wird es in der nachfolgenden Zeiteinheit um eine Einheit mit der Wahrscheinlichkeit p = 0,6 nach rechts und mit der Wahrscheinlichkeit 1 — p = 0,4 nach links verschoben. 2. An den Punkte x = 1 und x = 5 wird das Teilchen absorbiert, d.h., es bleibt mit der Wahrscheinlichkeit 1 in der nachfolgenden Zeit dort. 3. Zur Zeit t = 0 befinde sich das Teilchen an der Stelle x = 2 . Die Wahrscheinlichkeitsverteilung pC) zum Zeitpunkt t = 3 ist zu berechnen.
16.2 Wahrscheinlichkeitsrechnung 791 0 0 0,6 0 0 0,6 0,4 0 0 0 0 ^ 0 0 0,6 1 / Daraus folgt P3 = / 1 0,496 0,160 0,064 V 0 0 0 0,192 0 0 0 0 0 \ 0,288 0 0,216 0 0,288 0,360 0,192 0 0,744 0 0 1 / Gemäß A6 115) gilt pC) = p@) • P3 mit p@) = @,1,0,0,0) und der Übergangsmatrix ' 0,4 0 0 0,4 0 0 V 0 0 und man erhält pC) = @,496,0, 0, 288,0,0,216) 16.2.6.2 Poisson—Prozesse 1. Poisson-Prozeß Bei den stochastischen Ketten sind sowohl der Zustandsraum Z als auch der Parameterraum T diskret, d h., der stochastische Prozeß wurde nur zu den diskreten Zeitpunkten to, £i, £2, • • betrachtet Beim PoiSSON-Prozeß wird dagegen ein stetiger Parameterraum T vorausgesetzt. 1. Mathematische Fprmulierung Zur mathematischen Formulierung des PoiSSON-Prozesses wird festgelegt- 1. Die Zufallsgröße Xt sei die Anzahl der Signale im Zeitintervall [0,t), 2. die Wahrscheinlichkeit px(t) = P(Xt = x) sei die Wahrscheinlichkeit für x Signale im Zeitintervall [o,t). Darüber hinaus werden folgende Voraussetzungen gefordert, die vom radioaktiven Zerfall und von vielen anderen zufällig ablaufenden Prozessen (zumindest annähernd) erfüllt werden: 3. Die Wahrscheinlichkeit P(Xt = x) für x Signale in einem Zeitintervall der Länge t hängt nur von x und t ab, aber nicht von der Lage des Zeitintervalls auf der Zeitachse 4. Die Anzahl der Signale in disjunkten Zeitintervallen sind unabhängige Zufallsgrößen. 5. Die Wahrscheinlichkeit für mindestens ein Signal in einem kleinen Zeitintervall der Länge At ist proportional zu dieser Länge. Der Proportionalitätsfaktor werde mit A (A > 0) bezeichnet. 2. Verteilungsfunktion Durch die voranstehenden Eigenschaften 3. bis 5. ist die Wahrscheinlichkeitsverteilung der Zufallsgröße Xt bestimmt. Man erhält P(Xt = x) = ^e~xt A6 116a) x\ mit dem Mittelwert \i = Xt und der Streuung a2 = Xt A6.116b) 3. Bemerkungen 1. Für t = 1 ergibt sich aus A6.116a) als Spezialfall die PoiSSON-Verteilung (s 16.2.3.3, S. 780). 2. Zur Interpretation des Parameters A und eventuell zu seiner genäherten Bestimmung aus beobachteten Daten sind die folgenden Zusammenhänge nützlich • A ist die mittlere Anzahl von Signalen pro Zeiteinheit, • — ist der mittlere Abstand zweier Signale eines PoiSSON-Prozesses. A 3. Der POISSON-Prozeß kann als zufällige Bewegung (Irrfahrt) eines Teilchens auf dem Zustandsraum Z = {0,1,2,. } gedeutet werden. Das Teilchen startet im Zustand 0 , und bei jedem Signal springt es vom Zustand i in den nächsten Zustand i + 1 Dabei soll in einem kleinen Zeitintervall At für die Ubergangswahrscheinlichkeit p^i+i vom Zustand i in den Zustand i + 1 gelten: pM+i«AA*. A6.117) A heißt hier Übergangsrate 4. Beispiele für Poisson-Prozesse ¦ Der radioaktive Zerfall ist ein typisches Beispiel für den POISSON-Prozeß- Mit einem Zählgerät wer-
792 16. Wahrscheinlichkeitsrechnung und mathematische Statistik den die Zerfallsakte (Signale) registriert und über einer Zeitachse abgetragen. Der Beobachtungszeitraum sei dabei vernachlässigbar klein im Vergleich zur Halbwertszeit des radioaktiven Strahlers. ¦ Für die Anzahl der in einer Telefonzentrale bis zum Zeitpunkt t registrierten Telefongespräche läßt sich z B. die Wahrscheinlichkeit dafür berechnen, daß bis zur Zeit t höchstens x Gespräche vermittelt werden, wenn pro Zeiteinheit durchschnittlich A Gespräche geführt werden. ¦ Bei Zuverlässigkeitsuntersuchungen wird die wahrscheinliche Anzahl der Ausfälle eines reparierbaren Systems während der Betriebsdauer berechnet. ¦ In der Bedienungstheorie wird die Anzahl der bis zur Zeit t eintreffenden Kunden an einer Kaufhauskasse, einem Fahrkartenschalter oder einer Tankstelle betrachtet. 2. Geburts- und Todesprozesse Eine erste Verallgemeinerung des PoiSSON-Prozesses besteht darin, daß man in A6 117) eine vom Zustand i abhängige Übergangsrate A^ wählt Als zweite Verallgemeinerung werden auch Übergänge vom Zustand i in den Zustand i — 1 zugelassen Die zugehörige Übergangsrate wird mit pi bezeichnet. Der Zustand i eines solchen Prozesses kann z.B. die Anzahl der Individuen einer Population angeben, die beim Übergang von i zu i + 1 um ein Individuum vergrößert, beim Übergang von i zu i — 1 um ein Individuum verringert wird Solche stochastischen Prozesse werden Geburts- und Todesprozesse genannt Es sei p(Xt = i) = pi(t) die Wahrscheinlichkeit dafür, daß sich der Prozeß zum Zeitpunkt t im Zustand i befindet Für die Übergangswahrscheinlichkeiten gilt dann analog zum PoiSSON-Prozeß: von i — 1 zu i- p%-\,i ~ A^_iA£, von i + 1 zu i p»+i,i ~ Pi+i^t, A6.118) von i zu i • p^ « 1 — (A* + pi)At . Bemerkung: Der PoiSSON-Prozeß ist ein reiner Geburtsprozeß mit konstanter Übergangsrate. 3. Warteschlangen Das einfachste Warteschlangensystem besteht aus einem Schalter, an dem die Kunden einzeln in der Reihenfolge der Ankünfte bedient werden Der Warteraum sei so groß, daß keine Kunden wegen Überfüllung abgewiesen werden müssen Die ankommenden Kunden sollen einen sogenannten „PoiSSON- Strom" bilden, d.h. die Zeiten zwischen den Ankünften der Kunden sind exponentialverteilt mit dem Parameter A. In vielen Fällen können auch die Bedienungszeiten als exponentialverteilt, aber mit dem Parameter p angesehen werden. Die Parameter A und p haben dann die folgende Bedeutung • A- mittlere Anzahl von Ankünften pro Zeiteinheit, • —: mittlere Zeit zwischen zwei Ankünften, A • p mittlere Anzahl der Abfertigungen pro Zeiteinheit, • — mittlere Bedienungszeit. Bemerkungen: 1. Nimmt man die Anzahl der Kunden im Warteschlangensystem als Zustand des stochastischen Prozesses, dann handelt es sich bei dem obigen einfachen Warteschlangenmodell um einen Geburts- und Todesprozeß mit der konstanten Geburtsrate A und der konstanten Sterberate p 2. Ausgehend von den einfachen Warteschlangensystemen lassen sich zahlreiche andere Warteschlangensysteme angeben z.B. auch solche, bei denen die Kunden an mehreren parallelen Schaltern bedient werden und (oder) solche, bei denen die Ankunftszeiten und die Bedienzeiten unterschiedlichen Verteilungen genügen (s. [16 14], [16 27]).
16 3 Mathematische Statistik 793 16.3 Mathematische Statistik Die mathematische Statistik stellt eine Anwendung der Wahrscheinlichkeitstheorie auf konkrete Massenerscheinungen dar Ihre Sätze ermöglichen Wahrscheinlichkeitsaussagen über Eigenschaften einer bestimmten Menge aus den Ergebnissen von Versuchen, deren Anzahl aus ökonomischen Gründen möglichst klein zu halten ist. 16.3.1 Stichprobenfunktionen 16.3.1.1 Grundgesamtheit, Stichproben, Zufallsvektor 1. Grundgesamtheit Grundgesamtheit nennt man eine Menge von Elementen, die auf gewisse Merkmale hin untersucht werden sollen Man kann darunter eine Gesamtheit gleichartiger Elemente verstehen, z B alle Stücke einer bestimmten Produktion oder alle Meßwerte einer Meßreihe, die bei ständiger Wiederholung desselben Versuchs auftreten können Die Anzahl N der Elemente einer Grundgesamtheit kann sehr groß, sogar unendlich sein 2. Stichprobe Um nicht die gesamte Grundgesamtheit auf die betreffenden Merkmale hin untersuchen zu müssen, entnimmt man ihr eine Teilmenge, eine sogenannte Stichprobe vom Umfang n (n < N) Erfolgt die Auswahl zufallsgemäß, d h . jedes Element der Grundgesamtheit muß die gleiche Chance haben, ausgewählt zu werden, dann spricht man von einer zufälligen Stichprobe. Die zufällige Auswahl kann durch Mischen oder blindes Ziehen bzw durch Festlegung der auszuwählenden Elemente mit Hilfe von Zufallszahlen erfolgen. 3. Zufallige Auswahl mit Hilfe von Zufallszahlen Bei gehortetem oder geschichtetem Material, z B Betonplatten, ist eine zufällige Entnahme besonders schwierig oder sogar unmöglich Dann kann eine Tafel von Zufallszahlen (s Tabelle 21.21, S 1128) verwendet werden. Auf dem Intervall [0,1] kann man mit vielen Taschenrechnern gleichmäß verteilte Zufallszahlen erzeugen, indem man z B. mit der Taste RAN völlig regellos angeordnete Zahlen zwischen 0.00 0 und 0,99 9 aufruft Daraus lassen sich durch Aneinanderreihen der Ziffern nach dem Komma mehrstellige Zufallszahlen bilden Häufig werden Zufallszahlen auch in Tabellen angegeben In der Tabelle 21.21, S 1128 sind zweistellige Zufallszahlen angegeben, die auch zu mehrstelligen Zufallszahlen zusammengefaßt werden können. ¦ Aus einer Lieferung von 70 gestapelten Rohren soll eine zufällige Stichprobe vom Umfang 10 entnommen werden. Dazu werden die Rohre von 00 bis 69 numeriert Mit Hilfe einer zweistelligen Zufallszahlentafel wird das System festgelegt, nach dem die Auswahl geschehen soll, z.B. horizontal, vertikal oder diagonal Sollten sich dabei Zufallszahlen wiederholen oder treten Zahlen auf. die größer als 69 sind, dann werden diese weggelassen. Die Rohre mit den Nummern der entsprechenden Zufallszahlen gehören dann zur Stichprobe Steht nur eine Tafel mehrstelliger Zufallszahlen zur Verfügung, dann werden bestimmte Zweiergruppen ausgewählt 4. Zufallsvektor Eine Zufallsgröße X wird durch ihre Verteilungsfunktion und deren Parameter charakterisiert, wobei die Verteilungsfunktion ihrerseits durch die Eigenschaften der Grundgesamtheit bestimmt ist Diese sind aber bei Beginn einer statistischen Untersuchung nicht bekannt, so daß man möglichst viele Informationen mit Hilfe von Stichproben gewinnen muß In der Regel wird man sich nicht auf eine Stichprobe beschränken, sondern mehrere Stichproben, praktischerweise vom gleichen Umfang n . untersuchen Dabei zeigt sich, daß die Realisierungen von Stichprobe zu Stichprobe unterschiedlich ausfallen, d h der 1 Wert der 1 Stichprobe vom 1 Wert der 2 Stichprobe verschieden sein wird usw Damit ist die Variable 1. Wert der Stichprobe ebenfalls eine Zufallsgröße, die mit X\ bezeichnet wird Analog kann man für den 2,3, , n-ten Stichprobenwert die Zufallsgröße X2, X3, Xn einführen, die man auch Stichprobenvariable nennt. Zusammengefaßt erhält man den Zufallsvektor X=(XuX2,....Xn)
794 16. Wahrscheinlichkeitsrechnung und mathematische Statistik Jede konkrete Stichprobe vom Umfang n mit den Elementen Xi, die einer Grundgesamtheit entnommen wurden, kann als Vektor x = (xi,x2,. ..,£„) zusammengefaßt und als eine Realisierung des Zufallsvektors angesehen werden 16.3.1.2 Stichprobenfunktionen So wie sich die konkreten Stichproben unterscheiden, sind auch die arithmetischen Mittel x von Stichprobe zu Stichprobe zufallsbedingt unterschiedlich Sie können als Realisierungen einer neuen Zufallsgröße aufgefaßt werden, die mit X bezeichnet wird und von den Stichprobenvariablen Xi, X2, ,Xn abhängt. 1 Stichprobe: Xu, Xi2j ... x\n mit Mittelwert x\ 2. Stichprobe: £21, £22, ... x2n mit Mittelwert x2 . ... A6119) ra-te Stichprobe: xmi, xm2, .. xm mit Mittelwert xm Mit Xij (i = 1,2,. ., m; j = 1,2,. ., n) wird die Realisierung der j-ten Stichprobenvariablen in der z-ten Stichprobe bezeichnet Eine Funktion des Zufallsvektors X = (X\, X2,..., Xn) ist wieder eine Zufallsgröße und heißt Stich- probenfunktion. Die wichtigsten Stichprobenfunktionen sind Mittelwert, Streuung, Median und Spannweite. 1. Mittelwert Der Mittelwert X der Zufallsveränderlichen Xi lautet: ~X = -JTXi A6.120a) ni=i Im konkreten Fall lautet der Mittelwert x zur Stichprobe (xi, x2, , xn) x = -Yxi. A6120b) Häufig ist es vorteilhaft, zur Berechnung des Mittelwertes einen Schätzwert x0 einzuführen, der beliebig gewählt werden kann, aber nach Möglichkeit in der Nähe des zu erwartenden Mittelwertes x liegen soll. Wenn z B. in großen Meßreihen die x{ mehrstellige Zahlen sind, bei denen sich lediglich die letzten Stellen von Meßwert zu Meßwert ändern, ist es einfacher, mit den kleineren Zahlen Zi = Xi — Xq A6.120c) zu rechnen. Es gilt dann 1 n x = x0 + - V Zi = x0 + z . A6.120d) 2. Streuung Die Streuung S2 der Zufalls veränderlichen Xi mit dem Mittelwert X lautet: Im konkreten Fall lautet die Streuung s2 zur Stichprobe (x\, x2, . , xn) s2 = ^—jr(xl-xJ. A6.121b) A6.121a)
16 3 Mathematische Statistik 795 Mit dem Schätzwert x0 ergibt sich Y.z?~zY.zi Y,* - n(x — XqJ n — 1 n — 1 Für x — Xq wird wegen ~z = 0 die Korrektur z ^ ^ = 0 A6 121c) 3. Median (Zentralwert) Sind n Elemente einer Stichprobe der Größe nach geordnet, so heißt Median X im Falle n ungerade der 71 ~\~ 1 71 / 71 \ an — ter Stelle stehende Wert, im Falle n gerade der Mittelwert aus den an — -ter und f — + 1J -ter Stelle stehenden Werten Im konkreten Fall lautet der Median x zur Stichprobe (x\. x2*. ., xn), deren Elemente der Größe nach geordnet sind ( xm+i, falls 7i — 2m + 1, X = { Xm+l + Xn falls n = 2m. 4. Spannweite R = max Xi — min X{ 1,2, ,n) % A6 122) A6.123a) ,*») i 1 2 3 4 5 ^ 1,01 1,02 1,00 0,98 0,99 i 6 7 8 9 10 Xi 1.00 0,99 1,01 1,01 1,00 i 11 12 13 14 15 Xi 1.00 1,00 1,02 1,00 1,01 Im konkreten Fall lautet die Spannweite R zur Stichprobe (#i, #2, • # = *max - Xmrn • A6.123b) Jede spezielle Realisierung einer Stichprobenfunktion wird mit Ausnahme der Spannweite R mit kleinen Buchstaben bezeichnet, d.h., im konkreten Fall werden zur Stichprobe (xi,x2, , xn) die Werte x, s2, x und R berechnet. ¦ Der laufenden Produktion von permanentdynamischen Lautsprechern wird eine Stichprobe von 15 Lautsprechern entnommen. Das interessierende Merkmal X sei die Luftspaltinduktion B, gemessen in Tesla. Daraus berechnet man x = 1,0027 bzw. x = 1,0027 mit x0 = 1,00, s2 = 1,2095 • 10-4 bzw. s2 = 1,2076 • 10~4 mit x0 = 1,00; x = 1,00, R = 0,04 16.3.2 Beschreibende Statistik 16.3.2.1 Statistische Erfassung gegebener Meßwerte Um eine Eigenschaft eines Elements statistisch zu untersuchen, ist diese durch eine Zufallsgröße X zu charakterisieren. In der Regel bilden dann n Meß- oder Beobachtungswerte x^ des Merkmals X den Ausgangspunkt für eine statistische Untersuchung, die vor allem darin besteht, Angaben über die Verteilung von X zu machen Jede Meßreihe vom Umfang n kann in diesem Zusammenhang als eine zufällige Stichprobe aus einer unendlichen Grundgesamtheit aufgefaßt werden, die entsteht, wenn der Versuch oder die Messung unter gleichen Bedingungen unendlich oft wiederholt würde Da der Umfang rz einer Meßreihe sehr groß sein kann, geht man zur statistischen Erfassung der Daten wie folgt vor 1. Protokoll, Urliste Protokollierung der Meß- oder Beobachtungswerte x{, die eine Stichprobe oder Meßreihe darstellen, in einem Meßprotokoll, der Urliste
796 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 2. Intervalle oder Klassen Einteilung der gegebenen n Meßwerte Xi (i = 1,2,..., n) in k Intervalle, auch Klassen genannt, der Breite h Man wählt ca. 10 bis 20 Klassen und ordnet die n Meßwerte in diese Klassen ein. Es entsteht die Strichliste. 3. Häufigkeiten und Häufigkeitsverteilung Eintragen der absoluten Häufigkeiten hj (j = 1,2, . , k), d.h der Anzahl von Meßwerten (Besetzungszahl), die auf ein bestimmtes Meßintervall Axj entfallen und Bestimmung der relativen Häufigkeiten hj/n (in %). Werden die Werte hj/n als Rechtecke über den Klassen aufgetragen, dann ergibt die graphische Darstellung der so entstehenden Häufigkeitsverteilung ein Histogramm (Abb. 16.13a). Die Werte hj/n können als empirische Werte der Wahrscheinlichkeitsdichte f(x) interpretiert werden 4. Summenhäufigkeiten Durch Summation der absoluten bzw. relativen Häufigkeiten erhält man die absoluten bzw. relativen Summenhäufigkeiten F_hl+h2 + ... + hj% (j = ix k) A6124) Werden die Werte Fj in den oberen Klassengrenzen aufgetragen und als Parallele nach rechts fortgesetzt, dann ergibt sich eine graphische Darstellung für die empirische Verteilungsfunktion, die als Näherung für die unbekannte Verteilungsfunktion F(x) aufgefaßt werden kann (Abb.16.13b). ¦ Bei einem Versuch wurden n = 125 Messungen durchgeführt. Die Meßergebnisse streuten über den Bereich 50 bis 270, so daß sich eine Einteilung in k = 11 Klassen der Breite h = 20 als zweckmäßig erwies Es ergab sich die nebenstehende Häufigkeitstabelle Tabelle 16.3 F/%' Tabelle 16.3 Häufigkeitstabelle Klasse 50 - 70 71 - 90 91 -110 111 -130 131 - 150 151 - 170 171 - 190 191 -210 211 -230 231 -250 251 -270 h3 1 1 2 9 15 22 30 27 • 9 6 3 h,/n(%) 0,8 0,8 1,6 7,2 12,0 17,6 24,0 21,6 7,2 4,8 2,4 F3 (%) 0,8 1,6 3,2 10,4 22,4 40,0 64,0 85,6 92,8 97,6 100,0 >/° 100 80 60 40 20 70 110 150 190 230 270 x b) 70 110 150 190 230 270 Abbildung 16.13 16.3.2.2 Statistische Parameter Nachdem die Meßwerte gemäß 16.3.2.1, S 795 bearbeitet worden sind, können die folgenden Parameter zur Charakterisierung der Verteilung, die den Meßwerten zu Grunde liegt, bestimmt werden- 1. Mittelwert Wenn sämtliche Meßwerte unmittelbar berücksichtigt werden, gilt x = -^2xi. A6 125a)
16.3 Mathematische Statistik 797 Wenn die Mittelwerte Xj und Häufigkeiten hj der Klassen j benutzt werden, gilt 1 k x^-Y^hjXj A6 125b) n j=i 2. Streuung Wenn sämtliche Meßwerte unmittelbar berücksichtigt werden, gilt 1 n s2 = —— Yl^i-xJ- 11 L »=i Wenn die Mittelwerte Xj und Häufigkeiten hj der Klassen j benutzt werden, gilt 1 k s2 = y^ hjixj — xJ . Häufig wird auch die Klassenmitte Uj an Stelle von Xj benutzt. 3. Median Dieser Parameter x ist definiert durch P(X < x) = \ und wird im diskreten Falle bestimmt durch {xm+i, falls n = 2m -f-1, , falls n = 2m, 4. Spannweite R = xmax - xmin A6 128) 5. Mo dal wert heißt der Meßwert, der in einer Häufigkeitsverteilung am häufigsten auftritt. Er wird mit D bezeichnet. 16.3.3 Wichtige Prüfverfahren Eine der Hauptaufgaben der mathematischen Statistik besteht darin, aus Stichproben Rückschlüsse auf die Grundgesamtheit zu ziehen Da 1. eine Verteilung ganz wesentlich durch die Parameter /i und a2 charakterisiert werden kann (im Falle von Meßwerten würde man sich unter fj, den exakten Wert oder den Sollwert und unter a2 ein Maß für die Abweichung von diesem Sollwert vorstellen), 2. bei der Verteilung von Beobachtungs- und Meßwerten die GAUSSsche Normalverteilung das entscheidende mathematische Modell darstellt, stehen bei den Prüfverfahren die folgenden zwei Fragen im Vordergrund: a) Liegt den Meßwerten eine Normalverteilung zu Grunde? b) Wie gut geben die Stichprobenparameter x und s2 die Parameter /i und o2 der Grundgesamtheit wieder? 16.3.3.1 Prüfen auf Normalverteilung In der mathematischen Statistik sind verschiedene Tests zum Prüfen auf Normalverteilung entwickelt worden Von den beiden gebräuchlichsten wird einer graphisch mit Hilfe von Wahrscheinlichkeitspapier durchgeführt, der andere erfolgt rechnerisch als „x2-Test". 1. Prüfen mit Hilfe des Wahrscheinlichkeitspapiers 1. Prinzip des Wahrscheinlichkeitspapiers In einem rechtwinkligen Koordinatensystem ist die x-Achse gleichabständig unterteilt, während die y-Achse die folgende Skala darstellt: Sie ist gleich- A6 126a) A6 126b) A6.127a) A6.127b)
798 16 Wahrscheinlichkeitsrechnung und mathematische Statistik abständig bezüglich Z unterteilt, wird aber mit = #(Z) = y/2* J e 2 dt A6 129) beziffert. Falls eine Zufallsgröße X einer Normalverteilung mit Mittelwert /i und Streuung a2 genügt, dann gilt für ihre Verteilungsfunktion (s 16 2 4 2, S 782) dh.. F(x) = 0 es muß (^) :0(Z), A6.130a) A6.130b) z 0 1 -1 X fi + a fi — a A6 130c) gelten und damit ein linearer Zusammenhang zwischen x und Z bestehen. Aus der Substitution A6 130b) liest man außerdem die nebenstehende Zuordnung A6 130c) ab 2. Anwendung des Wahrscheinlichkeitspapiers Entnimmt man einer normalverteilten Grundgesamtheit eine Stichprobe, berechnet deren relative Summationshäufigkeiten gemäß A6.124) und trägt diese in das Wahrscheinlichkeitspapier als Ordinaten zu den entsprechenden oberen Klassengrenzen als Abszissen ein, dann liegen diese Punkte annähernd (bis auf zufällige Abweichungen) auf einer Geraden (Abb.16.14). Aus der Abb. 16.14 ist ersichtlich, daß für das vorliegende Beispiel eine Normalverteilung angenommen werden kann Außerdem liest man ab: iL « 176, er « 37,5 Hinweis: Die Werte F» der relativen Summenhäufigkeiten lassen sich einfacher in das Wahrscheinlichkeitspapier eintragen, wenn dessen Bezifferung der Ordinate bezüglich y gleichabständig ist, was ungleichabständige Ordinaten zur Folge hat. t t 1 z O(t) 3 99.86 - 2 97.72 - 1 ÜA 1 3 - 1 Oft.lJ H U dU.UU "^ -1 lo.o/ ^ -2 2.28 - -3 0 14 - y i i , i A !, 1 "*1 ! ! ' ! ' * ' ! ! 70 110 150 190 230 270 x U-G \i |i+G Abbildung 16.14 2. x2-Anpassungstest Es ist zu prüfen, ob eine Zufallsgröße X einer Normal Verteilung genügt. Daher wird der Wertebereich von X in k Klassen eingeteilt und die obere Grenze der j-ten Klasse (j = 1,2,.. , k) mit ^ bezeichnet. Die „theoretische" Wahrscheinlichkeit, daß X in die j-te Klasse fällt, sei pj , d h , es gilt Pj = F(Zi)-F(Zi-i), wobei F(X) die Verteilungsfunktion von X ist (j = mit F(£q) = 0). Da X normalverteilt sein soll, muß Ffe)=<Z> A6.131a) 1,2, ., k , £o ist die untere Grenze der 1 Klasse A6.131b) sein Mit $(x) ist die Verteilungsfunktion der normierten GAUSSschen Normalverteilung bezeichnet (s 16 2 4 2, S 782). Die Parameter ß und a2 der Grundgesamtheit sind in der Regel nicht bekannt Deshalb werden x und s2 als Näherungswerte einer Stichprobe verwendet. Wurde der Grundgesamtheit eine Stichprobe (#i,X2,... ->xn) vom Umfang n entnommen und deren
16.3 Mathematische Statistik 799 Häufigkeit hj bezuglich der oben festgelegten Klasseneinteilung ermittelt, dann genügt die Zufallsgröße xl- A6.131c) näherungsweise einer x2-Verteilung mit m = k — 1 Freiheitsgraden. Dazu ist notwendig, daß npj > 5 gilt, was durch Zusammenfassen einiger Klassen erreicht werden kann. Die Prüfung auf Normalverteilung (man spricht auch vom x2 -Anpassungstest) besteht darin, daß man nach Vorgabe einer statistischen Sicherheit 1 — a oder Irrtumswahrscheinlichkeit a das Quantil xi-k-i der Tabelle 21.18, S. 1124 entnimmt, für das P(x2 > xl-,k-i) = a Si][t- Ergibt sich für den nach A6 131c) ermittelten speziellen Wert Xs xl<xU-t, A6 131d) dann besteht kein Widerspruch zu der Annahme, daß die Stichprobe aus einer Grundgesamtheit stammt, die normalverteilt ist ¦ Dem folgenden x2~Anpassungstest liegen die Zahlenwerte des Beispiels in 16.3 2.1, S. 796 zu Grunde. Ausgangspunkt ist eine Stichprobe vom Umfang n = 125, aus der bereits Mittelwert x — 176,32 und Streuung s2 = 36,70 ermittelt worden sind. Diese Werte werden als Schätzwerte für die unbekannten Parameter /i und a2 der Grundgesamtheit verwendet. Damit kann die Testgröße Xs gemäß A6.131c) unter Beachtung von A6.131a) und A6 131b), wie in Tabelle 16.4 dargestellt, ermittelt werden. 6 70 90 110 130 150 170 190 210 230 250 270 hj n i ,3 9j 15 22 30 27 9 !}¦ G -2,90 -2,35 -1,81 -1,26 -0,72 -0,17 0,37 0,92 1,46 2,01 2,55 Tabelle 16 4 •ffl 0,0019 0,0094 0,0351 0,1038 0,2358 0,4325 0,6443 0,8212 0,9279 0,9778 0,9946 \;2-Anpasf Vi 0,0019 0,0075 0,0257 0,0687 0,1320 0,1967 0,2118 0,1769 0,1067 0,0499 0,0168 sungstest npj 0,2375 ^1 JS 12,9750 8,5857J 16,5000 24,5875 26,4750 22,1125 13,3375 6'2375U 3375 {hj - npjJ npj 0,00005 0,1635 0,2723 0,4693 1,0803 1,4106 0,0526 X! = 3,4486 Aus der letzten Spalte folgt x| — 3,4486. Wegen der Forderung npj > 5 reduziert sich die Anzahl der Klassen von k = 11 auf k* = k — 4 = 7. Da zur Berechnung der theoretischen Häufigkeit npj die beiden Schätzwerte x und s2 der Stichprobe an Stelle von \i und a2 der Grundgesamtheit verwendet werden, verringert sich die Anzahl der Freiheitsgrade der betreffenden x2~Verteilung um weitere zwei. Damit muß als kritischer Wert das Quantil xt k*-i-2 verwendet werden Für a = 0,05 erhält man aus Tabelle 21.18, S. 1124 Xo,os,4 = 9,5 , so daß wegen Xs < Xo,05;4 ^em Widerspruch zu der Annahme besteht, daß die Grundgesamtheit normalverteilt ist. 16.3.3.2 Verteilung der Stichprobenmittelwerte Es sei X eine kontinuierliche Zufallsgröße. Der zugehörigen Grundgesamtheit kann man beliebig viele Stichproben vom Umfang n entnehmen. Dann beschreiben die zugehörigen Stichprobenmittelwerte eine neue Zufallsgröße X, die ebenfalls kontinuierlich ist. Für deren statistische Sicherheit und Normalverteilung gelten die im folgenden dargelegten Aussagen.
800 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 1. Statistische Sicherheit des Stichprobenmittelwertes Wenn X normalverteilt ist mit den Parametern /x und a2 , dann ist X normalverteilt mit den Parametern /i und a2/n , d.h , die Dichtefunktion f(x) von X ist stärker um den Mittelwert ji konzentriert als die Dichtefunktion f(x) der Grundgesamtheit. Es gilt für einen vorgegebenen Wert e > 0: P{ \X-fi\<e) = 20 (£\ - 1, P( \X-fi\<s) = 2<Z> (£-^pj - 1. A6.132) Daraus folgt, daß mit wachsendem Umfang n der Stichprobe die Tabelle 16 5 Wahrscheinlichkeit größer wird, daß der Stichprobenmittelwert ei- Statistische Sicherheit des ne gute Näherung für fi ist. Stichprobenmittelwertes — ^ 1 ,, ,.„.„«x „/nr? , 1 ¦ Für e = -er erhält man aus A6 132) P l\X - p\ < ¦ - 20 l - y/n J — 1, und für verschiedene Werte von n folgen daraus die Werte in Tabelle 16.5. Man liest aus Tabelle 16.5 z.B. ab, daß bei einer Stichprobe vom Umfang n = 49 der Stichprobenmittelwert x mit einer Sicherheit von 99,95 % um höchstens ±-c vom Mittelwert \x der Grundgesamtheit abweicht. P{\X-p\<\<?) 38,29 % 68,27 % 95,45 % 98,76 % 99,96 % ^o 2. Normalverteilung der Stichprobenmittelwerte Die Zufallsgröße X ist auch annähernd normalverteilt mit den Parametern /i und a2/n, wenn die dazugehörige Grundgesamtheit einer beliebigen Verteilung mit Mittelwert fi und Streuung a2 genügt Diese Aussage geht auf den zentralen Grenzwertsatz zurück (s. auch 16.2.5.2, S. 788). 16.3.3.3 Vertrauensgrenzen für den Mittelwert 1. Vertrauensgrenzen für den Mittelwert bei bekannter Streuung <r2 Es sei X eine kontinuierliche Zufallsgröße, normalverteilt mit den Parametern \i und a2 . Nach 16.3 3 2, S. 799 ist dann X ebenfalls eine kontinuierliche Zufallsgröße, normal verteilt mit den Parametern ji und a2/n. Durch die Substitution ~Z=?—^Vn A6 133) er erhält man eine Zufallsgröße Z, die der normierten Normal Verteilung genügt. Für diese gilt e P( \Z\ < e) = I <p{x) dx = 20{e) - 1. A6.134) —£ Gibt man jetzt eine Irrtumswahrscheinlichkeit a vor und verlangt P(\Z\ <e) = 1-Q, A6 135) dann kann man e = e(a) aus A6 134) numerisch bestimmen bzw aus der Tabelle 21.17, S. 1122 der normierten Normalverteilung ablesen und erhält aus \Z\ < e(a) unter Beachtung von A6.133) die Beziehung ß = x±-^=e{a). A6.136) yjn Die Werte x± —=e(a) in A6 136) heißen Vertrauensgrenzen für den Mittelwert fi der Grundgesamtheit y/n bei bekannter Streuung a2 und vorgegebener Irrt ums Wahrscheinlichkeit a Man kann auch sagen Der Mittelwert fi liegt mit der statistischen Sicherheit 1 — a zwischen den Vertrauensgrenzen A6.136). Hinweis: Ist der Stichprobenumfang hinreichend groß {n > 100), dann kann in A6.136) an Stelle der in
16.3 Mathematische Statistik 801 der Regel unbekannten Streuung o2 der Grundgesamtheit die Stichprobenstreuung s2 verwendet werden. Anderenfalls müssen die Vertrauensgrenzen mit Hilfe der t-Verteilung gemäß A6 139) ermittelt werden. 2. Vertrauensgrenzen für den Mittelwert bei unbekannter Streuung er2 Wenn die Streuung a2 der Grundgesamtheit unbekannt ist, dann ersetzt man sie durch die Stichprobenstreuung s2 und erhält an Stelle von A6.133) die Zufallsvariable T = X 1 r A6 137) die der £-Verteilung (s. 16 2 4.8, S. 786) mit m = n — 1 Preiheitsgraden genügt. Dabei ist n der Umfang der Stichprobe Mit einer vorgegebenen Irrtumswahrscheinlichkeit a gilt dann P(\T\<e)- ¦ Jft(x)dx = p( \X-ß\ \/n < e 1-a A6.138) Aus A6.138) folgt e = e(a,n) = ta/2-n-\» wobei £Q/2;n-i das Quantil der t-Verteilung (mit n — 1 Preiheitsgraden) zur Irrtumswahrscheinlichkeit a/2 darstellt (Tabelle 21.20, S. 1127). Aus \T\ = ta/2n-\ folgt ß = X± —*a/2;n-l • A6.139) S heißen Vertrauens grenzen für den Mittelwert ß der Grundgesamtheit bei Die Werte x ± —7=ia/2n-i \fn ' ' unbekannter Streuung a2 und vorgegebener Irrtumswahrscheinlichkeit a. ¦ Eine Stichprobe bestehe aus den folgenden 6 Meßwerten. 0,842; 0,846; 0,835; 0,839, 0,843; 0,838. Daraus erhält man x = 0,8405 und s = 0,00394. Wie groß ist höchstens die Abweichung des Stichprobenmittelwertes x vom Mittelwert ß der Grundgesamtheit, wenn eine Irrtumswahrscheinlichkeit a von 5% bzw 1% zugelassen wird? 1. a = 0,05: Aus Tabelle 21.20, S. 1127 liest man ta/2.5 = 2,57 ab und erhält \X - fi\ < 2,57 • 0,00394/^ = 0,0042, d.h., mit 95% Wahrscheinlichkeit weicht der Stichprobenmittelwert x = 0,8405 höchstens um ±0,0042 vom Mittelwert ß ab. 2. a = 0,01 ta/2-,5 = 4,03; \X - ß\ < 4,03 • 0,00394/^6 = 0,0065, d h , mit 99% Sicherheit weicht x um höchstens ±0,0065 von ß ab. 16.3.3.4 Vertrauensgrenzen für die Streuung Die Zufallsgröße X sei normalverteilt mit den Parametern ß und a2 . Dann genügt die neue Zufallsgröße X2 = (n-1)- A6.140) einer x2~Verteilung mit m = n — 1 Preiheitsgraden, wobei n der Umfang einer Stichprobe ist und s2 deren Streuung. Aus Abb. 16.15, in der fx*(x) die Wahrscheinlichkeitsdichte der x2~Verteilung bedeutet, folgt P{X2<XD = P{X2>XI) = \, A6.141) d.h., mit den Quantilen der x2-Verteilung besteht der Zusammenhang (Tabelle 21.18, S. 1124). Xu — Xl-a/2;n-l ' 2 _ 2 Xo ~ Xa/2;n- tXx) OC/ 0 ) 2 1-a x^ a/2 X Abbildung 16 15 A6.142)
802 16 Wahrscheinlichkeitsrechnung und mathematische Statistik Unter Beachtung von A6.140) erhält man damit die folgende Abschätzung für die unbekannte Streuung <72 der Grundgesamtheit bei einer Irrtumswahrscheinlichkeit a: {n-iy^a^(n-^ A6143) Xa/2;n-l Xl-a/2;n-l Das durch A6.143) beschriebene Vertrauensintervall für a2 wird bei kleinem Stichprobenumfang noch sehr grob sein ¦ Für die Zahlenwerte des Beispiels auf S. 801 und a = 5% liest man aus Tabelle 21.18, S. 1124 X00255 = °>831 und X09755 = 12>8 ab> so daß aus A6 143) folgt 0,625 • s < a < 2,453 • s mit 5 = 0', 00394. 16.3.3.5 Prinzip der Prüfverfahren Ein statistisches Prüfverfahren hat grundsätzlich folgenden Aufbau 1. Es wird eine Hypothese H aufgestellt, daß die Stichprobe einer Grundgesamtheit von vorgegebenen Eigenschaften angehört, z B H- Grundgesamtheit ist normal verteilt mit den Parametern fi und a2 oder H: Für das unbekannte fi wird ein Näherungswert /i0 , in diesem Zusammenhang auch Schätzwert genannt, eingesetzt, der z B durch Rundung des Stichprobenmittelwertes x gewonnen wird 2. Man ermittelt in der angenommenen Grundgesamtheit ein Vertrauensintervall B (im allgemeinen mit Hilfe von Tabellen), in dem der Wert einer bestimmten Stichprobenfunktion mit einer vorgegebenen Sicherheit (z.B. a = 0,01 oder et = 0,05) liegt. 3. Man berechnet den Wert der Stichprobenfunktion und lehnt die Hypothese ab, wenn dieser Wert nicht in B liegt. ¦ Prüfen des Mittelwertes mit der Hypothese H. [i = //0 bei vorgegebener Irrt ums Wahrscheinlichkeit a. Nach 16.3 3 3, S. 800 genügt die Zufallsgröße T = —— >/n einer t-Verteilung mit m = n — 1 Frei- s heitsgraden Daraus folgt, daß man die Hypothese ablehnen muß, wenn /iq nicht in dem durch A6.139) festgelegten Vertrauensintervall liegt, d.h., wenn sich \X-ß0\>^ta;n^ A6.144) y n ergibt Man sagt dann, es handelt sich um eine signifikante Abweichung und spricht von Signifikanz Weitere Angaben über die Durchführung von Prüfverfahren s [16 24] 16.3.4 Korrelation und Regression Bei der Korrelationsanalyse geht es um die Feststellung von Abhängigkeiten zwischen zwei oder mehreren Merkmalen einer Grundgesamtheit an Hand von Meßwerten Mit Hilfe der Regressionsanalyse wird dann die Form der Abhängigkeit zwischen diesen Merkmalen untersucht 16.3.4.1 Lineare Korrelation bei zwei meßbaren Merkmalen 1. Zweidimensionale Zufallsgrößen Zwei Merkmale X und Y sollen zu einer zweidimensionalen Zufallsgröße (X, Y) mit folgenden Verteilungsfunktionen zusammengefaßt werden x y F{x, y) = P(X <x,Y <y)= f f f(x, y) dx dy , A6.145a) —oo—oo Fl(x) = P(X <x,Y <oo), F2(y) = P(X < oo,Y <y). A6 145b) Die Zufallsgrößen X und Y heißen unabhängig voneinander, wenn F(x,y) = F1(x).F2(y) A6.146)
16 3 Mathematische Statistik 803 gilt Die wichtigsten Parameter einer zweidimensionalen Verteilung sind: 1. Mittelwerte oo oo ßX = E(X)= j j xf(x,y)dxdy, —oo—oo oo oo ßY = E{Y)= I I yf(x,y)dxdy. A6 147a) A6 147b) 2. Streuungen ax = E((X-ßxJ), A6 148a) 3. Kovarianz aXY = E((X- ßx)(Y - pY)) A6.149) aY = E((Y - hyJ) 4. Korrelationskoeffizient 0~XY Qxy = axo-Y A6 148b) A6.150) Der Korrelationskoeffizient ist ein Maß für die lineare Abhängigkeit von X und Y , denn es gilt: Alle Punkte (X, Y) liegen genau dann mit der Wahrscheinlichkeit 1 auf einer Geraden, wenn q2xy = 1 ist Wenn X und Y unabhängige Zufallsveränderliche sind, dann ist Qxy = 0 Aus qxy = 0 kann man nur dann auf die Unabhängigkeit der Merkmale X und Y schließen, wenn diese einer zweidimensionalen Normalverteilung genügen, die durch die folgende Dichtefunktion definiert ist: f(x,y) 1 2-jTaxO'YyJl - Qxy „Qxy(x - nx)(y exp ¦Py) 2A ¦Qxy) ¦PyJ jx-ßxJ O'XO'Y )] A6 151) 2. Test auf Unabhängigkeit zweier Merkmale Bei praktischen Aufgaben ist zu untersuchen, ob eine Stichprobe, die aus n Meßpunkten (a^, yi) (i — 12, , n) besteht, aus einer zweidimensionalen, normal verteilten Grundgesamtheit mit dem Korrelationskoeffizienten qxy = 0 stammt, so daß die beiden Zufallsgrößen X und Y als unabhängig angesehen werden können Der Test läuft wie folgt ab. 1. Aufstellen der Hypothese H: qxy = 0 . 2. Vorgabe einer Irrtumswahrscheinlichkeit a und Ermittlung des Quantiis ta>m der t-Verteilung aus Tabelle 21.20, S 1127 für m = n - 2 . 3. Berechnung der Testgröße yVn- J2{x{ - x)(yi - y) ^ A6 152a) mit A6 152b) ¦xfY,(yi-y? 4. Ablehnung der Hypothese, falls \t\ > ta,m ist. Die Größe rxy heißt empirischer Korrelationskoeffizient 16.3.4.2 Lineare Regression bei zwei meßbaren Merkmalen 1. Bestimmung der Regressionsgeraden Wenn zwischen den Merkmalen X und Y mit Hilfe des Korrelationskoeffizienten eine Abhängigkeit festgestellt wurde, dann besteht die nächste Aufgabe in der Ermittlung des funktionalen Zusammenhanges Y = f(X) Im einfachsten Falle der linearen Regression wird dabei vorausgesetzt, daß bei
804 16. Wahrscheinlichkeitsrechnung und mathematische Statistik beliebigem, aber festem z-Wert die Zufallsgröße Y in der Grundgesamtheit normalverteilt ist mit dem Erwartungswert E(Y) = a + bx A6 153) und der von x unabhängigen Streuung a2 . Die Beziehung A6.153) bedeutet, daß die Zufallsgröße Y im Mittel von dem festen x-Wert linear abhängt. Für die in der Regel unbekannten Parameter a, b und o2 der Grundgesamtheit werden mit Hilfe der Stichprobenwerte (xi,yi) (i = 1,2,..., n) Näherungswerte nach der Fehlerquadratmethode bestimmt. Aus der Forderung n Y^iVi - (a + bxi)}2 = min! A6.154) erhält man für a, b und o2 die Schätzwerte (Näherungswerte) n J2{xi-x){yi-y) 6=^ , ä = y-bx, ä2 = 7^s2y(l-r2xy) A6155a) E(x* - ^J t=l mit *=4x>. y = ~tvi^ ^Ad»-«2 A6-155b) und dem empirischen Korrelationskoeffizienten r^ gemäß A6 152b) Die Koeffizienten o und b nennt man Regressionskoeffizienten. Die Gerade j/(a;) = ä + 6x heißt Regressionsgerade. 2. Vertrauensgrenzen für den Regressionskoeffizienten Nach der Bestimmung der Regressionskoeffizienten ä und b erhebt sich die Frage, wie gut diese Schätzwerte die theoretischen Parameter a und b wiedergeben Dazu bildet man die Testgrößen tb = (b-b)-^^^= A6.156a) mit ta = (ä- a) ^^^ ^ A6.156b) y\ll-r% ' sv\f l-rl \i E**2 Diese stellen die Realisierung von Zufallsgrößen dar, die einer t-Verteilung mit m = n - 2 Freiheitsgraden genügen. Demzufolge kann man zu einer vorgegebenen Irrtumswahrscheinlichkeit a das Quantil ta.m aus Tabelle 21.20, S 1127 ablesen, und aus P{ \t\ < ta;m) = l-a folgt für t = ta bzw. t = tb. s /i_r2 svy/l-r%,'\ X><2 \b - b\ < ta]n.2 yV f* , A6 157a) \ä - a\ < ta,n.2 ^— sxy/n — 2 ' ' sxy/n — 2 • \/n A6 157b) Mit Hilfe der durch A6.157a,b) beschriebenen sogenannten Konfidenzintervalle für a und b kann man auch einen Konfidenzbereich für die unbekannte Regressionsgerade y = a + bx angeben (s [16 4], [16.26]). 16.3.4.3 Mehrdimensionale Regression 1. Funktionaler Zusammenhang Zwischen den Merkmalen Xi, X2,..., Xn und Y bestehe ein funktionaler Zusammenhang, der durch die theoretische Regressionsfunktion s y = f(x1,x2,.. ,xn) = '52ajgj(x1,X2,...,xn) A6.158) J=0
16 3 Mathematische Statistik 805 beschrieben werden soll Die Funktionen gj(x\, X2, . •, xn) sind bekannte Funktionen von n unabhängigen Variablen Die Koeffizienten aj sind konstant und treten in A6.158) linear auf Man spricht deshalb im Falle von A6 158) auch von linearer Regression, obwohl die Funktionen gj beliebig sein können ¦ Die Funktion f{x\, £2) = &o + aixi + a2x2 + ö3^i2 + CL4X22 + 05^1^2 , ein vollständiges quadratisches Polynom in zwei Variablen mit go = 1, ^1 = X\, #2 — £2 , #3 — ^i2 , 9 a = %22 und #5 = X1X2 , ist ein Beispiel für eine theoretische Regressionsfunktion der linearen Regression. 2. Vektorschreibweise Es ist zweckmäßig, im mehrdimensionalen Fall zur vektoriellen Schreibweise x=(xl,x2, ,xn)T überzugehen, so daß A6.158) jetzt lautet: y = f(x) = Y,a39j{x)- A6 159) A6 160) 3. Lösungsansatz und Normalgleichungssystem Der theoretische Zusammenhang A6.158) wird durch Meßwerte (x(i),/,), (i = l,2, ,N) auf Grund zufälliger Meßfehler nicht exakt wiedergegeben Man macht deshalb den Ansatz s y = f(x) = Y,äj9jU) und bestimmt nach der Fehlerquadratmethode (s 16 3 4 2,1., S 804) gemäß E[/,-/(X«)]2 = minf A6 161a) A6 161b) A6.161c) die Koeffizienten äj , die als Schätzwerte für die theoretischen Koeffizienten a,j dienen. Mit den Bezeichnungen ä0\ äs) , f = d1) h V/J ' G = Ute») 51 C?)) fl'olx' B)\ 9i x' B)\ xM} \ xM] {go{*W) 9i (*W) 9s ix' W A6 161d) '/ erhält man aus der Forderung A6 161c) das sogenannte Normalgleichungssystem GTGa = GTf A6 161e) zur Bestimmung von ä Die Matrix GTG ist symmetrisch, so daß sich zur Lösung von A6.161e) das Cholesky-Verfahren (s. 19.2 1.2, S. 920) besonders eignet ¦ Mit Hilfe einer Stichprobe, deren Ergebnisse die folgende Wertetabelle enthält, sind die Koeffizienten der Regressionsfunktion Xi X2 f{xi,x2) 5 0,5 3 0,5 5 0,3 3 0,3 1,5 3,5 6,2 3,2 bestimmen Aus A6 16ld) folgt 1,5\ 3,5 6,2 3,2^ , G = /l 5 1 3 1 5 Vi 3 0,5\ 0,5 0,3 0,3/ f{xi}x2) = a0 + a\X\ + a2x2 A6 162) zu A6 163)
806 16. Wahrscheinlichkeitsrechnung und mathematische Statistik und A6 161e) lautet 4ä0+ 16äi+ l,6ä2 =14,4, ä0=7,0, 16ä0 + 68 äi + 6,4 ä2 = 58,6, d.h. äi = 0,25, A6 164) 1,6ä0 + 6,4äi + 0,68ä2 = 5,32 , ä2 = -11 4. Hinweise 1. Zur Bestimmung der Regressionskoeffizienten hätte man auch von der Interpolationsbedingung /(x«)=/iB = l,2, ..,iV),dh.von Ga = f A6.165) ausgehen können Im Falle s < N stellt A6 165) ein uberbestimmtes lineares Gleichungssystem dar, zu dessen genäherter Lösung das Householder-Verfahren (s. 19 6.2 2, S. 948) verwendet werden kann. Der Übergang von A6.165) zu A6.161e), d.h. Multiplikation von A6.165) mit GT, wird auch als Gaü SS-Transformation bezeichnet Wenn die Spalten der Matrix G linear unabhängig sind, also Rang G = s + 1 ist, dann hat das Normalgleichungssystem A6 161e) eine eindeutige Lösung, die mit der nach HOUSEHOLDER ermittelten Näherungslösung von A6.165) übereinstimmt. 2. Auch im mehrdimensionalen Fall lassen sich mit Hilfe der £-Verteilung Vertrauensgrenzen für die Regressionskoeffizienten analog zu A6 157a,b) angeben (s. [16.9]). 3. Mit Hilfe der F-Verteilung (s. 16.2.4.7, S. 785) kann man einen sogenannten Adäquatheitstest für den Ansatz A6.161b) durchführen. Dieser Test gibt Auskunft darüber, ob ein Ansatz der Form A6.161b), aber mit weniger Gliedern, schon eine hinreichend gute Approximation der theoretischen Regressionsfunktion A6 158) liefert (s [16 9]) 16.3.5 Monte-Carlo-Methode 16.3.5.1 Simulation Unter Simulation versteht man die Untersuchung eines Prozesses oder Systems mit Hilfe eines Ersatzsystems. Als Ersatzsysteme verwendet man in der Regel mathematische Modelle, die den zu untersuchenden Prozeß beschreiben und auf einem Computer ausgewertet werden können Man spricht dann von digitaler Simulation. Sind bei einer solchen Simulation gewisse Größen zufällig auszuwählen, dann spricht man von einer Monte-Carlo-Simulation oder einer zufallsbedingten Simulation. Die dabei notwendige zufällige Auswahl kann mit Hilfe von Zufallszahlen erfolgen 16.3.5.2 Zufallszahlen Zufallszahlen sind Realisierungen von Zufallsgrößen (s. 16.2.2, S 774), die bestimmten Verteilungen genügen. Auf diese Weise kann man verschiedene Arten von Zufallszahlen unterscheiden 1. Gleichverteilte Zufallszahlen Man versteht darunter die im Intervall [0,1] gleichverteilten Zufallszahlen, die als Realisierung einer Zufallsgröße X mit der folgenden Dichtefunktion fo(x) und der folgenden Verteilungsfunktion F0(x) interpretiert werden: r i f ¦ n <? <? 1 f0 für 0<x, *>(*> = {0 sonst; " * " ' *>(*)= 1 flir 0 7* < 1, A6.166) ^ A für a;>l. 1. Methode der mittleren Ziffern von Quadraten Eine einfache Methode zur Erzeugung von Zufallszahlen wurde von J. v. Neumann vorgeschlagen. Sie wird auch Methode der mittleren Ziffern von Quadraten (kurz Quadratmittelmethode) genannt und geht von einem beliebigen 2n-stelligen Dezimalbruch z G [0,1] aus. Dann bildet man z2 und erhält einen Dezimalbruch, der aus 4n Dezimalstellen besteht. Von diesen Dezimalstellen streicht man die ersten und die letzten n Stellen weg, so daß wieder ein 2n-stelliger Dezimalbruch aus [0,1] ensteht. Diese Vorgehens weise wird wiederholt Man erhält eine Folge von 2n-stelligen Dezimalbrüchen, die als Zufallszahlen benutzt werden können Die Anzahl 2n richtet sich nach der Stellenzahl des zur Verfugung stehenden Computers. Man wählt z B 2n = 10
16 3 Mathematische Statistik 807 Dieser Algorithmus hat sich bei praktischen Anwendungen nicht bewährt Er lieferte mehr kleine Werte, als in der Regel gebraucht wurden Deshalb wurden verschiedene andere Methoden entwickelt. ¦ 2n = 4 z = z0 = 0,1234, z\ = 0, Oll 5227 [56, z = Zl=0,5227, z\ = 0,27|3215|29, z = z2 = 0,3215 usw Die ersten drei Zufallszahlen wären somit z0. Z\ und z2 2. Kongruenzmethode Stark verbreitet ist die Kongruenzmethode: Eine Folge ganzer Zahlen Zi (i = 0,1,2, ..) wird nach der Rekursionsformel Zi+i = c • Zi modm A6 167) berechnet Dabei ist zq eine beliebige positive Zahl Mit c und m sind ebenfalls ganze positive Zahlen bezeichnet, die geeignet zu wählen sind. Für zi+\ ist die kleinste nicht negative ganze Zahl zu nehmen, die der Kongruenz A6.167) genügt. Die Zahlen Zi/m liegen zwischen 0 und 1 und können als gleichverteilte Zufallszahlen dienen 3. Hinweise a) Man wählt m = 2r , wobei r die Zahl der Bits eines Computerwortes darstellt, z.B. r = 40 . Die Zahl c ist in der Größenordnung von y/m zu wählen. b) Zahlen, die nach einer bestimmten Formel gewonnen werden und die Werte einer Zufallsgröße X simulieren sollen, nennt man Pseudozufauszahlen. c) Zufallszahlen kann man schon mit dem Taschenrechner erzeugen, und zwar in der Regel unter dem Befehl „ran"(Abkürzung für Zufall, Englisch random). 2. Zufallszahlen mit anderen Verteilungen Zur Erzeugung von Zufallszahlen mit einer beliebigen Verteilungsfunktion F(x) geht man wie folgt vor: Ausgangspunkt ist eine Folge gleichverteilter Zufallszahlen £1} £2, • • • aus [0,1] Aus ihnen berechnet man die Zahlen rji = F'1^) für i = 1,2, .. Dabei ist F~l(x) die Umkehrfunktion zur Verteilungsfunktion F(x) Dann gilt F(x) P{f]i <x) = P{F-l{ii) <x) = P(& < F{x)) = / f0{t) dt = F{x), A6 168) o d h , die Zufallszahlen 771,772,. • genügen einer Verteilung mit der Verteilungsfunktion F(x), die stetig und monoton sein muß. 3. Tabelle und Anwendung von Zufallszahlen 1. Erzeugung Eine Tabelle von Zufallszahlen könnte man auf folgende Weise erzeugen: Auf zehn gleichen Chips sei jeweils eine der zehn Ziffern 0,1,2,. ,9 eingeprägt. Diese zehn Chips werden in einem Gefäß gut gemischt Danach wird ein Chip gezogen und seine Ziffer in einer Tabelle festgehalten. Der Chip wird wieder in das Gefäß zurückgelegt. Es wird erneut gemischt und die Ziehung wiederholt. Auf diese Weise entsteht eine Reihe von Zufallszahlen, die aus Gründen der Übersichtlichkeit z.B in Gruppen zu je vier zusammengfaßt werden (s Tabelle 21.21, S. 1128) Die Verfahren, nach denen Zufallszahlen aufgestellt werden, müssen sichern, daß die Ziffern 0,1,2, ,9 an jeder Stelle der vierstelligen Zahlen gleichwahrscheinlich sind. 2. Anwendung von Zufallszahlen Die Anwendung einer Tabelle von Zufallszahlen soll an einem Beispiel demonstriert werden. ¦ Von N = 250 Untersuchungsobjekten sollen n = 20 zufällig ausgewählt werden. Dazu werden die Objekte von 000 bis 249 durchnumeriert In der Tabelle 21.21, S. 1128 wird willkührlich in irgend einer Spalte oder Zeile eine Zahl ausgewählt und eine Vorschrift festgelegt, nach der die Auswahl der übrigen 19 Zufallszahlen erfolgen soll, z.B vertikal, horizontal oder diagonal. Von den Zufallszahlen werden nur die ersten drei Ziffern berücksichtigt Von den so entstehenden 3-stelligen Zufallszahlen werden nur die verwendet, die kleiner als 250 sind
808 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 16.3.5.3 Beispiel für eine Monte-Carlo-Simulation Die genäherte Berechnung des bestimmten Integrals I ¦ : f g(x)dx A6.169) /¦ i 0 k E y A -~js« 1 X unter Benutzung von gleichverteilten Zufallszahlen soll als Beispiel für eine zufallsbedingte Simulation behandelt werden Im folgenden werden zwei Lösungsmöglichkeiten betrachtet 1. Benutzung der relativen Häufigkeit Es soll angenommen werden, daß 0 < g(x) < 1 gilt. Dies läßt sich stets durch eine Transformation (s A6 174)) erreichen. Dann gibt das Integral / den Inhalt einer Fläche an, die ganz im Einheitsquadrat E liegt (Abb. 16.16). Von einer Folge gleichverteilter Zufallszahlen aus dem Intervall [0,1] faßt man je zwei zu den Koordinaten eines Punktes des Einheitsquadrates E zusammen und erzeugt auf diese Weise n Punkte Pi (i = 1,2, .., n). Bezeichnet man mit m die Anzahl der Punkte, die innerhalb oder auf dem Rand der Fläche A liegen, dann gilt unter Beachtung des Begriffes der relativen Häufigkeit (s 16 2.1 2, S 771): i rg(x)dx*-. A6.170) 0 U . Abbildung 16.16 Um mit Hilfe von A6.170) eine bestimmte Genauigkeit zu erreichen, ist eine sehr große Anzahl von Zufahlszahlen notwendig. Deshalb hat man nach Möglichkeiten zur Erhöhung der Effektivität gesucht Eine davon stellt die folgende Monte-Carlo-Methode dar, weitere findet man in [16 19] 2. Benutzung des Mittelwertes Zu Berechnung von A6 169) geht man von n gleichverteilten Zufallszahlen £i, £2, • • , £n als Realisierung der gleichverteilten Zufallsgröße X aus Dann sind die Werte gi — <?(&) (i = 1,2,..., n) Realisierungen der Zufallsgröße g(X), für deren Erwartungswert sich nach Formel A6 49a,b), S. 776 ergibt: 00 l in E(g(X)) = I g(x)f0(x)dx = f g{x)dx « - £ <fc A6 171) -oo 0 U i=1 Diese Vorgehens weise, die die Formel für den Mittelwert einer Stichprobe verwendet, wird auch als gewöhnliche Monte-Carlo-Methode bezeichnet. 16.3.5.4 Anwendungen der Monte-Carlo-Methode in der numerischen Mathematik 1. Berechnung mehrfacher Integrale Zunächst soll für Funktionen einer Variablen die Transformation des bestimmten Integrals b P = Ih(x)dx A6.172) a auf einen Ausdruck gezeigt werden, der das Integral i / = f g(x)dx mit 0 < g{x) < 1 A6.173) o enthält. Danach kann die Monte-Carlo-Methode gemäß 16 3 5 3, S. 808 angewendet werden. Man substituiert wie folgt: x = a + (b — a)u, ' m = min h(x), M— maxh(x). A6.174) x€[a,b] xe[a,b]
16 3 Mathematische Statistik 809 Dadurch geht A6 172) über in r = (m - m)(b — a) I h(a + (b — a)u) ¦ M -m -du + (b — a)m, A6 175) wobei der Integrand h(a + (b — a)i/) • = g(u) der Bedingung 0 < g(u) < 1 genügt M -m ¦ Die näherungsweise Berechnung mehrfacher Integrale mit Hilfe der Monte-Carlo- Methode wird am Beispiel des Doppelintegrals V = II h(x,y) dxdy mit h(x,y) > 0 A6 176) gezeigt. Mit S wird ein ebenes Flächenstück bezeichnet, das durch die Ungleichungen a < x < b und V?i(z) < y < <P2(x) beschrieben sein soll. Mit ip\{x) und ip2{x) sind gegebene Funktionen bezeichnet Dann kann V als Volumen eines zylinderischen Körpers K aufgefaßt werden, der senkrecht auf der x, y -Ebene steht und für dessen Deckfläche 0 < z < h(x, y) gilt Dieser Körper liege in dem Quader Q , der durch die Ungleichungen a<x<b,c<y<d,Q<z<e (a,b,c,d.e const) beschrieben wird Nach einer Transformation analog zu A6 174) erhält man aus A6.176) einen Ausdruck, der das Integral V* — g(u,v)dudv mit 0 < g(u,v) < 1 A6 177) enthält, wobei V* als Volumen eines Körpers K* im dreidimensionalen Einheitswürfel aufgefaßt werden kann. Das Integral A6 177) wird näherungsweise nach der Monte-Carlo-Methode wie folgt berechnet Von einer Folge von Zufallszahlen, die im Intervall [0,1] gleich verteilt sein sollen, faßt man je 3 als Koordinaten eines Punktes Pt (i = 1,2, , n) des Einheitswürfels auf und prüft, ob Pi dem Körper K* angehört Ist das für m Punkte der Fall, dann gilt analog zu A6 170) V* « m/n A6 178) Hinweis: Bei bestimmten Integralen mit einer Integratisipnsveränderlichen sollte man die in 19 3. S 925 beschriebenen Verfahren anwenden. Bei der Berechnung mehrfacher Integrale ist dagegen die Anwendung der Monte-Carlo-Methode durchaus zweckmäßig. 2. Lösung partieller Differentialgleichungen durch Irrfahrtsprozesse Mit Hilfe von Irrfahrtsprozessen wird die Monte-Carlo- Methode zur genäherten Lösung von partiellen Differentialgleichungen realisiert. Es wird die folgende Randwertaufgabe betrachtet- a) Randwertaufgabe: d2' Au = in + TT? = ° für (xiy)eG1 A6 179a) A6.179b) &2> dx2 ' dy2 u(x,y) = f(x,y) für (x,y) £ T Hierbei ist G ein einfach zusammenhängendes Gebiet der x,y-Ebene, mit r ist der Rand von G bezeichnet (Abb. 16.17). Wie bei den Differenzenmethoden in 19.5 1, S 938 wird G mit einem quadratischen Gitter überzogen, bei dem ohne Beschränkung der Allgemeinheit die Schrittweite h = 1 gewählt werden soll. Auf diese Weise entstehen innere Gitterpunkte P(x, y) und Randpunkte Ri. Von den Randpunkten Ri, die auch Gitterpunkte sind, wird zunächst zur Vereinfachung angenommen, daß sie tatsächlich auf dem Rand r von G liegen, d h., es soll gelten y| y+l-- y-l- 0 k < S X C*\ , i -V <x- 1-1 r -G X Abbildung 16 17
810 16. Wahrscheinlichkeitsrechnung und mathematische Statistik u(Ri) = f{Ri) (i = l,2,.. ,N) A6.180) b) Lösungsprinzip: Man stellt sich vor, daß ein Teilchen von einem inneren Punkt P(x,y) aus zu einer Irrfahrt startet. Das bedeutet: 1. Das Teilchen bewegt sich von P(x, y) aus zufällig zu einem der 4 Nachbarpunkte des Gitters. Jedem dieser 4 Gitterpunkte wird die Wahrscheinlichkeit 1/4 für eine Bewegung zu diesem Punkt zugeordnet 2. Erreicht das Teilchen einen Randpunkt Ri, dann endet dort die Irrfahrt mit der Wahrscheinlichkeit 1. Es läßt sich zeigen, daß ein Teilchen nach endlich vielen Schritten von einem inneren Punkt P aus einen Randpunkt Ri erreicht. Mit p(P,Ri)=p((x,y),Rl) A6 181) wird die Wahrscheinlichkeit bezeichnet, daß eine Irrfahrt vom Punkt P(x, y) aus in dem Randpunkt Ri endet. Dann gilt p(Ä,,Ä,) = l, p(Ri,Rj) = 0 für i^j A6 182) und p{{x,y),Ri) = -\p((x-l}y),Ri)^p{(x + l,y),Ri)^p({x,y-l),Ri)^p((x,y + l),Ri)].(l6m) Die Gleichung A6.183) stellt eine Differenzengleichung für p{(x, y),Ri) dar. Werden n Irrfahrten vom Punkt P(x, y) aus durchgeführt, von denen rrii im Punkt R^ enden (m^ < n), dann gilt P((x,v),R,))h^ A6184) Die Gleichung A6 184) gibt eine Näherungslösung der Differentialgleichung A6 179a) unter der Bedingung A6 180) an. Die Randbedingung A6 179b) wird dagegen berücksichtigt, indem man N v(P) = v{x,y) = ^2f(Ri)p((x,y),Ri) A6 185) i=l setzt; denn wegen A6.183) gilt v(Rj) = £ f{Rl)p(Rj, R{) = f(Rj). Zur Berechnung von v(x,y) wird A6.183) mit f(Ri) multipliziert Nach Summation erhält man die folgende Differenzengleichung für v(x, y): v(x, y) = -[v(x -1,2/) + v(x + 1,2/) + v(x, y - 1) + v(x, y + 1)]. A6 186) Werden n Irrfahrten vom inneren Punkt P(x,y) aus durchgeführt, von denen rrij im Randpunkt Ri (i = 1,2, , N) enden, dann erhält man durch v{x,y)^-Yjmif{Ri) A6.187) einen Näherungswert im Punkt P(x, y) des Randwertproblems A6.179a,b) 16.3.5.5 Weitere Anwendungen der Monte-Carlo-Methode Die Monte-Carlo-Methode als zufallsbedingte Simulationsmethode (man spricht häufig auch von der Methode der statistischen Versuche) wird in den verschiedensten Disziplinen angewendet. Als Beispiele seien genannt: • Kerntechnik. Untersuchung des Neutronendurchganges durch eine Materialschicht (z B Berechnung des biologischen Schutzes); • Nachrichtentechnik Trennung von Signal und Störung; • Operations Research. Reihenfolgeprobleme, Ablaufplanung, Lagerhaltung, Bedienungsmodelle. Zur Lösung derartiger spezieller Probleme muß auf die Literatur verwiesen werden (s. z B. [16 19], [16.23])
16.4 Theorie der Meßfehler 811 16.4 Theorie der Meßfehler Bei jeder wissenschaftlichen Messung — unabhängig davon, wie sorgfältig sie durchgeführt wird — sind Beobachtungs- oder Meßwerte mit unvermeidlichen Meßfehlern behaftet. Nach DIN werden die Meßfehler, also alle während einer Messung auftretenden Fehler, Abweichungen genannt. Unsicherheiten nennt man dagegen die Fehler bei der Angabe von Meßergebnissen Mit diesen beiden Begriffen kann man die Zielstellung der Theorie der Meßfehler wie folgt formulieren 1. Die Abweichungen sind so klein wie möglich zu halten, d h., für den Wert, der durch die Messung bestimmt werden soll, ist eine möglichst gute Näherung zu ermitteln Dafür eignet sich besonders die Ausgleichsrechnung, die auf GAUSS zurückgeht und die im wesentlichen aus der Fehlerquadratmethode besteht 2. Die Unsicherheit ist so gut wie möglich abzuschätzen oder zu berechnen, wozu die Methoden der mathematischen Statistik eingesetzt werden. 16.4.1 Meßfehler und ihre Verteilung 16.4.1.1 Meßfehlereinteilung nach qualitativen Merkmalen Teilt man die Meßfehler nach ihrer Ursache ein, dann können die folgenden drei Meßfehlerarten unterschieden werden- 1. Grobe Meßfehler beruhen auf falschen Ablesungen und Verwechslungen 2. Systematische Meßfehler beruhen auf falsch geeichten oder schlecht justierten Meßgeräten und auf der Art der Meßmethode, wobei die Art des Ablesens sowie systemimmanente Meßfehler eine Rolle spielen können Sie sind nicht immer vermeidbar. 3. Statistische oder zufällige Meßfehler beruhen einerseits auf nicht oder nur wenig beeinflußbaren zufälligen Veränderungen der Meßbedingungen sowie andererseits auf der Zufälligkeit gewisser Eigenschaften der betrachteten Ereignisse In der Theorie der Meßfehler geht man davon aus, daß alle groben und systematischen Meßfehler ausgeschlossen werden und lediglich die statistischen Eigenschaften und zufälligen Meßfehler in die Berechnung der Unsicherheiten eingehen 16.4.1.2 Meßfehler verteilungsdichte 1. Meßprotokoll Die Berechnung der Unsicherheiten setzt voraus, daß die Meßergebnisse in einem Meßprotokoll als Urliste tabelliert und durch die Angabe der relativen Häufigkeiten oder der Dichtefunktion f(x) bzw durch die Angabe der relativen Summenhäufigkeiten oder der Verteilungsfunktion F(x) verfügbar sind (s 16.3 2 1,S 795) Unter der Variablen x ist die Realisierung der Zufallsveränderlichen X zu verstehen, durch welche die zu bestimmende Größe beschrieben wird 2. Fehlerverteilungsdichte Spezielle Annahmen über die Eigenschaften der Meßfehler bedingen bestimmte Eigenschaften der Dichtefunktion der Fehler Verteilung. 1. Stetige Dichtefunktion Da zufällige Meßfehler beliebige Werte aus einem bestimmten Intervall annehmen können, sind sie durch eine stetige Dichte f(x) zu beschreiben 2. Gerade Dichtefunktion Wenn Meßfehler mit gleichem Absolutbetrag, aber verschiedenem Vorzeichen gleichwahrscheinlich sind, muß die Dichtefunktion eine gerade Funktion sein: f(—x) = f(x) 3. Monoton fallende Dichtefunktion Wenn Meßfehler mit großem Absolutbetrag weniger wahrscheinlich sind als Fehler mit kleinem Absolutbetrag, muß f(x) für x > 0 eine monoton fallende Funktion sein. 4. Endlicher Erwartungswert Der Erwartungswert des Absolutbetrages des Fehlers muß eine endliche Größe sein, d h , es muß gelten oo E{\X\) = f \x\f(x)dx < oo A6 188)
812 16 Wahrscheinlichkeitsrechnung und mathematische Statistik Durch Zugrundelegung unterschiedlicher Fehlereigenschaften kommt man zu verschiedenen Fehlerdichtefunktionen. 3. Fehler normal Verteilung 1. Dichte und Verteilungsfunktion In den meisten Fällen der Praxis kann davon ausgegangen werden, daß die Meßfehler normal verteilt sind, und zwar mit dem Mittelwert ß = 0 und einer Streuung er2 , d.h., für die Dichtefunktion f(x) und die Verteilungsfunktion F(x) von Meßfehlern soll gelten: m-- i x\ e~2^ A6. aV^TT und Fw=^?/r^*=*G) A6.189b) Dabei ist <P(x) die Verteilungsfunktion der normierten Normal Verteilung (s. A6 73a, S 782) und Tabelle 21.17, S. 1122). Im Falle von A6.189a,b) spricht man auch von der Fehlernormalverteüung 2. Geometrische Darstellung In Abb. 16.18a ist die Dichte der Fehlernormalverteilung A6.189a) mit Wende- und Schwerpunkt dargestellt, in Abb. 16.18b das Verhalten bei drei verschiedenen Werten der Streuung. Die Wendepunkte liegen bei den Abszissenwerten ±a , die Schwerpunkte der Flächenhälften bei ±77. Der Maximalwert der Kurve bei x = 0 beträgt l/(ay/2n). Mit wachsendem a2 verbreitert sich die Kurve, wobei der Flächeninhalt unter ihr konstant gleich Eins bleibt. Die Verteilung besagt, daß, gemessen am absoluten Betrag, kleine Fehler häufig vorkommen, große selten. 4. Parameter zur Charakterisierung der Fehlernormalverteüung Zur Charakterisierung der Fehlernormalverteüung werden außer der Streuung a2 bzw der Standardabweichung a, auch mittlerer quadratischer Fehler genannt, noch andere Parameter verwendet, wie das Genauigkeitsmaß h, der mittlere Fehler n und der wahrscheinliche Fehler 7 a) -c -7 0 +Y +0 b)" Abbildung 16 18 1. Genauigkeitsmaß Neben der Streuung a2 wird zur Charakterisierung der Breite der Normalverteilung auch der Begriff Genauigkeitsmaß oder Genauigkeit ä=-4= A6-190) crv27T benutzt. Je schmaler die GAUSS-Kurve ist, desto größer ist die Genauigkeit (Abb.16.18b). Wenn für g die experimentell mit Hilfe von Meßwerten ermittelte Größe a bzw. äx eingesetzt wird, charakterisiert das Genauigkeitsmaß die Genauigkeit der Meßmethode 2. Einfacher mittlerer Fehler Der Erwartungswert 77 des absoluten Betrages des Fehlers ergibt sich zu r) = E(\X\) = 2Jxf(x)dx. A6 191)
16.4 Theorie der Meßfehler 813 3. Wahrscheinlicher Fehler Die Schranke 7 des absoluten Betrages des Fehlers mit der Eigenschaft P(\X\ <l) = \ A6.192a) heißt wahrscheinlicher Fehler. Daraus folgt +7 / f(x) dx = 2<p(-t\-l = -, A6.192b) -7 wobei <P(x) die Verteilungsfunktion der normierten Normalverteilung ist 4. Vorgabe einer Fehlergrenze Wenn eine obere Fehlergrenze a > 0 vorgegeben wird, die nicht überschritten werden soll, dann kann mit der Formel P(\X\ <a) = 2<P (-) - 1 A6.193) die Wahrscheinlichkeit ausgerechnet werden, mit der der Fehler in das Intervall [—a, a] fällt. 5. Zusammenhang zwischen Standardabweichung, mittlerem und wahrscheinlichem Fehler sowie Genauigkeit Im Falle der Fehlernormalverteilung gelten unter Benutzung des Zahlenfaktors g = 0,4769 die folgenden Zusammenhänge: fc=^ = vb=f (m94b) *(^)=5- (l6-195) 16.4.1.3 Meßfehlereinteilung nach quantitativen Merkmalen 1. Wahrer Wert und seine Näherungen Der wahre Wert xw einer meßbaren Größe ist im allgemeinen unbekannt. Als Schätzwert für xw wird man den Erwartungswert der Zufalls variablen wählen, deren Realisierung durch die Meßwerte X{ {% = 1,2,.. ,n) erfolgt. Demzufolge bieten sich als Näherungswerte für xw die folgenden Mittelwerte an: 1. Gleichgewichteter Mittelwert _ 1 n k x = - ^Xi A6.196a) bzw. x = ^ hjXj, A6 196b) n i=i j=i wenn die Meßwerte in k Klassen mit den absoluten Häufigkeiten hj und den Klassenmittelwerten Xj (j = 1,2,.. ,k) eingeteilt worden sind 2. Gewichteter Mittelwert x(p)=X>^/X>. A6 197) »=i ' »=i Dabei sind die einzelnen Meßwerte mit dem Gewichtsfaktorgi (gi > 0) gewichtet worden (s 16.4.1.6,bfl , S 817). 2. Fehler der Einzelmessung einer Meßreihe 1. Wahrer Fehler der Einzelmessung einer Meßreihe wird die Abweichung des Meßergebnisses vom wahren Wert xw genannt. Da dieser meist unbekannt ist, bleibt auch der wahre Fehler Ei der i-ten Messung mit dem Ergebnis Xi unbekannt. £i = xw — X{. A6.198a)
814 16. Wahrscheinlichkeitsrechnung und mathematische Statistik 2. Scheinbarer Fehler der Einzelmessung einer Meßreihe wird die Abweichung des Meßergebnisses Xi vom arithmetischen Mittelwert genannt' Vi = x-x{. A6.198b) 3. Mittlerer quadratischer Fehler der Einzelmessung oder Standardabweichung der Einzelmessung Da der Erwartungswert der Summe der wahren Fehler Ei und der Erwartungswert der Summe der scheinbaren Fehler v\ von n Messungen einer Größe verschwindet, werden die verschiedenen Fehler mit Hilfe der Fehlerquadratsümmen berechnet' £2 = f>2, A6 199a) v2 = f>2. A6 199b) Für die praktische Auswertung ist nur A6 199b) von Interesse, weil nur die Werte Vi aus den Meßergebnissen ermittelt werden können. Deshalb definiert man \ EWy(n-l) A6 200) i=i ' als mittleren quadratischen Fehler der Einzelmessung der Meßreihe Der Wert a ist ein Näherungswert für die Standardabweichung a der Fehlerverteilung Im Falle der Fehlernormal Verteilung gilt für a = a' P(\e\ < er) = 2#A) - 1 = 0,68. A6.201) Das bedeutet Die Wahrscheinlichkeit, daß der wahre Fehler betragsmäßig den Wert o nicht übersteigt, beträgt ca 68% 4. Wahrscheinlicher Fehler ist die Bezeichnung für eine Zahl 7 , für die gilt. P(\e\ < 7) = \ A6.202) Das bedeutet: Die Wahrscheinlichkeit, daß der Fehler den Wert 7 nicht übersteigt, beträgt in diesem Falle 50 %. Die Abszissenwerte ±7 teilen die linke und rechte Fläche unter der Dichtefunktion in je zwei gleich große Hälften (Abb. 16.18a). Im Falle der Fehlernormalverteilung besteht zwischen 7 und a der Zusammenhang 7 = 0,6745a « |cr = |Jf>2/(n - 1) A6.203) 5. Mittlerer Fehler ist die Bezeichnung für eine Zahl 77, die als Erwartungswert des absoluten Betrages des Fehlers definiert wird- 00 fj = E(\e\) = 2 f xf(x) dx. A6 204) 0 Im Falle der Fehlernormal Verteilung ergibt sich rj = 0,798 . Auf Grund der Beziehung P(\e\ <ri) = 2$(Jt\-i = 0,576 A6 205) folgt daraus. Die Wahrscheinlichkeit, daß der Fehler den Wert 77 nicht übersteigt, beträgt ca. 57,6 % Bei den Abszissenwerten ±77 liegen die Schwerpunkte der rechten bzw. linken Fläche unter der Dichtefunktion (Abb.16.18a). Im Falle der Fehlernormalverteilung gilt w^= 0,7978Ö- « 0,85- = 0, X>7(n-1) A6-206)
164 Theorie der Meßfehler 815 3. Fehler des arithmetischen Mittelwertes einer Meßreihe Die Fehler des arithmetischen Mittelwertes x einer Meßreihe werden mit Hilfe der Fehler der Einzelmessung wie folgt definiert 1. Mittlerer quadratischer Fehler oder Standardabweichung *AM = * X>2/K™ " 1)] = 4= ' A6 207) \ i=i I Vn 2. Wahrscheinlicher Fehler 1AM * f JX>2/[n(n- 1)] = |-^ A6.208) 3. Mittlerer Fehler ^M~0,8JE^7Kn-1I=0,8-7=. \j=i ' V™ A6.209) 4. Sättigung des erreichbaren Fehlerniveaus Da die drei definierten Fehler A6.207-16.209) des arithmetischen Mittels proportional zum entsprechenden Fehler der Einzelmessung A6.200,16 203 und 16.206) und umgekehrt proportional zur Wurzel aus n sind, ist es nicht sinnvoll, mit der Anzahl der Einzelmessungen über einen gewissen Wert hinauszugehen. Eine merkliche Verringerung des Fehlers kann nur durch Verbesserung des Genauigkeitsmaßes h der Meßmethode A6.190) erreicht werden 4. Absoluter und relativer Fehler 1. Absolute Unsicherheit, absoluter Fehler Die Unsicherheit eines Meßergebnisses, angegeben als Fehler 6i, vi} G{, ji oder ??; bzw. e, v, o, 7 oder 77, ist ein Maß für die Zuverlässigkeit der Messungen. Der Begriff der absoluten Unsicherheit, angegeben als absoluter Fehler, steht für alle diese Fehlergrößen und die ihnen entsprechenden Ergebnisse von Fehlerfortpflanzungsrechnungen (s. 16.4.2, S. 818) Sie zeichnen sich durch die gleiche Dimension aus wie die zu messende Größe. Der absolute Fehler wurde eingeführt, um Verwechslungen mit dem Begriff des relativen Fehlers zu vermeiden. Als Formelzeichen wird häufig Ax; bzw. Ax verwendet. Das Wort „absolut" hat hier eine andere Bedeutung als im Begriff Absolutwert. Es bezieht sich lediglich auf den Zahlenwert der Meßgröße (z B. Länge, Ladung, Energie), ohne auf ihr Vorzeichen Bezug zu nehmen. 2. Relative Unsicherheit, relativer Fehler Die relative Unsicherheit, angegeben durch den relativen Fehler, ist ein Maß für die Qualität der Messungen, bezogen auf den Zahlenwert der Meßgröße im oben definierten Sinne. Im Unterschied zum absoluten Fehler ist der relative Fehler dimensionslos, weil er als Quotient aus dem absoluten Fehler und dem Zahlenwert der Meßgröße gebildet wird. Ist letzterer nicht bekannt, dann setzt man den Mittelwert der Meßgröße x ein: ÖXi = — « ^ . A6.210a) x x Der relative Fehler wird meist in Prozenten angegeben und heißt daher auch prozentualer Fehler: Sxi/% = ÖXi ¦ 100 %. A6.210b) 5. Absoluter und relativer Maximalfehler 1. Absoluter Maximalfehler Ist die zu bestimmende Größe z eine Funktion der Meßgrößen x\, X2, .., xn , d.h. z = }{x\,X2, . , xn), dann muß der resultierende absolute Fehler unter Berücksichtigung dieser Funktion berechnet werden. Das geschieht entweder mit Hilfe des Fehlerfortpflanzungsgesetzes, wodurch ein Ausgleich der Messungen vorgenommen wird, weil nach der Fehlerquadratmethode ein Minimum von Y,(zi ~ zJ gesucht wird, oder man verzichtet auf den Ausgleich der Meßwerte und berechnet lediglich eine obere Fehlerschranke, die absoluter Maximalfehler A2max genannt wird. Für den
816 16. Wahrscheinlichkeitsrechnung und mathematische Statistik Fall, daß es sich um n unabhängige Veränderliche x{ handelt, gilt: A*™ dx~if{x^- ,*») Ax{, A6.211) wobei für die Xi der jeweilige Mittelwert x^ einzusetzen ist. 2. Relativer Maximalfehler Der relative Maximalfehler wird gebildet, indem der absolute Maximalfehler durch den Zahlenwert der Meßgröße (meist ist das der Mittelwert z) dividiert wird. ozm&x = « —-— A6 212) 16.4.1.4 Angabe von Meßergebnissen mit Fehlergrenzen Eine realistische Einschätzung eines Meßergebnisses ist nur möglich, wenn der zu erwartende Fehler mit angegeben wird; Fehlerangaben sind unverzichtbarer Bestandteil eines Meßergebnisses Aus den Angaben muß zu erkennen sein, welche Fehlerart mit welchen Vertrauensgrenzen und bei welcher Irrtumswahrscheinlichkeit angegeben wird. 1. Angabe der definierten Fehler Die Angabe des Meßergebnisses erfolgt für die Einzelmessung in der Form x = Xi ± Ax = Xi±ö, A6.213a) für den Mittelwert in der Form x = x ± Axam = x ± öam- A6.213b) Dabei wurde für Ax jeweils die mit Abstand am häufigsten verwendete Standardabweichung eingesetzt. Es können aber auch 7 und f) benutzt werden X — xw 2. Vorgabe beliebiger Vertrauensgrenzen Die Größe T = — genügt im Falle einer N(fi. a2) G verteilten Grundgesamtheit der ^-Verteilung A6.97b) mit dem Freiheitsgrad / = n — 1 Für eine geforderte Irrtumswahrscheinlichkeit a oder statistische Sicherheit S = 1 — a ergeben sich für den unbekannten wahren Wert xw = /i mit Hilfe der t-Quantile £a/2,/ die Vertrauensgrenzen fi = x±ta/2-f'äAM A6 214) Somit liegt der wahre Wert xw mit der statistischen Sicherheit S = 1 — a, d.h. mit der Wahrscheinlichkeit 1 — a , innerhalb dieses Intervalls mit den angegebenen Vertrauensgrenzen Meist ist man daran interessiert, den Meßreihenumfang n so gering wie möglich zu halten. Das Vertrauensintervall 2ta/2-f(JAM ist um so enger, je kleiner 1 — a gewählt wird und je größer die Anzahl n der Messungen ist. Da gam mit l/\/n abnimmt und die Quantile ta/2;f mit / = n — 1 abnehmen (bei n von 5 bis 10 ebenfalls mit 1/y/n (s. Tabelle 21.20, S. 1127)), verringert sich die Breite des Vertrauensintervalls hier mit \jn 16.4.1.5 Fehlerrechnung für direkte Messungen gleicher Genauigkeit Bei direkten Messungen gleicher Genauigkeit, d.h., wenn für alle n Messungen die gleiche Streuung Gi realisiert werden kann, spricht man von Messungen mit gleicher Genauigkeit h = const. In diesem Falle führt die Methode der kleinsten Quadrate auf die in A6.200), A6 203) und A6.205) angegebenen Fehlergrößen. ¦ Es ist das Endergebnis für eine Meßreihe anzugeben (s nachfolgende Tabelle), die aus n = 10 direkten Messungen gleicher Genauigkeit besteht. Xi Vi • 103 Vi2 ¦ 106 1,592 - 12 144 1,581 - 1 1 1,574 + 6 36 1,566 + 14 196 1,603 -23 529 1,580 0 0 1,591 - 11 121 1.583 -3 9 1,571 + 9 81 1,559 + 21 441
16 4 Theorie der Meßfehler 817 x = 1,580, ö = JX^Vfa-l) = 0,0131, ötam = flr>/n = 0,041. Endergebnis, x = x ± gam — 1,580 ± 0,041. 16.4.1.6 Fehlerrechnung für direkte Messungen ungleicher Genauigkeit 1. Gewicht einer Messung Wenn die direkten Meßergebnisse x^ aus verschiedenen Meßverfahren stammen oder Mittelwerte von Einzelmessungen darstellen, die zu dem gleichen Mittelwert x mit verschiedenen Streuungen <jj2 gehören, setzt man an die Stelle des gleichgewogenen Mittels das gewogene Mittel ^ = EWE* und an die Stelle der Streuungen o? die Streuungsverhältnisse <72 A6 215) A6 216) Für <7 steht ein beliebiger Wert öi (meist der mit dem geringsten Fehler), der aus dem Zahlenbereich der Meßwerte ausgewählt wird Er dient als Standardabweichung der Gewichtseinheit, d.h., für öi — b ist gi = 1. Aus A6.214) folgt: Das Gewicht einer Messung ist um so größer, je kleiner ihr Fehler öi ist. 2. Standardabweichungen Die Standardabweichung der Gewichtseinheit ergibt sich als Schätzwert zu \ £>W(n-l). i=l ' A6 217) Es ist darauf zu achten, daß cr(ff) < ä ist, im entgegengesetzten Falle ä^ > ä sind Xi mit systematischen Abweichungen enthalten. Die Standardabweichung der Einzelmessung lautet Vi .(g) : y/9i —z-Ci, er wobei di^ < äi erwartet werden kann. Die Standardabweichung des gewogenen arithmetischen Mittels lautet: *ft = *to\ \i=i (n-l)E^* A6.218) A6.219) 3. Fehlerangabe Die Fehlerangaben können wie inl641.4,S.816 dargestellt, entweder mit Hilfe der definierten Fehler oder mit Hilfe der t-Quantile des Freiheitsgrades / erfolgen ¦ Es ist das Endergebnis für n = 5 Meßreihen mit den verschiedenen Mittelwerten Xi (i = 1,2, .., 5) und den verschiedenen Standardabweichungen gam{ anzugeben.
818 16. Wahrscheinlichkeitsrechnung und mathematische Statistik Xi 1,573 1,580 1,582 1,589 1,591 \Xi)m = 1,583 VAMi 0,010 0,004 0,005 0,009 0,011 =0,009 ~2 °AMi i,o-io-4 1,6-10~5 2,5-10-5 8,1-10-5 1,21-10-4 9i 0,81 5,06 3,24 1,00 0,66 n J2di t=i =10,7 Zi -1,2-10-2 -5,0-10-3 -3,0-10-3 +4,0-10-3 +6,0 IQ 9iZi -9,7-10-3 -2,5-10 -9,7-10-3 4,0-10-3 3,9-10-3 J2diZi t=i =3,6-10-2 z? 1,44-10-4 2,50-10-5 9,0-10 1,6-10-5 3,6-10-5 9iZ? 1,16-10-4 1,26-10-4 2,91-10-5 1,6-10-5 2,37-10 n Y.9iZi2 *=i =3,1-10~4 Man berechnet (xi)m = 1,5830 und wählt Xq = 1,585 sowie a = 0,009 Mit Zi = X{ — x0 , gi = ä2/di2 berechnet man ~z = —0,0036 und erhält x = Xq + z = 1, 582 . Für die Standardabweichungen ergibt xi£#^2/(ra-l) = 0,0088 < a und a, sich ä{9) = x = x±dx = 1,585 + 0,0027 &AM 0,0027 Das Endergebnis lautet 16.4.2 Fehlerfortpflanzung und Fehleranalyse Häufig gehen die gemessenen Größen über eine funktionale Abhängigkeit in ein Endresultat ein Wenn die Fehler klein sind, kann eine TAYLOR-Entwicklung nach den Fehlern durchgeführt werden, in der man die Glieder 2. Ordnung vernachlässigt. Man spricht dann von Fehlerfortpflanzung 16.4.2.1 Gaußsches Fehler fort pflanz ungsgesetz 1. Problemstellung Zu bestimmen sind Zahlenwert und Fehler einer Größe z , die über die Funktion z = f{x\, x2) • ,xk) von den unabhängigen Variablen Xj (j = 1,2, , k) abhängt Die Werte Xj können als Realisierungen von Zufallsgrößen angesehen werden und lassen sich als Mittelwerte Xj je einer Meßreihe mit n,- Meßwerten bestimmen Ihre Streuung ist o2 Es ist zu untersuchen, wie sich die Fehler der Variablen auf die Funktion f(x\,x2, , Xk) auswirken. Die Funktion f(x\, x2, , Xk) muß differenzierbar sein, ihre Variablen müssen stochastisch unabhängig sein, sie dürfen aber beliebigen Verteilungen mit unterschiedlichen Streuungen o2 genügen. 2. Taylor-Entwicklung Da die Fehler relativ kleine Änderungen der unabhängigen Variablen darstellen, kann die Funktion f(xi,X2, ¦ ,Xk) in der Nähe der Mittelwerte Wj durch den Linearanteil ihrer TAYLOR-Entwicklung mit den Koeffizienten üj angenähert werden, so daß für ihren Fehler A/ gilt: Af = f(xux2,....xk)-f(xux2, . ,xk), A6.220a) A/ « df = ^-dxx + ^-dx2 + - OX\ OX2 • + w—dxk ¦¦ oxk i2^rdxJ = iZaJdxJ j=i uxj A6 220b) wobei die partiellen Ableitungen df/dxj an der Stelle (xi, x2,..., xk) zu nehmen sind. Streuung und Standardabweichung der Funktion ergeben sich zu (jf = a\ aXl + a2 aX2 + • • • + ak aXk = 2_, Q>j &xj • A6 221) 3. Näherung für die Streuung a-f Da die Streuungen der unabhängigen Variablen Xj unbekannt sind, ersetzt man sie durch Streuungen ihrer Mittelwerte, die aus den Meßwerten Xji (l = 1,2, , ni) der einzelnen Variablen wie folgt ermit-
164 Theorie der Meßfehler 819 telt werden h1 °Xj n3 1=1 nj{rij — 1) Mit diesen Werten bildet man <f/ = E«/*|- als Näherung für V A6.222) A6 223) =i Formel A6 223) wird GAUSSsches Fehlerfortpflanzungsgesetz genannt 4. Spezialfälle 1. Linearer Fall Ein häufig auftretender Fall ist die Addition der Fehlerbeiträge linear eingehender Fehlergrößen mit üj — 1: af = yjö^2 + a22 + • • • + dk2 A6 224) ¦ Am Ausgang des Impulsverstärkers eines Detektorkanals zur Spektrometrierung von Strahlungen wird eine Impulsbreite festgestellt, die auf drei Anteile zurückgeführt werden kann: 1. Statistische Energieverteilung der Strahlung des zu spektrometrierenden Übergangs einer Energie E0 , charakterisiert durch astr, 2. statistische Umsetzungsprozesse im Detektor mit <7Det, 3 elektronisches Rauschen des Verstärkers der Detektorimpulse öe\ Für die Gesamtimpulsbreite ergibt sich */ = >/*L + S£* + öä- A6.225) 2. Potenzgesetz Oft treten die Variablen Xj in der folgenden Form auf: z = f(xux2l xh) = axxbl ¦ x2b2 ... xkh A6.226) Durch logarithmische Differentiation ergibt sich der relative Fehler zu dl = bld?l + b2^ + ... + bk<^, A6227) / Xi X2 Xk woraus nach dem Fehlerfortpflanzungsgesetz für den mittleren relativen Fehler folgt: °1 = f ^ E{^J A6 228) ¦ Die Funktion f(xi,X2,xs) habe die Form f(xi,x2,X3) — ^Jx[x22 x33 , die Standardabweichungen sind aXl , aX2 und aX3. Der relative Fehler ergibt sich dann zu 5z=°4 J~\ m)+m+m 5. Unterschied zum Maximalfehler Die Angabe des absoluten oder relativen Maximalfehlers A6.211,16.212) bedeutet, daß kein Ausgleich zwischen den Meßergebnissen durchgeführt wird. Bei der Ermittlung des absoluten oder relativen Fehlers mit Hilfe des Fehlerfortpflanzungsgesetzes A6 223) oder A6.226) wird mit einer vorgegebenen Wahrscheinlichkeit innerhalb eines festgelegten Vertrauensintervalls zwischen den Meßergebnissen Xj ausgeglichen Die Vorgehensweise erfolgt in der inl6414,S 816 angegebenen Weise. 16.4.2.2 Fehleranalyse Unter Fehleranalyse versteht man allgemein die Analyse der Fortpflanzung von Fehlern bei der Berechnung einer Funktion <p(xi), wenn Größen höherer Ordnung vernachlässigt werden. Im Rahmen der
820 16. Wahrscheinlichkeitsrechnung und mathematische Statistik Theorie der Fehleranalyse wird mit Hilfe eines Algorithmus untersucht, wie sich ein Eingangsfehler Axi im Endergebnis (p(xi) auswirkt Man spricht in diesem Zusammenhang auch von differentieller Fehleranalyse. In der numerischen Mathematik versteht man unter Fehleranalyse die Untersuchung des Einflusses von Verfahrens-, Rundungs- und Eingangsfehlern auf das Ergebnis (s. [19.26], [19.30])
821 17 Dynamische Systeme und Chaos 17.1 Gewöhnliche Differentialgleichungen und Abbildungen 17.1.1 Dynamische Systeme 17.1.1.1 Grundbegriffe 1. Typen dynamischer Systeme, Orbits Ein dynamisches System ist ein mathematisches Objekt zur Beschreibung der Zeitentwicklung physikalischer, biologischer und anderer real existierender Systeme Es wird definiert durch einen Phasenraum M, der im weiteren oft der Rn, eine Teilmenge davon oder ein metrischer Raum ist, und eine ein- parametrige Familie von Abbildungen ipl • M —? M, wobei der Parameter t (Zeit) aus R bzw. R+ (zeitkontinuierlich) oder Z bzw. Z+ (zeitdiskret) ist Für beliebiges x G M muß dabei a) <p°(x) = x und b) ipt((fs(x)) = (pt+s(x) für alle t, s aus der jeweiligen Zeitmenge gelten. Die Abbildung tpl wird kurz als (p geschrieben. Im weiteren wird die Zeitmenge mit r bezeichnet Dabei kann r = R, F = R+, r = Z oder F = Z+ sein. Ist F = R (R+), so nennt man das dynamische System auch Fluß (Semifluß) Da bei r = R und r = Z wegen a) und b) für jedes tef neben (p* auch die inverse Abbildung (y>*)-1 = <£-' existiert, spricht man hier von invertierbaren dynamischen Systemen Ist das dynamische System nicht invertierbar, versteht man für eine beliebige Menge A C M und beliebiges t > 0 unter ip~l(A) das Urbild von A bzgl. ipl, d.h. die Menge (p~l(A) = {x G M <pl(x) G A} . Ist für jedes t G r die Abbildung ipl • M —> M stetig bzw. fc-mal stetig differenzierbar (dabei sei M C Rn), so heißt das dynamische System stetig bzw. Ck-glatt. Für beliebiges festes x G M definiert die Abbildung t \—? ^ (i), i G T eine Bewegung des dynamischen Systems mit Anfang x zur Zeit t = 0. Das Bild 7(x) einer Bewegung mit Anfang x ist der Orbit (oder die Trajektone) durch x,dh 7B) = {^*(a;)}ter Analog wird der positive Semiorbit durch a; als 7+(x) = {<^*(a;)}t>o und, falls r 7^ R+ oder T / Z+ ist, der negative Semiorbit durch x als 7~(x) = {y*(aj)}t<o definiert Der Orbit 7C;) heißt Ruhelage, wenn 7C;) = {x} ist, und T-•periodisch, wenn ein T G F, T > 0, existiert, so daß (/?*+r(x) = ^{x) für alle t e t und T G T die kleinste positive Zahl mit dieser Eigenschaft ist Die Zahl T heißt Periode. 2. Fluß einer Differentialgleichung Gegeben sei eine gewöhnliche Differentialgleichung x = f{x), A7 1) wobei /: M —* Rn ( Vektorfeld) eine r-mal stetig differenzierbare Abbildung ist und M = Rn oder eine offene Teilmenge des Rn darstellt. Im weiteren wird im Rn stets die EUKLiDische Norm || • || benutzt, d h., für beliebiges x G Rn , x = (x\, .., xn) ist ||x|| = JYh=\ x* . Schreibt man die Abbildung / in Komponenten als / = (/1? .., fn), so ist A7.1) das System aus den n skalaren Differentialgleichungen ii = fi(xu ,xn), i = 1,2, ...,n. Die Sätze über die lokal eindeutige Lösbarkeit von PiCARD-LiNDELÖF und über die r-malige Diffe- renzierbarkeit nach den Anfangsbedingungen (s [17 5]) garantieren, daß für jedes x$ G M eine Zahl e > 0, eine Kugel Bs(x0) = {x: \\x — £0|| < $} aus M und eine Abbildung (p. (—e, e) x Bs(x0) —> M existieren, so daß gilt 1. ip(-, •) ist (r + l)-mal stetig differenzierbar bzgl. des ersten Arguments (Zeit) und r-mal stetig differenzierbar bzgl. des zweiten Arguments (Ortsvariable) 2. <p(-, x) ist für jedes fixierte x G B$(x0) eine lokal eindeutige Lösung von A7 1) auf dem Zeitintervall (s,e) mit Anfang x zur Zeit t = 0, d.h., es gilt — (t,x) = <p(t,x) = f((p(t,x)) für alle t G (—e,e),
822 17 Dynamische Systeme und Chaos ip@,x) = x, und jede andere Lösung mit Anfang x zur Zeit t = 0 stimmt für kleine Zeiten |t| mit <p(t, x) überein. Alle lokalen Lösungen von A7.1) seien eindeutig auf ganz R fortsetzbar. Dann gibt es zu jeder Differentialgleichung A7.1) eine Abbildung ip: R x M —? M mit folgenden Eigenschaften: 1. v?@, x) = x für alle x G M. 2. ip(t + s, x) = <£>(£, <p (s, a;)) für alle £, s G R und alle x G M 3. (/?(•, •) ist bzgl. des ersten Arguments (r + l)-mal und bzgl. des zweiten Arguments r-mal stetig differenzierbar. 4. </?(-, aj) ist für jedes fixierte x G M eine Lösung von A7.1) auf ganz R. Der zu A7.1) gehörige Cr-glatte Fluß läßt sich dann durch die Beziehung ip1- = (p(t, •) definieren. Die Bewegungen <^(-, x): R —? M eines Flusses von A7.1) heißen Integralkurven. ¦ Das System x = a(y — x), y = rx — y — xz z = xy — bz A7 2) heißt Lorenz -System der konvektiven Turbulenz (s. 17.2.4.3, S.850). Dabei sind a > 0, r > 0 und 6 > 0 Parameter. Dem LORENZ-System entspricht ein C°°-Fluß in M = R3 . 3. Zeit diskrete dynamische Systeme Gegeben sei auf dem metrischen Raum (M, p) (s. 12.2.1, S. 624) die Differenzengleichung xt+1=ip(xtI ter, A7 3) die auch als Zuordnung x i—? ip(x) geschrieben werden kann. Dabei ist r G {Z+, Z_} , und ip: M —> M ist eine stetige oder r-mal stetig differenzierbare Abbildung, wobei im letzten Fall McRn sei. Ist </? invertierbar, so definiert A7 3) durch die Festlegung ipl = ipo o(p, falls t > 0, (pl = ip~1o o(£-1, falls t < 0, (p° = id t-mal, — t-mal, ein invertierbares zeitdiskretes dynamisches System Ist ip nicht invertierbar, so sind die Abbildungen ipl nur für t > 0 erklärt. Zur Realisierung von y>* s. E.87), S. 306. ¦ A: Die Differenzengleichung xt+i = axt (l - xt), t = 0,1,... A7 5) mit einem Parameter a G @,4] heißt logistische Gleichung Hierbei ist M = [0,1], und ip: [0,1] —* [0,1] ist bei fixiertem a die Funktion (p(x) = ax(l — x). Offenbar ist ip unendlich oft differenzierbar, aber nicht umkehrbar. Also definiert A7.5) kein invertierbares dynamisches System. ¦ B: Die Differenzengleichung xt+i = Vt + 1 - ax\ , Vt+i = bxt, t = 0, ±1, ., A7 6) mit Parametern a > 0 und b ^ 0 heißt Henon-Abbildung Die A7.6) entsprechende Abbildung ip: R2 —? R2 ist durch tp(x,y) = (y+1—ax2 , bx) definiert, unendlich oft differenzierbar und umkehrbar 4. Volumenschrumpfende und volumenerhaltende Systeme Das invertierbare dynamische System {(pt}ter auf M C Rn heißt volumenschrumpfend oder dissipativ bzw. volumenerhaltend oder konservativ, wenn für jede Menge A C M mit einem positiven n-dimensionalen Volumen vol(A) und jedes t > 0(t G T) die Beziehung vol(<p*(i4)) < vol(^4) bzw vol(y>'(A))=völ(j4)gilt ¦ A: Sei tp in A7.3) ein Cr-Diffeomorphismus (d h.: ip. M —> M ist invertierbar, McRn offen, <p und (p~l sind Cr-glatte Abbildungen) und sei D(p{x) die JACOBI-Matrix von ip in x G M. Dann ist das zeitdiskrete System A7.3) dissipativ, falls | det D(p(x)\ < 1 für alle x G M ist, und konservativ, falls | det Dip(x) \ = 1 in M ist. / —2ax 1 \ ¦ B: Für das System A7.6) ist D(p(x,y) = f , ^ J und damit \detD(p(x,y)\ = \b\ Also ist A7.6) dissipativ, falls \b\ < 1, und konservativ, falls |6| = 1.
17.1 Gewöhnliche Differentialgleichungen und Abbildungen 823 Die HENON-Abbildung läßt sich aus drei Teilabbildungen zusammensetzen (Abb. 17.1): Zunächst wird der Ausgangsbereich durch die Abbildung x' = x,y' = y + 1 — ax2 flächenerhaltend gedehnt und gebogen, dann durch x" — bx'' ,y" = y' in Richtung der rr'-Achse kontrahiert (bei |6| < 1) und abschließend durch die Abbildung x'" = y", y'" = x" an der Geraden y" == x" gespiegelt. -Ph Abbildung 17.1 17.1.1.2 Invariante Mengen 1. a-und w-Grenzmenge, absorbierende Menge Sei {ip^ter ein dynamisches System auf dem metrischen Raum (M, p) Die Menge A C M heißt invariant unter {<£*}, falls ^(A) = A für alle t € T ist, und positiv invariant unter {</?*}, falls ^(A) C A für alle t > 0 aus r ist Für jedes x G M ist die u-Grenzmenge des Orbits durch x die Menge u{x) = {yeM:3{tn}(^L1 CT, tn -> +oo , <ptn(x) -> y für n -» +oo}. A7 7) Die Elemente von u(x) heißen u-Grenzpunkte des Orbits. Liegt ein invertierbares dynamisches System vor, so heißt für jedes x G M die Menge a(x) = {yeM:3 {tn}™=1 C T, tn -? -oo , <ptn{x) ^yiüin^ +cx)} A7 8) a-Grenzmenge des Orbits durch x; die Elemente von a(x) heißen a-Grenzpunkte des Orbits. Die lokale Eigenschaft des Volumenschrumpfens fuhrt bei vielen Systemen zur Existenz einer beschränkten Menge im Phasenraum, in die alle Orbits für wachsende Zeiten gelangen und dort verbleiben Eine beschränkte, offene und zusammenhängende Menge U C M heißt absorbierend bzgl {(pt}t€p, falls ¥>*({/) C U für alle positiven t aus r ist. (U ist die Abschließung von U ) ¦ Gegeben sei in der Ebene das Differentialgleichungssystem ¦2) A7 9a) = rsintf läßt sich die Lösung von A7.9a) mit x = —y + x A - x2 — y2), y = x + y(l — x2 — y Unter Verwendung von Polarkoordinaten x = r cos$, y Anfang (r0, $o) zur Zeit t = 0 in der Form r(t, r0) = [1 + (r0 - 1) e^]/2, tf(*, t?0) = * + ^o A7 9b) schreiben. Aus dieser Lösungsdarstellung folgt, daß der Fluß von A7 9a) einen 27r-periodischen Orbit besitzt, der als 7(A,0)) = {(cost, sin t), t G [0,27r]} dargestellt werden kann. Für die Grenzmengen der Orbits durch p gilt: @,0), a(p) ={7(A,0)), <1, = 1, >1 und u(p) ./7(A,0)), l @,0), P^@,0), P=@,0) Jede offene Kugel Br = {(x, y). x2 -\-y2 < r2} mit r > 1 ist eine absorbierende Menge für A7.9a). 2. Stabilität von invarianten Mengen Sei A eine unter dem dynamischen System {(pl}ter auf {M,p) invariante Menge. Die Menge A heißt stabil, wenn jede Umgebung U von A eine andere Umgebung U\ C U von >l enthält, so daß (pl(Ui) C £/ für alle t > 0 gilt. Die unter {(/?*} invariante Menge A heißt asymptotisch stabil, wenn sie stabil ist und folgende Beziehung gilt: 3 A > ° dtat^t) < A } däst^s). A) —> 0 für < -» +oo A7 10)
824 17. Dynamische Systeme und Chaos Dabei ist dist (sc, A) — inf p(x, y). yzA 3. Kompakte Mengen Sei (M,p) ein metrischer Raum Ein Mengensystem {Ui}iEi aus offenen Mengen heißt offene Überdeckung von M, wenn jeder Punkt aus M in mindestens einem Ui liegt Der metrische Raum (M,p) heißt kompakt, wenn aus jeder offenen Überdeckung {Ui}iei von M endlich viele U^, ., Uir ausgewählt werden können, so daß M = Uix U • • • U Uir ist. Die Menge K C M heißt kompakt, wenn sie als Teilraum kompakt ist . 4. Attraktor, Einzugsgebiet Sei {(p*}ter ein dynamisches System auf (M, p) und A eine unter {</?*} invariante Menge Dann heißt W(A) = {x e M u)(x) C A} Einzugsgebiet von A Eine kompakte Menge A C M heißt Attraktor von {</^}<er auf M , wenn A invariant unter {p1} ist und es eine offene Umgebung U von A gibt, so daß u(x) = A für fast alle (im Sinne des LEBESGUE-Maßes (s 12.9 1, S. 656)) xeU gilt. ¦ A = 7(A,0)) ist ein Attraktor des Flusses von A7.9a) Dabei ist W(A) = R2 \ {@,0)} . Für manche dynamischen Systeme ist ein allgemeinerer Attraktorbegriff sinnvoll. So gibt es invariante Mengen A, die in jeder Umgebung periodische Orbits besitzen, die nicht von A angezogen werden (z B der FEIGENBAUM-Attraktor). Die Menge A muß auch nicht unbedingt durch eine einzige u Grenzmenge aufgespannt werden. Eine kompakte Menge A heißt Attraktor im Sinne von MiLNOR von {pt}ter auf M , wenn 4 invariant unter {ip*} ist und das Einzugsgebiet von A eine Menge mit positivem LEBESGUE-Maß enthält 17.1.2 Qualitative Theorie gewöhnlicher Differentialgleichungen 17.1.2.1 Existenz des Flusses und Phasenraumstruktur 1. Fortsetzbarkeit der Lösungen Neben der Differentialgleichung A7 1), die wir autonom nennen, treten auch Differentialgleichungen auf, deren rechte Seite explizit von der Zeit abhängt und die deshalb nichtautonom heißen: x = f(t,x). A711) Dabei sei /• R x M —*¦ Rn mit der offenen Menge McR" eine Cr-Abbildung. Durch die neue Variable ^n+i : — i läßt sich A7.11) als autonome Differentialgleichung x = f(xn+\,x), xn+i = 1 auf M x R interpretieren Die Lösung von A7.11) mit Anfang x0 zur Zeit t0 wird mit y>(-, £0, xo) bezeichnet Um die globale Existenz der Lösungen und damit die Existenz eines Semiflusses von A7.1) zu zeigen. sind folgende Sätze oft hilfreich 1. Kriterium von Wintner und Conti Ist in A7.1) M = Rn und existiert eine stetige Funktion /•+00 l uj [0, +oo) —? [1, +oo), so daß ||/(x)|| < u (\\x\\) für alle x eTC gilt und ist / —- dr = +oo. so Jo Lü(r) läßt sich jede Lösung von A7.1) auf ganz R+ fortsetzen. ¦ Für das Kriterium von Wintner und Conti sind folgende Funktionen geeignet u(r) = Cr + 1 und u(r) = C r|ln r\ + 1, wobei C > 0 eine Konstante ist. 2. Fort Setzungsprinzip Bleibt eine Lösung von A7.1) für wachsende Zeiten beschränkt, so existiert sie für alle positiven Zeiten und damit auf ganz R+ Voraussetzung: Im weiteren wird stets die Existenz eines Flusses {(p^teR Dzw eines Semiflusses {(ft}teR+ von A^-1) vorausgesetzt. 2. Phasenporträt a) Ist ip(t) eine Lösung von A7.1), so ist mit einer beliebigen Konstanten c die Funktion p(t + c) ebenfalls eine Lösung.
17 1 Gewöhnliche Differentialgleichungen und Abbildungen 825 b) Zwei beliebige Orbits von A7 1) haben keinen gemeinsamen Punkt oder stimmen überein. Der Phasenraum von A7 1) zerfällt also in disjunkte Orbits. Die Zerlegung des Phasenraumes in disjunkte Orbits heißt Phasenporträt. c) Jeder Orbit, verschieden von einer Ruhelage, ist eine reguläre glatte Kurve, die geschlossen oder nicht geschlossen sein kann 3. Satz von Liouville Seien {<^}teR der Fluß von A7 1), D C M C Rn eine beliebige beschränkte und meßbare Menge, Dt : = ^(D) und Vt : = vol(.Dt) das n-dimensionale Volumen von Dt (Abb.17.2a). Dann gilt für Abbildung 17 2 beliebiges t G R die Beziehung — Vt — / divf(x) dx Für n = 3 lautet der Satz von LlOUVlLLE- dt JDt ~diVt = JJJ d^/fai'^,x3)dxi dx2dx3. A7.12) Dt Folgerung: Gilt für A7.1) div/(x) < 0 in M, so ist der Fluß von A7.1) volumenschrumpfend Gilt div/(x) = 0 in M, so ist der Fluß von A7.1) volumenerhaltend (Wegen des Torus T2 in Abb.17.2b s. die Definition des Torus in 17.1.2 3,7., S 830 ) ¦ A: Für das LORENZ-System A7.2) ist div/(x, y, z) = -(er + 1 + b). Wegen o > 0 und b > 0 ist also div/(x, y, z) < 0. Mit dem Satz von LlOUVlLLE folgt für eine beliebige beschränkte und meßbare Menge D C R3 offenbar — Vt = / / / -(a + 1 + b) dxx dx2 cte3 = -(a + 1 + b)Vt. Für die lineare Dt Differentialgleichung Vt = -{a + 1+ b)Vt lautet die Lösung Vt = V0 • e-{a+1+b)t, so daß Vt -+0 für t —» +00 folgt ¦ B: Sei U C Rn x Rn eine offene Teilmenge und H: U —^ R eine C2-Funktion. Dann heißt ±i = f)J-f riM -^—(xiy)i yi — ~~ä—(xiV) (* = 1,2, . , n) HAMiLTONsche Differentialgleichung Die Funktion H oy% 0X{ heißt Hamilton-Funktion des Systems Bezeichnet / die rechte Seite dieser Differentialgleichung, so gilt offenbar pfijj ß^H 1 = 0. HAMiLTONsche Differentialgleichungen sind also dxidyi fay)- dyidxi (x,y) div f(x,y) = £ volumenerhaltend. 17.1.2.2 Lineare Differentialgleichungen 1. Hauptsätze Es sei A(t) = [a»j(*)]?j=i eme Matrix-Funktion auf R, wobei jede Komponente a^: R —? R als stetige Funktion vorausgesetzt wird, und es sei b: R —? Rn eine stetige Vektorfunktion auf R. Dann heißt x = A(t)x + b(t) A7.13a) inhomogene lineare Differentialgleichung erster Ordnung im Rn und x = A(t)x A7 13b)
826 17 Dynamische Systeme und Chaos die zugehörige homogene lineare Differentialgleichung erster Ordnung. 1. Hauptsatz über homogene lineare Differentialgleichungen Jede Lösung von A7 13a) existiert auf ganz R Die Gesamtheit aller Lösungen von A7.13b) bildet einen n-dimensionalen Untervektorraum Lh der C^-glatten Vektorfunktionen über R (Hauptsatz über homogene lineare Differentialgleichungen). 2. Hauptsatz über inhomogene lineare Differentialgleichungen Die Gesamtheit aller Lösungen Li von A7.13a) ist ein n-dimensionaler affiner Unterraum der C^-glatten Vektorfunktionen über R in der Form Li = (p0 + Lh , wobei <po eme beliebige Lösung von A7 13a) ist (Hauptsatz übei inhomogene lineare Differentialgleichungen) Seien y?1}... ,</?n beliebige Lösungen von A7 13b) und $ — [ifi,.. , (pn] die zugehörige Lösungsmatrix Dann genügt 0 auf R der Matrix-Differentialgleichung Z(t) = A(t)Z(t), wobei Z(t) G Rnn ist. Bilden die Lösungen ipu . ,<pn eine Basis von Lh , so heißt $ — [^l) • • • j <Pn] Fundamentalmatrix von A7.13b). Bezüglich einer Lösungsmatrix $ von A7 13b) ist W(t) = det$(t) die WRONSKi-Determinante. Für sie gilt die Formel von Liouville. W(t) = SpA(t) W(t) (teR). A7.13c) Für eine Lösungsmatrix ist W(t) = 0 auf R oder W(t) ^ 0 für alle i€R Das System ipu . , ipn ist also genau dann eine Basis von Lh , wenn det[(ßi(t),..., tpn(t)} i=- 0 für ein t (und damit für alle) ist 3. Satz über die Variation der Konstanten Sei $ eine beliebige Fundamentalmatrix von A7 13b) Dann läßt sich die Lösung (p von A7 13a) mit Anfang p zur Zeit t = r in der Form t <p(t) = ^(^(t)-1 p + / ^(t)^(s)-1 b(s)ds (t G R) A7 13d) T darstellen (Satz über die Variation der Konstanten) 2. Autonome lineare Differentialgleichungen Gegeben sei im Rn die Differentialgleichung x = Ax, A7 14) wobei A eine konstante Matrix vom Typ (n, n) ist Die Operator-Norm (s. auch 12.5.1 1, S. 639) einer Matrix A ist durch ||j4|| = max{||^4x||, x G Rn, ||x|| < 1} gegeben, wobei für die Vektoren des Rn wieder die EuKLiDische Norm vereinbart sei Seien A und B zwei beliebige Matrizen vom Typ (n, n). Dann gilt: a) \\A + B\\ < PH + ||£||, b) \\\A\\ = |A| ||A|| (A € R), (x€R"), d)pß||<P||||ß||, wobei Amax der größte Eigenwert von ATA ist. Die Fundamentalmatrix mit Anfang En zur Zeit t = 0 von A7 14) ist die Matrix-Exponentialfunktion eAt = En + v + — + --- = j:— A715) mit folgenden Eigenschaften j a) Die Reihe für eAt konvergiert bezüglich t auf einem beliebigen kompakten Zeitintervall gleichmäßig und für jedes t absolut; b)||eAi|| <elW (*>0); I c) j^(eAt) = (eAt) = AeAt = eAtA (t G R); d) e(t+s)A = etAesA (S)teR). e) eAt ist für alle t regulär und (eAt)~l — e~At;
17 1 Gewöhnliche Differentialgleichungen und Abbildungen 827 f) sind A und B kommutative Matrizen vom Typ (n, n), d h. gilt AB = BA, so ist B eA = eA B und eA+B=eAeB^ g) sind ,4 und B Matrizen vom Typ (n, n) und ist Z? regulär, so ist eBAB~ = B eA B~l. 3. Lineare Differentialgleichungen mit periodischen Koeffizienten Betrachtet wird die homogene lineare Differentialgleichung A7.13b), wobei A(t) = [a»j(£)]?j=i eme ^_ periodische Matrix-Funktion ist, d.h , es gilt a^(£) = Oy (t + T) (\/t G R, z, j = 1, . , n) In diesem Falle nennt man A7 13b) eine lineare T-periodische Differentialgleichung. Dann läßt sich jede Fundamentalmatrix # von A7.13b) in der Form $(i) = G(t)etR darstellen, wobei G(t) eine glatte, reguläre T-periodische Matrix-Funktion ist und R eine konstante Matrix vom Typ (n, n) darstellt (Satz von Floquet) Sei $(t) die bei t = 0 normierte Fundamentalmatrix ($@) = En) der T-periodischen Differentialgleichung A7.13b) und <P(t) = G(t)etR eine Darstellung laut Satz von Floquet. Die Matrix <P(T) = eRT heißt Monodromie-Matrix von A7.13b); die Eigenwerte pj von <P(T) sind die Multiplikatoren von A7 13b). Eine Zahl p G C ist genau dann Multiplikator von A7 13b), wenn es eine Lösung tp jk 0 von A7 13b) gibt, so daß <p(t + T) = pip(t) (t G R) gilt 17.1.2.3 Stabilitätstheorie 1. Lyapunov-Stabilität und orbitale Stabilität Betrachtet wird die nichtautonome Differentialgleichung A7.11). Die Lösung ip(t, t0,Xo) von A7.11) heißt LYAPUNOV-stabil, wenn gilt- \\Xl-Uh^xQ)\\<ö\ MMi,*i)-^(Mo,*o)||<£ \/t > h A7.16a) Die Lösung y?(i, £0, x0) heißt asymptotisch stabil im Sinne von LYAPUNOV, wenn sie stabil ist und gilt. für t -> +00 A7 16b) Für die autonome Differentialgleichung A7.1) läßt sich neben der LYAPUNOV-Stabilität der Lösungen auch die orbitale Stabilität betrachten. Die Lösung <p(t,Xo) von A7.1) heißt orbital stabil (asymptotisch orbital stabil), wenn der Orbit 7B:0) — {^(^^0), t G R} stabil (asymptotisch stabil) im Sinne einer invarianten Menge ist. Eine Lösung von A7 1), die eine Ruhelage repräsentiert, ist genau dann LYAPUNOV-stabil, wenn sie orbital stabil ist. Schon für periodische Lösungen von A7.1) können sich beide Stabilitätsarten unterscheiden ¦ Gegeben sei ein Fluß in R3 , der den Torus T2 als invariante Menge besitzt. Lokal sei in Winkelkoordinaten der Fluß beschrieben durch ©1 = 0, <92 = /2F>i), wobei f2: R —> R eine 27r-periodische glatte Funktion sei, für die gilt: V6>! G R 3 U&1 (Umgebung vonöi) V<$i, <52 € U0l 1. , (x , , , fx , 6,^62 j-hW^hW- Eine beliebige Lösung mit Anfang (<9i@), <92@)) auf dem Torus ist gegeben durch 0i(*)es0i(O), ö2(*) = ö2(O) + /2@i(O))t (teR). An dieser Darstellung erkennt man, daß jede Lösung orbital stabil ist, aber nicht LYAPUNOV-stabil (s. Abb.17.2b, S. 825)- Sind die Anfangswerte zweier Integralkurven auf dem Torus nahe zu einander, so bleiben auch deren Orbits nahe zu einander, nicht aber die jeweils zum gleichen Zeitpunkt betrachteten Punkte der Integralkurven (s. [17.15]) 2. Satz von Lyapunov über asymptotische Stabilität Eine skalarwertige Funktion V heißt positiv definit in einer Umgebung U des Punktes p G M C Rn , wenn gilt:
828 17. Dynamische Systeme und Chaos 1. V: U C M -> R ist stetig. 2. V(x) > 0 für alle xeU\{p} und V(p) = 0 . Sei U C M eine offene Teilmenge und V U —> R eine stetige Funktion. Die Funktion V heißt LYAPUNOV-Fwn^zon von A7.1) in U , falls V(<p(t)) für wachsende £ nicht wächst, solange für die Lösung <p(t) € U gilt. Sei V. U —? R eine LYAPUNOV-Funktion von A7 1) und sei V positiv definit in einer Umgebung U von p Dann ist p stabil Gilt außerdem, daß aus V((p(t,x0)) = const (t > 0) für eine Lösung (p von A7.1) mit tp(t,x) EU (t > 0) immer <p(£,aJo) = P folgt, so ist die Ruhelage p sogar asymptotisch stabil. ¦ Der Punkt @,0) ist Ruhelage der ebenen Differentialgleichung x = y, y = — x — x2y Mit V(x, y) = x2 + y2 liegt eine Funktion vor, die positiv definit in jeder Umgebung von @,0) ist und für deren Ableitung entlang einer beliebigen Lösung —V{x(t),y(t)) = -2x(tJy(tJ < 0 für x(t)y(t) ^ 0 gilt. Also dt ist @,0) asymptotisch stabil 3. Klassifizierung und Stabilität der Ruhelagen Sei #0 eine Ruhelage von A7.1) Das lokale Verhalten der Orbits von A7 1) nahe x0 wird, unter gewissen Voraussetzungen, durch die Variationsgleichung y = D f(x0)y beschrieben, wobei Df(xo) die Jacobi- Matrix von / in Xq ist Besitzt Df(xo) keinen Eigenwert Xj mit Re A; = 0, so heißt die Ruhelage xo hyperbolisch. Die hyperbolische Ruhelage x0 ist vom Typ (m, k), wenn Df(x0) genau m Eigenwerte mit negativem Realteil und k = n — m Eigenwerte mit positivem Realteil besitzt Die hyperbolische Ruhelage vom Typ (m, k) heißt Senke, wenn m = n ist, Quelle, wenn k — n ist, und Sattel, wenn m ^ 0 und/c^0ist (Abb.17.3). Typ der Ruhelage Eigenwerte der JACOBI-Matrix Phasenporträt Senke • • jf Quelle • • ¥ Sattelpunkt • • # Abbildung 17.3 Eine Senke ist asymptotisch stabil; Quellen und Sattel sind instabil (Satz über Stabilität in der ersten Näherung). Im Rahmen der drei topologischen Grundtypen von hyperbolischen Ruhelagen (Senke, Quelle und Sattelpunkte) sind weitere algebraische Unterscheidungen üblich So heißt eine Senke (Quelle) stabiler Knoten(instabiler Knoten), wenn alle Eigenwerte der JACOBI-Matrix reell sind, und stabiler Strudel (instabiler Strudel), wenn Eigenwerte mit nicht verschwindendem Imaginärteil vorliegen Für n = 3 ergibt sich daraus eine Einteilung der Sattelpunkte in Sattelknoten undSattelstrudel. 4. Stabilität periodischer Orbits Sei (p(t,xo) eine T-periodische Lösung von A7.1) und 7B:0) = {<£(*> #o), t € [0, T]} ihr Orbit. Das Phasenporträt nahe 7B:0) wird, unter gewissen Voraussetzungen, durch die Variationsgleichung y = D f(ip(t,Xo))y beschrieben. Da A(t) = D f((p(t,x0)) eine T-periodische stetige Matrixfunktion vom Typ (n,n) ist, folgt aus dem Satz von Floquet, daß die bei t = 0 normierte Fundamentalmatrix <PX0 (t) der Variationsgleichung als <PX0 (t) = G(t)eRt darstellbar ist, wobei G eine T-periodische reguläre glatte Matrixfunktion mit G(Ö) — En ist und R eine konstante Matrix vom Typ (n, n) darstellt, die nicht eindeutig festliegt Die Matrix $x>(T) = eRT heißt Monodromie-Matrix des periodischen Orbits 7B:0), die Eigenwerte p\, ,pn von eR* sind die Multiplikatoren des periodischen Orbits 7B:0) Wird der Orbit 7B:0) durch eine andere Lösung tp(t,xi) repräsentiert, d.h., ist 7B:0) = 7B:1), so stimmen
17.1 Gewöhnliche Differentialgleichungen und Abbildungen 829 die Multiplikatoren von 7B:0) und 7(^1) überein. Einer der Multiplikatoren eines periodischen Orbits ist immer gleich Eins (Satz von Andronov-Witt). Seien pi,..., pn-\,pn — 1 die Multiplikatoren des periodischen Orbits 7B:0), und sei $XQ(T) die Mono- dromie-Matrix von 7(.t0) . Dann gilt X> = Sp<MT)und ft PJ = det<PXo(T) = efoSVDf^x^dt j=i j=i = efodWf{v(t,Xo))dt (ll\7) Ist also n = 2 , so ist p2 = 1 und Pl = eIod^f(^ *<>)) dt ¦ Sei (p(t, A,0)) = (cos£, sint) eine 27r-periodische Lösung von A7.9a). Die Matrix A(t) der Variationsgleichung lautet a/_l\ i^tf /j. /1 n\w ( — 2cos2£ —1 — sin2t ^) = D/MMi,o)))=^_sin2f _2sin2i Die bei t = 0 normierte Fundamentalmatrix #(i,o)(£) ist fh i+\ — (e~2tcost — sinA _ fcost — smt\ (e~2t 0\ ^0)(t)-ye-2ts[nt cost)-{s[nt COSt){ 0 lj' wobei das letzte Produkt eine FLOQUET-Darstellung von $(i>0)(£) darstellt Also ist p\ = e~4n und p2 = 1 Die Multiplikatoren lassen sich auch ohne FLOQUET-Darstellung bestimmen Für System A7 9a) ist div/(x,y) = 2 — Ax2 — 4y2 Damit ergibt sich div/(cos£,smt) = —2 Nach obiger Formel ist pi = eSon~2dt = e~4n . 5. Klassifizierung periodischer Orbits Hat der periodische Orbit 7 von A7 1) außer pn = 1 keinen weiteren Multiplikator auf dem komplexen Einheitskreis, so heißt 7 hyperbolisch Der hyperbolische periodische Orbit heißt vom Typ (m, k), wenn m Multiplikatoren innerhalb und k = n — 1 Multiplikatoren außerhalb des Einheitskreises liegen. Ist m > 0 und k > 0, so heißt der periodische Orbit vom Typ (m, k) sattelartig Nach einem Satz von ANDRONOV und Witt ist ein hyperbolischer periodischer Orbit 7 von A7 1) vom Typ (n — 1,0) asymptotisch stabil. Hyperbolische periodische Orbits vom Typ (m, k) mit k > 0 sind instabil ¦ A: Ein periodischer Orbit 7 = {(p(t), t € [0, T}} in der Ebene mit den Multiplikatoren p\ und pi = 1 ist asymptotisch stabil, wenn M < 1, d.h. wenn tf divf(<p(t)) dt < 0 ist. ¦ B: Liegt außer pn = 1 noch ein weiterer Multiplikator auf dem komplexen Einheitskreis, so ist der Satz von Andronov-Witt nicht anwendbar Zur Stabilitätsanalyse des periodischen Orbits reichen die Informationen über die Multiplikatoren nicht aus. ¦ C: Als Beispiel sei das ebene System x = — y + x f(x2 4- y2), ,y = x + y f(x2 + y2) mit der glatten Funktion / @, +00) —> R gegeben, die zusätzlich den Eigenschaften /(l) = f'(l) = 0 und f(r)(r — 1) < 0 für alle r / l,r > 0, genügt. Offenbar ist (p(t) = (cost,sint) eine 27r-periodische Lösung des betrachteten Systems und #(i,o) (t) — ( • / / ) ( 0 1 ) die FLOQUET-Darstellung der Fundamentalmatrix. Aus ihr erkennt man, daß p\ = p2 = 1 ist. Die Verwendung von Polarkoordinaten führt zum System r = rf(r2), $ = 1 Aus dieser Darstellung folgt sofort, daß der periodische Orbit 7(A,0)) asymptotisch stabil ist 6. Eigenschaften von Grenzmengen, Grenzzyklen Die in 17.1.1.2, S. 823 definierten a- und u;-Grenzmengen besitzen für den Fluß der Differentialgleichung A7 1) mit McRn die folgenden Eigenschaften. Sei x G M ein beliebiger Punkt Dann gilt a) Die Mengen a(x) und u)(x) sind abgeschlossen ; b) Ist 7+(x) bzw j~(x) beschränkt, so ist u(x) ^ 0 bzw. a(x) ^ 0. Außerdem ist u(x) bzw a(x) in
830 17. Dynamische Systeme und Chaos diesem Fall invariant unter dem Fluß von A7 1) und zusammenhängend ¦ Ist z B 7+(x) unbeschränkt, dann mußa;(x) nicht unbedingt zusammenhängend sein (Abb.17.4a) (®1h a) I = b) Abbildung 17 4 Für eine ebene autonome Differentialgleichung A7 1) (d h McR2) gilt der Satz von Poincare—Bendixson: Sei ip(-,p) eine nicht periodische Lösung von A7.1), für die 7+(p) beschränkt ist. Enthält uj(p) keine Ruhelagen von A7 1), so ist u(p) ein periodischer Orbit von A7 1) Für autonome Differentialgleichungen in der Ebene sind also Attraktoren, die komplizierter als eine Ruhelage oder ein periodischer Orbit sind, nicht möglich Ein periodischer Orbit 7 von A7 1) heißt Grenzzyklus, wenn es ein x ^ 7 gibt, so daß entweder 7 C w(i) oder 7 C a(i) gilt Ein Grenzzyklus heißt stabiler Grenzzyklus,wenn eine Umgebung U von 7 existiert. so daß 7 = u(x) für alle x G U ist, und instabiler Grenzzyklus, wenn eine Umgebung U von 7 existiert, so daß 7 = a(x) für alle x G U ist. ¦ A: Für den Fluß von A7 9a) gilt für den periodischen Orbit 7 = {(cost,sint),t G [0,27r)} die Eigenschaft 7 = u(p) für alle p ^ @,0). Also ist U = R2\{@,0)} eine Umgebung von 7, mit der 7 zum stabilen Grenzzyklus wird (Abb. 17.4b) ¦ B: Für die lineare Differentialgleichung x — —y, y = x ist dagegen 7 = {(cost, sint),t G [0,27r]} ein periodischer Orbit, aber kein Grenzzyklus (Abb. 17.4c). 7. m—dimensionale eingebettete Tori als invariante Mengen Eine Differentialgleichung A7 1) kann einen m-dimensionalen Torus als invariante Menge besitzen. Ein in den Phasenraum McRn eingebetteter m-dimensionaler Torus Tm wird durch eine differenzierbare Abbildung g: Rm —? Rn, die als Funktion (G\,. ., Gm) t—> g(Gi,.. , Gm) in jeder Koordinate ßi als 27T-periodisch vorausgesetzt wird, definiert (Abb. 17.2b, S. 825). ¦ In einfachen Fällen läßt sich die Bewegung des Systems A7.1) auf dem Torus in Winkelkoordinaten durch die Differentialgleichungen Q{ — Ui (i = 1,2,..., m) beschreiben Die Lösung dieses Systems mit Anfang @i@), . , <9m@)) zur Zeit t = 0 ist G^t) = corf + 6^@) (z = l,2, . ,m,t€R) Eine stetige Funktion / R —> Rn heißt quasiperiodisch, wenn / eine Darstellung in der Form f(t) - g(cüit, uj2t,. ., unt), wobei g wieder wie oben eine differenzierbare Funktion, die 27r-periodisch in jeder Komponente ist, besitzt und die Frequenzen U{ inkommensurabel sind, d.h. es keine ganzen Zahlen ni n mit J2 n\ > 0 gibt, so daß n\U\ + h nnun = 0 ist. 17.1.2.4 Invariante Mannigfaltigkeiten 1. Definition, Separatrixflächen Sei 7 eine hyperbolische Ruhelage oder ein hyperbolischer periodischer Orbit von A7 1) Die stabile Mannigfaltigkeit Ws{^) (instabile Mannigfaltigkeit ^G)) von 7 ist die Menge aller der Punkte des Phasenraumes, durch die Orbits verlaufen, die für t —> +00 (t —? —00) gegen 7 streben: Ws(>y) = {xeM: u(x) = 7} und Wu{j) = {x G M- a(x) = 7} . A7 18) Stabile bzw instabile Mannigfaltigkeiten bezeichnet man auch als Separatrixflächen ¦ In der Ebene wird die Differentialgleichung x = — x, y = y + x2 A7 19a)
17.1 Gewöhnliche Differentialgleichungen und Abbildungen 831 betrachtet. Die Lösung von A7.19a) mit Anfang (xo, yo) zur Zeit t = 0 ist durch <p(t,x0,y0) = (e-'sö.e'jfc + ^ (e' - e')) A7.19b) explizit gegeben Für die stabile bzw. instabile Mannigfaltigkeit der Ruhelage @,0) von A7.19a) erhält man (s. Abb. 17.5a): x2 VH@,0)) = {{x0lyo): lim p{t,x0,y0) = @,0)} = {(*<,,2/b): Vo + "T = °> > VT(@,0)) = {(zo,3/o): lim </>(*, *o,lfo) = @,0)} = {(x0, J/b): *o = 0, y0 G R} Ws(@,0)) Abbildung 17 5 Es seien M und N zwei glatte Flächen des Rn und LXM bzw. LXN die entsprechenden Tangentialebenen durch x an M bzw. TV. Die Flächen M und TV heißen transversal zueinander, wenn für alle x G M C\N die folgende Beziehung gilt. dim LXM + dim LXN -n = dim (LXM D LxiV). ¦ Für den in Abb. 17.5b dargestellten Schnitt gilt dim LXM = 2, dim LXN = 1 und dim (LXM D LXN) = 0. Also ist der in Abb. 17.5b dargestellte Schnitt transversal. 2. Satz von Hadamard und Perron Wichtige Eigenschaften der Separatrixflächen werden durch den Satz von Hadamard und Perron beschrieben: Sei 7 eine hyperbolische Ruhelage oder ein hyperbolischer periodischer Orbit von A7.1). a) VFSG) und Wu('f) sind verallgemeinerte C-Flächen (d.h. immersierte Cr-Mannigfaltigkeiten), die lokal wie Cr-glatte Elementarflächen aussehen Jeder Orbit von A7.1), der für t —? +oo oder t —> — oo nicht gegen 7 strebt, verläßt eine hinreichend kleine Umgebung von 7 für t —> +00 oder t —> — 00 b) Ist 7 = £0 eine Ruhelage vom Typ (m, k), so sind VKs(x0) und Wu(x0) Flächen der Dimension m bzw. k. Die Fläche Ws(x0) bzw VKu(xo) tangiert in xo den stabilen Untervektorraum Es = {yeRn: eDf{xo)ty -? 0 für t -? +00} von £ = Df(x0)y A7.20a) bzw. den instabilen Untervektorraum Eu = {yeTin: eDf{xo)ty - 0 für i -? -00} von y = D/(a;o)y. A7.20b) c) Ist 7 ein hyperbolischer periodischer Orbit vom Typ (m, k), so sind Ws(i) und ^G) Flächen der Dimension m + 1 bzw. fc + 1, die sich längs 7 transversal schneiden (Abb. 17.6a) ¦ A: Für die Bestimmung einer lokalen stabilen Mannigfaltigkeit der Ruhelage @,0) der Differentialgleichung A7.19a) wird der folgende Ansatz benutzt: Wtoc(@,0)) = {(x,y): y = h(x),\x\ < A,/i: (-A,A) -? R differenzierbar}. Sei {x(t),y{t)) eine Lösung von A7.19a), die in W£c(@,0)) liegt. Aufgrund der Invarianz für zu t benachbarten Zeiten s ergibt sich y(s) = h(x(s)). Durch Differentiation und Darstellung von x und y über das System A7.19a) ergibt sich für die unbekannte Funktion h(x) das Anfangswertproblem h'(x)(—x) = h(x)+x2, h@) = 0. Über den Reihenansatz h(x) = —x2 + —xs H , in dem h'@) = 0 beachtet wurde, ergibt sich durch Einsetzen und Koeffizientenvergleich a<i — —2/3 und a^ = 0 für k > 3.
832 17. Dynamische Systeme und Chaos ¦ B: Für das System x = -y + x(l - x2 - y2), y = x + y(l - x2 - y2), z = az A7 21) mit einem Parameter a > 0 ist 7 = {(cost, sint, 0), t € [0, 2n]} ein periodischer Orbit mit den Multiplikatoren pi = e-47r, p2 = ea2n und p3 = 1. In Zylinderkoordinaten x = r cos $,y = rsin,#,2: = 2: hat die Lösung von A7 21) mit Anfang (r0, $o, -^o) zur Zeit t = 0 die Darstellung (r(t,r0), #(£,#0) > eQ*2;o), wobei r(£,ro) und ^(t^o) die Lösung von A7 9a) in Polarkoordinaten ist. Damit ist Ws(<y) = {(x,y,z)- z = 0} \ {@,0,0)} und Wu(~i) = {(x,y,z): x2 + y2 = 1} (Zylinder) Die beiden Separatrixflächen sind in Abb. 17.6b zu sehen. Abbildung 17 6 3. Lokale Phasenporträts nahe Ruhelagen für n = 3 Wir betrachten die Differentialgleichung A7.1) mit der hyperbolischen Ruhelage 0 für n = 3 Sei A = Df@) und det[A£—A] = \3+p\2+q\+r das charakteristische Polynom von A Mit den Bezeichnungen S — pq — r und A = — p2q2+4p3r+4q3 — 18pqr + 27r2 (Diskriminante des charakteristischen Polynoms) sind die verschiedenen Ruhelagetypen in Tabellel7.1 aufgeführt. 4. Homokline und heterokline Orbits Es seien 71 und 72 zwei hyperbolische Ruhelagen oder periodische Orbits von A7.1) Die Separatrixflächen VFsGi) und Wu(j2) können sich schneiden Der Schnitt besteht dann aus ganzen Orbits. Für zwei Ruhelagen oder periodische Orbits heißt jeder Orbit 7 C WsGi) fl Wu(^2) heteroklin, falls 71 ^ 72 ist (Abb.17.7a). und homoklin, falls 71 = 72 Homokline Orbits von Ruhelagen heißen auch Separatrixschleifen (Abb. 17.7b). Abbildung 17 7 ¦ Das LORENZ-System A7 2) wird bei festen Parametern o — 10,6 = | und veränderlichem r betrachtet Die Ruhelage @,0,0) von A7 2) ist für 1 < r < 13,926... ein Sattel, der durch eine zweidimensionale stabile Mannigfaltigkeit Ws und eine eindimensionale instabile Mannigfaltigkeit Wu charakterisiert wird. Bei r = 13,926 .. bilden sich in @,0,0) zwei Separatrixschleifen, d.h., die beiden Aste der instabilen Mannigfaltigkeit kehren für t —> +00 über die stabile Mannigfaltigkeit in den Ursprung zurück (s. [17.14], [17.22]).
17 1 Gewöhnliche Differentialgleichungen und Abbildungen 833 Tabelle 17.1 Ruhelagetypen im dreidimensionalen Phasenraum Parameterbereich £>0; g>0,r >0 A A<0 A>0 Typ der Ruhelage Stabiler Knoten Stabiler Strudel Nullstellen des char. Polynoms Im Xj = 0 A7 <0, j = 1,2,3 ReAiJ <0 A3<0 Dimension von Ws bzw Wu dimWs = 3, d\mWu = 0 A<0 A>0 Parameterbereich <5<0; r <0, g >0 A A<0 A>0 Typ der Ruhelage Instabiler Knoten Instabiler Strudel Nullstellen des char. Polynoms ImAj = 0 A7 >0, j = 1,2,3 ReAi,2 > 0 A3>0 Dimension von Ws hzvt.Wu dimW = 0, d\mWu = 3 A<0- A>0: Parameterbereich ö>Q;r <0, q<0 oder r < 0 , q > 0 A A<0 A>0 Typ der Ruhelage Sattelknoten Sattelstrudel Nullstellen des char. Polynoms ImAj = 0 Ai,2 < 0, A3 > 0 ReAi,2 < 0 A3>0 Dimension von Ws bzw.Wu dimW* = 2, d\mWu = 1 A<0 A>0: Parameterbereich S <0; r >0, g<0 oder r > 0 , q > 0 A A<0 A>0 Typ der Ruhelage Sattelknoten Sattelstrudel Nullstellen des char. Polynoms ImXj = 0 Ai,2 > 0, A3 < 0 ReAi 2 > 0 A3'<0 Dimension von Ws bzw.Wu dimWs = l,dimW/u = 2 A<0. 't* f*L± A>0: T7T
834 17. Dynamische Systeme und Chaos 17.1.2.5 Poincare-Abbildung 1. Poincare-Abbildung für autonome Differentialgleichungen Sei 7 = {(p(t,xo), t G [0, T]} ein T-periodischer Orbit von A7.1) und E eine (n — l)-dimensionale glatte Hyperfläche, die in x0 den Orbit 7 transversal schneidet (Abb.17.8a). periodischer Orbit Abbildung 17 8 Dann gibt es eine Umgebung U von xq und eine glatte Punktion r : U —> R mit t(x0) = T und ip(r{x),x) G E für alle x G U. Die Abbildung P- U D E -+ E mit P(x) = y?(r(x),x) heißt PoiN- CARE-Abbildung für 7 in x0 Ist die rechte Seite / von A7 1) r-mal stetig differenzierbar, so ist P ebenfalls so oft differenzierbar. Die Eigenwerte der JACOBI-Matrix DP(xq) sind die Multiplikatoren /0i,. ., pn-i des periodischen Orbits, hängen also nicht von der Wahl des Xq auf 7 und der Wahl der transversalen Fläche ab Der PoiNCARE-Abbildung kann ein System A7.3) in M = U zugeordnet werden, das erklärt ist, solange die Bildpunkte in U bleiben. Den Ruhelagen dieses zeitdiskreten Systems entsprechen periodische Orbits von A7.1), und der Stabilität dieser Ruhelagen entspricht die Stabilität der periodischen Orbits von A7.1). ¦ Für das System A7.9a) wird in Polarkoordinaten die transversale Hyperebene ST = {(r,'d):r >0,tf = tf0} betrachtet Für diese Ebene kann U = £ gewählt werden. Offenbar ist r(r) = 2tt (Vr > 0) und damit P(r) = [1 + (r - 1) e7r]-1/2, wobei die Lösungsdarstellung von A7 9a) genutzt wurde Es gilt weiter P(E) = E> -P(l) = 1 und P'(l) = e-47r < 1 2. Poincare-Abbildung für nicht autonome zeitperiodische Differentialgleichungen Eine nichtautonome Differentialgleichung A7.11), deren rechte Seite / bzgl. t die Periode T besitzt, d h , für die f(t + T, x) = f(t, i)VtGR, Vx e M gilt, wird interpretiert als autonome Differentialgleichung x = f(s. x), s = 1 mit zylindrischem Phasenraum M x {s mod T} Sei s0 G {s mod T} beliebig Dann ist E = M x {50} eine transversale Ebene (Abb. 17.8b) Die PoiNCARe-Abbildung ist global als P E —> E über xo 1—>• ip(so + T, sq, xo) gegeben, wobei <p(t, s0, x0) die Lösung von A7 11) mit Anfang xq zur Zeit So ist. 17.1.2.6 Topologische Äquivalenz von Differentialgleichungen 1. Definition Gegeben sei neben A7 1) mit dem zugehörigen Fluß {y'}t€R eme weitere autonome Differentialgleichung x = g(x), A7.22) wobei g: N —+ Rn eine auf der offenen Menge iVcRn gegebene Cr-Abbildung ist. Der Fluß {ipl}teR von A7 22) möge ebenfalls existieren Die Differentialgleichungen A7.1) und A7 22) (bzw. deren Flüsse) heißen topologisch äquivalent wenn es einen Homöomorphismus h • M —? N gibt, (d.h., h ist bijektiv, h und h~l sind stetig), der die Orbits von A7 1) in Orbits von A7 22) unter Beibehaltung der Orientierung, aber nicht unbedingt der
17 1 Gewöhnliche Differentialgleichungen und Abbildungen 835 Parametrisierung überführt Die Systeme A7.1) und A7 22) sind also topologisch äquivalent, wenn es neben dem Homöomorphismus h' M —> N eine stetige Abbildung r RxM^R gibt, die bei jedem fixierten x € M streng monoton wachsend ist, R auf R abbildet, für die r@, x) = 0 für alle x G M ist und die der Beziehung h((pl(x)) = ißT^t,x\h(x)) für alle iGM und teR genügt. Bei topologischer Äquivalenz gehen Ruhelagen von A7.1) in Ruhelagen von A7.22) und periodische Orbits von A7 1) in periodische Orbits von A7.22) über, wobei die Perioden nicht unbedingt übereinstimmen. Sind also zwei Systeme A7.1) und A7.22) topologisch äquivalent, so stimmt die topologische Struktur der Zerlegung des Phasenraumes in Orbits überein Sind zwei Systeme A7 1) und A7 22) topologisch äquivalent über den Homöomorphismus h M —> N und erhält h sogar die Parametrisierung, d h . gilt h{ipt{x)) = ^(h^)) W, x , so heißen A7.1) und A7.22) topologisch konjugiert. Topologische Äquivalenz bzw. Konjugiertheit kann sich auch auf Teilmengen der Phasenräume M und JV beziehen. Ist z B. A7 1) auf Ux C M und A7.22) auf U2 C N definiert, so heißt A7.1) aufUi topologisch äquivalent zu A7 22) aufU2, wenn ein Homöomorphismus h: U\ —* U2 existiert, der die Schnitte der Orbits von A7 1) mit U\ in Schnitte der Orbits von A7 22) mit U2 unter Beibehaltung der Orientierung überführt. ¦ A: Homöomorphismen für A7 1) und A7.22) sind Abbildungen, bei denen z.B. Strecken und Stauchen der Orbits erlaubt ist, Aufschneiden und Schließen der Orbits dagegen nicht. Die zu den Phasenporträts von Abb.17.9a und Abb.17.9b gehörenden Flüsse sind topologisch äquivalent; die zu Abb.17.9a und Abb.17.9c gehörenden Flüsse dagegen nicht. Abbildung 17 9 ¦ B: Gegeben seien die beiden linearen ebenen Differentialgleichungen (s. [17.19]) x = Ax und x = Bx mit A = l _„ _. 1 und B = [ n _o) Die Phasenporträts dieser Systeme nahe @,0) sind in Abb.17.10a bzw. Abb.17.10b zu sehen Der Homöomorphismus h. R2 —? R2 mit h(x) = Rx, wobei R = —j= ( . , ] ist, und die Funktion r . R x R2 —> R mit r{t,x) = | t überführen die Orbits des ersten Systems in Orbits des zweiten Systems, so daß eine topologische Äquivalenz vorliegt. b) jr xi Abbildung 17 10 2. Satz von Grobman und Hartman Sei p eine hyperbolische Ruhelage von A7.1). Dann ist die Differentialgleichung A7 1) nahe p topologisch äquivalent zu ihrer Linearisierung y = Df(p)y.
836 17. Dynamische Systeme und Chaos 17.1.3 Zeit diskret e dynamische Systeme 17.1.3.1 Ruhelagen, periodische Orbits und Grenzmengen 1. Typen der Ruhelagen Es sei x0 eine Ruhelage von A7.3) mit M C Rn. Das lokale Verhalten der Iteration A7.3) nahe x0 wird, unter gewissen Voraussetzungen, durch die Variationsgleichung yt+i = D(p(x0)yt, t G T, bestimmt Besitzt Dip(xo) keinen Eigenwert Xi mit |Aj| = 1, so heißt die Ruhelage Xo , analog zum Differentialgleichungfall, hyperbolisch. Die hyperbolische Ruhelage xq ist vom Typ (m, k), wenn Df(xo) genau m Eigenwerte innerhalb und k = n — m Eigenwerte außerhalb des komplexen Einheitskreises besitzt Die hyperbolische Ruhelage vom Typ (m, k) heißt für m = n Senke, für k = n Quelle und für m > 0 und k > 0 Sattel. Eine Senke ist asymptotisch stabil; Quellen und Sattel sind instabil (Satz über Stabilität in der ersten Näherung für zeitdiskrete Systeme). 2. Periodische Orbits Sei 7B:0) = {<Pk(xo), k = 0, • • •, T - 1} ein T-periodischer Orbit (T > 2) von A7 3). Dann heißt 7B:0) hyperbolisch, wenn xo eine hyperbolische Ruhelage der Abbildung ipT ist. Die Matrix D(pT(xo) = D(p(ipT~l(xo)) • • • D(f(x0) heißt Monodromie-M&tnx, die Eigenwerte p{ von D(pT(x0) sind die Multiplikatoren von 7B:0) • Sind alle Multiplikatoren pi von 7B:0) vom Betrag kleiner 1, so ist der periodische Orbit 7B:0) asymptotisch stabil. 3. Eigenschaften der u;-Grenzmenge Jede u;-Grenzmenge uj(x) von A7.3) mit M = Rn ist abgeschlossen, und es gilt u(<p(x)) = u(x) Ist der Semiorbit j+(x) beschränkt, so ist uj(x) ^ 0 und u(x) ist invariant unter ip. Analoge Eigenschaften gelten für a-Grenzmengen. ¦ Gegeben sei auf R die Differenzengleichung xt+\ = —xti t = 0, ±1, • • •, mit (p(x) = —x Offenbar sind für x = 1 die Beziehungen cjA) = {1, —1}, cü((p(l)) = u(—1) = u(l), und ip(u(\)) = u(l) erfüllt Zu beachten ist, daß u(l), im Unterschied zum Differentialgleichungsfall, nicht zusammenhängend ist 17.1.3.2 Invariante Mannigfaltigkeiten 1. Separatrixflächen Sei x0 eine Ruhelage von A7.3). Dann heißt Ws(x0) = {y G M: (pl{y) —? 2:0 für i —> +00} stabile Mannigfaltigkeit und Wu(xo) = {y G M: <pl(y) —> 2:0 für i —> —00} instabile Mannigfaltigkeit von x0 Stabile und instabile Mannigfaltigkeiten heißen auch Separatrixflächen 2. Satz von Hadamard und Perron Der Satz von Hadamard und Perron für zeitdiskrete Systeme in M c Rn beschreibt Eigenschaften der Separatrixflächen: Ist Xo eine hyperbolische Ruhelage von A7.3) vom Typ (m, k), so sind Ws(x0) und Wu(xo) verallgemeinerte Cr-glatte Flächen der Dimension m bzw. k, die lokal wie Cr-glatte Elementarflächen aussehen Die Orbits von A7 3), die für i —> +00 oder i —*• — od nicht gegen x0 streben, verlassen hinreichend kleine Umgebungen von 2:0 für i —? +00 oder i —? — 00. Die Fläche Ws(xo) bzw. Wu(xq) tangiert in x0 den stabilen Untervektorraum Es = {y G Rn : [D(p(x0)]1 y —? 0 für i -^ —00} von yi+i = Dip(xo)yi bzw. den instabilen Untervektorraum Eu = {y G Rn : [D(p(xo)]ly —> 0 für i —> —00} . ¦ Es wird das folgende zeitdiskrete dynamische System aus der Familie der HENON-Abbildungen betrachtet* xi+1 = x] + yt - 2, yi+1 =xuieZ. A7 23) Die beiden hyperbolischen Ruhelagen von A7.23) sind Px = (y/2, \/2) und P2 = (--\/2, -y/2). Bestimmung der lokalen stabilen und instabilen Mannigfaltigkeiten von P\: Mit der Variablentransformation X* = f j + \/2, Vi = Vi + V% geht A7.23) in das System &+1 = t£ + 2\/2 ^ + 77*, ryi+i = ^ mit
111 Gewöhnliche Differentialgleichungen und Abbildungen 837 der Ruhelage @,0) über. Den Eigenwerten Ai>2 = V^ ± y/3 der JACOBI-Matrix Df (@,0)) entsprechen die Eigenvektoren a\ = (y/2 4- >/3,1) bzw a2 = (y/2 — >/3,1), so daß i?s = {ta2, tGR} und £" = {taut e R} ist. Indem Ansatz W£c(@,0)) = {(£,//) V = /?@> Ifl < A^- (~A>A) ~> R differenzierbar} wird ß als Potenzreihe /3(f) = (yfi-y/2)£+k£2 + - • • gesucht. Aus (&, r/0 G W^c(@,0)) folgt (&+i, 7/t+i) £ W£c(@j 0)) • Dies führt zu einer Bestimmungsgleichung für die Koeffizienten der Zerlegung von ß, wobei A; < 0 ist. Der prinzipielle Verlauf der stabilen und instabilen Mannigfaltigkeit ist in Abb.17.lla zu sehen (s [17 13]). Abbildung 17 11 3. Transversale homokline Punkte Die Separatrixflächen Ws(x0) und Wu(x0) einer hyperbolischen Ruhelage x0 von A7.3) können sich schneiden Ist der Schnitt Ws(xo) D Wu(x0) transversal, so heißt jeder Punkt y G Ws(xo) n Wu(x0) transversaler homokliner Punkt Dabei gilt* Ist y transversaler homokliner Punkt, so besteht der Orbit {<pl(y)} des invertierbaren Systems A7 3) nur aus transversalen homoklinen Punkten (Abb. 17.IIb). 17.1.3.3 Topologische Konjugiertheit von zeitdiskreten Systemen 1. Definition Gegeben sei neben A7 3) ein weiteres zeitdiskretes System xt+i = 1>(xt) A7.24) mit iß: N —> N, wobei N cKn eine beliebige Menge und tp stetig ist (M und N können auch allgemein metrische Räume sein) Die zeitdiskreten Systeme A7.3) und A7 24) (bzw. die Abbildungen </? und ijj) heißen topologisch konjugiert, wenn ein Homöomorphismus (konjugierender Homöomorphismus) h M —? N existiert, so daß (p = h~l o ip o h ist Sind A7.3) und A7.24) topologisch konjugiert, so überfuhrt der konjugierende Homöomorphismus h die Orbits von A7.3) in Orbits von A7.24) 2. Satz von Grobman und Hartman Ist <p in A7.3) ein Diffeomorphismus (/?: Rn —> Rn,x0 eine hyperbolische Ruhelage von A7.3), so ist A7 3) nahe x0 topologisch konjugiert zur Linearisierung yt+i = Dtp(xo)yt ¦ 17.1.4 Strukturelle Stabilität (Robustheit) 17.1.4.1 Strukturstabile Differentialgleichungen 1. Definition Die Differentialgleichung A7 1), d h das Vektorfeld /: M —? Rn , heißt strukturstabil (oder robust), wenn bei kleinen Störungen von / topologisch äquivalente Differentialgleichungen entstehen Die präzise Definition der Strukturstabilität erfordert einen Abstandsbegriff zwischen zwei Vektorfeldern auf M . ! Wir beschränken uns auf die Betrachtung solcher glatter Vektorfelder auf M , die alle eine feste offene, j beschränkte und zusammenhängende Menge U C M als absorbierende Menge besitzen. Der Rand dU | von U sei eine glatte (n — l)-dimensionale Hyperfläche und sei darstellbar als dU = {x G Rn h(x) =
838 17. Dynamische Systeme und Chaos 0} , wobei h. Rn —> R eine C1-Funktion mit grad h(x) ^ 0 in einer Umgebung von dU ist Sei Xl(U) der metrische Raum aller glatten Vektorfelder auf M , versehen mit der ^-Metrik p(/, 9) = sup II f(x) - g(x) || + sup || Df(x) - Dg(x) ||. A7.25) : SUP | xeu \+8uv\\Df(x)-Dg(x) xeu (Im ersten Term der rechten Seite bedeutet || • || die EuKLiDische Vektornorm, im zweiten die Opera- tornorm.) Diejenigen glatten Vektorfelder /, die transversal den Rand dU in Richtung U schneiden, d.h., für die grad h{x)Tf(x) ^ 0, (x G dU) und (pf(x) G U {x G dU,t > 0) gilt, bilden die Menge X+(£/) C X^C/). Das Vektorfeld / G X+(E7) heißt strukturstabil, wenn es ein 5 > 0 gibt, so daß jedes andere Vektorfeld g G X+(i7) mit p(/, g) < 6 topologisch äquivalent zu / ist. ¦ Betrachtet wird die ebene Differentialgleichung g(-, a) x = — y + x(a - ¦y2), y = x + y{a-x2-y2) A7 26) mit einem Parameter a , wobei \a\ < 1 sei. Die Differentialgleichung g gehört z B zu Xj_(E/) mit U = {(x,y): x2 + y2 < 2} (Abb.17.12a). Offenbar gilt p(g{-,0),g{-,a)) = \a\{V% + 1). Das Vektorfeld g(-, 0) ist strukturell instabil, da beliebig nahe von g(-, 0) Vektorfelder existieren, die topologisch nicht äquivalent zu #(•, 0) sind (Abb. 17.12b,c). Dies wird klar, wenn man zur Polarkoordinatendarstellung r = —r3 + ar, i) = 1 von A7.26) übergeht. Für a > 0 existiert immer der stabile Grenzzyklus r = y/ä b) a^O c) a>0 Abbildung 17.12 2. Strukturstabile Systeme in der Ebene Die ebene Differentialgleichung A7 1) mit / G Xj_(t/) sei strukturstabil. Dann gilt: a) A7.1) hat nur eine endliche Anzahl von Ruhelagen und periodischer Orbits. b) Alle cj-Grenzmengen u(x) mit x G U von A7.1) bestehen nur aus Ruhelagen und periodischen Orbits. Satz von Andronov und Pontryagin: Die ebene Differentialgleichung A7.1) mit / G Xj.(J7) ist genau dann strukturstabil, wenn gilt: _ a) Alle Ruhelagen und periodische Orbits in U sind hyperbolisch b) Es gibt keine Separatrizen (d.h. heterokline oder homokline Orbits), die aus einem Sattel kommen und in einen Sattel münden. 17.1.4.2 Strukturstabile zeitdiskrete Systeme Im Falle von zeitdiskreten Systemen A7.3), d h. von Abbildungen ip M —> M, sei U C M C Rn eine beschränkte, offene und zusammenhängende Menge mit glattem Rand. Sei Diff1(C/) der metrische Raum aller Diffeomorphismen auf M , versehen mit der bezüglich U definierten C1 -Metrik Die Menge Diff+(C/) C Diff1 (U) bestehe aus denjenigen Diffeomorphismen ip, für die ip(U) C U gilt Die Abbildung <p G Diff+([/) (und damit das dynamische System A7.3)) heißt strukturstabil, wenn es ein ö > 0 gibt, so daß jede andere Abbildung tp G Diff+(C/) mit p(ip, ip) < 6 topologisch konjugiert zu <p ist
17 1 Gewöhnliche Differentialgleichungen und Abbildungen 839 17.1.4.3 Generische Eigenschaften 1. Definition Eine Eigenschaft von Elementen eines metrischen Raumes (M, p) heißt generisch (oder typisch), wenn die Gesamtheit der Elemente A von M mit dieser Eigenschaft eine Menge der zweiten B AlREschen Kategorie bildet, d h eine Teilmenge B C A ist darstellbar als B = fU= 1,2, Bm , wobei jede Menge Bm offen und dicht in M ist. ¦ A: Die Mengen R und I C R (irrationale Zahlen) sind Mengen der zweiten BAlREschen Kategorie, Q C R dagegen nicht. ¦ B: Dichtheit allein als Merkmal des „Typischen" reicht nicht aus- Q C R und I C R sind beide dicht, können aber nicht gleichzeitig typisch sein. ¦ C: Zwischen LEBESGUE-Maß A (s. 12.9.1,2., S 656) einer Menge aus R und der BAlREschen Kategorie dieser Menge besteht kein Zusammenhang So ist (s. [17.21]) die Menge B = f| Bk mit fc=l,2, Bk = U (fln — TTTi an + ttt) ' wobei Q = {an}?L0 die rationalen Zahlen darstellt, eine Men- n>o k 2n k2n ge der zweiten BAlREschen Kategorie. Andererseits gilt wegen Bk D Bk+i und X(Bk) < +00 auch X(B) = lim X(Bk) < lim \ —L- = 0 k—oo k^oo kl — 1/2 2. Generische Eigenschaften von ebenen Systemen, Hamilton-Systeme Für ebene Differentialgleichungen ist die Menge aller strukturstabilen Systeme aus X+(E/) offen und dicht in X\(U). Strukturstabile Systeme sind für die Ebene also typisch. Typisch ist also auch, daß jeder Orbit eines ebenen Systems aus X\(U) für wachsende Zeiten gegen eine endliche Anzahl von Ruhelagen und periodischer Orbits geht. Quasiperiodische Orbits sind nicht typisch. Unter bestimmten Voraussetzungen bleiben aber bei HAMILTON-Systemen quasiperiodische Orbits bei kleinen Störungen der Differentialgleichung erhalten. HAMILTON-Systeme sind also keine typischen Systeme. ¦ Gegeben sei im R4 das HAMILTON-System (in Winkel-Wirkungsvariablen) 3i = 0, 32 = 0, 0i = 1—, 02 = ir- , dj\ d32 wobei die HAMILTON-Funktion H0(ji,j2) analytisch ist Offenbar hat dieses System die Lösungen ji = Ci,32 — C2, S\ = u\t + c3, ©2 = Lü2t + c4 mit Konstanten ci, , c4 , wobei u\ und lü2 von c\ und c2 abhängen können. Die Beziehung (ji, J2) = (ci,C2) definiert einen invarianten Torus T2 (s ¦ 1 in 17.1.2.3,1., S 827) Es wird nun anstelle von H0 die gestörte HAMILTON-Funktion H0{juJ2) + eH1{j1,J2,OuO2) betrachtet, wobei H\ analytisch und e > 0 ein kleiner Parameter sei. Das Theorem von KOLMOGOROV-ARNOLD-MOSER (KAM- Theorem) sagt in dieser Situation aus, / d2H \ daß, falls Ho nichtdegeniert ist, d.h. det I 0 I ^ 0 gilt, für hinreichend kleine e > 0 im gestörten V dJk ) HAMILTON-System die Mehrzahl der invarianten nichtresonanten Tori nicht verschwindet, sondern nur leicht deformiert wird. Mehrzahl ist in dem Sinne zu verstehen, daß das LEBESGUE-Maß der bezüglich der Tori gebildeten Komplementmenge gegen Null geht, wenn e gegen 0 geht. Ein oben definierter Torus, charakterisiert durch u\ und U2 , heißt nichtresonant, wenn es eine Konstante c > 0 gibt, so daß 1^1 -El 1^2 q\ 3. Nichtwandernde Punkte, Morse-Smale-Systeme Sei {<^}f€R ein dynamisches System auf der n-dimensionalen kompakten orientierbaren Mannigfaltigkeit M Der Punkt p € M heißt nichtwandernd bezuglich {y?*} , wenn für eine beliebige Umgebung für alle positiven ganzen Zahlen p und q die Ungleichung ^gilt
840 17 Dynamische Systeme und Chaos Up C M von p gilt- VT>0 3 t, \t\>T <p'(tfp)nt7p^0. A7.27) ¦ Ruhelagen und periodische Orbits bestehen nur aus nichtwandernden Punkten. Die Menge ft(^') aller nichtwandernden Punkte des von A7 1) erzeugten dynamischen Systems ist abgeschlossen, invariant unter {</?*} und enthält alle periodischen Orbits und alle cj-Grenzmengen von Punkten aus M. Das dynamische System {(/?*}teR auf M, erzeugt durch ein glattes Vektorfeld, heißt Morse-Smale- System, wenn folgende Bedingungen erfüllt sind: 1. Das System hat endlich viele Ruhelagen und periodische Orbits und alle sind hyperbolisch 2. Alle stabilen und instabilen Mannigfaltigkeiten von Ruhelagen bzw periodischen Orbits sind transversal zueinander. 3. Die Menge aller nichtwanderenden Punkte besteht nur aus Ruhelagen und periodischen Orbits Satz von Palis und Smale: MORSE-SMALE-Systeme sind strukturstabil Die Umkehrung des Satzes von Palis und Smale gilt nicht- Es existieren für n > 3 strukturstabile Systeme mit unendlich vielen periodischen Orbits. Für n > 3 sind strukturstabile Systeme nicht typisch. 17.2 Quantitative Beschreibung von Attraktoren 17.2.1 Wahrscheinlichkeitsmaße auf Attraktoren 17.2.1.1 Invariantes Maß 1. Definition, auf dem Attraktor konzentrierte Maße Gegeben sei das dynamische System {ip^ter auf (M? p) • Sei B die cr-Algebra der BOREL-Mengen auf M und sei fi. B —? [0, +oo] ein Maß auf B Jede Abbildung tp* wird als //-meßbar vorausgesetzt Das Maß /i heißt invariant unter {y>*}ter ' wenn /i((^~<(^)) — M(^) fur alle A € B und t > 0 gilt. Ist das dynamische System {(pl}ter invertierbar, so läßt sich die Eigenschaft eines Maßes, invariant unter dem dynamischen System zu sein, auch als fj,(ipt(A)) = fi(A) (A G B, t > 0) ausdrücken. Das Maß ja heißt auf der BOREL-Menge A C M konzentriert, wenn /i(M \ A) = 0 ist Ist also A ein Attraktor von {(pl}ter und /x ein unter {ip1} invariantes Maß, so ist dieses auf A konzentriert, wenn fi{B) = 0 für jede BOREL-Menge B mit A fl B = 0 ist Der Träger eines Maßes \i. B —> [0, +oo], bezeichnet mit supp ji, ist die kleinste abgeschlossene Teilmenge von M , auf der das Maß /i konzentriert ist. ¦ A: Betrachtet wird auf M = [0,1] die Modulo-Abbildung xt+i = 2xt (mod 1) A7 28) In diesem Fall ist p [0,1] —> [0,1] mit (p(x) = < 2 '_ i i /ö <- ~" < 1 ' Anhand der Definition sieht man, daß das LEBESGUE-Maß invariant unter der Modulo-Abbildung ist. Schreibt man eine Zahl x G [0,1) als Dualzahl x = £ an - 2~n (an = 0 oder 1), so kann man 71=1 diese Darstellung mit x = . a^a^ ... identifizieren. Das Ergebnis der Operation 2x(mod 1) läßt sich schreiben als a'^a'^ ... mit a!{ = ai+\, d h., alle Ziffern a^ werden um eine Stelle nach links verschoben und die erste Ziffer fällt weg ¦ B: Die Abbildung #• [0,1] -? [0,1] mit W{y) \2(l-y), l/2<y<l {U ZJ}
17.2 Quantitative Beschreibung von Attraktoren 841 heißt Zelt-Abbildung und hat ebenfalls das LEBESGUE-Maß als invariantes Maß Der Homöomorphis- 2 mus h. [0,1) —? [0,1) mit y = — aresin y/x überführt die Abbildung ip aus A7 5) mit a = 4 in A7.29). 7T Damit besitzt A7 5) bei a = 4 ebenfalls ein invariantes Maß, das absolut stetig ist Für die Dichten Pi(y) = 1 von A7.29) und p(x) von A7.5) bei a = 4 gilt dabei pi(y) = p(h~1(y)y\(h~l)'(y)\. Hieraus ergibt sich sofort p(x) — —, . 7rJx(l — X) ¦ C: Ist xo ein stabiler Periodenpunkt der Periode T des invertierbaren zeitdiskreten dynamischen 1 T_1 Systems {ip1} , so ist p = — J^ <^(xD) em invariantes Wahrscheinlichkeitsmaß für {p1} . Dabei ist 5Xo das in Xq konzentrierte DlRAC-Maß. 2. Natürliches Maß Sei A ein Attraktor von {ip1 }t€r in M mit Einzugsgebiet W Für eine beliebige BOREL-Menge A CW und einen beliebigen Punkt x0 e W wird die folgende Größe gebildet. ß(A-Xo)-= lim *(T';^o). A7 30) i —>oo ± Dabei ist t(T, ^4, xq) jeweils der Teil der Gesamtzeit T > 0, in dem der Orbitabschnitt {(^*(xo)}^0 m der Menge A liegt. Wenn für A-fast alle Xo aus W sogar /i(^4, xo) = a ist, wird als natürliches Maß p(A) := p(A\ xo) gesetzt Da fast alle Orbits mit Anfang xo G W für t —> +oo gegen A streben, ist // ein Wahrscheinlichkeitsmaß, das auf A konzentriert ist. 17.2.1.2 Elemente der Ergodentheorie 1. Ergodische dynamische Systeme Ein dynamisches System {(pl}ter auf (M, p) mit invariantem Maß p heißt ergodisch (man sagt auch, das Maß ist ergodisch), wenn für jede BOREL-Menge A mit ^{A) = A (W > 0) entweder p(A) = 0 oder p(M \ A) = 0 ist. Ist {ip1} ein zeitdiskretes dynamisches System A7.3), ip\ M —? M ein Homöomorphismus, M ein kompakter metrischer Raum, so existiert immer ein invariantes ergodisches Maß (Satz von BOGOLJUBOV- Krylov) ¦ A: Gegeben sei mit einem Parameter # G [0,2ir] die Rotationsabbildung des Kreises S1 xt+i=xt + <P (mod27r), t = 0,l,.. , A7 31) mit ip. [0,2ir) —> [0, 2tt) , definiert durch ip(x) = x + ^ (mod 27r) Das LEBESGUE-Maß ist invariant $ ^ unter y?. Ist — irrational, so ist A7.31) ergodisch; ist — rational, so ist A7 31) nicht ergodisch 27T Z7T ¦ B: Dynamische Systeme mit stabilen Ruhelagen oder stabilen periodischen Orbits als Attraktoren sind bezuglich des auf diesen Attraktoren konzentrierten natürlichen Maßes ergodisch. Ergodensatz von Birkhoff: Das dynamische System {(p^ter sei auf M ergodisch bezüglich des invarianten Wahrscheinlichkeitsmaßes p Dann stimmen für jede integrierbare Funktion h G Ll{M, B, p) die Zeitmittel entlang des positiven Semiorbits {^(xq)}^ , d.h. h(xo) = lim — / h{(pt{xo)) dt für -i n—1 Flüsse und h(x0) = lim - J^ h (ipl(x0)) für zeitdiskrete Systeme, für p-iast alle Punkte x0 G M mit n_>oc n i=o dem Raummittel J hdp überein. M 2. Physikalische oder SBR-Maße Die Aussage des Ergodensatzes ist nur dann brauchbar, wenn der Träger des Maßes p möglichst groß ist Seien (p: M —> M eine stetige Abbildung, p- B —? R ein invariantes Maß. Man sagt (s [17.6]), daß
842 17. Dynamische Systeme und Chaos p ein SBR-Ma/?ist (nach Sinai, Bowen und Ruelle), wenn für jede stetige Funktion h: M —? R die Menge aller der Punkte xq G M , für die 1 n_1 r lim - Y h((pl(x0)) = hdp A7 32a) M gilt, ein positives LEBESGUE-Maß hat. Dafür ist ausreichend, daß die Folge der Maße Mn-=-£ <W) A732b) 71 *=0 für fast alle x G M schwach gegen p konvergiert, d.h für jede stetige Funktion h M —> R immer / /i dpn —> / /id/i für n —> +oo gilt M M ¦ Für einige wichtige Attraktoren, so für den HENON-Attraktor, wurde die Existenz eines SBR-Maßes nachgewiesen. 3. Mischende dynamische Systeme Ein dynamisches System {</?*}ter auf (M, p) mit invariantem Wahrscheinlichkeitsmaß p heißt mischend wenn lim p [An(f~t{B)) = p(A)p(B) für beliebige BOREL-Mengen A,BcM gilt Für ein mischen- t—»+oo des System hängt also das Maß der Menge aller Punkte, die bei t = 0 in A und für große t in B liegen, nur vom Produkt p(A)p(B) ab. Ein mischendes System ist auch ergodisch. Seien {ip1} ein mischendes System und A eine BOREL-Menge mit ip'^A) = A (t > 0). Dann gilt p{AJ = lim p(^-t(Ä) n A) = p(A) und p(A) ist 0 oder 1 Ein Fluß {(£*} von A7 1) ist genau dann mischend, wenn für beliebige quadratisch integrierbare Funktionen g, h G L2(M, B, p) die Beziehung ^ /W'(x)) - g}[h{x) -h}dp = 0 A7 33) M gilt Dabei bezeichnen g und /i die räumlichen Mittel, die durch die zeitlichen Mittel ersetzt werden ¦ Die Modulo-Abbildung A7 28) ist mischend. Die Rotationsabbildung A7 31) ist bezüglich des Wahrscheinlichkeitsmaßes A/27T nicht mischend 4. Autokorrelationsfunktion Das dynamische System {ip^ter auf M mit invariantem Maß p sei ergodisch. Es seien h. M —> R eine beliebige stetige Funktion, {^(^)}*>o ein beliebiger Semiorbit und das räumliche Mittel h sei ersetzt 1 fT durch das zeitliche Mittel, d.h durch lim — / hi^ix^dt im zeitkontinuierlichen Fall und durch T->oo T Jo 1 n— 1 lim — ^2 h (ipl(x)) im zeitdiskreten Fall. Bezüglich h wird die Autokorrelationsfunktion längs des Se- miorbits {^(^)}t>o zu einem Zeitpunkt r > 0 für einen Fluß durch 1 T Ch(r)= hm - fh(ipt+T(x))h(^(x))dt-h2 A734a) 7 —>oo ± J 0 und für ein zeitdiskretes System durch Ch{r) = lim ± £> (<^+r(x)) /i (^(z)) - P A7.34b) n-»oo 77, ^_o definiert Die Autokorrelationsfunktion wird auch für negative Zeiten erklärt, indem Ch( ) als gerade Funktion auf R bzw. Z aufgefaßt wird.
17.2 Quantitative Beschreibung von Attraktoren 843 Periodische oder quasiperiodische Orbits führen zu einem periodischen bzw quasiperiodischen Verhalten von Ch . Ein schneller Abfall von Ch(r) für wachsende r und beliebiger Testfunktion h deutet auf chaotisches Verhalten hin Fällt Ch(t) für wachsende r sogar mit exponentieller Geschwindigkeit, so ist dies ein Anzeichen für mischendes Verhalten 5. Leistungsspektrum Die FOURIER-Transformierte von Ch(t) heißt Leistungsspektrum (s auch 15.3.1 2,5., S. 749) und wird +oo mit Ph(uj) bezeichnet. Im zeitkontinuierlichen Fall ist, unter der Voraussetzung / |C/i(t)|c/t < oo. +oo oo -°° Ph(uj) = f Ch(T)e~[uJT dr = 2J Ch(r) cos(wt) dr . A7 35a) -oo , 0 +00 Im zeitdiskreten Fall ist, falls E |C^,(A;)| < +oo gilt, k——oo Ph(u) = Ch{0) 4- 2 £ Ch{k) coscük A7.35b) Liegt die absolute Integrierbarkeit bzw. Summierbarkeit von Ch(-) nicht vor, kann in wichtigen Fällen Ph als Distribution aufgefaßt werden. Periodischen Bewegungen eines dynamischen Systems entspricht ein Leistungsspektrum, das durch äquidistante Impulse charakterisiert ist. Bei quasiperiodischen Bewegungen treten im Leistungsspektrum Impulse auf, die sich aus ganzzahligen Linearkombinationen der Grundimpulse der quasiperiodischen Bewegung ergeben Ein „breitbandiges Spektrum mit einzelnen Spitzen" kann dagegen als Indikator für chaotisches Verhalten gelten ¦ A: Seien ip ein T-periodischer Orbit von A7 1), h eine Testfunktion, so daß das zeitliche Mittel von h((p(t)) Null ist, und habe h{<p(t)) die FOURIER-Darstellung h{ip(t)) = Y,k™-oo akeikuot mit lü0 = ^ Dann ist Ch{r) = Eg°-oo K|2 cos{ku0r) und Ph(u) = 2tt E£°-oo M2S{lj - ku0), wobei 6 die 6- Distribution bezeichnet. ¦ B: Seien <p ein quasiperiodischer Orbit von A7 1), h eine Testfunktion, so daß das zeitliche Mittel entlang ip Null ist, und habe h((p(t)) die Darstellung (zweifache FOURIER-Reihe) h(ip(t)) = E£~-oo Zt™-oo afclfcae^^+^)'. Dann ist Ch(r) = £+£_„ £+"_„ K*2|2 ^(k^ +k2u2)r und Ph(u>) = 27T EK-oo EK-oo \<Xklk2\2Ö(u - k^ - k2U2) 17.2.2 Entropien 17.2.2.1 Topologische Entropie Sei (M, p) ein kompakter metrischer Raum und {ipk}ker ein stetiges dynamisches System mit diskreter Zeit auf M Für beliebiges nGN wird eine Abstandsfunktion pn auf M durch Pn{x, V) := max p (^(x), ^(j/)) A7.36) 0<t<n definiert. Sei weiter N(s,pn) die größte Anzahl von Punkten aus M , die mindestens einen Abstand in der Metrik pn von e zueinander haben Die topologische Entropie des zeitdiskreten dynamischen Systems A7 3) bzw. der Abbildung ip ist h(ip) = lim limsup — In N(e, pn) Die topologische Entropie ist £—0 n->oo n ein Maß für die Komplexität der Abbildung Sei (Mi, pi) ein weiterer kompakter metrischer Raum und (pi Mi —? Mi eine stetige Abbildung Sind dann die beiden Abbildungen ip und ipi topologisch konjugiert, so stimmen ihre topologischen Entropien überein Insbesondere hängt die topologische Entropie nicht von der Metrik ab Für beliebiges n € IN gilt h (ipn) = nh (ip). Ist p> sogar ein Homöomorphismus, so gilt h (ipk) = \k\ h ((p) für alle k G Z Auf Grund der letzten Eigenschaft definiert man für einen Fluß tp* = ip(t, •) von A7 1) auf M C Rn die topologische Entropie über hfo*) := h (ip1). 17.2.2.2 Metrische Entropie t Sei {ipl}ter ein dynamisches System auf McRn mit dem Attraktor A und einem auf A konzentrierten invarianten Wahrscheinlichkeitsmaß /x Für beliebiges e > 0 seien Qi(e),..., Qn(e){£) die Würfel der ! I
844 17. Dynamische Systeme und Chaos Form {(xi,..., xn) : ki£ < X{ < (ki + \)e (i = 1,2,..., n)} mit ki G Z, für die fi(Qi) > 0 ist Für beliebiges x aus einem Qi wird der Semiorbit {^(^OJSo fur wachsende t verfolgt In Zeitabständen von r > 0 (r = 1 in zeitdiskreten Systemen) werden jeweils TV-mal hintereinander die Nummern iu .i\ der Würfel notiert, in denen sich der Semiorbit befindet. Sei Eix if1 die Menge aller Startwerte nahe A, deren Semiorbits zu den Zeitpunkten U = ir (i = 1,2, , N), jeweils in Qix,..., QiN liegen und sei p{i\,'' •, *at) = M-^n, jN) die Wahrscheinlichkeit dafür, daß ein (typischer) Startwert in Eiu jijv liegt. Die Entropie gibt den Zuwachs an Information an, den ein Versuch im Mittel liefert, der anzeigt, welches Ereignis aus einer endlichen Anzahl disjunkter Ereignisse wirklich eingetreten ist In der vorliegenden Situation ist dies HN = - Y^ Vihr'-^N) In p (zi,---,iAr), A7 37) (*i, An) wobei über alle Symbolfolgen (ii, • • , ijv) der Länge N summiert wird, die durch Orbits in der oben beschriebenen Weise realisiert werden. Die metrische Entropie oder KOLMOGOROV-S IN AI- Entropie hß des Attraktors A von {ip1} bezüglich TJ des invarianten Maßes a ist die Größe hu = lim lim —— (Für zeitdiskrete Systeme entfällt der Grenz- wert für e —> 0.) Für die topologische Entropie h((p) von ip: A —» A gilt hß < h((f) In vielen Fällen ist h(ip) = sup{/iM: /x-invariantes Wahrscheinlichkeitsmaß auf A} ¦ A: Sei A = {xo} eine stabile Ruhelage von A7.1) als Attraktor, versehen mit dem in xo konzentrierten natürlichen Maß /i. Bezuglich dieses Attraktors ist /iM = 0 ¦ B: Für die Shift-Abbildung A7 28) gilt h(cp) = hß = In 2 , wobei /i das invariante LEBESGUE-Maß sei. 17.2.3 Lyapunov—Exponenten 1. Singulärwerte einer Matrix Sei L eine beliebige Matrix vom Typ (n, n). Die Singulärwerte V\ > a2 > • • • > on von L sind die nichtnegativen Wurzeln der Eigenwerte a\ > • • • > an > 0 der positiv semidefiniten Matrix LTL Die Eigenwerte a; sind, ihrer Vielfachheit entsprechend, angeführt. Die Singulärwerte lassen sich geometrisch interpretieren Ist K£ eine Kugel mit Mittelpunkt in 0 und Radius e > 0, so ist das Bild L(Ke) ein Ellipsoid mit den Halbachsenlängen OiE (i = 1,2,. . ,n) (Abb.17.13a). r^ fl> (xo) ~y(t,x0,ev) \^y K_Sy \£v yP(xo+ev) a) Abbildung 17.13 2. Definition der Lyapunov-Exponenten Sei {ip^tzr ein glattes dynamisches System auf M C Rn , das einen Attraktor A mit einem dort konzentrierten invarianten ergodischen Wahrscheinlichkeitsmaß /i hat. Für beliebige t > 0 und x G A seien &\{t, x) > • • • > an(t, x) die Singulärwerte der JACOBI-Matrix D(pt(x) von ip1 im Punkt x . Dann existiert eine Folge von Zahlen Ai > • • • > An , die Lyapunov-Exponenten, so daß - In ai(t, x) —> A; für t —*¦ +oo //-fast überall im Sinne von L1 gilt. Nach dem Satz von Oseledec existiert //-fast überall eine Folge von Teilräumen des Rn R" = £* 3 ££ D • • • D El+1 = {0} , A7 38)
17 2 Quantitative Beschreibung von Attraktoren 845 so daß für //-fast alle x die Größe - In \\D(pl (x)v\\ gleichmäßig bezüglich v € E*. \ E% gegen ein Element XSj G {Ai,..., An} strebt 3. Berechnung der Lyapunov-Exponenten Die Formel Xi(x) = ^m SUP ~ m ^*(*»x)» wobei ai(t, x) wieder als Halbachsenlängen eines aus der Ein- t—>oo t heitskugel mit Mittelpunkt x durch Deformation mit D^pt(x) hervorgegangenen Ellipsoids interpretiert werden können, kann zur Berechnung der LYAPUNOV-Exponenten benutzt werden, wenn außerdem noch Reorthonormalisierungsverfahren, wie das von HOUSHOLDER, herangezogen werden. Die Funktion y(t, x, v) = D(pl(x)v ist Lösung der zum Semiorbit 7+(x) des Flusses {<£*} gehörigen Variationsgleichung mit Anfang v zur Zeit t = 0 In der Tat, ist {(/?*}iGR der Fluß von A7 1), so lautet die Variationsgleichung y = Df{(pt(x))y Die Lösung dieser Gleichung mit Anfang v zur Zeit t = 0 ist darstellbar als y(t,x,v) = <Px(t)v , wobei $x(t) die bei t = 0 normierte Fundamentalmatrix der Variationsgleichung ist, die, nach dem Satz über die Differenzierbarkeit nach den Anfangszuständen (s. 17.1.1 1,2., S 821), Lösung der Matrix-Differentialgleichung Z = Df((pt(x))Z mit Anfang Z@) = En ist. Die Zahl \(x, v) = lim sup - In ||£)(/?*(x)?;|| beschreibt das Verhalten der Orbits 7B; + ev), 0 < e <C 1, mit Anfang x + ev bezüglich des Ausgangsorbits 7@;) in der Richtung v Ist \{x, v) < 0 , so heißt dies, daß in Richtung v für wachsende t eine Annäherung der Orbits stattfindet, ist dagegen x(x,v) > 0 , so entfernen sich die Orbits (Abb.17.13b) Für die Summe aller LYAPUNOV-Exponenten von {^}ter mit dem Attraktor A und dem dort konzentrierten invarianten Maß /i gilt für //-fast alle x G A im Falle eines Flusses von A7.1) Formel A7 39a) und für ein zeitdiskretes System A7 3) Formel A7.39b) 1 * n -, fc-l V Xi = lim - / divf{<ps(x))ds, A7.39a) Y \ = lim - Y ln I det D<P(<P%(x))\ • A7.39b) n In dissipativen Systemen gilt also J2 Xi < 0. Dies, zusammen mit der Tatsache, daß für Flüsse einer *=i der LYAPUNOV-Exponenten Null ist, falls der Attraktor keine Ruhelage ist, gestattet Vereinfachungen bei der Berechnung der LYAPUNOV-Exponenten (s [17 16]) ¦ A: Sei x0 eine Ruhelage des Flusses von A7 1) und seien a{ die Eigenwerte der JACOBI-Matrix in xq . Mit dem in x0 konzentrierten Maß gilt für die LYAPUNOV-Exponenten Aj = Re en* (i = 1,2,..., n) ¦ B: Sei 7B:0) = {^(xo), t G [0, T]} ein T-periodischer Orbit von A7.1), und es seien pi die Multiplikatoren von 7B:0) Mit dem in 7B:0) konzentrierten Maß gilt Xi = A/T) ln \pi\ für i = 1,2 , n. 4. Metrische Entropie und Lyapunov-Exponenten Ist {ip1 }ter ein dynamisches System auf M C Rn mit dem Attraktor A und einem auf A konzentrierten ergodischen Wahrscheinlichkeitsmaß /i, so gilt für die metrische Entropie h^ die Ungleichung hfji < E Aj, wobei die LYAPUNOV-Exponenten entsprechend ihrer Vielfachheit aufgeführt werden Ai>0 Die Gleichheit /i„ = J2 \ (PESiNsche Formel) gilt im allgemeinen nicht (s. auch 17.2.4.4, ¦ B, S. Ai>0 851). Ist das Maß /i allerdings absolut stetig bezüglich des LEBESGUE-Maßes und tp: M —> M ein C2-Diffeomorphismus, so gilt die PESiNsche Formel 17.2.4 Dimensionen 17.2.4.1 Metrische Dimensionen 1. Fraktale Attraktoren oder andere invariante Mengen von dynamischen Systemen können geometrisch komplizierter als Punkt, Linie oder Torus aufgebaut sein Fraktale sind, auch unabhängig von einer Dynamik, Mengen, die sich durch eines oder mehrere Merkmale wie Ausfransung, Porosität, Komplexität,
846 17 Dynamische Systeme und Chaos Selbstähnlichkeit auszeichnen. Da der übliche Dimensionsbegriff, wie er für glatte Flächen und Kurven gebraucht wird, für Fraktale nicht anwendbar ist, müssen verallgemeinerte Definitionen der Dimension herangezogen werden Eine ausführlichere Darstellung der Dimensionstheorie s [17 8], [17 20], [17 4] ¦ Das Intervall Gq = [0,1] wird in drei Teilintervalle gleicher Länge geteilt und das mittlere offene Drittel entfernt, so daß die Menge G\ = [0, |] U [|, 1] entsteht. Dann werden von den beiden Teilintervallen von Gi die jeweils mittleren offenen Drittel entfernt, so daß die Menge G<i = [O, §1 U [|, |] U 11,11 U [§, ll entsteht Diese Prozedur wird mit Gk fortgesetzt, indem aus jedem Teilintervall von Gfc_! das mittlere offene Drittel entfernt wird Dadurch entsteht eine Folge von Mengen Gq D Gi D • D Gn D • • •, wobei jedes Gn aus 2n Intervallen der Länge — besteht. 3n Die CANTOR-Men^e C kann als Beispiel für ein Fraktal dienen; sie ist definiert als Menge aller der oo Punkte, die allen Gn angehören, d.h., C = f] Gn Die Menge C ist kompakt, überabzählbar, hat das n=l LEBESGUE-Maß Null und ist perfekt (d.h., C ist abgeschlossen, und jeder Punkt ist Häufungspunkt). 2. Hausdorff-Dimension Die Motivation für diese Dimension ergibt sich aus der Volumenberechnung durch das LEBESGUE-Maß. Wird eine beschränkte Menge AcR mit einer Überdeckung aus einer endlichen Anzahl Kugeln BTi mit Radius r* < e versehen, so daß also Ui Bri D A gilt, erhält man für A das „Rohvolumen" J2 ^irrf Bildet man nun über alle endlichen Überdeckungen von A durch Kugeln mit Radius r» < e die Größe He{A) = inf-JX |7rrf} und läßt £ gegen Null gehen, so ergibt sich das äußere LEBESGUE-Maß X(A) von A, das für meßbare Mengen mit dem Volumen vo\(A) übereinstimmt Es seien M der EUKLiDische Raum Rn oder, allgemeiner, ein separabler metrischer Raum mit Metrik p und Ad M eine Teilmenge. Für beliebige Parameter d > 0 und e > 0 wird die Größe fidAA) = inf \ OdiarrLß0d • A c U Bi' diamßi < e > A7.40a) gebildet, wobei Bi C M beliebige Teilmengen mit Durchmesser diamßi = sup p(x, y) sind x,yGBi Das äußere HAUSDORFF-Ma/? zur Dimension d von A wird durch pd(A) = lim ud,£{A) = suppd,e{A) A7 40b) £-+° e>0 definiert und kann endlich oder unendlich sein. Die HAUSDORFF-Dimension dn(A) der Menge A ist dann der (einzige) kritische Wert des HAUSDORFF-Maßes dH(A) = { _ J +oo, falls Pd{A) ^ 0 für alle d > 0 ist, inf{d > 0- ßd(A) = 0} . A7 40c) Bemerkung: Die Größen p,d,£(A) können auch mit Hilfe von Überdeckungen aus Kugeln vom Radius t% < £ oder, im Falle des Rn , aus Würfeln der Kantenlänge < e gebildet werden. Wichtige Eigenschaften der Hausdorff-Dimension: (HD1) dnüb) = 0. (HD2) Ist A C Rn, so gilt 0 < dH(A) < n. (HD3) Aus AGB CM folgt dH(A) < dH{B). (HD4) Ist Ai C M, i = 1,2,..., A = U£i A, so gilt dH(A) = sup^ dH{Ai) (HD5) Ist A endlich oder abzählbar, so ist dn(A) = 0 (HD6) Ist (p: M —> M LiPSCHiTZ-stetig (d h existiert eine Konstante L > 0 mit p((f(x), y>(y)) < Lp(x,y),\/x,y £ M), so gilt dn((p(A)) < o)h(A) Existiert die inverse Abbildung ip~l und ist diese ebenfalls LiPSCHiTZ-stetig, so ist sogar dn(A) = dfi{(p{A))
17.2 Quantitative Beschreibung von Attraktoren 847 ¦ Für die Menge Q aller rationalen Zahlen gilt wegen (HD5) d#(Q) = 0. Für die CANTOR-Menge CistdH{C) = j^? «0,6309.... 3. Kapazitätsdimension Sei A im weiteren eine relativ kompakte Menge des metrischen Raumes (M, p) und sei Ne(A) die minimale Anzahl von Mengen vom Durchmesser < e , die nötig ist, um A zu überdecken. Die Größe A7 41a) heißt obere Kapazitätsdimension oder fraktale Dimension, die Größe A7.41b) untere Kapazitätsdimension von A • dc(A) = limsup £-»0 \nN£(A) ln± ' A7 41a) dc(A) = liminf In N£(A) lni " A7.41b) Gilt dc(A) = dc(A) •= dc{A), so heißt dc{A) Kapazitätsdimension von A Für eine beschränkte Menge AcR" kann in den obigen Definitionen die Zahl N£(A) auch folgendermaßen definiert werden: Der Rn wird mit einem Gitter aus n-dimensionalen Würfeln der Seitenlänge e überdeckt Dann kann für N£(A) die Anzahl der Würfel des Gitters, die A schneiden, genommen werden. Wichtige Eigenschaften der Kapazitätsdimension. (KD1) Es gilt immer dH{A) < dc(A) < dc{A). (KD2) Für m-dimensionale glatte und beschränkte Flächen FcRn ist dn(F) = dc{F) = m. (KD3) Mit der Abschließung ~A von A gilt dc{A) = dc(Ä), während oft dH(A) < dH(Ä) ist. (KD4) Ist A = (J An, An C M, n = 1,2,.. , relativ kompakt, so gilt für die Kapazitätsdimension im n allgemeinen nicht dc(A) = sup dc{An). n ¦ Sei A = {0,1,1/2,1/3,...} . Dann gilt dH{A) = 0 und dc(A) = 1/2 . Ist A die Menge aller rationalen Punkte in [0,1], so gilt wegen KD2 und KD3 dc(A) = 1 Andererseits ist dH{A) = 0 4. Selbst ähnlichkeit Einer Reihe geometrischer Figuren, die man selbstähnlich nennt, liegt folgende Entstehungsprozedur zugrunde- Eine Ausgangsfigur wird durch eine neue Figur ersetzt, die aus p mit dem Faktor q > 1 linear skalierten Kopien der Ausgangsfigur besteht. Alle im k-ten Schritt vorhandenen fc-fach skalierten Ausgangsfiguren werden jeweils wie im ersten Schritt behandelt. A BA: *J^J w\_, CANTOR-Menge: p = 2 , q = 3 . ¦ B: KoCHsche Kurve: p = 4, q = 3. Die ersten Abbildung 17.14 3 Schritte sind in Abb.17.14 zu sehen. ¦ C: SiERPiNSKl-Drachen: p = 3, q = 2. Die ersten 3 Schritte zeigt Abb. 17.15. (Die weißen Dreiecke werden jeweils entfernt.) ¦ D: SlERPlNSKl-Teppich: p = 8, q = 3. Die ersten 3 Schritte zeigt Abb. 17.16. (Die weißen Quadrate werden entfernt.) Für die unter A - D genannten Mengen \np Abbildung 17.15 ^^#^^^ W\%A\?8A\2l ÄÄi Bt PH '^^'^^A WWreWw ®MM%M% gilt dc = dH = Abbildung 17.16 mg '
848 17. Dynamische Systeme und Chaos 17.2.4.2 Auf invariante Maße zurückgehende Dimensionen 1. Dimension eines Maßes Sei ji ein Wahrscheinlichkeitsmaß in (M, p), konzentriert auf A. Ist x G A ein beliebiger Punkt, Bs(x) die Kugel mit Radius 6 und Mittelpunkt x , so bezeichnen A7 42a) und A7.42b) die obere und die untere punktweise Dimension: 3„(z) = limsup^4¥^' A7-42a) ^(x) = liminfln^Bf)). A7 42b) Ist dß(x) = dß(x) := c?M(x), so heißt ofM(x) Dimension des Maßes fi'mx. Satz I von Young: Gilt für /i-fast alle x G A die Beziehung d^{x) = a, so ist a = <M/x):= inf {<*„(*)}. A7 43) XCA,fx(X)=l Die Größe d//(/z) heißt Hausdorff-Dimension des Maßes fi ¦ Es sei M = Rn , und es sei A C Rn eine kompakte Kugel mit dem LEBESGUE-Maß A(A) > 0 Für die Einschränkung von /i auf A gelte /2a — Dann ist fi(Bs(x)) ~ <5n und d//(/i) = n A(A) 2. Informationsdimension Der Attraktor A von {(pt}ter sei wie in A7 2.2.2) mit Würfeln Qi(e),. .. Qn(e)(e) der Seitenlänge e überdeckt Sei /i ein invariantes Wahrscheinlichkeitsmaß auf A Die Entropie der Zerlegung £?i(e), .., Qn(e)(e) ist n(e) #(e) = -J^PiOOlnpifc), wobei pi(e) = ^(Qi(e)), i = 1, ..,n(e) A7 44) t=i /-//Vi gesetzt wurde Existiert der Grenzwert di(n) = — lim , so hat diese Größe die Eigenschaft einer Dimension und wird Informationsdimension genannt. Satz II von Young: Gilt für jz-fast alle x G A die Beziehung dß(x) = a, so ist a = dH(ß) = dI(ß) A7 45) ¦ A: Das Maß \x sei auf einer Ruhelage x0 von {tp1} konzentriert. Da für e > 0 immer H£(/i) = -1 In 1 = 0 ist, gilt d7(/x) = 0 . ¦ B: Das Maß fi sei auf einem Grenzzyklus von {ip1} konzentriert. Für e > 0 ist H£(fi) = — Ine und deshalb d/(/i) = 1. 3. Korrelat ionsdimension Es seien {</?*}<er ein zeitdiskretes dynamisches System auf M C Rn, A C M ein Attraktor und /i ein auf A konzentriertes invariantes Wahrscheinlichkeitsmaß. Für x G A wird der Semiorbit {^(^OJjuo betrachtet. Sind N G IN und e > 0 beliebig, so heißt C(x,e,N) = —card{(i,j) • 0 < ij < N, dist ^i(x),ipj(x)) < e} A7 46a) Korrelationssumme. Nach dem Satz von Pesin-Tempelman existiert, falls /i ergodisch ist, für \i fast alle x G A der Grenzwert <M/i) = lim lim ]nC^N) A7 46b) Avrv £-,on-cx> Ine der Korrelationsdimension von // genannt wird
17 2 Quantitative Beschreibung von Attraktoren 849 4. Verallgemeinerte Dimension Der Attraktor A von {<^}*<=r auf M mit invariantem ergodischem Wahrscheinlichkeitsmaß fi wird wie in A7 2.2.2) mit Würfeln der Seitenlänge e überdeckt. Für einen beliebigen Parameter gGR,g/l heißt Hq(e) = -^ In J>(e)« mit Pi(e) = ßiQ^e)) A7.3a) verallgemeinerte Entropie q-ter Ordnung bezüglich der Zerlegung Qi(e),..., Qn(£)(e). Die Renyi-Dimension q-ter Ordnung ist dq = - lim 4^ , ' A7.3b) e^O In £ falls dieser Grenzwert existiert Sonderfalle der Renyi-Dimension: l.g = 0: d0 = dc(supp/i). A7 4a) 2. g = 1 di = lim d9 = d7(/i) A7 4b) 3. q = 2 d2 = dK(/x). A7.4c) 5. Lyapunov—Dimension Sei {ipl}ter ein glattes dynamisches System auf M C Rn mit Attraktor A (bzw invarianter Menge) und mit auf A konzentriertem invariantem ergodischem Wahrscheinlichkeitsmaß. Sind Ai > A2 > • • • > An k fc+1 die LYAPUNOV-Exponenten bezüglich /i und ist k der größte Index, für den Yl K > 0 und J2 Aj < 0 *=1 i=l ist, so heißt die Größe |Afc+i| Lyapunov-Dimension des Maßes \i. n Ist J2 Xi > 0, so wird g?l(aO = n gesetzt; ist Ai < 0 , wird di{ß) = 0 definiert. t=i Satz von Ledrappier: Es seien {</?*} ein zeitdiskretes System A7.3) auf M C Rn mit einer C2- Funktion (p und fi, wie oben, ein auf dem Attraktor A von {<£*} konzentriertes invariantes ergodisches Wahrscheinlichkeitsmaß. Dann gilt dn(ß) < d^ß), ¦ A: Der Attraktor A C R2 eines glatten dynamischen Systems {ip1} werde mit Ne Quadraten der Seitenlänge e überdeckt. Es seien a\ > 1 > cr2 die gemittelten Singulärwerte von Dip. Dann gilt für das dc-dimensionale Volumen des Attraktors m^ ~ N£ • edc . Aus jedem Quadrat der Seitenlänge e entsteht unter tp näherungsweise ein Parallelogramm mit a2e und 0\£ als Seitenlänge. Nimmt man Überdeckungen aus Rhomben mit der Seitenlänge a2£ , so ist Na2£ ~ N£— . Aus der Beziehung 02 N££dc ~ Nao£(£o-2)dc erhält man sofort cfc? — 1 — \ = 1 + 77—r • Diese heuristischen Überlegungen ln<72 |A2| geben also einen Hinweis auf die Herkunft der Formel für die LYAPUNOV-Dimension. ¦ B: Gegeben sei das HENON-SystemA7.6) mit a = 1,4 und b = 0,3. Das System A7.6) besitzt bei diesen Parametern einen Attraktor A (Henon-Attraktor) mit komplizierter Struktur. Die numerisch bestimmte Kapazitätsdimension ist dc(A) ~ 1,26. Für den Henon-Attraktor A läßt sich ein SBR- Maß nachweisen. Für die LYAPUNOV-Exponenten Ai und A2 gilt Ai + A2 = In | detDip(x)\ = In6 = InO, 3 ~ —1,204 Mit dem numerisch ermittelten Wert Ai ~ 0,42 ergibt sich A2 ~ — 1,62 . Damit ist 0 42 <fe(/i)* 1 + ^*1,26
850 11. Dynamische Systeme und Chaos 17.2.4.3 Lokale Hausdorff-Dimension nach Douady-Oesterle Sei {v?*}t€r ein glattes dynamisches System auf McR" und A C M eine kompakte invariante Menge Ein beliebiges t0 > 0 werde fixiert und # .= (pto gesetzt Satz von Douady und Oesterle: Seien (Ji(x) > • • • > crn(x) die Singulärwerte von D<P(x) und sei d G @, n] eine Zahl in der Darstellung d = d0 + s mit d0 G {0,1, , n — 1} und s G [0,1] Ist sup [ai(x)a2(x) .. crd0(^d0+i(x)] < 1 > so S11* <MA) < d. xeA Spezielle Version für Differentialgleichungen: Seien {(^}*gr der Fluß von A7.1), A eine kompakte invariante Menge und seien a\(x) > ••• > ctn(x) die Eigenwerte der symmetrisierten J ACOBi-Matrix \[Df(x)T + Df(x)] in einem beliebigen Punkt x G A Ist d G @,n] eine Zahl in der Form d = d0 + .s mit do € {0,..., n — 1} sowie s G [0,1] und gilt sup[ai(x) -\ \- ado(x) + sadQ+i(x)} < 0 , so ist dH(A) <d. Die Größe xGA dßo(z) fO, falls ai(a;) <0, \ sup{d: 0 < d < n, ai(rc) + • • + a[d](x) -\-{d- [d])a[d]+l{x) > 0} sonst, A7 6) wobei x G A beliebig ist und [d] den ganzzahligen Anteil von d bedeutet, heißt DOUADY-OESTERLE-Öimenszon im Punkt x Unter den Voraussetzungen des oben formulierten Satzes von Douady-Oesterle für Differentialgleichungen gilt dann d#(A) < sup dDO{x). xeA ¦ Das LORENZ-System A7.2) besitzt für er = 10, b = 8/3, r = 28 einen Attraktor A (LORENZ- Attraktor) mit der numerisch ermittelten Dimension d#(A) « 2,06 (Abb.17.17, erzeugt mit Mathemati- ca) Mit dem Satz von Douady-Oesterle erhält man für beliebige b > 1, g > 0 und r > 0 die Abschätzung dH(A)<Z-Z±*±l mit 1 (J + b + (a - bf + : + 2 )ar Damit ergibt sich Abbildung 17.17 für den LORENZ-Attraktor die Abschätzung d//(A) < 2,41 17.2.4.4 Beispiele von Attraktoren ¦ A: Die Hufeisenabbildung ip tritt in Verbindung mit PoiNCARE-Abbildungen auf, die transversale Schnitte von stabilen und instabilen Mannigfaltigkeiten beinhalten. Das Einheitsquadrat M = [0,1] x [0,1] wird zunächst in einer Koordinatenrichtung linear gestreckt und in der anderen Richtung gestaucht. Anschließend wird das erhaltene Rechteck in der Mitte gebogen (Abb. 17.18) Wiederholt man diese Prozedur ständig, entsteht eine Folge von Mengen M D ip{M) D • • •, für die A = f] cpk{M) fc=0 eine kompakte unter 9? invariante Menge darstellt, die alle Punkte aus M anzieht Mit Ausnahme eines Punktes läßt sich A lokal als Produkt „Linie x CANTOR-Menge" beschreiben. ¦ B: Sei a G @, |) ein Parameter und M = [0,1] x [0,1] das Einheitsquadrat Die Abbildung $ M -> M mit V{x,y) = Bar, ay), falls 0 < x < 1/2 , y G [0,1], Bx -l,ay+ 1/2), falls 1/2 < x < 1, y G [0,1] heißt dissipative Bäcker-Abbildung. Zwei Iterationen der Bäcker-Abbildung sind in Abb. 17.19 dar- gestellt. Man erkennt die entstehende „Blätterteigstruktur" Die Menge A = f] pk(M) ist invariant A;=0
17 2 Quantitative Beschreibung von Attraktoren 851 fl M <p(M) (p2(M) Abbildung 17.18 ky V// 1 i 1 ky st^l i fy lx lx Abbildung 17.19 1 x unter ip und alle Punkte aus M werden von A angezogen. Der Wert für die HAUSDORFF-Dimension ist dj/(A) 1 + In 2 . Für das dynamische System {<pk} existiert auf M ein invariantes Maß /x, — Ina verschieden vom LEBESGUE-Maß In den Punkten, wo die Ableitungen existieren, erhält man die JACOBI-Matrizen Dipk((x,y)) = 2k 0 0 ak Hieraus ergeben sich die Singulärwerte <7i(/c, (x,y)) 2fc,cr2(/c, (x.y)) = ak und, demzufolge, die LYAPUNOV-Exponenten (bezüglich des invarianten Maßes /i) Ai = In 2, A2 = In a Damit gilt für die LYAPUNOV-Dimension In 2 dL(fi) = 1 + - ¦Ina = dH(A) Die PESlNsche Formel für die metrische Entropie (s. auch 17.2 3,4., S. 845) stimmt hier, d.h., es gilt hß Ai>0 = ln2 ¦ C: Gegeben sei ein Volltorus T mit den lokalen Koordinaten F>, x, y), wie er in Abb. 17.20a zu sehen ist Eine Abbildung (p: T —> T wird durch ö/b+i = 20k, Xk+l Vk+i 1 fcos0k\ fxk 2\sin<9fcy \yk (ib = 0,l,. .) D@) Abbildung 17 20 mit einem Parameter a G @,1/2) erklärt Das Bild <p(T), zusammen mit den Schnitten ip{T) C\ D(ß) und (p2(T)r\D@), ist in Abb.17.20b und Abb.17.20c zu sehen. Im Ergebnis der Iterationen entsteht die Menge A = f) <P (T), die Solenoid heißt Der Attraktor A besteht in Längsrichtung aus einem k=0 Kontinuum von Kurven, von denen jede dicht in A ist und die alle instabil sind. Der Schnitt von A transversal zu diesen Kurven ist eine CANTOR-Menge. In 2 Für die HAUSDORFF-Dimension gilt d#(A) = 1 — . Die Menge A besitzt eine ganze Umgebung als Ina Einzugsgebiet Außerdem ist der Attraktor A strukturstabil, d.h , die oben formulierten qualitativen Eigenschaften ändern sich nicht bei C1-kleinen Störungen von ip.
852 17. Dynamische Systeme und Chaos ¦ D: Das Solenoid ist ein Beispiel für einen hyperbolischen Attraktor 17.2.5 Seltsame Attraktoren und Chaos 1. Chaotischer Attraktor Sei {(//}fer ein dynamisches System im metrischen Raum (M, p) Der Attraktor A dieses Systems heißt chaotisch, wenn auf A eine sensitive Abhängigkeit von den Anfangszuständen vorliegt. Die Eigenschaft „sensitive Abhängigkeit von den Anfangszuständen" wird in unterschiedlicher Weise präzisiert Sie ist z.B. gegeben, wenn eine der beiden folgenden Bedingungen erfüllt ist. a) Alle Bewegungen von {</?*} auf A sind in gewisser Weise instabil. b) Der größte LYAPUNOV-Exponent von {</?*} bzgl. eines auf A konzentrierten invarianten ergodischen Wahrscheinlichkeitsmaßes ist positiv. ¦ Sensitive Abhängigkeit im Sinne von a) liegt beim Solenoid vor. Die Eigenschaft b) ist z.B. beim HENON-Attraktor zu finden. 2. Fraktale und seltsame Attraktoren Ein Attraktor A von {<^}ter heißt fraktal, wenn er weder eine endliche Anzahl von Punkten, eine stückweise differenzierbare Kurve oder Fläche noch eine Menge, die von einer geschlossenen stückweise differenzierbaren Fläche umgeben wird, darstellt. Ein Attraktor heißt seltsam, wenn er chaotisch, fraktal oder beides ist Die Begriffe chaotisch, fraktal und seltsam werden für kompakte invariante Mengen, die keine Attraktoren sind, analog benutzt. Ein dynamisches System heißt chaotisch, wenn es eine kompakte invariante chaotische Menge besitzt ¦ Im Einheitsquadrat wird die Abbildung xn+1 = 2xn + yn (modl), yn+1 = xn + yn (mod 1) A7.7) (ANOSOV-Diffeomorphismus) betrachtet Das System ist in Wirklichkeit auf dem Torus T2 als adäquater Phasenraum definiert. Es ist konservativ, besitzt das LEBESGUE-Maß als invariantes Maß, hat abzählbar unendlich viele periodische Orbits, deren Vereinigung dicht liegt, und ist mischend. Andererseits ist A = T2 eine invariante Menge mit ganzzahliger Dimension 2. 3. Chaotisches System nach Devaney Sei {(pt}ter ein dynamisches System im metrischen Raum (M, p) mit kompakter invarianter Menge A Das System {(/?*}t€r (bzw. die Menge A) heißt chaotisch im Sinne von DEVANEY, wenn gilt: a) {(pt}ter ist topologisch transitiv auf A, d.h., es gibt einen positiven Semiorbit, der dicht in A liegt. b) Die periodischen Orbits von {(pt}t£r liegen dicht in A. c) {<^}t€r ist auf A sensitiv bezüglich der Anfangswerte im Sinne von Guckenheimer,(s. [17.10]) d h , 3e>0 VxGA \/6>0 3yeAnU5{x) 3 t > 0 p ((p* (x), cp1 (y)) > e, A7.8) wobei Us{x) = {z € M- p{x, z) < S}. ¦ Gegeben sei der Raum der einseitig unendlichen Folgen aus zwei Symbolen £ = {s = 5oSlS2 ..,5i€{0,l} (z = 0,l..)}. Für zwei Folgen s = s0sis2 . . und s' = sf0s[s'2 ... sei der Abstand gemäß ( i\ _ / 0, falls s = s', ft8>8)-\2->, falls s^s' definiert, wobei j der kleinste Index mit Sj ^ s'j ist. Damit wird (£, p) ein vollständiger metrischer Raum, der außerdem kompakt ist. Die Abbildung a: s = soSiS2 ... i—? a(s) = sf = sis2ss ... heißt BERNOULLi-Shifl-Abbildung. Die Shift-Abbildung ist chaotisch im Sinne von Devaney. 17.2.6 Chaos in eindimensionalen Abbildungen Für stetige Abbildungen eines kompakten Intervalls in sich gibt es zahlreiche hinreichende Bedingungen für die Existenz chaotischer invarianter Mengen. Drei Beispiele sollen genannt werden.
17 2 Quantitative Beschreibung von Attraktoren 853 Satz von Shinai: Sei tp: I —> / eine stetige Abbildung eines kompakten Intervalls / (z.B. / = [0,1]) in sich. Dann ist das System {ipk} auf / genau dann chaotisch im Sinne von Devaney, wenn die topo- logische Entropie von ip auf /, d h h((p), positiv ist Satz von Sharkovsky: Die positiven ganzen Zahlen seien folgendermaßen geordnet. 3 >- 5 >- 7 ^ >-2-3>-2-5)-..^22-3^22-5^. ^ 2 V 2 V 2 >~ 1. A7 9) Sei ip . / —> I eine stetige Abbildung eines kompakten Intervalls in sich und habe {tpk} auf / einen n-periodischen Orbit Dann hat {ipk} auch einen m-periodischen Orbit, wenn n y m ist Satz von Block, Guckenheimer und Misiuriewicz: Sei ip - I —* I eine stetige Abbildung des kompakten Intervalls / in sich, so daß {(pk) einen 2nra-periodischen Orbit (ra > 1, ungerade) besitzt , / n In 2 Dann ist h(y) > ^T 17.2.7 Rekonstruktion der Dynamik aus Zeitreihen 17.2.7.1 Grundlagen, Rekonstruktionen mit generischen Eigenschaften 1. Meßfunktion, Zeitreihe Betrachtet wird ein dynamisches System {(pt}ter mit r G {Z+, R+}, generiert durch eine Abbildung tp G DiSl{U) (s 17 1 4 2, S 838) oder ein Vektorfeld / G X*_A7) (s 17.1 4 1 S. 837). Eine C1- Funktion h U —> R, genannt Meßfunktion, soll zur Rekonstruktion der Dynamik aus Messungen dienen Da in der Praxis häufig nur zu diskreten Zeiten gemessen werden kann, erfolge dies zu den Zeiten [kr, k = 1,2,.. }cT, wobei r > 0 eine feste Zeit Verschiebung ist. Für m 6 N und k G { — 1,1} heißt {(mv^mop^öo), ^K+<m"iwT(p)))}r=m-, ¦ (i7i°) die zum Orbit {&*(&)} tsr mitp G U über die Meßfunktion h mit fester Zeitverschiebung r > 0 gemessene Zeitreihe der Ordnung m in verzögerten (k = —1) bzw vorauseilenden (k = 1) Koordinaten 2. Immersion, Einbettung, Satz von Whitney Sei U CR71 offen Die C1-Abbildung 0- U -> Rm heißt Immersion, falls die JACOBI-Matrix D$(u) in jedem Punkt u G U den Rang n hat Die Immersion <3>:U—> Rm heißt Einbettung, wenn $ die Menge U homöomorph auf $(U) abbildet ($(U) versehen mit der Teilraumtopologie des Rm). Der Satz von Whitney sagt aus, daß bezüglich der offenen und beschränkten Menge C/cR" für jedes m > 2n + 1 die Gesamtheit aller Einbettungen <P: U —? Rm eine offene und dichte Teilmenge aller Cl-Abbildungen U —> Rm bildet Für m > 2n + 1 ist $ also generisch eine Einbettung 3. Rekonstruktionssatz von Takens, Satz von Kupka und Smale Ist DiSliU) und m > 2n + 1 eine beliebige natürliche Zahl, so ist die Gesamtheit aller Paare {(p, h) G Diff|(C/) x Cl(U, R), für die die Rekonstruktionsabbildung (in vorauseilenden Koordinaten) pef«^W = (%).%1(p)). .%<m-1(p))) A7-11) eine Einbettung ist, offen und dicht in DiffJ; (U) xCl(U, R) Die Eigenschaft von Q^ , eine Einbettung zu sein, ist also für m > 2n +1 generisch Eine solche Zahl m wird auch Einbettungsdimension genannt. (Satz von Takens s [17 24]) Der Satz läßt sich auf Differentialgleichungen aus X+(C/) anwenden- Ist m > 2n + 1 eine beliebige natürliche Zahl, so ist die Menge aller Paare (/, h) G Xj_(E/) x Cl(U, R), für die die Rekonstruktionsabbildung Peu^$lh(p) = (h(p),h(<p1(p)), ¦ Mvn-\p))) A7.12) (mit {y>*}t>o als dem zu / gehörigen Semifluß) eine Einbettung ist, offen und dicht im Raum X^_(E/) x Cl(U, R) Die Eigenschaft von $Vth , eine Einbettung zu sein, ist also generisch. ¦ Auf (—1 — e, 1 + e) (s > 0 , hinreichend klein) sei die Differentialgleichung x = —x = f(x) gegeben. Da / stetig differenzierbar ist und /(-l) = 1 > 0 sowie /(l) = -1 gilt, ist / G X^(J7) mit U = (-1,1)
854 17. Dynamische Systeme und Chaos Dies folgt auch sofort aus der expliziten Lösung ^(x) = xe t,t > 0, x € U Laut Satz von Ta- kens ist für m > 3 die Rekonstruktionsabbildung <P^^ mit einer stetig differenzierbaren Meßfunktion h. (—1,1) —? R generisch in X+(?7) x Cl{JJ, R) eine Einbettung. Beispielsweise leistet /ii(x) = x dies, da x G (—1,1) H-» <?yt/ll (x) = (x, xe-1, xe-2) offenbar eine Einbettung in den R3 ist. Dagegen ergibt die Meßfunktion h2(x) = x2 die Rekonstruktionsabbildung x € (—1,1) •—> $f,h2{x) = (x2,x2e-2,x2e-4), die nicht injektiv und damit auch keine Einbettung ist. Grundlage für den Rekonstruktionssatz von TAKENS ist der Satz von Kupka und Smale: Die Gesamtheit aller Diffeomorphismen <p G Diff+(f/), für die jederPeriodenpunkt hyperbolisch ist und Ws(p) transversal zu Wu(q) für beliebige Periodenpunkte ist, bildet eine Menge der zweiten BAiREschen Kategorie, d.h , solche Diffeomorphismen sind typisch in Diff+(E/). Die Forderung m > 2m +1 ergibt sich daraus, daß $Vth für typische (y>, h) G Diff+(£/) x Cl(U, R) nahe der Periodenpunkte eine Immersion ist, die anschließend zu einer Einbettung auf ganz U fortgesetzt werden kann. 4. Dynamik im Rekonstruktionsraum Der Satz von TAKENS impliziert, daß für generische (</?,/*) G Diff+(E/) x C1(Ui'R) die Menge $(U) (Rekonstruktionsraum), mit # = <P^h das immersierte und homömorphe Bild von U ist und auf $(U) die Abbildung tp = <P o tp o #-1 definiert ist. Für das (unbekannte) System {tpk}ke± auf U und das System {ipk}ke± auf $(U) stimmen die topologischen Eigenschaften von korrespondierenden Ruhelagen und periodischen Orbits sowie die Eigenwerte der JACOBI-Matrizen überein Übereinstimmend sind auch Entropien und Dimensionen, wie z,B, die Korrelationsdimension (s. 17.2.7.2, S 854) sowie die LYAPUNOV-Exponenten korrespondierender invarianter Maße Die Abbildung ip auf $(U) ist in den Punkten vollständig beschrieben, die durch Zeitreihen erfaßt werden. Zur Demonstration dieses Sachverhaltes sei r = 1. Ein Punkt xk = {h{ipk(p)),..., h^171'1 (p))) G Rm, k G Z+ sei gegeben. Offenbar ist xk = $(qk), wenn qk = ipk(p) gesetzt wird Dann gilt ip(xk) = @ o ip o ^-1)(^(gfc)) = x^+i, d.h. ip (h(qk),.. , h{Q.k+m-i)) — (h(Qk+i), h(qk+2),. , h(qk+m)) Anstelle der nicht zugänglichen Dynamik von tp auf U erhält man also über die Messungen vollständige Orbits (mit r = Z+) von ip auf $(U) und kann daraus Rückschlüsse auf die Dynamik von (p ziehen. 17.2.7.2 Rekonstruktionen mit prävalenten Eigenschaften 1. Prävalenz als metrische Variante der Generizität Prävalenz oder metrische Generizität ist eine Ausweitung der für endlich-dimensionale Vektorräume sinnvollen Eigenschaft „fast überall im Sinne des LEBESGUE-Maßes" (s. 12.9 1,2., S. 656) auf unendlich- dimensionale Räume. Sie unterscheidet sich damit von der auf Mengen der zweiten BAiREschen Kategorie zurückgehenden topologischen Form der Generizität (s. 17.1 4 3, S 839). Eine BOREL-Menge S des BANACH-Raumes B heißt prävalent (s. [17.23]), wenn ein finites BOREL-Maß ß mit kompaktem Träger K (s 17 2 1.1, S 840) existiert, so daß /iE + x) = ß{S) = n(K) für jedes xeB ist. ¦ A: Jede BOREL-Menge eines endlich-dimensionalen Vektorraumes, deren Komplement das Maß Null hat, ist prävalent. ¦ B: Die Vereinigung und der Durchschnitt einer endlichen Anzahl prävalenter Mengen ist prävalent ¦ C: Eine prävalente Teilmenge in Cfc(£/,R), U C Rn offen und zusammenhängend, ist dicht im BANACH-Raum Cfc(£/,R) aller der skalarwertigen Punktionen aus Ck(U, R), deren partielle Ableitungen der Ordnung < k stetig in U sind. 2. Rekonstruktionssatz von Sauer, Yorke und Casdagli Sei {^*}t>o em Semifluß, generiert durch das Vektorfeld / 6 Xj (s 17.1.4.1, 837) und sei A eine kompakte Teilmenge in U mit der fraktalen Dimension dc(A) = d. Weiter seien m > 2d eine ganze Zahl und r > 0 beliebig In A mögen von {(ft}t>o höchstens eine endliche Anzahl von Ruhelagen, keine periodischen Orbits der Perioden r oder 2r und höchstens endlich viele periodische Orbits der Perioden
17 2 Quantitative Beschreibung von Attraktoren 855 3t, 4t, , tut sein, wobei die Multiplikatoren dieser periodischen Orbits (bis auf 1) jeweils verschieden seien Dann bildet die Gesamtheit aller Meßfunktionen h: U —> R, für die die Rekonstruktionsabbildung $f,h,T (m verzögerten Koordinaten) peU~ #/Ar(p) = (h (<p(m-1)T(p)) , h (</"-2)T(p)) ,..., h(p)) A7 13) die folgenden zwei Eigenschaften a) und b) hat, eine prävalente Menge Cl(U', R): a) ^/,/i,r ist injektiv auf A; b) $/,/j,t ist eine Immersion auf jeder Teilmenge U C A, die darstellbar ist als U = &(]¥), wobei W - G H R* x {0, . , 0} , G C Rn offen, V: G -» Rn eine (^-Abbildung und jfc < d ist. (Satz von n—fc Sauer, Yorke, Casdagli, s [17.23].) 3. Abschätzung der Korrelationsdimension Gegeben sei ein dynamisches System {(/?*}t€jr mit r G {Z+,R+}, generiert durch (/? G Diff.j;([/) bzw. / G X+(C7). In C/ habe {(pt}ter einen Attraktor A mit invariantem Wahrscheinlichkeitsmaß fi Es seien h. U —> R eine Meßfunktion, ra G N der Ordnungsparameter, r = 1 die Zeitverschiebung und für i = l,2,... xi = (yiiyi+u ,yi+m)enm+1 A7.14) mit */* = h(ipl(p)) eine zum Orbit {(pt}t^r mit p e U gemessene Zeitreihe der Ordnung ra+1 in vorauseilenden Koordinaten. Für Vektoren Xi und x3 wird ihr Abstand durch dist(£i, Xj) = max \yi+s — yj+s\ definiert. Bezeichnet N > m eine natürliche Zahl und e > 0 eine reelle Zahl, so heißt der Ausdruck Cm((f) = limsup —{Anzahl der geordneten Paare (xi: Xj) i,j G {1, . , N} , dist(xj, Xj) < e} N—xx) iV A7.15) lnCm(£) (diskretes) Korrelationsintegral (bzgl m und e). Falls die Größe d#(m) = lim — existiert, liefert diese eine Schätzung der Korrelationsdimension oIk • Für h G C1(U,IV) ist dies nach dem Satz von Takens generisch der Fall, falls m > 2n ist, bzw. nach dem Satz von Sauer, Yorke, Casdagli prävalent, falls m + 1 > dc(A) ist und verzögerte Koordinaten benutzt werden ¦ Das LORENZ-System A7 2) (s 17 1.1.1,2. S. 822) gehört zu X+(E/), wobei beispielsweise U •= {(x,y, z) G R3 . |[x2 + y2 + (z — a — rJ] < c} (c > 0, hinreichend groß), gewählt werden kann Offenbar ist der LORENZ-Attraktor A (bei a = 10,6 = 8/3, r = 28) in U enthalten. Der Satz von Douady-Oesterle (s. 17.2.4.3, S. 850) ergibt die Schranke dH(A) < 2,421. Numerische Integration mit der Box-Counting-Methode liefert dH(A) « 2,06. Die Abschätzung der Korrelationsdimension des natürlichen Maßes nach der Einbettungsmethode mit Zeitreihen in verzögerten Koordinaten (r « 0,12) ergibt für den LORENZ-Attraktor dK « 2, 03 (GRASSBERGER, [17 12]).
856 17. Dynamische Systeme und Chaos 17.3 Bifurkationstheorie und Wege zum Chaos 17.3.1 Bifurkationen in Morse—Smale—Systemen Gegeben sei auf M C Rn ein von einer Differentialgleichung oder einer Abbildung erzeugtes dynamisches System {(/?* }jer , das zusätzlich von einem Parameter e G V C Rz abhängt Jede Änderung der topologischen Struktur des Phasenporträts des dynamischen Systems bei kleiner Änderung des Parameters heißt Bifurkation. Der Parameter e = 0 G V heißt Bifurkationswert, wenn in jeder Umgebung von 0 Parameterwerte £ G V existieren, so daß die dynamischen Systeme {ip\} und {</?q} auf M topolo- gisch nicht äquivalent bzw nicht konjugiert sind. Die kleinste Dimension eines Parameterraumes, bei der eine Bifurkation beobachtbar ist, heißt Kodimension der Bifurkation. Man unterscheidet lokale Bifurkationen, die nahe einzelner Orbits des dynamischen Systems ablaufen, und globale Bifurkationen, die sofort einen großen Teil des Phasenraumes betreffen 17.3.1.1 Lokale B ifurkat ionen nahe Ruhelagen 1. Satz über die Zentrumsmannigfaltigkeit Betrachtet wird eine parameterabhängige Differentialgleichung x = f(x,e) bzw. ±i = /i(#i,... ,£n»£ij • ?£j) (z = 1,2, . ,n) A716) mit / M x V —? Rn , wobei M C Rn und V C Hl offene Mengen darstellen und / als r-mal stetig differenzierbar vorausgesetzt wird Die Gleichung A7.16) läßt sich als parameterfreie Differentialgleichung x = f(x, e), e = 0 im Phasenraum MxV interpretieren Aus dem Satz von Picard-LindelÖf und dem Satz über die Differenzierbarkeit nach den Anfangswerten (s. 17 1.1.1,2., S. 821) folgt, daß A7.16) für beliebige p G M und £ e V eine lokal eindeutige Lösung y?(-,p,e) mit Anfang p zur Zeit t = 0 besitzt, die bezüglich p und £ dann r-mal stetig differenzierbar ist. Alle Lösungen mögen auf ganz R existieren. Es wird weiter vorausgesetzt, daß System A7.16) bei £ = 0 die Ruhelage x = 0 besitzt, d h , es gelte /@,0) = 0. Es seien Ai, .., As die Eigenwerte von Dxf@,0) = gM mit ReAj = 0 Außer- =i dem habe Dxf@,0) genau m Eigenwerte mit negativem und k = n — s — m Eigenwerte mit positivem Realteil Nach dem Satz über die Zentrumsmannigfaltigkeit für Differentialgleichungen (Satz von Shoshitaish- vili) (s. [17.14]) ist die Differentialgleichung A7 16) für £ mit hinreichend kleiner Norm ||e|| in einer Umgebung von 0 topologisch äquivalent zu einem System x = F(x, e) = Ax + g(x, e), y = -y, z = z A7.17) mit x G Rs, y G Rm und z G Rfc , wobei A eine Matrix vom Typ (s, s) ist, die Ai, , As als Eigenwerte hat, und g eine Cr-Funktion mit g@,0) = 0 sowie Dxg@,0) = 0 darstellt Aus der Darstellung A7.17) folgt, daß Bifurkationen von A7 16) in einer Umgebung von 0 ausschließlich durch die Differentialgleichung x = F(x,e) A7 18) beschrieben werden Die Gleichung A7 18) stellt die auf die lokale Zentrumsmannigfaltigkeit Wfoc = {x, y: z' y = 0, z = 0} von A7 17) reduzierte Differentialgleichung dar. Die reduzierte Differentialgleichung A7 18) kann oft durch eine nichtlineare parameterabhängige Koordinatentransformation, die die topologische Struktur ihres Phasenporträts nahe der untersuchten Ruhelage nicht ändert, auf eine relativ einfache Form (z B mit Polynomen auf der rechten Seite) gebracht werden, die Normalform heißt Eine Normalform läßt sich nicht eindeutig bestimmen, in der Regel wird eine Bifurkation durch unterschiedliche Normalformen äquivalent beschrieben. 2. Sattelknoten-Bifurkation und transkritische Bifurkation Gegeben sei A7.16) mit / = 1, wobei / mindestens zweimal stetig differenzierbar ist und Dxf@,0) den Eigenwert Ai = 0 und n — 1 Eigenwerte \j mit ReAj ^ 0 habe Nach dem Satz über die Zentrumsmannigfaltigkeit werden in diesem Fall alle Bifurkationen von A7.16) nahe 0 durch eine eindimensionale
17.3 Bifurkationstheorie und Wege zum Chaos 857 dF reduzierte Differentialgleichung A7.18) beschrieben Offenbar ist dabei F@,0) = -7— @,0) = 0 Wird zusätzlich 7—rF@,0) ^ 0 und -7— @,0) 7^ 0 vorausgesetzt und die rechte Seite von A7 18) nach der oxl de TAYLOR-Formel entwickelt, so läßt sich diese Darstellung nach [17.14] durch Koordinatentransformation umformen zur Normalform x = a + x + • d2F, d2F (bei ^-^-@,0) < 0), wobei a -- A7 19) a(e) eine differenzierbare (bei ^^@,0) > 0) bzw x = a - x2 + • öxz Funktion mit a@) = 0 ist und die Punkte Terme höherer Ordnung bedeuten Für a < 0 hat A7.19) nahe x = 0 zwei Ruhelagen, von denen eine stabil, die andere instabil ist. Bei a = 0 verschmelzen diese zur Ruhelage x = 0 , die instabil ist Für a > 0 hat A7 19) keine Ruhelage nahe 0 (Abb. 17.21b). 1-! a) a<0 oc=0 a>0 b) Abbildung 17 21 a=0 Abbildung 17 22 oc>0 Die Übertragung auf den mehrdimensionalen Fall liefert eine Sattelknoten-Bifurkation nahe 0 in A7 16). Für n = 2 und Ai = 0, A2 < 0 ist diese Bifurkation in Abb.17.22 zu sehen. Die Darstellung der Sattelknoten-Bifurkation im erweiterten Phasenraum ist in Abb. 17.21a zu sehen Für hinreichend glatte Vektorfelder A7.16) sind Sattelknoten-Bifurkationen generisch. dF Wird in den Bedingungen an F für eine Sattelknoten-Bifurkation die Voraussetzung -7— @,0) ^ 0 de dF d2F durch die Forderungen —— @,0) = 0 und @,0) 7^ 0 ersetzt, so ergibt sich aus A7 18) die verkürzet oxoe te Normalform (ohne Glieder höherer Ordnung) x = ax — x2 einer transkritischen Bifurkation Für n = 2 und A2 < 0 ist die transkritische Bifurkation, zusammen mit dem Bifurkationsdiagramm, in Abb. 17.23 zu sehen Sattelknoten- und transkritische Bifurkation gehören zu den Kodimension-1- Bifurkationen 3. Hopf-Bifurkation Gegeben sei A7.16) mit n > 2, / = 1 und r > 4 Für alle e mit |e| < e0 (e0 > 0 hinreichend klein) gelte /@, e) = 0. Die JACOBI-Matrix Dxf(Q, 0) habe die Eigenwerte Ai = Ä^ = iu mit uj ^ 0 und n - 2 Eigenwerte Xj mit ReAj ^ 0 Nach dem Satz über die Zentrumsmannigfaltigkeit wird die Bifurkation durch eine zweidimensionale reduzierte Differentialgleichung A7 18) in der Form x = a(e)x - u(e)y + gi(x,y,e), y = u{e)x + a(e)y + g2(x.y,e) A7 20)
858 17. Dynamische Systeme und Chaos i oc<0 Abbildung 17 23 oc>0 beschrieben, wobei a, u, g\ und g<i differenzierbare Funktionen sind und u;@) = lü sowie a@) = 0 gilt Durch eine nichtlineare Koordinatentransformation im Komplexen und Einführung von Polarkoordinaten (r, $) läßt sich A7.20) auf die Normalform r = a(e)r + a(e)r3 + • ' = uj(e) + b(e)r2 + • A7.21) bringen, in der mit Punkten die Glieder höherer Ordnung angedeutet werden. Die TAYLOR-Entwick- lung der Koeffizientenfunktionen von A7.21) führt auf die verkürzte Normalform r = a'{0)sr + a@)r3, ö = u{0) + u'@)e + 6@)r2 A7 22) Der Satz von ANDRONOV und HOPF garantiert, daß A7.22) die Bifurkationen von A7.21) nahe der Ruhelage bei e = 0 beschreibt. Unter der Annahme a'@) > 0 ergeben sich für A7.22) folgende Fälle: 1 a@) < 0 (Abb.17.24a). 2. a@) > 0 (a) e > 0 • Stabiler Grenzzyklus und (a) e < 0. instabile Ruhelage (b) e = 0. Zyklus und Ruhelage verschmel- (b) e = 0: zen in eine stabile Ruhelage. (c) £ < 0: Alle Orbits nahe @,0) streben (c) £ > 0 • wie in (b) für t —> +oo spiralartig gegen die Ruhelage @,0) (Abb.17.24b) Instabiler Grenzzyklus. Zyklus und Ruhelage verschmelzen in eine instabile Ruhelage Spiralartige instabile Ruhelage wie in (b) a) £>0 (^ e^0 b) £<0 Abbildung 17 24 Q) e^0 Die Interpretation der obigen Fälle für das Ausgangssystem A7.16) zeigt die Bifurkation eines Grenzzyklus aus einer zusammengesetzten Ruhelage (zusammengesetzter Strudel der Vielfachheit 1), die Hopf-Bifurkation (oder auch Andronov-Hopf- Bifurkation) genannt wird. Der Fall a@) < 0 heißt dabei superkritisch, der Fall a@) > 0 subkritisch (unter der Annahme a'@) > 0). Für n = 3, Ax = Ä^ = i, A3 < 0, a'@) > 0 und a@) < 0 ist die Situation auf Abb. 17.25 zu sehen
17 3 Bifurkationstheorie und Wege zum Chaos 859 HOPF-Bifurkationen sind generisch und gehören zu den Kodimension-1-Bifurkationen Die angeführten Fallunterscheidungen illustrieren die Tatsache, daß eine superkritische HOPF-Bifurkation unter den oben formulierten Voraussetzungen anhand der Stabilität eines Strudels erkannt werden kann Die Eigenwerte \\(e) und X2(£) der JACOBI-Matrix der rechten Seite von A7.16) in 0 bei £ — 0 seien rein imaginär, und für die restlichen Eigenwerte Xj gelte ReAj ^ 0 . Sei weiter — ReAi(e)|e=o > 0 und sei 0 ein asymptotisch stabiler Strudel für A7 16) bei e = 0 Dann findet in A7 16) bei e = 0 eine superkritische HOPF-Bifurkation statt ¦ Die VÄN-DER-POLsche Differentialgleichung x + s(x2 — l)x + x = 0 mit dem Parameter e kann als ebene Differentialgleichung x = y, y = -e(x2-l)y-x ' A7 23) geschrieben werden Bei e — 0 geht A7 23) in die Gleichung des harmonischen Oszillators über und hat deshalb nur periodische Lösungen und eine Ruhelage, die stabil, aber nicht asymptotisch stabil ist Mit der Transformation u = y/e .x, v = \fey für e > 0 wird A7 23) zur ebenen Differentialgleichung ü = v, v = -u - {u2 - e)v. A7 24) Für die Eigenwerte der JACOBI-Matrix in der Ruhelage @,0) von A7 24) gilt: Ai,2(e) = -± Wy-1 und damit AiJ@) = ±i sowie — ReAi(e)|e=0 = ^ > 0 • d t. , , x 1 ^ReAl(^0=2 Wie im Beispiel von 17 1 2.3,1., S 827 gezeigt wurde, ist @,0) eine asymptotisch stabile Ruhelage von A7.24) bei e = 0 Bei e = 0 findet eine superkritische HOPF-Bifurkation statt, und @,0) ist für kleine e > 0 ein instabiler Strudel, der von einem Grenzzyklus umgeben ist, dessen Amplitude mit £ wächst. 4. Bifurkationen in zweiparametrigen Differentialgleichungen 1. Spitzen-Bifurkation Gegeben sei die Differentialgleichung A7 16) mit r > 4 und / = 2 Die JACOBI-Matrix Dxf@,0) habe den Eigenwert Ai = 0 und n — 1 Eigenwerte Xj mit ReXj ^ 0 Für dF d2F die reduzierte Differentialgleichung A7 18) gelte F@,0) = -^-@,0) = ^r(°>0) = 0 und/3 = ox oxz d3F t—-@,0) 7^ 0 Die TAYLOR-Zerlegung von F nahe @,0) führt auf die verkürzte Normalform (ohne ox6 Glieder höherer Ordnung, s. [17 1]) x = ai + ot2X + sign I3X3 A7 25) mit den Parametern a\ und a2 Die Menge {(ai,a2,x)- a\-\- a2x + sign l3x3 = 0} stellt im erweiterten Phasenraum eine Fläche dar und wird Falte genannt (Abb. 17.26a). Im weiteren sei Z3 < 0 Die nicht hyperbolischen Ruhelagen von A7 25) werden durch das Gleichungssystem ai+a2x—x3 = 0 . a2—3x2 = 0 definiert und liegen auf den Kurven Si und S2 , die durch die Menge {(«l, a2) 27a\ — Aa\ = 0} bestimmt werden und zusammen eine Spitze (cusp) bilden (Abb.17.26b) Bei (ai,a2) — @,0) ist die Ruhelage 0 von A7 25) stabil. Das Phasenporträt von A7 16) nahe 0 , z B für n = 2, /3 < 0 und Ai = 0 ist, für A2 < 0 (dreifach zusammengesetzter Knoten) in Abb. 17.26c und für A2 > 0 (dreifach zusammengesetzter Sattel) in Abb.17.26d zu sehen (s. [17.14]) Beim Übergang von (a1? a2) = @,0) in das Innere des Gebietes 1 (Abb.17.26b) spaltet sich die nicht hyperbolische Ruhelage 0 von A7 16) vom Typ eines zusammengesetzten Knotens in drei hyperbolische Ruhelagen (zwei stabile Knoten und ein Sattel) auf (superkritische Gabelbifurkation) Im Falle des zweidimensionalen Phasenraumes von A7 16) sind die Phasenporträts in Abb.l7.26c,e zu sehen Beim Durchqueren des Parameterpaares von Si \ {@,0)} (i = 1.2) aus 1 in 2 bildet sich eine zweifach zusammengesetzte Ruhelage vom Sattelknoten-Typ, die sich anschließend aufhebt Eine stabile hyperbolische Ruhelage verbleibt
860 17. Dynamische Systeme und Chaos 3; ^v^2 a) Sl \<h d) Abbildung 17.26 2. Bogdanov-Takens-Bifurkation Für A7.16) gelte n > 2, / = 2, r > 2, und die Matrix Ac/@,0) habe die beiden Eigenwerte Ai = A2 = 0 und n — 2 Eigenwerte Xj mit ReXj ^ 0. Die reduzierte zweidimensionale Differentialgleichung A7.18) sei topologisch äquivalent zum ebenen System x = Vi V = Oi\ + a2x + x2 — xy. A7.26) Dann findet auf der Kurve S\ = {(«i, 0:2): al ~ ^ai = 0} eme Sattelknoten-Bifurkation statt. Auf ^2 = {(ai, «2)" ai = 0) a2 < 0} entsteht beim Übergang aus dem Gebiet a\ < 0 in das Gebiet a\ > 0 durch eine HOPF-Bifurkation ein stabiler Grenzzyklus und auf S3 = {(«i, a2): e*i = — fea^ + • • •} (A; > 0, const) existiert für das Ausgangssystem eine Separatrixschleife (Abb. 17.27), die im Gebiet 3 in einen stabilen Grenzzyklus bifurkiert (s. [17 1], [17.17]). Diese Bifurkation ist von globaler Natur und wird als Entstehung eines einzigen periodischen Orbits aus dem homoklinen Orbit eines Sattels oder Auflösung einer Separatrixschleife bezeichnet ^ ^ a. J K K°- Abbildung 17.27 3. Verallgemeinerte Hopf-Bifurkation Für A7 16) seien die Voraussetzungen der HOPF-Bifur- kation mit r > 6 erfüllt und die zweidimensionale reduzierte Differentialgleichung habe nach einer Koordinatentransformation in Polarkoordinaten die Normalform r = e\r + e^r3 — r5 + • • •, •d = H . Das Bifurkationsdiagramm (Abb. 17.28) dieses Systems enthält die Linie S\ = {(£1, £2): £i = 0 , £2 7^ 0} , deren Punkte HOPF-Bifurkationen repräsentieren (s. [17.1]) Im Gebiet 3 existieren zwei periodische Orbits, von denen einer stabil, der andere instabil ist. Auf der Kurve 52 = {(£1, £2): £l + 4£2 > 0 , £1 < 0} verschmelzen diese beiden nicht hyperbolischen Zyklen in einen zusammengesetzten Zyklus, der im Gebiet 2 verschwindet
17 3 Bifurkationstheorie und Wege zum Chaos 861 Abbildung 17 28 5. Symmetriebrechung Manche Differentialgleichungen A7 16) besitzen Symmetrien im folgenden Sinne: Es existiert eine lineare Transformation T (oder sogar eine Gruppe von Transformationen), so daß f(Tx, e) = T f (x, e) für alle x G M und s G V ist Ein Orbit 7 von A7 16) heißt symmetrisch bezüglich T, falls T7 = 7 ist. Von einer symmetriebrechenden Bifurkation bei e = 0 spricht man z B. in A7.16) (bei 1 = 1), wenn für e < 0 eine stabile Ruhelage oder ein stabiler Grenzzyklus vorliegt, die jeweils symmetrisch bezüglich T sind, und bei e = 0 zwei weitere stabile Ruhelagen oder Grenzzyklen entstehen, die nicht mehr symmetrisch bezüglich T sind ¦ Für System A7.16) mit f{x,e) = ex — x3 definiert T: x 1—> — x eine Symmetrie, denn f(—x,e) = —/(x, e) (x G R, £ G R). Bei £ < 0 ist x\ = 0 eine stabile Ruhelage Bei £ > 0 gibt es neben x\ = 0 die beiden anderen Ruhelagen x2,3 = ±\ß, die beide nicht symmetrisch sind. 17.3.1.2 Lokale Bifurkationen nahe einem periodischen Orbit 1. Satz über die Zentrumsmannigfaltigkeit für Abbildungen Gegeben sei ein periodischer Orbit 7 von A7.16) bei e = 0 mit den Multiplikatoren p\,..., pn-i, pn — 1. Eine Bifurkation nahe 7 ist möglich, wenn bei Änderung von £ mindestens einer der Multiplikatoren auf den komplexen Einheitskreis trifft Die Verwendung einer zu 7 transversalen Fläche führt auf eine parameterabhängige PoiNCARE-Abbildung xi—>P(x,£) A7.27) Dabei sei P- E x V -> R71, wobei E C Rn_1 und V C R! offene Mengen sind, eine Cr-Abbildung, wobei die Abbildung P: E x V -> Rn_1 x Rl mit P(x, e) = (P(x, e), e) sogar ein Cr-Diffeomorphismus sei. Es sei weiter P@,0) = 0 und die JACOBI-Matrix DxP@y 0) habe s Eigenwerte pi,..., ps mit |pi| = 1, m Eigenwerte pa+i,. , ps+m mit |p;| < 1 und A; — n — s — m — 1 Eigenwerte p8+m+i,..., pn_i mit |pi| > 1. Dann ist nach dem Satz über die Zentrumsmannigfaltigkeit für Abbildungen (s. [17.11]) P nahe @,0)g£xV topologisch konjugiert zur Abbildung (z,y, 2,e) ^^ (P(x,e), ^, ^u2,e) A7.28) nahe @,0) G Rn_1 x Rl mit F(x, e) = ^cx + p(x, e) Dabei ist ^ eine Cr-differenzierbare Abbildung, die den Bedingungen #@,0) = 0 und Dxg@, 0) = 0 genügt Außerdem sind Ac, As bzw. Au Matrizen vom Typ (s, s), (m, m) bzw. (k, k) mit Eigenwerten auf, innerhalb bzw. außerhalb des Einheitskreises Aus A7.28) folgt, daß Bifurkationen von A7.27) nahe @,0) ausschließlich durch die reduzierte Abbildung xi—>F(x,e) A7 29) auf der lokalen Zentrumsmannigfaltigkeit Wf^. = {(x, y,z): y = 0, 2 = 0} beschrieben werden 2. Bifurkation eines zweifach zusammengesetzten semistabilen periodischen Orbits Gegeben sei das System A7 16) mit n > 2, r > 3 und / = 1 Das System A7 16) habe bei £ = 0 den periodischen Orbit 7 mit den Multiplikatoren p\ = +1, \pi\ ^ l(i = 2,3,...,n — 1) und pn = 1. Nach dem Satz über die Zentrumsmannigfaltigkeit für Abbildungen werden Bifurkationen in der PoiNCARE- Abbildung A7.27) durch die eindimensionale reduzierte Abbildung A7.29) mit Ac = 1 beschrieben
862 17. Dynamische Systeme und Chaos F(.,a) b) oc<0 a=0 oc>0 Abbildung 17 29 d2F dF Wird dabei -jt-j @,0) ^ 0 und -7— @,0) ^ 0 vorausgesetzt, so führt dies auf die Normalformen • F(x,a) = a + x + x2 A7 30) d2F (bei -—r@,0) > 0) bzw. oxz d2F, öl + x - x2 (bei -^-@,0) < 0). Die Iterationsverläufe von A7 30) nahe 0 und die zugehörigen Phasenporträts sind für verschiedene a in Abb.17.29a bzw. Abb.17.29b zusehen (s. [17.1]). Für a < 0 liegen eine stabile und eine instabile Ruhelage nahe x = 0 vor, die für a = 0 in der instabilen Ruhelage x = 0 verschmelzen Für a > 0 existiert keine Ruhelage nahe x = 0 Die durch A7.30) beschriebene Bifurkation in A7.29) heißt subkritische Sattelknoten-Bifurkation für Abbildungen. Für die Differentialgleichung A7.16) beschreiben die Eigenschaften der Abbildung A7.30) die Bifurkation eines zweifach zusammengesetzten semistabilen periodischen Orbits Bei a < 0 existieren ein stabiler periodischer Orbit 71 und ein instabiler periodischer Orbit 72 , die bei a = 0 zu einem semistabilen Orbit 7 verschmelzen, der sich bei a > 0 auflöst (Abb.l7.30a,b) a a<0 oc=0 a>0 b) c) Abbildung 17.30 3. Periodenverdopplung oder Flip-Bifurkation Gegeben sei das System A7.16) mit n > 2, r > 4 und / = 1. Betrachtet wird ein periodischer Orbit 7 von A7.16) bei e = 0 mit den Multiplikatoren pi = -1, \p{\ ^ 1 (i = 2, . ,n — 1) und pn = 1. Das Bifurkationsverhalten der PoiNCARE-Abbildung nahe 0 wird durch die eindimensionale Abbildung A7.29) mit Ac = —1 beschrieben, von der die Normalform x 1—? F(x, a) = (-1 + a)x + x3 A7 31) angenommen werden soll. Die Ruhelage x = 0 von A7.31) ist für kleine a > 0 stabil und für a < 0 instabil. Die zweite iterierte Abbildung F2 hat bei a < 0 außer x = 0 noch die beiden stabilen Fixpunkte x\%2 = ±y/—a + o(\a\), die keine Fixpunkte von F sind. Demzufolge müssen sie Punkte der Periode 2 von A7.31) sein.
17.3 Bifurkationstheorie und Wege zum Chaos 863 Allgemein formuliert, kommt es in einer C4-Abbildung A7.29) zur Entstehung eines zweiperiodischen Orbits bei e = 0, wenn folgende Bedingungen erfüllt sind (s. [17.2]): dF dF2 F@,0) = 0, _@,0) = -l, ^-@,0) =0, ox oe (\7'\tX\ d2F2 d2F2 d3F2 K } ^@,0)^0, ^@,0)=0, -^@,0) *0. dF dF2 Da wegen —— @,0) = — 1 auch -7— @,0) = +1 ist, sind damit für die Abbildung F2 die Bedingungen ox ox für eine Gabelbifurkation formuliert. Die Eigenschaften der Abbildung A7 31) implizieren für die Differentialgleichung A7.16), daß sich bei a = 0 von 7 ein stabiler periodischer Orbit 7Q mit etwa doppelter Periode abspaltet {Periodenverdopplung), wobei 7 seine Stabilität verliert (Abb.17.30c). ¦ Die logistische Abbildung <pa- [0,1] —> [0,1] ist für 0 < a < 4 durch (pQ(x) = ax(l — x), d.h. durch das zeitdiskrete dynamische System xt+i = axt(l - xt) A7.33) gegeben. Die Abbildung besitzt nach [17.9] folgendes Bifurkationsverhalten. Für 0 < a < 1 hat A7 33) die Ruhelage 0 mit dem Einzugsgebiet [0,1] Für 1 < a < 3 besitzt A7.33) die instabile Ruhelage 0 und die stabile Ruhelage 1 — £ , wobei letztere das Einzugsgebiet @,1) besitzt. Bei Qi = 3 wird die Ruhelage 1 — ^ instabil und zerfällt in einen stabilen 2periodischen Orbit. Beim Wert ot2 = 1 + >/6 wird auch der 2periodische Orbit instabil und durch einen stabilen 22- periodischen Orbit ersetzt Die Periodenverdopplung setzt sich fort, und es entstehen stabile 29-perio- dische Orbits bei a = aq Numerische Untersuchungen belegen für q —* +00 die Konvergenz aq —? »oo « 3,570 .. Bei a = a^ liegt ein Attraktor F vor (Feigenbaum-Attraktor), der die Struktur einer Cantor- ähnlichen Menge hat. In beliebiger Nähe des Attraktors liegen Punkte, die nicht in den Attraktor, sondern auf instabile periodische Orbits iteriert werden. Der Attraktor F hat dichte Orbits und eine HAUSDORFF-Dimension dn(F) « 0,538 Andererseits liegt keine sensitive Abhängigkeit von den Anfangszuständen vor Im Bereich a^ < a < 4 existiert eine Parametermenge A mit positivem LEBESGUE-Maß, so daß für a 6 A das System A7.33) einen chaotischen Attraktor positiven Maßes besitzt Die Menge A ist von Fenstern durchsetzt, in denen Periodenverdopplung auftritt Das Bifurkationsverhalten der logistischen Abbildung ist auch in einer Klasse von unimodalen Abbildungen, d.h von Abbildungen des Intervalls / in sich, die in / ein einfaches Maximum besitzen, zu finden. Obwohl die Parameterwerte c^ , bei denen Periodenverdopplung auftritt, für verschiedene solche unimodale Abbildungen sich voneinander unterscheiden, ist die Konvergenzrate, mit der diese Parameter gegen den jeweiligen Wert a^ streben, gleich: ajt — a^ « CS~k, wobei 5 = 4,6692. . die FEIGENBAUM-Konstante ist (C hängt von der konkreten Abbildung ab). Gleich sind auch die Hausdorff-Dimensionen der Attraktoren F bei a = a^: dn(F) « 0,538.... 4. Abspaltung eines Torus Gegeben sei A7 16) mit n > 3,r > 6 und 1 = 1. Für alle e nahe 0 habe A7.16) einen periodischen {TT 2tT ~] 0, —, —, TT >, pj (j = 3,. ., n — 1) mit \pj\ ^ 1 undpn = 1. Nach dem Satz über die Zentrumsmannigfaltigkeit ergibt sich in der vorliegenden Situation eine zweidimensionale reduzierte C6-Abbildung x>—>F(x,e) A7.34) mit F@, e) = 0 für e nahe 0. Hat die JACOBI-Matrix DxF@, e) für alle e nahe 0 die konjugiert komplexen Eigenwerte p(e) und ~p(e)
864 17 Dynamische Systeme und Chaos mit |p@)| = 1, ist d •= — |/o(e)||e=o > 0 und ist p@) für g = 1,2,3,4 keine q-te Wurzel aus 1, so läßt sich A7.34) durch eine glatte ^-abhängige Koordinatentransformation auf die Form x \-> F(x,e) = F0(x,s) + 0(\\x\\5) bringen (O LANDAU-Symbol), wobei F0 in Polarkoordinaten durch \p{e)\r + a(e)r3 gegeben ist. Dabei sind a,u und b differenzierbare Funktionen. Sei a@) < 0. Dann ist die Ruhelage r = 0 von A7 35) für alle e < 0 asymptotisch stabil und für e > 0 instabil Außerdem existiert bei e > 0 der Kreis r = J — , der invariant unter der Abbildung A7.35) und asymptotisch stabil ist (Abb.17.31a). Satz von Neimark und Sacker Der Satz von Neimark und Sacker (s. [17.18], [17 3]) sagt aus, daß das Bifurkationsverhalten von A7.35) auch auf F zutrifft (Superkritische HOPF-Bifurkation für Abbildungen). ¦ In der Abbildung A7.34), gegeben durch x\ 1 ((l + e)x + y + x2 -2y2 \y) \/2 \-x + A +e)y + x2 - x3 findet bei e = 0 eine superkritische HOPF-Bifurkation statt. Bezogen auf die Differentialgleichung A7 16) bedeutet die Existenz einer geschlossenen invarianten Kurve der Abbildung A7.34), daß bei a@) < 0 der periodische Orbit 70 instabil wird und sich bei e > 0 ein bezüglich A7 16) invarianter stabiler Torus abspaltet (Abb.17.31b). Abbildung 17.31 17.3.1.3 Globale Bifurkationen Neben der Entstehung eines periodischen Orbits durch Auflösung einer Separatrixschleife kann es in A7.16) zu weiteren globalen Bifurkationen kommen. Zwei davon sollen am Beispiel erläutert werden (s. [17.11]). 1. Entstehung eines periodischen Orbits durch Verschwinden eines Sattelknotens ¦ Das parameterabhängige System x = x(l - x2 - y2) + y(l + x + a), y = -x(l + x 4- a) + y(l - x2 - y2) hat in Polarkoordinaten x = r cos # , y = r sin # die Form r = r(l - r2), ti = -A + a + r costf). A7 36) Offenbar ist bei beliebigem Parameter a der Kreis r = 1 invariant unter A7 36), und alle Orbits (außer der Ruhelage @,0)) streben für t —> +00 zu diesem Kreis. Für a < 0 liegen ein Sattel und ein stabiler Knoten auf dem Kreis, die bei a = 0 zu einer zusammengesetzten Ruhelage vom Sattelknoten-Typ verschmelzen Für a > 0 liegt keine Ruhelage mehr auf der Kreislinie, die dann einen periodischen Orbit repräsentiert (Abb. 17.32).
17 3 Bifurkationstheorie und Wege zum Chaos 865 oc<0 a=0 a>0 Abbildung 17 32 2. Auflösung einer Sattel—Sattel—Separatrix in der Ebene ¦ Gegeben sei die parameterabhängige ebene Differentialgleichung x = a + 2xy, y = 1 + x2 - y2 . A7 37) Für a = 0 hat A7 37) die beiden Sättel @,1) und @, -1) und die y- Achse als invariante Menge. Teil dieser invarianten Menge ist der he- terokline Orbit. Für kleine |a| ^ 0 bleiben die Sattelpunkte erhalten, während der heterokline Orbit zerfällt (Abb. 17.33) 17.3.2 Übergänge zum Chaos Ein seltsamer Attraktor entsteht häufig nicht abrupt, sondern im Ergebnis einer Reihe von Bifurkatio- nen, von denen die typischen in Punkt A7 3.1) dargestellt wurden Die wichtigsten Wege zur Bildung seltsamer Attraktoren bzw. seltsamer invarianter Mengen sollen im weiteren beschrieben werden. 17.3.2.1 Kaskade von Periodenverdopplungen Analog zur logistischen Gleichung A7.33) kann es auch in zeitkontinuierlichen Systemen zu einer Kaskade von Periodenverdopplungen nach folgendem Szenario kommen. Das System A7.16) besitzt für e < ei den stabilen periodischen Orbit 7M. Bei e = £\ findet nahe 7^ eine Periodenverdopplung statt, bei der der periodische Orbit 7^ für e > £\ seine Stabilität verliert Von ihm spaltet sich ein periodischer Orbit 7^) mit etwa doppelter Periode ab. Bei e = £2 findet erneut eine Periodenverdopplung statt, wobei 7^ seine Stabilität verliert und ein stabiler Orbit 7^ mit nahezu doppelter Periode entsteht Für wichtige Klassen von SystemenA7.16) setzt sich dieser Prozeß der Periodenverdopplung fort, so daß eine Folge von Parameterwerten {£j} entsteht Numerische Berechnungen für bestimmte Differentialgleichungen A7.16) (z.B bei hydrodynamischen Differentialgleichungen wie dem LORENZ-System) belegen die Existenz des Grenzwertes lim gJ+1~gJ =5, A7 38) j^+OO £j+2 - £j + l wobei S wieder die FEIGENBAUM-Konstante ist Bei e* = lim e,- verliert der Zyklus mit unendlicher Periode seine Stabilität, und es kommt zur Bildung j-+oo eines seltsamen Attraktors. Der geometrische Hintergrund der Entstehung dieses seltsamen Attraktors in A7 16) durch eine Kaskade von Periodenverdopplungen ist in Abb.17.34a zu sehen. Der PoiNCARE-Schnitt zeigt dabei näherungsweise eine Bäcker-Abbildung, die auf die Entstehung einer C ANTOR-Mengen-ähnliche Struktur hindeutet. 17.3.2.2 Intermittenz Gegeben sei ein stabiler periodischer Orbit von A7.16), der bei £ = 0 seine Stabilität verliert, indem genau einer der Multiplikatoren, die innerhalb des Einheitskreises lagen, den Wert +1 annimmt. Nach O ttl a<0 a^O a>0 Abbildung 17 33
866 17. Dynamische Systeme und Chaos Abbildung 17.34 'dem Satz über die Zentrumsmannigfaltigkeit läßt sich die entsprechende Sattelknoten-Bifurkation der PoiNCARE-Abbildung durch eine eindimensionale Abbildung in der Normalform x i—> F(x, a) = a + x + x2 -\ beschreiben Dabei ist a ein Parameter, für den a = a(e) mit a@) = 0 gilt. Für positives a ist der Graph von F(-, a) in Abb. 17.34b zu sehen. Wie die Abb. 17.34b zeigt, verweilen für a>, 0 die Iterierten von F(-,a) relativ lange in der Tunnelzone. Für die Gleichung A7.16) bedeutet dies, daß die entsprechenden Orbits relativ lange in der Umgebung des ursprünglichen periodischen Orbits bleiben. In dieser Zeit ist das Verhalten von A7 17) nahezu periodisch (laminare Phase). Ist die Tunnelzone durchlaufen, entflieht der betrachtete Orbit, was zu irregulären Bewegungen führt (turbulente Phase) Nach einem gewissen Zeitraum wird der Orbit eingefangen und erneut eine laminare Phase eingeleitet. Ein seltsamer Attraktor entsteht in der beschriebenen Situation dann, wenn der periodische Orbit verschwindet und seine Stabilität an die chaotische Menge vererbt Die Sattelknoten-Bifurkation ist nur eine der generischen lokalen Bifurka- tionen, die im Intermittenz-Szenario eine Rolle spielen Zwei weitere sind die Periodenverdopplung und die Abspaltung eines Torus 17.3.2.3 Globale homokline Bifurkationen 1. Satz von Smale Die invarianten Mannigfaltigkeiten der PoiNCARE-Abbildung einer Differentialgleichung A7 16) im R3 nahe dem periodischen Orbit 7 seien wie in Abb. 17.IIb. Die transversalen homoklinen Punkte Pj(xo) korrespondieren mit einem bezüglich 7 homoklinen Orbit von A7 16) Die Existenz eines solchen homoklinen Orbits in A7 16) führt zu einer sensitiven Abhängigkeit von den Anfangs werten. In Verbindung mit der betrachteten PoiNCARE-Abbildung lassen sich die auf Smale zurückgehenden Hufeisen-Abbildungen konstruieren, die zu folgenden Aussagen führen Satz von Smale: In jeder Umgebung eines transversalen homoklinen Punktes der PoiNCARE-Abbildung A7.29) existiert ein periodischer Punkt dieser Abbildung. Darüber hinaus existiert in jeder Umgebung eines transversalen homoklinen Punktes eine für Pm(m € IN) invariante Menge A, die vom CANTOR-Typ ist. Die Einschränkung von Pm auf A ist topologisch konjugiert zu einem BERNOULLI- Shift, d h. zu einem mischenden System Die invariante Menge der Differentialgleichung A7 16) nahe des homoklinen Orbits sieht aus wie das Produkt einer CANTOR-Menge mit dem Einheitskreis Ist diese invariante Menge anziehend, stellt sie für A7.16) einen seltsamen Attraktor dar. 2. Satz von Shilnikov Betrachtet wird die Differentialgleichung A7.16) im R3 mit einem skalaren Parameter s. Das System A7 16) habe bei £ = 0 die hyperbolische Ruhelage 0 vom Sattelknoten-Typ, die für kleine \e\ erhalten bleibe Die JACOBI-Matrix Dxf@,0) habe den Eigenwert A3 > 0 und die konjugiert komplexen Eigenwerte Ai;2 = a ±iüü mit a < 0. Weiter habe A7.16) bei e = 0 eine Separatrixschleife 70 , d.h einen homoklinen Orbit, der für t —? — 00 und t —> +00 gegen 0 geht (Abb. 17.35a) Dann hat A7.16) nahe der Separatrixschleife folgende Phasenporträts. a) Sei A3 + a < 0 Bricht die Separatrixschleife bei e ^ 0 in der mit A gekennzeichneten Variante (Abb.17.35a) auf, so setzt bei e = 0 genau ein periodischer Orbit von A7.16) ein. Bricht die Sepa-
17 3 Bifurkationstheorie und Wege zum Chaos 867 ratrixschleife bei e ^ 0 in der mit B gekennzeichneten Variante (Abb. 17.35a) auf, so entsteht kein periodischer Orbit. b) Sei A3 + a > 0 Dann existieren bei e = 0 (bzw für kleine |e|) nahe der Separatrixschleife 70 (bzw. nahe der zerfallenen Schleife 70) abzählbar unendlich viele sattelartige periodische Orbits Die PoiNC ARE-Abbildung bezüglich einer zu 70 transversalen Ebene erzeugt bei e = 0 eine abzählbar unendliche Menge von Huf eisen-Abbildungen, von denen bei kleinen |e| ^ 0 eine endliche Anzahl bleibt b) W(p, Abbildung 17.35 3. Melnikov-Methode Gegeben sei die ebene Differentialgleichung x = f(x) + eg(t, x), A7 39) wobei e ein kleiner Parameter ist. Für e = 0 sei A7.39) ein HAMILTON-System, d.h. für / = (/1, f2) ßH c)H gelte /1 = -— und U = — -— , wobei H: U C R2 —? R eine C3-Funktion sei. Das zeitabhängige ox2 oxi Vektorfeld g • R x U —? R2 sei zweimal stetig differenzierbar und T-periodisch bezüglich des ersten Arguments. Außerdem seien / und g beschränkt auf beschränkten Mengen. Bei e = 0 existiere in A7 39) ein homokliner Orbit bezüglich des Sattelpunktes 0 Der PoiNCARE-Schnitt £fo von A7 39) im Phasenraum {(xi,x2,t)} bei t = t0 sehe aus wie in Abb.17.35b. Die PoiNCARE-Abbildung PEtto. ^2tQ —> J2t0 nat mr kleine \e\ einen Sattel p£ nahe x = 0 mit den invarianten Mannigfaltigkeiten Ws(p£) und Wu(p£). Ist der homokline Ortyt des ungestörten Systems durch ip(t — to) gegeben, so läßt sich der Abstand der Mannigfaltigkeiten Ws(p£) und Wu(p£), gemessen entlang der Geraden, die durch (p@) verläuft und senkrecht auf /(y>@)) steht, durch die Formel A7.40a) berechnen: d{to) = £U(m)\\+(,(£2h A7'40a) wobei M(-) die durch +00 M(t0) = I f(tp{t - *0)) A g(t, <p(t - to)) dt A7.40b) —00 definierte Melnikov-Funktion ist (Für a = @1,02) und b = (bi, b2) ist a A b = 0162 — 02^1)- Besitzt die MELNIKOV-Funktion M in t0 eine einfache Nullstelle (d.h. gilt M(t0) = 0 und M'(t0) ^ 0), so schneiden sich die Mannigfaltigkeiten Ws(p£) und Wu(p£) für genügend kleine e > 0 transversal Wenn M keine Nullstellen besitzt, gilt Ws(p£) D Wu(p£) = 0 , d.h., es gibt keine homoklinen Punkte Bemerkung: Das ungestörte System A7.39) besitze einen heteroklinen Orbit, gegeben durch ip(t—to), der aus einem Sattel 0i in einen Sattel 02 läuft. Seien p\ undp2. die Sattel der PoiNCARE-Abbildung P£j0 für kleine \e\ Besitzt M, berechnet wie oben, in £0 eine einfache Nullstelle, so schneiden sich Ws(pl) und Wu(pi) für kleine e > 0 transversal ¦ Betrachtet wird die periodisch gestörte Pendelgleichung x + sin x = e sin ut, d h. das System x = y, y = — sin x + £ sin ut, in der e ein kleiner Parameter und u ein weiterer Parameter ist Das ungestörte System x = y , y = — sinx ist ein HAMILTON-System mit H(x,y) = \y2 — cosx . Es besitzt (u.a ) ein Paar heterokliner Orbits durch (—7r,0) und Gr,0) (im zylindrischen Phasenraum
868 17. Dynamische Systeme und Chaos S1 x R sind dies homokline Orbits), gegeben durch (f±(t) = (±2arctan(sinh£), ±2—¦—) (t G R) cosht Die direkte Berechnung der MELNIKOV-Funktion liefert M(t0) = =f—n rr • Da M bei t0 = 0 coshGra;/2) eine einfache Nullstelle besitzt, hat die PoiNCARE-Abbildung des gestörten Systems für kleine e > 0 transversale homokline Punkte. 17.3.2.4 Auflösung eines Torus 1. Vom Torus zum Chaos 1. Hopf-Landau-Modell der Turbulenz Die Frage des Übergangs von einem regulären (laminaren) Verhalten zu einem irregulären (turbulenten) Verhalten ist besonders für Systeme mit verteilten Parametern, die z B. durch partielle Differentialgleichungen beschrieben werden, von Interesse Aus dieser Sicht läßt sich Chaos als zeitlich irreguläres, aber räumlich geordnetes Verhalten interpretieren Turbulenz dagegen ist ein Systemverhalten, das sowohl zeitlich als auch räumlich irregulär ist. Das HOPF-LANDAU-Modell erklärt die Entstehung der Turbulenz über eine unendliche Kaskade von HOPF -Bifurkationen- Bei e = E\ entsteht aus einer Ruhelage ein Grenzzyklus, der bei £2 > £i instabil wird und zu einem Torus T2 fuhrt Bei der k-ten Bifurkation entsteht ein fc-dimensionaler Torus, der durch nicht geschlossene Orbits aufgewickelt wird. Das HOPF-LANDAU-Modell fuhrt im allgemeinen nicht zu einem Attraktor, der durch sensitive Abhängigkeit von den Anfangsbedingungen und Durchmischung gekennzeichnet ist. 2. Ruelle—Takens-Newhouse-Szenario Im System A7.16) sei n > 4 und / = 1. Bei Änderung des Parameters e sei die Bifurkationssequenz Ruhelage —» Periodischer Orbit —? Torus T2 —> Torus T3 über drei aufeinander folgende HOPF-Bifurkationen realisiert. Der auf T3 gegebene quasiperiodische Fluß sei strukturell instabil. Dann können schon bestimmte kleine Störungen von A7.16) zum Zerfall von T3 und zur Bildung eines seltsamen Attraktors führen, der strukturell stabil ist. 3. Satz über den Glattheitsverlust und die Zerstörung eines Torus T2von Afraimovich und Shilnikov [17.1] Gegeben sei das hinreichend glatte System A7 16) bei n > 3 und 1 = 2. Beim Parameterwert £0 habe System A7.16) einen anziehenden glatten Torus T2(e0), der aufgespannt wird durch einen stabilen periodischen Orbit 7S, einen sattelartigen periodischen Orbit ju und dessen instabile Mannigfaltigkeit Wu(ju) (Resonanz-Torus). Die invarianten Mannigfaltigkeiten der Ruhelagen der PoiNCARE-Abbildung bezüglich einer Fläche, die transversal zur Längsrichtung den Torus schneidet, sind in Abb. 17.36a dargestellt. Der Multiplikator p von 7s, der dem Einheitskreis am nächsten liegt, sei reell und einfach Es sei weiter e(-) [0,1] —? V eine beliebige stetige Kurve im Parameterraum, für die e@) = £q gilt, und für die das System A7 16) bei e = e{l) keinen invarianten Resonanz-Torus besitzt Dann gelten folgende Aussagen- a) Es existiert ein Wert s* G @,1), bei dem T2(e(s*)) seine Glattheit verliert. Dabei wird entweder der Multiplikator p(s*) komplex, oder die instabile Mannigfaltigkeit Wu{^u) verliert ihre Glattheit nahe 7, b) Es existiert ein weiterer Parameterwert s** G (s*, 1), so daß das System A7 16) für s € (s**, 1] keinen resonanten Torus besitzt Der Torus zerfällt dabei nach einem der folgenden Szenarien- ol) Der periodische Orbit js verliert seine Stabilität bei e = e(s**). Es kommt zu einer lokalen Bifurkation wie der Periodenverdopplung oder der Abspaltung eines Torus. ß) Die periodischen Orbits 7„ und 7S fallen bei e = e(s**) zusammen (Sattelknoten-Bifurkation) und heben sich dabei auf. 7) Die stabilen und instabilen Mannigfaltigkeiten von ju schneiden sich bei e = e(s**) nicht transversal (s. Bifurkationsdiagramm in Abb. 17.36c). Die Punkte auf der schnabelförmigen Kurve 5i entsprechen dem Verschmelzen von js und 7^ (Sattelknoten-Bifurkation). Die Schnabelspitze C\ liegt auf einer Kurve So , die der Abspaltung eines Torus entspricht. Auf der Kurve #2 liegen die Parameterpunkte, bei denen ein Glattheitsverlust eintritt, während die Punkte auf £3 die Auflösung eines T2-Torus charakterisieren. Auf 64 liegen die Parameterpunkte, für
17 3 Bifurkationstheorie und Wege zum Chaos 869 '»/ a) b) c) > S,4 P ?4 ,S, Abbildung 17.36 die sich stabile und instabile Mannigfaltigkeiten von yu nicht transversal schneiden Sei P0 ein beliebiger Punkt in der Schnabelspitze, so daß bei diesem Parameterwert ein Resonanz-Torus T2 vorliegt. Der Übergang von P0 nach Pi entspricht dem Fall a) des Satzes Wird dabei auf 52 der Multiplikator p zu -1, so findet eine Periodenverdopplung statt Eine sich anschließende Kaskade von weiteren Periodenverdopplungen kann zum Entstehen eines seltsamen Attraktors führen Trifft beim Überqueren von S2 ein Paar konjugiert komplexer Multiplikatoren piJ auf den Einheitskreis, dann kann es zur Abspaltung eines weiteren Torus kommen, für den der Satz von AFRAIMOVICH und SHILNIKOV erneut anwendbar ist Der Übergang von P0 nach P2 repräsentiert den Fall ß) des Satzes: Der Torus verliert die Glattheit, und beim Überqueren von S\ findet eine Sattelknoten-Bifurkation statt. Der Torus zerfällt, und ein Übergang zum Chaos über Intermittenz kann stattfinden. Der Übergang von P0 nach P3 schließlich entspricht Fall 7) Nach dem Verlust der Glattheit bildet sich beim Überqueren von S4 eine nicht robuste homokline Kurve. Der stabile Zyklus js bleibt, und es entsteht eine zunächst nicht anziehende hyperbolische Menge Wenn 7S verschwindet, kann aus dieser Menge ein seltsamer Attraktor entstehen. 2. Abbildungen auf dem Einheitskreis und Rotationszahl 1. Äquivalente und geliftete Abbildungen Beim Glattheitsverlust und Zerfall eines Torus spielen die Eigenschaften invarianter Kurven der PoiNCARE-Abbildung eine wichtige Rolle Stellt man die PoiNCARE-Abbildung in Polarkoordinaten dar, so erhält man unter gewissen Voraussetzungen losgekoppelte Abbildungen der Winkelvariablen als aussagefähige Hilfsabbildungen auf dem Einheitskreis Diese sind im Falle glatter invarianter Kurven (Abb. 17.36a) umkehrbar und im Falle nichtglatter Kurven (Abb.17.36b) nicht umkehrbar. Eine Abbildung F. R -+ R mit F(<9+1) = F(9) +1 für alle 0 G R, die das dynamische System 6W1 = F(ßn) A7.41) erzeugt, heißt äquivariant. Jeder solcher Abbildungen läßt sich auch eine Abbildung auf dem Einheitskreis/ S1 -+ SlmitSl =R\Z = {<9modl,6> G R} zuordnen Dabei ist f(x) := F@), wenn für die Aquivalenzklasse [0] die Beziehung x = [0] gilt. Man bezeichnet F als eine von f geliftete Abbildung Offenbar ist diese Zuordnung nicht eindeutig. Im Gegensatz zu A7 41) ist xt+i = f(xt) A7 42) ein dynamisches System auf Sl ¦ Sind uj und K zwei Parameter, so sei die Abbildung F(- ;lü ,K) für alle r G R durch F(cr;u, K) = 0 + Lü — K sin g definiert Das zugeordnete dynamische System an+\ = an + lü — K sin an A7 43) läßt sich durch die Transformation an = 2ir0n auf das System <9n+i = On + Ü - — sin 27r<9n Z7T A7.44) mit Q = —- überführen. Mit F((9, Sl, K) = O + Q sin 2-kO liegt eine äquivariante Abbildung vor, Z7T 2lT die die Standardform der Kreisabbildung erzeugt
870 17. Dynamische Systeme und Chaos 2. Rotationszahl Der Orbit 7(<9) = {Fn@)} von A7.41) ist genau dann ein q-periodischer Orbit von A7.42) in S1, wenn er ein p/q — Zyklus von A7 41) ist, d h , wenn eine ganze Zahl p existiert, so daß On+q = &n + p,(n € Z) gilt. Die Abbildung / : 51 —* 51 heißt orientierungstreu, wenn es eine zugehörige geliftete Abbildung F gibt, die monoton wachsend ist Ist F aus A7 41) ein monoton Fn(x) wachsender Homöomorphismus, so existiert für jedes x G R der Grenzwert lim , und dieser |n|-K» n Fn(x) Grenzwert hängt nicht von x ab. Es kann deshalb der Ausdruck p(F) := lim definiert werden rV ' |nHoo n Ist / : S1 —? S1 ein Homöomorphismus und sind F sowie F zwei von / geliftete Abbildungen, so gilt p(F) = p(F) + k, wobei k eine ganze Zahl ist Aufgrund der letzten Eigenschaft läßt sich die Rotationszahl (oder Windungszahl) p(f) eines orientierungstreuen Homöomorphismus / S1 —? Sl als p(f) — p(F) m°d 1 definieren, wobei F eine beliebige von / geliftete Abbildung ist. Ist / Sl —> S1 in A7.42) ein orientierungstreuer Homöomorphismus, so hat die Rotationszahl folgende Eigenschaften (s. [17 11]): a) Hat A7.42) einen ^-periodischen Orbit, so existiert eine ganze Zahl p, so daß p(f) = - ist. b) Ist p(f) = 0, so hat A7.42) eine Ruhelage. p c) Ist p(f) = - , wobei p^O, ganzzahlig und q eine natürliche Zahl ist (p und q teilerfremd), so hat A7.42) einen g-periodischen Orbit. d) p(f) ist genau dann irrational, wenn A7.42) weder einen periodischen Orbit noch eine Ruhelage besitzt Satz von Denjoy- Ist /: S1 —> S1 ein orientierungstreuer C2-Diffeomorphismus und ist die Rotationszahl öl = p(f) irrational, so ist / topologisch konjugiert zu einer reinen Drehung, deren geliftete Abbildung F(x) = x + a lautet. 3. Differentialgleichungen auf dem Torus T2 Sei 0i = /iF>i,6>2), 6>2 = /2F>i,6>2) A7.45) eine ebene Differentialgleichung, in der /1 und /2 differenzierbare und 1-periodische Funktionen in beiden Argumenten sind. In diesem Fall definiert A7.45) einen Fluß, der auch als Fluß auf dem Torus T2 = S1 x S1 bezuglich 6>i und 02 interpretiert werden kann. Ist fi{©i,02) > 0 für alle F>i, <92), so besitzt A7.45) keine Ruhelage und ist äquivalent zur skalaren Differentialgleichung 1. Ordnung gg» = /»(gi.ft). A746) dßl /i@i,e2)- [uqo) h Mit den Bezeichnungen <9i = t, ©2 = x und / = — läßt sich A7.46) als nichtautonome Differential- h gleichung x = f(t,x) A7 47) schreiben, deren rechte Seite 1-periodisch bezüglich t und x ist. Es sei ip(',xo) die Lösung von A7.47) mit Anfang x0 zur Zeit t = 0. Damit kann man A7 47) eine Abbildung tp1^) = </?(l, •) zuordnen, die als geliftete Abbildung einer Abbildung / S1 —> 51 gelten kann. ¦ Seien lji,U2 € R Konstanten und ©\ = u\, ©2 — ^2 eine Differentialgleichung auf dem Torus, die Cc>2 ^2 für üüi 7^ 0 der skalaren Differentialgleichung x = — äquivalent ist. Damit ist ip(t, Xo) = —t + x0 und (p (x) = \-x .
17.3 Bifurkationstheorie und Wege zum Chaos 871 4. Standardform einer Kreisabbildung 1. Standardform Die Abbildung F aus A7 44) ist für 0 < K < 1 ein orientierungstreuer Diffeo- dF morphismus, da —- = 1 — K cos 2ir,d > 0 ist Bei K — 1 ist F kein Diffeomorphismus mehr, aber ov noch ein Homöomorphismus, während für K > 1 die Abbildung nicht mehr invertierbar und damit auch kein Homöomorphismus mehr ist. Im Parameterbereich 0 < K < 1 ist für F(-, Q, K) die Rotationszahl p{ü,K) •= p{F(--Q,K)) definiert. Sei K G @,1) fixiert. Dann hat p(-,K) auf [0,1] folgende Eigenschaften- a) Die Funktion p(-,K) ist nicht fallend, stetig, aber nicht differenzierbar. b) Für jede rationale Zahl - G [0,1) existiert ein Intervall Ip/q , dessen Inneres nicht leer ist und für das p(Q, K) = - für alle ft G Ip/q gilt. c) Für jede irrationale Zahl a G @,1) gibt es genau ein Q mit p(ft, K) = a 2. Teufelstreppe und Arnold-Zunge Für jedes K G @,1) ist p(-,K) also eine Cantor- Funktion. Der Graph von p(-,K), der auf Abb. 17.37b dargestellt ist, heißt Teufelstreppe (deviVs staircase) Das Bifurkationsdiagramm von A7.44) ist auf Abb.17.37a zu sehen. Von jeder rationalen Zahl auf der Q-Achse geht ein schnabelförmiges Gebiet (ARNOLD-Zunge) mit nicht leerem Inneren aus, in dem die Rotationszahl konstant und gleich der rationalen Zahl ist. K 1 a) k o / l/ 1 3 / ( 1 2 \ / i 3 \ \ \ 1 \l Ü Abbildung 17.37 Ursache für das Entstehen der Zungen ist eine Synchronisation der Frequenzen (Frequenzkopplung oder frequency locking). Für 0 < K < 1 überlappen sich diese Gebiete nicht Von jeder irrationalen Zahl auf der fi-Achse geht eine stetige Kurve aus, die immer die Gerade K = 1 erreicht. In der ersten ARNOLD- Zunge mit p = 0 hat das dynamische System A7 44) Ruhelagen. Ist K fixiert und wächst Q. an, so verschmelzen auf dem Rand der ersten ARNOLD-Zunge zwei dieser Ruhelagen und heben sich dabei gleichzeitig auf Im Ergebnis einer solchen Sattelknoten-Bifurkation entsteht ein auf Sl dichter Orbit. Ahnliche Erscheinungen lassen sich beim Verlassen der anderen ARNOLD-Zungen beobachten. Für K > 1 ist die Theorie der Rotationszahlen nicht mehr anwendbar Die Dynamik wird komplizierter, und es findet ein Übergang zum Chaos statt Dabei treten, ähnlich wie im Falle der Feigenbaum- Konstante, weitere Konstanten auf, die für bestimmte Klassen von Abbildungen, zu denen auch die Standard-Kreisabbildung gehört, gleich sind Eine davon wird im folgenden beschrieben. V5 _ i 3. Goldenes Mittel, Fibonacci-Zahlen Die irrationale Zahl —-— heißt Goldenes Mittel (s. 111 4,3., S 4) und besitzt die einfache Kettenbruchdarstellung — 1— Durch sukzessives Abschneiden des Kettenbruches erhält man eine Folge {rn} 1 + - von rationalen Zahlen, die gegen y/b-1 konvergiert Die Zahlen rn lassen sich in der Form rn - 2 0 „ . F^ darstellen, wobei Fn FiBONACCi-Zahlen sind (s. auch 5.4 1.5, S. 334), die sich durch die Iterationsvor-
872 17. Dynamische Systeme und Chaos schrift Fn+i — Fn + Fn_i (n = 1,2, • • •) mit den Startwerten F0 = 0 und Fi = 1 bestimmen lassen v/5 — 1 Sei nun f^ der Parameterwert von A7.44), für den p(Qoo, 1) = —-— ist und sei jeweils £ln der fi«, am nächsten liegende Wert, für den p(fin, 1) = rn ist. Eine numerische Analyse ergibt den Grenzwert «-°° O . - O lim ^L_^zl = _2,8336..
873 18 Optimierung 18.1 Lineare Optimierung 18.1.1 Problemstellung und geometrische Darstellung 18.1.1.1 Formen der linearen Optimierung 1. Gegenstand der linearen Optimierung ist die Minimierung oder Maximierung einer linearen Zielfunktion (ZF) von endlich vielen Variablen unter Einhaltung einer endlichen Anzahl von Nebenbedingungen (NB) oder Restriktionen, die als lineare Gleichungen bzw Ungleichungen vorliegen Die Bedeutung der linearen Optimierung besteht darin, daß viele praktische Aufgabenstellungen direkt auf lineare Optimierungsprobleme führen bzw durch lineare Modelle näherungsweise als lineare Optimierungsprobleme beschrieben werden können und daß Theorie und Lösungsverfahren anschaulich und übersichtlich dargestellt werden können 2. Allgemeine Form Ein lineares Optimierungsproblem besitzt die folgende allgemeine Form: ZF: NB: /(x) = C\X\ + • • • + crxr + cr+ixr+i + • • • + cnxn = max! 01,1^1 ^ •" altr%r + öl,r+l^r+l H h CL\,nXn < h , üSiiXi +• • + as+i^rxr + as+i)r+ia:r+i + • • + as+iinxn = bs+i, "tti,l^l i***i Q'm,r'Er ~r ^*m,r+l ^"+1 i * * " i Ö77; X\ > 0, ,xr>0, aJr+i) • j^n frei Die abgekürzte Schreibweise wird Kurzform genannt ZF: /(x) = c^x1 + c2V = max! Dabei bedeuten* A8.2a) NB = bm Anx1 + A12x2 < b1, A21X1 + A22x2 = b2 , x1 > 0, x2 frei. A8.1a) A8 lb) A8 2b) c2 \CrJ , C" Cr+2 \ Cn ) /flu 0-12 •'• ai,r\ 021 Ö22 * * * Q>2,r \fls,l as,2 ' ' * 0>s,r I x2 \xr) (Xr+l^ Xr+2 \ Xn ) / 0>l,r+l al,r+2 '' Al,r+n\ Ö2,r+1 «2,r+2 ' * * «2,r+n \ ö«,r+l ös,r+2 * * * &s,n A8 2c) A8 2d) /fls+1,1 fls+1,2 *•' ös+l,r\ ös+2,1 «s+2,2 * * * ös+2,i \ am,l «m,2 flm,r / /fls+l.r+1 ßs+l,r+2 "• Gs+l,n \ ös+2,r+l as+2,r+2 * ' * ös+2,n \flm,r+l Öm,r+2 Q"m,n / A8 2c) 3. Nebenbedingungen Treten Nebenbedingungen mit „>"-Zeichen auf, dann werden diese durch Multiplikation mit ( — 1) auf die obige Form gebracht
874 18 Optimierung 4. Minimumaufgabe Liegt eine Minimumaufgabe /(x) = min' vor, so wird diese in die äquivalente Maximumaufgabe überführt: -/(x) = rnax' A8.3) 5. Ganzzahligkeitsforderungen Mitunter werden an einige Variable zusätzlich Ganzzahligkeits- forderungen gestellt Auf derartige diskrete Probleme soll hier nicht näher eingegangen werden 6. Formulierung mit vorzeichenbeschränkten Variablen und Schlupfvariablen Für die Herleitung eines Lösungsverfahrens ist es günstig, das System der Nebenbedingungen A8.1b), A8 2b) als Gleichungssystem mit vorzeichenbeschränkten Variablen zu schreiben Dazu wird jede freie Variable Xk durch die Differenz von jeweils zwei nicht negativen Variablen Xk = x\ — x\ ersetzt Die Ungleichungsbedingungen werden durch Addition einer nichtnegativen Variablen, der Schlupf variablen, in Gleichungen überführt Damit nimmt das lineare Optimierungsproblem die nebenstehende Form an Die Kurzform lautet: ZF-/(x) NB: CiXi + öi,i^i H ~r CnXn ZF: /(x) = cTx = rnax' A8 5a) NB: x\ > 0,... ,xn > 0. Ax = b , x > 0. A8 4a) A8 4b) A8.5b) Es kann vorausgesetzt werden, daß m < n, da anderenfalls das Gleichungssystem linear abhängige bzw widersprüchliche Gleichungen enthält. 7. Zulässiger Bereich Die Menge aller nichtnegativen Vektoren x > 0, die allen Nebenbedingungen genügen, bilden den zulässigen Bereich M- M = {x € Rn • x > 0, Ax = b}. A8 6a) Ein Punkt x* G M mit der Eigenschaft /(x*) > /(x) für alle x € M A8 6b) heißt Maximalpunkt oder Lösungspunkt des linearen Optimierungsproblems. 18.1.1.2 Beispiele und graphische Lösungen 1. Beispiel Herstellung zweier Produkte Für die Herstellung zweier Produkte E\ und E2 werden die Ausgangsstoffe Ri, R2 und R3 benötigt Aus dem Schema 18.1 sind die für die Erzeugung einer Produkteinheit (PE) der Produkte E\ und E2 erforderlichen Mengeneinheiten (ME) der Ausgangsstoffe sowie die verfügbaren Materialkontingente zu entnehmen. Der Verkauf einer Produkteinheit von E\ bzw £2 er- Schema 18 1 bringt einen Gewinn von 20 bzw. 60 Gewinneinheiten (GE). Gesucht ist ein Produktionsprogramm, das maximalen Gewinn sichert, wobei mindestens 10 Produktionseinheiten von Ei erzeugt werden sollen. Bezeichnet man mit x\ bzw. X2 die Anzahl der Produkteinheiten von E\ bzw E2, dann ergibt sich die folgende Aufgabe ZF: /(x) = 20xi + 60^2 = max! Ei E2 Kontingent ME Ri pro PE 12 6 630 ME R2 pro PE 8 12 620 ME Rz pro PE 0 10 350 NB: 12zi + 6x2 < 630, 8x1 + 12x2 < 620, 10x2 < 350, xi > 10 Einführung von Schlupfvariablen X3, X4, X5, xq führt auf.
18 1 Lineare Optimierung 875 ZF NB. /(x) = 20xi + 60x2 + 0 • x3 4- 0 • xA + 0 • t5 + 0 • x6 = max' X'3 12xi + 6x2 + 8:ri + 12x2 10x2 -Xi + x4 x5 + x6 = 630, = 620, = 350, = -10. A8 7) 2. Eigenschaften linearer Optimierungsprobleme An Hand des Beispiels können einige Eigenschaften linearer Optimierungsprobleme graphisch veranschaulicht werden. Dazu kann auf die Einführung von Schlupfvariablen verzichtet werden a) Eine Gerade a\X\ + ü2X2 = b teilt die Xi,x2-Ebene in zwei Halbebenen Somit liegen alle Punkte (x\, t2), die die Ungleichung d\X\ + a2x2 < b erfüllen, auf dieser Geraden bzw in einer der Halbebenen Die graphische Darstellung der Punktmenge in einem karte- sischen Koordinatensystem erfolgt durch Einzeichnen der trennenden Geraden, und die Halbebene, die die Lösungsmenge der Ungleichung enthält, wird mit Pfeilen gekennzeichnet. Die Ausführung der graphischen Darstellung aller Nebenbedingungen liefert eine Menge Abbildung 18 1 von Halbebenen, deren Durchschnitt den zulässigen Bereich M bildet (Abb.18.1). Im Beispiel bilden die Punkte von M eine Polygonfläche. Es kann auch vorkommen, daß M unbeschränkt oder leer ist Treffen in einer Ecke des Polygons mehr als zwei begrenzende Geraden aufeinander, dann spricht man von einer entarteten Ecke (Abb. 18.2) Abbildung 18 2 b) Alle Punkte in der x\, x2-Ebene, die der Beziehung f(x) = 20xi+60.t2 = c0 genügen, liegen auf einer gemeinsamen Geraden, der Niveaulinie zum Funktionswert c0 Bei verschiedener Wahl von c$ wird eine Schar paralleler Geraden definiert, auf denen der Zielfunktionswert jeweils konstant ist Geometrisch sind alle diejenigen Punkte Lösungen des Optimierungsproblems, die sowohl zum zulässigen Bereich M als auch zu einer Niveaulinie 20xi +60x2 = c0 mit einem maximalen c0 gehören Im konkreten Fall ergibt sich auf der Niveaulinie 20a;i + 60x2 = 2600 der Maximalpunkt (xi,x2) = B5,35). Die Niveaulinien sind in Abb. 18.3 dargestellt, wobei die Pfeile in die Richtung wachsender Funktionswerte zeigen Somit wird bei beschränktem zulässigen Bereich M das Maximum in mindestens einer Ecke von M eingenommen Bei unbeschränktem M kann der Zielfunktionswert auch gegen unendlich streben 18.1.2 Grundbegriffe der linearen Optimierung, Normalform Betrachtet wird die Aufgabe A8 5a,b) mit dem zulässigen Bereich M. 18.1.2.1 Ecke und Basis 1. Definition der Ecke Ein Punkt x € M heißt Ecke von M, wenn für alle Xi, x2 G M mit xt ^ x.2 x^ Ax! + A-A)x2, 0<A<1 A8 8) gilt, d h., x liegt nicht auf der Verbindungsgeraden zweier verschiedener Punkte aus M .
876 18. Optimierung P4=D,2,0) Abbildung 18.3 Abbildung 18.4 2. Satz über den Eckpunkt Der Punkt x € M ist genau dann ein Eckpunkt von M, wenn die zu den positiven Komponenten von x gehörenden Spalten der Matrix A linear unabhängig sind. Unter der Annahme, daß der Rang von A gleich m ist, können nur maximal m Spalten von A linear unabhängig sein. Deshalb kann ein Eckpunkt höchstens m positive Komponenten besitzen Die restlichen n — m Komponenten sind gleich Null. Im Normalfall sind genau m Komponenten positiv. Ist die Anzahl der positiven Komponenten jedoch kleiner als m , dann spricht man von einer entarteten Ecke 3. Basis Jeder Ecke können m linear unabhängige Spaltenvektoren der Matrix A zugeordnet werden, so daß darunter die zu positiven Komponenten gehörenden Spalten enthalten sind. Dieses System der linear unabhängigen Spaltenvektoren nennt man eine Basis der Ecke. Im Normalfall ist einer Ecke eindeutig eine Basis zugeordnet. Einer entarteten Ecke hingegen können im allgemeinen mehrere Basen zugeordnet werden. Es gibt höchstens ( ) Möglichkeiten, aus den n Spalten von A m linear unabhängige auszuwählen. Demzufolge ist die Anzahl verschiedener Basen und somit auch der Ecken »gleich (£). höchstens i , Ist M nicht leer, so hat M mindestens eine Ecke ZF: /(x) = 2zi + 3x2 + 4z3 = max! NB: xi + x2 + . x3 > 1, x2 <2, -xi + 2x3 < 2, 2zi - 3x2 + 2x3 < 2. Der durch die Nebenbedingungen festgelegte zulässige Bereich M ist in Abb. 18.4 dargestellt. Einführung von Schlupfvariablen £4, £5, x6, x7 führt auf NB: x\ + x2 + x2 -xi + 2x3 2x\ — 3^2 + 2x3 x3 - xA + x5 + x6 + x7 ¦¦ Dem Eckpunkt des Polyeders P2 = @,1,0) entspricht im erweiterten System der Punkt x = (xi, x2, £3, X4, £5, xq, x-j) = @,1,0,0,1,2,5). Die Spalten 2, 5, 6 und 7 von A bilden die zugehörige Basis. Dem Punkt P\ entspricht die entartete Ecke A,0,0,0,2,3,0). Eine Basis dieser Ecke besteht aus den Spalten 1, 5, 6 und einer der Spalten 2, 4 oder 7.
18 1 Lineare Optimierung 877 4. Ecke mit maximalem Funktionswert Die Bedeutung der Aussagen über die Ecken des zulässigen Bereiches M wird im folgenden Satz deutlich. Ist M nicht leer und die Zielfunktion /(x) = cTx auf M nach oben beschränkt, so ist mindestens eine Ecke von M ein Maximalpunkt. Eine lineare Optimierungsaufgabe kann somit gelöst werden, indem unter allen Ecken eine mit maximalem Funktionswert bestimmt wird Da aber die Anzahl der Ecken von M in praktischen Problemstellungen sehr hoch sein kann, ist eine Methode erforderlich, die eine optimale Ecke zielsicher ansteuert. Eine solche Methode ist das Simplexverfahren, auch Simplexalgorithmus genannt Zu seinem Einsatz ist eine geeignete Darstellung der linearen Optimierungsaufgabe erforderlich, aus der eine Ecke direkt abgelesen werden kann 18.1.2.2 Normalform der linearen Optimierungsaufgabe 1. Normalform und Basislösung Die lineare Optimierungsaufgabe kann immer, eventuell durch Umbenennung der Variablen, folgendermaßen umgeformt werden. ZF: /(x) = cixi H h cn.mxn.m + c0 = max! A8 9a) NB: Öl,l#l + • • • + öl,n-m^n-m + ^n-m+1 = b\ , ",m,l*^l i * ' * i U"m,n—m%n—m i %n — "m 5 Die letzten m Spalten der Koeffizientenmatrix sind offensichtlich linear unabhängig und bilden eine Basis Die Basislösung (x\,X2, ,xn-m, xn-m+i, ,xn) = @, ., 0, b\,. , bm) kann sofort aus dem Gleichungssystem abgelesen werden. Ist b > 0, dann heißt A8.9a,b) eine Normalform oder kanonische Form des linearen Optimierungsproblems In diesem Falle ist die Basislösung zulässig, d.h , sie ist x > 0, und somit eine Ecke von M In der Normalform bezeichnet man die Variablen xi,. ., xn_m als Nichtbasisvariable und xn_m+1,..., xn als Basisvanable. Der zur Ecke gehörende Zielfunktionswert ist Co, da die in der Zielfunktion auftretenden x-Komponenten, die Nichtbasisvariablen, verschwinden. 2. Ermittlung der Normalform Ist eine Ecke von M bekannt, dann kann eine Normalform des linearen Optimierungsproblems wie folgt ermittelt werden. Man wählt eine zur Ecke gehörende Basis aus m Spalten von A Im Normalfall sind diese Spalten durch die positiven Komponenten der Ecke festgelegt. Die Basisvariablen werden zum Vektor xß und die Nichtbasisvariablen zum Vektor x^ zusammengefaßt Die zur Basis gehörenden Spalten bilden die Basismatrix Aß, die restlichen Spalten die Matrix AN Dann gilt ' Ax = ANxN + AßXß = b A8.10) Die Matrix A# ist regulär und besitzt die Inverse A^1, die sogenannte Basisinverse. Multiplikation von A8 10) mit A^1 und Umstellung der Zielfunktion nach den Nichbasisvariablen liefert eine kanonische Form des linearen Optimierungsproblems. ZF- /(x) = cjx* + Co , NB Aß1 ANxN + Xß = A^b mit xN > Q, xß > 0 ¦ Im obigen Beispiel ist x = @,1,0,0,1,2, 5) eine Ecke. Somit ist X2 X5 Xq X7 X\ Xs X4 A8 9b) A8.11a) A8 IIb) 0 A8 12a) 0/
878 18. Optimierung und ABlAN -(T Xl 1 -1 2 5 £3 ergibt sich das System Xi + X2 + X3 -xi - x3 —xi + 2x3 5xi + 5^3 + i X4 Xi x4 + x5 3^4 + £6 A^b = A8.12b) A8 13) + x7 ¦¦ Aus /(x) = 2xi + 3x2 + 4x3 erhält man durch Subtraktion der mit 3 multiplizierten ersten Nebenbedingung eine auf Nichtbasisvariablen umgerechnete Zielfunktion /(x) = -xx + x3 + 3x4 + 3. A8 14) 18.1.3 Simplex verfahren 18.1.3.1 Simplextableau Mit dem Simplexverfahren wird eine Folge von Eckpunkten des zulässigen Bereiches mit wachsenden Zielfunktionswerten ermittelt. Der Übergang zu einer neuen Ecke wird vollzogen, indem eine zur gegebenen Ecke gehörende Normalform zu einer Normalform der neuen Ecke umgewandelt wird Zur übersichtlichen Darstellung dieses Vorganges sowie zur Formalisierung der rechentechnischen Umsetzung wird eine als bekannt vorausgesetzte Normalform A8.9a,b) in das Simplextableau (Schema 18.2a, 18.2b) eingetragen: Schema 18 2a Schema 18.2b Xn—m+l Xn Xi • fll.l • 0>m,l ' Cl • Xn—m Q>l,n—m Q"m,n—m Cn—m h bm -Co oder kürzer xß 2£jv -Co Die k-te Zeile des Tableaus ist zu lesen als Xn—m+k ~r 0,k,lX\ ~r " * ' ~r CLk,n—mXn—m z ¦¦h. A8 15a) Für die Zielfunktion gilt c\X\ -\ h cn_mxn_m = /(x) — c0 A8 15b) Aus dem Simplextableau wird die Ecke (x^, xB) = @, b) abgelesen Gleichzeitig ist der Zielfunktions- wert dieser Ecke durch /(x) = c$ bestimmt. Auf jedes Tableau trifft genau einer der drei Fälle zu: a) Cj < 0, j = 1, .. ,n — rn: Das Tableau ist optimal. Der Punkt (xjv,xß) = @,b) ist der Maximalpunkt b) Für mindestens ein j gilt Cj > 0 und %• < 0, i = 1, .., m- Das lineare Optimierungsproblem besitzt keine Lösung, da die Zielfunktion in Richtung wachsender x^-Werte unbeschränkt wächst. c) Für alle j mit Cj > 0 gibt es mindestens ein i mit a^ > 0: Man kann von einer Ecke x zu einer Ecke x übergehen mit /(x) > /(x)- Für eine nichtentartete Ecke x gilt immer das „>"-Zeichen. 18.1.3.2 Übergang zum neuen Simplextableau 1. Nichtentarteter Fall Ist ein Tableau nicht entscheidbar (Fall c)), dann wird ein neues Tableau (Schema 18.3) bestimmt, indem eine Basisvariable xp ausgewählt und gegen eine Nichtbasisvariable
18 1 Lineare Optimierung 879 xq unter Beachtung folgender Austauschregeln ausgetauscht wird: a) < = £• b) äPj c) äiq d) äij ¦ i*pj W'pq: ¦ U{q ' Upq " 0>ij i Ö.p7 , — On ' flD< *' ' " ' ff fH i^P* cq = -cq • äpq. A8.16a) i ^ P, 3 ^ Q, bi =bi + bp- äiq, i ^ p, Cj = Cj + apj • cq, j ^ q, c0 = c0 + bq • cq. Das Element apq heißt Pivotelement, die p-te Zeile Pivotzeile und die g-te Spalte Pivotspalte. Bei der Auswahl von Pivotzeile und Pivotspalte sind zwei Bedingungen zu berücksichtigen: a) Das neue Tableau muß zulässig sein, d.h., es muß gelten b > 0, b) Es muß gelten c0 > Cq Dann ist (xN,xB) = @,b) eine neue Ecke mit nicht kleinerem Zielfunktionswert /(x) = Cq. Die angegebenen Bedingungen werden mit der folgenden Wahl des Pivotelementes erfüllt: a) Wähle ein q mit cq > 0 als Pivotspalte; b) wähle die Pivotzeile p so, daß gilt A8.17) bp —^ = mm apq Ki<m \h l«iQ Sind die Ecken des zulässigen Bereiches nicht entartet, dann bricht das Simplexverfahren nach einer endlichen Anzahl von Simplexschritten mit einem entscheidbaren Tableau ab (Fall a) oder Fall b)). ¦ Die zum Beispiel in 18.1.2, S. 876 gefundene Normalform kann direkt in ein Simplextableau übertragen werden (Schema 18.4a). Das Tableau ist nicht optimal, da in der letzten Zeile noch positive Koeffizienten der Zielfunktion auftreten. Die dritte Spalte wird als Pivotspalte festgelegt (auch die zwei- Schema 18 3 Schema 18.4a Schema 18 4b Xß -Co Schema 18 4c X2 X5 Xq X7 X\ 1 -1 -1 5 -1 x3 x4 1 -1 -1 1 2 0 5 -3 1 3 1 1 2 5 -3 1 : 1 X2 X4 Xq X7 X\ 0 -1 -1 2 2 Z3 0 -1 2 2 4 xb 1 1 0 3 -3 2 1 2 8 -6 Schema 18.4d Schema 18.5 x2 X4 xs x7 Xl 0 3 2 1 ~2 1100 4 Xq 0 1 » toi 1 2 -1 -2 ^5 1 1 0 COI -3 2 2 1 6 -10 X2 x4 X3 Xl Xl 0 1 2 1 6 1 3 4 3 Xq 0 0 1 3 1 ~3 2 ~3 x5 1 5 2 1 2 1 -7 2 5 2 2 -18 2/i Vm ZF ZF* X\ ' Xn 0-1,1 ' • ' al,n Q"m,l ' ' ' Q"m,n Cl '" Cn m m Yl Oj,l ' ' ' Z) Öj,n J'=l J=l 6i 0 m 6:3 te Spalte wäre denkbar). Mit allen positiven Koeffizienten der Pivotspalte bildet man die Quotienten bi/aiq. Die Quotienten wurden hinter der letzten Spalte des Tableaus notiert Der kleinste Quotient legt die Pivotzeile fest. Ist die Pivotzeile nicht eindeutig zu bestimmen, dann ist die durch das neue Ta-
880 18 Optimierung bleau bestimmte Ecke entartet. Mit den Austauschregeln erhält man das Tableau in Schema 18.4b. Dieses Tableau bestimmt die Ecke @,2,0,1,0, 2,8), die dem Punkt P7 in Abb. 18.4 entspricht Da das neue Tableau nicht optimal ist, wird jetzt xq gegen xs getauscht (Schema 18.4c) Die Ecke des 3. Ta- bleaus entspricht dem Punkt Pq in Abb. 18.4. Nach einem weiteren Tausch erhält man ein optimales Tableau (Schema 18.4d) mit dem Maximalpunkt x* = B,2,2,5,0,0,0), der dem Punkt P5 mit dem maximalen Zielfunktionswert /(x*) = 18 entspricht. 2. Entarteter Fall Ist in einem Simplextableau nach erfolgter Pivotspaltenwahl die Festlegung der Pivotzeile nicht eindeutig möglich, dann wird das neue Tableau eine entartete Ecke darstellen Geometrisch ist eine entartete Ecke als Zusammenfallen mehrerer Ecken in einem Punkt interpretierbar Für eine solche Ecke gibt es mehrere Basen. Somit kann der Fall eintreten, daß einige Austauschschritte ausgeführt werden, ohne zu einer neuen Ecke zu gelangen Es sind sogar Beispiele konstruierbar, die nach einigen Schritten ein bereits betrachtetes Tableau ergeben, so daß unendlich viele Zyklen auftreten können. Beim Auftreten einer entarteten Ecke ist es möglich, das Gleichungssystem durch Addition von el (mit einem geeigneten e > 0) zu den Restriktionskonstanten bt so zu stören, daß diese und alle folgenden Ecken des gestörten Systems nicht mehr entartet sind und das Optimum des gestörten Problems mit dem des ungestörten Problems übereinstimmt, wenn man in der Lösung e = 0 setzt Algorithmisch wird diese Störung durch einen Zusatz zum Simplextableau erreicht, worauf hier nicht eingegangen werden soll Werden die Pivotspalte und im nicht eindeutigen Fall die Pivotzeile „zufällig" gewählt, dann ist eine Zyklenbildung in den meisten praktischen Fällen unwahrscheinlich. 18.1.3.3 Bestimmung eines ersten Simplextableaus 1. Hilfsprogramm und künstliche Variable Häufig ist es besonders bei einer großen Anzahl von Nebenbedingungen schwierig, sofort eine Ecke und damit ein Simplextableau anzugeben. Daher stellt man zunächst ein Hilfsprogramm auf, aus dessen Lösung sich ein Simplextableau der ursprünglichen Aufgabe ergibt Dazu wird das Gleichungssystem Ax = b durch Multiplikation einzelner Gleichungen mit (—1) so modifiziert, daß b > 0 gilt Nun wird auf der linken Seite jeder Gleichung eine künstliche Variable y^ > 0 (k = 1,2, .., m) addiert und das folgende Hilfsproblem formuliert ZF*: #(x,y) = -2/1 Vm = max! A8 18a) NB*: a,i,\X\ H h ai>nxn + y\ = &i, 1 am,ixi +•••+ am,nxn +yn = bm,) A8 18b) xu...,xn > 0; yi,...,ym > 0. J Mit 2/i, ,ym als Basisvariable kann sofort ein erstes Simplextableau angegeben werden (Schema 18.5) Die letzte Zeile des Tableaus enthält die auf Nichtbasisvariable umgerechneten Koeffizienten der Hilfszielfunktion ZF* Offensichtlich ist #(x, y) < 0 Ist für einen Maximalpunkt (x*, y*) des Hilfsproblems g(x% y*) = 0, dann ist y* = 0 und folglich x* eine Lösung von Ax = b Andererseits besitzt Ax = b bei #(x*, y*) < 0 keine Lösung 2. Fallunterscheidung Ziel der Lösung des Hilfsprogramms mit dem Simplexverfahren ist es, die künstlichen Variablen aus der Basis zu entfernen Wird eine künstliche Variable zur Nichtbasisvariable, dann kann die zugehörige Spalte im Tableau gestrichen werden. Man ermittelt so einen Maximalpunkt (x*,y*) und unterscheidet* 1. g(x*,y*) < 0 Das System Ax = b besitzt keine Lösung 2. g{x*,y_*) = 0: Falls sich unter den Basisvariablen keine künstlichen Variablen befinden, ist sofoit ein Tableau für die ursprüngliche Aufgabe gegeben Anderenfalls wird so lange aus einer zu einer künstlichen Variablen gehörenden Zeile ein Pivotelement ^ 0 gewählt, ein Austauschschritt ausgeführt und anschließend die Pivotspalte gestrichen, bis alle künstlichen Variablen aus dem Tableau entfernt worden sind.
18.1 Lineare Optimierung 881 Durch die Einfuhrung von kunstlichen Variablen kann die Dimension des Hilfsproblems stark anwachsen. Mitunter ist es nicht notwendig, zu jeder Gleichung eine künstliche Variable zu addieren War das System der Nebenbedingungen vor der Einführung von Schlupfvariablen gegeben durch AiX > hx, A2x = b2, A3x < bg mit bl5 b2, h$ > 0, dann sind nur in den ersten beiden Systemen künstliche Variable erforderlich Für das dritte System können die Schlupfvariablen als erste Basisvariable gewählt werden. ¦ Im Beispiel von Abschnitt 18.1 2, S. 875 ist nur in der ersten Gleichung eine künstliche Variable erforderlich* ZF*: 0(x,y)= -s/1 = max! NB*: xi + x2 + x3 - X4 + Vi = 1, X\ + X2 + £3 - x2 -X\ + 2X3 2xi - 3£2 + 2^3 - 2/1 - x4 + 2/1 + £5 + £6 + X7 ¦¦ 2, 2, 2. Das ermittelte Tableau (Schema 18.6b) ist mit #(x*,y*) = 0 optimal. Durch Streichen der zweiten Spalte erhält man ein erstes Tableau für das Ausgangsproblem. Schema 18.6b 1 : 1 2 1 2/1 x5 x6 x7 ZF ZF* Schema 18.6a X\ X2 Xs £4 111-1 0 10 0 -10 2 0 2-320 2 3 4 0 111-1 1 2 2 2 0 1 x2 x5 Xq x7 ZF ZF* X\ 2/1 1 1 -1 -1 -1 0 5 3 -1 -3 0 -1 x3 x4 1 -1 -1 1 2 0 5 -3 1 3 0 0 1 1 1 2 5 -3 0 18.1.3.4 Revidiertes Simplex verfahren 1. Revidiertes Simplextableau Das lineare Optimierungsproblem sei in einer Normalform gegeben: ZF: /(x) = C1X1 + • • • + cn_mxn_m + Co = max! A8.19a) NB: ai,ixi + h ahn-mxn-m + xn-m+1 = ßx, ) Si^i "• 1- ai m,n—m^n—m ~y xn Pjtj A8.19b) x\ > 0, .., xn > 0 Um zu einer anderen Normalform und damit zu einer anderen Ecke zu wechseln, genügt es, das Gleichungssystem A8.19b) mit der entsprechenden Basisinversen zu multiplizieren. Das Simplexverfahren kann also dahingehend modifiziert werden, daß in jedem Schritt anstatt eines neuen Tableaus nur die Basisinverse ermittelt wird Vom eigentlichen Tableau sind nur die zur Bestimmung des neuen Pivotelements erforderlichen Größen zu berechnen. Ist die Anzahl der Variablen sehr groß im Vergleich zur Anzahl der Nebenbedingungen (n > 3m), dann erreicht man mit der revidierten Simplexmethode eine beachtliche Verringerung an Rechenaufwand und Speicherplatz bei gleichzeitiger Erhöhung der Rechengenauigkeit. Die allgemeine Form eines revidierten Simplextableaus zeigt das Schema 18.7. Die eingetragenen Größen haben die folgende Bedeutung: xf,..., x^: Aktuelle Basisvariable. Ci,.. , cn: Auf Nicht basisvariable umgerechnete Koeffizienten der Zielfunktion 61, ., bm: Rechte Seite der aktuellen Normalform. Wert der Zielfunktion in der Ecke (xf,..., x%) = (bi ,bm)
882 18. Optimierung 01,71—m+1 Gl,r \ Q"m,n—m+\' ' ' ' "m,7 . r = (ri,...,rm)T. Aktuelle Pivotspalte. Aktuelle Basisinverse, wobei die Spalten von A* die zu den Variablen Xn-m+i,..., xn gehörenden Spalten der aktuellen Normalform sind. xf *l Xl ¦ Cl • Xn—m • cn-m Schema 18 7 ^71 — 771+1 fll,n-m+l * * " "TO, 71 — 771+1 Cn-m+l '•• ^n ßl,n «771,71 Cn bi bm -Co xq n rm cq 2. Revidierter Simplexschritt a) Das Tableau ist nicht optimal, solange wenigstens ein Cj > 0 ist (j = 1,2, ., n). Auswahl der Pivotspalte q für ein cq > 0 b) Berechnung der Pivotspalte r durch Multiplikation der q-ten Spalte der Koeffizientenmatrix von A8 19b) mit A* und Eintragen des ermittelten Vektors in die letzte Spalte des Tableaus. Ermittlung der Pivotzeile wie beim Simplexalgorithmus gemäß A8.17) c) Berechnung des neuen Tableaus mit den Austauschregeln A8 16a-d), wobei formal aiq durch r* ersetzt wird und die Indizes im Bereich n—m+1 < j < n liegen. Die Größen fj werden nicht eingetragen Mit c = (cn_m+i, ., cn)T ermittelt man für j = 1, ,n — mcj = Cj + ajc , wobei Qj die j-te Spalte der Koeffizientenmatrix von A8.19b) darstellt ¦ In die Normalform des Beispiels von 18.1 2, S 876 soll xA aufgenommen werden Die zugehörige Pivotspalte r = 04 wird in das Tableau (Schema 18.8a) eingetragen Schema 18 8b x2 x5 Xq X7 Schema 18 8a Xi £3 X4 -113 X2 X5 Xq X7 10 0 0 0 10 0 0 0 10 0 0 0 1 0 0 0 0 1 1 2 5 -3 X4 -1 1 0 -3 3 1 1 X2 X4 Xq X7 Xi £3 X4 2 4 0 x2 1 0 0 0 0 X5 Xq X7 1 0 0 1 0 0 0 1 0 3 0 1 -3 0 0 2 1 2 8 -6 xs 0 -1 Ilto 2 4 1 1 0 0\ 0 10 0 0 0 10' 0 3 0 1/ / 1 -1 2 V 5 Für j = 1,3,4 erhält man. Cj = Cj — 3a2j' (ci, c3, C4) = B,4,0). Der ermittelte Eckpunkt x = @,2,0,1,0,2,8) entspricht dem Punkt P7 in Abb.18.4. Als nächste Pivotspalte wird j = 3 bestimmt Die Größe r mit r = (n,. .,rm) = A*a3 = ist im 2 Tableau (Schema 18.8b) bereits eingetragen. Der weitere Rechengang erfolgt in Analogie zum Beispiel von 18 1.3 2, S 879 18.1.3.5 Dualität in der linearen Optimierung 1. Zuordnung Jeder linearen Optimierungsaufgabe (primales Problem) läßt sich umkehrbar eindeutig ein zweites Optimierungsproblem (duales Problem) zuordnen-
18 1 Lineare Optimierung 883 ': /(x) = 3: AltlX! A2,lXl Kl >0, Ci Xj 1 Qn —2 — + A1?2x2 < bj + A2,2x2 = b2 x2 frei. ZF*: NB*: Duales Problem #(u) = b^U! + bju2 = min! A8 21a) A^xü! + Ajau2 > Ci, A^Ui + A£2u2 = c2 , Ui > 0, u2 frei. A8 21b) Primales Problem max! A8.20a) A8.20b) Die Koeffizienten der Zielfunktion des einen Problems bilden die rechte Seite der Nebenbedingungen des anderen Problems Jeder freien Variablen entspricht eine Gleichungs- und jeder vorzeichenbeschränkten Variablen eine Ungleichungsbedingung des jeweiligen anderen Problems 2. Dualitätsaussagen a) Besitzen beide Probleme zulässige Punkte, d h., M ^ 0, M* ^ 0, dann gilt /(x) < g(u) für alle x € M, u G M*, A8.22a) und für beide Probleme existieren Optimalpunkte b) Die Punkte x € M und u G M* sind genau dann Optimalpunkte des jeweiligen Problems, wenn gilt /(x) = 0(u) A8 22b) c) Ist /(x) über M nach oben bzw g(u) über M* nach unten unbeschränkt, so ist M* = 0 bzw M = 0 d) Die Punkte x e M und u G M* sind genau dann Optimalpunkte der jeweiligen Aufgaben, wenn gilt u^Ai^Xi + Aii2x2 - bj) = 0 und x^A^Ui + Ajau2 - Cj) = 0. A8 22c) An Hand der letzten beiden Beziehungen kann man aus einer nicht entarteten Optimallösung u des dualen Problems eine Lösung x des primalen Problems aus dem folgenden linearen Gleichungssystem ermitteln: A2,iXi + A2,2x2 - b2 = 0, A8.23a) (Ai.iXx + Ai,2x2 - bji = 0 für u{ > 0 , A8.23b) Xi = 0 für (A^Ui + A^u2 - cji ^ 0. A8 23c) Zur Lösung des dualen Problems kann das Simplexverfahren verwendet werden. 3. Einsatzgebiete der dualen Aufgabe Die Bearbeitung des dualen Problems kann in den folgenden Fällen von Vorteil sein. a) Wenn für das duale Problem eine Normalform leichter zu finden ist, geht man von der primalen zur dualen Aufgabe über b) Wenn im primalen Problem die Anzahl der Restriktionen groß gegenüber der Anzahl der Variablen ist, so kann bei der Lösung des dualen Problems mit dem revidierten Simplexverfahren der Rechenaufwand verringert werden ¦ Für das Beispiel aus 18 1 2, S 876 gilt ohne Schlupfvariablen Primales Problem ZF: f(x) = 2xx + 3x2 + 4x3 = max' NB: -xi - x2 - x3 < -1, x2 < 2, -xi + 2x3 < 2, 2xx - 3x2 + 2x3 < 2, Wird das duale Problem nach Einführung von Schlupfvariablen und Aufstellung eines ersten Simplex- tableaus mit dem Simplex verfahren gelöst, dann ergibt sich unter Vernachlässigung der Schlupfvaria- ZF*: NB*: Duales Problem g(u) = —u\ + 2u2 + 2u3 + 2w4 —u\ — u3 + 2uA > 2 , —U\ + u2 — 3ii4 > 3, —u\ + 2u3 + 2u4 > 4, Wl,W2,^3,ti4 > 0.
884 18. Optimierung blen in der Lösung: u* = (it1} u2, u3, w4) = @,7,2/3,4/3) mit g(u) = 18. Daraus kann eine Lösung x* des primalen Problems über das System (Ax — b)i = 0 für U{ > 0 ermittelt werden, d h , x2 = 2, -xi + 2xz = 2, 2x1 - 3x2 + 2x3 = 2, so daß schließlich folgt, x* = B,2,2) mit /(x) = 18 18.1.4 Spezielle lineare Optimierungsprobleme 18.1.4.1 Transport problem 1. Modell Ein von m Erzeugern Ei,E2,. ., Em in den Mengen ai, a2,.. , am produziertes Erzeugnis soll zu n Verbrauchern Vi, V^,..., Vn mit dem Bedarf &i, b2, • • •, bn transportiert werden. Die Kosten des Transportes einer Produkteinheit vom Erzeuger Ei zum Verbraucher V3 betragen Cy. Von Ei werden Xy Produkteinheiten zu Vj transportiert. Gesucht ist eine, die Transportkosten minimierende Aufteilung der Erzeugnisse auf die Verbraucher. Es wird vorausgesetzt, daß die Gesamtkapazität der Erzeuger gleich dem Gesamt verbrauch ist, d.h. f> = X>- A8.24) i=l j=l Man bildet die Kostenmatrix C und die Verteilungsmatrix X* E: £ p _ / ci,i • • • ci,n \ Ei / aji,i • • • xi>n \ ai ' • j . , A8.25a) X= : * : A8 25b) V: Vi-'-Vn E: h-'-bn Ist die Bedingung A8.24) nicht erfüllt, dann werden zwei Fälle unterschieden: a) Für £ Oi > £ 6j wird ein fiktiver Verbraucher Vn+1 mit dem Bedarf 6n+1 = J2 <k - E &j und den Transportkosten Cj,n+i = 0 eingeführt. b) Für J2ai < J2bj wird ein fiktiver Erzeuger Em+i mit der Kapazität am+i = Y^bj — £a» und den Transportkosten cm+ii:7 = 0 eingeführt. Zur Bestimmung eines optimalen Verteilungsplanes ist das folgende Optimierungsproblem zu lösen: ZF: /(X) = J21t, ciJxiJ = min! A8 26a) NB. ^Xij^ai (i = l,...,m), X^^^^ (j = l,. .,n), a?y > 0). A8 26b) j=i *=i Das Minimum dieses Problems wird in einer Ecke des zulässigen Bereiches angenommen. Von den m+n Nebenbedingungen sind m + n — 1 linear unabhängig, so daß eine Ecke im nicht entarteten Fall, der hier vorausgesetzt werden soll, m + n — 1 positive Komponenten Xij besitzt Die folgende Bestimmung eines optimalen Verteilungsplanes wird als Transportalgorithmus bezeichnet 2. Ermittlung einer zulässigen Basislösung Mit der „Nordwestecken-Regel" kann immer eine erste zulässige Basislösung (Ecke) ermittelt werden a) Setze Xn = min(ai,&i) . A8.27a) b) Ist ai < &i, streicht man die erste Zeile von X. A8 27b) Ist a\ > &i, streicht man die erste Spalte von X. A8 27c) Ist ai = &i, streicht man wahlweise die erste Zeile oder die erste Spalte von X A8.27d) Liegen nur noch eine Zeile, aber mehrere Spalten vor, dann ist eine Spalte zu streichen und umgekehrt c) Ersetze a\ durch a\ — X\\ und b\ durch b\ — x\\ und wiederhole den Vorgang mit dem reduzierten Schema.
18 1 Lineare Optimierung 885 Alle bei diesem Verfahren im Schritt a) besetzten Variablen sind Basisvariable, alle anderen sind Nichtbasisvariable und erhalten den Wert 0. E E 5 3 2 7 \ Ei I xu xiJ xi,3 £i,4 \ ai=9 8 2 1 1 £2 , X = X2,l X2,2 ^2,3 £2,4 a2 = 10 . 9 2 6 3 / Ez \ x3ji x3J x3,3 x3L / a3 = 3 V Vi V2 I/3 ^4 £: &i =4b2 = 6b3 = 5b4 = 7 Ermittlung einer ersten Ecke mit der Nordwestecken-Regel: 1 Schritt 2. Schritt weitere Schritte /4 \ 0 5 /45-\ )J0 /4 5 — \ 0 X= I MO , x= I 10 » X= I 154 ljÖ?)iO. VI y 3 VI / 3 VI I 13/ 3 /i65 7 0057 0£7 0 ; /03 0 Verfahren zur Aufstellung eines ersten Verteilungsplanes, die auch die anfallenden Transportkosten berücksichtigen (z B VOGELsche Approximationsmethode, s [18 15]), liefern im allgemeinen bessere Erstlösungen 3. Lösung des Transportproblems mit der Potentialmethode Bei der Aufstellung des gewöhnlichen Simplextableaus für dieses Problem erhält man ein riesiges Schema vom Typ (ra + n) x (ra • n) mit einer großen Anzahl von Nullen Jede Spalte enthält nur zwei 1-Elemente. Deshalb arbeitet man besser mit einem reduzierten Schema Das Verfahren besteht aus Simplexschritten, die nur mit Nicht Null-Elementen des theoretischen Simplextableaus durchgeführt werden Die Matrix der Simplextableaus enthält die Koeffizienten der Zielfunktion Die Basisvariablen werden iterativ gegen die Nichtbasisvariablen ausgetauscht, um so jeweils eine zugehörige modifizierte Kostenmatrix zu berechnen Der Rechengang wird am Beispiel erläutert. a) Ermittlung der modifizierten Kostenmatrix C aus C mittels c*j = cij + Pi + Qj (^ — 1) • j m » J' = 1j • • • »n) » A8.28a) unter den Bedingungen Cij = 0 für (i,j) mit xij ist aktuelle Basisvariable. A8 28b) Dazu werden in C die zu Basis variablen gehörenden Kosten markiert und pi = 0 gesetzt. Die weiteren Größen pi und q^ auch Potentiale bzw Simplexmultiplikatoren genannt, werden so errechnet, daß zu markierten Kosten gehörende pi und qj zusammen mit den Kosten Cy die Summe 0 ergeben. ( E) C) 2 ? \*=° /0 0 05 \ ¦ C = 8 B) A) A) U = l ^ c= 4 0 00 A8 28c) \ 9 2 6 C) ; P3 = -1 V 3^2] 3 0J 9i = -5 <72 = -3 q3 = -2 qA = -2 b) Berechnung von cpq = minjcL-} A8 28d) ' Ist cpq > 0, dann ist der gegebene Verteilungsplan X optimal; anderenfalls wird xpq als neue Basisvariable gewählt Im Beispiel ist cpq = c32 = — 2 c) In C werden cpq und die zu Basisvariablen gehörenden Kosten markiert. Enthält C eine Zeile oder Spalte mit maximal einem markierten Element, dann wird diese Spalte oder Zeile gestrichen Mit der
886 18 Optimierung verbleibenden Restmatrix wird dieser Vorgang wiederholt, bis keine Streichungen mehr möglich sind. /(j>) @) j) 0 \ C = 4 @) (i) @) . A8.28e) \ I (-2) Is @)/ d) Die zu verbleibenden markierten Elementen Cy gehörenden Xij bilden einen Zyklus Man setzt zunächst xpq = 8 > 0. Alle weiteren zu markierten Cy gehörenden xy- werden so bestimmt, daß die Nebenbedingungen erfüllt bleiben Die Größe 8 errechnet sich aus 8 = xrs = mm{xij: Xij = x^ — ö}, A8.28f) wobei xrs Nichtbasisvariable wird. Im Beispiel ist 8 = min{l, 3} = 1 X /4 5 1-8 I V S 4 6 _ \ 5 4 + <5 T —> 3 — 5/ 5 7 10 X: 45 55 1 2 /(x) = 53 A8 5 Danach wird das Verfahren ab Schritt 1 und X / E) C) 2 7 C=| 8 2 A) A) C) V 9 Qi = ( 4 X = -5 q2 = 5-8 I 1 + 8 B) 6 3 tf3 = -4 q4 = -4 C = / (ft) @) (^2) 3 \ k 2 @) @) V MO) 3 @) A8 28h) 8 T 5-8 \ 5 + 8 T 2-8 8 = 2 X 432 37 3 /(X) - 49 A8 28i) Die nächste zu bestimmende Matrix C enthält keine negativen Elemente. Deshalb ist X ein optimaler Verteilungsplan. 18.1.4.2 Zuordnungsproblem Die Darlegung erfolgt an Hand eines Beispiels. ¦ Es sollen n Transportaufträge an n Transportunternehmen so vergeben werden, daß jedes Unternehmen genau einen Auftrag erhält. Gesucht ist die kostengünstigste Zuordnung, wenn das i-te Unternehmen für die Ausführung des j-ten Auftrages die Kosten c^ berechnet. Ein Zuordnungsproblem ist ein spezielles Transportproblem mit m = n und ai = bj = 1 für alle z, j ZF: /(x) - Y, Yl ciJxiJ = min' NB: Ylxij = 1 (i = 1T- •,n), J^Xij = 1 (j = l,...,n), i=l ^€{0,1} A8 29a) A8.29b) Jede zulässige Verteilungsmatrix enthält in jeder Zeile und jeder Spalte genau eine 1 und sonst Nullen Ausgehend von einer zulässigen Verteilungsmatrix X kann das Zuordnungsproblem ohne Beachtung der Ganzzahligkeitsforderungen mit dem Transportalgorithmus gelöst werden. Dabei ist jede zulässige Basislösung (Ecke) entartet, da n — 1 Basisvariable gleich Null sind. Es sind daher Maßnahmen zur
18.1 Lineare Optimierung 887 Vermeidung von Zyklen zu treffen Dieses Vorgehen ist sehr zeitaufwendig Effektiver ist die Ungarische Methode zur Lösung des Zuordnungsproblems (s. [18.11]). 18.1.4.3 Verteilungsproblem Das Problem wird an Hand eines Beispiels dargelegt. ¦ Die m Produkte Ei, E2,..., Em sind in den Mengen ai, a2, .,flm herzustellen. Jedes Produkt kann auf jeder der n Maschinen Mi, M2, , Mn produziert werden Zur Herstellung einer Produkteinheit des Produktes Ei benötigt die Maschine Mj die Bearbeitungszeit b^ und verursacht dabei die Kosten Cij. Die insgesamt für die Maschine Mj zur Verfügung stehende Maschinenzeit sei bj. Die auf jeder Maschine Mj von jedem Produkt Ei herzustellenden Mengen x^ sollen so festgelegt werden, daß die verursachten Gesamtkosten möglichst gering sind Aus der Aufgabe ergibt sich das folgende allgemeine Modell eines Verteilungsproblems. ZF: /(x) = Y^ JT djXij = min! A8.30a) i=l3=1 m n NB: ^Xij = üi (i = 1, . ,ra), X^üxü < h- (j = 1,. , n), x^ > 0 für alle z,j. A8.30b) j=i *=i Das Verteilungsproblem ist eine Verallgemeinerung des Transportproblems und kann mit dem Simplexverfahren gelöst werden Sind alle b^ = 1, dann kann nach Einführung eines fiktiven Produktes Em+l (s 18 1 4 1,1., S 884) der effektivere Transportalgorithmus (s. 18.1.4.1,1., S. 884) zur Lösung herangezogen werden 18.1.4.4 Rundreiseproblem Gegeben sind n Orte 0\, ö2,.. , On . Um von Oi nach Oj zu gelangen, muß ein Reisender die Entfernung Cij zurücklegen. Dabei kann Cy ^ Cji möglich sein Es ist eine kürzeste Reiseroute so zu wählen, daß ein Reisender jeden Ort genau einmal besucht und am Ende zum Ausgangsort zurückkehrt Wie beim Zuordnungsproblem ist wiederum in jeder Zeile und jeder Spalte der Entfernungsmatrix C genau ein Element auszuwählen, so daß die Gesamtsumme der ausgewählten Elemente minimal wird. Allerdings wird die numerische Lösung des Rundreiseproblems beträchtlich durch die Einschränkung erschwert, daß eine Anordnung der markierten Elemente Cy in folgender Form möglich sein muß ciui2ici2,iiT --^wn+i mit ik ^ ii für k t£1 und in+i=ii. A8 31) Das Rundreiseproblem kann durch die Anwendung von Verzweigungsverfahren (branch and bound) gelöst werden 18.1.4.5 Reihenfolgeproblem Die Bearbeitung von n verschiedenen Produkten erfolgt in einer vom Produkt abhängigen Reihenfolge an m verschiedenen Maschinen An jeder Maschine können nicht mehrere Produkte gleichzeitig bearbeitet werden Zur Bearbeitung eines jeden Produktes wird an jeder Maschine eine vorgegebene Arbeitszeit benötigt. Im Produktionsablauf können dabei sowohl Wartezeiten, in denen auf Grund belegter Maschinen Produkte nicht bearbeitet werden können, als auch Maschinenstillstandszeiten auftreten. Gesucht ist eine Reihenfolge der auf den einzelnen Maschinen nacheinander zu bearbeitenden Produkte, die je nach ökonomischer Zielsetzung die Gesamtdurchlaufzeit aller Produkte, die Gesamtwartezeit oder die Gesamtstillstandszeit aller Maschinen minimiert. Ein weiteres Ziel kann in der Minimierung der Gesamtdurchlaufzeit bestehen, wenn zusätzlich entweder keine Wartezeiten oder keine Stillstandszeiten nach der ersten Arbeitsaufnahme auftreten sollen
888 18. Optimierung 18.2 Nichtlineare Optimierung 18.2.1 Problemstellung und theoretische Grundlagen 18.2.1.1 Problemstellung 1. Nichtlineares Optimierungsproblem Unter einem nichtlinearen Optimierungsproblem werden Aufgaben der Grundform /(x) = min! für x G Rn mit A8.32a) 0»(x)<O, i€/ = {l,...,m}, fy(x) = 0, j€ J = {l,...,r} A8 32b) verstanden, wenn mindestens eine der Funktionen /, &, /^ nicht linear ist. Die Menge M aller zulässigen Punkte wird beschrieben durch M = {x G Rn . #(x) <0,tG7, /ij(x) = 0, j G J}. A8 33) Die Aufgabe besteht in der Bestimmung von Minimalpunkten. 2. Minimalpunkte Ein Punkt x* e M heißt globaler Minimalpunkt, wenn /(x*) < /(x) für alle x G M gilt Ist diese Beziehung nur für zulässige Punkte x aus einer Umgebung U von x* erfüllt, dann ist x* ein lokaler Minimalpunkt Aus den Kriterien für die Minimalpunkte ergeben sich die Optima- litätsbedingungen Da die Gleichungsrestriktionen hj (x) = 0 durch die zwei Ungleichungen -Äj(x)<0, Äj(x)<0 A8 34) beschrieben werden können, kann im folgenden von einer leeren Menge J(J = 0) ausgegangen werden. 18.2.1.2 Optimalitätsbedingungen 1. Spezielle Richtungen a) Der Kegel der zulässigen Richtungen in x G M ist definiert durch Z(x) = {d G Rn : 3ä>0: x + adG M, 0 < a < ä}, xeM, A835) wobei Richtungen mit d bezeichnet sind. Ist d G Z(x)} dann liegen alle Punkte des Strahls x + ad für hinreichend kleine a-Werte in M . b) Eine Abstiegsrichtung im Punkt x ist ein Vektor d G Rn , für den es ein ä > 0 gibt mit /(x + ad)</(x) VaG@,ä). A8 36) In einem Minimalpunkt existiert keine Abstiegsrichtung, die zugleich auch zulässig ist Ist / differenzierbar, so folgt aus V/(x)Td < 0 die Abstiegseigenschaft der Richtung d Mit V ist der Nablaoperator bezeichnet, so daß V/(x) den Gradienten der skalaren Funktion / an der Stelle x darstellt. 2. Notwendige Optimalitätsbedingung Ist / differenzierbar und x* ein lokaler Minimalpunkt, dann gilt V/(x*)Td>0 für alle d G Z(x*). A8 37a) Insbsondere gilt V/(x*) = 0 , A8 37b) falls x* im Inneren von M liegt. 3. Lagrange-Funktion und Sattelpunkt Unter der Annahme von Zusatzvoraussetzungen soll die Optimalitätsbedingung A8 37a,b) auf eine für die praktische Anwendung geeignete Form gebracht werden Dazu wird entsprechend der Lagran- GEschen Multiplikatorenmethode zur Ermittlung der Extremwerte von Funktionen unter Gleichheitsnebenbedingungen (s. 6.2 5.6, S. 419) die LAGRANGE-Funktion gebildet: £(x, u) = /(x) + J2 ui9i(x) = /(x) + uT#(x), x G R, u G R^ A8 38)
18 2 Nichtlineare Optimierung 889 Ein Punkt (x*, u*) € Rn x R™ heißt Sattelpunkt von L, wenn gilt L(x*,u) < L(x*,u*) < L(x,u*) für alle xeRn,ueRJ A8 39) 4. Globale Kuhn-Tucker-Bedingungen Ein Punkt x* G Rn genügt den globalen KUHN-TUCKER-Bedingungen, wenn ein u* G R™, d h ein u* > 0 existiert, so daß (x*, u*) ein Sattelpunkt von L ist. Wegen des Beweises der KuHN-TuCKER-Bedingungen s. 12.5.6, S 646. 5. Hinreichende Optimalitätsbedingung Ist (x*, u*) G Rn x R™ ein Sattelpunkt von L, dann ist x* ein globaler Minimalpunkt von A8 32a,b) Sind die Funktionen / und gi differenzierbar, dann können lokale Optimalitätsbedingungen abgeleitet werden 6. Lokale Kuhn-Tucker-Bedingungen Ein Punkt x* G M genügt den lokalen KuHN-TuCKER-Bedingungen, wenn Zahlen u* > 0, i G io(x*) existieren, für die gilt -V/(x*) = XI WiV^(x*), A8.40a) wobei I0(x) = {i € {1,. *e/o(x*) .,m} . #(x) = 0} A8.40b) die Indexmenge der in x aktiven Restriktionen ist Der Punkt x* heißt dann auch KuHN-TuCKER-Pwn^ oder stationärer Punkt Geometrisch betrachtet erfüllt ein Punkt x* G M die lokalen Kuhn- TuCKER-Bedingungen, wenn der negative Gradient —V/(x*) in dem durch die Gradienten der in x* aktiven Nebenbedingungen V<ft(x*), i G ¦^o(x*) aufgespannten Kegel liegt (Abb. 18.5) Oft wird die folgende äquivalente Formulierung für A8 40a,b) verwendet- x* G Rn genügt den lokalen KUHN-TuCKER-Bedingungen, wenn ein u* G R+ existiert, so daß gilt g{x*) < 0, A8.41a) g2fe)=0 Uigi(x*) = 0, i = 1, . ,m, A8.41b) Vga(x*) V/(x*) + E^V^(x*) = 0. A8 41c) Niveaulinien f(x)=konst. Abbildung 18 5 Vf(x*) Vg2(x*) 7. Notwendige Optimalitätsbedingung und Kuhn-Tucker-Bedingungen Ist x* G M ein lokaler Minimalpunkt von A8.32a,b) und erfüllt der zulässige Bereich in x* die Re- gularitätsbedingung 3d G Rn : V^(x*)Td < 0 für alle i G /o(x*), dann genügt x* den lokalen KuHN-TuCKER-Bedingungen. Für eine detaillierte Darstellung s [18.5] 18.2.1.3 Dualität in der Optimierung 1. Duales Problem Zu A8.32a,b) wird unter Verwendung der LAGRANGE-Funktion A8 38) das folgende duale Problem gebildet £(x,u) = max! für (x,u) G M* mit M* = {(x,u) GRn xR' L(x,u) = min L(z,u)} z€Rn A8.42a) A8 42b) 2. Dualitätsaussagen Sind Xi G M und (x2,u2) G M*. dann gilt a)L(x2,u2) </(xi) b) Ist L(x2,u2) = /(xi), dann ist xx Minimalpunkt von A8.32a,b) und (x2,u2) Maximalpunkt von A8.42a,b)
890 18 Optimierung 18.2.2 Spezielle nichtlineare Optimierungsaufgaben 18.2.2.1 Konvexe Optimierung 1. Konvexe Aufgabe wird die Optimierungsaufgabe /(x) = min! bei &(x) < 0 (i = 1,.. , m) A8 43) genannt, wenn die Funktionen / und g{ konvex sind Insbesondere können / und gt lineare Funktionen sein. Für konvexe Aufgaben gilt. a) Jedes lokale Minimum von / über M ist auch globales Minimum b) Ist M nicht leer und beschränkt, dann existiert mindestens eine Lösung von A8 43) c) Ist / streng konvex, dann existiert höchstens eine Lösung von A8.43). 2. Optimalitätsbedingungen a) Ist / stetig partiell differenzierbar, dann ist x* G M genau dann Lösung von A8 43), wenn gilt (x - x*)TV/(x*) > 0 für alle xGM A8 44) b) Die SLATER-Bedingung ist eine Regularitätsbedingung für den zulässigen Bereich M Sie ist erfüllt, wenn ein x G M mit #i(x) < 0 für alle nicht affin linearen Funktionen gi existiert c) Ist die SLATER-Bedingung erfüllt, dann ist x* genau dann ein Minimalpunkt von A8 43), wenn ein u* > 0 existiert, so daß (x*, u*) ein Sattelpunkt der LAGRANGE-Funktion ist. Sind darüber hinaus die Funktionen /, gt differenzierbar, dann ist x* genau dann eine Lösung von A8 43), wenn x* den lokalen- KUHN-TUCKER-Bedingungen genügt. d) Für ein konvexes Optimierungsproblem mit differenzierbaren Funktionen / und gi kann das duale Problem A8 42a,b) einfacher formuliert werden. £(x,u) = max!, (x,u) G M* mit A8 45a) M* = {(x,u) eRnxR; : VxL(x,u) = 0} A845b) Der Gradient von L wird hier nur bezuglich x gebildet. e) Für konvexe Optimierungsaufgaben gilt der starke Duahtätsatz: Erfüllt M die SLATER-Bedingung und ist x* G M eine Lösung von A8 43), dann existiert ein u* G R™, so daß (x*, u*) eine Lösung des dualen Problems A8.45a,b) ist, und es gilt /(x*) - min/(x) = max L(x,u) = L(x*, u*). A8 46) x€M (x,u)GM* 18.2.2.2 Quadratische Optimierung 1. Aufgabenstellung Die quadratische Optimierung umfaßt Aufgaben der Form /(x) = xTCx + pTx = min', x G M C Rn mit A8 47a) M = Mi. M = {x G Rn . Ax < b, x > 0} A8 47b) Dabei ist C eine symmetrische (n, n)-Matrix, p G Rn, A eine (m, n)-Matrix und b G Rm Der zulässige Bereich M kann alternativ in folgende Darstellungen überführt werden: M = Mu M = {x : Ax = b, x > 0}, A8 48a) M = Min: M = {x : Ax < b} . A8.48b) 2. Lagrange-Funktion und Kuhn-Tucker-Bedingungen Die LAGRANGE-Funktion zum Problem A8.47a,b) ist L(x, u) - xTCx + pTx + uT(Ax - b) A8.49) Die KuHN-TuCKER-Bedingungen lauten mit v=^ = p + 2Cx + ATu und y = -^ = -Ax + b A850) <9x - - du für den zulässigen Bereich:
18.2 Nichtlineare Optimierung 891 Fall I: Fall II: Fall III: a) Ax + y = b, a) Ax = b, a) Ax + y = b, A8 51a) b) 2Cx-v + ATu=-p, b) 2Cx-v + ATu=-p, b) 2Cx + ATu = -p, A8 51b) c) x > 0, v > 0, y > 0, u > 0, c) x > 0, v > 0, c) u > 0, y > 0, A8.51c) d) xTv + yTu = 0 d) xTv = 0 d) yTu = 0 A8.51d) 3. Konvexität Die Funktion /(x) ist genau dann konvex (streng konvex), wenn die Matrix C positiv semidefinit (positiv definit) ist Alle Aussagen über konvexe Optimierungsprobleme können für quadratische Aufgaben mit positiv semidefiniter Matrix C übertragen werden, insbesondere ist die SLATER-Bedingung immer erfüllt, und deshalb ist für die Optimalität eines Punktes x* notwendig und hinreichend, daß ein Punkt (x*, y, u, v) existiert, der das entsprechende System der lokalen Kuhn- TUCKER-Bedingungen erfüllt ~ 4. Duales Problem Ist C positiv definit, dann kann das zu A8 47a,b) duale Problem A8.45a,b) explizit in folgender Weise formuliert werden: L(x,u) = max', (x,u) <E M*, A8 52a) M* = {(x,u)GRnxR^ : x = ~CT1(ATu + p)}. A8 52b) Setzt man den Ausdruck —-C_1(ATu + p) für x in die duale Zielfunktion L(x, u) ein, dann entsteht das äquivalente Problem ¥>(u) = -iuTACrxATu - (iAC-1p + b) u - ^PTC_1p = max! , u > 0 , A8 53) für das gilt- Ist x* G M eine Lösung von A8 47a,b), dann besitzt A8 53) eine Lösung u* > 0, und es gilt /(x*) = <p(u*) . A8 54) Das Problem A8.53) kann durch die äquivalente Formulierung ^(u) = uTEu + hTu = min!, u > 0 mit A8.55a) E = i ACT1 AT und h = ^AC_1p + b A8 55b) ersetzt werden 18.2.3 Lösungsverfahren für quadratische Optimierungsaufgaben 18.2.3.1 Verfahren von Wolfe 1. Aufgabenstellung und Lösungsprinzip Das Verfahren von Wolfe ist zur Lösung von quadratischen Problemen der folgenden speziellen Form geeignet: /(x) = xTCx + pTx = min!, Ax-b, x>Q. A8.56) Für die hier beschriebene Version des Verfahrens wird C als positiv definit vorausgesetzt Die Grundidee besteht in der Ermittlung einer Lösung (x*, u*, v*) des dem Problem A8 56) zugeordneten Systems der KuHN-TuCKER-Bedingungen Ax = b , A8 57a) 2Cx - v 4- ATu = -p , A8 57b) x > 0 , v > 0 , A8 57c) xTv = 0. A8.58)
892 18. Optimierung Die Formeln A8.57a,b,c) stellen ein lineares Gleichungssystem mit m + n Gleichungen und 2n + m nicht negativen Variablen dar. Auf Grund der Bedingung A8 58) muß entweder x» = 0 oder v{ = 0 (i = 1, 2,..., n) gelten. Daher besitzt jede Lösung von A8.57a,b,c,18 58) höchstens m + n von Null verschiedene Komponenten und muß folglich eine Basislösung von A8.57a,b,c) sein. 2. Lösungsgang Mit Hilfe des Simplexverfahrens wird zunächst eine zulässige Basislösung (Ecke) x des Systems Ax = b bestimmt Die zu den Basis variablen von x gehörenden Indizes bilden die Indexmenge Iß. Um eine Lösung des Systems A8.57a,b,c) zu finden, die auch A8 58) erfüllt, formuliert man das Hilfsproblem -/i = min' (/i e R), A8.59) Ax = b, A8.60a) 2Cx- v + ATu-/iq = -p mit q = 2Cx + p, A8 60b) x > 0 , v > 0 , /i > 0; A8 60c) xTv = 0. A8 61) Für eine Lösung (x, v, u, fi) dieses Problems, die gleichzeitig A8 57a,b,c) und A8 58) erfüllt, muß ß = 0 gelten Als zulässige Basislösung für das System A8.60a,b,c) ist (x, v,u, /x) = (x,0,0,1) bekannt, die gleichzeitig der Bedingung A8 61) genügt. Eine zu dieser Basislösung gehörende Basis wird aus den folgenden Spalten der Koeffizientenmatrix A 0 0 0 \ i^I Einheitsmatrix, 0 Nullmatrix und 0^ A8 P21 l 2C — I AT — q / ' \Nullvektor entsprechender Dimension/ zusammengesetzt • a) m Spalten, die zu Xi mit i E Iß gehören, b) n — m Spalten, die zu Vi mit i £ Iß gehören, c) alle m Spalten zu ui? d) die letzte Spalte, dafür wird aber eine geeignete der unter b) und c) bestimmten Spalten wieder weggelassen Ist q = 0 , dann ist zwar der Austausch nach d) nicht möglich, es ist dann aber x bereits ein Lösungs- punkt. Man kann nunmehr ein erstes Simplextableau aufstellen. Die Minimierung der Zielfunktion erfolgt mit dem Simplexverfahren unter der folgenden Zusatzregel, die xTY = 0 sichert Bleibt in einem Austauschschritt Xi (i — 1, 2,... ,n) Basisvariable, dann darf v\ nicht Basisvariable werden und umgekehrt Für positiv definites C führt das Simplexverfahren unter Beachtung der Zusatzregel zu einer Lösung des Problems A8.59), A8.60a,b,c), A8.61) mit /i = 0 Für positiv semidefinites C kann auf Grund der eingeschränkten Pivotelementwahl der Fall eintreten, daß kein Austauschschritt mehr ausgeführt werden kann, ohne die Zusatzregel zu verletzen, obwohl // > 0 gilt Man kann zeigen, daß in diesem Fall Ii überhaupt nicht verkleinert werden kann ¦ /(x) = x\ 4- 4^2 — 10a;i — 32x2 = min! mit x\ + 2x2 + £3 = 7, 2x\ + x2 + x4 = 8 A _ (l 2 1 0\ K_ G\ r_ 0 4 0 0 A~ \2 1 0 1 J' -~ (s) ' ^000 1 0 0 0\ /-10\ - ¦ - - .32 0 V o / \0 0 0 0/ In diesem Falle ist C lediglich positiv semidefinit. Eine zulässige Basislösung von Ax = b ist x = @,0, 7,8)T, q = 2Cx + p = (-10, -32,0,0)T Als Basisvektoren werden gewählt. a) die Spalten 3 und 4 von ( 9p, ), b) die Spalten 1 und 2 von ( _T ), c) die Spalten von ( .j
18 2 Nichthneare Optimierung 893 und d) die Spalte I _ j anstelle der 1 Spalte von ( _T 1 Aus diesen Spalten wird die Basismatrix gebildet und die Basisinverse errechnet (s 18.1, S. 873) Durch Multiplikation mit der Matrix A8.62) sowie des Vektors I ~ I mit der Basisinversen ergibt sich ein erstes Simplextableau (Schema 18.9) Auf Grund der Zusatzregel kann in diesem Tableau nur x\ gegen v2 ausgetauscht werden Als Lösung erhält man nach einigen Austauschschritten x* = B,5/2,0,3/2)T Die letzten zwei Gleichungen von 2Cx — v + ATu — ßq = —p lauten: v3 = u\, v4 = u2 Man kann deshalb den Umfang des Problems zu Beginn der Rechnung reduzieren, indem man die freien Variablen U\ und u2 aus dem System eliminiert 18.2.3.2 Verfahren von Hildreth-d'Esopo 1. Prinzip Dem streng konvexen Optimierungsproblem /(x) = xTCx + pTx = min', Ax < b ist das duale Problem (s 1 ) 003 X4 V2 Wl u?. V Xi 1 2 64 10 0 0 2 10 2 10 Schema 18 9 X2 2 1 — 8 0 0 0 0 Vi 0 0 32 10 0 ¦ 0 1 10 1 10 V3 0 0 12 10 - 1 0 1 10 1 10 vA 0 0 54 10 0 - 1 2 10 2 10 7 8 0 0 0 1 -1 ^(u) = uTEu -I- hTu = u > 0 mit E = - ACT1 AT , h = i AC_1p + b A8 63) A8.64a) A8.64b) zugeordnet Die Matrix E ist positiv definit und besitzt positive Diagonalelemente e« > 0, (i = 1,2, . , m). Die Variablen x und u sind über die folgende Beziehung miteinander verknüpft. X=~C-1(ATu + p). A8.65) 2. Iterationslösung Das duale Problem A8 64a), das nur die Nebenbedingung u > 0 enthält, kann mit Hilfe des folgenden einfachen Iterationsverfahrens in Schritten gelöst werden- a) Setze u1 > 0 (z.B. u1 = 0), k = 1 b) Berechne wf+1 für i = 1,2,. ., m gemäß A8.66a) ;{0,wf+1} A8.66b) c) Falls ein Abbruchkriterium, z B. |^(ufc+1) - ip(uk)\ <£,£>0, nicht erfüllt ist, wird Schritt b) mit k -t-1 an Stelle von k wiederholt Unter der Voraussetzung, daß ein x mit Ax < b existiert, konvergiert die Folge {^(ufc)} gegen den Minimalwert ipm-m und die mittels A8.65) gebildete Folge {xfc} gegen die Lösung x* des Ausgangsproblems Dagegen konvergiert die Folge {\r} nicht immer. Zu weiteren Verfahren zur Lösung quadratischer Optimierungsprobleme s [18 10]. 18.2.4 Numerische Suchverfahren Suchverfahren ermöglichen für eine Reihe von Optimierungsproblemen, mit geringem Rechenaufwand akzeptable Näherungslösungen zu ermitteln. Sie beruhen prinzipiell auf dem Vergleich von Funktionswerten.
894 18. Optimierung 18.2.4.1 Eindimensionale Suche Viele Optimierungsverfahren beinhalten als Teilaufgabe die Minimierung einer Funktion f(x) für x € [a, b] Oft ist dabei eine Näherung x für den Minimalpunkt x* ausreichend. 1. Aufgabenstellung Es sei / auf [a, b] unimodal und x* ein globaler Minimalpunkt. Dann soll ein Intervall [c, d] C [a, b] mit x* € [c, d] und d — c < e, e > 0 bestimmt werden Dabei heißt f(x). xGR eine unimodale Funktion im Intervall [a, 6], falls / auf jedem abgeschlossenen Teilintervall J C [a,6] genau einen lokalen Minimalpunkt besitzt. , 2. Gleichmäßige Suche Man wählt n (n ganzzahlig) so, daß 6 = < - gilt, und berechnet die Werte f(xk) für xk = a + kö, k = 1,..., n. Ist f(x) unter diesen Funktionswerten ein kleinster Wert, dann liegt der Minimalpunkt x* im Intervall [x — ö, x + S] Die für die geforderte Genauigkeit notwendige Anzahl von Funktionswertberechnungen kann mittels n> 2{6^a) _l ' (l867) abgeschätzt werden. 3. Verfahren des Goldenen Schnittes und Fibonacci-Verfahren Das Intervall [a, b] = [ahbi] wird schrittweise so verkleinert, daß das jeweils neue Teilintervall den Minimalpunkt x* enthält. Im Intervall [ai,6i] werden die Punkte Ai = ßi + A - r)(bi — ai) , fr = ai + r(bi — d\) mit A8 68a) ^5- -1)« 0,618 A868b) ermittelt. Das entspricht einer Teilung nach dem Goldenen Schnitt Es sind zwei Fälle zu unterscheiden: a) /(Ai) < f(tii)' Man setzt a2 = a\ , b2 = Hi und ß2 = Ai A8 69a) b)/(Ai) >/(/ii): Man setzt a2 = Xi , b2 = h und A2 = //i- A8 69b) Ist b2 — ö2 > £, dann wird das Verfahren mit dem Intervall [a2, b2] wiederholt, wobei aber nunmehr einer der Werte f(X2) (Fall a)) bzw f(fi2) (Fall b)) aus dem ersten Schritt verwendet werden kann. Zur Berechnung eines Intervalls [an,6n], in dem der Minimalpunkt x* liegt, sind somit insgesamt n FunktionsWertberechnungen erforderlich. Aus der Forderung e>bn-an = Tn-1(b1-a1) A8 70) kann eine Abschätzung der notwendigen Schrittzahl n gewonnen werden. Mit dem Verfahren des Goldenen Schnittes wird höchstens eine Funktionswertberechnung mehr benötigt als mit dem Fibonacci-Verfahren. An Stelle einer Intervallunterteilung gemäß dem Goldenen Schnitt erfolgt hier eine Unterteilung mit Hilfe der FiBONACCl-Za/i/en (s. 5.4 1 5, S 334 und 17 3.2.4,3.,3.,S. 871) 18.2.4.2 Minimumsuche im n-dimensionalen euklidischen Vektorraum Die Suche nach einer Näherung für einen Minimalpunkt x* des Problems /(x) = min', x G Rn, kann auf die Lösung einer Folge eindimensionaler Optimierungsprobleme zurückgeführt werden. a) Man setzt x = x1, k = 1, wobei x1 eine geeignete Ausgangsnäherung für x* ist A8 71a) b) Man löst für r = 1,2, , n die eindimensionalen Probleme ¥?(Qr) = /(xJ+1,...,a;j!+11,a;J + Qr,a;J+1,.. ,a£) = min!, ar e R A8 71b) Ist är ein Minimalpunkt bzw eine Näherung des r-ten Problems, dann setzt man xk+1 = xk + är. c) Unterscheiden sich zwei aufeinander folgende Näherungen hinreichend wenig, d.h gilt für die Norm oder /(xfc+1) - fUk) < £2, A8 71c)
18.2 Nichtlineare Optimierung 895 dann ist xfc+1 eine Näherung für x*. Anderenfalls geht man mit k + 1 an Stelle von k zu Schritt b über Die eindimensionalen Probleme im Schritt b können unter anderem mit den in 18.2.4.1, S. 894 beschriebenen Suchverfahren gelöst werden 18.2.5 Verfahren für unrestringierte Aufgaben Es wird das allgemeine Optimierungsproblem /(x) = min! für x € Rn A8 72) mit einer stetig differenzierbaren Funktion / betrachtet Mit den in diesem Abschnitt beschriebenen Verfahren wird eine im allgemeinen unendliche Punktfolge {xk} G Rn konstruiert, deren Häufungspunkte stationäre Punkte sind. Die Punktfolge wird ausgehend von x1 G Rn nach der Vorschrift = xk + akdk (fc = l,2,...) A8.73) berechnet, d h , in xk wird eine Richtung dfc G Rn bestimmt und mittels des Schrittweitenparameters ü;fc G R festgelegt, wie weit xk+1 in Richtung dk von xk entfernt liegt. Ein so konstruiertes Verfahren heißt Abstiegsverfahren , wenn gilt /(xfc+1) < /(x*) (* = 1,2,...) A8.74) Die Bedingung V/(x) = 0, wobei V der Nablaoperator ist (s 13.2.6 1, S 677), charakterisiert einen stationären Punkt und kann als Abbruchtest für die Iterationsverfahren herangezogen werden. Die in den folgenden Abschnitte angeführten Verfahren unterscheiden sich hinsichtlich der Festlegung der Richtungen dk und der Schrittweiten ak . 18.2.5.1 Verfahren des steilsten Abstieges (Gradientenverfahren) Ausgehend vom aktuellen Punkt xfe, wird dk als Richtung des lokal steilsten Abstieges festgelegt durch dfc = -V/(xfc). A8 75a) Es ist also xfc+1 = xfc - akVf{xk). A8.75b) Eine schematische Darstellung des Gradientenverfahrens mit den Niveaulinien /(x) = /(x*) zeigt die Abb. 18.6. Die Schrittweite ak wird nach dem CAUCHY-Prinzip, auch Prinzip der Strahlminimie- rung genannt, ermittelt, d.h., ak löst die eindimensionale Aufgabe /(x* + adfc) = minl, a > 0. A8.76) Dazu können Verfahren aus 18.2.4, S. 893ff herangezogen werden. Das Gradientenverfahren A8.75b) konvergiert relativ langsam. Für jeden Häufungspunkt x* der Folge {xk} gilt V/(x*) = 0. Für eine quadratische Zielfunktion, d.h. /(x) = xTCx+pTx, Niveaulinien ;)=f(xi) Vffei) Abbildung 18 6 besitzt das Verfahren die Form: xk+1 = xk + akdk A8.77a) mit dfe = -BCxfc + p) und ak = dfcTdfc 2dfcTCdA: A8.77b) 18.2.5.2 Anwendung des Newton-Verfahrens Die Funktion / wird im aktuellen Näherungspunkt xk durch eine quadratische Funktion approximiert: ?(x) = /(xfc) + (x - xfc)TV/(xfc) + ^(x - xfc)TH(xfc)(x - xfc) A8 78)
896 18. Optimierung Dabei ist H(xfc) die HESSE-Matrix, d.h die Matrix der zweiten partiellen Ableitung von / im Punkt x^ . Ist H(xfc) positiv definit, dann hat q(x) an der Stelle xfc+1 mit Vg(xfc+1) = 0 ein globales Minimum, und man erhält für das NEWTON-Verfahren die Iterationsvorschrift xfc+1 = xk - H(xA;)V/(xfc) (k = 1,2, ..), d.h., es ist A8 79a) dk = -H(xfc)V/(xfc) und ak = 1 A8.79b) Das NEWTON-Verfahren hat eine hohe Konvergenzgeschwindigkeit, der aber folgende Nachteile gegenüberstehen. a) Die Matrix H(xfc) muß positiv definit sein. b) Das Verfahren konvergiert nur für hinreichend gute Startwerte c) Es gibt keine Schrittweitensteuerung d) Das Verfahren ist im allgemeinen kein Abstiegsverfahren. e) Der Aufwand zur Berechnung von H_1(xfc) ist mitunter recht groß. Einige Nachteile können durch die folgende Version eines gedämpften Newton -Verfahrens behoben werden- xfc+1=xfc-afcH-1(x*)V/(xfc) (fc = l,2,. .). A8 80) Der Dämpfungsfaktor ak kann unter anderem durch Strahlminimierung ermittelt werden (s. 18.2 5 1. S. 895). 18.2.5.3 Verfahren der konjugierten Gradienten Zwei Vektoren d1, d2 G Rn heißen konjugierte Vektoren bezüglich einer symmetrischen, positiv defini- ten Matrix C, wenn gilt dlTCd2 = 0. A8 81) Sind d\d2,... ,dn paarweise konjugierte Vektoren bezüglich einer Matrix C, dann ist das konvexe quadratische Problem q(x) = xTCx + pTx, x G ün, in n Schritten lösbar, wenn ausgehend von einem beliebigen x1 die Folge xfc+1 = xfc + Cikdk gebildet wird, wobei ak als optimale Schrittweite in Abstiegsrichtung gewählt wird. Unter der Annahme, daß /(x) in der Nähe des Minimalpunktes x* annähernd quadratisch ist, d.h. C « -H(x*), kann das für quadratische Zielfunktionen resultierende Verfahren auch auf allgemeinere Funktionen /(x) angewendet werden, ohne daß dabei explizit die Matrix H(x*) benutzt wird Das Verfahren der konjugierten Gradienten besteht aus folgenden Schritten- a) x1 e Rn , d1 = -V/(xJ), A8 82) wobei x1 eine geeignete Ausgangsnäherung für x* ist. b) xfc+1 = xfc + <*kdk {k = 1, ., n) mit ak > 0 so, daß f(xk + adk) minimiert wird A8 83a) dk+l = -V/(xA:+1) + ßkdk (k = 1,. ., n - 1) mit A8 83b) = V/(xfc+1) V/(xfc+1) und dn+1 = _v/(xn+i) A8 83c) V/(xfc)TV/(xfc) " n~ V ] c) Wiederholung des Schrittes b) mit xn+1 und dn+1 an Stelle von x1 und d1 18.2.5.4 Verfahren von Davidon, Fletcher und Powell (DFP) Mit dem DFP-Verfahren ermittelt man, ausgehend von x1 G Rn, eine Punktfolge nach der Vorschrift xfc+1 = xfc - afcMfcV/(xfc) (k = 1, 2,...). A8 84) Dabei ist M& eine symmetrische, positiv dennite Matrix Die Idee des Verfahrens besteht in einer schrittweisen Approximation der inversen HESSE-Matrix durch die Matrizen M^ in dem Falle daß
18 2 Nichtlineare Optimierung 897 /(x) eine quadratische Funktion ist Ausgehend von einer symmetrischen, positiv definiten Matrix Mi, z B. Mi = I (I Einheitsmatrix), wird M* aus Mfc_i durch Addition einer Rang-Zwei-Korrekturmatrix vVT (Mfc-iWfc)(Mfc_iW*)T Mk = Mfc_i + T 77p— A8 85) v^v* wfc Mfcwfc mit vfc = xfc - xfc_1 und wfc = V/(xfc) - V/(xfc_1) (fc = 2,3,...) ermittelt. Die Schrittweite ak erhält man durch Strahlminimierung aus /(xfc - öMfcV/(xfc)) = min!, a > 0. A8.86) Ist /(x) eine quadratische Funktion, dann geht das DFP-Verfahren für Mi = I in das Verfahren der konjugierten Gradienten über. 18.2.6 Evolutionsstrategien Evolutionsstrategien sind dem Vorbild der natürlichen Evolution nachgebildete stochastische Optimierungsverfahren Sie beruhen auf den Prinzipien Mutation, Rekombination und Selektion 1. Mutation Aus einem Elternpunkt xE wird durch eine zufällige Variation d ein Nachkomme x.n = *e + d gebildet. Mit einer normalverteilten Variation d sind kleine Änderungen wahrscheinlich, große Abweichungen treten dagegen nur selten auf. 2. Rekombination Aus einer Population von m Eltern können Nachkommen durch Mischen der Informationen zweier oder mehrerer zufällig ausgewählter Eltern gebildet werden. Ein Nachkomme kann dabei z B. aus dem gewichteten Mittel von n Eltern gebildet werden: n n xAr = ^aiXEi, 53a< = l, 2<n<m. A8.87) t=i *=i 3. Selektion Anhand eines Vergleiches der Zielfunktionswerte f(x) werden der oder die besten Punkte für die nachfolgende Generation ausgewählt Die Evolutionsstrategien werden bezüglich der Anzahl der Eltern und Nachkommen, der Anzahl der an der Rekobination beteiligten Eltern sowie der Vorschriften für Mutation und Selektion klassifiziert. Nähreses dazu findet man in [18 9]. 18.2.6.1 Mutations-Selektions-Strategie Dieses Verfahren gleicht dem Gradientenverfahren aus 18.2 5.1, S. 895 mit dem Unterschied, daß die Richtung dk ein normal verteilter Zufallsvektor ist. 1. Mutationsschritt In der Generation k wird aus einem Elternpunkt durch Addition einer normalverteilten Variation ein Nachkomme ermittelt gemäß: xkN = xEk+adk A8.88) Der Faktor a ist ein Parameter zur Steuerung der Schrittweite über den die Konvergenzgeschwindigkeit beeinflußt werden kann. 2. Selektionsschritt Der Punkt mit dem kleineren Zielfunktionswert wird zum Elternpunkt der nächsten generation fc + 1: fx* falls /(x&) < /(x|) /1889x \x| sonst ' ; Das Verfahren wird beendet, wenn über eine bestimmte Anzahl von Generationen kein besserer Nachkomme mehr ermittelt wird. Die Schrittweite a kann vergrößert werden, wenn die Mutation häufig zu zu einem verbesserten Nachkommen führt. Bei geringer Erfolgsrate ist a zu verkleinern. 18.2.6.2 Strategien mit Rekombination Ausgehend von einer Population von m Eltern der k-ten Generation XE = {xEl,..., x^m } wird durch Rekombiantion und Mutation eine Menge von n Nachkommen X^ = {x^ , •. , x^m} gebildet. Jeder Nachkomme wird durch eine Kombination von zwei oder mehr zufällig ausgewählten Eltern ermittelt. vfc+i .
898 18. Optimierung Aus den n + m Punkten der Mengen X\ und X^ werden die besten m Punkte für die nächste Elterngo- neration X^+l = {xj^J, ^x^1} ausgewählt. Bei einigen Strategien nehmen nur die Nachkommen Xjy an der Auswahl teil In diesem Falle können die Zielfunktionswerte der Nachkommen giößer sein als die der Eltern und lokale Optima wieder verlassen werden. 18.2.7 Gradientenverfahren für Probleme mit Ungleichungsrestriktionen Wenn das Problem /(x) = min' bei #(x) < 0 (i = 1,. ., m) A8 90) mit einem Iterationsverfahren der Art xfc+1 = x* + akdk (fc=l,2, ) A8 91) gelöst werden soll, dann sind auf Grund des eingeschränkten zulässigen Bereiches zwei Voraussetzungen zu beachten: 1. Die Richtung dfc muß eine in xfe zulässige Abstiegsrichtung sein. 2. Die Schrittweite ak ist so zu bestimmen, daß auch xk+1 in M liegt. Die verschiedenen Verfahren gemäß Vorschrift A8 91) unterscheiden sich in der Konstruktion der Richtung dfc Um die Zulässigkeit der Folge {xfe} C M zu sichern, werden a'k und ak folgendermaßen bestimmt a'k aus f(xk + adk) = min!, a>0 und a£ = max{a € R . xk + adk € M} . A8 92) Daraus resultiert ak = minjofj,, ak } . A8 93) Wenn in einem Schritt k keine zulässige Abstiegsrichtung dk existiert, dann ist xk ein stationärer Punkt 18.2.7.1 Verfahren der zulässigen Richtungen 1. Richtungssuchprogramm Eine zulässige Abstiegsrichtung dk im Punkt xk kann durch Lösung des folgenden Optimierungsproblems gewonnen werden. er = min' A8 94) V^(xfc)Td < er, iE Jo(xfc), A8 95a) V/(xfe)Td < a , A8 95b) ||d|| < 1 A8 95c) Gilt für die Lösung d = dk dieses Richtungssuchprogrammes a < 0, dann sichert A8 95a) die Zulässigkeit und A8 95b) die Abstiegseigenschaft von dfc Mit der Normierungsbedingung A8.95c) wird der zulässige Bereich für das Richtungssuchprogramm beschränkt. Ist a = 0, dann ist x^ ein stationärer Punkt, da in xfc keine zulässige Abstiegsrichtung existiert. Ein gemäß A8 95a,b,c) definiertes Richtungssuchprogramm kann innerhalb der Folge der beschränkten xfc ein Zickzack-Verhalten verursachen Das kann vermieden werden, wenn die Indexmenge /o(xA) durch die Indexmenge /£fc(xfc) = {ie{l, .,m} -ek < 9i(xk) < 0}, ek>0 ' A8 96) der sogenannten in xfc e^-aktiven Restriktionen ersetzt wird Dadurch werden lokale Abstiegsrichtun- gen ausgeschlossen, die von xfc ausgehend näher an den von ^-aktiven Restriktionen gebildeten Rand von M heranführen (Abb. 18.7) Ist nach dieser Modifizierung a = 0 Lösung von A8 95a,b,c), dann ist xk nur dann ein stationärer Punkt, wenn Io(xk) = ISk{^k) erfüllt ist Anderenfalls ist sk geeignet zu verkleinern und das Richtungssuchprogramm zu wiederholen (s [18 6])
18 2 Nichtlineare Optimierung 899 gi(x)=0 g2(x)=0 Abbildung 18 7 2. Spezialfall linearer Restriktionen Sind die Funktionen ^(x) linear, d.h. ^(x) = a,Tx — ^, dann kann ein einfacheres Richtungssuchprogramm aufgestellt werden: c = V/(xfc) d = min! bei a,Td<0, t€/o(xfc) bzw i e I£k{xk), lldll < 1. -Vf(xk) a) ^?fä\ Abbildung 18 8 A8 97) A8 98a) A8 98b) Die Wirkung der Wahl verschiedener Normen j|d|| = maxfldil} < 1 bzw. ||d|| = y/^fd < 1 ist in Abb.l8.8a,b gezeigt. Die in einem gewissen Sinne beste Wahl der Norm ist ||d|| = ||d||2 = yf<fd, denn mit dem Richtungssuchprogramm ermittelt man das d^, das den kleinsten Winkel mit — V/(xfc) bildet Dann ist das Richtungssuchprogramm jedoch nicht linear und erfordert einen höheren Rechenaufwand Dagegen ergibt sich mit ||d|| = ||d||oo = max{|<ii|} < 1 ein System linearer Nebenbedingungen — 1 < di < 1 (i = 1,... ,n), so daß das Richtungssuchprogramm z.B. mit dem Simplexverfahren gelöst werden kann. Um zu sichern, daß das Verfahren der zulassigen Richtungen für quadratische Optimierungsprobleme /(x) = xTCx+pTx = min! mit Ax < b in endlich vielen Schritten zum Ziel führt, wird das Richtungssuchprogramm durch die folgende Konjugationsvorschrift ergänzt: Ist in einem Schritt a^_i = ot'k_i, d h x* ist ein „innerer" Punkt, dann wird dem Richtungssuchprogramm die Bedingung dfc-lTCd = 0 A8.99) hinzugefügt. Weiterhin werden entsprechende Bedingungen aus vorhergehenden Schritten beibehalten Die Bedingung A8 99) wird erst fallengelassen, wenn in einem Schritt ak = a'k' gesetzt wird ¦ /(x) = x\ + 4x1 ~ 10xi ~ 32-^2 = min! #i(x) = -xi < 0, g2(x) = -x2 < 0, 03(x) = xi + 2x2 - 7 < 0, 04(x) = 2xl + x2 - 8 < 0. 1 Schritt: Start mit x1 = C,0)T, V/(xx) = (-4, -32)T, ^(x1) = {2} Richtungssuchprogramm -4di - 32d2 = -^2<0, ||d < 1 d1^!,!I Strahlmimierung. a'k = — dk V/(xfc) 2dfcTCdfc Maximal zulässige Schrittweite* a'k = min 9i(*k) a/dfc für i mit a/cT > 0 18 5 '
900 18. Optimierung ai 2. Schritt lT'3j 3' " ~ U'3j 8 _ 3' = { :V/(x2) = (-|-f)T, /o(x2) = {4}. Richtungssuchprogramm ~sdl ~ Yd2 = min! 2rf1 + d2<0, lldll«,^ .} (-;•>)' 152 "öT' 3^o, = -l^ = C,2)\ 3. Schritt: V/(x3) = (-4, -16)T, /0 = (x3) = {3,4}. {—4di — 16^2 = min' dI + 2d2<0, 2d1+d2<0, 1, a» = 3 =>o» = l, J£t=B.|)T a (-¦!)' 0 Das nächste Richtungssuchprogramm liefert a = 0 Daher ist x* = x4 der Minimalpunkt (Abb. 18.9). 18.2.7.2 Verfahren der projizierten Gradienten 1. Aufgabenstellung und Lösungsprinzip Gegeben ist das konvexe Optimierungsproblem /(x) = min! bei a,Tx < bu A8.100) mit i = 1, . .,ra. Eine zulässige Abstiegsrichtung dk im Punkt xk G M wird auf folgende Weise ermittelt Ist — V/(xfc) eine zulässige Richtung, dann wird dfc = —V/(xfc) gesetzt. Anderenfalls liegt xfc auf dem Rand von M und — V/(xfc) zeigt aus M hinaus. Mittels einer linearen Abbildung Pfc wird der Vektor -V/(xfc) auf eine li- 1 2 3 4 xi Abbildung 18.9 neare Teilmannigfaltigkeit des Randes von M projiziert die von einer Teilmenge der in xfc aktiven Restriktionen gebildet wird. Die Projektion auf eine Kante zeigt die Abb. 18.10a, die Projektion auf eine Seitenfläche die Abb. 18.10b. Unter der Voraussetzung der Nichtentartungsbedingung, d.h. für alle x e Rn sind die Vektoren aj, i 6 70W, linear unabhängig, ist eine solche Projektion gegeben durch dk = -PfcV/(xfc) = - (i - AfcT(AfcAfcT)_1Afc) V/(x*). A8 101) Dabei besteht Ajt aus allen den a^, deren entsprechende Nebenbedingungen die lineare Teilmannig- faltigkeit bilden, in die —V/(xfc) projiziert werden soll. -Vf(xk)^ b) Abbildung 18.10 2. Algorithmus Das Verfahren der projizierten Gradienten besteht aus folgendem Algorithmus Starte mit x1 £ M , setze k = 1 und gehe nach folgendem Schema vor:
18.2 Nichtlineare Optimierung 901 I: Ist —V/(xfc) zulässige Richtung, dann wird dk = —V/(xfc) gesetzt und mit III fortgesetzt. Anderenfalls wird Ak aus den Vektoren azT mit i G Jo(xfc) gebildet und zu II übergegangen II: Es wird dk = - (i - AfcT(AA;AA;T)~1Afc) V/(xfc) gesetzt Ist dk ^ 0, wird mit III fortgesetzt. Ist dk = 0 und gilt u = -(AkA/J) AkVf(xk) > 0, dann ist xk ein Minimalpunkt. Die lokalen KUHN-TUCKER-Bedingungen - V/(xfc) = £ u^ = AfcTu sind offensichtlich erfüllt. i€/o(x/c) Ist u ^ 0 , dann ist ein i mit Ui < 0 zu wählen, die i-te Zeile aus A& zu streichen und II zu wiederholen III: Berechnung von ak sowie von xfc+1 = xfc + ctkdk und Übergang mit k = k + 1 zu I. 3. Bemerkungen zum Algorithmus Wenn —V/(xfc) nicht zulässig ist, wird dieser Vektor zunächst in die Teilmannigfaltigkeit geringster Dimension, auf der xk liegt, abgebildet Ist dk = 0 , dann steht —V/(xfe) senkrecht auf dieser Teilmannigfaltigkeit Gilt nicht u > 0 , dann wird durch Weglassen einer aktiven Nebenbedingung die Teilmannigfaltigkeit um eine Dimension erweitert, wodurch dk ^ 0 eintreten kann (Abb. 18.10b) (mit Projektion auf eine Seitenfläche) Da A& häufig aus Ak-i durch Hinzufügen bzw Streichen einer Zeile entsteht, kann die aufwendige Berechnung von (AfcAfcT) erleichtert werden, indem die Kenntnis von (Ak-iAk-iT) genutzt wird (s [18.6], [18 10]) ¦ Lösung des Problems im vorangegangenen Beispiel in 18.2.7.1,2., S 899 1 Schritt x1 = C,0)T, 1 V/(xx) = (-4, -32)T, -V/(x1) ist zulässig, d1 = D,32)T.. 1 /1 fi 8\^ III Die Schrittweite wird wie im vorangegangenen Beispiel ermittelt: a\ = —, x2 = ( —, - ) . 20 \ 5 5/ 2 Schritt: —g-,—g-) (nicht zulässig),/0(x2) = {4}, A2 = B 1). III a2 = 5,x3 = C,2)T. 3 Schritt: I: V/(x3) = (-4, -16)T (nicht zulässig), 70(x3) = {3,4}, A3 = ( * ^) . II.Pa=(S ^),d3 = @,0)T,u=(|,-?)Tu2<0: A3 = A 2). 4 Schritt I: V/(x4) = (-6, -12)T (nicht zulässig), /0(x4) - {3}, A4 = A3 II P4 = P3, d4 = @,0)T, u = Q>0 Daraus folgt, daß x4 Minimalpunkt ist.
902 18. Optimierung 18.2.8 Straf— und Barriereverfahren Das Grundprinzip dieser Verfahrensklasse besteht darin, daß ein Optimierungsproblem mit Nebenbedingungen durch Modifikation der Zielfunktion in eine Folge von Optimierungsaufgaben ohne Neberi- bedingungen umgeformt wird. Die modifizierten Probleme können z.B. mit Verfahren aus 18 2 5, S. 895 gelöst werden Bei geeigneter Konstruktion der modifizierten Zielfunktionen ist jeder Häufungspunkt der Folge der Lösungspunkte dieser Ersatzprobleme eine Lösung der ursprünglichen Aufgabe 18.2.8.1 Strafverfahren Das Problem /(x) = min! bei #(x) < 0 (i = 1,2,... ,m) A8 102) wird durch die Folge unrestringierter Minimumaufgaben #(x,Pfc) = /(x)+PfcS(x) = min! mit x G Rn, pk > 0 {k = 1,2,. .) A8 103) ersetzt. Dabei ist pk ein positiver Parameter Für 5(x) gilt sv>-{zl VA <i8io4> d.h., das Verlassen des zulässigen Bereiches M wird mit einer „Strafe" PkS(x) geahndet Das Problem A8.103) wird mit einer gegen oo wachsenden Folge von Strafparametern pk gelöst. Es gilt lim#(x,pfc) = /(x), xeM. A8 105) k—>oo Ist xk die Lösung des A:-ten Strafproblems, dann gilt H(xk,Pk) > Jfte*-1,^-!), f(xk) > f^-1), A8.106) und jeder Häufungspunkt x* der Folge {xk} ist eine Lösung von A8 102) Ist eines der berechneten xk in M enthalten, so löst xfc das Ausgangsproblem. Als Realisierungen für S(x) sind z B. geeignet: 5(x) = maxr{0,pi(x),.. ,pm(x)} (r = l,2, .) oder A8 107a) S(x) = £maxr{0,^(x)} (r = l,2,...) A8 107b) Sind die Funktionen /(x) und <ft(x) differenzierbar, so erreicht man im Falle r > 1 auch auf dem Rand von M Differenzierbarkeit der Straffunktion H(x,pk), so daß analytische Hilfsmittel zur Lösung des Hilfsproblems A8.103) herangezogen werden können. Abb. 18.11 zeigt eine Veranschaulichung des Strafverfahrens. H(x/Pl) Abbildung 18 11 Abbildung 18.12
18 2 Nichtlineare Optimierung 903 B /(x) = x\ + x\ = min! bei xi + x2 > 1, H(x,Pfc) = £? + #! + Pa: max2{0,1 — x\ — x2} . Die notwendige Optimalitätsbedingung lautet Vtf(x,pfcJ - {2x2-2pkmax{0,l-x1-x2}) ~ \0) ' Der Gradient von H wird hier nur bezüglich x gebildet. Durch Subtraktion beider Gleichungen folgt Pk x\ = x2 Die Gleichung 2x\ — 2pk max{0,1 — 2x\) = 0 besitzt die eindeutige Lösungx\ = x\ = 1 + 2pk Pk 1 Durch den Grenzübergang k —> oo ergibt sich als Lösung sc? = xj = lim — = - . k-*oo 1 + 2pk 2 18.2.8.2 Barriere verfahren Es wird eine Folge von Ersatzproblemen der Form ff (x, qk) = /(x) + qkB(x) = min!, qk > 0 A8.108) betrachtet. Der Term qkB(x) verhindert, daß der zulässige Bereich M bei der Lösung von A8.108) verlassen wird, indem die Zielfunktion bei Annäherung an den Rand von M unbeschränkt wächst. Die Regularitätsbedingung M° = {xeM : ft(x)<:0 (i = 1,2, ,m)}^0 und W = M A8.109) sei erfüllt, d h , das Innere von M ist nicht leer und der Abschluß von M° ist gleich M. Die Funktion B(x) ist auf M° definiert und stetig. Sie wächst auf dem Rand von M nach oo. Das Ersatzproblem A8.108) wird mit einer gegen Null fallenden Folge von Barriereparametern qk gelöst Für die Lösung xfc des fc-ten Problems A8.108) gilt fUk)<f(xk-1), A8 110) und jeder Häufungspunkt x* der Folge {xfc} ist eine Lösung von A8.102) Abb.18.12 zeigt eine Veranschaulichung des Barriereverfahrens. Als Realisierungen für die Funktion B(x) sind z.B geeignet m £(x) = - Yl - ln(-#(x)), x € M° oder A8.111a) *=i m -1 b(x) = Zt-T7ZW (»- = 1.2,...). S€M°. . A8.111b) B/(x) = x\ + x2 = min! bei sci+xä > 1, H(x,qk) = xf + £2+ #*:(— ln(ici + x2 — 1)), Xi+x2 > 1, V#(x,<fo) = Bxx-qk -^ £i — a;2 — 1 2x2 - gfc- ©¦ Xi + £2 > 1 V *^2 Hk . . \ Xi + X2 - 1 / Der Gradient von H wird hier nur bezüglich x gebildet. Subtraktion beider Gleichungen ergibt x\ = x2, 1 « 1 o X\ qk 1 2xi-qk2x7^i = °'Xl>2^ Xi-y-T = 0'Xl>2' , , l n r~ , n * , i *1 = X2 = J + Y Yg + 4*b> * "^ °°' «fc ~* 0; «1 = *2 = ". Die Lösung der Aufgaben A8.103) und A8 108) im fc-ten Schritt hängt nicht von den Lösungen der vorangegangenen Schritte ab Bei der Verwendung großer Straf- bzw. kleiner Barriereparameter treten bei der Lösung von A8.103) und A8.108) mittels numerischer Verfahren, z.B Verfahren aus 18 2.4, S. 893 häufig Konvergenzprobleme auf, falls keine gute Startnäherung verfügbar ist. Praktisch nutzt man deshalb den Lösungspunkt des fc-ten Ersatzproblems als Startwert der Lösung des (k + l)-ten Problems.
904 18. Optimierung 18.2.9 Schnittebenenverfahren 1. Aufgabenstellung und Lösungsprinzip Es wird das Optimierungsproblem /(x) = cTx = min!, c <G Rn A8 112) über dem beschränkten Bereich M C Rn , der mit konvexen Punktionen ^(x) (i = 1, 2,. , m) durch &(x) < 0 beschrieben ist, betrachtet. Ein Problem mit nichtlinearer, aber konvexer Zielfunktion /(x) wird in diese Form überführt, indem /(x)-z„+i<0, xn+1eR A8 113) als weitere Nebenbedingung aufgenommen und 7(x) = xn+1 = min! für alle x = (x, xn+1) G Rn+1 A8.114) mit <?^(x) = <7i(x) < 0 gelöst wird. Die Grundidee des Verfahrens besteht in der iterativen linearen Approximation von M in der Nähe des Minimalpunktes x* durch konvexe Polyeder, womit das Ausgangsproblem auf eine Folge linearer Programme zurückgeführt wird. Zunächst wird ein Polyeder A8 115) bestimmt. Aus dem linearen Programm /(x) = min! bei xePj A8116) wird ein bezüglich /(x) optimaler Eckpunkt x1 von Pi erhalten Ist x1 € M, dann ist die Optimallösung des Ausgangsproblems gefunden. Anderenfalls wird eine Hyperebene Hi = {x : as+1Tx = b8+i, as+1Ta:1 > bs+i}, die den Punkt x1 von M trennt, ermittelt, so daß das neue Polyeder P2 = {*eP1 as+1Tx<^+i} A8 117) erhalten wird. Abb. 18.13 zeigt eine schematische Darstellung des Schnittebenenverfahrens 2. Verfahren von Kelley Die verschiedenen Verfahren unterscheiden sich in der Wahl der trennenden Hyperebenen Hk ¦ Beim Verfahren von KELLEY wird Hk auf folgende Weise bestimmt: Es wird jk derart gewählt, daß gilt gjk{xk) = max{9i(xk) (i = l,. .,m)}. A8 118) Die Funktion gjk(ü) besitzt im Punkt x = xfc die Tangentialebene T(x) = ghUk) + (x - x*)TV&(x*) A8 119) Die Hyperebene Hk = {x G Rn . T(x) = 0} trennt den Punkt xfc von allen Punkten x mit gjk(x) < 0. Daher wird als weitere Restriktion für das (k + l)-te lineare Programm T(x) < 0 gesetzt Jeder Häufungspunkt x* der Folge {xfc} ist ein Minimalpunkt des Ausgangsproblems In der praktischen Rechnung zeigt das Verfahren eine geringe Konvergenzgeschwindigkeit Außerdem steigt die Restriktionszahl ständig an (s. auch [18.10]). P\ = {x € Rn a/x < fei, i = 1,..., s} f(x)=const. Abbildung 18.13
18.3 Diskrete dynamische Optimierung 905 18.3 Diskrete dynamische Optimierung 18.3.1 Diskrete dynamische Entscheidungsmodelle Mit den Methoden der dynamischen Optimierung kann eine breite Klasse verschiedenartigster Optimierungsaufgaben gelöst werden. Die Probleme werden dabei als natürlich oder formal in der Zeit ablaufende Prozesse betrachtet, die über zeitabhängige Entscheidungen gesteuert werden Läßt sich der Prozeß in endlich bzw abzählbar unendlich viele Stufen einteilen, dann spricht man von diskreter dynamischer Optimierung, anderenfalls von kontinuierlicher dynamischer Optimierung Im Rahmen dieses Abschnittes werden nur rc-stufige diskrete Prozesse untersucht. Zur kontinuierlichen dynamischen Optimierung s [18.13]. 18.3.1.1 n-stufige Entscheidungsprozesse Ein n-stufiger Prozeß P startet in der Stufe 0 mit einem Anfangszustand x, Zwischenzustände 2^, x2, • •, xn-i m den Stufen 1,2, Rm Die Zustandsvektoren Xj liegen in Zustandsbereichen Xj C Rm. Zur Überführung eines Zustandes Xj_! in den Zustand Xj ist eine Entscheidung Uj zu treffen Alle möglichen Entscheidungsvektoren Uj bei Vorliegen des Zustandes xj_l bilden den Entscheidungsbereich Uj(xj_i) C Rs. Aus Xj_Y ergibt sich der Folgezustand Xj über die Transformation (Abb. 18.14) x^^x^u,.), j = l(l)n A8 120) x0 und führt über die 1 in einen Endzustand xn = xe € Xe C Xa = So 8i(Xo' u^ HiG ui(*o) xi g2(xlr u2) U2G U2(xa) *2 *n-l ? gn (*n-l> ün) 1 x ' HnG Un&i- Xn = Xe ? i) Abbildung 18.14 18.3.1.2 Dynamische Optimierungsprobleme Das Ziel besteht nun in der Ermittlung einer Politik (u1?... ,un), die unter Beachtung aller Nebenbedingungen den Zustand xa in den Zustand xe überführt und dabei eine Zielfunktion bzw. Kostenfunktion /(/i(xo>Mi), .., fniXn-iiUn)) minimiert Die Funktionen fj(Xj_1,uj) werden als Stufenkosten bezeichnet Damit lautet das dynamische Optimierungsproblem in der Standardform A8 121a) ZF: /(/iCxo.Ui), ..,/n(x„-i,un))—>min! NB: Xj =^-(xi_i,uj) l(l)n,) l(l)n, :l(l)n.J A8 121b) i = l(l)n,' 2£o = 2£a, xn = xe e Xe, Xj E Xj C Rm, j = ii,- e UjUj^) c R™, j : Die Beziehungen x^ heißen dynamische und die Beziehungen x0,Uj statische Nebenbedingungen Alternativ zu A8.121a) kann auch ein Maximumproblem vorliegen Eine Politik (u1? ,un), die alle Nebenbedingungen erfüllt, wird als zulässig bezeichnet Um die Methoden der dynamischen Optimierung anwenden zu können, werden in 18.3.3, S. 906 einige Forderungen an die Form der Kostenfunktion gestellt. 18.3.2 Beispiele diskreter Entscheidungsmodelle 18.3.2.1 Einkaufsproblem In der j-ten Periode eines in n Stufen unterteilbaren Zeitraumes benötigt ein Betrieb Vj Mengeneinheiten eines bestimmten Ausgangsstoffes. Zu Beginn einer Periode j sei dieser Stoff in der Menge Xj-\
906 18. Optimierung vorrätig, speziell sei x0 = xa vorgegeben. Davon ausgehend ist eine Entscheidung darüber zu treffen welche Menge Uj zum Preis Cj pro Mengeneinheit einzukaufen ist Dabei darf die vorhandene Lagerkapazität K nicht überschritten werden, d.h. Xj-\ +Uj < K. Gesucht ist eine Einkaufspolitik (u1} , un), die die Gesamtkosten minimiert Dies fuhrt auf das folgende dynamische Problem n n ZF: f(uu • ,un) = J2fj(uj) = J2CJUJ—>min' A8.122a) 3=1 3=1 NB: Xj = Xj-i + Uj - Vj , j = l(l)n, "j xQ = xa , 0 < Xj < K , j = l(l)n, \ A8 122b) Uj(xj-i) = {uj : max{0,fj — Xj-i} < Uj < K — £j_i} , j = 1A)^. J In A8 122b) ist berücksichtigt, daß der Bedarf immer gedeckt ist und die Lagerkapazität nicht überschritten wird. Enstehen zusätzlich Lagerkosten / pro Mengeneinheit und Periode, dann betragen die mittleren Lagerkosten in der j-ten Periode (xj-\ + Uj — Vj/2)l, und die modifizierte Kostenfunktion lautet n f(x0, UU • • , Xn-uUn) = J2(CJUJ + fo'-l + UJ ~ Vj/2) ' 0- A8 123) 3=1 18.3.2.2 Rucksackproblem Von den Artikeln A\, ,An mit den Gewichten w\,...,wn und den Werten ci, .., cn sind einige so auszuwählen, daß ein Gesamtgewicht W nicht überschritten wird. Die getroffene Auswahl soll einen maximalen Gesamtwert erreichen. Dieses Problem hängt nicht unmittelbar von der Zeit ab Es wird auf folgende Weise „künstlich" dynamisiert In jeder Stufe wird eine Entscheidung Uj über die Auswahl des Artikels Aj getroffen. Dabei ist für ein ausgewähltes Aj uj = 1, anderenfalls ist Uj = 0 Wird die zu Beginn einer Stufe noch verfügbare Kapazität mit Xj-\ bezeichnet, dann ergibt sich das folgende dynamische Problem: n ZF: f(uu • iun) = ^2cjuj —> max' A8 124a) NB: A8 124b) 18.3.3 Bellmansche Funktionalgleichungen 18.3.3.1 Eigenschaften der Kostenfunktion Voraussetzung für die Aufstellung der BELLMANschen Funktiohalgleichungen sind zwei Forderungen an die Kostenfunktion 1. Separierbarkeit Die Funktion /(/i(x0, Ui),. •., /n(xn-i> un)) heißt separierbar, wenn sie mit zwei- argumentigen Funktionen H\,..., #n-i und mit Funktionen Fi,. ., Fn in folgender Form geschrieben werden kann. f{fl(x0,Ul),'--Jn{Xn-l,Un)) = *l(/l (Xo, ül), , /nfen-l, uj) , Fi(/i(x0,u1),...,/n(xn_1,un)) = ifi(/iBc0,u1),F2(/2(x1,u2),. . ,/n(xn_i,un))) , A8.125) Jb j Jb j — 1 UJ jLLj) xo = W, 0<Xj<W, Uj G {0,1}, falls Xj-i > Wj, Uj = 0 , falls Xj-i < Wj, 3 = l(l)n, 3 = 1A)«. }j = l(l)n Fn-l{fn-l(Xn-2,Un-l)Jn(xn-liUn)) = ^n-1 (/n-l(xn_2, Un-l), Fn(fn(*n-1, ün))) . Fn(/n(xn_1,Un)) = /n(xn_i,Un) .
18.3 Diskrete dynamische Optimierung 907 2. Minimumvertauschbarkeit Eine Funktion //(/(a), F(b)) heißt minimumvertauschbar, falls gilt: min ff (/(a), F(b)) = min ff (/(a), min F(b)) A8 126) Diese Eigenschaft ist zum Beispiel dann erfüllt, wenn H für jedes aEi bezüglich des zweiten Argumentes monoton wachsend ist, d.h., wenn für alle a € A gilt. H (/(a), Ffe)) < ff (/(a), F(b2)) für F(fc) < F(b2) A8.127) Für die Kostenfunktion des dynamischen Optimierungsproblems wird nun die Separierbarkeit von / und die Minimumvertauschbarkeit aller Funktionen Hj, j = l(l)n — 1, gefordert. Folgende häufig Verwendung findende Klassen von Kostenfunktionen genügen beiden Bedingungen: rm = t,fA^-uUj) bzw. fmax= max /,(*,_„»,) A8.128) j=l J=l(l)n Die Funktionen Hj lauten i/fm = /i(xi_1>iii)+ £ ACaSfc-i,!!*) bzw. A8.129) k=j+i tff^maxj/^^^ A8-130) 18.3.3.2 Formulierung der Funktionalgleichungen Es werden die folgenden Funktionen definiert 0i(xJ-_1)= min FjUjtej^Uj),. ., /n(xn_!,un)), j = l(l)n, A8.131) k=j(l)n 0n+l(xn)=O A8 132) Falls keine Politik (u^, , un) existiert, die den Zustand x7_i in einen Endzustand xe € Xe überführt, wird (j>j(xj_i) = oo gesetzt. Die Ausnutzung von Separierbarkeit und Minimumvertauschbarkeit sowie der dynamischen Nebenbedingungen liefert für j = l(l)n <fe(Xj_i)= min Hjifjix^Uj), min Fj+1(fj+1(xjiuj+1)y...Jn(xn__11jin)))i fc=j+l(l)n 0j(Xj_i)= min Hj(fj(Xj_uUj),<l>j+1(gj(Xj_uUj)j) A8 133) Die Gleichungen A8.133) zusammen mit Gleichung A8 132) werden als BELLMANsc/ie Funktionalgleichungen bezeichnet. </>i(x0) ist der Optimalwert der Kostenfunktion / 18.3.4 Bellmansches Optimalitätsprinzip Die Berechnung der Funktionalgleichung <fe(Xj_i) = min Hj (/^Xj-i,^),^!^)) A8 134)
908 18 Optimierung entspricht der Bestimmung einer optimalen Politik (u*, . , u*) für den mit dem Zustand Xj_i startenden Teilprozeß Pj , welcher aus den letzten n — j + 1 Stufen des Gesamtprozesses P besteht und dem die Minimierung der Kostenfunktion ^¦(x^u,-), ,/n(Xn-i,uJ) —> min! A8 135) zugrunde liegt Die optimale Politik des Prozesses Pj mit dem Anfangszustand Xj_i ist unabhängig von den Entscheidungen u1? , Uj_i in den ersten j — 1 Stufen von P, die zum Zustand Xj_i führten. Für die Ermittlung von 4>j(xij_l) wird die Größe <^J-+1(xJ-) benötigt Ist nun (u*, , u*) eine optimale Politik für Pj} dann ist offensichtlich (u*+1,... ,u*) eine optimale Politik für den Teilprozeß Pj+i zum Anfangszustand X-,- = gj(Xj_uu*). Diese Aussage wird im BELLMANschen Optimalitätspnnzip verallgemeinert. BELLMANsches Prinzip: Ist (uj,. , u*) eine optimale Politik eines Prozesses P und (xj, ., x*) die zugehörige Zustandsfolge, dann ist für jeden Teilprozeß Pj,j = l(l)n, mit dem Startzustand x*_x die Politik (u*,. . ,u^) ebenfalls optimal (s. [18.1]). 18.3.5 Bellmansche Funktionalgleichungsmethode 18.3.5.1 Bestimmung der minimalen Kosten Mittels der Funktionalgleichungen A8 132), A8 133) werden, mit </>n+i(xn) = 0 beginnend, für abnehmende j alle Funktionswerte 4>j(xj_1) mit Xj_i G Xj-\ bestimmt Dies erfordert für jedes x-_x G Xj-\ die Lösung eines Optimierungsproblems über dem Entscheidungsbereich C/j(xj_i). Für jedes Xj_i ergibt sich dabei eine Minimalstelle Uj als optimale Entscheidung für die erste Stufe eines mit Xj_! beginnenden Teilprozesses Pj Sind die Mengen Xj nicht endlich oder auch sehr groß, dann können die Werte 4>j unter Umständen an ausgewählten Stützstellen x^ G Xj-\ berechnet werden, woraus mittels Interpolation gegebenenfalls Zwischenwerte ermittelt werden können Mit fa (x0) ist der Optimal wert der Kostenfunktion für den Prozeß P gefunden Die Ermittlung einer optimalen Politik (uj, . , u*) sowie einer zugehörigen Zustandsfolge (xj, , x*) kann auf 2 Arten erfolgen. 18.3.5.2 Bestimmung der optimalen Politik 1. Variante 1: Mit der Auswertung der Funktionalgleichungen wird für jedes x^ G Xj-i die ermittelte Minimalstelle u^ abgespeichert. Nach der Berechnung von 0i(xo) ist eme optimale Politik einfach dadurch zu erhalten, daß zunächst aus dem für x0 = xj gespeicherten u^ = uj der Folgezustand xj = #i(xo, uj) errechnet wird. Die für diesen Zustand xj gespeicherte Entscheidung uj; liefert x^ usw 2. Variante 2: Zu jedem Xj_i G Xj-i wird lediglich der Wert (j)j(Xj-i) gespeichert Nachdem alle 0j(xj-i) bekannt sind, schließt sich eine Vorwärtsrechnung an Beginnend mit j = 1 und x0 = 2£o w^d u*l für wachsendes j durch Auswertung der Funktionalgleichung <^(x*_i)= min ^(//(xJ-^UjO.^+ifefxJ-i.Uj-))) A8 136) bestimmt Daraus ergibt sich jeweils x* = <7j(x*_l5 u*) In der Vorwärtsrechnung ist somit auf jeder Stufe nochmals ein Optimierungsproblem zu lösen. 3. Vergleich beider Varianten Bei Variante 1 ist der Rechenaufwand etwas geringer, da die bei der Variante 2 erforderliche Vorwärtsrechnung entfällt Dagegen muß für jeden Zustand x_j_1 eine Entscheidung Uj abgespeichert werden, was für höherdimensionale Entscheidungsräume Uj(xj_i) zu einem wesentlich höheren Speicherplatzbedarf, verglichen mit Variante 2, führt, bei welcher nur die Größen 0j(xj_i) zu speichern sind Für die Computerlösung wird deshalb in vielen Fällen Variante 2 vorzuziehen sein.
18.3 Diskrete dynamische Optimierung 909 18.3.6 Beispiele zur Anwendung der Funktionalgleichungsmethode 18.3.6.1 Optimale Einkaufspolitik 1. Problemstellung Das Problem der Bestimmung einer optimalen Einkaufspolitik aus 18.3.2.1, S. 905 n /(tii, ...,un) = Y, CjUj —> min! Xj = Xj-i + Uj — Vj , j — l(l)n , Xq = xa , 0 < Xj < K , j = l(l)n, Uj(xj-i) = {uj . max{0,i>7 — £j-i} < Uj < K — £j_i} , j = l(l)n fuhrt auf die Funktionalgleichungen 0n+l(O=O, (t>j{xj-i)= min {CjUj + (ßj+^Xj^ + Uj - Vj)), ujeUjixj-i) i(i)n 2. Zahlenbeispiel n = 6, AT = 10, xa = 2. c4 = v4 C5 : ^5 : : 4, c6 = = 4, V6 ¦- 2, = 3. ci =4, c2 = 3, c3 = 5, vi = 6, f 2 = 7, i>3 = 4, 1. Rückwärtsrechnung: Die Funktionswerte 4>j(xj-i) werden an den Stützstellen Xj-\ =0,1,. ,10 bestimmt Es genügt dann, die Minimumsuche nur für ganzzahlige Entscheidungen Uj durchzuführen j = 6 06 (#5) = mm c6^6 = Cq max{0, v$ — x5} = 2 max{0,3 — x5} u^eUcix^) Gemäß Variante 2 der BELLMANschen Funktionalgleichungsmethode werden nur die Werte 06 (#5) in die letzte Zeile der Tabelle eingetragen Exemplarisch wird 04@) bestimmt. 04@) = min Cw4 + 05 (u4 — 2)) 2<U4<10 = minB8,27,26,25,24,25,26,27,30) = 24. j=l 2 3 4 5 6 x3=0 59 44 24 22 6 1 56 39 21 18 4 2 75 53 34 18 14 2 3 50 29 15 10 0 4 47 24 12 6 0 5 44 21 9 4 0 6 41 18 6 2 0 7 38 15 4 0 0 8 35 12 2 0 0 9 32 9 0 0 0 10 29 6 0 0 0 2. Vorwärtsrechnung: £jB) = 75 = min Dwi + 02(«i - 4)) Als Minimalstelle ergibt sich u* = 4 und somit x\ = Xq + u\ — v\ = 0 Dieses Verfahren wird für 02@) und alle nachfolgenden Stufen wiederholt. Die optimale Politik lautet* (u[, u*2, uj, itj, itj, izj) = D,10,1,6,0,3). 18.3.6.2 Rucksackproblem 1. Problemstellung Gegeben sei das Problem aus 18 3.2.2, S. 906 ZF: NB: /K ,Un) ¦- E c3uj ¦ 3=1 A8.137a)
910 18 Optimierung A8 137b) Xj = Xj-i — WjUj , j = l(l)n, xo = W, 0 < Xj < W, j = l(l)n, Uj- 6 {0,1}, falls xj-! > Wj, 1 = , . itj = 0 , falls Xj-i < Wj , j J v ' Da ein Maximumproblem vorliegt, lauten die BELLMANschen Funktionalgleichungen jetzt 4>n+l(Xn) =0, MX3-l) = maX SCJU3 + ^J + l^j-l - WJUj)) » J = U1)™ • Da lediglich die Entscheidungen 0 und 1 auftreten, empfiehlt sich die Anwendung der Variante 1 der Funktionalgleichungsmethode. Es ergibt sich für j = n, n — 1, ., 1 M („ \-lC3+ tj+lfa-l - Wj) für X3-l > W3 Und CJ + tj+lfa-l ~ Wj) > (fij+iiXj-i) , mxJ-i) ~ \ 0j+1(^_1) sonst, Uj{Xj-i) = |0 2. Zahlenbeispiel 1 für Xj-i > Wj und Cj + (j)j+i(xj-i — Wj) > 0j+i(xj_i), sonst. W = 10, n = 6. ci = 1, C2 = 2, c3 = 3, c4 = 1, c5 = 5, c6 = 4, Wi = 2, iu2 = 4, ^3 = 6, W4 = 3, w5 = 7, w6 = 6 Aufgrund der Ganzzahligkeit der Gewichte u>j ist Xj G {0,1,. ., 10}, j = l(l)n, 0:0 = 10. Die Tabelle enthält für alle Stufen und alle Zustände Xj_i die Funktionswerte (j>j(xj-i) und die jeweilige Entscheidung Uj(xj-\). Exemplarisch werden die Größen 06 (#5), 03B), 03 F), und 03(8) berechnet Mzs) = |o' sonst 1 = 6, sonst, 0aB) x2 = 2 < w3 = 3 0aB) = 04B) = 3, u3B) = 0 03F) x2 > w3 und c3 + 03(x2 - w3) = 6 + 3 < 04(^2) = 10 03(8) x2 > w3 und c3 + 03(x2 - w3) = 6 + 9 > 04(^2) = 10: Die optimale Politik lautet {u\,ul,ul,u\,ul,ul) = @,1,1,1,0,1), 0i(lO) = 19 0aF) = 10, tz3F) = 0. 03(8) = 15, u3($) = 1 7 = 1 2 3 4 5 6 Xj = 0 0,0 0;0 0,0 0,0 0,0 1 3,0 3;0 3,1 0,0 0;0 2 4;1 3;0 3;1 0;0 0;0 3 7, 1 6, 1 3;1 0;0 0;0 4 9;0 9, 1 6;0 6;0 6;1 5 10; 1 9,0 9,1 7;1 6,1 6 13; 1 10; 0 10; 1 7; 1 6,1 7 13; 1 12, 1 10,1 7;1 6, 1 8 15; 0 15, 1 10; 1 7;1 6, 1 9 16; 0 16,1 13; 0 13; 1 6,1 10 19; 0 19; 1 16,0 16; 1 13; 1 6,1
911 19 Numerische Mathematik In diesem Kapitel werden häufig nur die Grundprinzipien numerischer Verfahren beschrieben Ihre Anwendung zur Lösung praktischer Aufgaben auf dem Computer erfordert in der Regel den Einsatz von Numerik-Bibliotheken der kommerziellen Software. Einige dieser Bibliotheken werden in 19 8 3, S. 973ff vorgestellt. Die speziellen Computeralgebrasysteme Mathematica und Maple und deren Numerikprogramme sind in Kapitel 20.1, S. 982ff. und in 19 8.4, S 975ff. beschrieben. Der Einfluß von Fehlern, die beim numerischen Rechnen auf Computern auftreten, wird in 19.8.2, S. 968ff behandelt. 19.1 Numerische Lösung nichtlinearer Gleichungen mit einer Unbekannten Jede Gleichung mit einer Unbekannten läßt sich auf eine der beiden Normalformen bringen Nullstellengleichung: f(x) = 0 A9.1) Fixpunktgleichung: x = ip(x). A9-2) Die Gleichungen A9.1) und A9 2) seien lösbar. Lösungen sollen mit x* bezeichnet werden. Zur Gewinnung einer ersten Näherung für x* versucht man, die zu lösende Gleichung auf die Form fi(x) = f2{%) zu bringen, bei der der Verlauf der Kurven y = fi{x) und y = /^(z) leicht zu übersehen ist. ¦ f(x) = x2 — sin x = 0 Aus dem Kurvenverlauf von y = x2 und y = sin x ist x\ = 0 und x\ ~ 0,87 ablesbar (Abb.19.1). ]0 1 2 =0 x*2«0,87 Abbildung 19.1 Abbildung 19.2 19.1.1 Iterationsverfahren Das allgemeine Prinzip der iterativen Methoden zur genäherten Lösung von Gleichungen besteht darin, ausgehend von bekannten Näherungswerten x^ (k = 0,1, .. , n) für eine Lösung, schrittweise, also durch Iteration, eine Folge von weiteren Näherungswerten zu erzeugen, die möglichst schnell gegen die betreffende Lösung der gegebenen Gleichung konvergiert 19.1.1.1 Gewöhnliches Iterationsverfahren Zur Lösung einer Gleichung, die auf die Fixpunktform x — (p(x) gebracht worden ist, verwendet man die naheliegende Iterationsvorschrift xn+i = ip{xn) (n = 0,1,2,...; x0 gegeben), A9.3) die als gewöhnliches Iterationsverfahren bezeichnet wird. Es konvergiert gegen eine Lösung x*, wenn es eine Umgebung von x* (Abb. 19.2) mit \tp(x) - (f(x*)\ < K < 1 (K = const) A9.4)
912 19 Numerische Mathematik gibt und die Ausgangsnäherung x0 m dieser Umgebung liegt Ist ip(x) differenzierbar, dann lautet die entsprechende Bedingung \tf{x)\ <K <1. A9 5) Die Konvergenz des gewöhnlichen Iterationsverfahrens ist um so besser, je kleiner die Zahl K ist ¦ x2 = sinx, d.h. \/sin£n. n Xn sinxn 0 0,87 0,7643 1 0,8742 0,7670 2 0,8758 0,7681 3 0,8764 0,7684 4 0,8766 0,7686 5 0,8767 0,7686 Hinweis 1: Im Falle komplexer Lösungen setzt man x = u + iv . Durch Trennung von Real- und Imaginärteil geht die zu lösende Gleichung in ein System zweier Gleichungen für die reellen Unbekannten u und v über. Hinweis 2: Die iterative Lösung nichtlinearer Gleichungssysteme findet man in 19.2.2, S. 923 19.1.1.2 Newton-Verfahren 1. Vorschrift des Newton-Verfahrens Zur Lösung der Nullstellengleichung f(x) = 0 verfährt das Newton- Verfahren nach der Vorschrift Xn+\ Xn (n = 0,1,2,... , xq gegeben), A9 6) d h , es benötigt zur Berechnung des neuen Näherungswertes xn+\ die Werte der Funktion f(x) und ihrer 1. Ableitung f'(x) an der Stelle xn . 2. Konvergenz des Newton-Verfahrens Für die Konvergenz des NEWTON-Verfahrens ist die Bedingung f'(x) + 0 A9 7a) notwendig, die Bedingung I/(*)/"(*) I ff2(x) < K < 1 (K = const) A9.7b) hinreichend Die Bedingungen A9.7a,b) müssen in einer Umgebung von x*, die alle Punkte xn sowie x* enthält, erfüllt sein Falls das NEWTON-Verfahren konvergiert, dann konvergiert es so gut, daß sich bei jedem Iterationsschritt die Anzahl der genauen Stellen etwa verdoppelt. Man spricht in diesem Fall auch von quadratischer Konvergenz Zur Lösung der Gleichung f(x) = x2 gegeben) liefert das NEWTON-Verfahren die Iterationsvorschrift _ 1 / a\ Xn+1 — TT ( Xn H 1 2 V xnJ Für a = 2 erhält man- = 0, d h speziell zur Berechnung der Werte x = y/ä (a > 0 A9.8) n Xn 0 1,5 1 M16 666 6 2 1,414215 7 3 1,414 213 6 3. Geometrische Interpretation Die geometrische Interpretation des NEWTON-Verfahrens ist in Abb. 19.3 dargestellt* Die Grundidee des NEWTON-Verfahrens besteht in der lokalen Approximation der Kurve y = f(x) durch eine Tangente. 4. Modifiziertes Newton-Verfahren Wenn sich im Laufe der Iteration die Werte von f'{xn) nur noch unwesentlich ändern, kann man diese konstant lassen und mit dem sogenannten modifizierten NEWTON-Verfahren f(xn) Xn+l weiterrechnen xn f'{Xm) (m fest, m < n) A9 9)
19.1 Numerische Lösung nichtlinearer Gleichungen mit einer Unbekannten 913 Abbildung 19.3 Abbildung 19.4 Die Güte der Konvergenz wird durch diese Vereinfachung nicht wesentlich beeinflußt. 5. DifFerenzierbare Funktionen komplexen Argumentes Das Newton-Verfahren ist auch auf differenzierbare Funktionen komplexen Arguments anwendbar. 19.1.1.3 Regula falsi 1. Vorschrift der Regula falsi Zur Lösung der Nullstellengleichung f(x) falsi nach der Vorschrift 0 verfährt die Regula \fixn) {n = 1,2,... ; m < n, x0, x\ gegeben), /(*„)-/(xmr""" -—-•¦•>"—•——/¦ (l9l°) d.h., sie benutzt nur Funktionswerte und geht aus dem Newton-Verfahren A9.6) dadurch hervor, daß die Ableitung f'(xn) durch den Differenzenquotienten von f(x) zwischen xn und einem vorhergehenden Näherungswert xm (m < n) ersetzt wird. 2. Geometrische Interpretation Die geometrische Interpretation der Regula falsi ist in Abb. 19.4 dargestellt: Die Grundidee der Regula falsi besteht in der lokalen Approximation der Kurve y = f(x) durch eine Sekante 3. Konvergenz Das Verfahren A9.10) konvergiert sicher, wenn man m jeweils so wählt, daß f(xm) und f(xn) verschiedene Vorzeichen haben. Ist bei fortgeschrittener Iteration die Konvergenz bereits gesichert, so wird sie beschleunigt, wenn man ohne Rücksicht auf die Vorzeichenbedingung xm — xn-\ setzt. ¦ f(x) = x2 — sin x — 0 . n 0 1 2 3 4 ^Xn — Xji Xn—\ -0,3 0,0065 0,000229 -0,000003 %n 0,9 0,87 0,8765 0,876729 0,876726 f(xn) 0,0267 -0,0074 -0,000252 0,000003 Ayn = f(xn) - /(xn_i) -0,0341 0,007148 0,000255 Ayn 0,8798 0,9093 0,8980 Falls sich im Verlaufe der Rechnung die Werte Axn/Ayn nur noch unwesentlich ändern, kann auf ihre Neuberechnung verzichtet werden. 4. Steffensen-Verfahren Durch Anwendung der Regula falsi mit xm = xn-i auf die Gleichung f(x) = x — tp(x) = 0 läßt sich häufig die Konvergenz wesentlich beschleunigen oder im Falle ipf{x) < — 1 sogar erzwingen. Diese Vorgehensweise ist unter dem Namen Steffensen- Verfahren bekannt geworden. ¦ Zur Lösung der Gleichung x2 — sin x = 0 mit Hilfe des Steffensen-Verfahrens soll die Gleichung f(x) = x — Vsinx = 0 benutzt werden.
914 19 Numerische Mathematik n 0 1 2 3 *-*Xn Xn •En—1 -0,03 0,006654 Xn 0,9 0,87 0,876654 0,876727 /(*n) 0,014942 -0,004259 -0,000046 0,000001 Al/ = /(*„) - /(s„-i) -0,019201 0,004213 AXn 1,562419 1,579397 19.1.2 Lösung von Polynomgleichungen Polynomgleichungen n-ten Grades haben die Form f(x) = pn(x) = anxn + an_ixn_1 + • • + axx + a0 = 0. A9.11) Zu ihrer effektiven Lösung benötigt man zunächst Verfahren zur Berechnung von Funktions- und Ableitungswerten des Polynoms pn(x) sowie eine erste Orientierung über die Lage seiner Nullstellen. 19.1.2.1 Horner—Schema 1. Reelle Argumentwerte Zur Berechnung des Funktionswertes pn(x) eines Polynoms ra-ten Grades an der Stelle x seinen Koeffizienten geht man von der Beziehung pn(x) = anxn + an-ixn~l H h a2x2 + a\X + a0 = (x - x0)pn-i(x) + pn{xo) aus, wobei pn-i(x) ein Polynom vom Grade n — 1 ist pn-i(x) = a'n_lxn x+a'n • + dyX + an = T0 aus A9.12) A9 13) A9.14) Durch Koeffizientenvergleich in A9 12) bezüglich xk erhält man die Rekursionsformel a'k-i — xoak + ak {k = n, n — 1, .., 0, a'n = 0, a'^ = pn(xo)) • Auf diese Weise werden aus den Koeffizienten ak von pn(x) die Koeffizienten a'k vonpn_i (x) sowie der gesuchte Funktionswert pn(xo) bestimmt Durch Wiederholung dieser Vorgehens weise, d h , im nächsten Schritt wird das Polynompn_i(x) mit dem Polynom pn-2(x) gemäß pn-l(x) = (X- X0)pn-2(x) +Pn-l{x0) A9 15) verknüpft usw., erhält man schließlich eine Folge von Polynomenpn(x), pn-i(x) , p\(x), po{x). Die Berechnung der Koeffizienten und Funktionswerte dieser Polynome ist in A9.16) schematisch dargestellt Xq Xq Xq Xq 0>n a'n-l <-2 fl(n-l) ÜQ In) a0 = On-1 Wn-1 a'n-2 XQa'n-2 an-3 (n-1 Pi{xq) Po(xq) Ün-2 Xoa'n_2 an-3 • Z0<-3 • <-4 • .. a3 a2 a1 a0 xoa'3 Xoa'2 Xoa\ xoa'0 a'2 a[ a'0 .. Xoa'2' Xoa'l Xoüq a'[ ag Pn{x0) Pn-l(Xo) A9 16) Aus dem Schema A9 16) liest man pn(xo) unmittelbar ab. Darüber hinaus gilt: p'n{x0) = l!p„_i(z0), PnM = 2!pn_2(x0), • ,pnn)(x0)=n\po(x0). A9 17)
19 1 Numerische Lösung nichtlinearer Gleichungen mit einer Unbekannten 915 pA{x) = x4 + 2x3 - 3x2 - 7. Der Funktionswert und die Ableitungswerte von p±(x) an der Stelle xq = 2 sind gemäß A9.16) zu berechnen. 2 2 2 2 2 12-30-7 2 8 10 20 14 5 10 113 2 12 34 1 6 17 |44 2 16 1 8 JJ33_ 2 1 [l0_ 1 Man liest ab' p4B) = 13, PiB) =44, rfB) =66, P'4"B) =60, p<4)B) = 24 Hinweis: Das HORNER-Schema läßt sich auch für komplexe Koeffizienten a^ durchführen, indem man für jeden Koeffizienten eine reelle und eine imaginäre Spalte gemäß A9.16) berechnet 2. Komplexe Argumentwerte Sind die Koeffizienten a^ in A9 11) reell, so kann die Berechnung von pn{x0) für komplexe Werte Xq = Uq + ii>0 ganz im Reellen ablaufen Dazu wird pn(x) wie folgt zerlegt: pn(x) = anxn + an-ixn~l H 1- a\X + a0 (x2 - px - q)(a'n_2xn 2 + • • 4- a'0) + T\X + r0 (x - x0)(x -x0), dh p = 2w0, g = -(w02 + v02). ¦ p4(x) = x4 + 2x3 ¦ berechnen. A9 18a) A9 18b) A9 18c) HORNER- A9.18A) 3x2 — 7 Der Funktionswert für xq = 2 — i, d h. p = 4 und q = — 5, ist zu mit x2 — px — q Es ist dann Pn(xo) = nx + r0 = (nito + r0) + inv0 Zur Realisierung von A9 18a) kann man nach Collatz das folgende sogenannte z\ Schema aufstellen. Q V Q>n < -2 an_i an_2 qa'n-2 • P<-2 Wn-3 <-3 ön-4 a3 a2 ai a0 .. ga^ ga2 qa\ qa'0 pa'2 pa[ pa'0 a[ af0 n r0 -5 4 1 2 -3 -5 4 24 1 6 16 0 -30 64 34 -7 -80 -87 Man liest ab: p4(x0) = 34xo-87= -19- 34i. 19.1.2.2 Lage der Nullstellen 1. Reelle Nullstellen, Sturmsche Kette Mit der kartesischen Zeichenregel kann man einen ersten Hinweis darauf bekommen, ob die Polynomgleichung A9 11) reelle Nullstellen hat. Es gilt: 1. Die Anzahl der positiven Nullstellen ist gleich der Anzahl der Vorzeichenwechsel in der Koeffizientenfolge an, an_i, , au a0 A9 19a) oder um eine gerade Anzahl kleiner.
916 19 Numerische Mathematik 2. Die Anzahl der negativen Nullstellen ist gleich der Anzahl der Vorzeichenwechsel in der Koeffizien- tenfolge a0, -au a2,.. , (-l)nan A919b) oder um eine gerade Anzahl kleiner. 1 Pö(^) = x5 — 6x4 + 10a;3 + 13a:2 — 15x — 16 hat 1 oder 3 positive Wurzeln und 0 oder 2 negative Wurzeln Mit der STURMschen Kette (s S. 44) kann man genaue Auskunft über die Anzahl der reellen Nullstellen zwischen zwei Stellen x = a und x = b bekommen. Einen Überblick über den Verlauf der Kurve y = pn(x) und damit auch über die Lage ihrer Nullstellen verschafft man sich dadurch, daß man mit Hilfe des HORNER-Schemas für gleichabständige Argumentwerte xv = Xo + v - h (h — const) die Funktionswerte ermittelt. Hat man zwei Stellen x = a und x = b gefunden, an denen pn(x) entgegengesetzte Vorzeichen hat, dann liegt zwischen ihnen mindestens eine reelle Nullstelle. 2. Komplexe Nullstellen Zur Eingrenzung des Bereichs, der in der komplexen Zahlenebene für die reellen oder komplexen Nullstellen in Frage kommt, geht man von der Polynomgleichung A9 11) zu der Gleichung f*(x) = k-ilr*-1 + |an_2|rn-2 + ... + |fll|r + \a0\ = \an\rn A9 20) über und bestimmt z.B. durch systematisches Probieren eine obere Schranke r0 für die positiven Nullstellen von A9.20). Es gilt dann für alle Nullstellen x*k (k = 1,2,..., n) von A9.11): \x*k\ <r0. A9 21) ¦ f{x) = pt(x) = x4 + 4, 4x3 - 20, Olx2 - 50, 12x + 29,45 = 0, f*(x) = 4,4r3 + 20,01r2 + 50,12r + 29,45 = r4 . Man erhält für r = 6. /*F) = 2000,93 > 1296 = r4, r = 7: Jf*G) = 2869,98 > 2401 = r4, r = 8: /*(8) = 3963,85 < 4096 = r4. Daraus folgt |jcj|<8(fc = l,2,3,4). Tatsächlich gilt für die betragsgrößte Nullstelle x\- -7 < x\ < -6. Hinweis: Für die Bestimmung der Anzahl der komplexen Nullstellen mit negativem Realteil sind z.B. in der Elektrotechnik in der sogenannten Ortskurventheorie spezielle Verfahren entwickelt worden, die dort als Stabilitätskriterien bezeichnet werden (s. [19.11], [19 37]). 19.1.2.3 Numerische Verfahren 1. Allgemeine Verfahren Alle in 19.1.1 angegebenen Verfahren sind zur Bestimmung reeller Wurzeln von Polynomgleichungen anwendbar. Das Newton-Verfahren ist bei Polynomgleichungen besonders geeignet, da es rasch konvergiert und die benötigten Werte f(xn) und f'(xn) mit Hilfe des HORNER-Schemas schnell berechnet werden können. Ist der Näherungswert xn für eine Nullstelle x* der Polynomgleichung f(x) = 0 schon ziemlich genau, dann kann die Korrekturgröße 5 = x* — xn mit Hilfe der Fixpunktgleichung 6=~jkö if{Xn) + hf{Xn)&2+' • •]= ^ A9-22) iterativ verbessert werden 2. Spezielle Verfahren Das BAIRSTOW- Verfahren ist ein Iterationsverfahren zur Bestimmung von Wurzelpaaren, auch konjugiert komplexen Es geht von der Abspaltung eines quadratischen Faktors vom gegebenen Polynom wie beim HORNER-Schema A9 18a-d) aus und hat die Ermittlung von Koeffizienten p und q zum Ziel, die die Restkoeffizienten r0 und r\ zu Null machen (s. [19.36], [19.11], [19.37]) Falls nur die betragsgrößte oder betragskleinste reelle Wurzel gesucht ist, so kann diese nach der Methode von Bernoulli recht einfach ermittelt werden (s. [19 36]).
19 2 Numerische Lösung von Gleichungssystemen 917 Vor allem aus historischer Sicht soll noch das Graeffe- Verfahren erwähnt werden, das alle Wurzeln gleichzeitig liefert, auch die komplexen, aber mit erheblichem Rechenaufwand (s [19 11], [19 37]) 19.2 Numerische Lösung von Gleichungssystemen Bei vielen praktischen Aufgaben werden für n unbekannte Größen Xi (i = 1,2, in Gleichungsform gestellt Fi(xux2, F2(xux2, , n) m Bedingungen A9 23) Fm(xi,x2,...,xn) = 0. Die Unbekannten X{ sind so zu bestimmen, daß sie eine Lösung des Gleichungssystems A9.23) darstellen In der Regel ist m = n , d h , die Anzahl der Unbekannten stimmt mit der Anzahl der Gleichungen überein Im Falle m > n bezeichnet man A9 23) als überbestimmtes System, im Falle m < n als unterbestimmtes System. Uberbestimmte Systeme haben in der Regel keine Lösung Man formuliert deshalb die zu A9 23) gehörende Quadratmittelaufgabe ^2F?(xux2, ,:rn) = min A9 24) als Ersatzaufgabe Im unterbestimmten Fall können im allgemeinen n — m Unbekannte frei gewählt werden, so daß die Lösung von A9 23) von n — m Parametern abhängt Man spricht dann von einer (n — ra)-dimensionalen Lösungsmannigfaltigkeit Man unterscheidet lineare und nichthneare Gleichungssysteme, je nachdem, ob in A9.23) die Unbekannten nur linear oder auch nichtlinear auftreten 19.2.1 Lineare Gleichungssysteme Gegeben sei das lineare Gleichungssystem aii^i + a\2x2 + a2iXi + a22x2 + + a\nxn = bi, + «2n^n = h , ßnl^l + an2x2 + * " * + annxn ~ ^n Das System A9 25) lautet in Matrixschreibweise Ax = b A = /flu öi2 • • • a>in\ a2i a22 • • a2n \ ßnl ^n2 • • • ünn ) b = ''2 \bnJ x2 \xnJ A9 25) A9 26a) A9 26b) Die quadratische Matrix A = (a^) (i,k = 1,2,... ,n) sei regulär, so daß das System A9 25) eine eindeutige Lösung besitzt (s 44.2.1,2.,S. 281). Bei der numerischen Lösung von A9 25) kann man im wesentlichen zwei Verfahrensklassen unterscheiden. 1. Direkte Verfahren, die durch elementare Umformungen das Gleichungssystem auf eine Form bringen, aus der die Lösungen unmittelbar abzulesen oder leicht zu bestimmen sind Dazu gehören das Austauschverfahren (s 4 4 1 2, S 279) und die in 19 2 1 1, S 918 bis 19 2.1 3, S 920 beschriebenen Verfahren
918 19. Numerische Mathematik 2. Iterationsverfahren, die von einer bekannten Startnäherung aus eine Folge von Näherungslösungen erzeugen, die gegen die Lösung von A9.25) konvergiert (s 19.2 1.4, S 922). 19.2.1.1 Dreieckszerlegung einer Matrix 1. Prinzip des Gaußschen Eliminationsverfahrens Durch die elementaren Umformungen 1. Vertauschen von Zeilen, 2. Multiplikation einer Zeile mit einer von Null verschiedenen Zahl und 3. Addition eines Vielfachen einer Zeile zu einer anderen Zeile wird das System Ax = b in ein sogenanntes gestaffeltes Gleichungssystem T\n\ (rn Rx = mit R = r*i2 72 ^13 7*23 7*33 0 Tnn / überführt. Da dabei nur äquivalente Umformungen vorgenommen werden, besitzt Rx Lösung wie Ax = b. Man erhält sie aus A9.27): Xi = — \Ci - 5Z rikxk (z = n - 1, n - 2,. , 1; xn = —). A9 27) c dieselbe A9.28) Die durch die Formel A9 28) angegebene Vorschrift nennt man Rückwärtseinsetzen, da die Gleichungen von A9.27) in der umgekehrten Reihenfolge ihrer Entstehung benutzt werden Der Übergang von A zu R erfolgt in n — 1 sogenannten Eliminationsschritten, deren Durchführung am ersten Schritt gezeigt werden soll. Dieser überfuhrt die Matrix A in die Matrix Ai äff a$...a^ \ 0 ' 0 Ö21 ß31 ai2 ^22 Ö32 ain\ &2n Ö3n V Önl Ön2 0 A9 29) Dabei ist wie folgt vorzugehen: 1. Man bestimme ein ari ^ 0 . Falls kein solches existiert, stop A ist singulär. Andernfalls heißt ar\ Pivot 2. Man vertausche die 1. und die r-te Zeile von A. Das Ergebnis ist die Matrix A 3. Man subtrahiere für i = 2,3, ., n das ln-f&che der 1 Zeile von der 2-ten Zeile der Matrix A. Als Ergebnis erhält man die Matrix Ai und analog die neue rechte Seite bx mit folgenden Elementen „W — a>ik — hiüik , hi — =— , &r>=v an -kibi (i,fc = 2,3,...,n) A9 30) Die in Ai (s. A9.29)) eingerahmte Teilmatrix ist vom Typ (n— 1, n—1) und wird analog zu A behandelt, usw. Diese Vorgehensweise bezeichnet man als Gauss sches Eliminationsverfahren oder GAUSS sehen Algorithmus (s 4 4.2.4, S 284) 2. Dreieckszerlegung Das Ergebnis des GAUSSschen Eliminationsverfahrens kann wie folgt formuliert werden: Zu jeder regulären Matrix A existiert eine sogenannte Dreieckszerlegung oder LR-Faktorisierung der Form PA = LR A931)
19 2 Numerische Lösung von Gleichungssystemen 919 R: (m [ T\2 T22 0 ns • r-23 • 7*33 • nn\ • T2n T3n L = A I21 1 ^31 ^32 1 \ 'nl 'n2 A9.32) *n,n—1 J- / R heißt Rechtsdreiecksmatrix, L Linksdreiecksmatrix und P ist eine sogenannte Permutationsmatrix Sie ist eine quadratische Matrix, die in jeder Zeile und in jeder Spalte genau eine 1 und sonst Nullen enthält. Sie beschreibt die Zeilenvertauschungen in der Matrix A , die sich durch die Pivotwahl in den Eliminationsschritten ergeben. /3 1 6\ (xx\ B\ ¦ Das G AUSSsche Eliminationsverfahren soll auf das System 2 1 3x2 = 7 angewendet Vi 1 1/ \xj \4/ werden. In einer schematischen Schreibweise, bei der die Koeffizientenmatrix und der Vektor der rechten Seite zu einer sogenannten erweiterten Koeffizientenmatrix zusammengefaßt werden, erhält man. (A,b) = 3 2/3 1/3 1 6 1/3 -1 1 [2/3]-1 2 17/3 10/3 3 1 6 1/3 2/3 -1 2/3 1/2 1-1/2 2 > 10/3 4 > ,dh. /l 0 0\ /3 1 6\ / 1 0 0\ /3 1 6 \ P = 0 0 1 =? PA = 1 1 1 ,L = 1/3 1 0 ,R= 0 2/3 -1 In den \0 10/ \2 1 3/ V2/3 1/2 1/ \0 0 -1/2/ erweiterten Koeffizientenmatrizen sind die Matrizen A, Ai und A2 sowie die Pivots gekennzeichnet worden. 3. Anwendung der Dreieckszerlegung Mit Hilfe der Dreieckszerlegung kann die Lösung des linearen Gleichungssystems A x = b in 3 Schritten beschrieben werden 1. PA = LR. Durchführung der Dreieckszerlegung und Substitution Rx = c. 2. Lc = Pb Bestimmung des Hilfsvektors c durch Vorwärtseinsetzen 3. Rx = c: Bestimmung der Lösung x durch Ruckwärtseinsetzen Wird zur Lösung eines linearen Gleichungssystems die erweiterte Koeffizientenmatrix (A, b) wie im obigen Beispiel nach dem GAUSSschen Eliminationsverfahren behandelt, dann wird die Linksdreiecksmatrix L explizit nicht benötigt Sie wird aber besonders dann wirksam, wenn mehrere lineare Gleichungssysteme mit derselben Koeffizientenmatrix, aber verschiedenen rechten Seiten gelöst werden müssen. 4. Wahl der Pivots Bei der Durchführung des /c-ten Eliminationsschrittes kommt jedes von Null verschiedene Element a\x~ der ersten Spalte der Matrix A^_i als Pivot in Frage. Im Hinblick auf die Genauigkeit der berechneten Lösung sind jedoch die folgenden Strategien zweckmäßig. 1. Diagonalstrategie Als Pivots werden sukzessive die Diagonalelemente gewählt, d.h , es werden keine Zeilenvertauschungen vorgenommen. Diese Pivotwahl ist in der Regel nur dann sinnvoll, wenn die Elemente der Hauptdiagonalen gegenüber den übrigen Elementen der betreffenden Zeile betragsmäßig sehr groß sind. 2. Spaltenpivotisierung Vor Ausführung des A:-ten Eliminationsschrittes wird ein Zeilenindex r so bestimmt, daß gilt. k£ l)\ = if^\a^ 1}i A9 33)
920 19 Numerische Mathematik Falls r ^ k ist, dann werden die r-te und die Ar-te Zeile vertauscht Es läßt sich zeigen, daß durch diese Strategie die Fortpflanzung von Rundungsfehlern gedämpft wird. 19.2.1.2 Cholesky-Verfahren bei symmetrischer Koeffizientenmatrix In vielen Fällen ist in A9.26a) die Koeffizientenmatrix A nicht nur symmetrisch, sondern auch positiv definit, d h , für die zugehörige quadratische Form Q(x) gilt: <2(x) = xTAx = ^2^2 atkxixk > 0 t=i fc=i A9 34) für alle x 6 Rn,x/0 Da es zu jeder symmetrischen positiv definiten Matrix A eine eindeutige Dreieckszerlegung mit LL1 (hi hi hi *22 ^32 ^33 \ ml 'n2 l"n t"nn ) ¦ = {^\ hk Ak-i) aik hk (i = k, k + 1, , n); A9 35) A9.36a) A9 36b) „(fc). „(*-!> . ,n) A9 36c) b nach dem Cholesky- ¦hkljk {i,j = h + l,k + 2, gibt, kann die Lösung des zugehörigen linearen Gleichungssystems Ax Verfahren in folgenden Schritten durchgeführt werden. 1. A = L LT Ermittlung der sogenannten CHOLESKY-Zerlegung und Substitution LTx = c 2., L c = b: Bestimmung des Hilfsvektors c durch Vorwärtseinsetzen. 3. LTx = c: Bestimmung der Lösung x durch Rückwärtseinsetzen. Für große Werte von n ist der Aufwand beim CHOLESKY-Verfahren etwa halb so groß wie bei der LR-Zerlegung gemäß A9.31). 19.2.1.3 Orthogonalisierungsverfahren 1. Lineare Ausgleichsaufgaben Gegeben sei das überbestimmte lineare Gleichungssystem n J2a^xfc = °i (i = 1,2, ...,ra; m > n), A9 37) fc=i in Matrixschreibweise Ax = b. A9 38) Die Koeffizientenmatrix A — (a^), die vom Typ (m, n) ist, habe den Maximalrang n, d.h., ihre Spalten sind linear unabhängig. Da ein überbestimmtes lineares Gleichungssystem in der Regel keine Lösung hat, geht man von A9 37) zu den sogenannten Fehlergleichungen Ti — Y2aikxk — bi (i = l,2, ,m,,m > n) A9 39) fc=i mit den Residuen r» über und verlangt, daß die Summe der Quadrate der Residuen minimal wird l2 En2 »=i ^2 &ikxk - bi L jfe=i = F(xi, a?2, • • •, xn) — min! A9.40)
19 2 Numerische Lösung von Gleichungssystemen 921 Die Aufgabe A9 40) wird als lineare Ausgleichsaufgabe oder lineares Quadratmittelproblem bezeichnet (s. auch 6 2 5 5, S 419) Die notwendigen Bedingungen dafür, daß die Fehlerquadratsumme F{x\, .x2, xn) ein relatives Minimum annimmt, lauten dF — = 0 (fc = l,2, ..,n) A9.41) OXfo und führen auf das lineare Gleichungssystem ATAx = ATb A9 42) Der Übergang von A9.38) zu A9.42) heißt Gauss-Transformation, da das System A9 42) durch Anwendung der GAVSSschen Fehlerquadratmethode (s 6 2 5 5, S 419) aus A9 38) entstanden ist Da für A Maximalrang vorausgesetzt wurde, ist ATA eine positiv definite Matrix vom Typ (n, ra), und die sogenannten Normalgleichungen A9.42) können mit Hilfe des Cholesky-Verfahrens (s. 19 2.1.2, S 920) numerisch gelöst werden Bei der Lösung des Normalgleichungssystems A9 42) können numerische Probleme auftreten, wenn die Konditionszahl (s [19 26]) der Matrix ATA sehr groß ist Die Lösung x kann dann große relative Fehler haben Deshalb ist es numerisch günstiger, zur Lösung linearer Ausgleichsaufgaben Orthogonalisierungsverfahren zu verwenden. 2. Orthogonalisierungsverfahren Grundlage der folgenden Orthogonalisierungsverfahren zur Lösung der linearen Quadratmittelaufgabe A9 40) sind die folgenden Aussagen 1. Die Länge eines Vektors bleibt unter orthogonalen Transformationen invariant, d h , die Vektoren x und x = Q0x mit Q?Qo = E A9 43) haben dieselbe Länge 2. Zu jeder Matrix A vom Typ (ra, n) mit Maximalrang ra (n < m) existiert eine orthogonale Matrix Q vom Typ (ra, ra), so daß frn rl2 T22 A = QR A9 44) gilt, mit QTQ = E und R = r2n \ O A9 45) Dabei ist R eine Rechtsdreiecksmatrix vom Typ (ra, ra), und O eine Nullmatrix vom Typ (ra — ra, n) Die Faktorisierung A9 44) der Matrix A wird als QR-Zerlegung bezeichnet Damit können die Fehlergleichungen A9 39) in das äquivalente System ruxi + rX2x2 + + rinxn -bj = rx, T22X2 + • + r2nXn ~&2 = h , A9 46) überführt werden, ohne daß dabei die Summe der Quadrate der Residuen verändert wird Aus A9 46) folgt, daß diese Quadratsumme für f\ = f2 = • • • = fn = 0 minimal wird und der Minimal wert gleich der Summe der Quadrate von rn+i bis fm ist. Die gesuchte Lösung x erhält man durch Rückwäitseinset-
922 19. Numerische Mathematik zen aus Rx = b0, A9 47) wobei b0 der Vektor ist, der aus den Werten h\, b2 , . , bn aus A9 46) gebildet wird. Zur schrittweisen Überführung von A9 39) in A9.46) werden vor allem zwei Methoden verwendet 1. GlVENS-Transformation, 2. HOUSEHOLDER Transformation Die erste erzeugt eine QR-Zerlegung der Matrix A durch Drehungen, die zweite durch Spiegelungen Die numerischen Realisierungen findet man in [19.25] Praktische Aufgaben der linearen Quadratmittelapproximation werden vorwiegend mit der HOUSE- HOLDER-Transformation gelöst, wobei man in vielen Fällen noch die spezielle Struktur der Koeffizientenmatrix A wie Bandstruktur oder schwache Besetztheit ausnutzen kann. 19.2.1.4 Iteration in Gesamt- und Einzelschritten 1. Jacobi- Verfahren In der Koeffizientenmatrix des linearen Gleichungssystems A9.25) seien sämtliche Diagonalelemente au (i = 1,2,..., n) von Null verschieden Dann kann die i-te Zeile nach der Unbekannten x* aufgelöst werden, und man erhält unmittelbar die folgende Iterationsvorschrift, in der fi der Iterationsindex ist. X(H-U = *L _ £ ^tj.00 (i = 1Ji. ,„) A9.48) O'ii fc—i Q>ii (fc#0 (/i = 0,1,2,. .; x[ , x2 j • • • >x^ gegebene Startwerte). Die Vorschrift A9 48) wird als JACOBI-Verfahren oder auch als Gesamtschrittverfahren bezeichnet, da sämtliche Komponenten des neuen Vektors x^+1) allein aus den Komponenten von x^ berechnet werden. Das JACOBI-Verfahren konvergiert für beliebige Startvektoren x/°), falls gilt. n 1 I max ^2 ~ < 1 Spaltensurnmenkriterium A9 49) oder jfe=i < 1 Zeilensummenkriterium. A9.50) 2. Gauß-Seidel-Verfahren Hat man die 1 Komponente xf+ nach dem JACOBI-Verfahren berechnet, dann liegt es nahe, diesen Wert bei der Berechnung von x2 bereits zu verwenden Geht man entsprechend bei der Berechnung aller übrigen Komponenten vor, dann erhält man die Iterationsvorschrift x(^i) = fc. _ g 0«^) _ £ 0^) A9 51) an k=l Üii k=i+l a" (z = 1,2,. ., n; xf\x{20\ . , x^ gegebene Startwerte, \x = 0,1,2, .) Die Vorschrift A9 51) wird als Gauss-Seidel- Verfahren oder Einzelschrittverfahren bezeichnet Das Gauss-Seidel-Verfahren konvergiert im allgemeinen schneller als das JACOBI-Verfahren, sein Kon- vergenzsatz ist aber etwas komplizierter. ¦ 10xi - 3x2 - 4x3 + 2x4 = 14, -Sxi + 26x2 + 5x3 - x4 = 22 , —4xi + 5x2 + 16x3 + 5x4 = 17, 2xi + 3x2 - 4x3 - 12x4 = -20
19 2 Numerische Lösung von Gleichungssystemen 923 Die dazugehörige Iterationsvorschrift gemäß A9 51) lautet- >+i) _ 'l4 + 34/l) + 44/i)- ¦2xP) Einige Näherungen und die Lösung enthält diese Zusammenstellung. ^+1> = ^B2 + 34' .(m+1) . 26 ¦ 5.t ¦P+xP) X3 Jm+1) -^A7 + 44m+1)-5x^+1). (n)\ ±- (-20 + 2x<r+1) + 3x 12 V .(/*+!) • 5:r! -44"+I)) x@) 0 0 0 0 X(D 1,4 1,0077 1,0976 1,7861 XD) 1,5053 0,9946 0,5059 1,9976 XE) 1,5012 0,9989 0,5014 1,9995 X 1,5 1 0.5 2 3. Relaxationsverfahren Die Iterationsvorschrift des Gauss-Seidel-Verfahrens A9 51) läßt sich auch in der sogenannten Korrekturform '< flifc (Ai+l) lflifc>) dh. x(M+D=a.(M)+( r(/0 •) A9.52) (i = 1,2,...,7i, // = 0,1,2, schreiben Durch geeignete Wahl eines Relaxationsparameters u , so daß A9 52) in 3>+i) = x(ß) + wd(M) (^ i? 2,..., n, /i = 0,1,2,. .) A9 53) übergeht, kann man versuchen, die Konvergenzeigenschaften des Einzelschrittverfahrens zu verbessern Es läßt sich zeigen, daß Konvergenz nur für 0 < lü < 2 A9 54) möglich ist Für u — 1 erhält man das Einzelschrittverfahren Im Fall u > 1 spricht man von Überre- laxation, die zugehörigen Iterationsverfahren werden als SOR- Verfahren (successive over relaxation) bezeichnet Die Bestimmung optimaler Relaxationsparameter ist nur für einige spezielle Matrizentypen explizit möglich. Die Anwendung iterativer Methoden zur Lösung linearer Gleichungssysteme ist vor allem angebracht, wenn die Hauptdiagonalelemente aü der Koeffizientenmatrix gegenüber den übrigen Elementen a^ (i 7^ k) betragsmäßig stark überwiegen oder wenn durch Umstellung oder geeignete Kombination der einzelnen Gleichungen eine solche Anordnung erreicht werden kann. 19.2.2 Nichtlineare Gleichungssysteme Das System der n nichtlinearen Gleichungen Fi(xi,x2, ,xn) = 0 (z = 1,2, , n) A9.55) für die n Unbekannten x\, x2, . , xn habe eine Lösung. Diese kann in der Regel nur numerisch mit Hilfe von Iterationsverfahren bestimmt werden. 19.2.2.1 Gewöhnliches It erat ions verfahren Das gewöhnliche Iterationsverfahren geht davon aus, daß sich die Gleichungen A9.55) auf eine Fixpunktform Xi = fi(xi,x2, ,xn) (z = 1,2,. . ,n) A9.56) bringen lassen. Dann erhält man, von den geschätzten Näherungswerten x[*, x2 ,. verbesserte Werte durch 1. Iteration in Gesamt schritten x^+1)=fi(x^\x^\ . ,:#>) (i = l,2,. ,n;/x = 0,1,2,...) oder durch r.@) ausgehend, A9 57)
924 19 Numerische Mathematik 2. Iteration in Einzelschritten xY+l) = ft (x[ß+1\ ... ,*£tVjM\a#i. ,4M)) (i = 1,2,... ,n; /i = 0,1,'2, ). A9.58) Für die Gute der Konvergenz dieser Verfahren ist ausschlaggebend, daß die Punktionen fo in der Umgebung einer Lösung möglichst schwach von den Unbekannten abhängen, d.h., falls die fo differenzierbar sind, müssen die Beträge der partiellen Ableitungen möglichst klein sein Als Konvergenzbedingung erhält man \dfi\ K < 1 mit K = max ( ^ 1 \k=i max .k=i \dxk Mit dieser Größe K gilt die Fehler ab Schätzung A9 59) >+i) _ I ^ K mQV L(m+i) Jß)\ max \xKr } - Xi\ < - max \x f ; - xf'l A9.60) Dabei sind a?j die Komponenten der gesuchten Lösung, xf' und x -M+ die zugehörigen /z-ten und (fi + l)-ten Näherungen 19.2.2.2 Newton-Verfahren Das Newton-Verfahren geht von der Nullstellenaufgabe A9 55) aus Nach Vorgabe von geschätzten Näherungswerten x[ , x2 ,..., x$ werden die Funktionen Fi als Funktionen von n unabhängigen Variablen x1} x2,. ¦ , xn nach Taylor (s 7.3 3 3,1., S 434) entwickelt Durch Abbruch dieser Entwicklungen nach den linearen Gliedern erhält man aus A9.55) ein lineares Gleichungssystem, mit dessen Hilfe man iterativ Verbesserungen nach folgender Vorschrift ermitteln kann- Ft (sj"\ 4"\ • • •, *<?>) + ± j£ (x?\ ¦ ¦ ¦, xi"') (z<"+1) - 4"') = 0 A9.61) *=1 °Xk (i = 1,2,...,n; /i = 0,l,2,. .). Die Koeffizientenmatrix des linearen Gleichungssystems A9 61), das in jedem Iterationsschritt zu lösen ist, lautet F\x^)==(^-{x[ß\x^\ .,xM)\ (t,fc = l,2,...,n) A9.62) und wird als 3 ACOBI-Matrix bezeichnet. Das Newton-Verfahren ist lokal quadratisch konvergent, d h , seine schnelle Konvergenz ist wesentlich von der Güte der Startnäherungen abhängig Setzt man in A9.61) x£+ — %k = dk > dann kann das NEWTON-Verfahren in der Korrekturform $+1) = 4^ + 4ß) (i = 1,2,..., n; /* = 0,1,2,. .) A9 63) geschrieben werden. Zur Herabsetzung der Startwertempfindlichkeit kann man dann analog zum Relaxationsverfahren einen sogenannten Dämpfungs- oder Schrittweitenparameter 7 einführen 4M+1) = 4ß) + 74M) (i = 1, 2,..., n; /i = 0,1,2,...; 7 > 0) A9.64) Angaben zur Bestimmung von 7 findet man in [19.26]. 19.2.2.3 Ableitungsfreies Gauß-Newton-Verfahren Zur Lösung der Quadratmittelaufgabe A9 24) geht man im nichtlinearen Fall (nichtlineare Ausgleichsaufgabe) iterativ wie folgt vor: 1. Ausgehend von geeigneten Startnäherungen x[', x2 ,..., x$ approximiert man wie beim NEWTON-Verfahren (s. A9.61)) die nichtlinearen Funktionen Fi(xi,x2)..., xn) (i = 1,2,...,m) durch lineare Näherungen Fi(x\,x2, , xn), die in jedem Iterationsschritt gemäß n fiP Ft(xu . ,xn) = F{ (x["\ z<f>,.. , *M) + £ p. (*<">, ..., *<">) (xk - xf) jfe=l OXk
19 3 Numerische Integration 925 (i = 1,2,.. ,n; /* = 0,1,2,...) A9 65) berechnet werden 2. Man setzt in A9 65) d£ = Xk — x£ und ermittelt die Verbesserungen d£ nach der GAUSSschen Fehlerquadratmethode, d h durch Lösung der linearen Quadratmittelaufgabe m J2^i(xu ..,xn) = min A9 66) i=l z.B. mit Hilfe der Normalgleichungen, (s A9.42)) oder des HOUSEHOLDER-Verfahrens (s. 19.6.2.2, S 948) 3. Man erhält Näherungen für die gesuchte Lösung durch 4M+1) = 4^ + 4M) bzw A9-67a) 4"+1> = x[ß) + 74M) (k = 1,2, , n), A9 67b) wobei 7 G > 0) ein Schrittweitenparameter wie beim Newton-Verfahren ist. Durch Wiederholung der Schritte 2 und 3 mit x^+l) an Stelle von x[^ erhält man das Gauss-New- ton- Verfahren. Es liefert eine Folge von Näherungswerten, deren Konvergenz sehr stark von der Güte der Startnäherungen abhängt. Mit Hilfe des Schrittweitenparameters 7 läßt sich jedoch ein sogenannter Abstieg, d.h. eine Verkleinerung der Fehlerquadrat summe, erzielen. Wenn die Berechnung der partiellen Ableitungen ——- (xi ,..., x^J (i = 1,2,..., m; k = 1,2,.. , n) OXk mit großem Aufwand verbunden ist, kann man die partiellen Ableitungen durch Differenzenquotienten sehr einfach approximieren — (x{f\ , X%\ , xM} « -L I P- (r^ t!m). ^ -4- ^M) ^ ^ C/Xfc Fi(xY\ -,x(kß\ ,4/x))j (i = l,2,...,m, fc = l,2,...,rc; p = 0,1,2,...). A9.68) Die sogenannten Diskretisierungsschrittweiten h^ können in Abhängigkeit von Iterationsschritt und Variablen speziell gewählt werden Verwendet man die Näherungen A9.68), dann müssen bei der Durchführung des Gauss-Newton- Verfahrens nur Funktionswerte Fi berechnet werden, d h , das Verfahren ist dann ableitungsfrei 19.3 Numerische Integration 19.3.1 Allgemeine Quadraturformel Die numerische Auswertung des bestimmten Integrals b I(f) = jf(x)dx A9.69) a muß näherungsweise erfolgen, wenn der Integrand f(x) sich nicht elementar integrieren läßt, sehr kompliziert ist oder nur an ausgewählten Stellen xv , den Stützstellen, aus dem Integrationsintervall [a, b] bekannt ist. Zur genäherten Berechnung von A9.69) werden sogenannte Quadraturformeln benutzt. Sie haben die allgemeine Form QU) = £ <WIfe + £ <W„ + • • • + £ cwyf> A9 70) mit yl^ = f{,2)(xu)(n = 1,2,. .,p, v= 1,2, .. ,n), ^ = /(x„), C/iI/ const. Es gilt I(f) = Q(f) + R, A9-71)
926 19. Numerische Mathematik wobei R der Quadraturformelfehler ist. Die Anwendung von Quadraturformeln setzt voraus, daß die benötigten Werte des Integranden f{x) und seiner Ableitungen an den Stützstellen als numerische Werte verfügbar sind Formeln, die nur Funktionswerte benutzen, heißen Mittelwertformeln, Formeln, die auch Ableitungswerte benutzen, nennt man HERMlTEsc/ie Quadraturformeln 19.3.2 Interpolationsquadraturen Die folgenden Formeln stellen sogenannte Interpolationsquadraturen dar Dabei wird der Integrand f(x) bezüglich einiger (möglichst weniger) Stutzstellen durch ein Polynom p(x) entsprechenden Grades interpoliert, und das Integral über f(x) wird durch das über p(x) ersetzt Die Formel für das Integral über das gesamte Integrationsintervall ergibt sich dann durch Summation. Im folgenden werden nur die praktisch wichtigsten Formeln für den Fall angegeben, daß die Stützstellen gleichabständig sind1 xv — xq + vh (v = 0,1,2, . ,n), xq = a, xn = b, h= . A9.72) n Zu jeder Quadraturformel wird eine obere Schranke für den Fehlerbetrag \R\ angegeben. Dabei bedeutet MM eine für den gesamten Bereich der Stützstellen gültige obere Schranke für \f(ß\x)\. 19.3.2.1 Rechteckformel Im Intervall [xq, Xq + h] wird f{x) durch die konstante Funktion y = y0f(xo) ersetzt, die f(x) an der Stützstelle xq , also am linken Rand des Integrationsintervalles, interpoliert. Auf diese Weise erhält man die linksseitige Rechteckformel xo+h 2 f{x)dx^h-y0, \R\<YM*- A973a) / Durch Summation ergibt sich die zusammengesetzte linksseitige Rechtecksumme b i f(x) dx « %0 + yi + 2/2 + • • • + 3/n-i), |Ä| < F tf)HMl. A9 73b) Mit Mi wird eine für den gesamten Bereich der Stützstellen gültige obere Schranke für |/'(x)| bezeichnet. Analog erhält man die rechtsseitige Rechtecksumme, wenn man in A9.73a) yo durch y\ ersetzt Die aufsummierte Formel lautet dann /(*) dx » %! + y2 + • • • + yn), |Ä| < {f)'a)hMl. A9.74) / 19.3.2.2 Trapezformel Im Intervall [xq,Xq + h] wird f(x) durch ein Polynom 1. Grades ersetzt, das f(x) an den Stützstellen Xq und X\ — Xq + h interpoliert Man erhält " /(*)«fa»-(tto + y,), |fi|<-M2. A9 75) / Durch Summation ergibt sich die sogenannte zusammengesetzte Trapezformel oder Trapezsumme Jf(x)dxKh(^ + y1 + V2 + - + Vn-i + *;), \R\<^=^M2 A976) a Mit M2 wird eine für den gesamten Bereich der Stützstellen gültige obere Schranke für \f"{x)\ bezeichnet. Der Fehler der Trapezsumme verhält sich wie h2 , d.h., die Trapezsumme hat die Fehlerordnung 2.
19.3 Numerische Integration 927 Daraus folgt für h —? 0 (also n —? oo) ihre Konvergenz gegen das bestimmte Integral, wenn Rundungsfehler nicht berücksichtigt werden 19.3.2.3 Hermitesche Trapezfarmel Im Intervall [xq,xq 4- h] wird f{x) durch ein Polynom 3. Grades ersetzt, das f(x) und f'(x) an den Stützstellen xq und X\ = xq + h interpoliert f(x)dx^-(y0 + y1) + -(y'0-y[)! \R\<—M,. A9.77) Xq Durch Summation ergibt sich die HERMiTEsc/ie Trapezsumme: i b jf(x)dx*h(^ + yl+y2 + --- + yn_l + ^ + '^(y>0-y'n), |fi|<i^^-M4. A9.78) O Mit M4 wird eine für den gesamten Bereich der Stutzstellen gültige obere Schranke für \f^{x)\ bezeichnet Die HERMiTEsche Trapezsumme hat die Fehlerordnung 4 und ist für Polynome bis zum Grade 3 exakt. 19.3.2.4 Simpson-Formel Im Intervall [xo, x0 + 2h] wird f(x) durch ein Polynom 2. Grades ersetzt, das f(x) an den Stützstellen xo , X\ = Xo + h und X2 = x0 + 2h interpoliert: j f(x)dx*-(yo + 4yi+y2), \R\ < -M4 A9.79) xo Für die zusammengesetzte SiMPSON-Formel muß n gerade sein. Man erhält. b i f{x) dx « -(y0 + % + 2y2 + Ayz + • • • + 2yn_2 + 4yn_! + yn), A9.80) ,„, [b-a)h\r |Ä|^ läo ^- Mit M4 wird eine für den gesamten Bereich der Stutzstellen gültige obere Schranke für |/D)(:r)| bezeichnet. Die zusammengesetzte SiMPSON-Formel hat die Fehlerordnung 4 und ist für Polynome bis zum Grad 3 exakt. 19.3.3 Quadraturformeln vom Gauß—Typ Quadraturformeln vom GAUSS-Typ sind Mittelwertformeln, aber im Ansatz b n f(x) dx^Yl c"Vv mit V* = f(x») A9.81) /' werden nicht nur die Koeffizienten cu , sondern auch die Stützstellen xu als freie Parameter aufgefaßt Diese werden so bestimmt, daß die Formel A9.81) für Polynome möglichst hohen Grades exakt ist. Die Erfahrung zeigt, daß Quadraturformeln vom GAUSS-Typ meist sehr genaue Näherungen liefern, dafür müssen aber ihre Stützstellen sehr speziell gewählt werden. 19.3.3.1 Gaußsche Quadrat urformein Setzt man in A9 81) als Integrationsintervall [a, b] = [—1,1], und wählt man als Stutzstellen die Nullstellen der LEGENDREschen Polynome (s 9.1 2 6,3., S. 529, und Tabelle 21.12, S. 1096), dann können die Koeffizienten cu so bestimmt werden, daß die Formel A9 81) Polynome bis zum Grad 2n + 1 exakt
928 19. Numerische Mathematik integriert Die Nullstellen der LEGENDREschen Polynome liegen symmetrisch zum Nullpunkt. Für die Fälle n = 1,2 und 3 erhält man. n = 1 Xo = — #i, Co = 1, xx = ^ = 0,577350269..., a = 1. n = 2 xo = -x2, Co = - , _ 8 zi-0, Cl~9' A9 82) x2 = W? = 0,774596669..., c2 = Co n = 3. x0 = -x3, co = 0,347 854 854 zi = -x2, ci = 0,652145154. ., x2 = 0,339981043 . , c2 = cx, x3 = 0,861136311 . , c3 = co Hinweis: Durch die Transformation t = —-—x ^ — läßt sich das allgemeine Integrationsintervall auf das Intervall [—1,1] transformieren (t G [a. b], x € [—1,1]). Mit den obigen für das Intervall [—1,1] gültigen Werten für xv und c„ gilt dann: lf/W^^ta(^ + ^) A9.83) 19.3.3.2 Lobattosche Quadraturformein In einigen Fällen ist es zweckmäßig, auch die Randpunkte des Integrationsintervalls als Stützstellen zu wählen. Dann treten in A9.81) nur noch 2n freie Parameter auf. Diese können so bestimmt werden, daß Polynome bis zum Grad 2n — 1 exakt integriert werden. Für die Fälle n = 2 und n = 3 erhält man: n = 2: n = 3. x0 = -l,co = -, z0 = -l, co^^' 3 6 4 A9 84a) 5 *i=0, ci = -, *i = -*2, C! = -, A9>84b) x2 = 4= = 0,447213595 , c2 = cx, v5 ^3 = 1, C3 = Co . /' x2 = 1, c2 = Co Der Fall n = 2 stellt die SlMPSON-Formel dar 19.3.4 Verfahren von Romberg Zur Erhöhung der Genauigkeit bei der numerischen Integration empfiehlt sich das Verfahren von Rom- BERG, bei dem von einer Folge von Trapezsummen ausgegangen wird, die sich bei fortgesetzter Halbierung des Integrationsintervalls ergibt 19.3.4.1 Algorithmus des Romberg-Verfahrens Das Verfahren besteht aus den folgenden Schritten: rb 1. Trapezsummenbestimmung Als Näherung für das Integral / f(x) dx werden nach A9.76) für Ja die Schrittweiten hi=h-^- (z = 0,l,2,...,m) A985)
19 3 Numerische Integration 929 die Trapezsummen T(hi) bestimmt. Dabei beachte man die rekursive Beziehung TW) = T (Y) = ^ [\m + / (« + Y) + /(a + ^-i) + / (a + Ih^) +/(a + 2^-x) + ... + / (fl + ^^f^-i) + \W)] = ir^-x) + ^ £/ («+ ^ +Ä-i) (i = 1,2, ,m; n = 2') A9.86) Die Rekursionsformel A9 86) besagt, daß für die Berechnung von T(hi) aus T(hi-i) nur die Funktionswerte an den neu hinzukommenden Stützstellen benötigt werden. 2. Dreiecksschema Man setzt T0i = T(hi) (i = 0,1,2, ) und berechnet rekursiv die Werte Tki = Tk-U + Tk-1'i~Tk-1'i-1 (fc = l,2,.. ,m,i = A;,Ä; + l,. ) A9.87) 4K — 1 Die Anordnung der nach A9.87) berechneten Werte erfolgt am günstigsten in einem Dreieckschema, dessen Berechnung spaltenweise durchgeführt wird- T(ho) = Too T(h1) = T01 Tn T{h2) = T02 Tu T22 A9 88) T(h3) = Tq3 T13 T23 T33 Das Schema wird nach unten mit fester Spaltenzahl so weit fortgesetzt, bis die Werte rechts unten im Schema hinreichend gut übereinstimmen. Die Werte Tu (i = 1,2,...) der zweiten Spalte entsprechen den nach der SlMPSON-Formel berechneten. 19.3.4.2 Extrapolationsprinzip Das Romberg-Verfahren stellt eine Anwendung des sogenannten Extrapolationsprinzips dar Es soll an der Herleitung der Formel A9.87) für den Fall k = 1 demonstriert werden Mit / werde das gesuchte Integral, mit T(h) die zugehörige Trapezsumme A9.76) bezeichnet Ist der Integrand von / im Integrationsintervall Bm + 2)-mal stetig differenzierbar, dann läßt sich zeigen, daß für den Quadraturformelfehler R der Trapezsumme eine asymptotische Entwicklung bezüglich h der Form R{h) = 1- T(h) = ai/i2 + a2h4 + • • • + amh2m + 0(h2m+2) A9 89a) oder T(h) = 1- axh2 - a2h4 amh2m + 0(h2m+2) A9.89b) gilt Die Koeffizienten a\, a2 ,. . ,am sind von h unabhängige Konstanten Man bildet T(h) und T I - ) gemäß A9.89b) und betrachtet die Linearkombination T,(h) = aiT{h) + a2T (±\ = (ai + a2)I - a, (ax + ^) h2 - a2 (a, + g) h4 - • • • . A9 90) CX.2 Setzt man a\ + a2 = 1 und ct\ + — = 0, dann hat Ti(h) die Fehlerordnung 4, während T(h) und T(h/2) beide nur die Fehlerordnung 2 haben. Es ergibt sich T 1 — I — T(h\ 7\(fc) = -\t(K) + ±T (J) = T (^ + -AV_ . A9 91) 3 w 3 V2
930 19 Numerische Mathematik Das ist die Formel A9.87) für k = 1. Fortgesetzte Wiederholung des eben beschriebenen Vorgehens führt auf die Näherung T^ gemäß A9.87), und es gilt Tki = I + 0(hf+2) Für das bestimmte Integral / A9.92) /*1 ein nß / dx (Integralsinus, s. 82.5,1., S. 477), das sich nicht ele- Jo x mentar integrieren läßt, sind Näherungswerte zu ermitteln (8stellige Rechnung), fc = 0 I fc = 1 I k = 2 I fc = 3 0,92073549 1. Romberg-Verfahren: 0,93979328 0,94614588 0,94451352 0,94608693 I 0,94608300 0,94569086 | 0,94608331 | 0,94608307 I 0,94608307 Für k = 3 liefert das Romberg Verfahren den Näherungwert 0,94608307. Der auf 10 Stellen genaue Wert lautet 0,9460830704. Die Größenordnung O (A/8)8) w 6 • 10~8 des Fehlers gemäß A9 92) wird bestätigt 2. Trapez- und Simpson-Formel: Aus dem Schema zum Romberg-Verfahren liest man unmittelbar ab, daß für h3 = 1/8 die Trapezformel den Näherungswert 0,94569086 und die SlMPSON-Formel den Wert 0,94608331 ergibt 0,30116868 Die Verbesserung der Trapezformel nach Hermite gemäß A9 77) liefert / = 0,94608301 3. Gauß-Formel: Nach Formel A9 83) erhält man für n = 2: /^Ijco/g^ + ^+c./^ + ^+c./g^ + I t 0,94569086+- 0,94604113, 64-12 : 0,94608313, n = 3 I' co/ 1 1 2Xo+2 ¦*M : 0,94608307 Man sieht, daß die GAUSS-Formel im Fall n = 3 , d.h. mit nur 4 Funktionswerten, einen auf 8 Dezimalen genauen Näherungswert liefert Diese Genauigkeit würde mit der Trapezsumme erst mit einer sehr hohen Zahl (> 1000) von Funktionswerten erreicht. Hinweise: 1. Eigenständige Bedeutung hat die Integration periodischer Funktionen im Zusammenhang mit der Fourier -Analyse erlangt (s. 7 4 1 1,1., S 437) Ihre numerische Realisierung findet man unter dem Stichwort Harmonische Analyse (s 19.6.4, S 954), die auf dem Rechner mit Hilfe der sogenannten Schnellen FOURIER-Transformation FFT (Fast Fourier Transformation) durchgeführt wird (s 19.6.4.2, S. 955) 2. In vielen Fällen ist es zweckmäßig, bei der numerischen Integration spezielle Eigenschaften des Inte- granden auszunutzen Auf diese Weise sind neben den oben vorgestellten Quadraturformeln noch viele andere entwickelt worden, und die Literatur zu Fragen der Konvergenz, der Abschätzung des Quadraturformelfehlers oder zur Konstruktion optimaler Quadraturformeln ist sehr umfangreich (s [19 3]) 3. Zur numerischen Integration mehrfacher Integrale muß auf die Literatur verwiesen werden (s. [19 29]).
19 4 Genäherte Integration von gewöhnlichen Differentialgleichungen 931 19.4 Genäherte Integration von gewöhnlichen Differentialgleichungen In vielen Fällen ist die Lösung einer gewöhnlichen Differentialgleichung nicht mehr durch einen geschlossenen Formelausdruck, der bekannte elementare und höhere Funktionen enthält, darstellbar Die dennoch unter sehr allgemeinen Voraussetzungen (s. 9 1 1.1,1., S 505) vorhandene Lösung muß dann durch numerische Verfahren bestimmt werden. Diese liefern nur partikuläre Lösungen, ermöglichen aber eine sehr hohe Genauigkeit Da man bei Differentialgleichungen von höherer als 1. Ordnung zwischen Anfangswertaufgaben und Randwertaufgaben unterscheidet, sind für diese beiden Aufgabenklassen auch unterschiedliche Verfahren entwickelt worden. 19.4.1 Anfangswertaufgaben Das Prinzip der im folgenden dargestellten Verfahren zur Lösung der Anfangswertaufgabe y' = f(x,y), y{xo) = vo A9-93) besteht darin, für die gesuchte Funktion y(x) an ausgewählten Stützstellen Xi Näherungswerte yi zu ermitteln In der Regel werden äquidistante Stützstellen mit der vorgegebenen Schrittweite h verwendet Xi = x0 + ih B = 0,1,2, ) A9.94) 19.4.1.1 Eulersches Polygonzug verfahren Durch Integration erhält man aus der Anfangswertaufgabe zu A9 93) die Integraldarstellung X y{x)=y* + J f(x,y{x))dx. A9.95) Diese ist Ausgangspunkt für die Näherung xo+h y{xi) = Vo+ J f(x,y{x))dxtty0 + hf(xo,y0) = yi, A9 96) Xo die zu der folgenden Vorschrift des EuhERschen Polygonzugverfahrens verallgemeinert wird: yi+1 = yi + hf{xi,yi) B = 0,1,2,... , y{x0) = y0) A9.97) Zur geometrischen Interpretation s Abb.19.5 Vergleicht man A9.96) mit der TAYLORentwicklung y(xi) = y(x0 + h) = yo + f(xo,yo)h+V^p-h2 A9 98) mit xo < £ < x0 + h, dann sieht man, daß die Näherung y\ für den exakten Wert y{x\) einen Fehler von der Größenordnung h2 hat Die Genauigkeit kann durch Verkleinerung der Schrittweite h erhöht werden. Praktische Rechnungen zeigen, daß sich bei Halbierung der Schrittweite h auch der Fehler der Näherungen ^ etwa halbiert Mit Hilfe des EuLERschen Polygonzugverfahrens kann man sich sehr schnell einen Überblick über den ungefähren Verlauf der Lösungskurve verschaffen 19.4.1.2 Runge-Kutta-Verfahren 1. Rechenschema Durch die Differentialgleichung y'(x) = f(x, y) ist in jedem Punkt (x0, y0) der Lösungskurve die Richtung ihrer Tangente gegeben Das EULERsche Polygonzugverfahren verfolgt diese Richtung bis zum nächsten Interpolationspunkt Beim RuNGE-KuTTA-Verfahren werden zusätzliche Punkte zwischen (xo,yo) und dem nächsten Interpolationspunkt (x0 + /i, y\) einbezogen. Durch geeignete Wahl dieser Zwischenpunkte bezüglich Anzahl und Lage erhält man eine höhere Genauigkeit h h h Abbildung 19 5
932 19. Numerische Mathematik von yi. Das im folgenden angegebene Rechenschema stellt ein Verfahren 4. Ordnung dar (s. 19.4.1.5,1., S. 934) Zum Vergleich, das EULER-Verfahren ist ein Verfahren 1. Ordnung. Zur genäherten Lösung der Anfangswertaufgabe A9.93) wird der Schritt von xq nach Xq + h wie folgt durchgeführt: A9.99) Die weiteren Schritte erfolgen nach demselben Schema. Der Fehler des Runge-Kutta-Verfahrens gemäß A9.99) ist bei jedem Schritt von der Größenordnung h5 , so daß bei geeigneter Wahl der Schrittweite eine sehr hohe Genauigkeit erzielt wird. X x0 Xq + h/2 Xq + h/2 x0-\-h Xi = Xq + h y 2/o 2/o + fci/2 2/o + h/2 yo + h 2/i=2/o + J(*. k = h- f{x,y) h k2 h A4 + 2k2 + 2ks + fc4) ~{x2 + y2) mit i/@): = 0.7/@,5) ist in einem Schritt, x ¦ 2/ d.h. h = 0,5 , zu bestimmen (s. nebenstehende Tabelle) Der auf 8 Dezimalen genaue Wert lautet 0,01041860. 2. Hinweise 1. Für die spezielle Differentialgleichung y' = f(x) geht das RuNGE-KuTTA-Verfahren in die SlMPSON-Formel (s. 19.3.2 4, S. 927) über 0 0,25 0,25 0,5 0,5 0 0 0,00390625 0,00781441 (*2 + 2/2) 0 0,00781250 0,00781441 0,03125763 0,01041858 2. Bei einer sehr großen Anzahl von Integrationsschritten kann sich ein Wechsel der Schrittweite als zweckmäßig oder sogar notwendig erweisen Über einen Schrittweitenwechsel kann mit Hilfe einer Fehlerschätzung entschieden werden, die dadurch gewonnen wird, daß man die Rechnung etwa mit doppelter Schrittweite 2h wiederholt Hat man z.B. für y(xQ + 2h) die Näherungswerte y2(h) (Rechnung mit einfacher Schrittweite) und y2{2h) (Rechnung mit doppelter Schrittweite) bestimmt, dann gilt für den Fehler R2(h) = y(xQ + 2h) — y2(h) die Schätzung R2(h) i l[y2(h)-y2Bh)} A9 100) Informationen über die Realisierung der sogenannten Schrittweitensteuerung findet man in der Literatur (s. [19.26]). 3. RUNGE-KuTTA-Schemata für Differentialgleichungen höherer Ordnung s. [19.26] Andererseits können Differentialgleichungen höherer Ordnung in ein System von Differentialgleichungen 1. Ordnung überführt werden (s. 9 1.2.1,1., S. 515). Dann besteht das Näherungsverfahren aus parallel durchgeführten Rechnungen gemäß A9.99), die durch die Differentialgleichungen miteinander gekoppelt sind. 19.4.1.3 Mehrschrittverfahren Das EuLERsche Polygonzugverfahren A9.97) und das Runge-Kutta-Verfahren A9.99) sind sogenannte Einschrittverfahren, da sie bei der Berechnung von yi+i nur auf das Ergebnis yi des vorangegangenen Schrittes zurückgreifen Allgemeine lineare Mehrschrittverfahren sind dagegen von der Form yi+k + ak-iyi+k-i + ak-2yi+k-2 H 1- ctiyi+1 + a0yi = h(ßkfi+k + ßk-ifi+k-! + • • • + ßifi+i + ßofi) A9 101) mit geeignet gewählten Konstanten ctj und ßj (j = 0,1,..., k; ak = 1). Die Vorschrift A9.101) wird als k-Schrittverfahren bezeichnet, falls |a0| + \ßo\ ^ 0 ist. Es heißt explizit, falls ßk = 0 ist, weil dann in den Werten fi+j = f(xi+j,yi+j) der rechten Seite von A9.101) nur die bereits bekannten Näherungswerte yi, yi+i,... , 2/i+fc-i auftreten. Ist ßk ^ 0 , so heißt das Verfahren implizit, da dann der gesuchte neue Wert yi+k auf beiden Seiten von A9.101) auftritt.
19.4 Genäherte Integration von gewöhnlichen Differentialgleichungen 933 Bei der Anwendung eines fc-Schrittverfahrens ist die Kenntnis von k Startwerten y0, yi, , yk_i notwendig Diese verschafft man sich z.B. mit Hilfe eines Einschritt Verfahrens Spezielle Mehrschrittverfahren zur Lösung der Anfangswertaufgabe A9 93) kann man dadurch gewinnen, daß man in A9 93) die Ableitung y'(xi) durch Differenzenformeln (s 9.1 1 5,1., S 513) ersetzt oder in A9 95) das Integral durch Quadraturformeln (s. 19 3.1, S 925) approximiert. Beispiele für spezielle Mehrschritt verfahren sind. 1. Mittelpunktsregel Die Ableitung y'(xi+i) in A9 93) wird durch die Sekantensteigung bezüglich der Stützstellen X{ und xi+2 ersetzt. Man erhält yi+2 -yi = 2hfi+1. A9 102) 2. Verfahren von Milne Das Integral in A9 95) wird durch die SlMPSON-Formel approximiert yi+2 -Vi = \{fi + 4/i+i + fi+2) • A9 103) 3. Verfahren von Adams-Bashforth Der Integrand in A9 95) wird durch das Interpolationspolynom von Lagrange (s S 945) bezüglich der k Stützstellen xi, xi+\,... , Xi+k-i ersetzt. Man integriert zwischen xi+k-i und Xi+k und erhält* Ä;-l Vi+k - Vi+k-i = 2J / Lj (x) dx fc-i f{xi+j, yi+j) = hY, ßjf(xi+j< yi+j) A9.104) j=o Das Verfahren A9 104) ist explizit bezüglich yi+k Zur Berechnung des Koeffizienten ßj s [19 1] 19.4.1.4 Prediktor-Korrektor-Verfahren In der Praxis sind implizite Mehrschritt verfahren gegenüber expliziten vorzuziehen, da sie bei gleicher Genauigkeit wesentlich größere Schrittweiten erlauben Dafür erfordert aber ein implizites Mehrschrittverfahren zur Berechnung des Näherungswertes yi+k die Lösung einer im allgemeinen nichtlinearen Gleichung Diese folgt aus A9 101) und ist von der Form k k-l Vi+k = h £ ßjfi+j - Y, ajVi+J = F(Vi+k) ' A9 105) 3=0 3=0 Die Lösung von A9.105) erfolgt iterativ Dabei geht man wie folgt vor Ein Startwert y\+k wird durch ein explizites Mehrschritt verfahren, dem sogenannten Prediktor, bestimmt und anschließend durch die Iterationsvorschrift yltt1} = F(yti) (p = 0,l,2,...), A9.106) dem sogenannten Korrektor, der aus dem impliziten Verfahren hervorgeht, verbessert Spezielle Predik- tor-Korrektor-Formeln sind (o) , h 12 y\ß+V] =Vi + ^(-/i-i + 8/, + 5/#{) {ß = 0,1, . ), A9 107b) 2. yf^ = Vi_2 + 9y,_x - 9Vi + 6fc(/i-i + fi), A9.108a) ^t1} = Ifc-i + |(/*-i H- 4/* + /Al) (/* = 0,1, ) A9 108b) Die SlMPSON-Formel als Korrektor in A9 108b) ist numerisch instabil und kann ersetzt werden, z B. durch V%Xl) = 0,9^_! + 0, lVi + A@, i/._2 + 6,7/i_i + 30,7f + 8,l/#>) A9.109) +i - di + ^U-2 ~ 16/i-i + 23/,), A9 107a)
934 19. Numerische Mathematik 19.4.1.5 Konvergenz, Konsistenz, Stabilität 1. Globaler Diskretisierungsfehler und Konvergenz Einschrittverfahren kann man allgemein in der Form darstellen: Vi+i =Vi + hF{xu yu h) (z = 0,1,2, .. ; 2/o gegeben). A9 110) Dabei wird F(#, y, h) Zuwachsfunktion oder Fortschreitrichtung des Einschrittverfahrens genannt. Die durch A9 110) gewonnene Näherungslösung hängt von der Schrittweite h ab und soll deshalb mit y(x, h) bezeichnet werden. Ihre Abweichung von der exakten Lösung y(x) der Anfangswertaufgabe A9.93) ergibt den globalen Diskretisierungsfehler g(x,h) (s. A9.111)), und man sagt: Das Einschrittverfahren A9.110) ist konvergent mit der Konvergenzordnung p, falls p die größte natürliche Zahl mit g(x, h) = y(x, h) - y(x) = 0(hp) A9 111) ist Die Formel A9.111) besagt, daß für jedes x aus dem Definitionsbereich der Anfangswertaufgabe die mit der Schrittweite h = bestimmte Näherung y(x, h) für jede Verfeinerung der Einteilung n mit h —? 0 gegen die Lösung y(x) konvergiert. ¦ Das EuLERsche Polygonzugverfahren A9 97) hat die Konvergenzordnung p = 1. Für das Runge- Kutta-Verfahren A9.99) gilt p = 4 2. Lokaler Diskretisierungsfehler und Konsistenz Die Konvergenzordnung gemäß A9.111) gibt an, wie gut die Näherungslösung y(x, h) die exakte Lösung y(x) approximiert. Darüber hinaus ist die Frage interessant, wie gut die Zuwachsfunktion F(x, y, h) die Ableitung y' — f[x, y) annähert. Dazu führt man den sogenannten lokalen Diskretisierungsfehler l(x, h) (s A9.112)) ein und sagt Das Einschrittverfahren A9 110) ist konsistent mit der Ordnungp, fallsp die größte natürliche Zahl mit l(x, h) = V{X + h)~V{X) - F(x, y, h) = Ö(hP) • A9.112) h ist. Für ein konsistentes Einzelschrittverfahren folgt aus A9.112) unmittelbar \im F{x,y,h) = f(x,y). A9.113) h—»0 ¦ Das EuLERsche Polygonzugverfahren hat die Konsistenzordnung p = 1, das RUNGE -Kutta- Verfahren die Konsistenzordnung p = 4 3. Stabilität gegenüber Störung der Anfangs werte Bei der praktischen Durchführung von Einschrittverfahren kommt zum globalen Diskretisierungsfehler 0(hp) noch ein Rundungsfehleranteil 0(l/h) hinzu. Das hat zur Folge, daß mit einer nicht zu kleinen, endlichen Schrittweite h > 0 gerechnet werden muß. Dabei ist die Frage wichtig, wie sich die numerische Lösung yi eines Einschrittverfahrens gegenüber Störungen des Anfangswertes verhält, und zwar auch für den Fall Xi —? oo . In der Theorie der gewöhnlichen Differentialgleichungen heißt eine Anfangswertaufgabe A9 93) stabil bezuglich Störungen ihrer Anfangswerte, wenn gilt- \y(x)-y(x)\<\yo-yo\. A9114) Dabei ist y(x) die Lösung von A9.93) mit der gegenüber y0 gestörten Anfangsbedingung y(xo) = yo . Die Abschätzung A9.114) besagt, daß die Lösungsänderung betragsmäßig nicht größer ist als die Störung des Anfangs wertes. Im allgemeinen läßt sich A9 114) nur schwer überprüfen Deshalb führt man die lineare Testaufgabe y' — Xy mit y(xo) = yo (A const, A < 0) A9.115) ein, die stabil ist, und prüft ein Einschritt verfahren an dieser speziellen Anfangswertaufgabe Man sagt Ein konsistentes Einzelschrittverfahren heißt für die Schrittweite h > 0 absolut stabil bezuglich Störungen des Anfangs wertes, wenn alle damit für das lineare Testproblem A9.115) berechneten Näherungen yi der folgenden Abschätzung genügen: |y<|<l2to|. A9H6)
19 4 Genäherte Integration von gewöhnlichen Differentialgleichungen 935 ¦ Für A9 115) ergibt das EuLERsche Polygonzugverfahren yi+i = (l4-A/i)?/j (i — 0,1, . ). Man sieht, daß A9.116) für |1 + Xh\ < 1 gilt, und erhält dadurch die Schrittweitenbeschränkung — 2 < Xh < 0 4. Steife Differentialgleichungen Bei vielen Anwendungen, z B. in der chemischen Kinetik, führen mathematische Modelle auf Differentialgleichungen, deren Lösungen sich aus verschieden stark exponentiell abklingenden Anteilen zusammensetzen. Solche Differentialgleichungen werden als steif bezeichnet In dem Beispiel y{x) = CxeXlX + C2eX2X (d, C2, A1; A2 const) A9.117) mit Ai < 0, A2 < 0 und |Ai| <C |A2| leistet für den Fall Ai = — 1, A2 = —1000 der zu A2 gehörende Term keinen Beitrag zur Lösung, er beeinflußt aber ganz wesentlich die Wahl der Schrittweite h eines Näherungsverfahrens, so daß der Einfluß der Rundungsfehler sehr stark anwächst Dann ist die Auswahl geeigneter Näherungsverfahren unbedingt notwendig (s [19.25]) 19.4.2 Randwertaufgaben Die wichtigsten Methoden zur Lösung von Randwertaufgaben bei gewöhnlichen Differentialgleichungen sollen an der folgenden einfachen linearen Randwertaufgabe für eine Differentialgleichung 2 Ordnung beschrieben werden y"{x) + p{x)y'(x) + q(x)y(x) = f(x) (a < x < b) mit y(a) = a , y(b) = ß A9.118) Die Funktionen p(x), q(x) und f(x) sowie die Zahlen a und ß sind gegeben Die beschriebenen Methoden lassen sich sinngemäß auf Randwertaufgaben bei Differentialgleichungen höherer Ordnung übertragen 19.4.2.1 Differenzenverfahren Man unterteilt das Intervall [a, b] durch gleichabständige Stutzstellen xv = x0 + vh {y = 0,1, 2,..., n, Xo = a, xn = b) und ersetzt in der für die inneren Stützstellen angesetzten Differentialgleichung y"(x„)+p(x„)y'(xu) + q(xu)y(xu) = !(xu) («/= 1,2, .,n-l) A9 119) die Werte der Ableitungen durch sogenannte finite Ausdrücke, z.B.. i/M*>ti = y"+1üy"~1< A9-120a) y"(x„) « y'l = v^-^ + v-i A9.120b) Man erhält auf diese Weise n — 1 lineare Gleichungen für die n — 1 Näherungswerte yv « y(xv) im Inneren des Integrationsintervalls [a, b], wenn man y0 = a und yn = ß beachtet Enthalten die Randbedingungen Ableitungen, dann werden diese ebenfalls durch finite Ausdrücke ersetzt. Eigenwertprobleme bei Differentialgleichungen (s 9.1 3.2, S 533) werden ganz analog behandelt. Die Anwendung des Differenzenverfahrens, beschrieben durch A9 119) und A9 120a,b), führt dann auf ein Matrizeneigenwertproblem (s 4.5, S. 286). ¦ Die Lösung der homogenen Differentialgleichung y" + X2y = 0 mit den Randbedingungen y@) = y(l) = 0 führt auf ein Eigenwertproblem Das Differenzenverfahren überführt die Differentialgleichung in die Differenzengleichung yu+\ — 2yu + yv_\ + h2X2yu = 0. Wählt man drei innere Punkte, also h = 1/4, dann erhält man unter Beachtung von y0 — y@) = 0 , ?/4 = y{l) = 0 das Gleichungssystem A2\ -2 + ^h/i+ ^ = 0, 16 yi + |-2+i!!r2 + Dieses homogene System ist nur bei verschwindender Koeffizientendeterminante lösbar Aus dieser Bedingung erhält man die Eigenwerte Ai2 = 9,37, A22 = 32 und A32 = 54,63, von denen allerdings nur
936 19. Numerische Mathematik der kleinste dem ihm entsprechenden wahren Wert 9,87 nahekommt Hinweis: Die Genauigkeit des Differenzenverfahrens kann erhöht werden durch 1. Verkleinerung der Schrittweite h, 2. Verwendung finiter Ausdrücke höherer Approximation (die Näherungen A9.120a,b) haben die Fehlerordnung 0(/i2)), 3. Anwendung des Mehrschrittverfahrens (s 19.4 1 3, S. 932). Ist eine nichtlineare Randwertaufgabe zu lösen, dann führt das Differenzenverfahren auf ein System nichtlinearer Gleichungen für die unbekannten Näherungswerte yv (s. 19 2.2, 923). 19.4.2.2 Ansatz verfahren Als Näherungslösung für die Randwertaufgabe A9.118) wird eine Linearkombination geeignet gewählter Funktionen gi(x) verwendet, die einzeln die Randbedingungen erfüllen und linear unabhängig sind: y(x)xsg{x) = Y;aigi(x) A9.121) i=l Setzt man g(x) in die Differentialgleichung von A9 118) ein, dann wird ein Fehler, der sogenannte Defekt e(x, oi, 02,.. , on) = g"{x) + p(x)g'(x) + q{x)g(x) - f(x), A9 122) auftreten. Die Bestimmung der Ansatzkoemzienten Oj kann nach den folgenden Prinzipien erfolgen 1. Kollokationsmethode Der Defekt soll an n Stellen xv , den Kollokationsstellen, verschwinden. Die Bedingungen e(xu;ai,a2, ,an) = 0 (i/=l,2,.. ,n), o < X\ < x2 < . < xn < b A9123) liefern ein lineares Gleichungssystem für die Ansatzkoemzienten 2. Fehlerquadratmethode Man fordert, daß das Integral b F(a!,02, ,an)= s2(x]ai,ü2, ,on)dx A9124) a in Abhängigkeit von den Koeffizienten minimal wird. Die notwendigen Bedingungen dF — = 0 (i = l,2, .,n) A9 125) Öüi ergeben ein lineares Gleichungssystem für die Koeffizienten a^ 3. Galerkin-Verfahren Man fordert die sogenannte Fehlerorthogonalität, d h , es muß b £(x;oi,a2,. ,an)gi(x)dx = 0 (i = l,2, .,n) A9126) /• gelten, und erhält auch auf diese Weise ein lineares Gleichungssystem zur Bestimmung der Ansatzkoemzienten 4. Ritz-Verfahren Bei vielen Randwertaufgaben hat die Lösung y(x) die Eigenschaft, auch Lösung einer sogenannten Variationsaufgabe zu sein, d h., y(x) macht ein Integral der Form b I[y}= jH(x,y,y')dx A9.127) o zum Minimum (s A0 4)) Kennt man die Funktion H(x,y,y'), so ersetzt man y(x) gemäß A9 121) näherungsweise durch g(x) und macht I[y] = /(oi, 02,..., an) zum Minimum. Die dafür notwendigen Bedingungen -1=0 (i = l,2,...,n) A9.128) liefern n Gleichungen für die Koeffizienten a^.
19 4 Genäherte Integration von gewöhnlichen Differentialgleichungen 937 ¦ Unter bestimmten Voraussetzungen an die Funktionen p, q, f und y sind die Randwertaufgabe -\p(x)y,(x)]' + q(x)y(x) = f(x), y(a) = a , y(b) = ß A9 129) und die Variationsaufgabe I[y] = Ja\p(x)y'2(x) +q(x)y2{x)-2f(x)y(x)}dx = min bei y{a) = a, y(b) = ß A9 130) äquivalent, so daß man für Randwertaufgaben der Form A9.129) die Funktion H(x, y, y') aus A9.130) unmittelbar ablesen kann. An Stelle des Ansatzes A9 121) wird häufig auch n g{x)=go{x)^^aigi(x) A9 131) i=l verwendet, wobei go(x) die Randbedingungen erfüllt und die Funktionen Qi(x) den Bedingungen 9i{a)=9i(b) = 0 (i = 1,2, ..,n) A9 132) genügen müssen. So kann z B. im Falle der Randwertaufgabe A9.118) go(x) = q + t--^(z - a) A9.133) o — a gewählt werden Hinweis: Bei linearen Randwertaufgaben führen die Ansätze A9 121) und A9 131) auf lineare Gleichungssysteme zur Bestimmung der Ansatzkoeffizienten Im Falle nichtlinearer Randwertaufgaben erhält man nichtlineare Gleichungssysteme, die nach den in 19.2.2, S. 923 angegebenen Verfahren zu lösen sind. 19.4.2.3 Schießverfahren Mit dem Schießverfahren wird die Lösung von Randwertaufgaben auf die Lösung von Anfangswertaufgaben zurückgeführt Das Prinzip soll am sogenannten Einzielverfahren, auch einfaches Schießverfahren genannt, beschrieben werden 1. Einzielverfahren Der Randwertaufgabe A9 118) wird die Anfangswertaufgabe y"+p{x)y'+ q(x)y = f{x) mit y(a) = a , y'(a) = s A9 134) zugeordnet Dabei ist s ein Parameter, von dem die Lösung y der Anfangswertaufgabe A9.134) abhängt, d h , es gilt y = y(x, s) Die Funktion y(x, s) erfüllt gemäß A9.134) die erste Randbedingung y(a, s) = öl . Der Parameter s ist so zu bestimmen, daß y(x, s) auch die zweite Randbedingung y(b, s) = ß erfüllt Dazu ist die Gleichung F{s) = y(b,s)-ß A9.135) zweckmäßigerweise mit Hilfe der Regula falsi zu lösen Diese benötigt nur Funktionswerte F(s), aber jede Funktionswertberechnung erfordert die Lösung der Anfangswertaufgabe A9 134) nach einem der in 19 4 1, S 931 angegebenen Verfahren bis x = b für den speziellen Parameterwert s 2. Mehrzielverfahren Bei der sogenannten Mehrzielmethode wird das Integrationsintervall [a, b] in Teilintervalle zerlegt und auf jedem Teilintervall die Einzielmethode angewendet Damit setzt sich die gesuchte Lösung aus Teillösungen zusammen, deren stetiger Übergang an den Teilintervallgrenzen zu sichern ist. Diese Forderung ergibt zusätzliche Bedingungen. Zur numerischen Realisierung der Mehrzielmethode, die vor allem bei nichtlinearen Randwertaufgaben verwendet wird, s [19 26]
938 19 Numerische Mathematik 19.5 Genäherte Integration von partiellen Differentialgleichungen Im folgenden wird nur das Prinzip der numerischen Lösung partieller Differentialgleichungen am Beispiel linearer partieller Differentialgleichungen 2. Ordnung mit zwei unabhängigen Variablen unter passenden Rand- oder/und Anfangsbedingungen gezeigt. 19.5.1 Differenzenverfahren Das Integrationsgebiet wird durch ausgewählte Punkte (xß,y„) gitterförmig unterteilt Gewöhnlich wird das Gitter rechteckig gewählt- x^ = xq + iih, y„ = yo + vl (/x,i/ = l,2,. .) • A9136) Für / = h erhält man ein quadratisches Gitter. Bezeichnet man die gesuchte Lösung mit u(x, y), dann werden die in der Differentialgleichung und in den Rand- bzw Anfangsbedingungen auftretenden partiellen Ableitungen durch finite Ausdrücke der folgenden Art ersetzt, wobei unter ußU ein Näherungswert für den Funktionswert u(xß, yv) zu verstehen ist: partielle Ableitung du du d'u d2u d*{x'"V-) d2u finiter Ausdruck -r{Uß+i,u ~ u^v) oder wr(un+hv ~ *V-i,«/) y(^/i,i/+i - *w) °der 2i(wM)l/+i - V-i) 1 , . TäK+l." ~ 2lW + UH-hv) j2 (*V,"+1 _ 2*W + UW-l) Fehlerordnung 0(h) oder 0{h2) 0A) oder 0{l2) O(hl) 0(h2) 0A*) A9 137) In A9.137) ist die Fehlerordnung mit Hilfe des LANDAU-Symbols O angegeben. In manchen Fällen ist es günstiger, die Näherung äOfy'2/«')' ufi+i,f+i ¦2ut + A - o) • 2wMi„ + wM_i)t A9 138) dx*K *"""' h2 v ' h2 mit einem festen Parameter a @ < a < 1) zu verwenden. Die Formel A9 138) stellt eine Konvexkombination zweier finiter Ausdrucke dar, die aus der entsprechenden Formel von A9 137) für die Werte y = yv und y = yu+\ enstanden sind. Mit den Formeln A9.137) kann eine partielle Differentialgleichung für jeden inneren Gitterpunkt in eine Differenzengleichung überführt werden, wobei die Rand- und Anfangsbedingungen zu beachten sind Das so entstehende Gleichungssystem für die Näherungswerte u^v , das für kleine Schrittweiten h und l von großer Dimension ist, muß in der Regel iterativ gelöst werden (s 19 2 1 4, 922) ¦ A: Die Funktion u(x,y) erfülle die Differentialgleichung Au = uxx + uyy = —1 für alle Punkte (x,y) mit \x\ < 1, \y\ < 2, d.h. im Innern eines Rechtecks, und genüge der Randbedingung u = 0 für \x\ = 1 und \y\ = 2. Die der Differentialgleichung entsprechende Differenzengleichung für ein quadratisches Gitter mit der Schrittweite h lautet: 4wM)j, = u^+i^ + wM,i/+i + wM-i,i/ + %,i/-i + h2 Die Schrittweite h = 1 (Abb. 19.6) liefert eine erste grobe Näherung für die Funktionswerte in den drei inneren Gitterpunkten: 4n0,i = 0 + 0 + 0 + n0,o + 1, 4w0,o = 0 + u0,i + 0 + w0,-i + 1, 4w0,-i = 0 + u0,o + 0 + 0 + 1. 3 5 Man erhält- w0,o = = ~ 0,429, u0,i = «o,-i = tt ~ 0> 357 •
19 5 Genäherte Integration von partiellen Differentialgleichungen 939 i-u=0 '¦1.0=0 -1 2 -2 U0,2= »0,1 u0,o 0 ,-1 =0 «1,1=0 ui,o=0 1 X Abbildung 19.6 ¦ B: Die Gleichungssysteme, die bei der Anwendung des Differenzenverfahrens auf partielle Differentialgleichungen entstehen, haben in der Regel eine sehr spezielle Struktur. Das soll am Beispiel der folgenden, etwas allgemeineren Randwertaufgabe gezeigt werden. Integrationsgebiet sei das Quadrat G0<x<l,0<2/<1 Gesucht ist eine Funktion u(x, y) mit Au = uxx + uyy '= f(x, y) im Innern von G, u(x, y) = g(x, y) auf dem Rand von G. Die Funktionen / und g sind gegeben Die zu dieser Differentialgleichung gehörende Differenzengleichung lautet für h = l = l/n. Vn,«/ + *W+i + mm-i,i/ + u^-i - 4uM>„ = ±zf(x^yu) [p,,v = 1,2, ., n — 1) Im Falle n = 5 hat die linke Seite dieses Differenzengleichungssystems für die Näherungswerte u^v in den 4x4 inneren Punkten die folgende Gestalt, wenn man das Gitter zeilenweise von links nach rechts durchläuft und dabei beachtet, daß die Funktionswerte auf dem Rand bekannt sind: A-4 1 0 0 1 0 0 1 Q \ 1 -4 1 - 0 0 1 0 0 0 0 1 -4 1 0 0 1 0 0 0 1 -4 ~ol 0 0 1 1 1 0 0 1 o -4 1 0 0 1 T 0 0 0 0 1 0 0 1 -4 1 0 ~ö" 1 0 0 0 0 1 0 0 1 -4 1 ~ö~ 0 1 0 0 0 0 1 Tl 0 i -4 ~Ö1 0 0 1 r 0 0 0 -4 1 0 0 1 1 0 0 0 0 1 0 0 ~T -4 1 0 ~ö~ 1 0 0 0 0 1 0 ~ö~ 1 -4 1 ^r 0 i 0 ül 0 0 1 ~Ö1 0 1 -4 ~ö~| 0 0 1 1 ^~ 0 0 0 -4 1 0 0 0 0 1 0 0 1 -4 1 - 0 0 0 0 0 1 0 0 1 0 0 1 0 -4 1 1 -4 ) (Un\ U21 U31 ^41 Wl2 U22 U32 U42 Ul3 U23 ^33 ^43 Uu U24 U34 \U44J Man sieht- Die Koeffizientenmatrix ist symmetrisch und schwach besetzt. Ihre Gestalt wird als block tridiagonal bezeichnet. Man beachte aber, daß die Gestalt der Koeffizientenmatrix davon abhängig ist, wie die Gitterpunkte durchlaufen werden Für die verschiedenen Aufgabenklassen bei partiellen Differentialgleichungen 2. Ordnung, insbesondere bei elliptischen, parabolischen und hyperbolischen Differentialgleichungen, ist eine Vielzahl angepaßter Differenzenverfahren entwickelt und auf Konvergenz und Stabilität hin untersucht worden Die Spezi- alliteratur dazu ist umfangreich, Standardwerke s [19 24], [19 26]. 19.5.2 Ansatzverfahren Man macht für die gesuchte Lösung u(x,y) einen Näherungsansatz der Art n u(x,y) ^v{x,y) = v0(x, y) + ^ a^x, y). A9.139) »=i Dabei soll z B. 1. vq(x, y) die vorgelegte inhomogene Differentialgleichung erfüllen, und alle übrigen Ansatzfunktionen Vi(x, y) (i = 1, 2, , n) die zugehörige homogene Differentialgleichung {Randmethode) oder
940 19. Numerische Mathematik 2. Vq(x, y) den inhomogenen Randbedingungen genügen und alle übrigen Vi(x, y) (i = 1,2, , n) den homogenen Randbedingungen (Gebietsmethode). Setzt man die Näherungsfunktion v(x,y) gemäß A9.139) im ersten Fall in die Randbedingungen, im zweiten Fall in die Differentialgleichung ein, so wird in beiden Fällen ein Fehler, der sogenannte Defekt e = e(x,y;a1,a2l... ,an), A9.140) auftreten Zur Bestimmung der Ansatzkoeffizienten a^ kann man nach folgenden Prinzipien verfahren 1. Kollokationsmethode Der Defekt e wird in n möglichst günstig verteilten Punkten, den Kollokationsstellen (xu,yu) (v = 1, 2, . , n), zum Verschwinden gebracht: e{xv,yv;a\,a2,... ,an) = 0 [y = 1,2,... ,n) A9141) Die Kollokationsstellen sind im 1 Fall Randpunkte (man spricht dann von Randkollokation), im 2 Fall innere Punkte des Integrationsgebietes (man spricht dann von Gebietskollokation). Es ergeben sich aus A9 141) n Gleichungen für die Koeffizienten Die Randkollokation ist in der Regel der Gebietskollokation vorzuziehen ¦ Für das in 19.5.1, S. 938 mit dem Differenzenverfahren behandelte Beispiel werde ein Ansatz verwendet, der bereits die Differentialgleichung erfüllt* v(x, y\ ai, a2, a3) = — \{x2 + y2) + a\ + ü2{x2 — y2) + a3(x4 — ßx2y2 + y4). Die Koeffizienten werden dadurch bestimmt, daß die Randbedingung in den Randpunkten (x\\ y\) = A; 0,5), {x2\ y2) = A,1,5) und (x3; y3) = @,5; 2) erfüllt ist (Randkollokation). Man erhält das lineare Gleichungssystem -0,3125 +ai +0,75a2- 0,4375a3=0, -0,8125 +ai -l,25o2- 7,4375a3=0, -1,0625 + ai - 3,75a2 + 10,0625a3 = 0 mit der Lösung a\ = 0,4562 , a2 = -0, 2000, a3 = —0,0143 . Mit Hilfe der Näherungsfunktion können Näherungswerte für die Lösung in beliebigen Punkten des Integrationsgebietes berechnet werden Zum Vergleich mit dem Differenzenverfahren seien die Werte v@; 1) = 0,3919 und v@,0) = 0,4562 angegeben. 2. Fehlerquadrat methode Je nachdem, ob die Ansatzfunktion A9 139) die Differentialgleichung oder die Randbedingungen erfüllt, verlangt man, daß 1. das über den Rand C erstreckte Linienintegral /= f £2(x{t),y(t);au . ,an)dt, A9 142a) (C) wobei die Randkurve C durch die Parameterdarstellung x = x(t), y = y(t) beschrieben wird, oder 2. das über den Bereich G erstreckte Doppelintegral J= ff e2{x,y; au...,an)dxdy A9.142b) (G) minimal wird. Aus den dafür notwendigen Bedingungen -pr— = 0 (i = 1,2,..., n) erhält man n Be- Öüi Stimmungsgleichungen für die Parameter a\, a2 , ..., an . 19.5.3 Methode der finiten Elemente (FEM) Seitdem leistungsfähige Computer zur Verfügung stehen, ist die FEM zur wichtigsten Methode für die numerische Lösung partieller Differentialgleichungen geworden. Sie ermöglicht es, in vielen Anwendungsbereichen, über Mechanik und Baustatik hinaus, anspruchsvollere und damit aussagekräftigere mathematische Modelle einzusetzen.
19 5 Genäherte Integration von partiellen Differentialgleichungen 941 Entsprechend den vielfältigen Anwendungen wird die FEM ganz unterschiedlich realisiert, so daß hier nur ihre Grundidee skizziert werden kann Aus Analogiegründen sei auf das RlTZ-Verfahren (s. 19.4.2.2, 4., S. 936) zur numerischen Lösung von Randwertaufgaben bei gewöhnlichen Differentialgleichungen und an die Splines (s 19 7, S. 959) erinnert. Die Methode der finiten Elemente besteht aus folgenden Schritten. 1. Aufstellung einer Variationsaufgabe Zu der vorgegebenen Randwertaufgabe ist eine Variationsaufgabe zu formulieren. Die Vorgehensweise wird an der folgenden Randwertaufgabe gezeigt: Au = uxx + uyy = f im Innern eines Gebietes G, u = 0 auf dem Rand von G . A9 143) Multipliziert man die Differentialgleichung in A9 143) mit einer hinreichend glatten Funktion v(x, y), die auf dem Rand von G verschwindet, und integriert man anschließend über G , dann erhält man S(^+d^)vdxdy=llSvdxdy- A9144) (G) V J ' (G) Durch Anwendung der GAUSSschen Integralformel (s 13.3.3 1,1., S 687), indem man in A3 121) P(x,y) = —vuy und Q(x,y) = vux setzt, erhält man aus A9.144) die Variationsgleichung a(u,v) = b(v) A9 145a) mit afav) = - JJ (G) du dv du dv dx dx dy dy dx dy, b(v) jj fvdx dy. A9 145b) (G) yt y1 1 Yv 0 i / /. /5 V / 4/ /3 V \ / / / / c *^v L x Abbildung 19.7 Abbildung 19.8 2. Triangulierung Das Integrationsgebiet G wird in einfache Teilgebiete zerlegt In der Regel nimmt man eine Triangulierung vor, bei der G durch Dreiecke so überdeckt wird, daß einander angrenzende Dreiecke eine ganze Seite oder nur einen Eckpunkt gemeinsam haben Ein krummlinig begrenztes Gebiet kann durch Dreiecke recht gut approximiert werden (Abb.19.7). Hinweis: Um numerische Schwierigkeiten zu vermeiden, sollte die Triangulierung keine allzu stumpfen Dreiecke enthalten ¦ Eine Triangulierung des Einheitsquadrates könnte in der in Abb, 19.8 angegebenen Weise erfolgen. Dabei geht man von Gitterpunkten mit den Koordinaten xß = ßh, yu = vh (/i, v — 0,1, 2, , N ; h = 1/N) aus Man erhält (N - lJ innere Punkte. Im Hinblick auf die Wahl von Ansatzfunktionen ist es zweckmäßig, jeweils 6 Dreiecke, die im Punkte (xß, yv) zusammenstoßen, zu dem Flächenstück GßV zusammenzufassen. 3. Ansatz Für die gesuchte Funktion u(x, y) wird in jedem Dreieck ein Ansatz gemacht. Ein Dreieck mit zugehörigem Ansatz wird als finites Element bezeichnet Dafür eignen sich Polynome in x und y In vielen Fällen reicht der lineare Ansatz ü(x, y) = öi + ü2X + asy A9.146)
942 19. Numerische Mathematik aus. Die Ansatzfunktionen müssen beim Übergang von einem Dreieck ins benachbarte zumindest stetig sein, damit eine stetige Gesamtlösung entsteht Die Koeffizienten ai, a2 und a3 in A9.146) lassen sich eindeutig durch die drei Funktionswerte u\, u2 und Us in den Eckpunkten des zugehörigen Dreiecks ausdrucken. Dadurch ist gleichzeitig der stetige Übergang in die benachbarten Dreiecke gesichert Der Ansatz A9 146) enthält damit als unbekannte Parameter die Näherungen ui für die gesuchten Funktionswerte. Als Ansatz, der im gesamten Gebiet G für die gesuchte Lösung u(x, y) als Näherung verwendet wird, wählt man N=1N-1 ü(x,y) = J2 E ®UuUuu(x,y). A9 147) Die Koeffizienten aal/ sind noch geeignet zu bestimmen. Für die Funktionen uuu(x,y) soll gelten Sie stellen über jedem Dreieck von G^v eine lineare Funktion gemäß A9 146) dar und erfüllen die folgenden Bedingungen für k = /i, l : 1. u^(xkjyi) ¦¦ ¦« 0 in allen anderen Gitterpunkten von GUi 2. uu„(x, y) = 0 für (x, y) <£ GUi A9 148a) A9 148b) Die Darstellung von uul/(x, y) über Gav zeigt die Abb.19.9 Die Berechnung von uul/ über Guv , d.h über den Dreiecken 1 bis 6 in Abb. 19.8, soll für das Dreieck 1 gezeigt werden uuu(x, y) = a\ + a2x + a% mit A9 149) {1 für x = xu,y = yu, 0 imx = xa-uy = yv-i, A9.150) 0 füix = xfi,y = yl/-i Aus A9.150) folgt ai = 1 ¦ erhält für Dreieck 1: v, a2 = 0, Ö3 = l/h, und man Abbildung 19.9 Analog berechnet man 1 uß„(x,y) = 1+ (- -v\ A9 151) u{x,y) ¦ 1- 1 + 1 + G-)-(I-) G-) (- /i + für Dreieck 2, für Dreieck 3, für Dreieck 4, für Dreieck 5, für Dreieck 6. A9.152) 4. Berechnung der Ansät zkoeffizienten Man bestimmt die Ansatzkoeffizienten aul/ durch die Forderung, daß der Ansatz A9 147) die Variationsaufgabe A9 145a) für alle Ansatzfunktionen aflu erfüllt, d h., in A9.145a) wird ü(x, y) für u(x, y) und uu„(x, y) für v(x, y) gesetzt Auf diese Weise ergibt sich zur Bestimmung der Ansatzkoeffizienten das lineare Gleichungssystem N-lN-l >a(uul/, ukl) = b(ukl) (fc, / = 1,2,..., N - 1). A9 153)
19.5 Genäherte Integration von partiellen Differentialgleichungen 943 In A9.153) bedeuten o.(u^um) = JJ f n.. \ Gki dx dx dy duk jdxdy, b(uki)= fukidxdy A9.154) Bei der Berechnung von a{u^u, uu) ist zu beachten, daß Beiträge zur Integration nur die Fälle liefern, in denen die Gebiete G^v und Gm keinen leeren Durchschnitt haben. Diese Gebiete sind in Tabelle 19.1 durch SchrafTur gekennzeichnet. Tabelle 19 1 Hilfstabelle zur FEM Flächenstück- auswahl 1 v = l A' v = l-l Q fi = k + 1 6' v = l p = k + l 4 v = l + l ß = k ö- v = l + 1 c LL = k — 1 V = l 7n=k-l 1 v=l-\ Graphische Darstellung Ä C/ / Ä / / Ä A V / K H 9 y /3 y H / 4/ / / V — Dreiecke von 1 1 2 2 3 3 4 4 5 5 6 6 1 5 2 4 2 6 3 5 3 1 4 6 4 2 5 1 5 3 6 2 6 4 1 3 duki dx 0 -l//i -1/Ä 0 1/h 1/h 0 -1/h -1/h -1/h -1/h 0 0 -1/h 1/h 1/h 1/h 0 dx 0 -1/h -1/h 0 1/h 1/h 1/h 0 1/h 1/h 0 1/h 1/h 0 -1/h -1/h 0 -1/h duki du^ ^ dx dx 4 ' h? 0 2 fr2 0 0 2 0 Die Integration erfolgt jeweils über ein Dreieck mit dem Flächeninhalt h2/2, so daß die Anteile der partiellen Ableitungen nach x ergeben: 1 h2 — Daw - 2^+1,/ - 2ak-iti) — ¦ A9.155a)
944 19. Numerische Mathematik Analog erhält man für die Anteile der partiellen Ableitungen nach y : 1 h2 — (AaM - 2aw+i - 2afc>z_1) — A9.155b) Die Berechnung der rechten Seite b{uk\) von A9 153)ergibt: b(uki) = Jj f(x, y)ukl(x, y) dx dy « fklVP , A9 156a) Gki wobei mit Vp das Volumen der von uki{x, y) über Gki beschriebenen Pyramide der Höhe 1 bezeichnet wird (Abb. 19.9) Wegen Vp = \'6'\h2 gÜt &(w«)«/«ä2 A9 156b) Damit ergeben die Variationsgleichungen A9.153) für die Bestimmung der Ansatzkoeffizienten das lineare Gleichungssystem Aakt - ak+u - ak-u - akil+1 - aKl-i = h2fkl (k, l = 1,2, ., N - 1) A9 157) Bemerkungen: 1. Sind die Ansatzkoeffizienten gemäß A9.157) bestimmt worden, dann stellt ü(x, y) aus A9.147) eine explizite Näherungslösung dar, deren Werte für beliebige Punkte (z, y) aus G berechnet werden können 2. Muß das Integrationsgebiet mit einem beliebigen, unregelmäßigen Dreiecksnetz überzogen werden, dann ist es zweckmäßig, sogenannte Dreieckskoordinaten (auch baryzentrische Koordinaten genannt) einzuführen Dadurch ist die Lage eines Punktes bezüglich des Dreiecksnetzes leicht feststellbar, und die Berechnung der mehrdimensionalen Integrale analog zu A9 154) wird vereinfacht, weil jedes beliebige Dreieck besonders einfach auf ein Einheitsdreieck transformiert werden kann 3. Soll die Genauigkeit der Näherungsfunktion erhöht oder ihre Differenzierbarkeit gewährleistet werden, dann muß man zu stückweise quadratischen oder stückweise kubischen Ansatzfunktionen übergehen (s. z B [19 24]). 4. Bei der Lösung praktischer Probleme entstehen Aufgaben sehr großer Dimension Deshalb wurden viele spezielle Verfahren entwickelt, z B auch für eine automatische Triangulierung und für eine günstige Numerierung der Elemente (davon hängt die Struktur der Gleichungssysteme ab, die gelöst werden müssen) Eine ausführliche Darstellung der FEM s. [19.13], [19 9], [19 24].
19.6 Approximation, Ausgleichsrechnung, Harmonische Analyse 945 19.6 Approximation, Ausgleichsrechnung, Harmonische Analyse 19.6.1 Polynominterpolation Die Grundaufgabe der Interpolation besteht darin, durch eine Reihe von Punkten (xu,yv) {y = 0,1, . ., n) eine geeignete Kurve hindurchzulegen. Graphisch geschieht das mit Hilfe eines Kurvenlineals, rechnerisch mit Hilfe einer Funktion g(x), die an den Stellen xv, den sogenannten Stutzstellen, die gegebenen Werte yv als Funktionswerte annimmt, d.h., g(x) erfüllt die Interpolationsbedingung g{xl/) = yu (i/ = 0,l,2,...,n) A9 158) Als Interpolationsfunktionen sind in erster Linie Polynome gebräuchlich bzw. bei periodischen Funktionen sogenannte trigonometrische Polynome Im letzteren Fall spricht man von trigonometrischer Interpolation (s. 2., S 955) Werden n + 1 Stützstellen benutzt, so heißt n die Ordnung der Interpolation, und der Grad des Interpolationspolynoms ist dann höchstens gleich n Da mit zunehmendem Polynomgrad die Interpolationspolynome starke Oszillationen aufweisen, die in der Regel unerwünscht sind, zerlegt man zweckmäßigerweise das Interpolationsintervall in Teilintervalle und geht zur Spline- Interpolation über (s. 19.7, S 959). 19.6.1.1 Newtonsche Interpolationsformel Zur Lösung der Interpolationsaufgabe A9 158) wird ein Polynom vom Grade n in der folgenden Form angesetzt: g(x) = pn(x) = a0+ai(x—Xo)+a2(x-x0)(x—Xi)-\ \-an(x-x0)(x-Xi)... (x—xn-i) A9 159) Dieser Ansatz, auch NEWTONsc/ie Interpolationsformel genannt, ermöglicht die einfache Berechnung der Koeffizienten a^ (i = 0,1, . , n), da die Interpolationsbedingung A9.158) unmittelbar auf ein gestaffeltes lineares Gleichungssystem führt ¦ Für n = 2 erhält man aus A9 158) das nebenstehende Gleichungssystem Das Interpolationspolynom pn(x) ist durch die Interpolationsbedingung A9.158) eindeutig bestimmt Die Berechnung von Funktionswerten kann in einfacher Weise mit Hilfe des Ho-RNER Schemas (s 19 1 2 1, S. 914) erfolgen. 19.6.1.2 Interpolationsformel nach Lagrange Um durch n + 1 Punkte (xv , yu) {y = 0,1, .., n) ein Polynom vom Grade n hindurchzulegen, kann man nach LAGRANGE den folgenden Ansatz benutzen: n g(x) = pn(x) = Y, V»Lß{x). A9 160) Dabei werden mit Lß{x) (/i = 0,1,.. , n) die LAGRANGEschen Grundpolynome bezeichnet Der Ansatz A9.160) erfüllt die Interpolationsbedingung A9.158), wenn gilt M*„)=^={5SE{!^: A9-16D Dabei ist 5^ das KRONECKER-Symbol Aus der Bedingung A9.161) und der Forderung, daß die LAGRANGEschen Grundpolynome vom Grad n sein sollen, ergibt sich die Darstellung l = (x ~ x°^x -xi)-'-(x~ x^-i)(x - Xp+i) -"{x-xn) = " x-xv 162. V*£/x "^0ji,*^/Lt %l) ' ' ' \Xß Xß— \J \Xß Xß+i) • • • yXß Xn) u=q Xjj, Xv [xo) = a0 [xi) = a0 + ai(xi -xo) [x2) = a0 + ai(x2 - xo) + a2(x2 - = 2/o = 2/i -x0)(x2-xi) =y2
946 19. Numerische Mathematik ¦ Die durch die Wertetabelle U:—q—ö~ gegebenen Punkte sollen mit Hilfe der LAGRANGEschen Interpolationsformel A9 160) interpoliert werden Man erhält «¦>-£^§4-^-»<•-»¦ r (x - 0) fr - 1) 1 L2W=C-0)C-l)=6l(l-1)- 5 17 p2(x) = 1 • L0{x) + 3 • Li(ar) + 2 • L2(x) = --x2 + —x + 1. 0 D Das LAGRANGEsche Interpolationspolynom hängt explizit und zwar linear von den gegebenen Funktionswerten yß ab Das ist für theoretische Überlegungen von Bedeutung (s z.B. das Verfahren von Adams-Bashforth, 19 4.1 3,3., S 933) Für praktische Rechnungen ist die LAGRANGEsche Interpolationsformel weniger geeignet 19.6.1.3 Interpolation nach Aitken—Neville In vielen praktischen Fällen wird das Interpolationspolynom pn(x) explizit nicht benötigt, sondern nur sein Funktionswert an einer vorgegebenen Stelle x des Interpolationsgebietes Zur Berechnung dieses Funktionswertes kann man nach Aitken-Neville rekursiv vorgehen. Dazu verwendet man zweckmäßigerweise die Bezeichnung Pn(x) =Poi, ,n(z), A9 163) in der die Indizierung die verwendeten Stützstellen und damit auch den Grad des Interpolationspolynoms angibt Es gilt poi Äx) = (x-x0)ph2, ,„(*)-fr-s„Ku, „..fr) _ (lg 164) Xn ~ Xq d h , der Funktionswert p0,i, ,n(x) ergibt sich durch lineare Interpolation aus den Funktionswerten von Pi,2, ,n(x) und po i.2, ,n-i(x), zwei Interpolationspolynomen vom Grad < n — 1. Die gezielte Anwendung von A9.164) führt auf ein Schema, das für den Fall n = 4 angegeben werden soll A9 165) Die Elemente von A9.165) werden spaltenweise berechnet Ein neuer Wert im Schema entsteht jeweils aus dem links daneben stehenden und dem unmittelbar über,diesem stehenden Wert, z B P23 = ——Z±I£±———Z±1£± = Ps + -(p3 ~ P2), A9 166a) ~- ~- x3-x2 Xq Xl x2 X3 £4 2/0 = Po 2/1 = Pi Poi 2/2 = P2 Pl2 P012 2/3 = P3 P23 Pl23 P0123 2/4 = PA P34 P234 P1234 P01234 = Pa(x) [X - X2)P3 -{X- X3 - X2 (X-Xi)p23 ~{X- x3 - xi (x~Xi)p234 - {X x3)p2 — i - x3)pl2 - x4)pi23 P123 = ——-^^———Mö,t'^ = p23 + ~(p23 - pl2), A9.166b) ~ X3 - Xi P1234 = ——~ijyzöq—K——•^im^l = p234 + -fe>34 - P123) A9 166c) X4 — Xi X4— Xi Für die Durchführung des Algorithmus von Aitken-Neville auf dem Computer braucht man nach [19 3] nur einen Vektor p mit n +1 Komponenten, der nacheinander die einzelnen Spalten von A9 165) aufnimmt Dazu wird vereinbart, daß der Wert Pi-k,i-k+i, 4 (i = k,k + l, , n) der A:-ten Spalte die i-te Komponente^ von p wird Damit sind die Spalten von A9.165) von oben nach unten zu berechnen.
19 6 Approximation, Ausgleichsrechnung, Harmonische Analyse 947 um die noch benötigten Werte zur Verfügung zu haben Der Algorithmus besteht dann aus folgenden zwei Schritten 1 Für i = 0,1, ,n setze Pi = yi A9 167a) 2 Für k = 1.2, . , n und für i = n, n — 1, ., A; setze p? = p^ H —{Pi — Pi-i) A9 167b) %i %i—k Nach Abschluß von A9 167b) stellt pn den gesuchten Funktionswert von pn(x) an der Stelle x dar 19.6.2 Approximation im Mittel Das Prinzip der Approximation im Mittel, bei dem zwischen stetigen und diskreten Aufgaben unterschieden werden soll, wird auch als G AUSSsche Fehler quadratmethode bezeichnet oder unter dem Begriff Ausgleichsrechnung zusammengefaßt 19.6.2.1 Stetige Aufgabe, Normalgleichungen Eine Funktion /(x) ist über dem Intervall [a, b] durch eine Funktion g(x) in dem Sinne zu approximieren, daß der Ausdruck b F = Juj(x)[f(x)-g(x)]2dx A9 168) a minimal wird, und zwar in Abhängigkeit von den Parametern, die die Funktion g(x) enthält Mit u(x) ist eine gegebene Gewichtsfunktion bezeichnet, für die lj(x) > 0 im Integrationsintervall gelten soll Macht man für die Näherungsfunktion g(x) den Ansatz g{x) = JTai9l{x) A9.169) t=0 mit geeigneten, linear unabhängigen Funktionen ^o(^), 9i(%), • ¦ ? 9n{x) > dann führen die notwendigen Bedingungen dF — = 0 (i = 0,l,. ,n) A9.170) für ein relatives Minimum von A9.168) auf das sogenannte Normalgleichungssystem, T,ai(9i,9k) = (f,9k) (fc = 0,l,.. ,n) A9.171) »=o zur Bestimmung der Ansatzkoeffizienten ü{ Dabei werden die Abkürzungen b (9i, 9k) = I u(x)gi(x)gk(x) dx , A9 172a) a b (/, 9k) = JLj(x)f(x)gk(x) dx (z, k = 0,1,..., n), A9 172b) a die auch als Skalarprodukte der betreffenden zwei Funktionen bezeichnet werden, verwendet. Das System der Normalgleichungen ist eindeutig lösbar, da für die Ansatzfunktionen go(x), g\ (x), gn(x) lineare Unabhängigkeit vorausgesetzt war Die Koeffizientenmatrix des Systems A9 171) ist symmetrisch, so daß zur Lösung das Cholesky-Verfahren (s 19 2 1 2, S 920) verwendet werden sollte Die Ansatzkoeffizienten a^ können direkt berechnet werden, ohne Lösung eines Gleichungssystems, wenn das System der Ansatzfunktionen orthogonal ist, d h wenn gilt. (gugk) = 0 für i± k A9 173)
948 19. Numerische Mathematik Darüber hinaus spricht man von einem orihonormierten System, wenn gilt: (*,*) = (? ^Ml* (a = o,i,...,n). A9.174) Mit A9 174) vereinfachen sich die Normalgleichungen A9 171) zu ai = (f,gi) (i = 0,l,.. ,n). t A9175) Linear unabhängige Funktionensysteme können orthogonalisiert werden. Aus den Potenzfunktionen gi(x) = x% (i = 0,1,.. , n) erhält man je nach Wahl der Gewichtsfunktion und des Integrationsintervalls die Orthogonalpolynome in Tabelle 19.2 Tabelle 19.2 Orthogonalpolynome Mf [-i,i] [0,oo) (—00,00) u{x) 1 1 y/l-x2 e~x e-x'/2 Bezeichung der Orthogonalpolynome LEGENDREsche Polynome Pn(x) TschebYSCHEFFsche Polynome Tn(x) LAGUERREsche Polynome Ln(x) HERMiTEsche Polynome Hn(x) s.S. 9.1.2.6,3., 529 951 9.1.2.6,3., 531 9.1.2.6,3., 532 A9.176) Mit dieser Auswahl können die wichtigsten Anwendungsfälle berücksichtigt werden 1. Endliches Approximationsintervall. 2. Einseitig unendliches Approximationsintervall, z B. bei zeitabhängigen Problemen 3. Zweiseitig unendliches Approximationsintervall, z.B bei Strömungsproblemen. Man beachte, daß jedes endliche Intervall [a, b] durch die Substitution b + a b — a , . r . in * = — + —* (xG[a,6],t€[-l,l]) auf das Intervall [—1,1], für das viele Ansatzfunktionen definiert sind, transformiert werden kann 19.6.2.2 Diskrete Aufgabe, Normalgleichungen, Householder-Verfahren Es seien N Wertepaare {xu, y„), z.B. durch Messung gefundene Werte, vorgegeben Gesucht wird eine Funktion g(x), deren Funktionswerte g(xu) von den gegebenen Werten yv in dem Sinne möglichst wenig abweichen, daß der quadratische Ausdruck f'Elfc-jW]' A9177) minimal wird, und zwar in Abhängigkeit von den Parametern, die die Funktion g(x) enthält Die Formel A9.177) stellt die klassische Fehlerquadratsumme dar. Die Minimierung der Fehlerquadratsumme mit Hilfe der notwendigen Bedingungen für ein relatives Extremum wird auch als als Methode der kleinsten Quadrate bezeichnet. Mit dem Ansatz A9.169) und den notwendigen Bedingungen dF —— = 0 (i = 0,1,. . ,n) für ein relatives Minimum von A9 177) erhält man zur Bestimmung der Ansatzkoeffizienten im diskreten Fall das lineare Gleichungssystem der Normalgleichungen E <9i9k] = [V9k] (k = 0,1,..., n). A9 178) Dabei werden in Anlehnung an die Gauss sehe Summensymbolik die folgenden Abkürzungen verwendet N N [9i9k] = E 9iMgk{xv), A9.179a) [ygk] = E Vv9h(xv) (i, k = 0,1, , n). A9 179b)
19.6 Approximation, Ausgleichsrechnung, Harmonische Analyse 949 In der Regel gilt n ^ N ¦ Für den Polynomansatz g(x) ¦ a0 + a\x + • • + anxn lauten die Normalgleichungen ] + ••• + an[xk+n] = [xky] (fc = 0,1,..., n) mit [xk] = EÜi xu ¦¦ N, [xky] = Hv=i xvkyu, [y] = Hv=i Vv Die Koemzientenmatrix des Normalgleichungssystems A9 178) ist symmetrisch, so daß für die numerische Lösung das Cholesky-Verfahren in Frage kommt. In Matrizenschreibweise haben die Normalgleichungen A9 178) und die Fehlerquadratsumme A9.177) die folgende übersichtliche Form GTGa = GTy, F = (y - Ga)T(y - Ga) mit G = 9o(x2) goix-s) 9i(xi) 9i{xs) 92(xi) 92(x2) 92(x3) 9n(Xl) \ 9n(x2) 9n{x3) y = fyi\ V2 93 (a°\ öl a2 A9.180a) A9 180b) \9o{xn) 9i(xn) 92(xn) ... 9n{xN)) \Vn ] \an I Würde man an Stelle der Forderung, die Fehlerquadratsumme zu minimieren, in den N Punkten (xu, yv) die Interpolationsforderung stellen, dann ergäbe sich das Gleichungssystem Ga = y, A9 181) ein überbestimintes lineares Gleichungssystem im Fall n < N — 1, das in der Regel keine Lösung hat Durch Multiplikation mit GT erhält man aus A9 181) das Normalgleichungssystem A9 178) bzw. A9 180a) Aus numerischer Sicht ist es jedoch günstiger, zur Lösung von Ausgleichsaufgaben auf A9 181) das Householder-Verfahren (s 4.4.3 2,2., S. 286) anzuwenden, das eine Lösung im Sinne der minimalen Fehlerquadrat summe A9 177) liefert 19.6.2.3 Mehrdimensionale Aufgaben 1. Ausgleichsaufgabe Es soll die folgende diskrete mehrdimensionale Ausgleichsaufgabe behandelt werden. Eine Funktion f(xi,x2, , xn) der n unabhängigen Variablen x\, x2 , .. , xn sei formelmäßig nicht bekannt, aber es seien N Funktionswerte /„, im allgemeinen Meßwerte, in einer Wertetabelle gegeben (s nebenstehend) Die Schreibweise wird übersichtlicher und die Analogie zur eindimensionalen Ausgleichsaufgabe deutlicher, wenn man folgende Vektoren einführt Vektor der n unabhängigen Variablen. Vektor der i/-ten Stützstelle (y — 1, . , N), Vektor der N Funktionswerte in den N Stützstellen xn) = /(x) werde ein Ansatz der Form X\ x2 Xn f x{1) x{2) xl) XU rU) rB) /l h . X1 . ^2 • 4"' fs A9.182) *(") : >Xn)T (xi,x2, ¦x2 • ,xn £ =(/„/2, -fN)T Zur Approximation von f(x\,x2. g(xux2, ,xn) = ^jaigi(xi,x2, . ,x„) t=0 verwendet Dabei sind die m + 1 Funktionen gi(x\,x2, . , xn) ¦ tionen ¦ A: Linearer Ansatz in n Variablen g(xi, x2i. ., xn) = oo + öi^i + a2x2 + ¦ B: Vollständiger quadratischer Ansatz in 3 Variablen q{xi,X2, x3) = a0 + a\X\ + a2x2 + a3x3 + a4Xi2 + a5x22 + a6x32 + a7XiX2 + agXiX-j + a9x2x:i A9 183) <7»(x) geeignet gewählte Ansatzfunk- • + anxn Die Ansatzkoeffizienten sind so zu bestimmen, daß J2„=i \fv " ¦9(X: .(") J») x{2\ ixtf)] = min gilt.
950 19 Numerische Mathematik 2. Normalgleichungssystem Bildet man analog zu A9.180b) die Matrix G, indem man formal die Stützstellen xv durch die vektoriellen Stützstellen x/^ (y = 1,2, , N) ersetzt, dann kann man auch im vorliegenden mehrdimensionalen Fall zur Bestimmung der Ansatzkoeffizienten das Normalgleichungssystem GTGa = GTf A9 184) oder das überbestimmte lineare Gleichungssystem Ga = f A9 185) verwenden. ¦ Beispiel zur mehrdimensionalen Regression s. 16.3.4.3,3., S. 805. 19.6.2.4 Nichtlineare Quadratmittelaufgaben Der prinzipielle Lösungsweg soll am eindimensionalen diskreten Fall gezeigt werden Die Ansatzfunk- tion g(x) hänge nicht linear von einigen Parametern ab. ¦ A: g(x) = a0eaiX + a2ea3X In dieser Exponentialsumme treten die Parameter a\ und a3 nichtlinear auf. ¦ B: g(x) = aoeaiX cos a2x. In diesem Ansatz sind a\ und a2 die nichtlinearen Paramter Die Abhängigkeit der Ansatzfunktion g(x) von einem Parametervektor a = (ao, a\, . , an)T soll durch die Bezeichnung g = g{x,a) = g(x\ a0,ai,. .,an) A9186) zum Ausdruck gebracht werden Es seien N Wertepaare (#„, yv) (u = 1,2,.. , N) gegeben Zur Minimierung der Fehlerquadratsumme N ^2[yv - g{x„; a0,ai,...,an)]2 = F(a0,ai, ,an) A9187) dF führen die notwendigen Bedingungen ^— = 0 (i = 0,1,. ., n) auf ein nichtlineares Normalgleichungs- System, das iterativ z B mit Hilfe des Newton-Verfahrens (s. 19 2 2 2, S 924) gelöst werden muß Einen anderen Lösungsweg, der bei praktischen Aufgaben in der Regel gegangen wird, vermittelt das GausS-Newton-Verfahren (s. 19 2 2 3, S 924), das zur Lösung der nichtlinearen Quadratmittelaufgabe A9.24) beschrieben worden ist. Die Übertragung auf die jetzt vorliegende nichtlineare Approximationsaufgabe A9.187) erfordert die folgenden Schritte. 1. Linearisierung der Ansatzfunktion g(x, a) nach TAYLOR bezüglich der Parameter a^ Dazu müssen Näherungswerte a\ ' (i = 0,1,..., n) bekannt sein- j(x,a) « j(x,a) = <?(z,a<°>) + E |^(x,a@))(ai - af). A9 188) t=0 Ü(Li 2. Lösung der linearen Ausgleichsaufgabe N X)[^-5(^,a)]2 = min! A9.189) mit Hilfe des Normalgleichungssystems GTG Aa = GT Ay A9190) oder nach dem Householder-Verfahren. In A9.190) sind die Komponenten der Vektoren Aa und Ay durch Aa{ = tu - a\0) (i = 0,1,2,..., n) und A9 191a) &Vv = yv-9{xv>d®) (^=1,2, ,N) A9191b)
19.6 Approximation, Ausgleichsrechnung, Harmonische Analyse 951 gegeben. Die Matrix G wird analog zu G in A9 180b) gebildet, indem man Qi(xv) durch —— (x„,a[ ) (i = 0,l, ,n, i/ = l,2, ,AQ ersetzt 3. Berechnung einer neuen Näherung durch J». „(°) J1) . ' + Aa{ bzw a\l) = a\V) + lAa; (* = 0,1, 2,..., n), A9.192) wobei 7 > 0 ein Schrittweitenparameter ist. Durch Wiederholung der Schritte 2 und 3 mit a\ an Stelle von a\ usw. erhält man für die gesuchten Parameter Folgen von Näherungswerten, deren Konvergenz sehr stark von der Güte der Startnäherung abhängt Mit Hilfe des Schrittweitenparameters 7 läßt sich aber zunächst eine Verkleinerung der Fehlerquadratsumme erzielen. 19.6.3 Tschebyscheff— Approximation 19.6.3.1 Aufgabenstellung und Alternantensatz 1. Prinzip der Tscheby scheff-Approximation Unter TSCHEBYSCYLEFF-Approximation oder gleichmäßiger Approximation versteht man im stetigen Fall die folgende Aufgabe In einem Intervall a < x < b ist die Funktion f(x) durch eine Näherungs- funktion g(x) = g(x ; ao, ßi,.. , an) so zu approximieren, daß der größte Fehlerbetrag max \f(x) -g(x, a0,au . ,an)| = 0{ao,au ,an) A9 193) a<x<b durch geeignete Wahl der Parameter a{ (i — 0,1,..., n) möglichst klein wird. Existiert für f(x) eine solche Näherungsfunktion, dann wird der Maximalwert der Abweichung in mindestens n + 2 Punkten xv des Intervalls, den sogenannten Alternantenpunkten, mit abwechselndem Vorzeichen angenommen (Abb.19.10) Das ist der wesentliche Inhalt des sogenannten Alternantensatzes zur Charakterisierung der Lösung einer TsCHEBYSCHEFFschen Approximationsaufgabe. yj 0 i rwT ! gw a \j/-i b X y< 0 1 ,f(x)-g(x) r\ ? 1_^Z. ^N h x a) b) Abbildung 19.10 ¦ Approximiert man auf dem Intervall [—1,1] die Funktion f(x) = xn durch ein Polynom vom Grade < n — 1 im TsCHEBYSCHEFFschen Sinne, dann erhält man als Fehlerfunktion, wenn auf den Maximalwert 1 normiert wird, das TsCHEBYSCHEFF-Po/?/nom Tn(x). Die Alternantenpunkte, die sich aus den Randpunkten und genau n — 1 Punkten im Innern des Intervalls zusammensetzen, entsprechen den Extremstellen von Tn{x) (Abb.l9.11a-f) 19.6.3.2 Eigenschaften der Tschebyscheff-Polynome 1. Darstellungen Tn{x) = cos(narccosx), A9 194a) Tn(x) : Tn(x) : i [{x+vi^iy+(x - Vx^t) (cosnt, x = cost für \x\ < 1, \ coshnt, x = cosht für \x\ > 1 (n = l,2, ) A9.194b) A9.194c)
952 19 Numerische Mathematik 1 -1 b) -1 T5(x)j A, IV 1 . A •\J -1 X 1 e) Abbildung 19.11 2. Nullstellen von Tn(x) B/x - 1)tt Xu = COS 2n (/x= 1,2, ...,n). 3. Extremstellen von Tn(x) für x € [—1,1] £„ = COS A/ = 0,1,2,. n ,n). 4. Rekursionsformel Tn+l = 2xTn(x) - Tn-i(x) {n = 1,2, Daraus folgt z B ;To(aO = l,ri(x)=aO. T2(x T4(x Te{x. T7(x[ T8(x. T9(X[ Tio{x] = 2x2-l, T3(x) =4x3-3x, = 8x4 - 8x2 + 1, T5(x) = Wx5 - 20x3 + 5x, = 32x6 - 48x4 + 18x2 - 1, = 6Ax7 - U2x5 + 56x3 - 7x, = 128x8 - 256z6 + 160x4 - 32x2 + 1, = 256x9 - 576x7 + 432x5 - 120x3 + 9x, = 512x10 - 1280x8 + 1120x6 - 400x4 + 50x2 - 1. A9 195) A9 196) A9 197) A9.198a) A9 198b) A9 198c) A9 198d) A9 198e) A9.1981) A9.198g)
19 6 Approximation, Ausgleichsrechnung, Harmonische Analyse 953 19.6.3.3 Remes-Algorithmus 1. Folgerungen aus dem Alternantensatz Der Alternantensatz ist der Ausgangspunkt für die numerische Lösung der stetigen Tschebyscheff- schen Approximationsaufgabe. Wählt man als Näherungsfunktion g(x) = j^ai9i{x) A9 199) mit n + 1 linear unabhängigen, bekannten Ansatzfunktionen, dann sollen mit a^* (i = 0,1, , n) die Koeffizienten der Lösung der TsCHEBYSCHEFFschen Aufgabe und mit g = <£(a0*,ai*, , an*) die zugehörige Minimalabweichung gemäß A9 193) bezeichnet werden. In dem Fall, daß die Funktionen / und gi (i = 0,1, . , n) differenzierbar sind, folgt aus dem Alternantensatz £ Oi'giM + (-1)^ = f(xv), £ <kWiM = f'M (i/ = 1,2,..., n + 2). A9 200) Die Stellen xu sind Alternantenpunkte mit a < xi < x2 < < xn+2 <b. A9 201) Die Gleichungen A9.200) stellen 2n+4 Bedingungen für die 2n+4 unbekannten Größen der TsCHEBYSCHEFFschen Approximationsaufgabe dar- n + 1 Ansatzkoeffizienten, n + 2 Alternantenpunkte und die Minimalabweichung g. Falls die Intervallrandpunkte zu den Alternantenpunkten gehören, brauchen dort die Bedingungen für die Ableitung nicht zu gelten. 2. Bestimmung der Minimallösung nach Remes Nach Remes geht man zur numerischen Bestimmung der Minimallösung wie folgt vor. 1. Man bestimmt eine Alternantennäherung xj® (v = 1, 2, ,n + 2) gemäß A9 201), z B. gleichabständig oder als Extremstellen von Tn+\(x) (s 19.6.3 1, S 951). 2. Man löst das lineare Gleichungssystem t,atgi(x^) + (-iyg = f(x^) (v = l,2,. ,n + 2) t=0 und erhält als Lösung die Näherungen a^ (i = 0,1,.. , n) und g0 . 3. Man ermittelt eine neue Alternantennäherung xj-1^ (^ = 1,2,. , n + 2), z.B als Extremstellen der Fehlerfunktion f(x) — £ Q>i®9i{x) • Dabei genügt es, Näherungen für diese Extremstellen zu ver- wenden Durch Wiederholung der Schritte 2 und 3 mit xv^ und a^ an Stelle von x^ und a/°) usw erhält man Folgen von Näherungen für die Koeffizienten und die Alternantenpunkte, für deren Konvergenz Bedingungen angegeben werden können (s. [19.28]) Man kann das Verfahren, das die Grundidee des sogenannten Rem ES-Algorithmus wiedergibt, abbrechen, wenn z B von einem gewissen Iterationsindex [i an 1^1 = max o<a;<6 t=0 A9.202) mit hinreichender Genauigkeit gilt. 19.6.3.4 Diskrete Tschebyscheff— Approximation und Optimierung Von der stetigen TsCHEBYSCHEFFschen Approximationsaufgabe max a<x<b f{x)-J2ai9iix) A9 203)
954 19. Numerische Mathematik kommt man zur zugehörigen diskreten Aufgabe, indem man N Stützstellen xv [y = 1,2,. ..N;N> n + 2) mit der Eigenschaft a < x\ < x<i • • • < %n < b wählt und max i/=l,2, ,N fordert. Substituiert man A9 204) 7 = max i/=l,2, ,JV /M-£*&(**) , A9 205) I i=0 I dann folgt daraus unmittelbar \f{xu) - JT ai9i(xA < 7 (i/ = 1, 2,..., N). A9 206) I t=o I Durch Auflösen der Beträge in A9.206) erhält man ein System von linearen Ungleichungen für die Koeffizienten a^ und 7, so daß aus A9.204) die lineare Optimierungsaufgabe (s. 18.1.1.1, S. 873) In 7 + E ai9i{xv) > f(xv), i=n° (i/=l,2,...,W) A9 207) 7 - E a^i(^) > ~f(xv), i=0 wird. Die Gleichung A9.207) besitzt eine Minimallösung mit 7 > 0 . Für eine hinreichend große Anzahl N von Stutzstellen kann unter bestimmten Bedingungen die Lösung der diskreten Aufgabe als Näherung für die Lösung der stetigen Aufgabe angesehen werden n Verwendet man an Stelle der linearen Näherungsfunktion g(x) = J2 di9i{x) eine Näherungsfunkti- i=0 on g(x) = g(x\ a0, a\,..., an), die nichtlinear von den Parametern ao, ai, , an abhängt, dann erhält man in analoger Weise eine Optimierungsaufgabe, und zwar eine nichtlineare Optimierungsaujgabe, die in der Regel schon bei einfachen nichtlinearen Ansätzen nicht konvex ist. Das ist eine wesentliche Einschränkung im Hinblick auf die Wahl numerischer Lösungsverfahren für nichtlineare Optimierungsaufgaben (s 18 2.2 1, S 890) 19.6.4 Harmonische Analyse Eine formelmäßig oder empirisch gegebene periodische Funktion f(x) mit der Periode 2ir ist durch ein trigonometrisches Polynom oder eine FouRiERsc/ie Summe der Form n n 9(x) = TT + ^2(ak coskx + bk sinkx), A9.208) 2 k=i wobei die Koeffizienten ao, a^ und bk reell sein sollen, zu approximieren Die Bestimmung der Ansatz- koefnzienten ist Gegenstand der harmonischen Analyse. 19.6.4.1 Formeln zur trigonometrischen Interpolation 1. Formeln für die Fourier-Koeffizienten Da das Funktionensystem 1, cos kx , sin kx (k = 1, 2,..., n) bezüglich des Intervalls [0,27r] und bezüglich der Gewichtsfunktion u = 1 orthogonal ist, erhält man durch Anwendung der Fehlerquadratmethode im stetigen Fall gemäß A9.171) für die Ansatzkoeffizienten die Formeln 27T 27T ak — — / f(x) cos kx dx, bk = — f{x) sin kxdx (A; — 0,1,2, ..,n) A9.209) 7T J IT J 0 0 Die Koeffizienten a^ und bk , die nach der Formel A9 209) berechnet werden, heißen FOURIER-Koeffizienten der periodischen Funktion f(x) (s. 7.4, S. 437)
19.6 Approximation, Ausgleichsrechnung, Harmonische Analyse 955 Lassen sich die in A9 209) auftretenden Integrale nicht mehr elementar oder nur mit großem Rechenaufwand integrieren oder ist die Funktion f(x) nur punktweise bekannt, dann kann man die Fourier- Koeffizienten näherungsweise durch numerische Integration ermitteln. Durch die Anwendung der Trapezformel (s. 19 3 2 2, S. 926) mit den gleichabständigen N + 1 Stützstellen Ott xu = uh (i/ = 0,l, ..,A0, h=J7 A9.210) erhält man die Näherungsformeln 2 N 2 N dk ~ äk = — ^2f{xv)coskxv, bkttbk = —^2 f{xu) sin kx„ (k = 0,1,2,.. ,n) A9.211) Im vorliegenden Fall periodischer Funktionen ist die Trapezformel in die sehr einfache Rechteckregel übergegangen. Diese ist hier von großer Genauigkeit, denn es gilt. Ist f(x) periodisch und Bm + 2)-mal stetig differenzierbar, dann hat die Trapezformel die Fehlerordnung 0{h2m+2) 2. Trigonometrische Interpolation Einige spezielle trigonometrische Polynome, die mit den Näherungskoeffizienten äk und bk gebildet werden, haben wichtige Approximationseigenschaften. Zwei davon sind. 1. Interpolation Es sei N = 2n. Das spezielle trigonometrische Polynom 1 n_1 ~ 1 gi{x) = -ä0 + ^(äkcoskx + bk sin kx) + -ancosnx A9.212) 2 jb=i 2 mit den Koeffizienten A9 211) erfüllt an den Stützstellen xu A9 210) die Interpolationsbedingung 9i(xv) = f(x„) (*/ = 1,2,. ,N) A9.213) Infolge der Periodizität von f(x) ist f(xo) = f(xpj). 2. Approximation im Mittel Es sei N = 2n. Das spezielle trigonometrische Polynom i m 92{%) = ^öo + ^{äk cos kx + bk sin kx) A9.214) mit m < n und den Koeffizienten A9.211) approximiert die Funktion f(x) im diskreten quadratischen Mittel bezuglich der N Stützstellen xv A9.210), d.h., die Fehlerquadratsumme ^»El/foO-&(*„)]* A9 215) ist minimal. Die Formeln A9.211) bilden den Ausgangspunkt für verschiedene Verfahren zur effektiven Berechnung der FOURIER-Koeffizienten 19.6.4.2 Schnelle Fourier-Transformation (FFT) 1. Numerischer Aufwand bei der Berechnung der Fourier-Koeffizienten Die Summen, die in den Formeln A9 211) auftreten, kommen auch im Zusammenhang mit der diskreten FOURIER-Transformation, z B. in der Elektrotechnik, in der Impuls- und vor allem in der Bildverarbeitung, vor Dabei kann N sehr groß sein, so daß die betreffenden Summen äußerst rationell berechnet werden müssen, denn die Berechnung der N Näherungswerte A9.211) für die FOURIER-Koeffizienten erfordert etwa N2 Additionen und Multiplikationen Für den Spezialfall N = 2P läßt sich jedoch mit Hilfe der sogenannten Schnellen FOURIER-Transformation FFT (Fast Fourier Transformation) die Anzahl der Multiplikationen I r~j ~ , 1Q 91 fix von N2 = 22p auf pN = pT> senken. Die Größenordnung dieser 101 ~ 10 | ~ 10 U« m>) Reduzierung erkennt man an nebenstehendem Zahlenbeispiel. V 10 20 N2 ~ 106 -1012 pN ~ 104 ~107
956 19. Numerische Mathematik Dadurch sinkt der Rechenaufwand und damit auch die Rechenzeit so stark ab, daß für einige wichtige Anwendungsgebiete bereits der Einsatz kleinerer Computer ausreicht Die FFT nutzt die Eigenschaften der JV-ten Einheitswurzel, d.h. der Lösungen der Gleichung zN = 1, aus, um die Summanden in A9.211) sukzessiv zusammenzufassen 2. Komplexe Darstellung der Fourier-Summe Um das Prinzip der FFT möglichst einfach beschreiben zu können, bringt man die FouRiERsche Summe A9.208) mit Hilfe der Formeln cos kx = i (eikx + e-[kx) , sin kx = i (e-'lkx - elkx) A9 217) auf die komplexe Form g(x) = \<* + £>* cos kx + bk sin kx) = \ao + £ f^-Z-^ete + ^±J^e-A A9 218) Setzt man ck = ük ~ lbk , A9 219a) dann gilt wegen A9 209) ck = ^- P* f(x)e~'lkx dx, A9 219b) 2 27T 70 und A9.218) geht in die komplexe Darstellung derFöURiERschen Summe über g(x) = £ ckelkx mit c_fc = cfc A9 220) fc=-n Sind die komplexen Koeffizienten c^ ermittelt worden, dann erhält man daraus die gesuchten reellen FOURIER-Koeffizienten auf folgende einfache Weise* a0 = 2c0, ak = 2Re(ck), bk =-2lm(ck) (k = 1,2, ,n). A9 221) 3. Numerische Berechnung der komplexen Fourier—Koeffizienten Zur numerischen Bestimmung von ck wendet man auf A9.219b) analog zu A9.210) und A9 211) die Trapezformel an und erhält die diskreten komplexen Fourier Koeffizienten ck 44E f{x»)e'lkx» = £ f^N (Ar = 0,l,2, . , n) mit A9 222a) 1 2-KV 27ri U = ^J{xv), xv = — (i/ = 0,l,2, .,W-1), w^e"* A9222b) Der Zusammenhang A9 222a) unter Beachtung von A9.222b) wird dann als diskrete komplexe Fou- RIER -Transformation der Länge N der Werte /„ (y = 0,1,2, . , TV - 1) bezeichnet. Die Potenzen u)vN = z (y = 0,1,2,... .N — 1) genügen sämtlich der Gleichung zN = 1. Sie werden deshalb auch als N-te Einheitswurzel bezeichnet Wegen e~2m = 1 gilt* <j# = 1, u;#+1 = ^ , u$+2 = u£,.. . A9 223) Die effektive Berechnung der Summe A9 222a) ergibt sich aus der Tatsache, daß eine diskrete komplexe Fourier- Transformation der Länge N = 2n auf zwei Transformationen der Länge N/2 = n in folgender Weise zurückgeführt werden kann: a) Für alle Koeffizienten c*. mit geradem Index, d.h. k = 21, erhält man: 2n-l n-1 n-1 Sa = E /^ = E [f*$r+u»uT+v)} = E [/-+/»+*] ^ A9-224) i/=0 i/=0 i/=0 Dabei wurde beachtet, daß uj1}n+v' = o;^nu;^ = lj%u ist Substituiert man V„ = U + fn+v (^ = 0,1,2, ,n-l) A9 225)
19.6 Approximation, Ausgleichsrechnung, Harmonische Analyse 957 und berücksichtigt man, daß u2N = uon gilt, dann ist C21 = £ y*wln {v = 0,1,2,..., n - 1) A9.226) i/=0 die diskrete komplexe FOURIER-Transformation der Werte yu A/ = 0,1, 2, .., n — 1) mit der Länge n = N/2 b) Für alle Koeffizienten c*. mit ungeradem Index, d.h. mit k = 21 + 1, erhält man analog: 2n-l n-1 öa+i = E /^+1)" = E [(/* - /m*)«*] <•#" • A9-227) ^=0 iv=0 Substituiert man 2/n+„ = (/„ - /n+,Vü (i/ = 0,l,2, ,n-l) A9 228) und beachtet man, daß auch hier <jjy = ujn gilt, dann ist c2Z+1 = ^7/n+^ A/ = 0,1,2,..., n-1) A9.229) i/=0 die diskrete komplexe FOURIER-Transformation der Werte 2/n+t, (y = 0,1,2,. ., n — 1) mit der Länge n = N/2. Die Reduzierung gemäß a) und b), d h die Zurückführung einer diskreten komplexen FOURIER-Trans- formation auf jeweils zwei diskrete komplexe FOURIER-Transformationen der halben Länge, läßt sich fortsetzen, wenn N eine Potenz von 2 ist, d.h. wenn N = 2P (p natürliche Zahl) gilt. Die p-malige Anwendung der Reduzierung wird als FFT bezeichnet. Da jeder Reduktionsschritt wegen A9.228) N/2 komplexe Multiplikationen erfordert, ist der Rechenaufwand bei der FFT von der Größenordnung N N^ kt jP=j\og2N A9 230) 4. Schemata zur FFT Für den speziellen Fall N = 8 = 23 sollen die dazugehörigen 3 Reduktionsschritte der FFT gemäß A9.225) und A9 228) im folgenden Schema 1 zusammengestellt werden: Schema 1: /o h h h u h h fl 1. Schritt 2/o = /o + U 2/1 = /1 + h 2/2 = h + h 2/3 = h + h 2/4 = (/o - /4K 2/5 = (fl ~ /öVg 2/6 = (/2 - /eVl 2/7 = (/3 - h)<4 N = 8, n := 4, u;8 = e-2^ 2. Schritt 2/0 := 2/0 + 2/2 2/1 = 2/1 + 2/3 2/2 •= B/0 - 2/2 V° 2/3 .= B/1 - 2/sVl 2/4 := 2/4 + 2/6 2/5 = 2/5 + 2/7 2/6 := B/4 - 2/6 V4 2/7 := B/5 - 2/7 Vi JV := 4, n := 2, u;4 = cjf 3. Schritt 2/0 = 2/0 + 2/1 2/1 := B/0 - 2/1V2 2/2 := 2/2 + 2/3 2/3 := B/2 - 2/3 V° 2/4 •= 2/4 + 2/5 2/5 •= B/4 - 2/5V2 2/6 =2/6 + 2/7 2/7 := B/6 - 2/7V2 AT = 2, 71 '= 1, CJ2 = V4 = Q) = c4 = c2 = Q> = Ci = Q> = c3 = c7 Die Zuordnung der gesuchten komplexen FOURIER-Koeffizienten zu den ^/-Werten des 3 Schrittes erkennt man, wenn man sich überlegt, wie in jedem Reduktionsschritt jeweils die Berechnung der Koeffizienten mit geraden und ungeraden Indizes erfolgt In dem folgenden Schema 2 A9.231) ist diese Verfahrensweise schematisch dargestellt.
958 19 Numerische Mathematik Schema 2: ck ¦¦ (fc = 0,l, C2k C2k+\ C4k+3 => ,7) (fc = 0,l,2,3) (k = 0,1) fc8fc l Csk+4 f C8fc+2 l Cgk+6 f C8fc+1 l C8fc+5 f C8fc+3 l C8fc+7 (* = 0). A9.231) Koeffizienten dk auf und gibt man die Dualdarstellung ihrer Indizes vor dem ersten und nach dem dritten Reduktionsschritt an, dann erkennt man, daß die Reihenfolge der gesuchten Koeffizienten durch sogenannte Bitumkehr auf besonders einfache Weise ermittelt werden kann, wie in dem nebenstehenden Schema 3 dargestellt ist. Schema 3: Co Cl h h Ca Qj c6 Cl Index 000 00L 0L0 OLL L00 LOL LLO LLL 1 Schritt Co c2 Ca c6 Ci c3 c5 Cl 2 Schritt Co Ca c2 Q> C\ h c3 Cl 3 Schritt Co ca Cl Cß Cl C5 c3 Cl Index 000 L00 OLO LLO 00L LOL OLL LLL {2tt2 für x = 0 o r.. „ ' o die periodisch mit der Periode 2ir sein soll, x2 für 0 < x < 2tt , y werde mit Hilfe der FFT die diskrete FOURIER-Transformation durchgeführt Man wähle N = 8. Mit x„ = ^, U = \fM (^ = 0,1,2, .,7), lü8 = e'lP =0,707107A-1), ^82 = -i, u3s = -0,707107A + i) erhält man das folgende Schema 4: Schema 4: /o = 2,467401 /i = 0,077106 h = 0,308425 h = 0,693957 /4 = 1,233701 /5 = 1,927657 /6 = 2,775826 /7 = 3,778208 1 Schritt 2/0 = 3,701102 2/i =2,004763 2/2 = 3,084251 2/3 = 4,472165 2/4 = 1,233700 2/5 = -1,308537A-i) 2/6 = 2,467401 i 2/7 = 2,180895A + i) 2 Schritt 2/o = 6,785353 2/i =6,476928 2/2 = 0,616851 2,3 = 2,467402 i 2/4 = 1,233700 +2,467401 i 2/5 = 0.872358 +3,489432 i 2/6 = 1,233700 -2,467401 i yr = -o, 872358 +3,4894321 3. Schritt 2/o = 2/i = 2/2 = 2/3 = 2/4 = 2/5 = 2/6 = 2/7 = 13,262281 =c0 0,308425 = c4 0,616851+ 2,467402 i = c2 0,616851-2,467402 i = c6 2.106058 + 5,956833i = ci 0,361342-1,022031 i = c5 0,361342 + 1,022031 i = c. 2,106058-5,956833 i = c7
19.7 Darstellung von Kurven und Flächen mit Hilfe von Splines 959 a0 = 26,524 562 ai = 4,212 116 a2= 1,233 702 a3= 0,722 684 a4 = 0,616850 h = b2 = bs = b4 = -11,913 666 - 4,934 804 - 2,044 062 0 Aus dem dritten (letzten) Reduktionsschritt erhält man die nebenstehend aufgeführten gesuchten reellen FOURIER-Koeffizienten gemäß A9 221). In diesem Beispiel kann man auch die allgemeine Eigenschaft cN-k = ck A9.232) der diskreten komplexen FOURIER-Koeffizienten überprüfen. Für k = 1,2,3 sieht man, daß C7 = c\, c6 = c2, c5 = c3 gilt 19.7 Darstellung von Kurven und Flächen mit Hilfe von Splines 19.7.1 Kubische Splines Da Interpolations- und Ausgleichspolynome höheren Grades in der Regel unerwünschte Oszillationen zeigen, ist es zweckmäßig, das Approximationsintervall durch sogenannte Knoten in Teilintervalle zu zerlegen und auf jedem dieser Teilintervalle die Approximation durch relativ einfache Funktionen vorzunehmen In der Praxis werden dazu vor allem kubische Polynome verwendet Bei dieser stückweisen Approximation ist ein glatter Übergang der Teilfunktionen an den Knoten zu gewährleisten. 19.7.1.1 Interpolationssplines 1. Definition der kubischen Interpolationssplines Es seien N Interpolationspunkte (xi.fi) (i = 1,2,..., N) gegeben Der kubische Interpolationsspline S(x) ist durch folgende Eigenschaften eindeutig festgelegt: 1. S(x) erfüllt die Interpolationsbedingung S(xi) = fi (z = 1, 2,..., N). 2. S(x) ist in jedem Teilintervall [x^ Xi+{\ (i = 1,2, , N — 1) ein Polynom vom Grad < 3. 3. S(x) ist 2mal stetig differenzierbar im gesamten Approximationsintervall [x1} xn] ¦ 4. S(x) erfüllt spezielle Randbedingungen. a) S"(xi) = S"(xpi) = 0 (man spricht dann von natürlichen Splines) oder b) S'(xi) = //, S'(xN) = fN' (fi und f^ sind gegebene Werte) oder c) S(x\) = S(xn), falls /1 = fN, und S'(xi) = S'(xn) sowie S"(xi) = S"(xn) (man spricht dann von periodischen Splines). Aus diesen Eigenschaften folgt, daß S(x) unter allen 2mal stetig differenzierbaren Funktionen g(x), die die Interpolationsbedingung g(xi) = fi (i = 1,2,..., N) erfüllen, dadurch ausgezeichnet ist, daß j[S"{x)]2dx < j[g"(x)Jdx A9.233) X\ Xl gilt (Satz von Holladay). Man sagt auf Grund von A9.233), S(x) hat minimale Gesamtkrümmung, da für die Krümmung n einer ebenen Kurve in erster Näherung k « S" gilt (s. S. 236). Darüber hinaus läßt sich zeigen- Legt man durch die Punkte (xi,fi) (i = 1,2,. ., N) ein dünnes, elastisches Lineal (engl. Spline), so wird seine Biegelinie durch den kubischen Interpolationsspline S(x) beschrieben. 2. Bestimmung der Spline-Koeffizienten Für den kubischen Interpolationsspline S(x) wird für x £ [xi, xi+i] der folgende Ansatz gemacht S{x) = Si(x) = a{ + bi(x - x^ + a(x - x{J + d{{x - Xif (i = 1,2, . ,N -1). A9 234) Die Länge der Teilintervalle wird mit hi = Xi+i — Xi bezeichnet. Zur Bestimmung der Ansatzkoeffizi- enten für den natürlichen Spline kann man wie folgt vorgehen: 1. Aus der Interpolationsforderung folgt ai = fi (i = l,2,...,W-l) A9.235)
960 19. Numerische Mathematik Es ist zweckmäßig, den im Ansatz nicht auftretenden Koeffizienten a^ einzuführen und a^ — Jn zu setzen 2. Die Stetigkeit von S"(x) an den inneren Knoten führt zu et - Q_i rfi-i 3hi- (i = 2,3,. . ,iV- 1) A9 236) Aus den natürlichen Randbedingungen folgt c\ = 0 . und A9.236) gilt auch für i — N , wenn man c\ einführt und cn = 0 setzt. 3. Die Stetigkeit von S(x) an den inneren Knoten führt zu <H- di-i 2q_i + Ci bi-i = ; Ali- (z = 2,3, . ,N). /ii-i 3 4. Die Stetigkeit von S"(x) an den inneren Knoten ergibt Ci-ihi-i + 2(/ij_i + /ii)Q + Cj+i/i* = 3 - ca ¦Oi-l A9 237) (i = 2,3, ,N-1) A9 238) hi hi-i Wegen A9.235) ist die rechte Seite des linearen Gleichungssystems A9 238) zur Bestimmung dei Koeffizienten Ci (i = 2,3,.. , N — 1; c\ = cN = 0) bekannt Die linke Seite hat folgende Gestalt f2{h1 + h2) h2 \ ( c2 \ h2 2(/i2 + /i3) h3 O c3 hs 2(/i3 + hi) hA II c4 O V hN-2 2(hN-2 + hN-i)J \cN-iJ A9 239) Die Koeffizientenmatrix ist tridiagonal, so daß sich das Gleichungssystem A9 238) durch eine LR Zerlegung (s 19.2.1.1,2., S 918) sehr einfach numerisch lösen läßt. Aus den Koeffizienten q erhält man über A9 237) und A9.236) die restlichen Koeffizienten 19.7.1.2 Ausgleichssplines In der Praxis sind die gegebenen Werte fc häufig Meßwerte, also fehlerbehaftet. In diesem Fall ist die Interpolationsforderung unzweckmäßig. Man führt deshalb den kubischen Ausgleichsspline ein Er entsteht, wenn man beim kubischen Interpolationsspline die Interpolationsforderung durch fi - S(xt) &i + A J [S"(x)]2 dx ¦ A9 240) ersetzt Die Forderung nach Stetigkeit von 5. S' und S" bleibt erhalten, so daß sich zur Bestimmung der Spline-Koeffizienten eine Extremwertaufgabe mit Nebenbedingungen in Gleichungsform ergibt Die Lösung erfolgt mit Hilfe einer LAGRANGE-Funktion (s 6 2 5 6, S 419). Einzelheiten s [19 29], [19.30] In A9 240) stellt A (A > 0) einen Glättungsparameter dar, der vorgegeben werden muß Für A = 0 ergibt sich als Spezialfall der kubische Interpolationsspline. für „große" A erhält man eine glatte Näherungskurve, die dafür aber die Meßpunkte nur ungenau wiedergibt, und für A = oo ergibt sich schließlich als weiterer Spezialfall die Ausgleichsgerade Eine geeignete Wahl von A kann am Computer im Bildschirmdialog erfolgen. Die Parameter <Ji (o* > 0) in A9.240) stellen die Standardabweichungen (s. 3.. S 814) der Meßfehler dar, mit denen die Meßwerte fi (i = 1, 2, , N) eventuell behaftet sind Bei den bisher betrachteten kubischen Interpolations- und Ausgleichssplines waren die Abszissen der Interpolations- bzw Meßpunkte identisch mit den Knoten der Spline Funktion Das hat zur Folge, daß bei großem N der Spline aus einer sehr großen Anzahl von kubischen Ansatzfunktionen A9.234) besteht. Es liegt nahe, Anzahl und Lage der Knotenpunkte frei zu wählen, da man in der Praxis meist mit
19.7 Darstellung von Kurven und Flächen mit Hilfe von Splines 961 wesentlich weniger Spline-Stücken auskommt Darüber hinaus ist es numerisch günstiger, an Stelle des Ansatzes A9 234) Splines in der Form r+2 S{x) = Y,aiNiA(x) A9.241) anzusetzen Dabei ist r die Anzahl der frei gewählten Knoten, und mit NiA(x) werden die sogenannten normalisierten B-Splines (Basis-Splines) der Ordnung 4, d h vom Polynomgrad 3, zum i-ten Knoten bezeichnet. Ausführungen dazu s [19.4]. 19.7.2 Bikubische Splines 19.7.2.1 Anwendung bikubischer Splines Bikubische Splines werden zur Lösung der folgenden Aufgabe verwendet. Ein Rechtecksbereich R der x, y-Ebene, gegeben durch a<x<b,c<y<d, werde durch die Gitterpunkte (xi, y.j) (i = 0,1,. ., n; j — 0,1,..., m) mit a = x0 < X\ < • ¦ • < xn = b, c = yo < y\ < • • • < ym = d A9.242) in die Maschen Rij zerlegt, wobei die Masche Ft+j aus den Punkten (x, y) mit rc» < x < xi+i ,yj<y< yj+i (i = 0,1,..., n — 1, j = 0,1, . , m — 1) besteht. In den Gitterpunkten seien von der Funktion f(x,y) die Funktionswerte f(x»y,) = fi3 (t = 0,l,...,n; j = 0,l, .,m) A9 243) gegeben Gesucht ist eine möglichst einfache, glatte Fläche über R, welche die Punkte A9 243) approximiert 19.7.2.2 Bikubische Interpolationssplines 1. Eigenschaften Der bikubische Interpolationsspline S(x,y) ist durch folgende Eigenschaften eindeutig festgelegt: 1. S(x,y) erfüllt die Interpolationsbedingung S{xi,yj) = fij (i = 0,l, ,n; j = 0,1, . ,m). A9 244) 2. Auf jeder Masche Ri3 des Rechteckbereiches R ist S{x, y) identisch mit einem bikubischen Polynom, d.h , es gilt die Darstellung S(x,y) = Saix.v) = Y,*tam{x - x,)k(y - %)'. A9.245) fc=0 1=0 Damit wird Sij(x, y) durch 16 Ansatzkoeffizienten repräsentiert, und für die Beschreibung von S(x, y) sind 16 • m • n Koeffizienten notwendig 3. Die Ableitungen ^, ^, ™- A9246) dx ' dy ' dxdy sind stetig auf R Damit wird eine gewisse Glattheit der gesuchten Fläche gewährleistet. 4. S(x, y) erfüllt spezielle Randbedingungen: dS [Xi, yj) = Pij iur i = U, n; j = U, 1, ., m, A9 247) Tx(Xi>y>] es. . 925 dxTy{Xi^] = Pü = Qu Tij für z = 0,n; j = 0,1, .,m, für i = 0,1,. ,n;i;' = 0,m, für i = 0, n; j = 0, m.
962 19. Numerische Mathematik Dabei sind pij. % und rij vorgegebene Zahlenwerte. Bei der Bestimmung der Ansatzkoeffizienten a^i können die Ergebnisse der eindimensionalen kubischen Spline-Interpolation ganz entscheidend ausgenutzt werden Es zeigt sich 1. Es ist eine sehr große Anzahl Bn + m + s) linearer Gleichungssyteme, aber nur mit tridiagonaler Koeffizientenmatrix, zu lösen. 2. Die linearen Gleichungssysteme unterscheiden sich im wesentlichen nur durch ihre rechten Seiten Man kann im allgemeinen sagen, bikubische Interpolationssplines sind günstig bezüglich Reehenzeit und Genauigkeit und damit recht gut geeignet für viele praktische Anwendungen Zur rechentechnischen Realisierung der Koeffizientenbestimmung s. [19 6], [19 27] 2. Tensorprodukt-Ansätze Der bikubische Spline-Ansatz A9 245) ist ein Beispiel für einen sogenannten Tensorprodukt- Ansatz, der die Form S(x1y) = J2YlaiJ9i{x)hj(y) A9 248) i=0 j=0 hat und vor allem für Approximationen über Rechteckgittern geeignet ist Die Funktionen g^x) (i - 0,1, , n) und hj(y) (j = 0,1, .., m) bilden zwei linear unabhängige Funktionssysteme. Tensorprodukt-Ansätze haben in numerischer Hinsicht den großen Vorteil, daß sich z B die Lösung der zweidimensionalen Interpolationsaufgabe A9.244) auf die Lösung von eindimensionalen Aufgaben zurückführen läßt Darüber hinaus gilt: Die zweidimensionale Interpolationsaufgabe A9 244) ist mit dem Ansatz A9.248) eindeutig lösbar, wenn 1. die eindimensionalen Interpolationsaufgaben mit den Ansatzfunktionen gi(x) bezüglich der Stützstellen x0, x\,. , xn und 2. die eindimensionalen Interpolationsaufgaben mit den Ansatzfunktionen hj(y) bezüglich der Stützstellen y0, 2/i,.. , ym eindeutig lösbar sind Ein wichtiger Tensorprodukt-Ansatz ist der mit kubischen B-Splines- r+2 p+2 S(x, V) = E E aaNiA{x)NiA{y) A9.249) »=i j=\ Dabei sind die Funktionen Ni^(x) und Nj^(y) normalisierte B-Splines der Ordnung 4 Mit r wird die Anzahl der Knoten bezüglich x , mit p die Anzahl der Knoten bezüglich y bezeichnet. Die Knoten sind frei wählbar, aber für die Lösbarkeit der Interpolationsaufgabe müssen gewisse Bedingungen an die Lage der Knoten und die der Stützstellen der Interpolation gestellt werden B-Spline-Ansätze führen bei der Lösung von Interpolationsaufgaben auf Gleichungssysteme deren Koeffizientenmatrizen Bandstruktur haben, also von numerisch günstiger Struktur sind Wegen Lösungen für verschiedene Interpolationsaufgaben mit Hilfe von bikubischen B Spline- Ansätzen s [19 15] 19.7.2.3 Bikubische Ausgleichssplines Der eindimensionale kubische Ausgleichsspline wird im wesentlichen durch die Extremalforderung A9 240) charakterisiert. Für den zweidimensionalen Fall könnte eine ganze Reihe entsprechender Ex- tremalforderungen aufgestellt werden, aber nur ganz bestimmte ermöglichen die eindeutige Existenz einer Lösung Geeignete Extremalforderungen und Algorithmen zur Lösung von Ausgleichsaufgaben mit bikubischen B-Splines s. [19.20], [19.19] 19.7.3 Bernstein—Bezier—Darstellung von Kurven und Flächen 1. Bernsteinsche Grundpolynome Die BERNSTEIN-BEZIER -Darstellung (kurz.B-B-Darstellung) von Kurven und Flächen verwendet die BERNSTElNsc/ien Grundpolynome
19 7 Darstellung von Kurven und Flächen mit Hilfe von Splines 963 Bi ,n(t)=(Tl)ti(l-t)n-i (i = 0,1, ,n) und nutzt vor allem die folgenden Eigenschaften aus* 1. 0 < Bi,n(t) < 1 für 0 < t < 1, 2. f>>n(*) = l A9 250) A9 251) A9 252) Die Formel A9 252) folgt unmittelbar aus dem binomischen Satz. ¦ A: B01(t) = l-t, Bhl(t) = t (Abb.19.12) ¦ B: B03(t) = A - tK , B1>3(*) = 3*A - tf , B2,3(t) = 3t2(l - t) B3,3(t) = t3 (Abb.19.13). 0 1 Abbildung 19 12 Abbildung 19.13 2. Vektordarstellungen Im folgenden werde eine Raumkurve, deren Parameterdarstellung x = x(t), y = y(t), z = z(t) lautet, vektoriell durch F = f(£) = x(t) ex + y(t) ey + z(t) ez A9 253) beschrieben Dabei ist t der Kurvenparameter. Die entsprechende Darstellung für eine Fläche lautet r = r(w, v) = x(u, v) ex + y(u, v) ey + z(u, v) ez A9.254) Dabei sind u und v die Flächenparameter 19.7.3.1 Prinzip der B-B—Kurvendarstellung Gegeben seien n +1 Eckpunkte P» (?' = 0,1, , n) mit den Ortsvektoren P^ eines räumlichen Polygons, das in diesem Zusammenhang als Stützpolygon bezeichnet wird. Durch die Vorschrift wird diesen Punkten eine Raumkurve, die sogenannte B-B-Kurve zugeordnet. Wegen A9 252) kann A9.255) als „variable Konvexkombination" der gegebenen Punkte aufgefaßt werden Die Raumkurve A9.255) hat folgende wichtige Eigenschaften: 1. Die Punkte P0 und Pn werden interpoliert. 2. Die Vektoren P0Pi und Pn_iPn sind Tangenten von r(t) in P0 bzw Pn Den Zusammenhang zwischen Stützpolygon und B-B- Kurve zeigt Abb. 19.14 A9 255) ( < =t \ ^/ p4 A Abbildung 19.14
964 19. Numerische Mathematik Die B-B-Darstellung wird vor allem für den Entwurf von Kurven eingesetzt, da man durch die Änderung von Polygonecken den Kurvenverlauf auf sehr einfache Weise beeinflussen kann. Häufig werden an Stelle der BERNSTElNschen Grundpolynome normalisierte B-Splines verwendet. Die zugehörigen Raumkurven heißen dann B-Spline-Kurven. Ihr Verlauf entspricht prinzipiell dem der B- B-Kurven, aber sie haben folgende Vorteile gegenüber diesen 1. Das Stutzpolygon wird besser approximiert. 2. Bei Änderung von Polygoneckpunkten ändert sich die B-Spline-Kurve nur lokal. 3. Neben der lokalen Änderung des Kurvenverlaufs kann auch die Differenzierbarkeit beeinflußt werden. So lassen sich z B auch Knicke und Geradenstucke erzeugen. 19.7.3.2 B-B-Flächendarstellung Gegeben seien Punkte P^ (i = 0,1, .., n; j = 0,1,.. , m) mit den Ortsvektoren Pi:7, die als Netzpunkte einer Fläche längs Parameterlinien aufgefaßt werden können In Analogie zu den B-B- Kurven A9.255) ordnet man den Netzpunkten durch n m ?(", v) = £ £ BiMBimWPij A9 256) t=0j=0 eine Fläche zu. Die Darstellung A9.256) ist für den Flächenentwurf geeignet, da auf einfache Weise durch die Veränderung von Netzpunkten eine Variation der Fläche möglich ist Allerdings ist der Einfluß aller Netzpunkte global, so daß man auch in A9.256) von den BERNSTElNschen Grundpolynomen zu B-Splines übergehen sollte.
19 8 Nutzung von Computern 965 19.8 Nutzung von Computern 19.8.1 Interne Zeichendarstellung Computer sind zeichenverarbeitende Maschinen Die Interpretation und Verarbeitung dieser Zeichen wird durch die verwendete Software (Programme) festgelegt und gesteuert Die externen Zeichen, Buchstaben, Ziffern und Sonderzeichen werden intern im Binärcode in Form von Bitfolgen dargestellt. Ein Bit (Binary Digit) ist die kleinste darstellbare Informationseinheit mit den Werten 0 und 1 Acht Bit werden zur nächsthöheren Einheit, dem Byte, zusammengefaßt In einem Byte können 28 Bitkombinationen erzeugt werden, die ihrerseits 256 Zeichen zugeordnet werden können. Eine solche Zuordnung bezeichnet man als Code. Es gibt verschiedene Codes, einer der weit verbreiteten ist der erweiterte ASCII (American Standard Code for Information Interchange). 19.8.1.1 Zahlensysteme 1. Bildungsgesetz Zahlen werden in Computern in mehreren aufeinanderfolgenden Bytes dargestellt Basis für die interne Darstellung bildet das Dualsystem, welches, wie auch das Dezimalsystem, zu den polyadischen Zahlensystemen gehört. Das Bildungsgesetz für polyadische Zahlensysteme lautet n a = ]T ZiB* (ra>0, n > 0, m,n ganz) A9.257) i——m mit B als Basis und Zi @ < z\ < B) als zugelassene Ziffern des Zahlensystems. Die Ziffern mit i > 0 bilden den ganzen, die mit i < 0 den gebrochenen Teil der Zahl. ¦ Die Dezimalzahldarstellung, d.h. B = 10 , für die Dezimalzahl 139,8125 lautet 139, 8125 = 1 • 102 + 3 H^ + g-H^ + S 10-1 + 1 • 10 + 2 • 10 + 5 • 10~4 . Im Zusammenhang mit der Nutzung von Computern sind die in Tabelle 19.3 aufgeführten Zahlensysteme gebräuchlich. Tabelle 19 3 Zahlensysteme Zahlensystem Dualsystem Oktalsystem Hexadezimalsystem (Sedezimalsystem) Dezimalsystem Basis 2 8 16 10 zulässige Ziffern 0,1 (als Zeichen 0,L) 0,1,2,3,4,5,6,7 0,1,2,3,4,5,6,7,8,9, A,B,C,D,E,F (Die Buchstaben A-F stehen für die Werte 10-15 ) 0,1,2,3,4,5,6,7,8,9 2. Konvertierung Die Umrechnung von einem Zahlensystem in ein anderes nennt man Konvertierung Werden mehrere Zahlensysteme gleichzeitig benutzt, so ist es zur Vermeidung von Irrtümern üblich, die Basis als Index anzuhängen ¦ Für die Dezimalzahl 139 8125 ergibt sich dann 139 8125i0 = 10001011 11012 = 213.648 = 8B.Di6 1. Konvertierung von Dualzahlen in Oktal- bzw. Hexadezimalzahlen Die Konvertierung von Dualzahlen in Oktal- bzw Hexadezimalzahlen ist einfach dadurch möglich, daß man vom Punkt ausgehend nach links und rechts Gruppen von drei bzw. vier Bits bildet und den Wert derselben bestimmt Diese Werte sind dann die Ziffern des Oktal- bzw Hexadezimalsystems 2. Konvertierung von Dezimalzahlen in Dual-, Oktal- oder Hexadezimalzahlen Für die Konvertierung vom Dezimal- in eines der anderen Systeme gelten für den ganzen und den gebrochenen
966 19 Numerische Mathematik Teil der Dezimalzahl folgende Algorithmen: a) Ganzer Teil: Ist G die ganze Zahl im Dezimalsystem, dann gilt für das Zahlensystem mit der Basis B das Bildungsgesetz A9.257): G = YJziBi (n>0) i=0 A9 258) Dividiert man G durch B , so erhält man einen ganzzahligen Teil (die Summe) und einen Rest B=^ZiB +B' A9.259) Dabei nimmt z0 die Werte 0,1, .., B — 1 an und ist die niederwertige Ziffer des Zahlensystems Wendet man das Verfahren jetzt auf die abgespaltete Summe wiederholt an, so ergeben sich die weiteren Ziffern. b) Gebrochener Teil: Ist g ein echter Dezimalbruch, so lautet die Vorschrift für die Konvertierung in das Zahlensystem mit der Basis B jetzt gB = z-1 + jrz-iB-i+1. t=2 Die wiederholte Anwendung auf die entstehenden Summen liefert die Werte z_2 , Z- A9 260) A: Umwandlung der Dezimalzahl B: Umwandlung des Dezimalbruchs 139 in eine Dualzahl 139:2 = 69 69 • 2 = 34 34: 2 = 17 17:2= 8 8-2= 4 4:2 = 2 2.2= 1 1:2 = 0 Rest Rest Rest Rest Rest Rest Rest Rest 1 1 0 1 0 0 0 1 A = A = @ = A = = 2o) = *i) = z2) -z7) 0.8125 in einen Dualbruch 0 8125-2 = 1.625 0 625 -2 = 1.25 0 25 -2 = 05 0.5 -2=1.0 00 -2 = 00 0 8125io =0.1101 (l = *-i) A = z-2) @ = *_3) A = z.4) 2 139io = IOOOIOH2 3. Konvertierung von Dual-, Oktal- oder Hexadezimalzahlen in Dezimalzahlen Der Algorithmus für die Umwandlung eines Wertes aus dem Dual-, Oktal- oder Hexadezimalsystem in das Dezimalsystem lautet, wobei der Dezimalpunkt nach z0 einzufügen ist: a = Yl ziBl (m > 0 , n > 0 , ganz). A9 261) 1110 1 2 6 14 28 1 3 7 14 [29 Die Auflösung erfolgt dabei zweckmäßig mit dem HORNER-Schema ¦ LLLOL = 1 • 24 + 1 • 23 + 1 • 22 + 0 • 21 + 1 • 2° = 29. L und O s. Tabelle 19.3. Das zugehörige HORNER-Schema s. nebenstehend 19.8.1.2 Interne Zahlendarstellung Dualzahlen werden im Computer in einem oder in mehreren Bytes dargestellt Man unterscheidet dabei zwei Darstellungsformen, die Festpunktzahlen (Festkommazahlen) und die Gleitpunktzahlen (Gleitkommazahlen) Im ersten Fall steht der Dezimalpunkt an einer festen Stelle (bei ganzen Zahlen also nach der Einerstelle), im zweiten Fall „gleitet" er mit der Änderung des Exponenten
19 8 Nutzung von Computern 967 1. Festpunktzahlen Der Wertebereich für Festpunktzahlen mit den angegebenen Parametern 'ergibt sich zu 0 < | a | < 2* - 1 A9 262) Festpunktzahlen können in der Form der nebensteheneden Abb. 19.15 dargestellt werden. Dualzahl (t Bits) T Vorzeichen y der Festpunktzahl Abbildung 19 15 2. Gleitpunkt zahlen Für die Darstellung von Gleitpunktzahlen sind prinzipiell zwei verschiedene Formen üblich, wobei die interne Realisierung im Detail variieren kann. 1. Normalisierte halblogarith- mische Form Bei der ersten Form werden die Vorzeichen für den Exponenten E und für die Mantisse M der Zahl a a = ±MB±E A9.263) gesondert gespeichert. Dabei wird meist der Exponent E so gewählt, daß für die Mantisse die Bedingung l/B < M < 1 gilt. Man spricht dann von der normalisierten halblogarith- mischen Form (Abb. 19.16) Exponent £ (p Bits) Mantisse M (t Bits) Vorzeichen vE des Exponenten Vorzeichen vM der Mantisse Abbildung 19 16 Mit den angegebenen Parametern ergibt sich folgender absoluter Wertebereich für die Gleitpunktzahlen A9.264) 2-aP < | a | < (l - 2-') • 2<2P~1 -i) 2. IEEE-Standard Die zweite (heute übliche) Form der Gleitpunktdarstellung entspricht dem 1985 verabschiedeten IEEE- Standard (Institute of Electrical and Electronics Engineers) Dieser befaßt sich mit der Normung der Rechnerarithmetik und enthält Festlegungen zu den Formaten, dem Rundungsverhalten, den arithmetischen Operatoren, der Konvertierung von Zahlenwerten, zu Vergleichsoperatoren und zur Behandlung von Ausnahmefällen wie Bereichsüberschreitungen. Dort wird für die Gleitpunktzahl die in Abb. 19.17 dargestellte Form festgelegt Die Charakteristik C wird aus dem Exponenten E durch Addition einer geeigneten Konstanten K gebildet. Diese wird so gewählt, daß für die Charakteristik nur positive Werte auftreten. Die darstellbare Zahl lautet a = (-l)v • 2E • 1.6^2 6*_i mit E = C-K A9265) Charakteristik C Mantisse M T Vorzeichen v der Gleitpunktzahl Abbildung 19 17 Dabei gilt. Cm 1,CL = 254 ; C = 0 und C = 255 sind reserviert. Der Standard gibt zwei Basisformate (einfachgenaue und doppeltgenaue Gleitpunktzahlen) vor, läßt aber auch erweiterte Formate zu. Tabelle 19.4 enthält die Parameter für die Basisformate
968 19. Numerische Mathematik Tabelle 19.4 Parameter für die Basisformate Parameter Wortlänge in Bits maximaler Exponent Emax minimaler Exponent Emin Konstante K Anzahl Bits des Exponenten Anzahl Bits der Mantisse einfachgenau 32 +127 -126 +127 8 24 doppeltgenau 64 +1023 -1022 +1023 11 53 19.8.2 Numerische Probleme beim Rechnen auf Computern 19.8.2.1 Einführung, Fehlerarten Für das Rechnen auf Computern gelten zwar prinzipiell die gleichen Gesichtspunkte wie beim Rechnen von Hand, jedoch werden diese durch die vorhandene begrenzte und feste Stellenzahl, durch die interne duale Darstellung der Zahlen und durch die fehlende Kritikfähigkeit des Computers gegenüber Fehlern verstärkt. Hinzu kommt noch, daß auf Computern im allgemeinen wesentlich umfangreichere Rechenprozesse ablaufen, als sie manuell möglich wären Daraus ergeben sich Fragen nach der Beurteilung und der Beeinflussung von Fehlern, nach der Auswahl des numerisch günstigsten Verfahrens unter mathematisch gleichwertigen, aber auch nach den Abbruchbedingungen eines Iterationsverfahrens. In den weiteren Ausführungen werden für die Angabe von Fehlern die folgenden Bezeichnungen benutzt, wobei x der exakte Wert einer Größe ist, der häufig unbekannt ist, und x ist ein Näherungswert für x: I At I I T — T \ Absoluter Fehler: | Ax| = \x - x\ A9 266) Relativer Fehler: — = . A9 267) I x I |x| Häufig werden auch die Bezeichnungen e(x) = x - x und erei(x) = A9 268) verwendet. 19.8.2.2 Normalisierte Dezimalzahlen und Rundung 1. Normalisierte Dezimalzahlen Jede reelle Zahl x ^0 läßt sich als Dezimalzahl in der Form x = ±0,6i&2...-10£; Fi^0) A9 269) darstellen. Dabei wird 0,6162 .. als Mantisse bezeichnet, die aus den Ziffern 6* G {0,1,2, ,9} gebildet wird. Die Zahl E ist eine ganze Zahl, der sogenannte Exponent zur Basis 10. Wegen 61 ^ 0 bezeichnet man A9.269) als normalisierte Dezimalzahl. Da in einem realen Computer nur mit endlich vielen Ziffern gearbeitet werden kann, muß man sich auf eine feste Zahl t von Mantissenziffern und auf einen festen Wertebereich für den Exponenten E beschränken Dadurch wird aus der Zahl x gemäß A9.269) durch Rundung, wie sie beim praktischen Rechnen üblich ist, die Zahl ~ _ f ±0,6i62 • • • bt ¦ 10E für bt+1 < 5 (Abrunden), X \ ±@,6i62 • • • bt + 10"*) 1015 für bt+i > 5 (Aufrunden), d.h., für den durch Rundung verursachten absoluten Fehler gilt* |Ax| = \x-x\ ^Ojö-KT'IO^. A9.270) A9.271)
19 8 Nutzung von Computern 969 2. Grundoperationen des numerischen Rechnens Jeder numerische Prozeß setzt sich letztlich aus einer Folge von Grundrechenoperationen zusammen Probleme ergeben sich insbesondere durch die endliche Stellenzahl bei der Gleitpunktarithmetik Diese sollen kurz betrachtet werden. Es sei vorausgesetzt, daß x und y normalisierte fehlerfreie Gleitkommazahlen gleichen Vorzeichens mit einem Wert ^ 0 sind. x = mlBE^ y = m2BEi mit A9 272a) t mi = Y, a-lB~k> a-i ^ 0, und A9.272b) „W. = oder B - 1 für k > 1 (i = 1,2) A9 272c) 1. Addition Für E\ > E2 erfolgt der Exponentenangleich an E\ , da wegen der Normalisierung nur eine Linksverschiebung des Punktes möglich ist. Die Mantissen werden addiert Ist B~l <| mi + m2B-{El-E^ |< 2 A9.273a) und | mx + m2B^El-E2) |> 1, A9 273b) so erfolgt die Punktverschiebung um eine Stelle nach links bei gleichzeitiger Erhöhung des Exponenten um eins (Additionsüberlauf) ¦ 0,9604 • 103 + 0,5873 • 102 = 0,9604 • 103 + 0,05873 103 = 1,01913 • 103 = 0,1019 • 104 . 2. Subtraktion Der Exponentenangleich erfolgt wie bei der Addition, die Mantissen werden subtrahiert. Ist | m1 - m2B-{El~E2) |< 1 - B~l A9 274a) f und | mx - m2B-{El~E2) |< B~l, A9 274b) so erfolgt die Punktverschiebung um maximal t Stellen nach rechts mit entsprechender Erniedrigung des Exponenten ¦ 0,1004 • 103 - 0,9988 • 102 = 0,1004 • 103 - 0,09988 • 103 = 0,00052 • 103 = 0,5200 • 10° Das Beispiel zeigt den kritischen Fall der Auslöschung führender Nullen Durch die beschränkte Stellenzahl (hier 4) werden außerdem von rechts Nullen eingeschleppt, die eine erhöhte Anzahl gültiger Ziffern vortäuschen 3. Multiplikation Die Exponenten werden addiert und die Mantissen multipliziert Ist m1m2 < B~l, A9 275) so wird der Dezimalpunkt bei gleichzeitiger Erniedrigung des Exponenten um eins um eine Stelle nach rechts verschoben (Multiplikationsunterlauf) ¦ 0,3176 • 103 • 0,2504 • 105 = 0,07952704 • 108 = 0,7953 • 107 . 4. Division Die Exponenten werden subtrahiert und die Mantissen dividiert. Ist — > B~l , A9 276) 777.2 so wird der Dezimalpunkt bei gleichzeitiger Erhöhung des Exponenten um eins um eine Stelle nach links verschoben (Divisionsüberlauf) ¦ 0,3176 • 103/0,2504 • 105 = 1,2683706 10~2 = 0,1268 • 10. 5. Resultat fehler Der Resultatfehler bei den vier Grundrechenarten mit vorausgesetzten fehlerfreien Operanden resultiert dann lediglich aus der Rundung Für den relativen Fehler gilt mit der Stellenzahl t und der Basis B die Schranke ^-B~l A9 277) 6. Vermeidung der Auslöschung Es ist ersichtlich, daß die Subtraktion nahezu gleich großer Gleitkommazahlen die kritische Operation ist. Wenn möglich, sollte in solchen Fällen durch Prioritätenänderungen oder andere Anordnung der Operanden die Reihenfolge der Operationen geändert werden
970 19. Numerische Mathematik 19.8.2.3 Genauigkeitsfragen beim numerischen Rechnen 1. Fehlerarten Numerische Verfahren sind fehlerbehaftet. Es gibt die folgenden Fehlerarten, aus denen sich der akkumulierte Fehler (Gesamtfehler) des Ergebnisses zusammensetzt (Abb.19.18). x Eingangsfehler Gesamtfehler Verfahrensfehler l Rundungsfehler Abbruchfehler Diskretisierungsfehler Abbildung 19 18 2. Eingangsfehler 1. Begriff des Eingangsfehlers Eingangsfehler heißt der Fehler des Ergebnisses, der durch fehlerbehaftete Eingangsdaten verursacht wird Die Bestimmung des Eingangsfehlers aus den Fehlern der Eingangsdaten wird direkte Aufgabe der Fehlertheorie genannt Als inverse Aufgabe wird jene bezeichnet, die untersucht, welche Fehler die Eingangsdaten besitzen dürfen, damit ein zugelassener Eingangsfehler des Resultats nicht überschritten wird Die Abschätzung des Eingangsfehlers ist bei komplexeren Aufgaben sehr kompliziert und kaum durchführbar * Allgemein gilt für eine zu berechnende reellwertige Funktion y = f(x) mit x = (^i,X2,.. , £n)T für den absoluten Eingangsfehler \&y\ = \f(x1,x2, -,xn)- f(xux2i. ,x„)| IE !£(&.&> • ,en)fe-fOI<E(max|g(x)|]|Ax,|, A9 278) wenn man für y = f(x) = f(xi,x2,..., xn) die TAYLOR-Formel (s. 7.3.3 3, S. 434) mit linearem Restglied verwendet Mit £1, £2, . , fn werden dabei Zwischenstellen, mit x\, x2l..., xn Näherungswerte für x\, #2, • • • » xn bezeichnet. Unter den Näherungswerten sind hier die fehlerhaften Eingangswerte zu verstehen. In diesem Zusammenhang ist auch das GAUSSsche Fehlerfortpflanzungsgesetz (s. 16.4.2.1,1. S 818) zu beachten. 2. Eingangsfehler für einfache arithmetische Operationen Für einfache arithmetische Operationen sind die Eingangsfehler bekannt Mit den Bezeichnungen in A9 266) bis A9.268) erhält man für die vier Grundrechenoperationen: e(x ±y) = e(x) ± e(y), A9.279) e(xy) = ye(x) + xe{y) + e{x)e(y), A9 280) e(y) + Glieder höherer Ordnung in e, A9 281) y xerei(x) ± yerei(y) e(H^ erel(x±y x £rel{-) '¦ X ±1 - ,A9.282) erel(xy) = erel(x)+erel(y)+erel(x)erel(y) ,A9 283) = erei(x) — erei(y) + Glieder höherer Ordnung ine A9 284) Die Formeln zeigen: Kleine relative Fehler der Eingangsdaten bewirken bei Multiplikation und Division nur kleine relative Fehler des Ergebnisses Bei Addition und Subtraktion kann dagegen der relative
19 8 Nutzung von Computern 971 Fehler von Summe und Differenz groß werden, wenn |x±y| <C \x\ + \y\ gilt Dann besteht die Gefahr der Stellenauslöschung. 3. Verfahrensfehler 1. Begriff des Verfahrensfehlers Verfahrensfehler leiten sich aus der Notwendigkeit ab, daß Kon- tinuum und Grenzwert numerisch approximiert werden müssen. Daraus ergeben sich Abbruchfehler bei Grenzprozessen (wie z.B. bei Iterationsverfahren) und Diskretisierungsfehler bei der Approximation des Kontinuums durch ein endliches diskretes System (wie z.B. bei der numerischen Integration). Verfahrensfehler existieren unabhängig von Eingangs- und Rundungsfehlern; sie können deshalb nur im Zusammenhang mit dem verwendeten Lösungsverfahren untersucht werden. 2. Verhalten bei Iterationsverfahren Wird ein Iterationsverfahren zur Lösung eingesetzt, so muß man sich bewußt sein, daß prinzipiell die beiden Fälle Ausgabe einer richtigen Lösung und Ausgabe einer falschen Lösung möglich sind Es kann jedoch auch der kritische Fall auftreten, daß keine Lösung gefunden wurde, obwohl eine existiert. Um Iterationsverfahren transparenter und sicherer zu machen, sollten folgende Empfehlungen beachtet werden: a) Um „endlose" Iterationen zu verhindern, sollte die Anzahl der Iterationsschritte gezählt und in die Abbruchbedingung einbezogen werden (Abbruch nach einer bestimmten Anzahl von Iterationszyklen auch dann, wenn die geforderte Genauigkeit noch nicht erreicht wurde). b) Verfolgung der Lösungsentwicklung auf dem Bildschirm durch die numerische oder graphische Ausgabe von Zwischenergebnissen. c) Nutzung evtl. bekannter Eigenschaften der Problemlösung wie Gradient, Monotonie usw. d) Untersuchung der Möglichkeit der Skalierung von Variablen bzw. Funktionen. e) Durchführung mehrerer Tests durch Variation von Schrittweite, Abbruchbedingung, Startwerten usw 4. Rundungsfehler Rundungsfehler entstehen dadurch, daß Zwischenergebnisse gerundet werden müssen. Sie sind demnach für die Beurteilung eines mathematischen Verfahrens bezüglich der erzielbaren Genauigkeit der Resultate von wesentlicher Bedeutung Sie entscheiden neben den Eingangs- und Verfahrensfehlern darüber, ob ein numerisches Verfahren stark stabil, schwach stabil oder instabil ist. Starke Stabilität und schwache Stabilität oder Instabilität liegen vor, wenn der Gesamtfehler mit wachsender Schrittzahl abnimmt, von gleicher Größenordnung bleibt oder anwächst Bei der Instabilität unterscheidet man die Anfälligkeit gegen Rundungs- und Diskretisierungsfehler (numerische Instabilität) und gegen Fehler in den Ausgangsdaten bei exakter Rechnung (natürliche Instabilität) Ein Rechenprozeß ist dann sinnvoll, wenn die numerische Instabilität nicht größer als die naturliche Instabilität ist. Für die lokale Fortpflanzung von Rundungsfehlern, d h , es werden die Rundungsfehler betrachtet, die beim Übergang von einem Rechenschritt zum nächsten auftreten, gelten dieselben Überlegungen und Abschätzungen, wie sie für die Eingangsfehler angestellt worden sind. 5. Beispiele zum numerischen Rechnen An einigen Beispielen sei die Problematik des zweckmäßigen Vorgehens beim numerischen Rechnen verdeutlicht. ¦ A: Wurzeln der quadratischen Gleichung: ax2 + bx + c = 0 mit reellen Koeffizienten a, 6, c und D = b2 — 4ac > 0 (reelle Wurzeln). Kritische Situationen ergeben sich für a) | Aac |<C b2 und b) 4ac « b2 . Vorgehen: a) x\ = , X2 = (Vietascher Wurzelsatz) 2a ax\ b) Durch das direkte Auflösungsverfahren ist die Auslöschung bei der Berechnung von D nicht zu beseitigen. Da jedoch der Summand b betragsmäßig überwiegt, tritt eine erhebliche Fehlerdämpfung
972 19. Numerische Mathematik bei (b + signF) VD) ein. ¦ B: Volumen der dünnen Kugelschale für h <C r (r _|_ M3 _ r3 2>r2h + 3r/?,2 + /i3 V = 47T ergibt wegen (r + h) « r starke Auslöschung; V = 47r - ergibt jedoch keine Auslöschung oo -j^ ¦ C: Bildung der Summe S = ^P -^—- E = 1,07667. .) mit einer geforderten Genauigkeit von drei Stellen Bei 8stelliger Rechnung müßten annähernd 6000 Summanden berücksichtigt werden. Nach der identischen Umformung — = — — 70/10 r erhält man k2 + 1 A;2 «2(/r + 1) oo -i oo -| 2 oo -i S = E ^ " E ^2 + !) und 5 = y ~ E fe2(A:2 + !) • Mit dieser Umformung sind nur noch acht Summenglieder zu berücksichtigen 0 / x2 - y2 ¦ D: Beseitigung der —Situation der Funktion z = A — Jl + x2 + y2)^—^7 für x = y = 0 0 x2- + yl Die Erweiterung mit A + y/\ + x2 + y2) beseitigt diese Situation ¦ E: Beispiel eines instabilen rekursiven Prozesses. Algorithmen der allgemeinen Form yn+] = ayn + byn-\ (n = 1, 2,. ) sind dann stabil, wenn die Bedingung a , /a2 2±Vt+6 < 1 erfüllt ist Fii den speziellen Fall yn+i = —3yn + 4?/n_i (n = 1, 2, . ) liegt Instabilität vor Besitzen nämlich yQ und yx die Fehler £ und —e , so ergeben sich für y2,2/3,2/4,2/5, y§,. die Fehler 7e, —25e, 103e, —409^, 1639e, . . Damit ist für die Parameter a = — 3 und b = 4 der Rechenprozeß instabil ¦ F: Numerische Integration einer Differentialgleichung. Für die gewöhnliche Differentialgleichung 1. Ordnung l/= f{x,y) mit f(Xly) = ay A9 285) und der Anfangsbedingung y(x0) = y0 sollen die Probleme bei der numerischen Berechnung etwas ausführlicher dargestellt werden. a) Natürliche Instabilität Neben der exakten Lösung y(x) sei u(x) die Lösung zu einer gegenüber der exakten Anfangsbedingung y(x0) = y0 fehlerbehafteten Anfangsbedingung Für die gestörte Lösung wird ohne Beschränkung der Allgemeinheit der Ansatz u(x) = y{x)+er)(x) A9 286a) gemacht, wobei e ein Parameter mit 0 < e < 1 und rj(x) eine sogenannte Störfunktion ist Unter Beachtung von u'{x) = f(x, u) ergibt sich bei Anwendung der TAYLOR-Entwicklung u'{x) — f(x, y(x) + e r}(x)) = f(x, y) + e rj(x) fy(x, y) + Glieder höherer Ordnung A9 280b) die sogenannte Differentialvariationsgleichung ff{x) = fy(x1y)rI(x). A9 286c) Die Lösung des Problems mit f(x,y) = ay lautet dann rj(x) = ??o ea{x-xo) mit rj0 = rj(x0). A9 286d) Für a > 0 führt eine kleine Anfangsstörung 770 zu unbeschränkt wachsender Störung r)(x) Damit liegt natürliche Instabilität vor b) Untersuchung des Verfahrensfehlers bei der Trapezregel Mit a = -1 ergibt sich die stabile Differentialgleichung y'{x) = —y{x) mit der exakten Lösung y(x) = y0e-{x-xo), wobei y0 = y(x0) gilt. A9 287a)
19 8 Nutzung von Computern 973 Die Trapezregel lautet j y(x)dxt ' + Vi+l h mit h = xi+i - xt. A9.287b) 2 Angewendet auf die angegebene Differentialgleichung erhält man Vi+i =Vi+ J (-y)dx = y{ h oder yi+1 = j—j-yi bzw 2 ^ fiö. A9.287c) ^2 + /i Mit Xi = x0 + ih und daraus i — (x{ — Xo/h erhält man für 0 < h < 2 y% = 9 — h\ (xi~xo)/h 2 + h hecW(Xi-xo) mit w-^p- /l2 /l4 12 . 80 A9.287d) Unter der Voraussetzung yo = yo gilt dann & < yi, und damit strebt für h —> 0 auch ^ gegen die exakte Lösung y0e~(Xi~Xo^ c) Eingangsfehler Unter b) war vorausgesetzt worden, daß exakter und näherungsweiser Anfangswert übereinstimmen. Jetzt soll das Verhalten untersucht werden, wenn yo ^ i/o mit | yo — yo \< Sq gilt. Wegen (^i+i - yi+1) < Y—fim - y*) folgt (yi+i - yi+i) < l j—^ j (yo - Vo) A9 288a) Damit ist ei+\ höchstens von der gleichen Größenordnung wie £o , und das Verfahren ist bezüglich des Anfangswertes stabil. Es sei jedoch darauf hingewiesen, daß für den Fall der numerischen Lösung obiger Differentialgleichung mit dem SiMPSON-Verfahren künstlich Instabilitäten eingeführt werden. So wurde sich in diesem Fall beispielsweise die allgemeine Lösung y. = Cie-Xi + C2(-lYeXi/3 A9.288b) für h —> 0 ergeben. Der Grund besteht darin, daß das numerische Lösungsverfahren Differenzen höherer Ordnung benutzt, als es der Ordnung der Differentialgleichung entspricht. 19.8.3 Bibliotheken numerischer Verfahren Im Laufe der Zeit sind unabhängig voneinander Bibliotheken von Funktionen und Prozeduren für numerische Verfahren in unterschiedlichen Programmiersprachen entwickelt worden. Bei ihrer Entwicklung wurden umfangreiche Computererfahrungen berücksichtigt, so daß bei der Lösung praktischer numerischer Aufgaben die Programme einer solchen Bibliothek genutzt werden sollten. Sie stehen meist für alle gängigen Betriebssysteme wie z B. WINDOWS, UNIX und LINUX zur Verfügung und sind bei Einhaltung bestimmter Konventionen mehr oder weniger einfach zu nutzen. Die Anwendung von Verfahren aus Programmbibliotheken entbindet den Nutzer nicht, sich Gedanken über die zu erwartende Lösung seines Problems zu machen. Darin ist auch der Hinweis eingeschlossen, sich gegebenenfalls über Schwächen und Stärken sowie über die mathematischen Voraussetzungen des
974 19. Numerische Mathematik verwendeten mathematischen Verfahrens näher zu informieren 19.8.3.1 NAG-Bibliothek Die NAG-Bibliothek (Numerical Algorithms Group) ist eine umfangreiche Sammlung numerischer Verfahren in Form von Funktionen und Subroutinen/Prozeduren in den Programmiersprachen FORTRAN 77, FORTRAN 90 und C. Hier ein Inhaltsüberblick. 1. Komplexe Arithmetik 14. 2. Nullstellen von Polynomen 15. 3. Wurzeln transzendenter Gleichungen 16. 4. Reihen 17. 5. Integration 18. 6. Gewöhnliche Differentialgleichungen 19. 7. Partielle Differentialgleichungen 20. 8. Numerische Differentiation 21. 9. Integralgleichungen 22. 10. Interpolation 23. 11. Approxim v. Daten d Kurven und Flächen 24. 12. Minima/Maxima einer Funktion 25. 13. Matrixoperationen, Inversion 26. Eigenwerte und Eigenvektoren Determinanten Simultane lineare Gleichungen Orthogonalisierung Lineare Algebra Einfache Berechnng. von Statist Daten Korrelation und Regressionsanalyse Zufallszahlengeneratoren Nichtparametrische Statistik Zeitreihenanalyse Operationsforschung Spezielle Funktionen Mathem und Maschinenkonstanten Matrixoperationen, Inversion Darüber hinaus findet man in der NAG-Bibliothek eine umfangreiche Software zur Statistik und Finanzmathematik 19.8.3.2 IMSL-Bibliothek Die IMSL-Bibliothek (International Mathematical and Statistical Library) besteht aus drei aufeinander abgestimmten Teilen Allgemeine mathematische Verfahren, Statistische Probleme, Spezielle Funktionen Die Teilbibliotheken enthalten Funktionen und Subroutinen in der Sprache FORTRAN 77, FORTRAN 90 und C Hier eine Inhaltsübersicht: Allgemeine mathematische Verfahren Optimierung Vektor- und Matrixoperationen Ellipische Funktionen, Funktionen von Weierstrass und verwandte Funktionen Wahrscheinlichkeitsverteilungen Verschiedene Funktionen Stichprobenerhebung Lebensdauerverteilgn und Zuverlässigkt Mehrdimensionale Skalierung Schätzung der Dichte- und Hasard- bzw Risikofunktion Zeilendrucker-Graphik Wahrscheinlichkeitsverteilungen Zufallszahlen-Generatoren Hilfsalgorithmen Mathematische Hilfsmittel 1. 2. 3. 4. 5. 6. 7. >tat 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. Lineare Systeme Eigenwerte Interpolation und Approximation Integration und Differentiation Differentialgleichungen Transformationen Nichtlineare Gleichungen istische Probleme Grundlegende Kennzahlen Regression Korrelation Varianzanalyse Kategoriale und diskrete Datenanalyse Nichtparametrische Statistik Anpassungstests und Test auf Zufälligkeit Zeitreihenanalyse und Vorhersage Kovarianz- und Faktoranalyse Diskriminanz-Analyse Cluster-Analyse 8. 9. 10. 11. . 12. 12. 13. 14. 15. 16. 17. 18. 19. 20.
19.8 Nutzung von Computern 975 Spezielle Funktionen 1. 2. 3. 4. 5. Elementare Punktionen Trigonometrische und hyperbolische Punktionen Exponentialfunktion und verwandte Gamma-Funktionen und verwandte Fehler- Punktionen und verwandte 6. 7. 8. 9. 10. Bessel-Funktionen Kelvin-Funktionen Bessel-Funktionen gebrochener Ordnung Elliptische Integrale von Weierstrass und verwandte Funktionen Verschiedene Funktionen 19.8.3.3 Aachener Bibliothek Die Aachener Bibliothek basiert auf der Formelsammlung zur Numerischen Mathematik von G. Engeln-MÜllges (Fachhochschule Aachen) und F. Reutter (Rheinisch-Westfälische Technische Hochschule Aachen) Sie existiert in den Programmiersprachen BASIC, QUICKBASIC, FORTRAN 77, FORTRAN 90, C, MODULA 2 und TURBO PASCAL. Hier ein Inhaltsüberblick- 1. Numerische Verfahren zur Lösung nichtlinearer und speziell algebraischer Gleichungen 2. Direkte und iterative Verfahren zur Lösung linearer Gleichungssysteme 3. Systeme nichtlinearer Gleichungen 4. Eigenwerte und Eigenvektoren von Matrizen 5. Lineare und nichtlineare Approximation 6. Polynomiale und rationale Interpolation sowie Polynomsplines 7. Numerische Differentiation 8. Numerische Quadratur und Kubatur 9. Anfangswertprobleme bei gewöhnlichen Differentialgleichungen 10. Randwertprobleme bei gewöhnlichen Differentialgleichungen Die Programme der Aachener Bibliothek eignen sich besonders zum Studium von Einzelalgorithmen der Numerischen Mathematik. 19.8.4 Anwendung von Computeralgebrasystemen 19.8.4.1 Mathematica 1. Hilfsmittel zur Lösung numerischer Probleme Das Computeralgebrasystem Mathematica verfugt über einen mächtigen Apparat zur numerischen Lösung vielfältiger mathematischer Aufgaben. Die Vorgehensweise von Mathematica ist jedoch hierbei ganz anders als im Falle symbolischer Berechnungen. Mathematica ermittelt nach bestimmten, voreingestellten Prinzipien eine Werteliste der beteiligten Punktionen, ähnlich der für graphische Darstellungen, und bestimmt dann aus diesen Werten die jeweilige Lösung. Da die Anzahl der benutzten Punkte endlich sein muß, kann es bei „schlechten" Funktionen zu Problemen kommen Mathematica wird zwar auch hier versuchen, an problematischen Stellen mehr Stützpunkte zu wählen, aber schließlich muß es Annahmen über die Stetigkeit in bestimmten Bereichen machen. Hier kann die Ursache für Fehler im Resultat liegen Es ist in jedem Fall sinnvoll, so viel wie möglich qualitative Informationen über die beteiligten Objekte einzuholen und, wenn irgend möglich, symbolische Berechnungen, zumindest in Teilbereichen der Aufgabe, durchzuführen. In Tabelle 19.5 sind Operationen für die numerische Auswertung dargestellt Tabelle 19.5 Numerische Operationen NIntegrate NSum NProduct NSolve NDSolve berechnet bestimmte Integrale berechnet Summen Y%= i /(*) berechnet Produkte löst numerisch algebraische Gleichungen löst Differentialgleichungen numerisch Nach dem Starten von Mathematica wird das „Prompt" In[l] = angezeigt, das die Bereitschaft für die Eingabe angibt. Die Ausgabe des zugehörigen Ergebnisses kennzeichnet Mathematica mit Out[l] .
976 19. Numerische Mathematik Allgemein. Der Text wird in die ,mit In[n] := gekennzeichnet Zeilen eingegeben. Die Zeilen, die mit Out[n] versehen sind, gibt Mathematica als Antwort zurück Der in den Ausdrücken auftretende Pfeil —> bedeutet z B ersetze z durch den Wert a. 2. Kurvenanpassung und Interpolat ions verfahren 1. Kurvenanpassung Mit Hilfe der Methode der kleinsten Quadrate (s 6 2 5, S 417ff) und der Approximation im Mittel, Diskrete Aufgabe (s 19 6 2.2, S 948) kann Mathematica die Anpassung von ausgewählten Funktionen an einen Datensatz durchführen Die allgemeine Anweisung dafür lautet Fit [{yi, 2/2, • • •}, funkt, z] A9.289) Dabei bilden die yi die Liste der Daten, funkt ist die Liste der ausgewählten Funktionen, die die Anpassung bewerkstelligen sollen, und x steht für den zugehörigen Wertebereich der unabhängigen Variablen Wählt man funkt z.B. als Table[zAi, {z, 0, n}], so wird die Anpassung durch ein Polynom n teri Grades durchgeführt. II Es sei die folgende Liste von Daten gegeben. In[l] .= I = {1 70045,1 2523,0 638803,0.423479,0 249091,0 160321,0 0883432,0.0570776, 0 0302744,0.0212794} Mit der Eingabe In[2] = /l = Fit[J, {1, z, zA2, zA3, zA4} , x] wird angenommen, daß den Elementen von / die Werte 1,2, ,10 von x zugeordnet sind. Man erhält das folgende Approximationspolynom 4. Grades: Out [2] = 2 48918 - 0 853487z + 0.0998996z2 - 0 00371393z3 - 0.0000219224z4 Mit dem Aufruf In[3] •= Plot[ListPlot[Z, {z, 10}], /l, {z, 1,10}, Axes0ngin-> {0,0}] erhält man eine Darstellung der Daten und der Approximationskurve (Abb. 19.19a). 175t 1.5 125 1 0 75 05 0 25 a) 2 4 6 8 10 b) 2 4 6 8 10 Abbildung 19.19 Für die gegebenen Daten ist diese völlig ausreichend Sie ergeben sich aus den ersten vier Gliedern der Reihenentwicklung von e1_0 5x . 2. Interpolation Mathematica stellt spezielle Algorithmen für die Bestimmung von Interpolations- funktionen zur Verfügung. Diese werden als sogenannte InterpolatingFunction Objekte dargestellt, die ähnlich wie reine Funktionen aufgebaut sind Die Anweisungen enthält Tabelle 19.6 Anstelle der Funkt ions werte yi kann eine Liste aus Funktionswert und spezifizierten Ableitungen an der jeweiligen Stelle eingegeben werden ¦ Mit In[3] = Plot[lnterpolation[/][z], {z, 1,10}] erhält man Abb.19.19b. Man erkennt, daß Mathematica eine präzise Nachbildung der Datenliste liefert 1 5 125 1 0 75 05 0 25
19 8 Nutzung von Computern 977 Tabelle 19.6 Anweisungen zur Interpolation I Interpolation[{2/i,?/2, J] erstellt eine Näherungsfunktion mit den Werten ^ für die I jeweiligen Xi = i als ganze Zahlen | Interpolation[{{xi,yi}, {x2,j/2}, • •}] erstellt eine Näherungsfunktion für die Punktfolge (x^,?/i) | 3. Numerische Lösung von Polynomgleichungen Wie in 20 4 2.1, S. 1015 gezeigt wird, kann Mathematica die Nullstellen von Polynomen numerisch bestimmen. Dazu dient die Anweisung NSolve[p[x] == 0, x,n], wobei n die Genauigkeit vorgibt, mit der die Bestimmung erfolgen soll Läßt man n weg, so wird mit Maschinengenauigkeit gerechnet. Man erhält stets den vollständigen Satz der Lösungen, also m, wenn es sich um ein Polynom m-ten Grades handelt. ¦ In[l] = NSolve[xA6 + 3xA2 - 5 == 0] Out[l] = {x-> -1.07432}, {x-> -0.867262 - 1 152921}, {x-> -0 867262 + 1.152921}, {x-> 0 867262 - 1.152921}, {x-> 0.867262 + 1.152921}, {x-> 1.07432}} . 4. Numerische Integration Für die numerische Integration stellt Mathematica die Anweisung NIntegrate zur Verfugung. Anders als bei der symbolischen Methode wird bei dieser Anweisung mit einer Datenliste der zu integrierenden Funktion gearbeitet. Als Beispiele werden zwei uneigentliche Integrale (s 8 2 3, S 470) betrachtet. ¦ A: In[l] = NIntegrate[Exp[-xA2], {x, -Inf lnity, Inf lnity}] Out LH = 1 77245 . ¦ B: In[2] .= NIntegrate[l/a;A2, {x, -1,1}] Power:-infy. Infinite expression J encountered. NIntegrate*:inum: Integrand Complexlnfinity is not numerical at{x} = {0}. Mathematica erkennt im Beispiel B die Unstetigkeit an der Stelle x = 0 und gibt die entsprechende Warnung als Antwort. Das hängt damit zusammen, daß Mathematica eine Datenliste mit erhöhter Stützstellenzahl im problematischen Bereich anlegt und dabei den Pol erfaßt Dennoch kann die Antwort in manchen Fällen fehlerhaft sein Mathematica verwendet bei der numerischen Integration Voreinstellungen gewisser Optionen, die für spezielle Fälle nicht ausreichend sind So wird mit den Parametern MmRecursion und MaxRecursion die minimale bzw. die maximale Anzahl der Rekursionsschritte, mit denen Mathematica jeweils in problematischen Bereichen arbeitet, bestimmt. Die Voreinstellungen sind jeweils 0 und 6. Erhöht man diese, so wird Mathematica zwar langsamer arbeiten, jedoch auch bessere Resultate liefern ¦ In[3] :=NIntegrate[Exp[-xA2],{:r, -1000,1000}] Mathematica ist nicht in der Lage, die Spitze bei x = 0 zu erfassen, da der Integrationsbereich sehr groß ist, und antwortet NIntegrate .ploss. Numerical Integration stopping due to loss of precision Achieved neither the requested PrecisionGoal nor AccuracyGoal;suspect one of the following:highly oscillatory integrand or the true value of the integral is 0. 0ut[3] = 1.34946 10-26 Verlangt man jedoch Infy] := NIntegrate[Exp[-xA2], {x, -1000,1000},MinRecursion-> 3,MaxRecursion-> 10], so erhält man Out [4] = 1.77245 Das gleiche Resultat wie im letzten Beispiel erhält man mit der erweiterten Anweisung: NIntegrate[/wn, {#, xa, X\, #2, • • •, xe}]. A9.290)
978 19. Numerische Mathematik Hier können neben unterer und oberer Grenze des Integrals weitere Stellen des Integrationsweges X{ angegeben werden, die das problematische Stück einengen und so Mathematica zwingen, hier genauer zu evaluieren 5. Numerische Lösung von Differentialgleichungen Bei der numerischen Lösung von gewöhnlichen Differentialgleichungen oder auch von Systemen von Differentialgleichungen stellt Mathematica die Ergebnisse mittels eines InterpolatmgFunction Objektes dar. Die gestattet den Wert der numerischen Lösung an beliebigen Punkten im gegebenen Intervall zu bestimmen oder aber auch die Lösungskurve zu zeichnen Die gebräuchlichsten Anweisungen sind in Tabelle 19.7 dargestellt. Tabelle 19.7 Anweisungen zur numerischen Lösung von Differentialgleichungen I NDSolve[dg/,?/, {x,xa,xe}\ liefert eine numerische Lösung der Differential- I gleichung im Bereich zwischen xa und xe InterpolatingFunction[Zis£e][.T] gibt die Lösung im Punkt x Plot[Evaluate[y[x]/ lös]], {x,xa, xe}] zeichnet die Lösung ¦ Lösung der Differentialgleichungen für die Bewegung eines schweren Körpers in einem Medium mit Reibung. Im Zweidimensionalen lauten die Bewegungsgleichungen x = -i\]x2 + y2 -x, y = -g- l\Jx2 + y2 • y Die Reibung wird hier proportional zur Geschwindigkeit angenommen. Setzt man g = 10.7 = Ol, so kann mit den Anfangswerten x@) = y@) = 0 und x@) = 100, y@) = 200 folgende Eingabe zur Lösung der Bewegungsgleichungen vorgenommen werden In[l] .= dg = NDSolve[{x"[*] == -0.1Sqrt[o/[£]A2 + y'[t]A2] x'[t],y"[t] == -10 -0 lSqrt[x'[t]A2 + yf{t}A2] y'lt],x{0] == y[0] == 0,z'[0] == 100,^[0] == 200}, {*,2/},{*,15}] Mathematica antwortet mit der Aufstellung der zugehörigen Interpolationsfunktionen: Out LH = {{x-> InterpolatingFunction[{0., 15.}, <>], y—> InterpolatingFunction[{0., 15.}, <>]}} Man kann die Lösung mit In[2] = Pdir<MetricPlot[{x[t],y[t]}/.dg, {£,0,2},PlotRange-> All] als Parameterkurve darstellen (Abb.19.20a). NDSolve akzeptiert eine Reihe von Optionen, die die Genauigkeit der Resultate beeinflussen Mit AccuracyGoal kann die Genauigkeit für die Berechnung der numerischen Lösungen vorgegeben werden Entsprechendes gilt für PrecisionGoal. Bei der internen Abarbeitung richtet sich Mathematica jedoch nach der sogenannten WorkmgPrecision, diese sollte bei erhöhter Genauigkeit noch um weitere 5 Einheiten erhöht werden. Die Anzahl der Schritte, mit denen Mathematica den geforderten Bereich bearbeitet, ist auf 500 voreingestellt. Im allgemeinen wird Mathematica in der Nähe von problematischen Bereichen adaptiv die Zahl der Stützpunkte erhöhen. Dies kann in der Umgebung von Singularitäten jedoch zur Erschöpfung der Schrittreserven führen In solchen Fällen ist es möglich mit, MaxSteps größere Schrittzahlen vorzugeben Die Einstellung Inf inity für MaxSteps ist möglich ¦ Die Gleichungen für das FouCAULTsche Pendel lauten: x(t) + u2x(t) = 2ily(t), y(t) + u2y{t) = -2Qx{t). Mit üj = 1, Ü = 0,025 und den Anfangsbedingungen x(Ö) = 0, y@) = 10, x(Q) = y@) = 0 ergeben sich die zu lösenden Gleichungen- In[3] = dg3 = NDSolve[{x"[t] == -x[t] + 0 töy'[t],y"[t] == -y[t] - 0 05a/[t],
19.8 Nutzung von Computern 979 x[0] == 0, y[0] == 10, x'[0] == y'[0] == 0}. {x, y}, {t, 0,40}] Out [3] = {{x-> InterpolatingFunction[{0 ,40 }, <>], y-> InterpolatingFunction[{0 .40.}, <>]}} Mit In[4J := ParametricPlot[{x[«],y[t]}/.dflf3,{t,0,40},AspectRatio-> 1] erhält man Abb. 19.20b 30 t 25 Abbildung 19.20 19.8.4.2 Maple Das Computeralgebrasystem Maple ist in der Lage, eine Vielzahl von Aufgaben der numerischen Mathematik mit Hilfe eingebauter Näherungsverfahren zu lösen Dabei kann die Stellenzahl, mit der die Berechnung zu erfolgen hat, durch die Einstellung der globalen Variablen Digits zu einem beliebigen n vorgenommen werden. Es ist aber zu beachten, daß größere n als die Voreinstellung auf Kosten der Rechengeschwindigkeit gehen 1. Numerische Berechnung von Ausdrücken und Funktionen Nach dem Start von Maple wird das „Prompt" > angezeigt, das die Bereitschaft für die Eingabe angibt. Zusammenhängende Ein- und Ausgaben werden oft in einer Zeile dargestellt, eventuell getrennt durch den Pfeiloperator —> 1. Operator evalf Zahlenwerte von Ausdrücken, die ganz allgemein eingebaute und nutzerdefinier- te Funktionen enthalten und die zu einer reellen Zahl auswertbar sind, können mit Hilfe des Befehls evalf (ausdr, n) A9.291) bestimmt werden. Mit ausdr wird der numerisch auszuwertende Ausdruck bezeichnet; das optionale Argument n kann verwendet werden, um bei der jeweiligen Berechnung abweichend von der Einstellung Digits mit n-stelliger Gleitpunktarithmetik zu arbeiten. ¦ Anlegen einer Tabelle der Funktionswerte der Funktion y = f(x) = \/x + In x Zunächst wird die Funktion definiert, was mit dem Pfeiloperator erfolgen kann: > / .= z -> sqrtB)+ ln(z),—?/ = z -> y/x-\-\nx. Danach sind die benötigten Funktionswerte mit dem Aufruf evalf (/(x)),, wobei für x die numerischen Werte einzusetzen sind, zu bestimmen. Eine Tabelle von Funktionswerten in Schritten von 0, 2 zwischen 1 und 4 kann man mit > f or x f rom 1 by 0.2 to 4 do pnnt(/[a;] = evalf (/(z), 12)) od; erzeugen Hier wird z.B gefordert, mit zwölf Ziffern zu arbeiten. Maple gibt das Ergebnis in der Form einer einspaltigen Tabelle mit Eintragungen der Art /[32] = 2 95200519181 aus
980 19. Numerische Mathematik 2. Operator evalhf: Neben evalf existiert der Operator evalhf Er kann auf ähnliche Art wie evalf angewendet werden Sein Argument sind ebenfalls Funktionen, die zu einer reellen Zahl auswertbar sind. Hier wird jedoch von Maple die maschinenspezifische Gleitpunktzahlgenauigkeit genutzt, alle Rechnungen werden mit dieser durchgeführt und abschließend wird das Ergebnis in das Maple eigene Gleitpunktzahlsystem überführt Bei der Nutzung dieses Befehls kann ein beträchtlicher Zeitgewinn bei umfangreichen numerischen Rechnungen eintreten. Es ist jedoch zu beachten, daß die in 19.8.2, S. 968 beschriebenen Probleme zu beträchtlichen Fehlern führen können. 2. Numerische Lösung von Gleichungen Wie in Kapitel 20.1, Computeralgebrasysteme, S. 1027ff. erwähnt, kann Maple in vielen Fällen Gleichungen und Gleichungssysteme numerisch lösen. Das ist insbesondere dann von Bedeutung, wenn es sich um transzendente Gleichungen oder um algebraische Gleichungen handelt, die nur im Bereich der reellen Zahlen auflösbar sind Dafür wird der Befehl f solve eingesetzt. Er ist in der Syntax fsolve(gln,var, Option) , A9 292) zu verwenden. In der Regel wird der Befehl für allgemeine Gleichungen eine einzelne Wurzel bestimmen. Für Polynomgleichungen jedoch liefert er alle reellen Wurzeln In der folgenden Tabelle 19.8 sind die zur Verfügung stehenden Optionen angegeben. Tabelle 19.8 Optionen des Befehls f solve I complex bestimmt eine einzelne komplexe Wurzel (bzw. alle Wurzeln eines Polynoms) I maxsols = n bestimmt zumindest n Wurzeln (gilt nur für Polynomgleichungen) fulldigits verhindert die Verkleinerung der Genauigkeit unter die voreingestellte in Zwischenrechnungen Intervall sucht nach Lösungen im angegebenen Intervall ¦ A: Bestimmung aller Lösungen der Polynomgleichung x6 + 3x2 — 5 = 0. Mit > eq := zA6 + 3 * xA2 - 5 = 0 : erhält man > fSolvenz); —> -1.074323739, 1 074323739 Maple hat nur die beiden reellen Wurzeln bestimmt Mit der Option complex erhält man auch die komplexen Wurzeln. > fsolve(eg,:r, complex); - 1.074323739, -0.8672620244 - 1.1529220121, -0 8672620244 + 1 1529220121, 0.8672620244 - 1.1529220121,0 8672620244 + 1 1529220121,1 074323739 ¦ B: Bestimmung der beiden Lösungen der transzendenten Gleichung e~x — 4x2 = 0 Nach der Festlegung > eq •= exp(—xA3) — 4 * xA2 = 0 erhält man mit > fsolve(eg,aj),—»0.4740623572 die positive Lösung. Mit > fsolve{eq,x,x = -2..0);—> -0.5412548544 bestimmt Maple auch die zweite (negative) Wurzel. 3. Numerische Integration Die Berechnung bestimmter Integrale ist oft nur numerisch möglich. Das ist der Fall, wenn der Inte- grand sehr kompliziert aufgebaut ist bzw. wenn die Stammfunktion nicht durch elementare Funktionen ausdrückbar ist. In Maple wird dann der Befehl evalf dem Integrationsbefehl für die Berechnung des bestimmten Integrals vorangestellt- evalf(int(/(x), x = a .6), n). A9 293)
19 8 Nutzung von Computern 981 Darauf wird das Integral mit der geforderten Genauigkeit von Maple unter Zuhilfenahme von Näherungsverfahren bestimmt In der Regel funktioniert diese Methode f2 - ? ¦ Berechnung des bestimmten Integrals / e x dx Da die Stammfunktion nicht bekannt ist, wird zunächst > int(exp(-xA3),x =-2 2).—> f e^ dx angezeigt. Gibt man jedoch > evalf(int(exp(-a;A3),:r = -2 .2), 15); ein, so erhält man 277 745841695583 Maple hat unter Benutzung des eingebauten Näherungsverfahrens die numerische Integration auf 15 Ziffern genau vorgenommen. In gewissen Fällen versagt diese Methode, insbesondere wenn über große Intervalle zu integrieren ist Dann kann man versuchen, mit dem Bibliotheksaufruf readlib(vevalf/intv). eine andere Näherungsprozedur aufzurufen, die ein adaptives Newtonverfahren verwendet. ¦ Die Eingabe > evalf(int(exp(-.TA2),T =-1000 1000)); führt zu einer Fehlermeldung Mit > readlib(vevalf/intv) . > vevalf/intv (exp(-xA2),x = -1000 1000,10,_NCrule); 1.772453851 erhält man das richtige Resultat Hier ist das dritte Argument die Angabe der Genauigkeit und das letzte die interne Bezeichnung des NäherungsVerfahrens 4. Numerische Lösung von Differentialgleichungen In 20 4.4.1,4., S. 1026 wird die Lösung gewöhnlicher Differentialgleichungen mit Hilfe der Maple-Opera- tion dsolve behandelt. In den meisten Fällen ist es jedoch nicht möglich, die Lösung in geschlossener Form anzugeben In diesen Fällen kann man versuchen, die Gleichung numerisch zu lösen, wobei entsprechende Anfangsbedingungen gegeben sein müssen. Dafür wird der Befehl dsolve in der Form dsolve(dgln, var, numeric) A9 294) mit der Option numeric als drittes Argument verwendet. Hier enthält das Argument dgln neben der eigentlichen Differentialgleichung auch die Anfangsbedingungen. Das Resultat dieser Operation ist eine Prozedur, die, wenn man sie z B mit / bezeichnet, durch den Aufruf f(t) den Wert der Lösung für den Wert t der unabhängigen Variablen berechnet Maple benutzt für diesen Prozeß das Runge-Kutta-Verfahren (s. 19.4.1.2, S 931) Die voreingestellte Genauigkeit für den relativen und den absoluten Fehler beträgt io_Dlglts+3 . Mit den globalen Symbolen _RELERR und _ABSERR kann der Nutzer diese Einstellungen ändern Treten bei der Berechnung Probleme auf, dann zeigt Maple dies durch verschiedenartige Meldungen an. ¦ Die Behandlung des Beispiels zum Runge-Kutta-Verfahren in 19.4.1 2, S 932 mit Maple liefert > r -=dsolve({diffB/(a;).a;) = A/4) * (xA2 + y{x)A2),y@) = 0},y{x),numeric); r = proc vdsolve/numeric/result2N (x, 1592392, [1]) end Mit > r@ 5);—>{xE)= 5000000000, y(x){ 5) = 01041860472} kann z B der Wert der Lösung im Punkt x — 0 5 bestimmt werden.
982 20. Computeralgebrasysteme 20 Computeralgebrasysteme 20.1 Einführung 20.1.1 Kurzcharakteristik von Computeralgebrasystemen 1. Allgemeine Zielstellungen für Computeralgebrasysteme In der mathematischen Praxis werden heute oft sogenannte Computeralgebrasysteme - Softwaresysteme, die „Mathematik machen können"-eingesetzt Solche Systeme wie Macsyma, Reduce, MuPad, Maple, Mathematica gestatten auch auf Einzelplatzrechnern (PC) die Lösung mathematischer Aufgaben wie z.B. die Umformung komplizierter Ausdrücke, die Bestimmung von Ableitungen und Integralen, die Lösung von Gleichungen und Gleichungssystemen, die graphische Darstellung von Funktionen einer und mehrerer Veränderlicher und vieles andere mehr Mit ihrer Hilfe können mathematische Ausdrücke manipuliert, d h., nach mathematischen Regeln umgeformt oder vereinfacht werden, sofern dies in geschlossener Form möglich ist Auch numerische Lösungen können mit der geforderten Genauigkeit berechnet und funktionale Zusammenhänge graphisch dargestellt werden Die meisten Computeralgebrasysteme können mit externen Dateisystemen und Dateien kommunizieren, d.h Daten ex- und importieren Neben einem Grundvorrat an Definitionen und Befehlen, der bei jedem Start des Systems geladen wird, bieten die meisten Systeme umfangreiche Bibliotheken mit Zusatzpaketen spezieller mathematischer Gebiete an, die nach Bedarf zugeladen werden können (s [20 4]) Computeralgebrasyteme ermöglichen Programmierungen zum Aufbau eigener Programmpakete Oft ermöglichen sie die Kommunikation mit anderen Programmiersprachen (z.B C oder Java) Die Möglichkeiten von Computeralgebrasytemen sollten jedoch nicht überschätzt werden Wenn für ein Integral kein geschlossener Ausdruck existiert, dann kann auch mit Hilfe eines Computeralgebrasytems keiner gefunden werden, allenfalls gelingt die Reduktion auf spezielle nicht-elementare Integrale. Bezüglich der auftretender Fehler s 19.8 2, S. 968. 2. Beschränkung auf Mathematica und Maple Die zur Zeit bekannten Systeme unterliegen der Weiterentwicklung Insofern kann jede konkrete Darstellung nur den aktuellen Stand reflektieren. Im folgenden soll eine Einführung in die grundlegende Struktur solcher Systeme und ihre Anwendung in wichtigen mathematischen Bereichen gegeben werden. Damit diese Einfuhrung gleichzeitig als Anleitung für erste praktische Schritte bei der Arbeit mit Computeralgebrasystemen dienen kann, werden die Darlegungen konkret auf die beiden Systeme Mathematica, Version 4.1 und Maple 8 beschränkt Diese Auswahl ist willkürlich, jedoch scheinen diese beiden Systeme gegenwärtig die größte Verbreitung gefunden zu haben. 3. Ein- und Ausgabe bei Mathematica und Maple In dieser Darstellung wird die konkrete Einbindung des jeweiligen Computeralgebrasystems in das Betriebssystem des Computers nicht behandelt Es wird davon ausgegangen, daß das Computeralgebrasystem über ein Kommando aus dem Betriebssystem heraus gestartet wird und auf einer graphischen Oberoberfläche (GUI) und/oder einer Kommandozeile ansprechbar ist. Die Darstellung von Ein- und Ausgaben erfolgt für Mathematica (s 19.8 4 1, S 975 und Maple (s. 19.8 4 2, 1., S 979 in jeweils abgesetzten Zeilen, um sie deutlich von anderen Textpassagen abzuheben, etwa in der Form In[l] •= Solve[3 x — 5 == 0,x] in Mathematica, (ww > solveC*x-5 = 0,x) in Maple. ^ U ^ Systemspezifische Symbole (Befehle, Typbezeichnungen und ähnliches) werden durch Darstellung in Schreibmaschinenschrift hervorgehoben. Aus Gründen der Platzersparnis werden zusammenhängende Ein- und Ausgaben oft durch Zusammenziehen in eine Zeile (evtl. durch das Zeichen —> getrennt) dargestellt.
20 1 Einführung 983 20.1.2 Einführende Beispiele für die Hauptanwendungsgebiete 20.1.2.1 Formelmanipulation Unter Formelmanipulaüon wird hier im weitesten Sinn die Umformung mathematischer Ausdrücke zwecks ihrer Vereinfachung oder ihrer Darstellung in einer für weitere Manipulationen zweckmäßigen Form, die Lösung von Gleichungen und Gleichungssystemen durch algebraische Ausdrücke, die Differentiation von Funktionen, die Berechnung unbestimmter Integrale, die Lösung von Differentialgleichungen, die Bildung unendlicher Reihen usw. verstanden. ¦ Lösung der folgenden quadratischen Gleichung- x2 + ax + b = 0 mit a, b G R B0 2a) In Mathematica wird eingegeben (man beachte das Leerzeichen zwischen a und x): Solve[xA2 + a x + b == 0, x]. B0.2b) Nach Betätigen des entsprechenden Eingabeabschlußbefehls (EINF oder SHIFT+ENTER) ersetzt Mathematica diese Zeile durch In[l] .= Solve[.xA2 + a x + b==0,x] B0.2c) und beginnt mit der Abarbeitung. Nach kurzer Zeit erscheint eine neue Zeile mit dem Inhalt -a + Sqrt[a2 - 46L r -a - Sqrt[a2 - 461,, Out[l] = {{x-> ^ i},{^-> V 4}. B0 2d) Mathematica hat die Gleichung gelöst und die beiden Wurzeln in Form einer Liste aus zwei Unterlisten, die jeweils eine Lösung enthalten, dargestellt. Dabei ist Sqrt das Symbol für die Quadratwurzel In Maple erfolgt die Eingabe in folgender Form > solve({:rA2 + a * x + b = 0}, {x}), B0 3a) Wichtig ist hier das Semikolon nach dem letzten Symbol Nach der Eingabebestätigung mit ENTER bearbeitet Maple die Eingabe und liefert in der nächsten Zeile {l/2(-a + (a2 - 46I/2)} , {l/2(-a - (a2 - 46I/2)} B0.3b) Das Ergebnis ist in Form einer Folge von zwei Ausdrücken, den beiden Lösungen, dargestellt. Abgesehen von den speziellen Zeichen für das jeweilige Computeralgebrasystem, besteht vom grundsätzlichen Aufbau her große Ähnlichkeit. Am Anfang steht ein Symbol, das vom System als Operator verstanden wird, der auf einen in Klammern stehenden Operanden anzuwenden ist. Das Ergebnis wird als Liste oder Folge der Lösungen wiedergegeben Ahnlich werden viele Operationen der Formelmanipulation dargestellt. 20.1.2.2 Numerische Berechnungen Computeralgebrasysteme besitzen umfangreiche Prozeduren zur Behandlung von Aufgaben der numerischen Mathematik Das betrifft sowohl die Lösung algebraischer Gleichungen, linearer Gleichungssysteme, die Lösung transzendeter Gleichungen, aber auch die Berechnung bestimmter Integrale, die numerische Lösung von Differentialgleichungen, Interpolationsprobleme und vieles andere mehr ¦ Gesucht Lösungen der Gleichung x6 - 2x5 - 30x4 + 36x3 + 190:r2 - 36x - 150 = 0. B0.4a) Diese Gleichung 6 Grades ist geschlossen nicht lösbar; sie besitzt jedoch 6 reelle Lösungen, die numerisch zu finden sind In Mathematica wird eingegeben: In[2] = NSolve[xA6 - 2xA5 - 30xA4 + 36xA3 + 190xA2 - 36x - 150 == 0, x] B0.4b) Als Antwort erhält man: Out [2] = {{x-> -4 42228} , {x-> -2.14285} , {x-> -0 937397} , {x-> 0 972291} , {x-> 3.35802} , {x-> 5 17217}} B0 4c)
984 20. Computeralgebrasysteme Das ist eine Liste mit den 6 Lösungen mit einer bestimmten Genauigkeit, die später erläutert wird Die Eingabe in Maple lautet: > f solve{(xA6 - 2 * xA5 - 30 * xA4 + 36 * xA3 +190 * xA2 - 36 * x - 150 = 0}, {x}); B0.4d) Hier darf in der Eingabe „= 0" fehlen, und die zusätzliche Angabe „{x}" wäre wegen der Eindeutigkeit auch nicht nötig Maple setzt den eingegebenen Ausdruck automatisch gleich Null. Als Ausgabe erhält man die Folge der 6 Lösungen. Die Benutzung des Befehls f solve teilt Maple mit, daß Fließkommazahlen als Ergebnis erwartet werden. 20.1.2.3 Graphische Darstellungen Die meisten Computeralgebrasysteme gestatten die graphische Darstellung der eingebauten wie auch der selbstdefinierten Funktionen In der Regel betrifft dies die Darstellung von Funktionen einer Veränderlichen in kartesischen und Polarkoordinaten, die Parameterdarstellung und die Darstellung impliziter Funktionen Funktionen von zwei Variablen lassen sich als räumliche Flächen darstellen, auch hier sind Parameterdarstellungen möglich Es können Kurven im dreidimensionalen Raum erzeugt werden. Darüber hinaus gibt es in den unterschiedlichen Systemen weitere graphische Darstellungsmöglichkeiten von funktionalen Zusammenhängen, z.B'. in Form von Diagrammen. Alle Systeme verfugen über ein reichhaltiges Angebot von Darstellungsoptionen, die von Linienform und -dicke über den Einbau zusätzlicher Graphikelemente wie z.B. von Vektoren bis zu Beschriftung und Farbgestaltung reichen In der Regel lassen sich erzeugte Graphiken als Dateien in gängigen Formaten wie eps, gif, jpeg, bmp und andere exportieren und damit in andere Programme einbinden bzw direkt auf Drucker und Plotter ausgeben 20.1.2.4 Programmierung in Computeralgebrasystemen Alle Systeme bieten Möglichkeiten für den Aufbau eigener Programmblöcke zur Lösung spezieller Aufgaben. Es handelt sich dabei einerseits um die bekannten Handwerkszeuge für den Aufbau von Prozeduren wie Schleifenkonstruktionen und Kontrollstrukturen, z B DO, IF - THEN, WHILE, FOR usw , andererseits um mehr oder weniger ausgeprägte Methoden der funktionalen Programmierung, die für viele Probleme elegante Lösungen anbieten Selbsterstellte Programmblöcke können den bestehenden Bibliotheken hinzugefügt und bei Bedarf jederzeit zugeladen werden. 20.1.3 Aufbau von und Umgang mit Computeralgebrasystemen 20.1.3.1 Hauptstrukturelemente 1. Objekttypen Computeralgebrasysteme arbeiten mit einer Vielzahl von Objekttypen Objekte sind die dem jeweiligen System bekannten Zahlen, Variablen, Operatoren, Funktionen usw , die mit dem Start des Systems latent geladen sind und aufgerufen bzw. vom Nutzer entsprechend der Syntax definiert werden können. Klassen von Objekten wie etwa Zahlenarten oder Listen usw. nennt man Typen Die meisten Objekte werden durch ihren Namen identifiziert, den man sich zur Objektklasse Symbol zugehörig denken kann und der bestimmten grammatikalischen Regeln genügen muß Der Nutzer gibt in die Eingabezeile eine Folge von Objekten, d.h. deren Namen, entsprechend der vorgeschriebenen Syntax ein, schließt die Eingabe mit einem dafür vorgesehenen Sonderzeichen und/oder einem speziellen Systemkommando ab, worauf das System mit der Abarbeitung beginnt und in weiteren Zeilen das Ergebnis darstellt (Eingaben können sich über mehrere Zeilen erstrecken) Die nachfolgend beschriebenen Objekte bzw. Objekt typen und -klassen stehen in der Regel in allen Computeralgebrasystemen zur Verfügung, wobei auf Besonderheiten bei der Besprechung der einzelnen Systeme eingegangen wird 2. Zahlen Die Computeralgebrasysteme kennen in der Regel die Zahlentypen ganze Zahlen, rationale Zahlen,
20.1 Einführung 985 reelle Zahlen (Gleitpunktzahlen), komplexe Zahlen, manche Systeme algebraische Zahlen, Wurzelzahlen und weitere Mit einer Vielzahl von Typprüfoperationen können Eigenschaften konkretei Zahlen, wie nichtnegativ, Primzahl usw . festgestellt werden. Gleitpunktzahlen können mit beliebiger Präzision genutzt werden In der Regel arbeiten die Systeme mit einer Voreinstellung für die Präzision, die nach Bedarf verändert werden kann. Die Systeme kennen spezielle Zahlen, die für die Mathematik von fundamentaler Bedeutung sind wie e, 7T und oo Sie gehen mit diesen Zahlen symbolisch um, können sie jedoch für numerische Berechnungen auch in beliebiger Präzision verwenden 3. Variable und Zuweisungsoperatoren Variable haben einen Namen, weiden in der Regel also durch ein vorn Nutzer bestimmtes Symbol repräsentiert Vom System vergebene Namen, d h reservierte Begriffe, sind dabei verboten Solange der Variablen kein Wert zugewiesen ist, steht das jeweilige Symbol für die Variable selbst Variablen können mit Hilfe spezieller Zuweisungsoperatoren Werte zugewiesen werden Werte von Variablen dürfen sowohl Zahlen, andere Variable als auch spezielle Sequenzen von Objekten, oft Ausdrücke genannt, sein. In der Regel existieren mehrere Zuweisungsoperatoren, die sich insbesondere durch den Zeitpunkt ihrer Auswertung, d h sofort bei Eingabe der Zuweisung oder erst beim späteren Aufruf der Variablen, unterscheiden 4. Operatoren Alle Systeme verfügen über einen Grundvorrat von Operatoren Dazu gehören die für die Mathematik üblichen Operatoren+, —, *, /, A (oder **), >, <, =, für die die bekannte Rangordnung bei der Abarbeitung gilt Stehen die Operatoren zwischen den Operanden, so bezeichnet man diese Schreibweise als Infix-Form. Die Palette der Operatoren, die in Präfix-Form vorliegen — in diesem Falle steht der Operator vor den Operanden ist in allen Systemen beträchtlich Hierzu gehören in der Regel Operatoren, die auf spezielle Objektklassen wie z.B. Zahlen, Polynome, Mengen, Listen, Matrizen, Gleichungssysteme wirken und auch Funktionalopcratoren wie Differentiation, Integration usw Darübci hinaus sind in der Regel Operatoren für die Gestaltung der Ausgaberesultate, die Manipulation von Zeichenketten und weiteren dem System bekannten Objekten vorhanden Manche Systeme gestatten die Darstellung einiger Operatoren in Suffix-Schreibweise, d h , der Operator steht hinter den Operanden Häufig benutzen Operatoren optionale Argumente, die spezielle Anwendungssituationen steuern 5. Terme und Funktionen Unter dem Begriff Term wird eine Anordnung von Objekten verstanden, die durch mathematische Operatoren, in der Regel in der Infix Form, verknüpft sind, also Basiselemente, die in der Mathematik ständig auftreten Ein Grundanliegen von Computeralgebrasystemen ist die Umformung von Termen sowie die Lösung von Gleichungen ¦ Die folgende Sequenz xAA - 5 * .rA3 + 2 * xA2 - 8 B0 5) ist z B ein Term, in welchem x eine Variable ist Computeralgebrasysteme kennen die üblichen elementaren Funktionen wie Exponentialfunktion, Logarithmusfunktion, trigonometrische Funktionen und deren Umkehrfunktionen sowie eine Reihe spezieller Funktionen. Diese Funktionen lassen sich anstelle von Variablen in Terme einbauen Auf diese Weise werden neue, komplizierte Terme oder Funktionen erzeugt 6. Listen und Mengen Alle Computeralgebrasysteme kennen die Objektklasse Liste, die als Aneinanderreihung von Objekten verstanden wird Mit speziellen Operatoren kann auf die Elemente einer Liste zugegriffen werden In der Regel sind Listen als Elemente von Listen zulässig. So entstehen verschachtelte Listen, die zur Konstruktion spezieller Objekttypen wie Matrizen und Tensoren benutzt werden können; alle Systeme bie-
986 20. Computeralgebrasysteme ten hierfür spezielle Objektklassen an. Hieraus ergibt sich die Möglichkeit, symbolisch in Vektorräumen Objekte wie Vektoren und Tensoren zu manipulieren und lineare Algebra zu betreiben Auch der Begriff Menge ist den Computeralgebrasystemen bekannt Die Operatoren der Mengenlehre sind definiert. In den folgenden Abschnitten werden die Hauptstrukturelemente und ihre Syntax für die beiden ausgewählten Computeralgebrasysteme Mathematica 4 1 und Maple 8 erläutert. 20.2 Mathematica Mathematica ist ein Computeralgebrasystem, das von der Firma Wolfram-Research, Ine entwickelt wurde. Eine umfassende Darstellung der Version Mathematica 4 1 findet man in [20.7, 20.11] . 20.2.1 Haupstrukturelemente Im System Mathematica werden die Hauptstrukturelemente einheitlich Ausdrücke genannt Ihre Syntax lautet (es sei nochmals betont, daß die jeweiligen Objekte durch ihr zugehöriges Symbol, also ihren Namen, anzugeben sind): obj0[obj1,obj2,... ,objn] B0.6) Man bezeichnet obj0 als Head (Kopf) des Audruckes; ihm ist der Index 0 zugeordnet Die Teile obj • (i = 1,.. , n) sind die Elemente des Ausdrucks und unter ihren Indices 1,..., n aufrufbar In vielen Fällen ist der Head des Ausdrucks ein Operator oder eine Funktion, die Elemente sind die Operanden oder die Variablen, auf die der Head wirkt. Sowohl Head als auch Elemente eines Ausdrucks können wieder Ausdrücke sein Eckige Klammern sind in Mathematica für die Darstellung von Ausdrücken reserviert, sie dürfen nur in diesem Zusammenhang verwendet werden. ¦ Der Term xA2 + 2 * x + 1, der in Mathematica auch in dieser Infix-Form eingegeben werden darf, hat die vollständige Form (FullForm) Plus[l, Times[2, x], Power [z, 2]] ist also ebenfalls ein Ausdruck Mit Plus, Power und Times werden die die entsprechenden arithmetischen Operatoren bezeichnet. Man erkennt an dem Beispiel, daß alle einfachen mathematischen Operatoren in der Präfix-Form existieren und daß die Schreibweise als Term in Mathematica nur eine Vereinfachung ist. Teile von Ausdrücken können extrahiert werden. Das erfolgt mit der Konstruktion Part[ausdr, i], wobei i die Nummer des entsprechenden Elements ist Insbesondere wird mit i = 0 der Head des Ausdrucks wiedergegeben. ¦ Gibt man in Mathematica In[l] .= £A2 + 2*x + l ein, wobei das Zeichen * auch weggelassen werden kann, und betätigt die Taste EINF, so antwortet Mathematica mit Out[l] = l-\-2x-\-x2 Mathematica hat die Eingabe zur Kenntnis genommen und sie in der mathematischen Standardform wiedergegeben Hätte man die Eingabe mit einem Semikolon abgeschlossen, so wäre die Ausgabe unterdrückt worden. Gibt man In[2] •= FullForm[%] ein, so lautet die Antwort 0ut2 = Plus[l, Times[2, x], Power[z, 2]] Das Zeichen % in der eckigen Klammer teilt Mathematica mit, daß die letzte Ausgabe als Argument für die neue Eingabe zu verwenden ist Aus diesem Ausdruck kann man mit
20 2 Mathematica 987 In[3] •= Part[%, 3] z B Out [3] = Power[x, 2] das dritte Element herausziehen, das in diesem Fall wiederum ein Ausdruck ist. Symbole sind in Mathematica die Bezeichner der Grundobjekte; sie können beliebige Folgen von Buchstaben und Zahlen sein und dürfen nicht mit einer Zahl beginnen. Das Sonderzeichen $ ist zulässig Es wird zwischen Groß- und Kleinbuchstaben unterschieden. Systemimmanente Symbole beginnen mit einem Großbuchstaben, bei zusammengesetzten Worten beginnt auch der zweite Teil mit einem Großbuchstaben. Der Nutzer sollte deshalb zur Unterscheidung seine selbstdefinierten Symbole nur mit Kleinbuchstaben schreiben. 20.2.2 Zahlenarten in Mathematica 20.2.2.1 Grundtypen von Zahlen in Mathematica Mathematica kennt vier Arten von Zahlen, die in Tabelle 20.1 dargestellt sind. Tabelle 20 1 Zahlenarten in Mathematica Zahlenart Ganze Zahlen Rationale Zahlen Reelle Zahlen Komplexe Zahlen Kopf Integer Rational Real Complex Charakteristik exakte ganze Zahl beliebiger Länge teilerfremder Bruch der Form Integer/Integer Gleitpunktzahl beliebiger spezifierter Präzision komplexe Zahl der Form zahl + zahl *I Eingabe nnnnn pppp/qqqq nnnn.mmmm Reelle Zahlen, d h Gleitpunktzahlen, dürfen beliebige Länge haben Wird eine ganze Zahl nnn in der Form nnn geschrieben, so faßt Mathematica sie als Gleitpunktzahl, also vom Typ Real, auf Mit Head[x] kann man den Typ einer Zahl x feststellen. So liefert In[l] = Head[51] Out[l] = Integer, während In[2] •= Head[51 ] Out [2] = Real ergibt. Die reellen und imaginären Komponenten einer komplexen Zahl können beliebigen Zahlentypen angehören Eine Zahl wie 5.731 + 0 I wird Mathematica dem Typ Real zuordnen, während 5 731+0 / vom Typ Complex ist, da 0 als Gleitpunktzahl mit dem genäherten Wert 0 aufgefaßt wird. Es gibt einige weitere Operationen, um Auskünfte über Zahlen zu erhalten So liefert In[3] = NumberQfa:] Out [3] •= True, wenn x eine Zahl ist B0.7a) Anderenfalls ergibt sich Out [3] = False Hier sind True und False die Symbole für die BoOLEschen Werte „Wahr" und „Falsch". IntegerQ[a:] testet, ob x eine ganze Zahl ist, weshalb InUJ =IntegerQ[2] Outty = False B0 7b) ergibt Ahnliche Tests für Zahlen sind mit den Operatoren EvenQ, OddQ und PrimeQ durchführbar. Ihr Sinn ist selbsterklärend. So ergibt In[5] = PrimeQ[1075643] Out [5] = True, B0.7c) während In[6] = PrimeQ[1075641] Out [6] = False B0 7d) liefert. Die zuletzt genannten Tests gehören zu einer ganzen Gruppe von Testoperatoren, die alle mit Q enden und jeweils mit True oder False im Sinne eines logischen Tests antworten (u.a Typprüfung) 20.2.2.2 Spezielle Zahlen In Mathematica sind einige spezielle Zahlen enthalten, die häufig benötigt werden und mit beliebiger 7T Genauigkeit aufgerufen werden können. Dazu gehören n mit dem Symbol Pi, e mit dem Symbol E, —— als Umrechnungsfaktoi von Gradmaß in Bogenmaß mit dem Symbol Degree, Inf lnity als Symbol für oo sowie die schon benutzte imaginäre Einheit I
988 20. Computeralgebrasysteme 20.2.2.3 Darstellung und Konvertierung von Zahlen Zahlen sind in verschiedenen Formen darstellbar, die sich ineinander konvertieren lassen. So läßt sich jede reelle Zahl x mit N[x, n] in eine Gleitpunktzahl mit n-stelliger Präzision konvertieren IN[7] = N[£, 20] liefert Out [7] = 2 7182818284590452354 B0 8a) Mit Rationalize[x, dx] kann die Zahl x mit der Genauigkeit dx in eine rationale Zahl gewandelt werden So ergibt In[8] = Rationalize[%, 10A - 5] 0ut[8] = —— B0.8b) 536 Mit der Genauigkeit 0 übermittelt Mathematica die bestmögliche Näherung der Zahl x durch eine rationale Zahl. Zahlen verschiedener Zahlensysteme können ineinander konvertiert werden. Mit BaseFormjir, b] wird die Zahl x im Dezimalsystem in die entsprechende Zahl im System mit der Basis b umgewandelt. Ist b > 10, so werden für die Darstellung der weiteren Ziffern wie üblich die fortlaufenden Buchstaben a, 6, c,... benutzt. ¦ A: So wird z B In[15] •= BaseForm[255, 16] zu Out [15] = //BaseForm = ff16 B0 9a) oder In[16] := BaseForm[N[£, 10], 8] Out [16] = //BaseForm = 2 5576052138 B0 9b) Die Konversion einer Zahl zur Basis b ins Dezimalsystem wird mit bAAmmmm durchgeführt ¦ B: In diesem Sinne liefert In[17] .= 8 AA735 Out [17] = 477 B0.9c) Die Darstellung der Zahlen erfolgt mit der jeweiligen Präzision (voreingestellt hierfür ist die Maschinenpräzision) und bei großen Zahlen in der sogenannten wissenschaftlichen Schreibweise, d.h. in der Form nnnn mmmm 10A ± qq . 20.2.3 Wichtige Operatoren Viele Grundoperatoren dürfen in der vereinfachten Schreibweise mit der in der Mathematik üblichen Infix-Form < symbi op symb2 > benutzt werden. Jedoch ist in jedem Fall diese nur ein vereinfachendes Synonym für die vollständige Schreibweise als Ausdruck Eine Reihe häufig vorkommender Operatoren und ihre vollständige Form enthält die Tabelle 20.2 Tabelle 20.2 Wichtige Operatoren in Mathematica a + b a b oder a * b aAb a/b u—> v r = s Plus[o, b] Times Power Times o, b] a, 6] a, Power[6, Rule[w, v] Set[r, s] -i]] u == v Equal[ti, v] w\ = v Unequal[w, v] r > t Greaterjr, t] r >= t GreaterEqual[r, t] s < t Less[s, t] s <= t LessEqual[s, t] Die meisten Bezeichnungen in Tabelle 20.2 sind selbsterklärend. Bei der Multiplikation in der Form a b ist unbedingt auf das Leerzeichen zwischen den Faktoren zu achten. Es sei auf die Ausdrücke mit den Heads Rule und Set hingewiesen Set weist dem Ausdruck r auf der linken Seite, z.B. einer Variablen, den Wert des Ausdrucks s auf der rechten Seite, z B eine Zahl, zu. Von hier an wird r bis zum Zeitpunkt der Aufhebung dieser Zuordnung durch den zugewiesenen Wert dargestellt Die Aufhebung erfolgt entweder durch die Zuweisung eines neuen Wertes oder durch x = . bzw. Clear[x], d h durch Löschen aller bisherigen Zuweisungen Die Konstruktion Rule dagegen ist als Transformationsregel aufzufassen. Sie tritt oft im Zusammenhang mit dem Ersetzungsoperator / auf.
20 2 Mathematica 989 Replace[£, u —> v] oder tj. u—> v bedeutet, daß alle im Ausdruck t enthaltenen Elemente u durch den Ausdruck v zu ersetzen sind. ¦ In[5] -=x + y2 /. y-> a + b 0ut[5] = x + (a + bJ Für beide Operatoren ist typisch, daß sofort nach Aufstellung der Zuweisung oder der Transformationsregel die rechte Seite ausgewertet wird. Damit werden die linken Seiten bei jedem nachfolgenden Aufruf durch die festgelegten rechten Seiten ersetzt. Daneben gibt es zwei weitere Operatoren, die verzögert wirken: u = v FullForm = SetDelayed[w, v] B0.10a) u>v FullForm = RuleDelayed[w, v] B0.10b) Auch hier gilt bis zur Aufhebung der Zuweisung bzw. der Transformationsregel, daß für die linke Seite immer die rechte eingesetzt wird, jedoch erfolgt die Auswertung der rechten Seite erst zum Zeitpunkt des Aufrufes der linken Der Ausdruck u—=v oder Equal[u, v] bedeutet, daß u und v identisch sind Equal wird z.B. benutzt, um Gleichungen zu manipulieren. 20.2.4 Listen 20.2.4.1 Begriff und Bedeutung Listen sind in Mathematica wichtige Instrumente für die Manipulation ganzer Gruppen von Größen, die vor allem in der höherdimensionalen Algebra und Analysis von großem Wert sind. Da auch allgemein Ausdrücke vielfach Ähnlichkeiten mit Listen besitzen, wird der Umgang mit Listen zu einem Musterbeispiel für Manipulationen auf bestimmten Klassen von Ausdrücken. Unter einer Liste versteht man die Zusammenfassung mehrerer Objekte zu einem neuen Objekt, der Liste, wobei in der Liste zunächst alle Objekte gleichwertig sind und sich nur durch ihren Standort in der Liste voneinander unterscheiden. Die Aufstellung einer Liste erfolgt mit der Angabe List[al, a2, a3, ] = {al, a2, a3, } B0 11) Zur Erläuterung der Arbeit mit Listen wird eine konkrete Liste benutzt, die mit 11 bezeichnet wird* In[l] .= 11 = List[al, a2, a3, a4, aö, a6] Out Li] = {al, a2, a3, a4, ab, a6} B0.12) Mathematica benutzt bei der Wiedergabe der Liste die Kurzform: Einschluß in geschweifte Klammern In Tabelle 20.3 sind Befehle dargestellt, die auf Elemente bzw. mehrere Elemente zugreifen und dann eine „Unterliste" ausgeben Tabelle 20.3 Befehle für die Auswahl von Listenelementen Firstf/1 Last Part Part i] /, n] oder l[[n\] l {nl, n2, .. }] J[[{nl, n2, }]] Take Take Drop Drop /, m] /, {m, n}\ l, n] l, {m, n}] wählt das erste Element aus wählt das letzte Element aus wählt das n-te Element aus erstellt eine Liste aus den Elementen mit den angegebenen Nummern äquivalent zur vorherigen Operation ergibt die Liste der ersten m Elemente von / ergibt die Liste der Elemente von m bis n ergibt die Liste ohne die ersten n Elemente ergibt die Liste ohne Elemente von m bis n ¦ Für die Liste 11 in B0 11) gilt z.B. InL2] := First[/1] 0utL2] = al In[3] = Ü[[3]] OutL3] = a3 In[4] ¦= ü[[{2, 4, 6}]] OutL4J = {a2, a4, a6} InL5] = Take[ü, 2] Out[5] = {al, a2}
990 20 Computeralgebrasysteme 20.2.4.2 Verschachtelte Listen Die Elemente von Listen können wiederum Listen sein, so daß verschachtelte Listen entstehen Setzt man z.B In[6] =al= {611, 612, 613, 614, 615} In[7] =a2= {621, 622, 623, 624, 625} In[8] •= a3 = {631, 632, 633, 634, 635} und analog für aA , ab und a6 , so entsteht eine verschachtelte Liste, die hier wegen ihres Umfangcs nicht explizit dargestellt werden soll. Mit Part[/, i, j] greift man auf das j-te Element der z-ten Unterliste zu Das gleiche Resultat erhält man mit l[[i, j}}. Im betrachteten Beispiel (in 20.2 4 1, S 989) wird In[12] = /1[[3, 4]] Out[12] = 634 Des weiteren liefert Part[/, {il, 12 }, {jl, j2 }] oder Z[[{ü, i2, .}, {jl, j2, }]] eine Liste, die aus den mit il, i2, .. numerierten Listen besteht, welche jeweils die mit jl, j2 numerierten Elemente enthalten ¦ Für das oben betrachtete Beispiel (in 20 2 4 1, S 989) etwa In[13] = /1[[{3, 5}, {2, 3, 4}]] Out[13] = {{632, 633, 634}, {652, 653, 654}} Aus diesen Darlegungen ist das Prinzip der Verschachtelung von Listen erkennbar. Es macht keine Mühe, Listen mit der Verschachtelungsstufe 3 und höher zu entwerfen und auf diese mit entsprechenden Auswahloperationen zu wirken. Die Möglichkeit der Verschachtelung von Listen öffnet den (symbolischen) Zugang zu einer Reihe von Spezialgebieten der Mathematik So lassen sich Vektoren und Matrizen erzeugen, wodurch die lineare Algebra symbolisch möglich wird Des weiteren können Tensoren definiert und symbolische Tensorrechnung betrieben werden 20.2.4.3 Operationen mit Listen Mathematica bietet eine Reihe weiterer Operationen, mit denen Listen abgefragt, erweitert oder verkürzt werden können: Tabelle 20 4 Operationen mit Listen Position}/, a] MemberQ[/, a] FreeQ[Z. a] Prependf/, a] Append Insert Delete /, a] /, a, i] i, V, i, il ReplacePart[/, a, i] liefert eine Liste der Positionen, an denen a in prüft, ob a Element der Liste ist prüft, ob a nirgendwo in der Liste auftritt fügt a an den Anfang der Liste hinzu fügt a am Ende der Liste hinzu fügt a an der Stelle i zur Liste hinzu löscht die Elemente mit den Nummern i, j, ersetzt das Element an der Stelle i durch a der Liste auftritt aus der Liste ¦ Mit Delete kann man z B die Liste 11 um das Glied aß verringern In[14] := 12 = Delete[/1, 6] 0ut[14] = {al, a2, a3, a4, a5}, wobei jedoch in der Ausgabe die ai durch ihre Werte - sie sind selbst Listen - ersetzt erscheinen 20.2.4.4 Spezielle Listen Mathematica stellt eine Reihe von Operationen bereit, die spezielle Listen aufbauen Eine dieser Ope- rationen^ die häufig bei der Arbeit mit mathematischen Funktionen eine Rolle spielt, ist Table Tabelle 20.5 Die Operation Table Table[/, {imax}} erzeugt eine Liste mit imax Werten von / = f(i) Tablej/, {i, imin, imax}] erzeugt eine Liste von Werten von / von imin bis imax Table[/, {z, imin, imax, di}] das gleiche wie letztes, nur in Schritten di ¦ Tabelle der Binomiiialkoeffizienten zu n = 7
20.2 Mathematica 991 In[15] •= Table[Binomial[7, i], {z, 0, 7}]] 0ut[15] = {1, 7, 21, 35, 35, 21, 7, 1} Mit Table können auch mehrdimensionele Tabellen hergestellt werden. So erhält man mit Table[/, {i, ü, z2}, {j, jl, j2}, ] mehrstufige verschachtelte Tabellen, so etwa aus In[16] = Table[Binomial[z, j], {i, 1, 7}, {j, 0, i}] die Binominalkoeffizienten bis zur Stufe 7: 0utft67 = {{1, 1}, {1, 2, 1}, {1, 3, 3, 1}, {1, 4, 6, 4, 1}, {1, 5, 10, 10, 5, 1}, {1, 6, 15, 20, 15, 6, 1}, {1, 7, 21, 35, 35, 21, 7, 1}} Mit der Operation Range lassen sich speziell fortlaufende Zahlenlisten erzeugen: Range[n] erzeugt die Liste {1, 2, , n} Entsprechend wirken Range[nl, n2] und Range[nl, n2, dn], die Zahlenlisten von nl bis n2 in den Stufen 1 bzw dn erstellen 20.2.5 Vektoren und Matrizen als Listen 20.2.5.1 Aufstellung geeigneter Listen Eine Reihe spezieller (Listen-) Anweisungen steht für die Definition von Vektoren und Matrizen bereit. Eine einstufige Liste der Art v= {vi, v2, . ., vn} B0 13) läßt sich jederzeit als Vektor im n-dimensionalen Raum mit den Komponenten vi, v2,. ., vn auffassen. Die spezielle Operation Arrayjv, n] erzeugt die Liste (den Vektor) {v[1], v[2],..., v[n]}. Mit Vektoren dieser Art kann symbolische Vektorrechnung betrieben werden. Die oben eingeführten zweistufigen Listen 11 (s. 20 2.4.2, S. 990) und 12 (s. 20 2 4.3, S 990) können als Matrizen mit den Zeilen i und den Spalten j aufgefaßt werden. In diesem Falle wäre bij das Element der Matrix in der z-ten Zeile und der j-ten Spalte Mit 11 ist eine Rechteckmatrix vom Typ F,5), mit 12 eine quadratische Matrix vom Typ E,5) gegeben. Mit der Operation Array[6, {n, m}] wird eine Matrix vom Typ (n, m) erzeugt, deren Elemente mit b[i, j] gekennzeichnet werden. Mit i werden die Zeilen numeriert, i läuft von 1 bis n; j numeriert die Spalten und läuft von 1 bis m. In dieser symbolischen Form läßt sich 11 darstellen- ü = Array[6, {6, 5}] , B0.14a) wobei für die Elemente gilt b[i, j]= bij (i = 1, , 6 j = 1,. ., 5). B0 14b) Die Operation IdentityMatnx[n] erzeugt die n-stufige Einheitsmatrix. Mit der Operation DiagonalMatnx[/zste] wird eine Diagonalmatrix mit den Elementen von liste auf der Hauptdiagonalen erzeugt. Die Operation Dimension[/zs£e] gibt die Dimension einer Matrix, deren Struktur durch liste gegeben ist Schließlich erhält man mit MatrixForm[/zs£e] eine matrixartige Darstellung von liste. Eine weitere Möglichkeit zur Definition von Matrizen lautet: Es sei f(i,j) eine Funktion der ganzen Zahlen i und j Dann kann mit Table[/, {i, n}, {j, m}] eine Matrix vom Typ (n, m) definiert werden, deren Elemente die jeweiligen f{i,j) sind. 20.2.5.2 Operationen mit Matrizen und Vektoren Mathematica ermöglicht die formale Manipulation von Matrizen und Vektoren Dafür stehen die in Tabelle 20.6 aufgeführten algebraischen Operationen zur Verfügung
992 20 Computeralgebrasysteme Tabelle 20.6 Operationen mit Matrizen c a a . b Det[a] Inverse[a] Transpose [a] MatrixPower[a, n] Eigenvalues[a] Eigenvectorsja] die Matrix a wird mit dem Skalar c multipliziert das Produkt der Matrizen a und b die Determinante der Matrix a die zu a inverse Matrix die zu a transponierte Matrix die n-te Potenz der Matrix a die Eigenwerte der Matrix a die Eigenvektoren der Matrix a A: Es sei In[18] :=r = Array[a, {4, 4}] Out[18] = Mit In[19] := Transpose[r] erhält man Out [19] = {{a {a {a {a {{a {a {a {a [1, 1 2, 1 3, 1 4, 1 i ö i ö , a , a 1, 2 2, 2 3, 2 4, 2 , a i O , a , a 1. 3 2, 3 3, 3 4, 3 , a , a , a , a 1, 41 2. 4 3. 4 4, 4 [!> ! 1, 2 1, 3 1, 4 i a , a , a , a 2, 1 2, 2 2. 3 2, 4 , a i a i a j a 3, 1 3, 2 3, 3 3, 4 i a . a . a . a 4, 11 4, 2 4, 31 4, 4 die zu r transponierte Matrix r. Definiert man den allgemeinen vierdimensionalen Vektor v mit In[20] .= v = Array[w, 4] , so erhält man Out[20] = -041], u[2], rz[3], w[4]} Nun kann das Produkt der Matrix r mit dem Vektor v gebildet werden, was bekanntlich einen neuen Vektor liefert (s. Rechenoperationen mit Matrizen. 4 1.4, S. 262) In[21] := r . v Out [21] = {a a [1.1 2, 1 3, 1 4, 1 u u u 1 1 T 1 + a + a + a + a 1, 2 2, 2 3, 2 4, 2 w u u CM CM CM CM + a + a + a + a 1, 3 2, 3 3, 3 4, 3 u u u u CO CO CO CO + a + a + a + a 1. 4 2, 4 3. 4 4, 4 u u u u 4 4 4 4 Eine Unterscheidung von Spaltenvektoren und Zeilenvektoren gibt es in Mathematica nicht Im allgemeinen ist die Matrixmultiplikation nicht kommutativ (s. 4.1.4, S. 262). Der Ausdruck r . v entspricht in der linearen Algebra dem Produkt einer Matrix mit einem nachfolgenden Spaltenvektor, während v . r dem Produkt eines Zeilenvektors mit einer nachfolgenden Matrix entspricht. ¦ B: Im Abschnitt CRAMERsche Regel D 4 2 3, S 283) ist das lineare Gleichungssystem pt = b mit der Matrix In[22] :=p = MatrixForm[{{2, 1, 3}, {1, -2, 1}, {3, 2. Out [22] = //MatrixForm -- 2 1 3 1 -2 1 3 2 2 2}}] und den Vektoren In[23] = t = Array[x, 3] In[24] := b = {9, -2, 7} Out[23] = {z[l], x[2], x[S]} Out [24] = {9, -2, 7} behandelt worden. Da in diesem Fall det(p) ^ 0 ist, kann man das System gemäß t = p Das geschieht durch In[25] := Inverse[p] . b mit der Ausgabe des Lösungsvektors Out [25] = { —1 sofort lösen 2, 3}
20 2 Mathemaüca 993 20.2.6 Funktionen 20.2.6.1 Standardfunktionen Mathematica kennt eine Vielzahl mathematischer Standardfunktionen, die in Tabelle 20.7 aufgelistet sind. Tabelle 20.7 Standardfunktionen Exponentialfunktion Logarithmusfunktionen Trigonom Funktionen Arcusfunktionen Hyperbol Funktionen Areafunktionen Exp Log Sin X X X , Log[b,x] , Cosfx], Tanfx], Cotfx], Secfx], Cscfx] ArcSin[x], ArcCos[x], ArcTan[x], ArcCot[x], ArcSec[x], ArcCscjx] Sinh[x], Cosh[x], Tanh[x], Coth[x], Sech[x], Csch[x] ArcSmh[x], ArcCosh[x], ArcTanhjx], ArcCoth[x], ArcSech[x], ArcCsch[x] Alle diese Funktionen sind auch für komplexe Argumente verfügbar In jedem Fall ist auf Eindeutigkeit der Funktionen zu achten Bei reellen Funktionen muß gegebenenfalls ein Zweig der Funktion ausgewählt werden, bei Funktionen mit komplexem Argument ist der Hauptwert (s. 14 5, S 720) zu wählen. 20.2.6.2 Spezielle Funktionen Mathematica kennt auch eine Anzahl spezieller Funktionen. Die Tabelle 20.8 listet einige auf Tabelle 20.8 Spezielle Funktionen BESSEL-Funktionen Jn(z) und Yn(z) BesselJ[n,z], BesselY[n,z] Modifizierte BESSEL-Funktionen In(z) Kn(z) Bessell[n,z], BesselK[n,z] LEGENDREsche Polynome Pn(x) LegendrP[n,x] Kugelfunktionen Y™^, 0) SphericalHarmonicY[Z, ra, theta,phi] Weitere Funktionen können mit entsprechenden Spezialpaketen zugeladen werden (s auch [17 1]). 20.2.6.3 Reine Funktionen Mathematica bietet die Möglichkeit, sogenannte reine Funktionen zu nutzen Das sind Funktionen ohne spezielle Namen. Man bezeichnet sie mit Function[x, rümpf ] Mit rümpf wird der Ausdruck für die Funktion in der Variablen x bezeichnet In[l] == Function^, xA3 + xA2] Out[l] = Function[x, xs + x2] B0 15) und mit In[2] := Function^, xA3 + xA2][c] wird Out[2] = c3 + c2 B0 16) Man kann für reine Funktionen eine vereinfachte Schreibweise nutzen Sie lautet rümpf &, wobei die zu benutzende Variable mit # gekennzeichnet wird Anstelle der vorhergehenden zwei Zeilen kann man also schreiben In[3] = (#A3 + #A2) & [c] Out [3] = c3 + c2 B0.17) Es lassen sich auch reine Funktionen mehrerer Veränderlicher definieren: Function] {xi, £2, • }? rümpf] oder in Kurzform rümpf &, wobei die Variablen in rümpf durch die Elemente #1, #2,. bezeichnet werden Die Benutzung des Zeichens & zum Abschluß ist sehr wichtig, da hieran erkannt wird, daß der vorstehende Ausdruck als reine Funktion zu betrachten ist. 20.2.7 Muster Mathematica gestattet d< nutzen. Mit In[l]:=f[x_] := Polynom(x) B0.18) Mathematica gestattet dem Nutzer, eigene Funktionen zu definieren und sie in seinen Berechnungen zu nutzen.
994 20 Computeralgebrasysteme mit Polynom(x) als beliebigem Polynom der Variablen x , wird eine spezielle Funktion durch den Anwender definiert In der Definition der Funktion f steht nicht x , sondern x_ (gesprochen x -blank) mit _ als dein Unterstrich Das Symbol x_ steht für ,,Irgendetwas mit dem Namen x". Von hier an wird Mathematica jedesmal, wenn ein Ausdruck f [Irgendetwas] erscheint, dies durch seine obige Definition ersetzen. Diese Art der Definition wird Muster genannt Mit dem Symbol blank ist das Grundelement eines Musters bezeichnet, y_ steht für ein Muster namens y Es ist auch möglich, in der entsprechenden Definition nur ein _ zu verwenden, also etwa yA_ Dieses Muster steht für beliebige Potenzen von y mit irgendwelchen Exponenten, also für eine ganze Klasse von Ausdrücken mit der gleichen Struktur. Entscheidend an einem Muster ist, daß es eine Struktur festlegt Wenn Mathematica einen Audruck bezüglich eines Musters prüft, vergleicht es die Struktur der Elemente des Ausdrucks mit der Struktur des Musters. Mathematica prüft nicht auf mathematische Gleichheit1 Dies wird folgendermaßen deutlich- Sei / die Liste IN[2] .= / = { 1, y, yAa, yASqrt[x}, {f [yA{rlq% 2Ay } } B0 19) Setzt man In[3l .= I /. yA_ -> ja B0 20) so antwortet Mathematica mit der Liste Out[3] = { 1. j/, ja, ja, {f[ja], 2*> }} B0 21) Mathematica hat die Elemente der Liste in bezug auf ihre Strukturidentität mit dem Muster yA_ untersucht und in allen Fällen, in denen Übereinstimmung festgestellt wurde, das jeweilige Element durch ja ersetzt Die Elemente 1 und y wurden nicht ersetzt, da sie nicht von der vorgegebenen Struktur sind, obwohl y° = 1, y1 = y gilt. Bemerkung: Der Mustervergleich erfolgt immer über die FullForm Prüft man InI4J = b/y /. yA_ -> ja so wird Outl^I = b ja B0 22) Das ist eine Folge dessen, daß die FullForm von b/y Timesß, Power[y, —1] ] lautet und beim Strukturvergleich das zweite Argument von Times als zur Struktur des Musters passend erkannt wird Mit der Definition In [51 =f[x_] = xA3 B0 23a) ersetzt Mathematica entsprechend dem vorgegebenen Muster In[6] = f[r] durch Out [6] = r3 usw B0.23b) In[7]:=f[a] + f[x] ergibt Out [7]= a3 + x3 B0 23c) Hätte man definiert In[8]-=f[x] =xA3, so wäre bei gleicher Eingabe In[7l.= ... B0 23d) die Ausgabe Out [71 = f[a] + x3 B0 23e) entstanden In diesem Fall spricht also nur die „identische" Eingabe auf die Definition an. 20.2.8 Funktionaloperationen Bekanntlich operieren Funktionen auf Zahlen oder algebraischen Ausdrücken. Der symbolische Charakter von Mathematica gestattet jedoch ebenso Operationen auf Funktionen, da die Namen von Funktionen wie Ausdrücke behandelt und damit auch wie Ausdrücke manipuliert werden können 1. Inverse Funktion Die Bestimmung der inversen Funktion zu einer gegebenen Funktion f(x) erreicht man mit der Funktionaloperation InverseFunction. ¦ A: In[II •= InverseFunction[./] [x] Out[lI = f~l [x] ¦ B: In[2l = InverseFunction[Exp] Out[21 — Log
20.2 Mathematica 995 2. Differentiation Mathematica nutzt die Möglichkeit, die Differentiation von Funktionen als Abbildung im Raum der Funktionen aufzufassen. Der Operator der Differentiation lautet in Mathematica Derivative[l][/] oder abgekürzt f'. Ist die Funktion f definiert, so erhält man mit f' ihre Ableitung. ¦ In[3] =f[x_] •= Sin[x]Cos[x] Mit InUJ = f wird OutUl = Cos[#l]2 - Sin[#l]2&, also f' als reine Funktion dargestellt und entsprechend In[5] =%[x] Out [5] = Cos[x}2 - Sin[x]2 3. Nest Die Angabe Nest[/, x. n] bedeutet, daß die Funktion f n-mal verschachtelt auf x anzuwenden ist Das Resultat lautet f [f [ f[x\] ]. 4. NestList Durch NestList[/, x, n] wird eine Liste {x, f[x], f[f[#]], ...} erzeugt, wobei bis einschließlich zur Stufe n verschachtelt wird 5. FixedPoint Durch FixedPoint[/, x] wird die Funktion wiederholt angewendet, bis sich das Ergebnis nicht mehr ändert 6. FixedPointList Die Funktionaloperation FixedPointListf/, x] erzeugt die fortlaufende Liste mit den Anwendungsergebnissen von f , bis sich der Wert nicht mehr ändert. ¦ Zur Demonstration dieser Art von Funktionaloperationen wird Nest auf die Näherungsformel (s. 19 1.1 2, S 912) von Newton für Wurzeln der Gleichung f(x) = 0 angewendet. Es sei eine Wurzel der Gleichung x cos x = sin x in der Nähe von 37r/2 zu finden: In[6] .= f[x_] .= x - Tan[.x] In[7] = f [x] 0ut[7] = l - Sec[x]2 In[8] = g[x_] - x - ±\x\l±'[x\ In[9] := NestList[#, 4 6, 4] // N Out [9] = {4.6, 4 54573, 4.50615, 4.49417, 4.49341} In [10] = FixedPoint[#, 4 6] Out [10] = 4 49341. Man hätte auch eine größere Präzision des Ergebnisses verlangen können 7. Apply Es sei / eine Funktion, die im Zusammenhang mit einer Liste {a, b, c, ...} erklärt ist Dann ergibt Apply[/, {a, 6, c, . .}] /[a, 6, c,. .] B0.24) ¦ In [1] •— Apply [Plus, {u, v, w}] Out[l] = u+ v + w In[2] -= Apply[List. a + 6+ c] Out [2] = {a, 6, c} Man erkennt hier gut das allgemeine Schema, wie Mathematica mit Ausdrücken von Ausdrucken umgeht Dazu schreibt man die letzte Operation in FullForm. In[3] = Apply[List, Plus[a, b, c]} Out[3] = List[a, b, c] Die Funktionaloperation Apply ersetzt offensichtlich den Head des zu behandelnden Ausdruckes Plus durch den geforderten List 8. Map Die Operation Map führt, bei entsprechend definierter Funktion /, zu dem Ergebnis Map[/, {o, 6, c, }] {/[a], /[&], /[c],...} B0 25) Map erstellt eine neue Liste, deren Elemente durch die Anwendung der Funktion / auf die Elemente der Ausgangsliste entstehen ¦ Es sei / die Funktion f(x) = x2 Sie wird durch In [4] =f[x_] = xA2 definiert Mit diesem / erhält man In[5] .= Map[/, {u, >ik w}\ Out[5] = {n2, v2, w2} Auch Map kann im oben genannten Sinn auf allgemeinere Ausdrücke angewendet werden- In[6] •= Map[/, Plus[a, b, c]] Out [6] = a2 + b2 + c2 20.2.9 Programmierung Mathematica nutzt für die Programmierung die bekannten Schleifen- und Kontrollstrukturen IF, FOR, WHILE, DO Hierzu gehören u.a die beiden Befehle
996 20 Computeralgebrasysteme Vo[ausdr, {i,il,i2,di}] B0 26a) und While[test, ausdr] B0 26b) Der erste Befehl bewirkt die Evaluierung des Ausdruckes ausdr, wobei i den Wertebereich von ü bis %2 in Schritten di durchläuft Läßt man di weg, so werden Einer-Schritte verwendet. Fehlt noch ü so wird bei 1 begonnen. Der zweite Befehl evaluiert den Ausdruck, solange test den Wert True besitzt. ¦ Zur Berechnung eines Näherungswertes von e2 werde die Reihenentwicklung der Exponentialfunktion benutzt In[l] •= sum = 1.0; Do[sum = sum + BAi/i\), {i, 1,10}]; , . sum ^ ' Out LH = 7.38899 Die Do-Schleife evaluiert entsprechend einer vorgegebenen Anzahl, die While-Schleife dagegen so lange, bis die vorgebene Bedingung ungültig wird Mathematica bietet insbesondere für die Programmierung die Möglichkeit, Variable lokal zu definieren und zu nutzen Das geschieht mit der Anweisung Module[{U, *2,...}, proced] B0 28) Die in der Liste eingeschlossenen Variablen oder Konstanten sind bezüglich ihrer Nutzung im Modul lokal, die ihnen zugewiesenen Werte sind außerhalb des Moduls nicht bekannt. ¦ A: Es ist eine Prozedur (Funktion) zu definieren, die die Summe der Quadratwurzeln von 1 bis n berechnet. In[l] .= sumq[nj\ .= Module[{sura = 1.}, , , Vo[sum = sum + N[Sqrt[i]], {i, 2, n}], lzu zyj sum ]; Der Aufruf sumq[30] liefert dann z.B. 112.083 Eine besondere Stärke der Programmiermöglichkeiten in Mathematica ist die Nutzung funktionaler Methoden der Programmierung, die mit den Operationen Nest, NestWhile, Apply, Map, ReplaceList und weiteren möglich werden. ¦ B: Beispiel A läßt sich funktional für den Fall, daß eine Genauigkeit auf 10 Ziffern gefordert ist, folgendermaßen schreiben: sumq[n_] := N[Apply[Plus, Table[Sqrt[i], {i, 1, n}]], 10], sumq[S0] liefert dann 112.0828452. Für Einzelheiten muß auf [20 6] verwiesen werden 20.2.10 Ergänzungen zur Syntax, Informationen, Meldungen 20.2.10.1 Kontexte, Attribute Mathematica muß mit einer Vielzahl von Symbolen umgehen, darüber hinaus lassen sich weitere Programmoduln je nach Bedarf hinzuladen. Um Mehrdeutigkeiten zu vermeiden, bestehen die Namen von Symbolen in Mathematica aus zwei Teilen, dem Kontext und dem Kurznamen. Als Kurznamen bezeichnet man die Benennungen (s. 20.2, S. 986) von Heads und Elementen der Ausdrücke. Darüber hinaus benötigt Mathematica für die Benennung von Symbolen Angaben über die Zugehörigkeit des Symbols zum jeweiligen Programmteil Dies wird durch die Angabe des Kontext gewährleistet, der den entsprechenden Programmteil benennt Der vollständige Name eines Symbols besteht daher aus dem Kontext und dem Kurznamen, die durch ein ' verbunden werden Beim Start von Mathematica sind immer zwei Kontexte präsent System'sowie Global'. Über die Verfügbarkeit weiterer Programmoduln kann man sich mit dem Befehl Contexts[ ] informieren lassen Alle in Mathematica eingebauten Funktionen laufen unter dem Kontext System', während die vom Nutzer definierten unter dem Kontext Global' abgelegt werden.
20.2 Mathematica 997 Ist ein gegebener Kontext aktuell, also der entsprechende Programmteil geladen, so können die Symbole mit ihrem Kurznamen angesprochen werden Beim Einlesen eines weiteren Mathematica-Programmoduls mit << NamePackage werden die dazugehörigen Kontexte geöffnet und der schon vorhandenen Liste vorn hinzugefügt. Es kann vorkommen, daß vor dem Zuladen des neuen Moduls ein Symbol mit einem Namen eingeführt wurde, der jetzt in dem neu eröffneten Kontext unter einer anderen Definition ebenfalls vorhanden ist In diesem Falle informiert Mathematica in einer Meldung darüber Dann ist entweder der vorher definierte Name mit Remove[Global'name] zu löschen, oder aber man verwendet für das zugeladene Symbol den vollständigen Namen Neben den Eigenschaften, die Symbole per Definition besitzen und die in der Regel spezieller Natur sind, kann man ihnen allgemeinere Eigenschaften, nämlich Attribute wie Orderless, d h. ungeordnet, kommutativ. Protected. d h , Werte können nicht geändert werden, oder Locked, d h, Attribute können nicht geändert werden u a. zuordnen. Auskunft über die für das jeweilige Objekt zutreffenden Attribute erhält man mit Attributes!/] Eigene Symbole können mit Protect[eigenesSymbol] geschützt werden, so daß keine anderen Definitionen für diese Symbol eingeführt werden können. Mit Unprotect kann das Attribut wieder entfernt werden 20.2.10.2 Informationen Informationen über eingebaute Objekte und deren Haupteigenschaften kann man mit folgenden Befehlen ausgeben lassen 7'symbol Information über das Objekt mit dem Namen symbol ausgeben 77symbol Ausführlichere Information über das Objekt ausgeben 7B* Informationen über alle Mathematica-Objekte, deren Namen mit B beginnen, ausgeben Es ist auch möglich, über spezielle Operatoren Informationen zu erhalten, z B mit ? = über den Zuweisungsoperator 20.2.10.3 Meldungen Mathematica verfügt über einen Meldeformalismus, der für verschiedenen Zwecke eingesetzt werden kann Die Meldungen werden während der Berechnungen erzeugt Ihre Ausgabe erfolgt in einer einheitlichen Form symbol tag, so daß die Möglichkeit besteht, sich im weiteren auf diese Meldung zu beziehen. Zur Illustration werden folgende Fälle betrachtet- ¦ A: In[l] =f[x_] = l/x, In[2] .= f[0] Power: :mfy:Infinite expression - encountered. Out[2] = Complexlnf lnity ¦ B: In[3] = Log[3, 16, 25] Log: : argt: Log called with 3 arguments; 1 or 2 arguments are expected. Out [3] = Log[3, 16, 25] ¦ C: In[4] = Multply[.T, xAn] General: :spelll: Possible spelling Error: new symbol name , ,Multiply'' is similar to existmg symbol , jMultiply''. Out [4] = Multply[x. xAn] Im Beispiel A warnt Mathematica daß im Verlaufe der Abarbeitung ein Ausdruck mit dem Wert 00 aufgetaucht ist. Die Berechnung selbst kann durchgeführt werden. Im Beispiel B ist der Aufruf des Logarithmus mit drei Argumenten erfolgt, was entsprechend der Definition nicht zulässig ist Mathematica reagiert nicht Im Beispiel C stößt Mathematica auf einen Symbolnamen, der neu ist, jedoch einem bekannten ähnelt Mathematica weist daraufhin und reagiert nicht Der Nutzer kann mit Of f [s : : tag] eine Meldung abschalten. In diesem Falle wird sie nicht ausgegeben Mit 0n läßt sich die Meldung wieder zuschalten Mit Messages[.s?/ra6o/] können alle Meldungen angezeigt werden, die sich auf das Symbol mit dem Namen symbol beziehen
998 20 Computeralgebrasysteme 20.3 Maple Das Computeralgebrasystem Maple wurde an der Waterloo-Universität (Ontario Canada) entwickelt. Es wird in der Version Maple 9 von Waterloo Maple Software vertrieben. Eine gute Einführung findet man neben den Handbüchern in [20.6]. 20.3.1 Hauptstrukturelemente 20.3.1.1 Typen und Objekte In Maple haben alle Objekte (Daten, Ausdrücke usw ) einen Typ, der ihre Zugehörigkeit zu einer Objektklasse bestimmt Ein Objekt kann mehreren Typen zugeordnet sein, so z B , wenn eine bestimmte Objektklasse eine durch zusätzliche Relationen definierte Unterklasse enthält. Als Beispiel sei erwähnt, daß die Zahl 6 vom Typ integer und vom Typ posmt ist Mit Hilfe der Typisierung und damit auch einer Hierarchisierung aller Objekte wird die widerspruchsfreie Formulierung und Abarbeitung bestimmter Klassen von mathematischen Aufgaben garantiert. Der Nutzer kann jederzeit den Basistyp eines Objektes mit der Anfrage > whattype(ofy'), B0 30) erfragen Nach Abschluß der Eingabe ist unbedingt das Semikolon zu setzen Die Rückgabe ist der Basistyp des Objektes Maple kennt folgende, in Tabelle 20.9 dargestellten Basistypen: Tabelle 20 9 Basistypen in Maple * v v <= v exprseq integer set Matrix v + v v <> v float list string Vector [column] v = v fraction vnotv symbol Vector [row] V ~ V function or table - .. - Nandv hfarray procedure uneval v < v array indexed series Array Die weitergehende Typstruktur kann mit Abfragen der Art type(obj,typname), deren Werte die Boo- LEschen Funktionen true oder f alse sind, ermittelt werden. In der Tabelle 20.10 ist eine kleine Auswahl der Maple bekannten Typnamen dargestellt Tabelle 20.10 Typenübersicht * = algn colourabl expanded intersect minus numeric posint radfunext relation symmfunc vector ** A algnumext connected facint laurent monomial odd positive radical scalar taylor + PLOT and constant float linear name oddfunc primeint radnum series tree PLOT3D anything cubic fraction list negative Operator procedure radnumext set trig RootOf array digraph function listlist negint or quadratic ränge sqrt type < algebraic biconnect equation graph logical nonneg planar quartic rational Square undigraph < algext bipartite even indexed mathfunc nonnegint point radext ratpoly string uneval <> algfun boolean evenfunc integer matrix not polynom radfun realcons subgraph union Auch die Typprüffunktion selbst besitzt einen Typ, nämlich type Grob gesprochen, charakterisieren die Basistypen Klassen von grundlegenden Datenstrukturen (Zahlenarten, strukturierte Datentypen) und Basisoperatoren, während die übrigen tiefergehenden Klassifizierungen der Basistypen bzw Sachverhalte algebraischer Natur widerspiegeln bzw. mit bestimmten Prozeduren von Maple verknüpft sind Wichtige Objekte in Maple sind Ausdrücke. Diese umfassen Konstanten (Zahlen), Operatoren, zusammengesetzte Objekte aus Variablen und Operatoren, Datenstrukturen, Funktionsaufrufe usw Auch
20.3 Maple 999 Prozeduren und Module können (zumindest im technischen Sinne) als Ausdrucke aufgefaßt werden Namen sind in Maple Aneinanderreihungen von Charakteren (einer oder mehrere), welche eindeutig ein Kommando, eine Variable oder andere Objekte identifizieren Zu unterscheiden sind dabei indizierte Namen und Symbole Ein indizierter Name hat die Form name [index]. etwa > A[l, 2] —> ^[1,2] Symbole sind nichtindizierte Namen Indizierten Namen können ebenso wie Symbolen Werte zugewiesen werden. 20.3.1.2 Eingaben und Ausgaben Im System Maple haben Eingaben oft die Form obj^obj^objj, . ,objn), B031) Auch hier ist der erste Teil des Terms, d h. der vor der öffnenden Klammer, in der Regel ein Operator, eine Anweisung oder eine Funktion, die auf die in der Klammer stehenden Teile wirken. In bestimmten Fällen sind als Argumente spezielle Optionen zulässig, die spezifische Anwendungen des Operators oder der Funktion steuern Wichtig ist das abschließende Semikolon, es teilt Maple mit, daß die Eingabe beendet ist Wird die Eingabe mit einem . beendet, so folgt daraus für Maple, daß die Eingabe zwar abzuarbeiten, das Ergebnis jedoch nicht darzustellen ist Symbole, d h Namen in Maple, können aus Buchstaben, Zahlen und dem Unterstrich(_) bestehen An erster Stelle darf keine Zahl stehen. Zwischen Groß- und Kleinbuchstaben wird immer unterschieden Der Unterstrich wird von Maple für interne Symbole verwendet, er sollte deshalb in selbstdefinierten Symbolen vermieden werden Zeichenketten, d h Objekte vom Typ string, sind in Anführungszeichen " gefaßt einzugeben. > S = "Dies ist ein String", B0 32) S = " Dies ist ein String" Die Typprüfung mit whattype ergibt string. Solange einem Symbol kein Wert zugewiesen ist, ist das Symbol vom Typ string bzw. name, d h , die Typprüfung > type(symb, name), bzw. type(sym,b, string), B0 33) ergibt true. Ist dem Nutzer nicht bekannt, ob ein Symbol in Maple schon mit einem Wert belegt ist, so läßt sich das mit der Eingabe ?name erfragen Antwortet Maple mit dem Hinweis, daß es diesen Namen nicht kennt, so ist das Symbol frei verfügbar. Nachdem dem Symbol ein Wert mit dem Zuweisungsoperator = zugewiesen wurde, nimmt das Symbol automatisch den Typ des zugewiesenen Wertes an ¦ Es sei xl ein Symbol, das hier als Variable dienen soll Gibt man ein > whattype(.xl); so antwortet Maple mit string Wird nunmehr eine Wertzuweisung etwa mit einer ganzen Zahl vorgenommen: > xl = 5. —? xl '= 5 und danach > whattype(.xl), eingegeben, so lautet die Antwort jetzt integer Maple kennt je nach Version eine beträchtliche Anzahl von Anweisungen, Funktionen und Operatoren. Nicht alle sind beim Start des Systems sofort aufrufbar. Eine Vielzahl spezieller Funktionen und Operationen ist in Fachgebietspaketen in der Maple-Bibliothek vorhanden Es gibt z B. Pakete zur linearen Algebra, zur Statistik usw. Diese Pakete müssen bei Bedarf mit dem Befehl > uith(paketname); zugeladen werden (s. Ergänzungen zur Syntax, 20.3.9.1, S. 1008) Erst danach stehen ihre Operationen und Funktionen dem Nutzer in der üblichen Art zur Verfügung
1000 20. Computeralgebrasysteme 20.3.2 Zahlenarten in Maple 20.3.2.1 Grundtypen von Zahlen in Maple Maple kennt die in Tabelle 20.11 aufgeführten Grundtypen von Zahlen. Tabelle 20 11 Zahlenarten in Maple Zahlenart Ganze Zahl Bruchzahlen Gleitpunktzahlen Typ integer fraction float Darstellungsform nnnnnn Kette beliebig vieler Ziffern ppp/qqq Bruch zweier ganzer Zahlen nn.mmm oder in wissenschaftlicher Notation n mm * 10A(pp) Mit Hilfe der Typprüfungsfunktionen können weitere Eigenschaften von Zahlen erfragt werden* 1. Rationale Zahlen (Typ rational): Rationale Zahlen sind in Maple die ganzen Zahlen und die Brüche, wobei ein Bruch, der zur ganzen Zahl vereinfacht werden kann, von Maple nicht als Bruch (Typ fraction) erkannt wird 2. Gleitpunktzahlen (Typ float): Setzt man hinter eine ganze Zahl den Dezimalpunkt (nun ), so wird sie automatisch als Gleitpunktzahl interpretiert. 3. Gemeinsamkeiten: Alle drei Zahlenarten haben die Typen realcons, numeric und constant Die letzten beiden Typen treffen auch für komplexe Zahlen zu 4. Komplexe Zahlen: Komplexe Zahlen werden mit der imaginären Einheit / wie üblich gebildet Die Zahl / repräsentiert, wie in der Mathematik üblich, die Quadratwurzel aus —1 Sie ist vom Typ complex Ihre Definition lautet intern / =Complex(l) B0.34) Für die Darstellung komplexer Zahlen existiert intern der Complex-Konstruktor > Complex(:r,2/) B0.35) liefert, wenn x und y Zahlen sind, x + yl. 20.3.2.2 Spezielle Zahlen Maple kennt eine Reihe spezieller Zahlen der Mathematik wie z.B. Pi, E, gamma 20.3.2.3 Darstellung und Konvertierung von Zahlen 1. Gleitpunktzahlen Der Befehl evalf (zahl); wandelt rationale Zahlen oder zunächst symbolisch dargestellte Zahlen und Ergebnisse von Berechnungen in Gleitpunktzahlen mit der voreingestellten Präzision um, d.h in der Regel 10 Stellen. ¦ > eval(£); 2.718281828 Die Präzision wird in Maple durch die Umgebungsvariable Digits gesteuert. Ist die Voreinstellung für die konkrete Aufgabe nicht geeignet, so läßt sich mit > Digits := m; m gewünschte Ziffernanzahl B0 36) eine Änderung herbeiführen Diese gilt bis zur nächsten Neufestlegung. 2. Zahlen verschiedener Basis Die Umwandlung von Zahlen im Zehnersystem in Zahlen einer anderen Basis erfolgt mit dem Befehl convert Dieser Befehl ist in seiner Grundform convert(ausdr, form, opt) B0 37) von besonderer Bedeutung, da er Ausdrücke von einer Form in eine andere umwandelt, sofern dies sinnvoll ist. Das Argument form kann einer der in Tabelle 20.12 aufgezählten Typen sein
20 3 Maple 1001 Tabelle 20.12 Einige ausgewählte Argumente der Funktion convert v -hv degrees factorial lessthan multiset rational vector * v diff float lessequal name ratpoly D double fraction list octal RootOf array eqnlist GAMMA listlist parfrac series base equality hex In polar set bmary exp horner matrix polynom sincos confrac expln hostfile metric radians sqrfree decimal expsmcos hypergeom mod2 radical tan Die Tabelle zeigt, daß füi die Umwandlung von Zahlen eine Vielzahl von Formfunktionen zur Verfügung stehen ¦ Beispiele für Formfunktionen: > convertG3. binary), —> 1001001 > convertG3, octal), —> 111 > convertG9,hex); —? 4F > convert(l.45, rational); —? — > convertA1001101,decimal,binary),—> 205 > convert(lFFA2\ decimal,hex);—> 65442 Im letzten der 6 Beispiele ist die Hexadezimalzahl in Linksakzenten einzusehließen. Mit dem Befehl convert (list, base, basl, bas2) erfolgt die Umwandlung einer Zahl zur Basis basl, die in Listenform einzugeben ist, in eine Zahl zur Basis bas2, die in Listenform ausgegeben wird Eingabe in Listenform heißt, daß die Zahl in der Form z — z\ * (bas)° + z2* (basI + z3 * (basK + zu schreiben ist und die Liste [ , 23, z2, Z\] einzugeben ist I Die Oktalzahl 153 soll in eine Hexadezimalzahl umgewandelt werden > convert([1.5,3],base,8,16), —> [9,14] Die Ausgabe erfolgt als Liste 20.3.3 Wichtige Operatoren in Maple Wichtige Operatoren sind+, —, *, /, A als die bekannten arithmetischen Operationen, =, <, <= , >, >=, <> als relationale Operatoren und .= als Zuweisungsoperator. Von spezieller Bedeutung ist der cat Operator, der abgekürzt in Infixform auch als 11 geschrieben wird Mit diesem Operator können Symbole (Namen) und/oder Strings miteinander verknüpft werden Es gilt- > cat(va\6) —> va6v > whattype(%) —? string B0 38a) > cat(a, vfrv) —> ab > whattype(%) —> symbol B0.38b) Die Verknüpfung liefert also ein Resultat, welches den Typ des ersten Arguments übernimmt Entsprechendes gilt für die Infixform || der Operand links vom Operator bestimmt den Typ des Resultats vav||6, —> va6v a\\" b\ —> ab B0 39) Mit dem Verknüpfungsoperator lassen sich Folgen von Symbolen erzeugen ¦ > i —A,2,3,4,5) eine Folge ganzer Zahlen > y\\i, Verknüpfung der Folge mit einer Variablen y —> yl,y2,y3,y4,y5 oder einfacher > 2/||(l 5); mit. als Bereichsoperator 20.3.4 Algebraische Ausdrücke Mit Hilfe der arithmetischen Operatoren lassen sich aus Variablen (Symbolen) algebraische Ausdrücke konstruieren Sie alle haben den Typ algebraic, zu welchem die „Untertypcnu integer, fraction, float, string, indexed, series, function, uneval sowie die arithmetischen Operatortypen und der Punktoperatortyp gehören
1002 20. Computeralgebrasysteme Man erkennt, daß eine einzelne Variable (ein Symbol) auch vom Typ algebraic ist Die Basiszahlentypen gehören ebenfalls dazu, denn zu ihnen lassen sich algebraische Ausdrücke in der Regel mit dem Befehl subs auswerten ¦ > p ¦= XA3 - 4 * xA2 + 3 * x + 5 . Hier wird ein Ausdruck, in diesem Fall ein Polynom dritten Grades in x, definiert. Mit dem Substitutionsoperator subs kann man der Variablen x im Polynom (Ausdruck) Werte (Zahlen) zuweisen und die Auswertung veranlassen. 347 > subs(x = 3,/?); —? 5 > subs(x = 3/4, p); —> —— > subs(x = 1.54,p), —? 3.785864 Der Operator op dient zur Extraktion von Unterausdrucken aus einem Ausdruck Mit op(p); B0 40) erhält man die Folge (s. 20 3 5, S. 1002) der Teilausdrücke auf der ersten Ebene, also x3,-4x2,3x,5 B0 41) In der Form op(i,p), wird der i-te Term zurückgegeben, also liefert z.B opB,p) den Term — Ax2, mit op@,p) wird der Basistyp von p, nämlich + zurückgegeben. Die Anzahl der Terme (Operanden) des Ausdrucks ermittelt man mit nops(p), 20.3.5 Folgen und Listen Maple versteht unter einer (Ausdruck-)Folge die Aneinanderreihung von Ausdrücken, die durch Kommas getrennt sind. Die Reihenfolge der Elemente ist signifikant. Folgen mit gleichen Elementen in unterschiedlicher Reihenfolge sind verschiedene Objekte Die Folge ist ein Basistyp von Maple exprseq ¦ > /l -=a;A3,-4*xA2,3*:z,5- B0.42a) definiert eine Folge, denn > type(/l, exprseq), liefert true B0 42b) Mit dem Befehl > seq(/(i),z = l..n); wird die Folge /(l),/B),. .,/(n) B0 43) erzeugt. ¦ Mit > seq(z2, i = 1 .5); erhält man 1,4,9,16,25 . Die Bereichsfunktion ränge definiert Laufbereiche von ganzzahligen Variablen, die in der Form i = n..m dargestellt werden, und bewirkt, daß die Indexvariable i nacheinander die Werte n,n + l,n + 2,..., m annimmt. Der Typ dieser Struktur lautet Eine äquivalente Form der Erzeugung von Folgen bietet die vereinfachte Schreibweise > f(i)$i = n..m, B0 44) die ebenfalls f(n),f(n + 1), . ,/(m) erzeugt Entsprechend liefert $ra..ra; die Folge n,n + 1, . ,m und x$i; die Folge mit i Gliedern x. ¦ Indizierte Variablen (Namen) erzeugt man durch > a[i]$i i = 1..4;—> ai, 02, «23,A4 Folgen können durch Anhängen weiterer Glieder ergänzt werden- folge,a,b, .. B0 45) Klammert man eine Folge / in eckige Klammern, so entsteht eine Liste, die vom Typ list ist ¦ > / := [i$i = 1..6)]; —? / := [1, 2,3,4,5,6]
20 3 Maple 1003 Mit dem schon bekannten Operator op erhält man über op(/is£e), die der Liste zugrundeliegende Folge zurück Um Listen zu erweitern, sind sie zunächst mit op(liste) in Folgen umzuwandeln, diese dann entsprechend zu erweitern und mit eckigen Klammern erneut in Listen umzuwandeln. Listen können als Elemente wiederum Listen enthalten, ihr Typ ist listlist. Strukturen dieser Art spielen bei der Konstruktion von Matrizen eine Rolle Der Zugriff auf Elemente einer Liste erfolgt mit dem Befehl op(n, liste), Dieser liefert das rc-te Element der Liste Einfacher ist es, wenn der Liste ein Name gegeben wurde, etwa L, und dann L[n], aufgerufen wird. Bei einer zweifachen Liste findet man die Elemente auf der unteren Ebene mit op(ra, op(n, L)); oder mit dem gleichbedeutenden Aufruf L[n][m],. Es bereitet keine Schwierigkeit, Listen mit höherem Verschachtelungsgrad aufzubauen. ¦ Erzeugung einer einfachen Liste > Ll.= [a,6,c,d,eJ], —? LI = [a, 6,c,d, e,/] Extraktion des 4 Elements dieser Liste. > opD,L); oder > L[A}\ —> d Erzeugung einer zweifach verschachtelten Liste > L2 = [[o,6,c],[d,e,/]] (Ausgabe unterdrückt') Der Zugriff auf das 3 Element der 2 Unterliste > opC,opB,L)); oder L[2][3]; —> f Erzeugung einer dreifach verschachtelten Liste: > L3.= [[[a,6,c],[dIc,/]],[[a,t]>[tt,i;]],[[a:>y]J[ii;^]]] • 20.3.6 Tabellen- und feldartige Strukturen, Vektoren und Matrizen 20.3.6.1 Tabellen- und feldartige Strukturen Maple besitzt zur Konstruktion tabellen- und feldartiger Strukturen die Befehle table und Array Mit table(z/c, list) B0.46) erzeugt Maple eine tabellenartige Struktur, in der ifc eine Indexfunktion ist (s 20.3.6.3, S. 1005) und liste eine Liste von Ausdrücken, die Gleichungen als Elemente enthält In diesem Fall benutzt Maple die linken Seiten der Gleichungen als Indices der Tabelleneinträge und die rechten Seiten als die jeweiligen Tabelleneinträge Enthält die Liste nur Elemente, so nimmt Maple die natürliche Indizierung der Tabelleneinträge, beginnend mit der 1, an. ¦ > T •= table([a, b, c]); —? := table([l = a, 2 = b, 3 = c]) > R-=täble([a = x,b = y,c = z])i —> R = table([a = x,b = y, c = z\) Ein erneuter Aufruf von T oder R liefert nur die Symbole T oder R zurück Erst mit op(T); oder auch eval(T), gibt Maple die Tabelle zurück, beim Aufruf op(op(T)), erhält man die Komponenten der Tabelle in der Form einer Liste der Gleichungen für die Tabellenwerte Hieran erkennt man, daß das Evaluierungsprinzip für diese Strukturen von der Regel abweicht. In der Regel evaluiert Maple einen Ausdruck bis zum Ende, d h bis keine weiteren Umformungen mehr möglich sind. Im gegebenen Fall wird die Definition zwar zur Kenntnis genommen, jedoch die weitere Auswertung unterdrückt, bis sie mit der speziellen Anweisung op ausdrücklich gefordert wird Eine Tabelle kann implizit durch Wertezuweisung an einen indizierten Namen erzeugt werden: Ta.b(index) ¦ Tab[a] = x Tab[6] = y . Tab[c] .= z : > eval(Tafr); —? table([a = x,b = y,c = z\)
1004 20 Computeralgebrasysteme Mit dem Befehl > tableQ, erzeugt man eine leere Tabelle table( erhält man durch > T'{index) . Zugriff auf die Werte einer Tabelle > Tab l [1],[2],[3] > indices(JR); liefert Die Indizes von T erhält man als Folge mit dem Befehl mdices(T);, eine Folge der Glieder mit entries (n ¦ Für die obigen Beispiele gilt > mdices(T); liefert und entsprechend z B > entnes(i?), liefert [#], [y], [<z] Mit dem Befehl array (z/c, 6er, list); B0.47) lassen sich spezielle Tabellen erzeugen, die mehrdimensional sein können und ganzzahlige Laufbereiche für jede Dimension besitzen ifc ist wiederum eine Indexfunktion (s 20.3 6.3, S 1005), her bestimmt die Dimension des Arrays (Anzahl der angegebenen Bereiche), list kann eine Liste von Gleichungen, eine Liste von Werten oder eine verschachtelte Liste von Listen sein Wird her nicht angegeben, so wird die Dimension aus den Einträgen von list entnommen. 20.3.6.2 Eindimensionale Arrays Mit array(l. 5), erzeugt man z B ein eindimensionales Array der Länge 5 ohne explizite Elemente, mit v := array(l .5, [a(l),aB),aC),aD),aE)]), ebenfalls, jedoch mit den angegebenen Komponenten Solche eindimensionalen Arrays interpretiert Maple auch als Vektoren. Mit der Typprüfungsfunktion type(v, vector); erhält man true. Fragt man jedoch whattype(i>);, so wird daraus symbol Das hängt mit der schon erwähnten Spezialform der Evaluierung zusammen. 20.3.6.3 Zweidimensionale Arrays Entsprechend definiert man zweidimensionale Arrays, etwa mit A = array(l.ra,l n, [[a(l, 1),... ,a(l,n)], . ,[a(ra,l), . ,a(ra,rc)]]); B0.48) Die so definierte Struktur verstellt Maple als Matrix der Dimension n x m. Die Werte von a(i, j) sind die entsprechenden Matrixelemente. ¦ > X :=arrayA.3, [xl,a;2,x3]), X '= [xl x2 x3] ergibt einen Vektor Eine Matrix bekommt man z B mit > A:=array(l .3,1..4,[]), A = array(l .3,1..4,[]) iese wird mit > eval(A); zu "?[1,1] 7[1,2] ?[1,31 ?[1,4]" ?[2,1] ?[2,2] ?[2,3] ?[2,4] .?[3,1] ?[3,2] ?[3,3] ?[3,4]_ Maple hat hier die nicht festgelegten Werte des Feldes (der Matrix) durch die Einträge Tfjj] eharakteri siert. Weist man jetzt allen oder einigen dieser Einträge durch Zuweisungen Werte zu, etwa durch > A[l, 1] := 1 i4[2,2] •= 1 : A[3,3] = 0 so führt ein erneuter Aufruf von A zur Ausgabe der Matrix mit den nunmehr festgelegten Werten 1 > eval(A), r[2,l] ?[3,1] 1 ?[3,2] 0 '[3,4]
20 3 Maple 1005 Mit dem Aufruf > B =array([[611,612,613], [621,622,623], [631,632,633]]), [611 612 613] B = 621 622 623 [631 632 633 stellt Maple die erzeugte Matrix mit ihren Elementen dar, da diese in der Definition explizit angegeben sind Die optionalen Dimensionsangaben sind hier nicht nötig, da durch die vollständige Angabe der Matrixelemente die Definition eindeutig ist. Kennt man allerdings von einer Matrix nur einige Werte, so muß der jeweilige Laufbereich angegeben werden; Maple ersetzt die nichtdefinierten Werte durch ihren formalen Wert- > C .= array(l. 3,1..4, [[eil, cl2, cl3], [c21, c22], []]), eil cl2 cl3 C[i,4]" C21 C22 C[2,3] C[24] C[3,l] C[3,2] C[3,3] C[3f4] C[4,l] C[4,2] C[4,3] C[4,4]_ Als optionale Argumente können Indexfunktionen der Art diagonal, identity, Symmetrie, antisymmetric, sparse benutzt werden. Man erhält damit die entsprechenden Matrizen > arrayA..3,1. 3, antisymmetric); ? [1,2] '[1,3] •'[1,2] 0 ?, •r[l,3] ~r[2,3] [2,3] 0 Ein weiterer Befehl zur Konstruktion von mehrdimensionalen Strukuren ist Array. Dieses Kommando hat die gleiche Form wie array, läßt aber wesentlich mehr Optionen zu. Intern unterscheiden sich beide Befehle durch die Art der Datendarstellung (Hash-table (assoziativer Array), feste Blocktabelle (normaler Array)) 20.3.6.4 Spezielle Anweisungen zu Vektoren und Matrizen Für Aufgaben der linearen Algebra stellt Maple zwei unterschiedliche Spezialpakete bereit. Das Paket linaig basiert auf der Grundstruktur array und stellt entsprechende Spezialkonstruktionen wie matrix, vector und andere sowie entsprechende Operatoren bereit. Das Paket Linear Algebra basiert auf der Array-Struktur, stellt Konstruktionen wie Matrix, Vector und eine große Anzahl spezieller Konstruktions- und Manipulationsvorschriften der linearen Algebra bereit ¦ Mit der Matrix B und dem Vektor X aus dem vorigen Beispiel wird nach dem Zuladen des Pakets lmalg mit > wit/ilinalg, > evalm(£?& * x); [611 xl + 612x2 + 613x3 ,621 xl + 622x2 + 623x3 ,631 xl + 632x2 + 633x3] Die Multiplikation einer Matrix mit einem Spaltenvektor ergibt wieder einen Spaltenvektor. Eine Multiplikation in der umgekehrten Reihenfolge hätte zu einer Fehlermeldung geführt 20.3.7 Prozeduren, Funktionen und Operatoren 20.3.7.1 Prozeduren Der Begriff Prozedur spielt in Maple eine bedeutende Rolle. Etwas vereinfacht dargestellt, hat eine Prozedur folgende Form > P = proc(parral,parra2,... ,parmri) B0.49)
1006 20 Computeralgebrasysteme Beim Aufruf der Prozedur sind dem Namen der Prozedur die benötigten Parameter in runden Klammern zu übergeben. ¦ > / =proc(ir) > xAn > end proc —> / := proc(x) xn end proc und der Aufruf dieser Prozedur ergibt > /(£); —? tn 20.3.7.2 Funktionen Maple enthält eine große Anzahl vordefinierter Funktionen, die beim Start des Systems sofort verfügbar sind bzw. aus Spezialpaketen zugeladen werden können Sie gehören zum Typ mathf unc Eine Auflistung kann mit ?inif cns erhalten werden. In den folgenden zwei Tabellen 20.13 und 20.14 sind einige aus der großen Anzahl von Standars- und speziellen Funktionen gegeben Tabelle 20 13 Standardfunktionen Exponentialfunktion exp Logarithmusfunktionen log, In Trigonom Funktionen sin, cos. tan, cot, sec, esc Arcusfunktionen arcsm, arecos, aretan, arecot, Hyperbol. Funktionen sinh, cosh, tanh. coth, sech, csch Areafunktionen arcsinh, aresosh, aretanh, arecoth, Tabelle 20 14 Spezielle Funktionen BESSEL-Funktionen Jn(z) und Yn(z) BesselJ(v, z), BesselY(v,z) Modifizierte BESSEL-Funktionen In(z) Kn(z) Bessell(i>, z), BesselK(?;, z) Gamma- Funktion Gamma(a:) Integralexponentialfunktion Ei (x) Unter den speziellen Funktionen sind auch die FRESNELschen Funktionen Das Paket für orthogonale Polynome enthält neben anderen HERMiTEsche, LAGUERREsche, Legen- DREsche, J ACOBische und TsCHEBYSCHEFFsche Polynome. Für Einzelheiten wird auf [20.6] verwiesen In Maple verhalten sich Funktionen wie Prozeduren Etwas vereinfacht- der Name einer Funktion, sofern sie in Maple definiert ist, wird als Prozedur aufgefaßt Mit anderen Worten, type(sin, procedure). liefert true Hängt man an die Prozedur das Argument oder auch mehrere, sofern dies nötig ist in runden Klammern an, so entsteht die entsprechende Funktion von der angegebenen Variablen ¦ > type(cos, procedure), liefert true und > type(cos, function); liefert false Setzt man als zu prüfendes Argument jedoch cos(a:) ein, so liefert die Typprüfung genau die umgekehrte Aussage Maple bietet daher die Möglichkeit, selbstdefinierte Funktionen in Form von Prozeduren zu erzeugen Dazu dient der Erzeugungsoperator x-> . Mit > F = x-> mathausdr : B0 50) und mit mathausdr als algebraischer Ausdruck in der Variablen x, wird eine neue Funktion in Prozedurform mit dem Namen F festgelegt Der algebraische Ausdruck kann dabei schon vorher definierte und/oder eingebaute Funktionen enthalten Hängt man an das so erzeugte Prozedursymbol eine unabhängige Variable in runden Klammern an, so entsteht die zugehörige Funktion dieser unabhängigen Variablen ¦ > F .= x-> sin(x) * cos(x) + xA3 * tan(x) + xA2 .
20.3 Mäple 1007 > F{y); —? F(y) •= sin(y) cos(y) + yi tan(y) + y2 Mit der Übergabe von Zahlenwerten (etwa als Gleitpunktzahlen) an dieses Argument, also durch Aufrufe der Art > F(nnmmm); liefert Maple den Funktionswert für diesen Wert Umgekehrt erzeugt man aus einer Funktion (man denke etwa an ein Polynom in der Variablen x) die zugehörige Prozedur mit der Anweisung unapply(function, var) So entsteht aus F(y) mit > unapply(FB/),2/), —> F wieder die Prozedur mit dem Symbol F 20.3.7.3 Funktionaloperatoren Funktionaloperatoren sind Spezialformen von Prozeduren Sie dienen als Anweisungen zur Manipulation und Kombination von Funktionen (Prozeduren) Mit Operatoren kann man nach den üblichen Regeln arbeiten Summe und Differenz zweier Operatoren sind wieder Operatoren Bei der Multiplikation ist zu beachten, daß darunter die Hintereinanderanwendung beider Operatoren zu verstehen ist. Maple benutzt dafür das spezielle Multiplikationssymbol @ Diese Multiplikation ist im allgemeinen nicht kommutativ. ¦ Es sei F = x—> cosB * x) und G := x—> xA2. Dann gilt > (G<3F)(x); —? cos2Bx), während > (F*G)(x)\ —? cosBz2) liefert Will man das Produkt zweier Funktionen bilden, die in Operatordarstellung gegeben sind, so benutzt man die Schreibweise (F * G)(x) = (G * F)(x), die F(x) * G(x) liefert 20.3.7.4 Differentialoperatoren Der Operator der Differentiation lautet in Maple D. Seine Anwendung erfolgt auf Funktionen in Prozedurform entsprechend D(F) bzw D[i](G). Im ersten Fall wird die Ableitung einer Funktion von einer Variablen in Prozedurform bestimmt Das Anhängen der geklammerten Variablen ergibt die Ableitung als Funktion In anderer Form läßt sich dies als D(F)(x) = diff(F(x),x) schreiben. Höhere Ableitungen erhält man durch Mehrfachanwendung des Operators D, was sich vereinfacht als (DO ®n)(F) schreiben läßt, wobei @ @ n die n-te „Potenz" des Differentialoperators bedeutet. Ist G eine Funktion mehrerer Variabler, so erzeugt D[«](G) die partielle Ableitung von G nach der i- ten Variablen Auch dieses Ergebnis ist wieder eine Prozedur. Mit D[z, j](G) erhält man D[z](D[j](G)), d.h. die zweite partielle Ableitung nach der j-ten und i-ten Variablen Entsprechend kann man höhere Ableitungen bilden Für den Diffentialoperator D gelten die aus der Differentialrechnung (s. 6.1 2.2, S. 395) bekannten Grundregeln, wobei F und H differenzierbare Funktionen sind. D(F + H) = D(F) + D(#), B0 51a) D(F * H) = (D(F) *H) + (F* D(H)), B0 51b) D(F @ H) = D(F) QH*D(H). B0.51c) 20.3.7.5 Der Funktionaloperator map Der Operator map kann in Maple benutzt werden, um einen Operator bzw. eine Prozedur auf einen Ausdruck bzw dessen Komponenten anzuwenden SeizB Feine Prozedur, die eine Funktion repräsentiert Dann liefert map(F, x + xA2 + x * y) den Aussdruck F(x) + F(x2) + F(x y). Entsprechend erhält man mit map(F; y * z) das Resultat F(y) * F(z). ¦ map(/,[a,6,c1d]); —» [f(a)J(b)J(c)J(d)}
1008 20. Computeralgebrasysteme 20.3.8 Programmierung in Maple Maple stellt für den Aufbau eigener Prozeduren und Programme die üblichen Kontroll- und Schleifenstrukturen in spezifischer Form bereit Fallunterscheidungen werden mit dem if-Befehl vorgenommen. Seine Grundstruktur ist if bed. then anwl eise anw2 end if B0 52) Der else-Zweig kann fehlen Vor dem else-Zweig können beliebig viele weitere Zweige mit der Struktur elif bedi then anwi end if B0 53) eingefügt werden. Schleifen erzeugt man mit f or bzw while, die den Anweisungsteil in der Form do .. anw . end do verlangen. In der f or-Schleife ist der Laufindex in der Form i from n to m by di zu schreiben, hier ist di die Schrittweite. Fehlen Anfangswert und Schrittweite, so werden diese automatisch auf 1 gesetzt. In der while-Schleife lautet der erste Teil while bed do anw end do Auch Schleifen können mehrfach ineinander verschachtelt werden Um in sich abgeschlossene Programme zu gestalten, benutzt man in Maple die Prozeduranweisung Sie kann sich über viele Zeilen erstrecken, entsprechend abgespeichert und unter ihrem Namen in die laufende Arbeit eingefügt werden. Ihre Grundstruktur lautet: proc(args) local options . . B0 54) anw end proc, Die Anzahl der Argumente der Prozedur muß nicht mit der im eigentlichen Körper benutzten Anzahl übereinstimmen; speziell kann die Angabe ganz fehlen Alle mit local definierten Variablen sind nur intern bekannt. ¦ Es soll eine Prozedur geschrieben werden, die die Summe der Quadratwurzeln aus den ersten n natürlichen Zahlen bestimmt > sumqw := proc(n) > local s,z, > s[0] := 0, > f or i to n > do s[i] '= s[i — 1] + sqrt(i) end do, > evalf(s[rc]), > end proc, Maple liefert die so definierte Prozedur zurück Dann wird die Prozedur über ihren Namen mit dem gewünschten Argument n aufgerufen. > sumqwCQ): Es folgt- 112 0828452 20.3.9 Ergänzungen zur Syntax, Informationen und Hilfe 20.3.9.1 Nutzung der Maple-Bibliothek Maple besteht aus drei Hauptkomporienten dem Kernel, einer Maple-Bibliothek und der Benutzeroberfläche Der Kernel ist in C geschrieben und sichert die Grundfunktionalität des Systems nebst mathe-
20 3 Maple 1009 matischen Basisoperationen Der Hauptteil der mathematischen Funktionalität liegt in dei Bibliothek Je nach Bedarf werden die entsprechenden Teile automatisch hinzugeladen. Darüber hinaus besitzt Maple eine umfangreiche Bibliothek von Spezialpaketen. Die Zuladung eines Spezialpaketes erfolgt mit dem Befehl > with(narae), B0.55) Hier ist narrte der Name des jeweiligen Pakets, also etwa linaig für das Spezialpaket Lineare Algebra Nach dem Aufruf listet Maple alle Befehle des Spezialpakets auf und warnt, falls im Paket Neudefinitionen schon vorher verfügbarer Befehle vorliegen. Soll nur ein spezieller Befehl aus einem Bibliothekspaket genutzt werden, so erfolgt der Aufruf mit paket[bef ehl] B0 56) 20.3.9.2 Umgebungsvariable Die Ausgaben von Maple lassen sich mit einer Reihe von Umgebungsvariablen steuern Bereits vorgestellt ist die Variable Digits (s. 20.3 2 3,1., S 1000), mit der die Anzahl der auszugebenden Ziffern von Gleitpunktzahlen festgelegt werden kann Die allgemeine Art der Resultatausgabe wird durch prettyprint festgelegt Voreinstellung ist hier > mterf ace(prettyprint = true) B0 57) Diese sorgt für die zentrierte Ausgabe im mathematischen Druckstil. Setzt man diese Option auf f alse, so beginnt die Ausgabe am linken Rand und nutzt die Eingabeschreibweise. 20.3.9.3 Informationen und Hilfe Hilfe zur Bedeutung von Befehlen und Schlüsselwörtern erhält man durch die Eingabe begriff-, B0 58) Anstelle des Fragezeichens kann auch help(begriff) verwendet werden Es folgt ein Hilfsbildschirm, der die entsprechenden Aussagen des Bibliothekshandbuches zum geforderten Begriff enthält. Läuft Maple unter Windows, so öffnet ein Aufruf von HELP ein sich jeweils nach rechts erweiterndes Menü, durch das man sich durch Anklicken mit der Maus bis zur Erläuterung des gewünschten Begriffs auf dem Hilfsbildschirm bewegen kann
1010 20 Computeralgebrasysteme 20.4 Anwendungen von Computeralgebrasystemen In diesem Unterkapitel wird die Behandlung mathematischer Problemkreise mit Computeralgebiasy- stemen vorgestellt Die Auswahl der betrachteten Problemkreise wurde sowohl nach ihrer Häufigkeit in Praxis und Ausbildung als auch nach den Möglichkeiten für ihre Bearbeitung mit Computeralgebrasystemen getroffen. Es werden Funktionen, Anweisungen. Operationen und ergänzende Syntaxhinweise für das jeweilige Computeralgebrasystem angegeben sowie Beispiele behandelt Wo nötig, werden zugehörige Spezialpakete kurz erläutert 20.4.1 Manipulation algebraischer Ausdrücke In der Praxis treten häufig algebraische Ausdrücke (s. 1.1.5, S. 10) auf, die für die weitere Arbeit, wie z B Differentiation, Integration, Reihendarstellung, Grenzwertbildung oder numerische Auswertung umzuformen sind In der Regel werden diese Ausdrücke als über dem Ring (s 5 3 6, S 323) der ganzen oder dem Körper (s 5 3 6,2., S 323) der rationalen Zahlen gebildet verstanden Es sei aber betont, daß Computeralgebrasysteme z.B. auch mit Polynomen über endlichen Körpern bzw über Erweite- rungsköipern (s 5.3 6,3., S 323) der gebrochenrationalen Zahlen umgehen können Für Interessenten muß dazu auf die Spezialliteratur verwiesen werden Eine besondere Rolle spielen algebraische Opeia- tionen auf Polynomen über dem Körper der rationalen Zahlen 20.4.1.1 Mathematica Mathematica stellt die in Tabelle 20.15 dargestellten Funktionen und Operatoren für die Umformung algebraischer Ausdrücke zur Verfügung Tabelle 20 15 Anweisungen zur Manipulation algebraischer Ausdrücke Expand[p] Expand[p, r] PowerExpand[a] Factor[p] Collect [p, &•] Collect[p, {.x, y, }] ExpandNumerator[r] ExpandDenommator[r] ExpandAll[r] Together[r] Apart [r] Cancel[r] löst die Potenzen und Produkte in einem Polynom p durch Ausmultiplikation auf multipliziert nur die Anteile in p aus, die r enthalten lost auch Potenzen von Produkten und Potenzen von Potenzen auf faktorisiert ein Polynom vollständig ordnet das Polynom nach Potenzen von x das gleiche wie vorstehend, nur mit mehreren Variablen entwickelt nur den Zähler eines rationalen Ausdrucks entwickelt nur den Nenner multipliziert sowohl Zähler als auch Nenner vollständig aus stellt den Ausdruck mit einem gemeinsamen Nenner dar stellt den Ausdruck als Summe von Tennen mit einfachen Nennern dar (Partialbruchzer legung) kürzt gemeinsame Faktoren in den jeweiligen Termen 1. Multiplikation von Ausdrücken Diese Operation der Multiplikation algebraischer Ausdrücke ist in jedem Falle durchführbar Dabei können Koeffizienten auch unbestimmte Ausdrücke sein ¦ In[l] = Expand[(£ + y - z)A4] liefert Out [1] = x4 + 4 x3 y + 6 x2 y2 + 4 x y:i + y4 - 4 x3 z - 12 x2 y z - 12 x y2 z - 4 y3 z +6x2 z2 + 12xy z2 + 6y2 z2 - 4xz3 - 4y z3 + z4 Entsprechend wird In[2] = Expand[(a x + byA2)(c xA3 - d yA2)] Out [2] = aex4 — adxy2 -\-bcx3y2 — bdy4 2. Fakt orzer legung von Polynomen Die Faktorzerlegung von Polynomen über ganzen oder rationalen Zahlen wird von Mathematica nur ausgeführt, wenn sie im Bereich der ganzen oder rationalen Zahlen möglich ist Anderenfalls gibt Ma-
20 4 Anwendungen von Computeralgebrasystemen 1011 thematica den Ausdruck unverändert zurück. ¦ In[2] •= p = xA6 + 7a:A5 + 12xA4 + 6zA3 - 25a:A2 - 30a: - 25, In[3] := Factor[p] , dies liefert 0ut[3] = (E + x) A + x + a:2) (-5 + x2 + x3)) Mathematica hat das Polynom in drei über dem Körper der rationalen Zahlen irreduzible Faktoren zerlegt. Wenn ein Polynom über dem Körper der komplexen rationalen Zahlen vollständig reduzibel ist, kann man mit der Option Gaussianlntegers eine vollständige Zerlegung erreichen. ¦ In[4J = Factor[x2 - 2x + 5] —> Out [4] = 5 - 2x + x2 , aber In[5] •= Factor[%,Gaussianlntegers—> True] Out [5] = (-l-2I + x)(-l + 2I + x) 3. Operationen auf Polynomen Die Tabelle 20.16 enthält eine Auswahl von Operationen, mit denen sich Polynome über dem Körper der rationalen Zahlen algebraisch manipulieren lassen Tabelle 20.16 Algebraische Polynomoperationen PolynomialGCD[pl,p2] bestimmt den größten gemeinsamen Teiler der beiden Polynome p\ und p2 PolynomialLCM[pl,p2] bestimmt das kleinste gemeinsame Vielfache der Polynome pl und p2 PolynomialQuotient[pl, p2, x] Division von pl (als Funktion von x) durch p2 unter Fortlassung des Restes PolynomialRemainder[pl, p2, x] Bestimmung des Restes bei der Division von p\ durch p2 M Es werden zwei Polynome definiert* In[l] =p = .ta6 + 7xA5 + 12xA4 + 6xA3 - 25xA2 - 30a: - 25, q = xA4 + xA3 - 6xA2 - 7x - 7; Mit diesen Polynomen ergeben die nachfolgenden Operationen In[2] •= PolynomialGCD[p, q] —? Out [2] = 1 + x + x2 In[3] = PolynomialLCM[p, q] Out[] = 3(-7 + x){l + x + x2)(-25 - 5x + 5a:2 + 6x3 + x4) In[4J := PolynomialQuotient[p, q, x] —? Out[4] = 12 + 6x + x2 In[5] = PolynomialRemainder[p, q, x] —> Out [5] = 59 + 96a: + 96a:2 + 37x3 Unter Berücksichtigung der letzten beiden Ergebnisse gilt also x6 + 7a:5 + 12a:4 + 6a:3 - 25a:2 - 30a; - 25 , „ _ 37a:3 + 96x2 + 96a: + 59 x4 + x3 - 6a:2 -Ix - 7 x4 + x3 - 6a:2 - 7x - 7 4. Partialbruchzerlegung Mathematica zerlegt Quotienten zweier Polynome in Partialbrüche Auch das ist nur über dem Körper der rationalen Zahlen möglich. ¦ Unter Nutzung der beiden Polynome p und q des voranstehenden Beispiels erhält man r , , r n -6 -55 + IIa: + 6a:2 In[6J = Apart[g/P] - 0ut[6j = 3^^^ + 35 (_5 + ,, + ^
1012 20. Computeralgebrasysteme 5. Manipulation nicht polynomialer Ausdrücke Mit dem Befehl Simplif y können oft komplizierte Ausdrücke, die nicht polynomialer Natur zu sein brauchen, vereinfacht werden. Mathematica wird immer versuchen, algebraische Ausdrucke unabhängig von der Natur der symbolischen Größen zu manipulieren. Dabei verwendet es eingebaute Kenntnisse So kennt Mathematica z.B. Regeln der Potenzrechnung (s. 1.1 4 1, S. 8) In[1] •= Simplify[aAn/aAm)] —? Out [1] = a(_m+n) B0.59) Mit dem Befehl FullSimplif y[ausdr] wird Mathematica einen wesentlich breiteren Ansatz zur Vereinfachung einsetzen. Für die Manipulation trigonometrischer Ausdrücke stehen die Befehle Tr igExpand, TrigFactor, TrigFactorList und TrigReduce zur Verfügung. ¦ In[l] := TrigExpand[Sin[2x] Cos[2z]] Out[l] = 2Cos[x]Cos[2/]2Sin[x]-2Cos[x](Cos[?/] + Sin[?/]) In[2] := TrigFactor[%] 0ut[2] = 2Cos[o;]Sin[a;](Cos[2/]-Sin[y])(Cos[y] + Sin[y]) In[3] •= TrigReduce[%] Out[3] = (l/2)(Sin[2x-2y] + Sin[2x + 2y]) Schließlich sei darauf hingewiesen, daß der Befehl ComplexExpand[ausdr] reelle Variable ausdr voraussetzt, während ComplexExpand[ausdr, {xl, x2,...}] von komplexen Variablen xi ausgeht. m In[l] .— ComplexExpand[Sin[2 x], {x}] " Out [1] = Cosh[2 Im[x]] Sin[2 Re[x}] + / Cos[2 Re[x}\ Sinh[2 Im[x]] 20.4.1.2 Maple Maple stellt die in Tabelle 20.17 dargestellten Operationen für die Umformung und Vereinfachung algebraischer Ausdrücke bereit. Tabelle 20 17 Operationen zur Manipulation algebraischer Ausdrücke expand(p, gl, g2,...) löst die Potenzen und Produkte in einem algebraischen Ausdruck p auf Die optionalen Argumente qi verhindern die weitergehende Auflösung der Unterausdrücke qi. f actor(p, K) faktorisiert den Ausdruck p. K ist ein optionales RootOf Argument, simplify(p, gl, #2,.. ) wendet eingebaute Vereinfachungsregeln auf p an. Bei Anwesenheit der optionalen Argumente werden nur diese zur Anwendung gebracht radsimp(p) vereinfacht p bezüglich seiner Wurzelanteile, normal (p) stellt p in der Normalform einer rationalen Punktion dar sort(p) sortiert die Glieder des Polynoms p nach fallenden Potenzen, coef f (p, x, i) liefert den Koeffizienten des Gliedes mit x%. collect(p, v) faßt Glieder mit der Variablen v eines Polynoms mehrerer Veränderlicher zusammen. 1. Multiplikation von Ausdrücken Im einfachsten Fall zerlegt Maple den Ausdruck in eine Summe von Potenzen der Variablen- ¦ > expand((:r + y — ^)A4); 4 x3y - 4 x3z + 6 x2y2 + 6 x2z2 + 4 xy3 - 4 xz3 - 4 y3z + 6 y2z2 - 4 yz3 + x4 + y4 + z4 -12 x2yz - 12 xy2z + 12 xyz2 ¦ Hier erkennt man das Vorgehen von Maple bei Ab- und Anwesenheit eines optionalen Arguments > expand((a * xA3 + b * yA4) * sinC * x) * cosB * x)); 8 ax3 sin(:r) cos(xL — 6 ax3 sin(x) cos(icJ + ax3 sin(rr) -I- 8 by4 sin(x) cos(xL —6 by4 sin(x) cos(xJ + by4 sin(x)
20 4 Anwendungen von Computeralgebrasystemen 1013 Der Ausdruck wird vollständig ausmultipliziert > expand((a * xA2 — b * yA3) * sin(S * x) * cosB * x), a * xA2 — 6 * yA3), 8 (ax2 — fa/3) sin(a;) cos(xL — 6 (ax2 — by3) sin(x) cos(xJ -f (ax2 — by3) sin(x) Maple hat den Ausdruck des optionalen Arguments unverändert beibehalten ¦ Dies demonstriert die Fähigkeiten von Maple > expand(expB * a * x) * sinhB * x) + ln{x3) * ,smD * x))\ 2ear2 sinh(:r) cosh(z) + 24 ln(a;) sin(x) cos(.tK — 12 ln(a;) sin(x) cos(x) 2. Faktor Zerlegung von Polynomen Maple ist in der Lage Polynome über algebraischen Erweiterungskörpern zu zerlegen, sofern dies prinzipiell möglich ist (s. 5 3.6.3., S. 323). ¦ > p = xA6 + 7 * xA5 + 12 * xA4 + 6 * xA3 - 25 * xA2 - 30 * x - 25 q = xA4 + xA3 -6*xA2-7*x-7. > pl = f actor(p); (x + 5) (x2 + x + 1) (z3 + r2 - 5) und > ql = idLCtor(q), (.r2 + x + l)(.r2-7) Zunächst hat Maple eine Faktorzerlegung der beiden Polynome in irreduzible Faktoren bezüglich des Körpers der rationalen Zahlen durchgeführt Will man eine weitere Zerlegung über einem algebraischen Erweiterungskörper, so ist folgendermaßen vorzugehen ¦ >p2 =factor(j9,(-3)A(l/2)), (.r3 + x2 - 5) B.t + 1 - y/^S) Bx 4- 1 + v71^) (x + 5) 4 Maple hat den zweiten Faktor weiter zerlegt (in diesem Fall nach einer formalen Erweiterung des Körpers mit v7—3) In der Regel weiß man nicht, ob eine solche Erweiterung möglich ist Sind die Grade der gefundenen Faktoren < 4, so ist dies immer möglich Mit der Operation RootOf lassen sich dann die Wurzeln als algebraische Ausdrücke darstellen ¦ > r .= RootOf (x3 + x2 - 5) . k = allvalues(r) > Mi], 1/3 i/l33 > > fc[2], 3/133 L 18 + 18 133 V65EV3 ~5^+ 18 18/133 + .VS55VI Ver! V3 / . 133 VsEüVä 54 18 1/3 54 18 J133 v/655V3
1014 20. Computeralgebrasysteme Der Aufruf von k[3] ergibt den konjugiert komplexen Wert von k[2]. Die in diesem Beispiel beschriebene Prozedur liefert im Falle eines Polynoms, das nur über dem Körper der reellen oder komplexen Zahlen reduzibel ist, eine Folge der Wurzeln als Gleitpunktzahlen. 3. Operationen auf Polynomen Neben den schon bekannten Operationen sind vor allem die Operationen gcd und 1cm von Bedeutung Sie finden den größten gemeinsamen Teiler (ggT) bzw das kleinste gemeinsame Vielfache (kgV) zweier Polynome. Entsprechend liefern quo(p, q, x) den ganzzahligen Anteil der Division der Polynome p und q und rem(p, q, x) den Rest. ¦ > p := x6 + 7 * x5 + 12 * x4 + 6 * xs - 25 * x2 - 30 * x - 25 q := x4 + x3 — 6*:r2 — 7 * z — 7 : > gcd(p,g), x2 + x + 1 > lcm(p,g); 210x + 5rr6 - 43a;5 - 109x4 - 72z3 + 150a:2 + 175 + 7x7 + x8 Mit dem Befehl normal kann man den Quotienten zweier Polynome über dem Körper der rationalen Zahlen in Normalform bringen, d.h. als Quotienten zweier gekürzter Polynome darstellen ¦ Mit den Polynomen des voranstehenden Beispiels wird > normal(p/q); x4 + 6x3 + 5x2 -5x-25 x2 -1 Mit numer und denom lassen sich Zähler und Nenner getrennt darstellen. > f actor(denom(x + l)/(a;A2 - 7), G)A(l/2)); [x +JJ)(x- y/T) 4. Partialbruchzerlegung Die Partialbruchzerlegung erfolgt in Maple mit dem Befehl convert, der mit der Option parf rac aufzurufen ist. ¦ Unter Benutzung der Polynome p und q der voranstehenden Beispiele erhält man > convert (p/q, parf rac, x), 2 n 1rt 372T + 59 x2 + 6x + 12 + —-—— und x2 — 7 > convert (q/p, parf rac, x), 6 -55 + 11 £ + 6x2 ~35x + 175 + 35z3 + 35x2 - 175 5. Manipulation allgemeiner Ausdrücke Die in der folgenden Tabelle aufgeführten Operationen erlauben die Umformung algebraischer und transzendenter Ausdrucke mit rationalen und algebraischen Funktionen, die in Maple eingebaute oder selbstdefinierte Funktionen enthalten. In der Regel lassen sich dabei optionale Argumente angeben, die die Umformung unter bestimmten Bedingungen ausführen. Der Befehl simplif y kann hierfür exemplarisch eingesetzt werden. In der einfachen Form simplif y(ausdr) versucht Maple eingebaute Vereinfachungsregeln auf den Ausdruck anzuwenden ¦ > t = sinhC * x) + cosh(A * x) . > simplify(t); 4 sinh(a;) cosh(a;J — sinh(x) + 8 cosh(xL — 8 cosh(xJ + 1
20 4 Anwendungen von Computeralgebrasystemen 1015 Entsprechend wird > r = sinB * x) * cosC * x) : > simplify(r), 8 sin(x) cos(xL - 6 sin(jc) cos(xJ Darüber hinaus existiert der Befehl combme, der im gewissen Sinne die Umkehrung von expand ist ¦ > t •= tan{2 * xJ • > t\ := expand(t); 4 sin(xJcos(xJ ~ B cos(xJ - lJ > combme(tl,trig); cosBa:)-2-l Hier wurde combme mit der Option trig aufgerufen, die dafür sorgt, daß trigonometrische Grundregeln angewendet werden Benutzt man den Befehl simplif y, so wird cosB xJ - 1 > t2 = simplify(*);,—> v ,' NO F )U cosB:rJ Hier hat Maple die Tangensfunktion auf die Kosinusfunktion zurückgeführt Umformungen lassen sich auch mit Exponentialfunktionen, Logarithmus- und weiteren Funktionen wie etwa Besselfunktionen, Gammafunktionen und andere durchführen 20.4.2 Lösung von Gleichungen und Gleichungssystemen Computeralgebrasysteme kennen Befehlsroutinen zur Lösung von Gleichungen und Gleichungssystemen Sofern Gleichungen im Bereich der algebraischen Zahlen explizit lösbar sind, werden die Lösungen mit Hilfe von Wurzelausdrücken dargestellt Ist es nicht möglich, Lösungen in geschlossener Form anzugeben, so lassen sich zumindest numerische Lösungen im Rahmen festlegbarer Genauigkeit finden Im folgenden werden einige Grundbefehle vorgestellt. Der Lösung linearer Gleichungssysteme ist der spezielle Abschnitt 20 4.3 2,1., S. 1021 gewidmet 20.4.2.1 Mathematica 1. Gleichungen Mathematica ermöglicht die Manipulation und Lösung von Gleichungen in einem breiten Rahmen. Eine Gleichung wird in Mathematica als logischer Ausdruck aufgefaßt. Wenn man schreibt In[l] -=g = xA2 + 2x-9==0, B0 60a) so interpretiert Mathematica dies als die Aufstellung einer Identität Gibt man In[2] .= %/. x-> 2, ein, so erscheint Out [2] = False, B0 60b) weil mit diesem Wert von x linke und rechte Seite nicht identisch sind. Die Anweisung Roots[#, x] veranlaßt, die obige Identität in eine Form zu bringen, die x explizit enthält Mathematica stellt das Ergebnis mit Hilfe des logischen ODER wieder in der Form einer logischen Aussage darin [2] = Root s [g, x] liefert Out[2] = x==-l- VlÖ\\x == -1 + >/lÜ B0 60c) In diesem Sinne können logische Operationen mit Gleichungen durchgeführt werden Mit der Operation ToRules können nachfolgend Gleichungen des logischen Typs wie oben in Transformationsregeln umgewandelt werden So ergibt In[3] .= {ToRules[%]} -> Out[3] = {{x-> -l-VTÖ},{x-> -1 + vTÖ}} B0.60d)
1016 20 Computeralgebrasysteme 2. Lösung von Gleichungen Mathematica stellt die Anweisung Solve für die Lösung von Gleichungen zur Verfügung. In gewissem Sinne führt Solve nacheinander die Operationen Roots und ToRules durch. Mathematica ist nur in der Lage, Gleichungen symbolisch zu lösen, wenn dies in Form algebraischer Ausdrücke überhaupt möglich ist, d h. höchstens Gleichungen vierten Grades Wenn jedoch Gleichungen höheren Grades durch algebraische Manipulationen wie Faktorisierung in einfachere algebraische Ausdrücke umgeformt werden können, dann ist Mathematica auch hier in der Lage, Lösungen zu bieten Solve versucht in solchen Fällen, mit den eingebauten Operationen Expand und Decompose entsprechende Zerlegungen vorzunehmen. Prinzipiell kann Mathematica unter bestimmten Voraussetzungen numerische Lösungen anbieten ¦ Allgemeine Lösung einer Gleichung dritten Grades: In[4J := Solve[xA3 + a xA2 + b x + c== 0,x] Mathematica liefert Out[4] ={{x-> ^ 6 i 23 (-Q2 + 3fr) 1 I / , o.nx ¦ ,,o ¦ , o ^ , . ^ .A3 3(-2a3 + 9a6-27c + 32 yj- (a2b2) +463 + 4a3c - 18a6c + 27 c2] (-2a3 + 9a& - 27c + 3§ ^-(a2 62) + 463 +4a3c-18a&c +27c2 i 3 1 -}, 323 Wegen der Länge ihrer Terme wurde in der Lösungsliste nur die erste Lösung explizit aufgeführt Will man eine Gleichung mit gegebenen Koeffizienten a,b,c lösen, so ist es besser, die Gleichung selbst mit Solve zu behandeln, als die Werte von a, b, c der formalen Lösung zuzuweisen. ¦ A: Für die kubische Gleichung (s. 1 6 2 3, S 40) x3 + 6x + 2 = 0 wird- In[5] = Solve[xA3 + 6z + 2==0,:r] OutCSj = «,-> 2V3 . *,}, {,_> i_^ _ iW3}> {,_> _i_^3 _ iW3}} ¦ B: Lösung einer Gleichung 6. Grades: In[6] : = Solve[xA6 - 6xA5 + 6xA4 - 4xA3 + 65xA2 - 38a; - 120 == 0, x] Out[6] = {{x-> -l},{a:->4},{x->3},{a:-> 2},{x-> -l-2z},{x-> -l + 2i}} Mathematica ist es gelungen, die Gleichung in Beispiel B mit internen Mitteln zu faktorisieren; danach wird sie problemlos gelöst Wenn es um numerische Lösungen geht, sollte man von vornherein die Anweisung NSolve benutzen, sie ist meist schneller ¦ Die folgende komplizierte Gleichung löst man mit NSolve: In[7] : = NSolve[^A6 - 4xA5 + 6xA4 - 5xA3 + SxA2 - ix + 2 == 0, x] Out [7] = {{x-> -0.379567- 0.76948 z}, {x-> -0.379567 +0 76948z}, {x-> 0 641445}, {x-> 1. - 1. z}, {x-> 1. + 1. z}, {x-> 2.11769}} 3. Lösung transzendenter Gleichungen Mathematica ist in der Lage, auch transzendente Gleichungen zu lösen. In der Regel ist dies symbolisch nicht möglich Außerdem können solche Gleichungen oft unendlich viele Lösungen haben Daher sollte man Mathematica in solchen Fällen eine Vorgabe für die Umgebung machen, in der eine Lösung gefunden werden soll Das ist mit der Anweisung FindRoot[g, {x,xs}] möglich, wobei xs der Startwert für
20 4 Anwendungen von Computeralgebrasystemen 1017 die Lösungssuche ist ¦ In[8] . = FindRoot[x + ArcCoth[x] - 4 == 0, {x, 1.1}] Out [8] = {x-> 1 00502} und In[9] = FindRoot[z + ArcCoth[:z]-4==0jz,5}] —> Out [9] = {x-> 3 72478} 4. Lösung von Gleichungssystemen Mathematica kann simultan mehrere Gleichungen lösen Die dafür eingebauten Operationen sind in Tabelle 20.18 dargestellt und betreffen die symbolische, nicht die numerische Lösung von Gleichungssystemen Tabelle 20.18 Operationen zur Lösung von Gleichungssystemen Solve[{/i == ri, li == r2,.. }, {sc, y,...}] löst das gegebene Gleichungssystem nach den Unbekannten auf Eliminate[{/i == ri, },{#, }] eliminiert die Elemente x. . aus dem Gleichungssystem Reduce[{/i == rx,...}, {x,. .}] vereinfacht das Gleichungssystem und liefert alle möglichen Lösungen Wie im Falle einer Unbekannten, erhält man mit der Anweisung NSolve eine numerische Lösung Beispiele für die Lösung von linearen Gleichungssystemen werden in 20 4 3, S 1019, behandelt 20.4.2.2 Maple 1. Wichtige Operationen Die beiden grundsätzlichen Operationen zur symbolischen Lösung von Gleichungen in Maple sind solve und RootOf bzw roots Mit ihnen und ihren möglichen Variationen durch bestimmte optionale Argumente gelingt es, eine Vielzahl von Gleichungen, auch transzendente, zu lösen Wenn eine Gleichung nicht in geschlossener Form lösbar ist, kann Maple nur numerische Näherungslösungen anbieten Die Funktion RootOf ist das Symbol für alle Wurzeln einer Gleichung einer Variablen Mit k := RootOf {xA3 - 5 * x + 7, x) —> k .= RootOf (_Z3 - 5 _Z + 7) B0 61) versteht Maple unter k die Gesamtheit der Wurzeln der Gleichung xs — hx + 7 = 0 Dabei wird der eingegebene Ausdruck, wenn möglich, in eine einfache Form gebracht und mit der globalen Variablen _Z dargestellt Der Aufruf allvaluesfA;) liefert eine Folge der Wurzeln. Der Befehl solve liefert die Lösung einer Gleichung, sofern diese existiert ¦ > k := solve(xA4 + xA3 - 6 * xA2 - 7 * x - 7, x); während >r = solve(a:A6 + 4*a:A5-3*x + 2,x);;—> r := RootOf(_Z6 + 4_Z5 - 3_Z + 2) ergibt Diese Gleichung besitzt im Bereich der rationalen Zahlen keine Lösungen Mit allvalues erhält man genäherte numerische Lösungen. 2. Lösung von Gleichungen mit einer Unbekannten 1. Polynomgleichungen Polynomgleichungen mit einer Unbekannten, für deren Grad < 4 gilt, kann Maple symbolisch lösen ¦ > solve(xA4 - 5 * zA2 - 6); —> I, -I, >/6, -\/6 2. Gleichungen 3. Grades Mit Maple kann man die allgemeine Gleichung dritten Grades mit all-
1018 20 Computeralgebrasysteme a gemeinen Koeffizienten in geschlossener Form lösen. ¦ >r = solve(xA3 + a * xA2 + b*x + c, x) >r[l]1 ba_c_a?_ y/4 fe3 - b2a2 - 18 bac + 27 c2 + 4 ca3\/3 ~6~ ~ 2 ~ 27 + 18 3 9 Ibä c ä3 y/4 fr3 - b2a2 - 18 frac + 27 c2 + 4 ca3y/3 3 V~6~~ 2 ~ 27 + 18 Man erhält entsprechende Ausdrücke für r[2], r[3], die wegen ihrer Länge hier nicht explizit angegeben werden. 3. Allgemeine Gleichung 4. Grades Auch die allgemeine Gleichung vierten Grades wird von Maple ohne Probleme gelöst Benutzt man in solve eine Gleichung, in der Koeffizienten als Gleitpunktzahlen geschrieben sind, so löst Maple die Gleichung numerisch. ¦ > solve(l. * xA3 + 6. * x + 2 , x), -3 27480002, .1637400010 - 2.465853271, .1637400010 + 2 465853271 Maple kann Gleichungen lösen, die Wurzelausdrücke der Unbekannten enthalten Hier ist jedoch zu beachten, daß Maple nur dann Lösungen anbietet, wenn die Gleichung (die ja quadriert werden muß) keine Scheinlösungen liefert. ¦ Für die Gleichung y/x + 7 + y/2x — 1 — 1 = 0 bietet Maple keine Lösung, da zweimal quadriert werden muß und die resultierende quadratische Gleichung eine Scheinlösung der Ausgangsgleichung liefert. ¦ Die Gleichung yfx — x + 1 = 0 löst Maple dagegen ohne Probleme: > solve(a: A A/3) -x + l,x); liefert A08+12^I/3 + . 2 A08 + 12X/69I/3 3. Lösung transzendenter Gleichungen Gleichungen, die transzendente Teile enthalten, lassen sich im allgemeinen nur numerisch lösen Maple bietet für die numerische Lösung von Gleichungen beliebiger Art den Befehl f solve . Mit seiner Hilfe versucht Maple, reelle Wurzeln der untersuchten Gleichung zu finden. Dabei wird in der Regel nur eine Wurzel angegeben. Oft haben jedoch transzendente Gleichungen viele Wurzeln. Deshalb erwartet der Befehl f solve als drittes Argument die optionale Angabe des zu betrachtenden Bereichs für die Suche nach einer Wurzel. ¦ > f solve(x + arccoth(x) - 4 = 0,x,2..4), —> 3.724783628 aber > f solve(a; + arccoth(x) - 4 = 0, x = 1.005); —> 1.005020099 B0 62) 4. Lösung von nichtlinearen Gleichungssystemen Systeme von Gleichungen lassen sich mit denselben Befehlen solve und f solve lösen Dazu sind als erstes Argument des Befehls alle Gleichungen in geschweifte Klammern zu fassen, als zweites Argument erwartet der Befehl die Unbekannten, nach denen aufgelöst werden soll, ebenfalls in geschweiften Klammern: > solve({#/1,0/2,. }, {xl, x2, }); B0 63) ¦ > solve{{xA2-yA2 = 2,xA2 + yA2 = 4},{x,y}); B0 64) {y = iiX = v^}, {y = l,x = -Vs},{y = -l,a; = V^}, {y = -l,x = -VS\
20.4 Anwendungen von Computeralgebrasystemen 1019 20.4.3 Elemente der linearen Algebra 20.4.3.1 Mathematica In 20.2.4, S 989 wurden der Begriff der Matrix und eine Reihe von Operationen mit Matrizen auf der Grundlage von Listen definiert Der Einsatz von Mathematica im Rahmen der Theorie linearer Gleichungssysteme baut auf diesen Festlegungen auf Es sei im folgenden p = Array[p, {m, n}] B0 65) eine Matrix vom Typ (m, n) mit den Elementen pij = p[[i, j]], des weiteren seien x = Array[x, {n}] und b = Arrayß, {m}] B0 66) zwei n- bzw. m-dimensionale Vektoren. Mit diesen Definitionen läßt sich das allgemeine System linearer inhomogener bzw. homogener Gleichungen schreiben (s. 4.4.2, S. 280) p x==b p x==0 B0 67) 1. Spezialfall n = m , detp ^ 0 Im Spezialfall n = m , detp ^ 0 hat das inhomogene System eine eindeutige Lösung, die mit x = Inverse[p].6 B0.68) sofort gefunden werden kann. Mit Mathematica können Systeme dieser Art mit etwa 50 Unbekannten in erträglicher, vom Computersystem abhängender Zeit, gelöst werden. Eine äquivalente, jedoch eventuell schneller ermittelbare Lösung kann mit LinearSolve[p, b] gefunden werden. 2. Allgemeiner Fall Mit den Anweisungen LmearSolve und NullSpace lassen sich alle in 4 4 2, S 280ff. beschriebenen Fälle behandeln, d h , es läßt sich festzustellen, ob prinzipiell eine Lösung existiert, und wenn ja, dann wird diese ermittelt Im Folgenden werden Beispiele aus 4 4.2 betrachtet ¦ A: Das Beispiel E auf S. 282 X\ — X2 + 5^3 — X4 = 0 X\ + X2 — 2x3 + 3x4 = 0 3xi — X2 + 8x3 + X4 = 0 xi + 3x2 — 9x3 + 7x4 = 0 hat als homogenes System nichttriviale Lösungen, die aus Linearkombinationen von Basisvektoren des Nullraumes der Matrix p bestehen. Das ist jener Teilraum des n-dimensionalen Vektorraumes, der bei Transformationen mit p auf die Null abgebildet wird Ein Satz solcher Basisvektoren läßt sich mit der Anweisung NullSpace[p] erzeugen Mit der Eingabe In[l] •= p = {{1, -1,5, -1}, {1,1, -2,3}, {3, -1,8,1}, {1,3, -9,7}} erzeugt man die für das System zuständige Matrix, deren Determinante tatsächlich Null ist, was sich mit Det[p] überprüfen läßt. Nun wird eingegeben In[2] = NullSpace[p] und als Ausgabe erscheint 0utß7 = {{-^,1,0}, {-1,-2,0,1}} eine Liste mit zwei linear unabhängigen Vektoren des vierdimensionalen Raumes, die im zweidimensionalen Nullraum der Matrix p eine Basis bilden Beliebige Linearkombinationen dieser beiden Vektoren liegen ebenfalls im Nullraum, sind also Lösungen des homogenen Gleichungssystems. Ein Vergleich mit der Lösung des betrachteten Beispiels E auf S 282 zeigt die Identität ¦ B: Man erzeugt gemäß Beispiel A, S. 281, Xi — 2x2 + 3x3 — x4 + 2x5 = 2 3xi — X2 + 5x3 — 3x4 — £5 = 6 2xi + X2 4- 2x3 — 2x4 — 3x5 = 8
1020 20 Computeralgebrasysteme die Matrix ml, die vom Typ C,5) ist und den Vektor bl In [3] = ral = {{1,-2,3,-1,2},{3.-1,5,-3,-1},{2,1,2,-2,-3}}, In/#.= 61 = {2,6,8}: Auf die Anweisung In[Jf.] = LinearSolve[ral,61] erscheint die Meldung LinearSolve : : nosol Linear equation encountered which has no Solution Danach wird die Eingabe nochmals ausgegeben ¦ C: Gemäß Beispiel B aus 4.4.2.1, S 281, x\ — X2 + 2x3 = 1 Xi - 2x2 - x3 = 2 3xi — %2 + 5x3 = 3 -2a;i + 2x2 + 3x3 = -4 wird eingegeben In[5] := m2 = {{1, -1,2}, {1. -2, -1}, {3, -1. 5}, {-2,2.3}}; InZ[7-=62 = {l,2,3,-4}; Da in diesem Fall das System überbestimmt ist, wird geprüft, ob sich die Matrix m2 aufgrund linearer Abhängigkeiten der Zeilen reduzieren läßt. Mit In[7] := RowReduce[ra2], —? Out [7] = {{1,0.0}, {0,1,0}, {0,0,1}, {0,0,0}} geschieht das Danach gibt man ein In[8] =LinearSolve[ra2,62],—> Out[8] = { — ,--,--} Die Ausgabe enthält die bekannte Lösung 3. Eigenwerte und Eigenvektoren In 4 5, S 286 sind Eigenwerte und Eigenvektoren von Matrizen definiert worden Mathematica bietet die Möglichkeit, diese mit speziellen Anweisungen zu bestimmen So liefert Eigenvalues[m] eine Liste der Eigenvektoren der quadratischen Matrix m, Eigenvectors[ra] eine Liste der Eigenvektoren von m Setzt man anstelle von m aber N[ra], so erhält man die numerischen Eigenwerte. Bei Matrizen mit der Ordnung n > 4 kann man im allgemeinen keine algebraischen Ausdrücke mehr erwarten, da die zu lösende Polynomgleichung höher als vierten Grades ist Deshalb kann man in diesen Fällen nur nach numerischen Werten fragen ¦ In[9] =/i = Table[l/(i+j-l),{i,5},{j,5}] Das erzeugt eine 5 -dimensionale sogenannte HlLBERT-Matrix. 1 1 1 1 1 1 1 1. 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Out[9] - U1'2'3'4'5J'^2'3'4'5'6^'^3'4'5'6'7^' M'5'6'7'8^'^5'6'7'8'9^ Mit der Anweisung In[10] •= Eigenvalues[/i] antwortet Mathematica Eigenvalues.:eival Unable to find all roots of the characteristic polynomial Gibt man aber ein In [11] •= Eigenvalues[N[/i]] , so erhält man Out [11] = {1 56705,0 208534,0.0114075,0 000305898,3 287931(T6}
20 4 Anwendungen von Computeralgebrasystemen 1021 20.4.3.2 Maple Die Maple-Bibliothek verfügt über die Spezialpakete linaig und LinearAlgebra. Bezüglich der Unterschiede zwischen beiden Paketen muß auf die Dokumentation von Maple verwiesen werden. Nach dem Befehl > with(linalg) . B0 69) stehen alle 100 Befehle und Operationen dieses Pakets für die Anwendung zur Verfügung. Wichtig ist, daß bei Nutzung dieses Pakets Matrizen und Vektoren mit den speziellen Anweisungen matrix und vector erzeugt werden sollten und nicht mit den allgemeineren Strukturen array. Mit matrix(ra, n, s) wird eine m x n-Matrix erzeugt Fehlt s , so sind die Elemente dieser Matrix nicht spezifiziert, können jedoch nachträglich durch Zuweisungen der Art A[i,j] = ... festgelegt werden. Ist s eine Funktion / = f(i,j) der Indizes, so erzeugt Maple die Matrix mit diesen Elementen Schließlich kann s eine Liste mit Listen der Elemente bzw. Vektoren sein. Die Definition von Vektoren erfolgt analog mit vector(n, e) Ein Vektor ist eine 1 x n-Matrix, wird jedoch als Spaltenvektor interpretiert Die Tabelle 20.19 gibt einen Überblick über einige wesentliche Operationen mit Matrizen und Vektoren Tabelle 20 19 Matrizenoperationen transpose(j4) bestimmt die zu A transponierte Matrix det(j4) bestimmt die Determinante der quadratischen Matrix A mverse(A) bestimmt die zur quadratischen Matrix A inverse Matrix adjoint(j4) bestimmt die zur quadratischen Matrix A adjungierte Matrix, d h A &* adjoint(j4) = det(A). mulcol(j4, s, ausdr) multipliziert die s-Spalte der Matrix A mit ausdr mulrow(A, r, audr) multipliziert die r-te Zeile mit ausdr Für die Addition von Vektoren und Matrizen steht der Befehl add(w, v, k, l) zur Verfügung. Er addiert die jeweils mit k und / skalar multiplizierten Matrizen oder Vektoren u und v. Die optionalen Argumente k und / können fehlen Die Addition funktioniert nur, wenn die entsprechenden Matrizen arithmetisch verknüpfbar sind. Die Matrizenmultiplikation wird mit multiply(w, v) ausgeführt oder mit der Kurzform &* (s 20 3 6.4, S. 1005) als Infix-Operator. 1. Lösung linearer Gleichungssysteme Zur Behandlung linearer Gleichungssysteme stellt Maple spezielle Operationen bereit, die im Paket für linare Algebra enthalten sind. Speziell handelt es sich um linsolve(^, c) Das lineare Gleichungssystem liegt in der Form A-x = c B0.70) vor, wobei A seine Matrix bezeichnet und c den Vektor der rechten Seite des Gleichungssystems Besitzt das System keine Lösung, dann wird die Null-Sequenz Null zurückgegeben. Hat das System mehrere linear unabhängige Lösungen, so werden diese in Parameterdarstellung wiedergegeben. Die Operation nullspace(,4) findet eine Basis im Nullraum der Matrix A, der für eine singulare Matrix von Null verschieden ist Für die Lösung von Gleichungssystemen können auch die Operationen der Matrixmultiplikation und die Bestimmung von inversen Matrizen benutzt werden. ¦ A: Es wird das Beispiel E aus 4 4 2.1,2., S 282, des homogenen Systems X\ — X2 + 5X3 — X\ = 0 Xi 4- X2 — 2x3 -h 3x4 = 0 3^1 — X2 + 8x3 + £4 = 0 xi + 3x2 - 9.T3 + 7x4 = 0
1022 20. Computeralgebrasysteme betrachtet, dessen Matrix singulär ist Das dort untersuchte homogene System besitzt nichttriviale Lösungen Zur Lösung wird zunächst die Matrix A definiert > A := matrix([[l, -1,5, -1], [1,1, -2,3], [3, -1,8,1], [1,3, -9, 7]]) . Mit det(A) kann man sich überzeugen, daß sie singulär ist, und über > a ¦= nullspace(^) —> a = j | ——, —, 1,01 , [-1, -2,0,1]| kann die Liste zweier linear unabhängiger Vektoren bestimmt werden. Diese Vektoren bilden eine Basis im zweidimensionalen Nullraum der Matrix A Für den allgemeinen Fall stellt Maple Operationen zur Anwendung des GAUSSschen Algorithmus zur Verfügung, die in Tabelle 20.20 aufgeführt sind Tabelle 20.20 Operationen des GAUSSschen Algorithmus pivot(j4, i, j) erzeugt aus A durch Addition von Vielfachen der i-ten Zeile zu allen anderen Zeilen eine Matrix, deren j-te Spalte außer A^ aus Nullen besteht gausselim(^4) erzeugt die durch Zeilenpivotisierung entstehende GAUSSsche Dreiecksmatrix Die Matrixelemente müssen rationale Zahlen sein gauss j ord(A) erzeugt eine Diagonalmatrix nach dem GAUSS-JORDAN- Verfahren, die Matrixelemente können Gleitpunktzahlen sein augment(,4, u) erzeugt die Matrix, die durch Anfügen einer Spalte (gegeben durch den Vektor u) aus A entsteht Hat man ein Gleichungssystem mit gleicher Anzahl von Gleichungen und Unbekannten sowie nichtsin- gulärer Matrix, so löst man das System mit lmsolve ¦ B: Es soll das System aus 19 2 1 4,2., S 922 10xi - 3x2 - 4x3 + 2x4 = 14 -3xi + 26x2 + 5x3 - x4 = 22 —4xi + 5x2 + 16x3 + 5x4 = 17 2zi + 3x2 - 4^3 - 12x4 = -20 gelöst werden Hier ist > A := matnx([[10, -3, -4, 2], [-3,26,5, -1], [-4, 5,16,5], [2,3, -4, -12]]) > v := vector([14,22,17, -20]) • Mit linsolve erhält man > linsolve(yl, v);, - Der Gauss-Algorithmus wird mit i>i» > F = gaussjord(augment(,4,i>));, F-= 1000^ 2 0 1001 OOloi 000 12 angewendet ¦ C: Es soll das inhomogene Gleichungssystem des Beispiels B aus 4 4.2 1,2., S 281 für das inhomogene System X\ — X2 + 2X3 = 1 xi - 2x2 - x3 = 2 3xi — x2 4- 5x3 = 3 -2xi + 2x2 + 3x3 = -4
20 4 Anwendungen von Computeralgebrasystemen 1023 gelöst werden. Dazu werden zunächst die zugehörige Matrix und der Vektor der rechten Seite definiert > A =matnx([[l,-l,2],[l,-2,-l],[3,-l,5],[-2,2,3]]) : > v := vector([l,2,3, -4]) • Das System ist überbestimmt. Um es zu lösen, kann lmsolve nicht benutzt werden Daher bestimmt > F := augment(yl, v);; - F:= 1-1 2 11 1-2-1 2 3-153 -2 2 3-4 Mit gaussjord kann die Matrix F in eine obere Dreiecksform gebracht werden- 10- > Fl = gaussjord(F),,- Fl := 1 00 0 10 00 1- 000 Der Lösungsvektor ist unmittelbar aus Fl ablesbar. 2. Eigenwerte und Eigenvektoren Maple stellt mit eigenvals und eigenvects spezielle Operatoren für die Bestimmung von Eigenwerten und Eigenvektoren quadratischer Matrizen bereit Dabei ist zu beachten, daß die Eigenwertgleichung bei Matrizen der Ordnung n > 4 im allgemeinen nicht mehr geschlossen lösbar ist. Daher liefert Maple in diesem Fall die Eigenwerte als genäherte Gleitpunktzahlen ¦ Es sind die Eigenwerte der 5-dimensionalen HiLBERT-Matrix (s. 20.4.3.1,3., S. 1020) zu finden Im Paket lmalg ist eine spezielle Anweisung zur Erzeugung n-dimensionaler HiLBERT-Matrizen vorhanden Sie lautet hilbert(n, x) Ihre Matrixelemente sind l/(i + j — x) Wird x nicht angegeben, so setzt Maple automatisch x — 1 Die Aufgabe wird daher mit der Eingabe > eigenvals(hilbertE)), gelöst Maple antwortet mit RootOf (-1 + 307505_Z - 1022881200_Z2 + 92708406000_Z3 -476703360000_Z4 + 266716800000_Z5) Mit allvalues kann man dies in eine Folge genäherter Eigenwerte umwandeln. ? 20.4.4 Differential- und Integralrechnung 20.4.4.1 Mathematica In 20 2 8, S 994 wird der Begriff der Ableitung als Funktionaloperator erläutert. Mathematica verfügt über eine Vielzahl von Möglichkeiten, um Operationen der Analysis wie die Bestimmung von Differentialquotienten beliebiger Ordnung, partieller Ableitungen, die Bildung vollständiger Differentiale, unbestimmter und bestimmter Integrale, Reihenentwicklung von Funktionen sowie die Lösung einer Reihe von Differentialgleichungen durchzuführen. 1. Berechnung von Differentialquotienten 1. Operator der Differentiation Der Differentiationsoperator von Mathematica (s. 20 2 8, S 995) wurde als Derivative eingeführt Seine vollständige Schreibweise lautet Derivative[ni, 7i2,.. •] B0.71) Die Argumente geben an, wie oft nach der jeweiligen Variablen differenziert werden soll. In diesem Sinne handelt es sich um einen Operator der partiellen Differentiation. Mathematica versucht die Darstellung des Ergebnisses als reine Funktion.
1024 20 Computeralgebrasysteme 2. Differentiation von Funktionen Die Differentiation einer vorgegebenen Funktion kann vereinfachend durch den Operator D durchgeführt werden. Mit D[/[a:],x] wird die Ableitung der Funktion f(x) angegeben. D gehört zu einer Gruppe von Differentialoperationen, die in Tabelle 20.21 aufgeführt sind Tabelle 20.21 Operationen der Differentiation D[/[a:], {x. n}] liefert die n-te Ableitung der Funktion f(x) Entsprechend liefern D[/, {xi. ri\}, {^2, r^}, • •] mehrfache Ableitungen jeweils r^-mal nach Xi (i = 1,2, • • •) Dt [/] das vollständige Differential der Funktion / Dt [/, x] die vollständige Ableitung — der Funktion Dt [/, x\, X2, ] das vollständige Differential einer Funktion mehrerer Veränderliche! Für die beiden Beispiele aus 6 1 2 2 S 397 eihält man ¦ A In[l] : = D[Sqrt[xA3 Exp[4x] Sinja:]], x] E4xx2 (xCos[x}+3Sm[x}+4xSi.n[x}) 0ut[1J ~ 2Sqrt[E4^3Sm[a:]] ¦ B : In[2] • = D[B.x + 1)aCt), x] Out[2] = 6x{l + 2a:)+3x + 3 A + 2xfx Log[l + 2x] Die Anweisung Dt liefert die vollständige Ableitung bzw das vollständige Differential ¦ C • In[3] . - Dt[xA3 + yA3] —> Out [3] = 3x2Dt[x] + 3y2üt[y] ¦ D. In[4J --Dt[xA3 + 2/A3,x] —> Out[4] = 3x2 + 3y2Dt[y<x] Mathematica nimmt in diesen letzten Beispielen an, daß y eine Funktion von x ist, die es jedoch nidit kennt, und schreibt den zweiten Teil der Ableitung deshalb wieder symbolisch. Wenn Mathematica bei der Differentiation auf eine symbolische Funktion stößt, beläßt es diese in der allgemeinen Form und drückt die Ableitung in der Form /' aus ¦ E In[5] -=D[xf[x]A3,x] —> 0ut[5] = f[x]3+ 3xf[x]2f'[x] Mathematica kennt die Regeln für die Differentiation von Produkten. Quotienten und die Kettenregel und kann diese auch formal anwenden. ¦ F In[6] •= D[f\m\x\] x] Out[6] = f'fubl] u\x] G In[7] := D[u[x]/v[.t].x] Out[7] = u' kr v[x] v[x]2 2. Unbestimmte Integrale Mit der Anweisung Integrate[/, x] versucht Mathematica, das unbestimmte Integial / f(x)dx zu b(>- stimmen Wenn das Integral Mathematica bekannt ist. gibt es dieses ohne die Integrationskonstanto wieder Mathematica nimmt an, daß jeder Ausdruck, der die Integrationsvariable nicht enthält, auch nicht von dieser abhängt Im allgemeinen findet es unbestimmte Integrale, wenn sich diese durch elementare Funktionen, wie rationale Funktionen, Exponential- und Logarithmusfunktionen sowie den trigonometrischen und deren inversen Funktionen ausdiückcn lassen. Wenn Mathematica nicht in der Lage ist, das Integral zu bestimmen, gibt es die Eingabe zurück Allerdings kennt Mathematica einige spezielle Funktionen, die durch nicht elementar bestimmbare Integrale definiert sind, wie z B die elliptischen Funktionen und andere.
20 4 Anwendungen von Computeralgebrasystemen 1025 r smx . f vuv / . dx — — / —7= mit t = cos x J x/coso: J ¦ Zur Demonstration der Möglichkeiten von Mathematica werden einige Beispiele aus 8.1, S. 444ff. behandelt. 1. Integration gebrochenrationaler Funktionen (s. 8.1.3 3, S. 449ff.) ¦ A : In[l]:= Integrate[Bx + 3)/(zA3 + xA2 - 2x), x] 0ut[l] = 5L°g[~1+a:] _ 3L°gM _ L°g[2 + *1 3 2 6 ¦ B : In[2] • = Integrate[(a;A3 + l)/{x(x - l)A3),x] Out [2] = - (-1 + x)~2 -^— + 2Log[-l + z] - Logfx] B0.72) —1 + x 2. Integration trigonometrischer Funktionen (s 8 1 5, S. 455ff ) ¦ A: Es wird das Beispiel A in 8 1 5 2, S 456 mit dem Integral / sin2 x cos5 x dx = / sin2£ A — sin2 xJ cosx (ix = t2(l — t2Jdt mit £ = sin:r betrachtet: In[3] = Integrate[Sin[x]A2Cos[x]A5,a;] 5Sin[x] Sin[3x] 3Sm[5x] Sin[7i] Ut ~ —64 192 32Ö 448 ¦ B: Es wird das Beispiel B in 8.1.5.2, S 456 mit dem Integral sinx f dt , dx — — / —7: /coso; J y/t betrachtet In[4J := Integrate[Sin[a;]/Sqrt[Cos[x]],a;] Out [4] = -2Sqrt[Cos[x]] 3. Hinweis: Im Falle nichtelementarer Integrale versucht Mathematica diese durch ihm bekannte spezielle Funktionen (deren es eine Vielzahl gibt) auszudrücken. Ist das nicht möglich, so wird das Integral unverändert zurückgegeben. ¦ In[5] := Integrate[xAx,x] —> Out [5] = Integrate[xx,x] 3. Bestimmte Integrale, Mehrfachintegrale 1. Bestimmte Integrale Mit der Anweisung Integratej/, {x,xa,xe}] kann Mathematica das bestimmte Integral der Funktion f(x) mit der unteren Grenze xa und der oberen Grenze xe bestimmen. ¦ A : In[l] := Integrate[Exp[—x2], {x, —Inf lnity, Inf lnity}] 0utfl7 = Sqrt[Pi] Mathematica liefert den Wert tt (s. Tabelle 21.8, S. 1086, Nr. 9 für a = 1). ¦ B: Gibt man aber ein In[2] : = Integrate[l/xA2, {x, -1,1}], so wird Out [2] = 00 unendlich, da es sich um ein uneigentliches Integral mit einem Pol des Integranden bei x = 0 handelt. Bei der Berechnung bestimmter Integrale ist Vorsicht geboten Wenn man die Eigenschaften des Integranden nicht kennt, sollte man sich vor der Integration eine Graphik der Funktion im interessierenden Bereich anfertigen. 2. Mehrfachintegrale Zweifache bestimmte Integrale ruft man mit der Anweisung Integrate[f [x, y], {x, xa, xe}, {y, ya, ye}] B0.73)
1026 20 Computeralgebrasysteme auf Die Abarbeitung erfolgt von rechts nach links, zunächst wird also die Integration über y durchgeführt Die Grenzen ya und ye können daher Funktionen von x sein, die in die Stammfunktion eingesetzt werden Danach wird das Integral über x bestimmt ¦ Für das Integral A zur Berechnung einer Fläche zwischen Parabel und einer, diese zweifach schneidenden Geraden, in 8.4.1.2, S. 489, erhält man 32 In[3] .= Integrate[x yA2, {x.0,2}. {y,xA2,2x}} —> 0ut[3] = — Auch hier ist Aufmerksamkeit in bezug auf Unstetigkeiten der beteiligten Funktionen geboten 4. Lösung von Differentialgleichungen Mit Mathematica können gewöhnliche Differentialgleichungen symbolisch behandelt werden, wenn eine Lösung in geschlossener Form prinzipiell möglich ist In diesem Fall liefert Mathematica in der Regel die Lösung. Die hierfür zutreffenden Befehle sind in Tabelle 20.22 aufgelistet Tabelle 20 22 Anweisungen zur Lösung von Differentialgleichungen T)Solve[dgl, y[x],x] löst eine evtl implizite Darstellung der Lösung der Differentialgleichung nach y[x] auf (falls möglich) DSolve[d#/, y, x] liefert die Lösung der Differentialgleichung in Form einer reinen Funktion DSolve[{d^/i, dgl2, . }, y, x] löst ein System gewöhnlicher Differentialgleichungen Die Lösungen werden (s 9 1,1., S 504) mit den entsprechenden willkürlichen Konstanten C[i] als allgemeine Lösungen dargestellt Anfangswerte oder Randbedingungen können in den Teil der Liste der die Gleichung bzw Gleichungen enthält, mit eingefügt werden In diesem Falle erhält man eine spezielle Lösung. Als Beispiele werden hier zwei Differentialgleichungen aus 9 1 1 2, S 506 betrachtet ¦ A: Es ist die Lsung der Differentialgleichung y'(x) — y(x) tanx = cosx zu bestimmen In/17 .= DSolve[y'{x] - y[x) Tan[x] == Cos[x],?/,x] Mathematica löst diese Gleichung und gibt die Lösung als reine Funktion mit einer Integrationskonstanten C[l] wieder Out[lJ = {{y -. p^lwl[MSl«>t[11]DC(l) + Si4iSlot[ll] + 2Slat[l])]}} Das Symbol Slot steht für #, es ist dessen FullForm. Verlangt man, daß die Lösung für y[x] bestimmt wird, dann liefert Mathematica ri/~ r, rSec[x] B.T + 4CA) + Sin[2d), In[2] :=y[x}/ %1 —> 0ut[2] = { U-± -^ [-J1} Man hätte in diesem Beispiel die Substitution auch für andere Größen, wie etwa y'[x] oder y[l] durchführen können Hier wird der Vorteil der Benutzung reiner Funktionen deutlich ¦ B: Es ist die Lösung der Differentialgleichung y'(x)x(x — y(x)) + y2(x) = 0 (s. 9.1.1.2,2., S. 506) zu bestimmen In[3] = DSolve[y'[x] x(x - y[x\) + y[x]A2 == 0,y[x],x] Mathematica meldet- InverseFunction . • if un Inverse Functions are beeing used Values may be lost x Hier ist ProductLogjz] der Hauptwert der Lösung von z = wew inw . In solchen Fällen kann man nach numerischen Lösungen (s 19 8 4 1 5., S 978) suchen Auch im Falle der symbolischen Lösung von Differentialgleichungen darf man wie bei der Berechnung unbestinimtei Out [3] = < < y[x]-> -xProductLog
20.4 Anwendungen von Computeralgebrasystemen 1027 Integrale Mathematica nicht überfordern. Wenn die Resultate nicht als algebraischer Ausdruck elementarer Funktionen darstellbar sind, bleibt nur der Weg, numerische Lösungen zu suchen Mit DSolve[#/ezc/i, y\x\,..., xn], {x\, ,xn}] können auch partielle Differentialgleichungen gelöst werden. 20.4.4.2 Maple Maple verfügt über eine Vielzahl von Möglichkeiten zur Behandlung von Aufgaben der Analysis Neben der Differentiation von Funktionen gehören dazu die Berechnug unbestimmter und bestimmter Integrale, die Berechnung mehrfacher Integrale und die Entwicklung von Funktionen in Potenzreihen Grundelemente der Theorie analytischer Funktionen werden zur Nutzung angeboten Zahlreiche Differentialgleichungen können gelöst werden 1. Differentiation In 20 3 7, S 1005ff. wird der Operator der Differentiation D eingeführt Seine Anwendung mit verschiedenen optionalen Argumenten gibt die Möglichkeit, Funktionen in Operatordarstellung zu differenzieren Seine vollständige Syntax lautet* D[i](/) B0 74a) Hierdurch wird die partielle Ableitung der (Prozedur-) Funktion / nach der i-ten Variablen bestimmt. Das Resultat ist wiederum eine Funktion in Prozedurdarstellung D[i, j](f) ist äquivalent zu D[i](D[;1(/))undD0(/) = /. B0 74b) Das Argument / ist dabei ein als Prozedur behandelter Funktionsausdruck. Dieser kann neben vordefinierten Funktionen auch selbstdefinierte Funktionsnamen, mit Pfeiloperatoren definierte Funktionen usw enthalten. ¦ Es sei > / =(x,y)—> exp(x * y) + sin(x + y) : Dann wird > D[](/), — / > D[l](/); —> (x,y)-> y exp(x y) + cos(x + y) > D[2](/), —? (x.y)—> x exp(x y) + cos(a: + y) > D[l,2](/); —> (x,y)-> exp(x y) + x y exp(x y) - sm(x + y) Neben dem Operator der Differentiation existiert die Operation dif f mit der Syntax diff(ausdr.xl,x2, ,xn) B0 75a) Hier ist ausdr ein algebraischer Ausdruck in den Variablen xl,a:2, Das Resultat ist die partielle Ableitung des Ausdrucks nach den Variablen xl,.. ,xn. Wenn n > 1 ist, dann erhält man das gleiche Resultat durch Mehrfachanwendung der Operation dif f: dif f (a, zl, z2) = dif f (dif f (a, zl), x2) B0 75b) Mehrfache Differentiation nach ein und demselben Argument kann mit dem Folgenoperator $ dargestellt werden. ¦ > diff(sin(.T),x$5); (= diff(sm(x),x,x,x,x,x)) —? cos(x) Ist die Funktion f(x) nicht definiert, dann liefert die Operation dif f die auftretenden Ableitungen symbolisch —f(x) dx > diif(f(x)/g(x)), g(x) g(xJ > diff(x*/(x),x); — f{x)+x—f{x)
1028 20. Computeralgebrasysteme 2. Unbestimmte Integrale Wenn zu einer gegebenen Punktion f(x) die Stammfunktion F(x) als Ausdruck elementarer Funktionen darstellbar ist, kann Maple diese nach dem Aufruf int(/, x) in der Regel finden. Die Integrations- konstante wird nicht ausgegeben. Ist die Stammfunktion Maple in geschlossener Form nicht bekannt, so gibt es den Integranden zurück Maple kennt jedoch viele Spezialfunktionen und wird, sofern das möglich ist, diese für den Rückgabewert einsetzen Anstelle des Operators int kann auch die Langform mtegrate benutzt werden. 1. Integrale gebrochenrationaler Funktionen ¦ A . > int(B * x + 3)/(xA3 + xA2 - 2 * x), x\ —? ~ \n{x) - \ ln(x + 2) + \ \n(x - 1) 2 6 3 ¦ B : > mt((xA3 + l)/(x * (x - 1)A3),x); —+ - ln(ar) - , * l—- + 2ln(x - 1) (x — \y x — i 2. Integrale von Wurzelfunktionen Mit Maple können die in den Tabellen Unbestimmte Integrale (S 1053ff.) dargestellten Integrale entsprechend bestimmt werden. ¦ Setzt man > X = sqrt(xA2 — aA2) -so findet man 1 r-n ö 1 > int(X,z); —? -xVx2 - a2 - -o2 ln(x + Vx2 - a2) B0 76) > int(X/x, x), —? y/x2 — a2 — aarcsec ( - J > int(X*z,aO; —+ Ux2 - a2K/2 3. Integrale mit trigonometrischen Funktionen ¦ A: > int(xA3 * sin(a*x),x), -a3x3 cos(ax) + 3a2x2 sin(ax) - 6 sin(ax) + 6ax cos(ax) __ /.,/// \\An \ 1 cos(ax) 1 ln(csc(ax) - cot(ax) ¦ B: > int(l/(sin(a*x))A3,x); —> --—r4—^ + -— — —- wv v n ' 2asin(axJ 2 a 4. Hinweis: Im Falle nichtelementarer Integrale (die auch durch dem System bekannte Spezialfunktionen nicht dargestellt werden können) wird lediglich eine Umformung vorgenommen. ¦ > mt(xAx,x); so erhält man xx dx, denn dieses Integral ist elementar nicht darstellbar 3. Bestimmte Integrale, Mehrfachintegrale 1. Bestimmte Integrale Zur Berechnung bestimmter Integrale ist der Befehl int mit dem zweiten Argument x = a.. b zu verwenden Hier ist x die Integrationsvariable, und a.. b gibt die untere und obere Grenze des Integrationsbereiches an ¦ A. > mt(a;A2,a; = a..ö); —> -b3 - -a3 > int(xA2,x = 1..3); —> — ¦ B. > iiit(exip(—xA2),x = —infinity..infinity), —> y/n ¦ C: > int(l/3A4,s = -l-.l); —? oo Wenn Maple das Integral symbolisch nicht lösen kann, gibt es die Eingabe zurück In diesem Fall kann man versuchen, eine numerische Integration (s. 19 3, S. 925ff.) durchzuführen
20 4 Anwendungen von Computeralgebrasystemen 1029 2. Mehrfachintegrale Auch Mehrfachintegrale können, soweit explizit möglich, mit Maple berechnet werden, indem man die Operation int entsprechend oft (verschachtelt) anwendet ¦ A- > int{mt(xA2 + yA2*exip(x + y),x)}y); )-xzy + ex+y(x + yf - 2(x + y)et+y + 2ex+y - 2 ((z + y)ex+y - ex+y) x + ex+yx2 32 ¦ B. > int(int(x*?/A2,?/ = :rA2. 2*x),x = 0 .2), —> — 5 4. Lösung von Differentialgleichungen Mit der Operation dsolve in ihren verschiedenen Formen bietet Maple die Möglichkeit, gewöhnliche Differentialgleichungen und Systeme symbolisch zu lösen Die Lösung kann sowohl als allgemeine Lösung als auch als spezielle Lösung für vorgegebene Anfangsbedingungen erhalten werden Die Lösung wird entweder explizit oder implizit als Funktion eines Parameters angegeben. Der Operator dsolve erlaubt als letztes Argument die in Tabelle 20.23 dargestellten Optionen Tabelle 20 23 Optionen der Operation dsolve explicit liefert die Lösung, falls möglich, in expliziter Form laplace verwendet die LAPLACE-Transformation zur Lösung series benutzt die Zerlegung in Potenzreihen zur Lösung. numeric liefert als Ergebnis eine Prozedur zur Berechnung numerischer Lösungswerte. 1. Allgemeine Lösung > dsolve(dif f (y(x), x) — y(x) * tan(x) = cos(x), y(x))\ B0.77a) = lcos(.)sin(.) + * + 2_Cl yy ' 2 cos(:e) v ; Maple liefert die allgemeine Lösung mit einer Konstanten in expliziter Form. Im folgenden Beispiel wild die Lösung implizit angegeben, da die Auflösung der definierenden Gleichung nach y{x) nicht möglich ist. Die zusätzliche Option explicit führt hier zu keinem Ergebnis. > dsolve(dif f (y(x), x) * (x - y(x)) + y(x)A2, y(x)), B0 78a) e~y^)x - Ei A, -M = _C\ B0.78b) V y(x)J 2. Lösung mit Anfangsbedingungen Es wird die Differentialgleichung y' - ex — y2 = 0 mit ?/@) = 0 betrachtet. Hier wird die Option series eingesetzt Dabei ist zu beachten, daß diese Option die Anfangsbedingungen bei x = 0 erwartet. Das gleiche gilt für die Option laplace . > dsolve({dif f (y(x), x) - exp(x) - y(x)A2, y@) = 0}, y(x), series), B0 79a) 1 1 7 Q1 y(x) = x+-x> + -x* + -x* + —x5 + 0(x6) B0 79b) Man erkennt, daß Gleichung und Anfangsbedingungen in geschweifte Klammern einzuschließen sind Das gleiche gilt für die Behandlung von Systemen von Differentialgleichungen.
1030 20. Computeralgebrasysteme 20.5 Graphik in Computeralgebrasystemen Mit der Bereitstellung von Routinen für die graphische Darstellung mathematischer Zusammenhänge in Form von Funktionsgraphen, räumlichen Kurven und räumlichen Flächen bieten moderne Computeralgebrasysteme vielschichtige Möglichkeiten zur Kombination von Formelmanipulationen, speziell im Bereich der Analysis und Vektorrechnung bis zur Differentialgeometrie, und graphischen Darstellungen. 20.5.1 Graphik mit Mathematica 20.5.1.1 Grundlagen des Graphikaufbaus Mathematica baut graphische Objekte aus eingebauten Graphik-Primitiven auf. Das sind Objekte wie Punkte (Point), Linien (Line) und Polygone (Polygon) sowie Eigenschaften dieser Objekte wie Dicke und Farbe. Des weiteren verfügt Mathematica über viele Optionen, die angeben, in welcher Umgebung und in welcher Art die graphischen Objekte dargestellt werden sollen. Mit dem Befehl Graphics[/is£e], wobei liste eine Liste graphischer Primitiven ist, wird Mathematica aufgefordert, eine Graphik aus den aufgelisteten Objekten zu erstellen Der Objektliste kann eine Liste von Optionen für die Art der Darstellung folgen. Mit der folgenden Eingabe In[l] :=g = Graphics[{Line[{{0,0}, {5,5}, {10,3}}], Circle[{5,5}, 4], B0 80a) Text[FontForm["Beispiel","Helvetica-Bold",25], {5,6}]}, AspectRatio-> Automatic] B0.80b) wird eine Graphik aus folgenden Elementen aufgebaut. a) Linienzug von zwei Linien, beginnend im Punkt @,0) über den Punkt E,5) zum Punkt A0,3) b) Kreis mit dem Mittelpunkt im Punkt E,5) und dem Radius 4. c) Text mit dem Inhalt „Beispiel", geschrieben im Schriftfont Helvetica-Bold (der Text erscheint zum Bezugspunkt E,6) zentriert). Mit dem Aufruf Show[g] liefert Mathematica das Bild der erzeugten Graphik D • • i \ (Abb.20.1) Hierbei werden gewisse Voreinstellungen der Graphikoptionen * » benutzt Im gegebenen Fall wurde die Option AspectRatio auf Automatic gesetzt Ihre Voreinstellung lautet 1/GoldenRatio Das entspricht einem Verhältnis zwischen der Ausdehnung in der x-Richtung zu dem der y-Richtung von 1 : 1/1,618 = 1 • 0,618. Mit dieser Einstellung wäre der Kreis verzerrt als Ellipse dargestellt worden. Die Einstellung dieser Option auf Automatic Abbildung 20.1 bewirkt, daß die Darstellung unverzerrt erfolgt. 20.5.1.2 Graphik-Primitive Mathematica stellt die in Tabelle 20.24 aufgelisteten zweidimensionalen Graphikobjekte zur Nutzung Tabelle 20.24 Zweidimensionale Graphikobjekte bereit. Point[{:r, y}] Line[{{xi,2/i},{x2,2/2},...}] Rectangle[{xiu, yiu}, {x roi Vrojl Polygon[{{xi,2/i}, {x2,2/2}, • • •}] Circle" Circle Circle Circle {xiy},r,{a1,a2}] {x,y},{a,b}} {x,y},{a,b},{ai,a2}} Disk[{x,y},rJ Text[text, {x,y}] Punkt an der Position x, y Linienzug durch die angegebenen Punkte ausgefülltes Rechteck mit den angegebenen Koordinaten links unten, rechts oben ausgefülltes Polygon mit den angegebenen Eckpunkten Kreis mit dem Radius r um den Mittelpunkt x, y Kreisbogen mit den jeweiligen Begrenzungswinkeln Ellipse mit den Halbachsen a und b elliptischer Bogen ausgefüllte Kreise bzw Ellipsen (anstelle von r Halbachsenangabe) ergibt text zentriert auf den Punkt x, y
20.5 Graphik in Computeralgebrasystemen 1031 Neben diesen Objekten bietet Mathematica für die Art der Darstellung weitere Primitiven, die Graphikanweisungen Sie legen fest, wie die Graphikobjekte dargestellt werden Zu ihnen gehören die in Tabelle 20.25 aufgelisteten Anweisungen. Tabelle 20 25 Graphikanweisungen PomtSize[a] Punkte werden mit dem Radius a als Bruchteil der Gesamtbildgröße gezeichnet AbsolutePomtSizeß] zeichnet die Punkte mit dem absoluten Radius b (gemessen in Druckerpunkten pt) Thickness[a] zeichnet Linien mit der relativen Breite a AbsoluteThicknessß] zeichnet Linien mit der absoluten Breite b (ebenfalls in pt) Dashing[{ai,a2,a3,...}] zeichnet Linien als sich wiederholende Folge von Strichen der angegebenen Länge (in relativem Maß) AbsoluteDashmg[{6i, b2,...}] das gleiche wie vorstehend, aber in absolutem Maß bestimmt die GrayLevel[p] die Graustufe des Objekts (p = 0 ergibt schwarz, p = 1 weiß) Darüber hinaus gibt es Anweisungen für Farbeinstellungen, auf die hier nicht eingegangen wird 20.5.1.3 Graphikoptionen Mathematica bietet eine Vielzahl von Graphikoptionen, die die Gestaltung des Bildes als Gesamtheit betreffen In Tabelle 20.26 ist eine Auswahl der wichtigsten gegeben. Für eine umfassende Darstellung wird auf [20.5] verwiesen. Tabelle 20 26 Einige Graphikoptionen AspectRatio —> w Axes —> True Axes —> False Axes —> {True,False} Frame —> True GridLines —> Automatic AxesLabel-> {xsymbol,ysymboi} Ticks —> Automatic Ticks -> {{xi,x2i },{j/i 2/2, setzt das Verhältnis w von Höhe zu Breite. Automatic bestimmt w aus den absoluten Koordinaten, Voreinstellung ist w = 1/GoldenRatio setzt Koordinatenachsen setzt keine Koordinatenachsen zeichnet nur die x-Achse erzeugt Rahmen erzeugt Gitterlinien beschriftet die Achsen mit dem angegebenen Symbol setzt Skalierungsstriche automatisch, mit None werden diese unterdrückt }} an den angegebenen Stellen werden Skalenmarken gesetzt 20.5.1.4 Syntax der Graphikdarstellung 1. Aufbau von Graphikobjekten Wenn ein graphisches Objekt aus den Primitiven aufgebaut werden soll, ist zunächst eine Liste der entsprechenden Objekte mit ihren Hauptangaben zu erstellen, etwa in der Form {objekti,objekt2,...}, B0.81a) wobei die Objekte selbst wieder Listen von Graphikobjekten sein können. So sei Objekt 1 z B. In[l] := ol - {Circle[{5,5}, {5,3}], Line[{{0,5}, {10, 5}}]} und entsprechend In[2] =o2 = {Circle[{5,5},3]}. Will man eines der Graphikobjekte, etwa o2, mit speziellen Graphikanweisungen versehen, so ist es mit der entsprechenden Anweisung in einer Liste zusammenzufassen In[3] •= o3 = {Thickness[0.01],o2}.
1032 20 Computeralgebrasysteme Die Anweisung gilt für alle nachfolgenden Objekte in der gleichen Klammer, auch für eventuell weiter verschachtelte, jedoch nicht für solche außerhalb der Listenklammer. Aus den erzeugten Objekten werden zwei unterschiedliche Graphiklisten festgelegt In[4J .= gl = Graphics[{ol,o2}] ; g2 = Graphics[{ol,o3}]; , die sich im zweiten Objekt durch die Strichdicke des Kreises unterscheiden. Mit dem Aufruf Show[pl] und Show[#2,Axes -> True] B0 81b) erhält man die in Abb.20.2 dargestellten Bilder. Beim Aufruf des Bildes Abb.20.2b wurde die Option Axes -> True eingefügt Das führt zur Ausgabe des Achsenkreuzes mit einer von Mathematica gewählten Markierung auf den Achsen und der entsprechenden Skalierung. b) 2 4 6 8 10 Abbildung 20.2 Abbildung 20.3 2. Graphische Darstellung von Funktionen Mathematica stellt spezielle Anweisungen für die graphische Darstellung von Funktionen zur Verfügung. Mit Plot[f [x], {x, xmin, xmax}} B0 82) wird die Funktion f(x) im Bereich zwischen x = xmin und x = xmax graphisch dargestellt Mathematica erstellt nach internen Algorithmen eine Funktionstabelle und gibt die sich daraus ergebende Graphik über die Graphikprimitiven zurück. ¦ Wenn die Funktion sin2x im Bereich zwischen —27T und 1-k graphisch dargestellt werden soll, ist einzugeben In[5] := Plot[Sin[2x], {x, -2Pi, 2Pi}] Mathematica liefert die in Abb.20.3 dargestellte Kurve Man erkennt, daß Mathematica bei der Darstellung gewisse voreingestellte Graphikoptionen benutzt So werden automatisch Achsen gezeichnet, diese entsprechend skaliert und mit x- und y-Werten versehen An diesem Beispiel erkennt man auch die Wirkung der Voreinstellung von AspectRatio. Das Verhältnis der Gesamt breite zur Gesamthöhe entspricht 1 : 0,618 Mit dem Befehl InputForm[%] kann man sich die volle Darstellung des Graphikobjektes anzeigen lassen Man erhält für das betrachtete Beispiel die Ausgabe: Graphics[{{Line[{{-6 283185307179587,4 90059381963448* 10A - 16}, Liste vieler Punkte aus der von Mathematica berechneten Funktionstabelle {6 283185307179587, -D.90059381963448* 10A - 16)}}]}}, {PlotRange—> Automatic, AspectRatio—> GoldenRatioA(—1), DisplayFunction > $DisplayFunction,ColorOutput—> Automatic, Axes—> Automatic, AxesOrigm—> Automatic, PIotLabe 1—> None, AxesLabel—> None,Ticks—> Automatic, GridLmes—> None, Prolog—> {}, Epilog—> {}, AxesStyle—> Automatic,Background—> Automatic, DefaultColor—> Automatic,DefaultFont :> $DefaultFont,
20 5 Graphik in Computeralgebrasystemen 1033 RotateLabel—> True, Frame—> False,FrameStyle—> Automatic, FrameTicks—> Automatic, FrameLabel—> None,PlotRegion—> Automatic}] Das Graphikobjekt besteht demzufolge aus zwei Unterlisten. Die erste enthält die Graphikprimitive Line , mit der die nach dem internen Algorithmus berechneten Kurvenpunkte durch Linien miteinander verbunden werden Die zweite Unterliste enthält die für die gegebene Graphik benutzten Optionen Das sind die Voreinstellungen. Soll das Bild in bestimmten Positionen bei der Wiedergabe verändert werden, so sind die veränderten Optionseinstellungen in die PI ot-Anweisung nach den beiden Haupteingaben anzuschließen. Mit In[6] := Plot[Sin[2n;], {x, -2Pi, 2Pi}, AspectRatio-> 1] B0 83) würde die Wiedergabe mit absolut gleich großen x- und y-Bereichen erfolgen. Man kann mehrere Optionen gleichzeitig hintereinander angeben Mit der Eingabe Plot[{f1[x]J2[x], }, {x,xmin,xmax}] B0 84) werden mehrere Funktionen in eine Graphik gezeichnet Mit der Anweisung Shou\plot. Optionen] B0.85) kann ein früher erzeugtes Bild erneut, wenn gewünscht mit veränderten Optionen, dargestellt werden Mit Show[GraphicsArray[/iste]], B0.86) können (mit liste als Liste von Graphikobjekten) Bilder nebeneinander, untereinander und matrixför- mig zueinander angeordnet werden 20.5.1.5 Zweidimensionale Kurven Als Beispiele sollen eine Reihe von Kurven aus dem Kapitel Funktionen (s. 2 1, S. 48ff.) erzeugt werden. 1. Exponentialfunktionen Eine Kurvenschar mit mehreren Exponentialfunktionen (s 2 6 1, S 72) erzeugt Mathematica (Abb. 20.4a) mit folgenden Eingaben: In[l] = f[x_] = 2Ax;g[x_] .= 10Ax; In[2] = h[x_] .= (l/2)Ax, i[x_] •= (l/E)Ax;k[x_] := (l/10)Ax, Das sind die Definitionen der beteiligten Funktionen. Die Funktion ex braucht nicht definiert zu werden, da sie in Mathematica eingebaut ist. In einem zweiten Schritt werden die folgenden Graphiken erzeugt In[3] =pl = Plot[{f[x],h[x]},{x,-4,4},PlotStyle-> Dashing[{0.01,0 02}]] In[4J .= p2 = Plot[{Exp[x], j[x]}, {x, -4,4}] In[5] .= p3 = Plot[{g[x], k[x]}, {x, -4,4}, PlotStyle-> Dashing[{0 005,0 02,0 01,0 02}]] Das gesamte Bild (Abb.20.4a) erhält man mit. In[6] := Show[{pl p2,p3},PlotRange-> {0,18}, AspectRatio-> 1 2] Auf die Anbringung von Text an den Kurven wurde hier verzichtet Das wäre mit der Graphikprimitiven Text möglich gewesen. 2. Funktion y = x + Arcoth x Unter Berücksichtigung der in 2 10, S 92 dargestellten Eigenschaften der Funktion Arcoth x läßt sich y = x + Arcoth x folgendermaßen graphisch darstellen. In[l] .= /l = Plot[x + ArcCoth[x], {x, 1.000000000005, 7}] In[2] = /2 = Plot[x + ArcCoth[x], {x, -7, -1.000000000005}] InO := 3Show[{/l,/2},PlotRange-> {-10,10}, AspectRatio-> 1 2,Ticks->
1034 20. Computeralgebrasysteme 10 2,5 a) Abbildung 20.4 {{{-6, -6}, {-1, -1}, {1,1}, {6,6}}, {{2.5,2.5}, {10,10}}} Die große Präzision der x-Werte nahe 1 und —1 wurde gewählt, um hinreichend große Funktionswerte für den gewünschten ^/-Bereich zu erhalten Als Resultat erhält man die Abb.20.4b J(n,z) n=l,3,5 Abbildung 20.5 3. Bessel-Funktionen s. 9.1.2.6,2., S 528 Mit den Aufrufen In[l] = bjO = Plot[{BesselJ[0, z], BesselJ[2, z], BesselJ[4, z]}, {z, 0,10}, PlotLabel-> „J(n, z) n = 0,2,4"] In[2] := bjl = Plot[{BesselJ[l,z],BesselJ[3, z],BesselJ[5,z]}, {z,0,10}, PlotLabel-> „ J(n, z) n = 1,3,5"] B0 87) werden Graphiken der BESSEL-Funktion Jn(z) für n = 0,2,4 und n = 1,3,5 erzeugt, die danach mit dem Aufruf In[3] := Show[GraphicsArray[{fej0,6jl}]] nebeneinander dargestellt werden können (Abb.20.5) 20.5.1.6 Parameterdarsteilung von Kurven Mathematica verfügt über eine spezielle Graphikanweisung, mit der Kurven in Parameterform dargestellt werden können Der grundlegende Befehl dafür lautet: ParametricPlot[{/x(t),/y(t)},{t,ti,t2}] B0.88) Es besteht die Möglichkeit, mehrere Parameterkurven in eine Graphik zu zeichnen Dazu ist in der Anweisung eine Liste von mehreren Kurven einzugeben. Mit der Option AspectRatio—> Automatic zeichnet Mathematica die Kurven in ihrer natürlichen Form Die in Abb.20.6 dargestellten Parameterkurven archimedische Spirale (s 2.14.1, S. 105) und logarithmische Spirale (s. 2.14.3, S. 106) werden mit den folgenden Eingaben aufgerufen: In[l] '= ParametncPlot[{£ Cos[t],t Sin[t]}, {£,0,3Pi}, AspectRatio-> Automatic] In[2] := ParametricPlot[{Exp[0 lt] Cos[t],Exp[0.1t] Sin[t]}, {t,0,3Pi},
20.5 Graphik in Computeralgebrasystemen 1035 AspectRatio—> Automatic] Mit In[3] .= ParametncPlot[{£ - 2 Sin[i], 1 - 2 Cos[*]}, {t, -Pi, HPi}, AspectRatio-> 0.3] kann eine der in 2 13.2, S. 102 beschriebenen Trochoiden erzeugt werden (Abb.20.7). Abbildung 20.7 Abbildung 20 6 20.5.1.7 Darstellung von Flächen und Raumkurven Mathematica bietet die Möglichkeit, dreidimensionale Graphikprimitive darzustellen Dadurch lassen sich, ganz ähnlich wie im zweidimensionalen Fall, dreidimensionale Graphiken aufbauen und mit der Anwendung verschiedener Optionen aus unterschiedlichster Perspektive betrachten. Insbesondere ist deshalb die graphische Darstellung gekrümmter Flächen im dreidimensionalen Raum möglich, d h die graphische Darstellung von Funktionen zweier Veränderlicher So ist es möglich, Kurven im dreidimensionalen Raum, z B. in Parameterdarstellung, zeichnen zu lassen. Eine ausführliche Beschreibung der dreidimensionalen Graphikprimitive s. [20 5] Der Umgang mit diesen Darstellungen erfolgt analog zu dem mit den zweidimensionalen Primitiven. 1. Graphische Darstellung von Oberflächen Der Befehl Plot3D verlangt in seiner Grundform die Angabe einer Funktion zweier Variablen und die Wertebereiche dieser Variablen, für die die Darstellung erfolgen soll: InO = Plot3D[f[x1y],{xixaixe},{y1yaiye}] B0.89) Alle Optionen sind zunächst mit der Voreinstellung belegt. ¦ Für die Funktion z = x2 + y2 erhält man mit der Eingabe In[l] •= Plot3D[xA2 + yA2, {x, -5,5}, {y, -5,5}, PlotRange-> {0,25}] die Abb.20.8a, während Abb.20.8b mit In[2] = Plot3D[(l - Sin[x]) B - Cos[2 y]), {x, -2,2}, {y, -2,2}] erzeugt wird Abbildung 20.8 Bei der Halbkugel wurde die Option PlotRange mit den gewünschten z-Werten eingegeben, um das Objekt an der Ebene z = 25 abzuschneiden
1036 20. Computeralgebrasysteme 2. Optionen für 3D-Graphik Die Zahl der Optionen für 3D-Graphik ist groß. In Tabelle 20.27 werden nur einige aufgelistet, wobei Optionen, die aus der 2D-Graphik bekannt sind, nicht aufgeführt werden Sie lassen sich sinngemäß übertragen. Tabelle 20 27 Optionen zur 3D-Graphik Boxed voreingestellt ist True, dies zeichnet einen dreidimensionalen Rahmen um die Fläche HiddenSurf ace bestimmt die Undurchsichtigkeit der Oberfläche, voreingestellt ist True ViewPoint bestimmt den Punkt (x, y, z) im Raum, von dem aus die Oberfläche betrachtet wird. Voreingestellt ist {1 3, -2 4,2} Shadmg voreingestellt ist True, damit wird die Oberfläche schattiert, False liefert weiße Oberflächen PlotRange ist hier für die Werte All, {za, ze}, {{xa, xe}, {ya, ye}, {za, ze}} wählbar Voreinstellung ist Automatic Hier sei besonders auf die Option ViewPoint hingewiesen, mit der sehr unterschiedliche Ansichtsperspektiven für die jeweilige Oberfläche ausgewählt werden können. 3. Dreidimensionale Objekte in Parameterdarstellung Ahnlich wie bei der 2D-Graphik können auch dreidimensionale Objekte, die in Parameterdarstellung gegeben sind, gezeichnet werden. Mit ParametricPlot3D[{/x[/, u], fy[t, u],fz[t, w]}, {t. ta< te}, {u, uG, ue}} B0 90) wird eine parametrisch vorgegebene Oberfläche gezeichnet, mit ParametricPlot3D[{/r[*],/y[t],/4[*]},{t,t0.te}] B0 91) wird eine dreidimensionale Kurve parametrisch erzeugt. ¦ Die Objekte in Abb.20.9a und Abb.20.9b wurden mit den folgenden Befehlen erstellt- In[3] .= ParametncPlot3D[{Cos[£] Cos[n].Sin[t] Cos[u],Sin[w]}, {/,0.2Pi}, {u,-Pi/2,Pi/2}] In[4] = ParametricPlot3D[{Cos[i],Sin[£], t/4}, {£,0,20}] B0 92) Mathematica stellt weitere Anweisungen zur Verfügung, mit denen Dichte und Konturdiagramme. Abbildung 20 9 Balken- und Sektordiagramme sowie Kombinationen der unterschiedlichsten Diagrammarten erzeugt werden können. ¦ Die Darstellung zum Lorenz- Attraktor (s 17 2.4 3, S. 850) wurde mit Mathematica erzeugt
20 5 Graphik in Computeralgebrasystemen 1037 20.5.2 Graphik mit Maple 20.5.2.1 Zweidimensionale Graphik Maple kann über plot-Befehle mit einer Vielzahl von Optionen Funktionen graphisch darstellen Als Eingabefunktionen sind sowohl explizite Funktionen einer Variablen, Funktionen in Parameterdarstellung und Listen von zweidimensionalen Punkten zugelassen. Maple berechnet aus der Eingabefunktion nach bestimmten internen Algorithmen eine Wertetabelle, deren Punkte nach einem Spline-Verfahren zu einer glatten Kurve verbunden werden. Mit Hilfe einer Reihe von Optionen kann die Gestaltung der Graphik beeinflußt werden Die Graphik selbst wird in einer eigenständigen Umgebung dargestellt und kann mit entsprechenden Systembefehlen in Arbeitsdokumente eingebunden bzw. in entsprechenden Formaten auf Drucker oder Plotter ausgegeben werden Die Ausgabe in Dateien verschiedenen Formats einschließlich Postscript ist möglich. 1. Syntax zweidimensionaler Graphik Der zweidimensionale Plot-Befehl hat die prinzipielle Struktur iplot(funct, hb, vb, options); B0 93) Das erste Argument funct kann folgende Bedeutung besitzen a) eine reelle Funktion einer unabhängigen Variablen, etwa f(x); b) eine Prozedur (Funktionssymbol), die z.B mit dem Pfeilsymbol erzeugt wurde; c) die Parameterdarstellung einer reellen Funktion in Form einer Liste [u(t),v(t),t = a b], wobei t = a..b den Laufbereich des Parameters angibt, d) mehrere, in geschweifte Klammern eingeschlossene Funktionen, die gemeinsam dargestellt werden sollen, e) eine Liste von Zahlen (gerade Anzahl), die fortlaufend als (x, y)-Koordinaten von Punkten interpretiert werden Tabelle 20.28 Optionen des Plot-Befehls coords = polar bewirkt die Darstellung einer parametrischen Eingabe in Polarkoordinaten (der erste Parameter ist der Radius, der zweite das Argument) numpoints = n legt die minimale Anzahl der generierten Punkte fest (Voreinstellung 49) resolution = m Setzt die horizontale Auflösung der Darstellung in pixel (Voreinstellung m = 200) xtickmarks = p Setzt die Anzahl der Skalenstriche auf der x- Achse style = SPLINE veranlaßt die Verbindung mit kubischer Spline-Interpolation (Voreinstellung) style = LINE veranlaßt lineare Interpolation style = POINT zeichnet nur die Punkte title = T Setzt den Titel für die Graphik, T muß ein String sein Das zweite Argument hb ist der Laufbereich der unabhängigen Variablen, er ist in der Form x = a b einzugeben Wird kein Argument eingegeben, so nimmt Maple automatisch den Laufbereich —10.. 10 an Es ist möglich, einer oder beiden Grenzen den Wert — oo und/oder oo zuzuordnen In diesem Fall wählt Maple eine Darstellung der x-Achse mit arctan. Das dritte Argument vb steuert den Darstellungsbereich der abhängigen (vertikalen) Variablen Auch er ist in der Form y = a. b einzugeben Wird er fortgelassen, so nimmt Maple die sich aus der Funktionsgleichung ergebenden Werte für den jeweiligen Bereich der unabhängigen Variablen Dies kann problematisch werden, wenn in diesem Bereich z.B eine Polstelle liegt. Daher sollte man, wenn nötig, diesen Bereich begrenzen Als weitere Argumente können eine oder mehrere Optionen folgen, die in Tabelle 20.28 dargestellt sind. Zur Darstellung mehrerer Funktionen durch Maple in einer Graphik werden diese in der Regel in verschiedenen Farben oder in unterschiedlicher Linienstruktur erzeugt Die auf graphischen Oberflächen laufenden Versionen von Maple bieten die Möglichkeit, direkt an der Graphik über entsprechende Menüs
1038 20 Computeralgebrasysteme Veränderungen wie z.B. das Verhältnis von horizontaler zu vertikaler Abmessung, die Rahmung des Bildes, Änderung der Linienstärke usw. vorzunehmen 2. Beispiele für zweidimensionale Graphiken Die folgenden Graphiken wurden mit Maple erzeugt, danach mit Coreltrace vektorisiert und mit Co- reldraw' nachbearbeitet. Dies war notwendig, weil die unmittelbare Konversion einer Maple-Grapliik in eine EPS-Datei nur sehr kleine Liniendicken ergibt und damit unansehnliche Bilder liefert. 1. Exponential- und Hyperbelfunktionen Mit der Konstruktion > plot({2Ax, 10Ax, (l/2)Ax, (l/10)Az, exp(x), l/exp(x)}, x = -4 4, y = 0 20, B0 94a) > xtickmarks = 2,ytickmarks = 2). B0 94b) erhält man die in Abb.20.10a dargestellten Exponentialfunktionen. a) -4 -2 4x b) Abbildung 20.10 Ähnlich liefert der Befehl > plot({sinh(x), cosh(x), tanh(x), coth(x)}, x = -2 1 2.1, y = -2 5..2 5); die gemeinsame Darstellung der vier Hyperbelfunktionen (s 2 9 1, S 88) in Abb.20.10b J(n,z) «=0,2,4 y f /-x J(n,z) rc=l,3,5 Abbildung 20.11 2. Bessel-Funktionen (s. auch 20 5.1.5,3., S 1034) Mit den beiden Aufrufen > plot({BesselJ@, z), BesselJB, z), BesselJD, z)}, z = 0..10), B0 95a) > plot({BesselJ(l,z),BesselJC,z),BesselJE,z)},z = 0 10); B0 95b) erhält man die ersten drei BESSEL-Funktionen J(n, z) mit geradem n (Abb.20.IIa) und mit ungeradem n (Abb.20.11b) und (Abb.20.11c). In ähnlicher Art und Weise lassen sich die anderen in Maple vordefinierten speziellen Funktionen darstellen. 3. Parameterdarstellung Mit dem Aufruf > plot([* * cos(t), t * sin(t), t = 0..3 * Pi]), B0 96a) erhält man die in Abb.20.12a dargestellte Kurve Auf die folgenden zwei Aufrufe liefert Maple eine trochoidenähnliche Schleifenfunktion (vgl verkürzte Trochoide in 2 13 2, S. 102 bzw eine hyperbolische Spirale in 2.14.2, S 106). > plot([t - sinB *£),!- cosB * t), t = -2 * Pi..2 * Pi}); B0 96b)
20.5 Graphik in Computeralgebrasystemen 1039 > plot([l/i, t,t = 0..2 * Pi\, x = - 5..2, coords = polar); B0.96c) Durch die Einfügung der Option coords in die Anweisung interpretiert Maple die Parameterdarstellung als Polarkoordinaten. c) i i i Abbildung 20.12 3. Spezialpaket plots In der Maple-Bibliothek findet man das Spezialpaket plots mit zusätzlichen graphischen Operationen Im zweidimensionalen Fall sind hier besonders die beiden Anweisungen conf ormal und polarplot von Interesse Mit polarplot(L, options) B0 97) können Kurven in Polarkoordinatenform gezeichnet werden. Mit L kann eine Menge (in geschweifte Klammern eingeschlossen) mehrerer Funktionen r((p) bezeichnet sein Maple interpretiert die eingehende Variable (p als Winkel und zeichnet die Kurven im Bereich zwischen — n < ip < tt , wenn nicht ein davon abweichender Bereich explizit eingegeben wird Der Befehl conf ormal(F, rl, r2, options) B0.98) bildet mit Hilfe der komplexen Funktion F die Gitterlinien eines rechteckigen Gitters in ein Kurvengitter ab. Die neuen Gitterlinien schneiden sich ebenfalls rechtwinklig Mit dem Bereich rl werden die ursprünglichen Gitterlinien festgelegt Er ist voreingestellt auf 0..1 + (—lI/2. Der Bereich r2 legt die Größe des Fensters fest, in welchem die Abbildung liegt. Hier werden als Voreinstellung die sich aus der Abbildung ergebenden Maxima und Minima benutzt. 20.5.2.2 Dreidimensionale Graphik Für die Darstellung von Funktionen zweier unabhängiger Variablen als räumliche Flächen oder auch zur Darstellung räumlicher Kurven stellt Maple den Befehl plot3d zur Verfügung. Die mit diesem Befehl erzeugten Objekte werden von Maple ganz analog wie auch die zweidimensionalen in einem eigenen Fenster dargestellt Die Anzahl der Optionen zur Darstellung ist wesentlich größer, insbesondere sind zusätzliche Optionen zur Betrachtungsperspektive von besonderer Bedeutung. 1. Syntax des plot3d-Befehls Der Befehl ist in vier verschiedenen Formen verfügbar a) plot3d(/wnc£, x = a .b,y = c .d). In dieser Form ist funct eine Funktion zweier unabhängiger Variabler, deren jeweilige Laufbereiche von x — a..b und y = cd festgelegt werden. Das Ergebnis ist eine räumliche Fläche. b) plot3d(/, a .6, c .d). Hier ist / eine Prozedur mit zwei Argumenten, z.B. mit dem Pfeiloperator erzeugt, die Laufbereiche beziehen sich auf diese Argumente c) plot3d([w(s, t), v(s, t), w(s, t)],s = a. b,t = c d) Die drei Funktionen u, v, w der beiden Parameter s und t definieren die Parameterdarstellung einer räumlichen Fläche, begrenzt durch die Laufbereiche der beiden Parameter. d) plot3d([/, g,h),a 6, c. d). Das ist die äquivalente Form der Parameterdarstellung, wobei /, g, h Prozeduren in zwei Argumenten sein müssen. Alle weiteren Argumente des Operators plot3d interpretiert Maple als Optionen. Einige wichtige Optionen sind in Tabelle 20.29 dargestellt. Sie sind in der Form Option = wert zu benutzen.
1040 20. Computeralgebrasysteme Tabelle 20 29 Optionen des Befehls plot3d numpomts — n grid[ra, n] labeis = [x.y,z style = s coords = c projection = p orientation = [theta,phi] view = z\ zl setzt die minimale Zahl der generierten Punkte (Voreinstellung ist n = 625) legt die Dimension des Rechteckgitters fest, auf dem die Punkte generiert werden spezifiziert die Achsenbezeichnungen (string erforderlich) s ist ein Wert von POINT, HIDDEN, PATCH, WIREFIRE. Hiermit wird die Art der Darstellung der Oberfläche festgelegt / kann die Werte BOXED, NORMAL, FRAME oder NONE annehmen Hiermit wird die Darstellung der Achsen spezifiziert spezifiziert das zu benutzende Koordinatensystem Werte sind cartesian, sperical, cylindrical Voreinstellung ist cartesian p nimmt Werte zwischen 0 und 1 an und bestimmt die Betrachtimgsperspektive Voreinstellung ist 1 (orthogonale Projektion) spezifiziert die Winkel des Raumpunktes im sphärischen Koordinatensystem, von dem aus die Oberfläche betrachtet wird gibt den Bereich der z-Werte, für die die Oberfläche dargestellt wird Voreinstellung ist die gesamte Oberfläche In der Regel sind fast alle Optionen über die entsprechenden Menüs im Zeichnungsfenster erreiclihar und entsprechend einstellbar Auf diese Weise kann man nachträglich die Anschaulichkeit der darzustellenden Oberfläche wesentlich verbessern. 2. Zusätzliche Operationen aus dem Paket plots Das schon erwähnte Bibliothekspaket plots liefert weitere Möglichkeiten für die Darstellung räumlicher Strukturen. Besonders soll hier die Darstellung von Raumkurven mit dem Befehl spacecurve erwähnt werden Dieser erwartet als erstes Argument eine Liste mit drei Funktionen eines Parameters, das zweite Argument muß den Laufbereich dieses Parameters festlegen. Darüber hinaus sind die Optionen des Befehls plot3d zugelassen, sofern sie für diesen Fall sinnvoll sind Weitere Informationen s Literatur. ¦ Mit den Eingaben > plot3d([cos(£) * cos(w). sin(£) * cos(u), sin(u)], t = 0 2 * Pi, u = 0 2 * Pi) B0 99a) > spacecurve([cos(*),sin(£).£/4],* = 0 7 * Pi) B0 99b) werden die Graphiken einer perspektivisch dargestellten Kugel (Abb.20.13a) und einer perspektivisch dargestellten räumlichen Spirale (Abb.20.13b) erzeugt Abbildung 20.13
1041 21 Tabellen 21.1 Häufig gebrauchte Konstanten 7T 17. 1%. e Ige = M M C 3,141592654 .. 0,01 0,001 2,718281828.. 0,434294482 .. 2,302585093... 0,577215665... LuDOLFsche Zahl Prozent Promille EuLERsche Zahl EuLERsche Konstante 21.2 Fundamentale physikalische Konstanten Die Tabelle wurde unter Verwendung von [21.12], [21.13] zusammengestellt. In runden Klammern ist die relative Standard Abweichung der letzten Ziffern der angegebenen Zahlenwerte ausgewiesen Universelle Konstanten Lichtgeschwindigkeit (Vakuum) Fallbeschleunigung Gravitationskonstante Induktionskonstante Influenzkonstante PLANCKsches Wirkungsquantum Wellenwiderstand (Vakuum) c0,c 9n G ßo £o h h Zo = 299 792458ms-1 (exakt) = 9,806 65 ms-2 (exakt) D5° geogr Breite, Meereshöhe) = 6,6742 A0) • 101 nr^kg-V2 = 47T-10-7 NA-2 = 12,566370614. .-10 NA-2 (exakt) = l//iec2 = 8,854187817 . -102 Fm (exakt) = 6,626 069 3A1) • 10~34 Js = 4,135 667 43C5) • 105 eVs = h/2n = 1,054 57168A8)-10-34 Js = 6,58211915E6)-10-16eVs = 376,730 313461 ü (exakt). Elektromagnetische Konstanten Elementarladung, elektrische Elektronenladung, spezifische Feinstrukturkonstante Flußquant, magnetischer JOSEPHSON-Konstante V. KLITZING-Konstante Leitfähigkeitsquant Zirkulationsquant e e/h -e/me a 1/a #0 K3 Rk Go s = 1,60217653A4)-10-19C = 2,41798940B1)-1014AJ_1 = -1,758 82012A5)-10nC kg = ßece2/2h = 7,297 352 568B4) • 10 = 137,03599911D6) = h/2e = 2,067833 72A8)-10-15Wb = 2e/h = 483 597,898A9) • 109 HzV = h/e2 = 25812,807 449D1) Q = 2e/h = 7,748 091696B8) • 10 S = h/2me = 3,636 947 550B4)-10 mV1 ) Atomhülle BOHRsches Magneton BOHRscher Radius klassischer Elektronenradius RYDBERG-Konstante RYDBERG-Energie THOMSON-Querschnitt ßB a0 re #oo hCToo ^0 = eh/2me = 9,274 00899 C7) • 106 JT_1 = 5,788 381804C9) • 10~5 eVT-1 = h2/E0{e)e2 = re/a2 = 0,529177 2108A8)-100 m = a2a0 = 2,817 940 325B8) • 105m = no2me4cs/8h3 = 10973 731,568 525G3) m = 13,605 692 3A2) eV = 87rre2/3 = 0,665245854A5)-KT28 m2
1042 21 Tabellen Atomkern, Elementarteilchen Atomare Masseneinheit COMPTON-Wellenlänge Elektron Neutron Proton Kernmagneton Kernradius Magische Neutronen- und Protonen-Zahlen Ruheenergie Atomare Masseneinheit Elektron Proton Neutron Ruhemasse Elektron Proton Neutron Magnetisches Moment Elektron Proton Neutron rau Ac Ac,e Ac,n Ac,P A*k R Nm,Zm Nm E0(u) Eo(e) Eo(p) E0(n) me mp mn ße VP Mn = lu= (kgmol)/^ = ^mA2C) = 1,660 53886B8) •10-27kg = 931.494043(80) MeVc = 1822,89me = h/mec = 3,861 592 642B8)-10-13m = 2,100194142A6)-10-16m = 2,103 089 089A6)-KT16 m = e%/2mp = 5.050 783 43D3) • 107 JT = 3,152 451 259B1). 10-8 eVT = ro41/3,ro = (l,2. . 1,4) fm, 1 < A < 250- r0 < R < 9 fm = 2, 8, 20, 28, 50, 82; = 126. eventuell 184; Zm = eventuell 114, 126 = 931,494013C7) MeV = 0,510 998 902B1) MeV = 938,271998C8) MeV = 939,565 330C8) MeV - 9,109 382 6A6) • 10~31 kg = 5,485 799 0945B4) • 10~4 u = 1,672 621 71B9)-10-27 kg =1836,152 672 61(85)me = 1,00727646688A3) u = 1,674 927 28B9) • 107 kg = 1 838,683 659 8A3)rae = 1,008 664915 60E5) u = -1,001159 652 1859D1)/iB = -928,476 412(80) • 106 JT-1 = +2, 792 847337B8)//k = 1,410606 71A2)-lO6 JT_i = -1,913 042 72D5)/ik = 0,966 236 45B6) • 10~26 JT Wechselwirkungskonstanten (dimensionslose, zum Vergleich) Starke Ww. Elektrom Ww Schwache Ww. Gravität ions-Ww. &k OLG aF &G = 0,08. .14 = 1/137 = 3-10-12 = 5, MO9 Physikalische Chemie, Thermodynamik AvoGADRO-Konstante BOLTZMANN-Konstante Gaskonstante, universelle FARADAY-Konstante LOSCHMIDT-Konstante Molarvolumen, ideales Gas (r = 273,15K,p= 101,325kPa) 1 PLANCKsche Strahlungskonstante 2 PLANCKsche Strahlungskonstante STEFAN-BOLTZMANN-Konstante WiENsche Verschiebungskonstante b = AmaxT = c2/4,965 114 231.. NA k Ro F n0 vm C\ c2 CT b = 6,0221415A0)-1023mor1 = Rq/Na = 1,380 6505B4)-10-23 JK_1 = 8,617343A5) • 10~5 eVK-1 = NAk = 8,314472A5) Jmol"^-1 = iVAe = 96485,3383(83) Cmol-1 = NA/Vm = 2,686 777D7) • 1025 m~3 = RoTo/po = 2,2 413 996C9) • 10-2 m3mor1 = 2-Khcl = 3,74177138F4)-10-16W-m2 = hco/k = 1,438 775 2B5) • 10 m-K = (tt2/60)A;4/^3c2 = 5,670 400D0) -lO"8 WmK =2,897 768 5E1)-10-3 m-K
21 3 Dezimalvorsätze 1043 21.3 Dezimal vor sätze Vorsatz Yocto Zepto Atto Femto Pico Nano Mikro Milli Zenti Dezi Potenzschreibweise 1Q-24 io-21 10-18 105 io-12 io-9 io-6 io-3 io-2 IO Abkürzung y z a f P n M m c d Vorsatz Deka Hekto Kilo Mega Giga Tera Peta Exa Zetta Yotta Potenzschreibweise IO1 IO2 IO3 IO6 IO9 IO12 IO15 IO18 IO21 IO24 Abkürzung da h k M G T P E Z Y ¦ IO3 = 1000. ¦ IO - 0,001. ¦ 1/xm A Mikrometer) = 10_6m ¦ 1 nm A Nanometer) = 10_9m 21.4 Physikalische Einheiten im Sl-System Weitere Informationen zu den physikalischen Einheiten s. auch [21 16]. [21.7], [21.17] Grundgrößen Länge Zeit Masse Temperatur Stromstärke Stoffmenge Lichtstärke m s kg K A mol cd Meter 1 Sekunde Kilogramm Kelvin Ampere | Mol A mol = A Stück, A = AvOGADRO-Zahl) Candela | Ergänzende SI-Einheiten Ebener Winkel Raumwinkel rad sr Radiant Steradiant a = l/r, 1 rad = 1 m/1 m Q = S/r2 , 1 sr = 1 m2/l m2 Abgeleitete SI-Einheiten mit selbsständigem Namen Frequenz Kraft Druck, Spannung Energie, Arbeit, Wärmemenge Leistung Elektrizitätsmenge Elektrische Spannung Elektrische Kapazität Elektrischer Widerstand Elektrischer Leitwert Magnetischer Fluß Magnetische Flußdichte Induktivität Lichtstrom Beleuchtungsstärke Hz N Pa J kWh w c V F Q S Wb T H Im lx Hertz Newton Pascal Joule Kilowattstunde Watt Coulomb Volt Farad Ohm Siemens Weber Tesla Henry Lumen Lux 1 Hertz = 1/s 1 N = 1 kg • m/s2 1 Pa = 1 N/m2 1 J = lNm= lkgm2/s2 lkWh = 3,6-106J 1 W=lkgm2/s3 = IN m/s 1C=1As lV=lkgm2/(As3) 1 F = 1 A2s2/(J2) m = lkgm2s3/(A2s3) 1 S = 1 A2s3/(kg m2) 1 Wb = 1 kg m2/(A s2) lT = lkg/(As2) 1 H = 1 kg m2/(A s2) 1 Im = 1 cd sr 1 lx = 1 cd sr/m2
1044 21. Tabellen Abgeleitete SI-Einheiten mit selbsständigem Namen Aktivität Aquivalentdosis Energiedosis Bq Sv Gy Becquerel Sievert Gray Bq = IS Sv^Jkg Gy-Jkg-1 Weitere abgeleitete SI-Einheiten Geschwindigkeit Winkelgeschwindigkeit Impuls Drehmoment Wirkung Fläche Dichte Elektrische Feldstärke Wärmekapazität Entropie m/s rads-1 kg ms-1 Nm2 Js m2 kg/m3 V/m J/K J/K Beschleunigung Winkelbeschleunigung Drehimpuls Trägheitsmoment Energie Volumen Teilchenzahldichte Magnetische Feldstärke Spezifische Wärmekapazität Enthalpie m/s2. rad s~2 kgm2s_1 kgm2 Ws m3 m~3 Am J/(Kkg) J Ausgewählte Sl-fremde gesetzliche Einheiten Fläche Wirkungsquerschnitt Volumen Geschwindigkeit Masse Energie Brechkraft Druck Ebener Winkel Zeit Ausgewählte SI-fre Länge Volumen Ebener Winkel Geschwindigkeit Energie Druck ar b 1 km/h u t eV dpt bar mmHg Grad Minute Sekunde min h d a mde nichl AE pc Lj Ä sm bbl gon kn cal atm Ar barn Liter Atomare Masseneinheit Tonne Elektronenvolt Dioptrie Bar mmHg-Säule 1° - tt/180 1° = 0,017453293. rad 1' = tt/10800 1" = tt/648000 Minute Stunde Tag Jahr ^gesetzliche Einheiten Astronomische Einheit Parsec Lichtjahr Angstr0m Internationale Seemeile Barrel Neugrad Neuminute Neusekunde Knoten Kalorie Phys. Atmosph lar = 100mJ lbarn= 108m2 ll=10-3m-3 1 km/h = 0,277778 ms 1 u=l, 6605655 -10~27 kg lt= 1000 kg leV= l,602m2kg/s2 1 dpt = 1/m 1 bar = 105 kg/(s2m) 1 mmHg =133,322 kg/(s2m) 1° = 0,017453293... A rad = 57,29577951 .. °) V = 000290888 ... 1" = 000004848 ... 1 min = 60 s lh = 3,6-103s ld = 8,64-104s la = 365d = 8760h 1AE= 149,597870-10ym lpc = 30,857-1015m lLj = 9,46044763 -1015m 1Ä = 10-I0m 1 sm = 1852 m 1 bbl = 0,158988 m3 lg = 0,57r-10-2rad lc = 0,5?r 10 rad lcc = 0,57r.l0-6rad lkn= lsm/h = 0,5144 m/s lcal = 4,1868kgm2/s2 1 atm = 1,01325- 105kg/(s2m) Zu Einheiten, die gemäß EG-Richtlinie nur in einigen EG-Staaten zugelassen sind, s. [21.17]
21 5 Wichtige Reihenentwicklungen 1045 21.5 Wichtige Reihenentwicklungen Funktion (a±x)n (l±x)m (ra>0) (l±s)i {l±x)i (l±x)i (l±x)% (l±x)'i (l±.T)~m (m>0) (l±a;)-7 (l±x)-i (l±x)-i (lix)-1 (l±x)-2 (l±:r)-2 Reihenentwicklung Algebraische Funktionen Binomische Reihe Nach Umformung auf die Gestalt am 11 ± wird man auf die nachfolgenden Reihen geführt: Binomische Reihe mit positiven Exponenten 1 ± mr + gfrlZi) g* ± "(" ~ 1)(" ~ 2) ^3 + . . + (±1)n^(">-l) • (m-« + l)gB + 1 ± ia:- 4 1_ 4 1 3 2 2 , ¦ 3 3 1=t2*+2 i , 5 5 1=t2*+2 -^±- 1-3-7 -8-12* .Z o J. - Z - 0 o —x ± x — 6 3-6-9 3-6-9 1 4 1- •3 8 2- •7- 12 5 g 11 16 .4 :r4±- 1 2-L 1-1 3 ~IX ± -—; OL 4 2-4-6 1 1-3 3 11, 3 xd + - 4X T 2-4-6 2 0 ö " J. q 0 ~AX 2~T^>X' ~ 2 4-6 1-1 4 6 3-1 4-6 12 -.t =f • -aT=F- Binomische Reihe mit negativen Exponenten m(m+l) 9 m(m + l)(m + 2) o lTmi+^j V^ — gP V + - • 1-5 1 =F 7* + \ 4 4 • 1 1-4 ;X =F 1-5-9 4-8 12 ^° + - 1-5-9-13 12-16 ^=F- 1 - - - 2 ! 4 3 1 4 7-10^4 3-6-9 12" x "=F- 1-3 1 3-5 1 T -.t H x* =F ¦ ^2 2-4 ^ 2-4- 1 =F x + x2 =F x3 + x4 =p • -ar + 1-3-5-7 2-4-6- ^ =F- 3-5 3-5-7 1 =F 2a: + 3x2 =f 4x3 + 5x4 =F 3-5-7-9 2-4-6- -x* =F • Konvergenzbereich \x\ < a fürra > 0 \x\ < a fürm < 0 |s| <1 \x\ < 1 |x|<l \x\<l \x\ < 1 \x\<l x\ < 1 x\ < 1 x\ < 1 x\ < 1 x| < 1 x\ < 1 x\ < 1
21 Tabellen Funktion Reihenentwicklung Konvergenzbereich (l±x)-i (l±x)~3 (l±x)~4 (l±x) 1 5 5-7 , .5-7-9 '2-4-6 x° + 5-7-9- ll 2-4-6-8 x*T • • 1 =F y-zB • 3x =F 3 • 4x2 + 4 • 5x3 q= 5 • 6x4 + • • •) IT 1-2-3 1=F 1 B • 3 • 4x =f 3 • 4 • 5x2 +4 • 5 • 6x3 =F 5 • 6 • 7x4 + • • •) -B-3-4-5x=f3-4-5-6x2 1-2-3 4V +4 • 5 • 6 • 7x3 =F 5 • 6 • 7 • 8x4 + • • •) Trigonometrische Funktionen ~5 ~2n+l sin(x + a) X~ü+V sin a + x cos a — ¦ ¦ + (-l)n Bn+l)! ±-- x4sina xnsin(a + ^) +—7\— + • • • + ^ — 1-¥ + i!-¥ + --- + (-1)"B^)!± cos(x + a) tanx cotx cos a — x sin a — 2! 3! x4cosa xncos(a+^) 4! + . n' 1 o 2 r 17 7 62 q |22"B2"-l)B„j2n_1 | Bn)l x i3 2x5 x7 3 + 45 + 945 + 4725 +'" 22n£„ Bn)l ' 1+2* +24X + 61 ^ + 277 ;1° + - 720 8064 + B«)! |*| <1 |x| <1 |x|<l |x|<l |x| < oo |x| < oo |x| < oo |x| < oo M<5 0 < \x\ < 7T
21.5 Wichtige Reihenentwicklungen 1047 Funktion Reihenentwicklung Konvergenzbereich In ex - 1 In x In x In x ln(l + x) ln(l-x) 1+x 1 1 - + «Z + T^Z + - 31 -xJ + - 127 x 6 360 15120 604800 + x' +¦ 2B2n-l _ 1} Bn)> '-Bnx* Exp onent ialfunkt ionen x x2 x3 xn 1 + Ti+2T+3!+--- + ^ + --- x In a (x In aJ (x In aK (x In a)n 1 + —r~ + -—^-^ + ^—^-+ *•• + - H^ + - 1 1 i £ 1 *— 2 2! 4' 6' B r2n Bn)! Logarithmische Funktionen x-l {x-lf (x-lM x + 1 3(x + lK 5(x + lM (x-lJ Bn + l)(x+lJn+1 (,_1)_(^ + (^1)!_^1L + 3 4 +(-l)"+i (g)W±. a-x. = 2 Artanh x n x-l (x-lJ (x-lK (x-l)n h — + — H h — + • x 2x2 3x3 nxn ,-^+^-^+...+(-ir>£±... x + —+ — + — + — + ••. + —+ • 2 3 4 5 n X+ — + — + — + ••• + - r 3 5 7 2n + 1 0 < |x| < TT \x\ < oo |x| < oo |x| < 2tt x>0 0<x x > <2 1 2 -1 <x < 1 -1 <x < 1 1*1 <1
1048 21. Tabellen Funktion "(St) = 2 Arcoth x ln|sin:r| In cos x In |tan x\ aresin x arecos x aretan x aretan x arecot x Reihenentwicklung 2 1111 1 x + 3x3 + 5x5 + 7^ + ' " + Bn + 1) z2n+1 + x2 x4 x6 22n~1Bnx2n n \x\ - — - — - ^^ n Bn)' rr2 x4 x6 17x8 ~T ~ 12 ~ 45 ~ 252Ö 22nB2" -l)Bnx2n n{2n)! i i i 1 2 7 4 62 6 ln^ + 3* +9ÖX+2835X+--- 22-B2-1 - 1M 2 + nBn)! Inverse trigonometrische Funktionen x3 l-3x5 l-3-5x7 <£ _| 1 1 1_ . . . 2-3 2-4-5 2-4-6-7 l-3-5---Bn-l)x2n+1 + 2-4-6---Bra)Bn + l) + " ' TT 2~ x3 l-3x5 l-3-5x7 x -1 1 1 1- • • • 2-3 2-4-5 2-4-6-7 l-3-5---Bn-l)x2n+1 + 2-4-6---Bn)Bn+l) +'" rpO ~.5 rpl rp2n-\-\ -t + t-t+-+(-1) äm±- TT 1 1 1 1 2~x + 3^~5^ + 7^ + (_l)n+l * ± . . . 1 ; Bn+l)x2"+1 7T ™o ~,5 ~,7 ™2ti+1 Konvergenzbereich |z| > 1 0 < \x\ < TT 1 1 ^ N<2 0 < |i| < - |x|<l |x|<l N<i |z|>l |x|<l
21 5 Wichtige Reihenentwicklungen 1049 Funktion Reihenentwicklung Konvergenzbereich sinhx cosh x tanh x coth x sech x cosech x Hyperbelfunktionen x2n+l x2 x4 x6 x2n 1 3 2 5 17 - 62 9 X- -X6 + —X - ~ X + —— X* - • 15 315 2835 (_l)n+l22nB2n_l) Bn)! 1 sc x3 2x5 x7 x + 3 ~ 45 + 945 ~ 4725 + ''' (_l)n+l 22n £n^ 61 1-T^ + T^-e\" + - 1385 Bn) + ir^ £^n^2n ± 1 a; 7 a;3 31a;5 + -^7- 7^77^ + ' Bn)l x 6 360 15120 + 2(-l)-(^-l)fl^1 + . Bn) Arsinh x Arcosh a; Artanh a: Arcoth a; 1 o 1-3 X-^3^ + 2T4^ Areafunktionen 1-3-5 2-4-6-7 1-3-5 --Bn-l) n j 2-4-6---2nBn+l) ± In Ba;)- 1 1-3 1-3-5 2 • 2x2 ~ 2 • 4 • 4a:4 ~ 2 • 4 • 6a;6 /«O ~,ö ™J rpZTl-J-L I _L _L _L i ä: + 3a:3 + 5a:F + 7a:7+"'+Bn+l) £2n+1 |a;| < oo |x| < oo 0 < |a;| < 7T i i n N<2 0 < \x\ < TT \x\<\ X > 1 |s|<l |x|>l
1050 21. Tabellen 21.6 Fourier-Ent Wicklungen 1 y — x für 0< x < 2tt 2. y = x für 0< x < tt y = 2tt — x für tt < x < 2tt v\aaa^- -2ji 0 2ji 4ji 6tt x n /sina; sin 2a: sin 3z \ TT 4 / 2 TT V 7T 4 / cos 3a: cos 5a: 2/ = I cos x H — 1 — h • 32 52 3 » = A -7l/ X für — TT < X < TT ¦y /I A A A . 0 k/ 3h/A bh/ 7h/ * 2jt ' 4ji " ort " /-**, X n /sina: sin 2a; sin 3ar -) 4. y = x fur —TT < x < TT 7T 37T y = 7T-a;fur-<a;<Y 4 f - — sin a: ¦ TT \ sin 3a: sin 5a: 5. 2/ = a für 0< x < tt y = — a für tt < x < 2tt 4a / . — sin x TT V sin 3a: sin 5a: + ^7— + —¦=— + • 0 k 2k 3tc 4tc 57t 6tc 7tc X
21.6 Fourier-Entwicklungen 1051 6 y = OfürO < x < a und für7r — a < x < ir + a und 2n — a < x < 2tt y = a iiir a < x < TT — a ; y = —a für TT + a < x < 2tt — a TT 2 Li a /t-oc Nr 37i !! 2 Ott Ü 2 u r.. 571 jj 2 LI y = — I cos a sin x + - cos 3a sin 6x 7T \ 3 +-cos 5a sin 5a; + • 5 ) 7. y = — für — a < x < a a y = a für a < x < ir — a, a(n -x) y = für 7r — a < x < ir + a , a y = — a für ir + a < x < 2ir — a 4a/ 1 = [sin a sin x + — sin 3a sin 3x 7T a \ öz +—r sin 5a sin 5x + • ¦) Insbesondere gilt für a = 6\/3o V3a / . 1 -x- sm x - — 7T2 V 5' _ sin 5x + — sin Ix - —-r sin Ilse + • 5^ ll W 1 für —7T < X < TT 7T A /COS cos x cos 2x cos 3x 22 32 ¦71 \0 7t 2jz37l4jt57t67t77t ! = x(ir — x) für 0 < x < ir +y 7T2 /cos2x cos4x cos6x l2 22 32 -7t 0 7t 27t 37t 4jt 10 y = x(n — x) für 0 < x < tt y = (ir — x)Bn — x) für ir < x < 2k ty 3tt2/4 8 ( ¦ 1 0„ sin 3x + — sin 5x + • 36 5d -tf^/fo 7t^S2jt 37K^/47t
1052 21. Tabellen 11 y = sin x für 0 < x < tt -% 0 71 2% 371 47C X 2 4 /cos 2a: cos 4a: cos 6a: \ V = ~t~t ~ n V 1-3 + 3-5 + 5-7 + " ') _ 4 /2sii '~ TT l"T 4 / 2 sin 2a: 4 sin 4a: 6 sin 6a: 13. y = sin x für 0 < a: < tt y = 0 für 7T < a: < 2tt VN A ¦7C 0 n 2n 3n x 11. 2 /cos2a: cos4a: cos 6a: 14. v = cos ux für —7T < a: < 7T 2wsinw7r [ 1 cosa: cos 2a: cos 3a: smw7r I" ~7T [2 L2w2 «2-l w2-4 w2-9 (n eine beliebige, jedoch nicht ganze Zahl) 15. y = sinwa: für — tt < x < tt 2sinw7r / sina: 2 sin 2a: 3 sin 3a: V = tt \l-u2 ~ A-u2 + 9-u2 + ' (u eine beliebige, jedoch nicht ganze Zahl) 16. y = x cos x für — n < x < tt 1 . 4 sin 2a: 6 sin 3a: 8 sin 4a: 17. y = -In B sin- J für 0 < x < tt y = cos x + - cos 2a: + - cos 3a: + • 18. y = In Bcos-J für 0 < x < tt y = cos x - - cos 2a: + - cos 3a: - • 1 x 19. y = - In cot — für 0 < x < tt ¦ cos x + - cos 3a: + - cos 5x + • 3 5
21 7 Unbestimmte Integrale 1053 21.7 Unbestimmte Integrale (Hinweise zur Nutzung der Tabellen s. in 8.1.1 2,2., S. 445) 21.7.1 Integrale rationaler Funktionen 21.7.1.1 Integrale mit X = ax + b Bezeichnung. X = ax + 1 1 [Xndx= , l ^Xn+l (n^-1), J a(n + l) v ^ ; n f dx 1, ^ 2 / — = -lnX. / (fürn = -l s Nr 2). 3. / xXn dx = Xn a2(n + 2) a2(n+l) (n ^ -1, ^ -2), (für n = -1, = -2 s. Nr 5 und 6). 4 fxmXndx=-^f(X-b)mXndX (n^-1,^-2, .., ^ -m) Das Integral wird für m < n oder bei ganzzahligem m und gebrochenem n angewandt, in diesen Fällen wird (X — b)m nach dem binomischen Lehrsatz (s. 1.1.6.4, S. 12) entwickelt. * x dx x b AnX ' i '/ rxdx 1 / —1 6 7 ~X"=~a^ \(n-2)Xn-2 + (n - l)*"-1 »¦ r^=iiix2-2bx+b2i»x) x a < xdx b ~X2=~a^X xdx 1 ~X3=~a~* a2 X + 2X2)' (Ml,^2). 10 11 12 13. 14. 15 f x2 dx J ~X2~ = r x2 dx J ~X*~ = r x2 dx J Xn r x3dx J ~~?T = r x3 dx J "x2"" r x3dx J ~~X*~ = a3 X-261nX-M 73(lnX + x-2X-2)' 1 -1 26 (n-3)Xn~3 (n-2)Xw-2 (n - .(£!.S!+^.,,„,). ?(t-«+*)- h (*-»-*-?+£) 62 - 1)X"-! (r.^1,^2,/3).
1054 21 Tabellen „ fx3dx 1 /, v 36 362 b3 \ r x3dx 1 f 17 l^=A -1 36 (n-4)Xn~4 (n-3)Xn~3 f dx _ IX J xX b x r dx 1 /. X ax\ 19 /^ = -^r7+x)- /• dx 1 /, X 2ax a2x2\ 20 yxX^ = -6^(ln7+X--2X^j- 21 /_*L = -i y xX» 6« ~~ f dx 1 22. / = y x2X 6x r X ^ /n - l\(-a)V [nx M * J *** . a , X + 6^ln7- 362 (n - 2)X"-2 + (n - (n > 1). 63 -l)Xn~\ (n^l,^2,^3,^4) 1 -E n\ (—a)*x*~ «yci-ijx«-1 H na In — 2aX f dx _ _ r_^_ 1 2 X] 23 y x2X2- aL62X + a62x 63lnxJ r dx _ _ r 1 2 1 _ 3_ Xi y x2X3 ~ a i.262X2 + 63X + a63x 64 n x J r dx J x^X f dx _ 1 y x^x "3 r dx _ 1 y x3x2 ~ ~s /• dx _ 1 y x3x3 ~ ~# r dx J x~*X' 24 25 27. (n > 2). a In h ^^r 28. 29 30 3a2 In — + —- + x X 6a2 In — + —- x X X2] 2x2 X2 3aX] " 2x2 x a4x2 X2 2. r2 2x2 4aXl X 1 ^ i=3 {-a)lx% : (i - 2)X^" a2X2 (n + l)aX 2x2 n(n + l)a2, X + 0 ln- 2 x (n>3) /* dx J xmXn fom+n 1 _m^r2/^m + n-2 i 2^ H-a)' (m-i- l)!;-*-1 ' Wenn der Nenner des Gliedes unter dem Summenzeichen verschwindet, dann ist ein solches Glied durch das folgende zu ersetzen. frn + n-2\ nX V ra — 1 / x
21.7 Unbestimmte Integrale 1055 Bezeichnung: A = bf — ag\ f ax + b , ax Z\ , , , f dx _ 1 ^fx + g J (ax + b)(fx + 32 33. 34. 35. 36 -ln- (ax + b)(fx + g) A ax + b b (A^O). /¦ xdx 1 J (ax + b){fx + g) ~ Ä ln(ax + 6) - ^ ln(/x + p) (A^O) /¦ dx _ 1 / 1 _/ fx + g\ J (ax + 6J(/x + a) " A lax + 6 + Ä ~a~x~Tb ) ( ^ J' /* xdx J (a + x)F + a , a + x m- (a + x)F + xJ (a-6)F + x) (a - bJ 6 + x /• xzdx J (a + x)F + xJ = " 62 - ln(a + x) + (a^6). b2 - 2ab lnF + x) (a ^ 6) (a + x)F + xJ F-a)F + x) F - aJ v y F - aJ / dx _ -1 / 1 1 \ 2 a + x y (a + xJF + xJ ~ (a-6J U + x + 6 + xj + (a - bf 6 + x {a * h /" xdx _ 1 f a 6 \ a + 6 a + x ( / h\ J (a + xJF + xJ = (a-6J \a~+^ + bTi) + (a-6K n6T^ (ö ^ } 39 /• x'dx y (a + xJF + x -1 a2 62 + ¦ 2ab , a + x + 7 —te- (a + xJF + xJ (a-6J\a + x 6 + x/ (a-6K 6 + x 21.7.1.2 Integrale mit X = ax2 + bx + c (a^b). Bezeichnungen: X = ax2 + 6x + c; A = Aac — b2 40 dx r dx J ~X 2 2ax + b —F= arctan p=— 2 A 2ax + l f-Ä : Artanh - /-Ä 1 , 2ax + £ : In- "•/ V^A 2ax + b + < dx 2ax + 6 2a r dx (für A>0), (für A<0), (für A<0). X2 AX la r dx ~ÄJ ~X f dx _ 2ax + 6/1 3a \ 6a2 r dx y x3 ~ a {2X2+äxy+Ä2" y y f dx _ 2ax + 6 Bn - 3Ja /• dx ' y X^ " (n - DAX« + (n - 1)A J Xn~1' (s Nr 40). (s Nr.40).
1056 21. Tabellen 44. 45. 46. 47. xdx 1 b f dx ~JT = 2a~11 ~YaiH xdx bx -\-2c b f dx "X2 xdx AX AJ X bx + 2c bBn - 3) r xdx bx + 2c b{2n — 6) r dx J ~X"~ = "(n-lJAI"-1 ~ (n-l)A ./ Xn~1' ' x2 dx r x'dx _ x J X a b , „ b2 - 2ac /• dx 2^lnX + "^ 49 50 51 52 53 £2 dx (b2 — 2ac)x + bc 2c f dx x2 dx Xn : f dx ' J ~X f x'dx _ [b* - 2ac)x + bc 2c r dx J "X2" ~ a~ÄX + Ä y ~X i rxmd. ' J ~1& aAX —x xm dx c f dx (n — 2N r xdx Bn - 3)aXn-T + Bn - 3)a i F~ Bn - 3)a y ~X" x™-1 (ra-l)c rxm-2dx {2n-m- l)aXn~l Bn - m - 1) (n — m)b f xm~l dx a J )b__ r: ¦l)aJ ' Xn (ra^2n-l); Bn-m-l)a7 Xn ¦2n~ldx 1 fx2n~3dx c rx2n-3dx b rx2n~2dx r ar" 1 dx _ 1 /• r"~° dx er ar" ° dx b r J Xn aJ Xn~l ~aJ Xn aJ /dx lx2 b r dx x~X = 2c'n^C~2c'JY r dx 1 b r dx 1 r dx J x~X^ = 2c{n-l)Xn-1 ~2~cJ "X^^'cJ xXn~x' } x2X~~2c~2 x*~cx + \2c2 c J Xn (s Nr 40) (s Nr 40) (s Nr 40) (s Nr 40) (s. Nr 43 u. 46) (für m = 2n - 1 s. Nr.51) (s. Nr 40) 55. 56. r dx _ 1 y xmXn ~ ~(m-l)cxm-1Xn-1 ~ r dx _ 1 y {fx + g)X = 2(cf2 - gbf + g2a) b2 a\ f dx ~X Bn + m — 3)a (m — l)c (fx + 9J J x1 dx -2Xn (n + m-2)b (m — \)c dx r dx J xm~l /In X 2ga - bf 2(c/2 - gbf + g2a) J X 1 / + g*a)J Xn dx (s. Nr 40). (m> 1) (s. Nr 40) 21.7.1.3 Integrale mit X — a2 ± x Bezeichnungen- X = a ± x , x aretan - für das Vorzeichen „ + " , a x 1 a ~\~ x Y = { Artanh — = - In für das Vorzeichen „ — u und \x\ < a , a 2 a - x X 1 X ~h CL Arcoth — = - In für das Vorzeichen „ — " und \x\ > a a 2 x-a ' ' Im Falle eines Doppelvorzeichens in einer Formel gehört das obere Vorzeichen zuX = a2 + x2 , das untere zu X = a2 — x2 , a > 0
/: 57 lf.il- X a 64 65 r dx _ x 1 58- J JÖ ~ 2a^X + 2a^Y- 59 [dx = x ¦ 3* 3 V X3 4a2X2 8a4X 8a5 ' f dx _ x 2n— 1 r dx ' J Xn+* = 2na2Xn + 2na2 i X^' /• x dx 1 62 Jjp^VC r xdx 1 63' i "X^ = T4X^ r xdx 1 , ... r x2 dx _ x x 1 7 "X3" ~ ^ix2" 8^X 8^ nn [ x2 dx x , 1 r dx , . n. f x3dx , x2 a2 . „ 69/—= ±y-TlnX x3 dx _ a2 1 X2"-2X + 2 x3 dx _ 1 X3"""^ ' 4X2' f x3 dx 1 a2 y X"+! = ~2(n - ^X"-1 + 2nX" (n > ,2 71 f^-~ + 72. /"da; 1 , r2 73 JxX = ^nT dx _ 1 lx2 iX2 " 2a2X + 2^ nx* da: _ 1 1 1 x]_ xJÖ ~ 4a2X2 + 2a4X + 2^ "x" dg 1_ _1_ x2X a2a; a3
1058 21. Tabellen 77. 78 79. 80 dx x2X2 dx x2X3 dx x^X = dx x3X2 2a4X ^ 2a5 x 7x a?x 1 x ~aQx T4a4X2 8a6X ^ 8a7 1 1 £2 a2x2lf 2a4 n X 2a4.T2 1 2.1 ^_ 2a4X T a6 n X f dx 1_ _1_ 1 7 x^X3 - "^V TÄT 4a4X2 ^ 3 , z2 82 cb c\ii{b + cx)-l\nX±-Y 2 a F + cx)X a2c2 ± b2 21.7.1.4 Integrale mit X = a3 ± x3 Bezeichnungen, a3 ± x3 = X: im Falle eines Doppelvorzeichens in einer Formel gehört das obere Vorzeichen zu X = a3 + x3 , das untere zul = fl3-i3 83 84 85 86 87 88 89. 90 91. 92 93. 94. /dx ~X = ±6^ (a ±xJ 1 2x =F a —z ö + n r- arctan 7=- a2^ax + x2 a2v3 aV3 dx . a2 =f ax + x2 , In ; ; rr ± - {a±x2) r dx x 2 r dx J X2 = 3a3X + 3^ y ~X r xdx 1 y ~y~=6^ / / / / / / / / y x2^2 1 2:r =fa —= arctan =-. i>/3 aV^ xdx ~X2~ = x2 dx X x2 dx "x2" x3 dx X x3 dx ~JB~ dx ~x~X = dx x~JÖ = dx x~V( = dx x2 1 f xdx = 3a3X + 3^ y ~X~ =4inx i ~Zf3X' o r dx x 1 r dx = TSX ZJlX 1 , x3 wlnx' 1 1 x3 ~ 3a3X 3a6 "x* 1 1 r xdx a3x a3 J X 1 x2 4 (s Nr 83) (s. Nr 85) (s. Nr.83) (s Nr 83) 3a6X T 3a6 / xdx (s Nr 85) (s Nr 85)
21 7 Unbestimmte Integrale 1059 /dx 1 1 f dx . _ _ rtrt. *x—üü**h (s Nr83) f dx 1 x 5 f dx . nn. 96 Ix^ = -2o^^^X^mJx ' (S-Nr83) 21.7.1.5 Integrale mit X = a4 + x4 r dx 1 1 x2 + ax V2 + a2 1 ax\/2 97 / — T = 7= In 7= 1 7= arctan — - J a4 + x4 4a3^2 x2-ax\/2 + a2 2a3\/2 a2 - x2 /x dx 1 x2 —* 7 — :r-^ arctan —. a4 + x4 2a2 a2 f x2 dx 1 , x2 + axy/2 + a2 1 ax\/2 99 / — - = 7= In 7= h 7—7= arctan - J i 100 a4 + x4 4av^ x2-ax>/2 + a2 2a>/2 ¦3 dx 1 , /• x°dx 1 4 4 / —; 7 = T "H" + z ) 7 a4 + x4 4 v J 21.7.1.6 Integrale mit X = a4 - x4 *~* f dx l . a + x 1 x 101 / — = —— In h r-^- arctan - Ja4- x4 4a3 a - x 2a3 a r xdx 1 a2 + x2 J a4-x4 = 4a~* na2-x2' r x2 dx 1 . a + x 1 x 103 / — t = — In —- arctan -. J ar — x4 4a a — x 2a a 104. /4^- = -Ilri(a4-x4). 7 a4 - x4 4 v y 21.7.1.7 Einige Fälle der Part ialbruchzer legung 105 l ~ l ( h « (a + bx)(f + gx) fb-ag \a + bx f + gx 1 A B C (x + a)(x + b)(x + c) x + a x + b x + c' wobei gilU = — -, B = — -, C = — - {o — a){c — a) {a — b){c — o) [a — c)\p — c) 1 A B C D 107 TT —, = + r + + - (x + a)(x + b)(r + c)(x + d) x + a x + b x + c x + wobei gilt A = — — — , B 108. {b - a)(c - a){d - a)' {a-b)(c- b){d - b) 1 1 / b q (a + bx2)(f + gx2) fb-ag \a + bx2 f + gx2
1060 21. Tabellen 21.7.2 Integrale irrationaler Funktionen 21.7.2.1 Integrale mit y/x und a2 ± b2x Bezeichnungen: arctan für das Vorzeichen „ + ", X = a*±b2x,Y=i, 1 a + ^ - In —= für das Vorzeichen „ — ". 2 a — b\Jx Im Falle eines Doppelvorzeichens in einer Formel gehört das obere Vorzeichen zu X = a2 + b2x, das untere zu X — a2 — b2x. tyftdx _ 2JZ 2a Uy' J X ~± b2 T 63 ^ fVö*dx_ 2y^ 2a2 yß 2a?_ J ~JT~ ~ 3 b2 64 + 65 fyftdXy/x 1 y X2 +62X aö3 / Vx^dx _ 2y/x* Sa2y/x 3a ' J x2 ~ ~b2Y+ b4x ~¥ 13 fJ^ = lY. J Xy/x ab 15 |^ = ^ + 4y. 16. X2v^ a2X a36 y rfs _ 2 3b2y/x~ 36 V X2V^3 ~~ a2Xyß T a*X T a5 ' 21.7.2.2 Andere Integrale mit y/x -~ f \/xdx 1 . x + a\/2x + a2 1 a-\/2ä? 17. /— - = 7= In p= -H 7= arctan — . J aA + x2 2ay/2 x - ay/2x + a2 ay/2 a2 - x r dx 1 . x + a>/2x + a2 1 a\/2x 18. / tu ox r- — —^~r= m 7= ö + „ /- arctan - 7 a4 + x2V£ 2a3x/2 x-av/^ + a2 . 19 (a4 + x2)v/£ 2a3\/2 x-a\/2^ + a2 a3\/2 y^ dx 1 a + -y/x 1 y^ f Jx dx 1 . a + \/x 1 vx / -^ = — In ¦= arctan J a4 — xl 2a a — yjx a a r dx _ 1 a + y/x 1 y^ J (a* — x2)y/x 2a3 a — \fx a3 a 21.7.2.3 Integrale mit Vax + b Bezeichnung: X — ax + b
21 7 Unbestimmte Integrale 1061 .21 [y/Xdx=—y/X* J 6a 22. xVXdx=— -^ J 15a2 23 15a2 ./ 105a3 ./ >/* a .25 /^ = 2(flg-226)^. i >/X 3a2 / x2rfT _ 2Ca2.x2-4aft:r + 8ft2)y/X y vx ~ loa5 27 28 29 30 31 ^X dx xy/X Vx dx Vx Vx 2 ^ [X 1 . y/X-y/b ... . n 7= Arcoth W — = —p In —7= 7= rur 0 > 0 , V^ V b y/b yfX + y/b 2 [Y r , „ = arctan w —- für b < 0 -b V —0 / J x I xsfX I r* y/X a r dx ~2bJ x\/X J; y/X a f dx x = 1- /- J xn dx x 2 1 Xy/X y/X Bn - 3)a G?- l)bxn~l Bn-2)b 2y/X^ yfx' 32 [y/X*dx .33 j' xyfJÖdx=^($yf)Ö- 7by/X*' r dx J xn-ly/ Vx' 5a 2 ' 35^2 34 [jVx»*r = l(^-»S*+!y* J a3 \ 9 7 5 35 36 37 / 2v/A3 - 2by/X + b2 f dx xy/X i%-h(* xdx 2 ( + • J yfJÖ a3 V 3 b2 Vx (s. Nr 127) (s Nr 127) (s. Nr. 127) (s Nr. 127)
1062 21. Tabellen 138. 139 140 dx xVx* bVx dx 1 / I x2VX* f X±n'2dx-- ii dx cVX 3a 3a r dx ~2VJ x^/X bxVx b2Vx 2XB±n)/2 aB ± n) (X{A±n)/2 bXB±n)/2 2±n Vx (s. Nr. 127) (s. Nr. 127). r o / W4±n)/2 141. xX±n'2dx = -0 ^- 7 a2 \ 4±n ,.o /" 2^±n/2j 2 (X^'2 26XD±-)/2 62XB±-)/2 142 / x2X±n/2 dx = — — + — J a3\ 6±n 4 ± n 2 ± n -Xnl2dx 2Xnl2 143 144 145 r Xn'*i J x i i X(n-2)/2 J X dx _ 2 xXn/2 ~ (n - 2)bX^~2)/2 ' 6 dx 1 1 r dx bJ xX^~2)/2' dx x2Xn/2 teX(n-2)/2 na r dx ~ 26 J ~x~X^< 21.7.2.4 Integrale mit y/ax + b und V/^ + 9 Bezeichnungen: X = ax + 6, Y = fx + g, A = 6/ — ag 146. 147. 148. 149. dx Txy xdx VXY~ ' dx VxVY*' /=57 arctan [X_ aY 2 A , //* -= Artanh W —— y/af V <Y X^ ag + bf für a/ < 0 , für a/ > 0 , für a/ > 0 . a/ 2a/ 2y/X 2 7: dx 7xy (s. Nr. 146). : arctan //* y\/x 1 ,fy/X-y/ET ;ln 150. /vxr^=A + 2°rVxF-A2 /< 4a/ 151 j^dx^-VXY-^J- 8a/ dx 7xy 1 für A/ < 0, für A/ > 0. dz /AY (s. Nr. 146). (s. Nr 146)
21 7 Unbestimmte Integrale 1063 / y/Xdx 2y/X A / dx 152 '-F- —+ /;w* Yndx >Yn~ldx 153 r dx = 2 L/xY" nA[Y Ü J y/X Bn + l)a\ J y/x f dx 1 j y/X / _3\ /• 154 dx 155 [y/XYndx=,n \ By/XYn+1+A f^B) J Bn + 3)/ V J VX J r y/Xdx _ 1 / y/X a y J Yn ~ (n-l)f [ Yn~l + 2J " 156 (n -1)/ V yn_1 ' 2 ^ v^y«-1 21.7.2.5 Integrale mit \/«2 — x2 Bezeichnung: X — a2 — x2 157 'dx=-\ xvX + a2 aresin - 2 \ a 158 / xy/Xdx = ~Vx* 159 Jx2Vxdx = -^V^+j(xVx + a2 Riesin-) fx3VXdx-- 160 xh wx3 — a 162 163 / vT x Vx 161 /— dx = VX-a\n J x 3 a + y/X y/X . x dx = arcsm -. ' \/X , y/X 1 , a + y/X ¦ + —- In - r-T*-- f dx 164 / —7= = arcsin 2x2 2a x a 166 167 168 / x2 dx x r— a2 x ,— = — -VX -f — arcsin — y/X 2 2 a rxUix VX* 2 r- f dx J xy/X 1, a + y/X = — In (s Nr 149) (s Nr 153)
.064 21. Tabellen 169 170. 171 172 173 174 175. 176 177. 178. 179. 180 181 182 183 184 r dx J x2Vx~ f dx J x*y/X~ fVx^dx fxVx^dj ___Vx_ a2x VX 1 a + VX 2a2x2 2a3 n x = \(xVV 5 [x2VJÖdx = -X-^ J 6 Jx*VT*dx = ^-- f^dx J X l~^dx l¥* r dx r xdx /7F = r x2 dx J 7x* = r x3dx r dx J x\fiÖ~ r dx J WF r dx J WF V)Ö , VX* X Vx* 2x2 X a2Vx' 1 Vx' 3a2x r— a2xVX* 5 ' 3a4 —— arcsm 2 16 X l«^-l.» ZVX 3a, —+ yln X . X —7= — arcsin - VX a Vx + 4=. Vx i i " a2VX ~ ~a~z aA \ x 1 2a2X2>/5 . a + VX -In . X X \ 3 t + 2a4VX arcsin-. a a + VX X 3 , a-\ 2a5 3 a6 . x f- — arcsin -. 16 a vVx X 21.7.2.6 Integrale mit Vx2 + a2 Bezeichnung: X = x2 + a2 185. fVXdx= i(Wx + a2Arsinh-) + C = i [x>/X + a2ln (z + VX)] + Ci.
21 7 Unbestimmte Integrale 1065 186 f xVXdx = ]-Vx*. 187 [x2VXdx=^s/jÖ-^(xVX + a2ATsmh-)+C = ^SJÖ-j[xVx + a2\n(x + Vx)]+C1 188 189 jx^dx = ^L V^ a2VX* 3 V^ , A7 , a + VX / dx = Va — a In 7 x 190. f^4-dx = -— + Arsinh - + C = - — + In (x + Vx) + d J xz x a x v y 7 x3 2x2 2a x 192 [ -j== = Arsinh - + C = In (x + y/x) 4- Ci » /$-<* 194. /^*.£^P-^ABliib£ + C-£^f-^li>(« + ^f) + C, 7 yX 2 2 a 2 2 ^ ' rx3dx VX* 2 y— 196 /4= = _I]n^±^ 7 xy/X a x 197 /_^_ = _^ i x2^ a2x' 198 y w^=_^v+^ln_^- 199 / v^dx = \ fxv/^+^v/X + ^ Arsinh -^ + <? i 4 \ 2 2 a) 200 f xVx* dx = ^Vx* 201 / iW dx = —- -f- -^ Arsinh - + C J 6 24 16 16 a xv^ a2xV^ a4xv^ a6 / /^\ ^ =  24 16 I^n(* + ^)+^ 202. fx^dx = ^-^ J 7 5
1066 21. Tabellen 203. f VX3 , VX3 2 r- I dx = — h aVX - a' J x 3 In a +VX 204. f^dx=-— + \xVx + la2 Arsinh- + C 7 x2 x 2 2 a ^\*x^+*a2\n(x + Jx)+Cl. 205 206. 207 x 2 2 >/F, VX* 33 fa + VX dx i X3 a?\fX' r xdx 1 J Vx*z = ~7x' [ ^=4 = 7= + Arsinh - + C = ^= + In (z + Vx) + d. J x/X3 a/X a VX V y ~~~ f X3 dx prz a2 209-/tf=^+7f 208 210. /^ = ^_llna+^ z VX3 a2VX a3 211. / * =-J^ + 7 a^Vx3 a4 V x 212. J X- x'y/X3 dx 1 3 3 , a + VX + ^rrhi- 3\f)Ö 2a2x2VX 2a4VX 2a5 x 21.7.2.7 Integrale mit y/x2 — a2 Bezeichnung: X = x2 — a2 213. f^Xdx= ^(xy/X-a2 Arcosh -) + C = i [xVx - a2ln (x + Vx)] + Ci. 214. fxVxdx^^Vx3. 215. Jx2VXdx=^Vx3 + j(xy/X-a2Arcosh^) + C = | VX3 + ^ [z VX - a2 In (z + y/x)} + d Vx* ^Vx3 216. fx3y/Xd: //Je ~dx = y/X-a x *= —+ ' 3 a arecos—.
21.7 Unbestimmte Integrale 1067 218 f^dx = -— + Arcosh - + C = -— + In (x + Vx) + d. J xl x a x v ' o,„ [y/Xj VX 1 a 219 / —— dx = —-r—r- + — arccos -. J x6 2x2 2a x 220. f -^L = Arcosh - + C = In (x + Vx) + d 222. /£l^ = ^+^ Arcosh-+ C = ^Vx + ^ln(x + Vx)+C1. 7 ^/x 2 2 a 2 2 v ' 223 ' 73c x3dx y/X* [x¦ äx VA-3 2 /— a nnA f dx 1 224 / —7= = - arccos — J xy/X a 225. J x2 xy/X a x dx y/X y/X a2x' oo* f dx VX l 226 / /_ = ^ 0 0 + ^-5- arccos - •/ X' 227 / >/Fdx = 1 ^VX^-^v/X + ^ Arcosh -") + C 7 4 \ 2 2 a) .l^.^Vx + ^ln^ + Vx^+C, 228. f xVJÖ dx = ^Vx* Jx2Vx^ xVlÖ a2xyfJP a4xVX ™„ / 2 /v, , ^v^ a2xy/X* a4xy/X a6 A , x ^ 229 / xVX3 cte = -V— + —-f- -jr- + — Arcosh - + C 6 24 16 16 a 24 16 +X« + ^+C. yfiC a2yfX* 230 Jx3VWdx = l— + oo, /"VX* , V^ o /TT 3 a 231. / dx = a^y/X + a6 arccos-. ' J x 3 x / —— dx = h -x\/X - -a2 Arcosh - + C J x2 2 2 2 a 232 -^ + |zVx - \a2 In (* + VX) + d. ^oo /" VX3 y^ 3\/X 3 a 233 / —— dx = — n - H -a arccos -. 7 xJ 2x2 2 2 x
1068 21 Tabellen 234 235. 236 237 238 239 240. r dx _ J 7x^ = ~ä- J 7x*~ Vx xdx 7F ' x2 dx 2Vx' 1 f ar dx x . , x _, x , / /—\ _, r x3dx r— a2 J x I J X' dx X* dx a2VX a; r arccos - x2VX* ~ "a^ \^T + ~Jx dx —7= — 7= 7= — 7Z~7 arccos - *yf)Ö 2a2x2VX 2a4VX 2a5 x 21.7.2.8 Integrale mit y/ax2 + bx + c 4a Bezeichnungen: X = ax2 + bx + c, A = 4ac — b2 , /c = — 241. y dxf J 7Z —= In f2v/öX + 2ax + b)+C 1 . . 1 2ax + 6 _, —= Arsinn = h Ci Va VA -7= lnBax 4- b) 1 . 2ax + 6 == arcsm —, V-ä V-A für a > 0, für a > 0 , A > 0 , für a > 0 , A = 0 , für a < 0 , A < 0 . 242 243 244 / / / dx 2Bax + b) xVx aVx dx _ 2{2ax + b) f 1 3AVX U + 2fc) 2Bax + b) XBn+l)/2 ~ Bn _ !)AXBn-l)/2 ' x2Vx dx 2k(n-l) 2n- R f d: 1 J XBn dx ¦l)/2 245. fVXdx = 246. /xVX Bax + b)VX 1 4a / dx 2kJ y/X dx=BaX + b)VX,x 3 8a V 2/c 248. J X^2n+1)/2 dx ¦¦ {2ax + 6)X<2n 4a(n + 1) +l)/2 3 /• dx + 8^2"/ 7x 5f 15 \ 5 r dx k+w) + Wk*J ~JX ^±R-[X^V2dx 2fc(n + l) J (s. Nr. 241) (s. Nr 241) (s. Nr 241)
21.7 Unbestimmte Integrale 1069 249. / 250./ 251./ 252 (X__b_ f dx a ~2aJ y/x 2(bx + 2c) aVx 1 b_ r a\ ~ Bn - DaX^-D/2 ~2ai ~X<& xdx 7x = xdx Xs/X~ xdx XB«+1)/2 ~ Bn - 1). x 36 die ¦+l)/2 r x2 dx ( J 3b2 - 4ac r dx 2a 4a2) v" ' 8^ J ~jx Vx- x2 dx _ Bb2 - 4ac)x + 26c 1 253 / ^-^ = ^ ""'- ' -~~ + -/-$= J XVX aA^X aJ y/x 254. fxVxäX = ^-b{2a::b)VX-^-J^ 3 3o 8a2 AakJ y/X . [xxVxdx=^X-±- fxVXc J 5a 2a 7 255 5a XBn+3)/2 ". dx 256 / xX^^2 dx = £ — - ±- /" X^+D/2 a1* 7 Bn + 3)a 2a 7 «** / 2 A7, / 56\ Xv/X 562-4ac f r- ' 1 , /2\/cX 2c 258 259 260 261. 262. dx x~7x /— ¦ + - + 6 +C X X j 1 . . 6z + 2c _, -=. Arsmn =- + Gi VC xVA 1 , 6x + 2c —^ln Vc x 1 . 6z + 2c i i— arcsm —== l \J-c xy/-A für c> 0, für c> 0, A > 0 , für c> 0, A = 0, für c < , A < 0. / dx ex 2c J dx dx x2\fX ex 2c J x^X l \fXdx rrr b f dx r d J^r = v*+2J7x=+cJxvx r \fXdx _ \fX f dx b r dx J ~^~ ~ "~ + aJ 7x + 2 J xVx . Jf Bn+l)/2 ;fBn+l)/2 XC2n-l)/2 ix 2n+l 2J ix dx (s Nr 241). (s. Nr. 244). (s. Nr. 241). (s. Nr 241). (s. Nr. 241). (s. Nr 246). (s Nr. 248). (s. Nr 245). (s. Nr. 258) (s. Nr. 241 und 258). (s. Nr. 241 und 258) (s Nr. 248 und 260)
1070 21. Tabellen nnr, . xdx r- ;r . x — a 265. / —=====. = — \J2ax — xz + aarcsin - f xdx r- ^ / —===== = — \J2ax — xz + flf i \/2ax - x2 a 2 / y/2ax — x2 dx = —-—V2ax — x2 + — aresin : 266 / y/2ax- ~^_ f dx 1 xJaq — bf , , , J (ax2 + b)y/fx2 + g Vb^/ag - bf Vb^fx2 + g = rl lnVbV7^+xVbf^äg {ag_bf<0) 2y/by/bf — ag y/b\/fx2 + g — Xy/bf — ag 21.7.2.9 Integrale mit anderen irrationalen Ausdrücken ~„~ f n/ 7 , n(ax + b) n/ r 268. / Vax + bdx = -± -^ Vax + b. J (n + l)a J \/ax + b (ra-l)a tyax + b' 269 (n + l)a dx n(ax + 6) 1 nf9n r dx 2 1 a + V^Tö^ 270 / —. = In ¦== . J x\Jxn + a2 na yjxn «-. f dx 2 a 271. / —, = — arecos —f=. J x\Jxn — a2 na yjxn n„n f Jxdx 2 . fx\3 21.7.2.10 Rekursionsformeln für ein Integral mit binomischem Differential 273. f xm{axn + b)pdx = \xm+1(axn + bf + npb fxm(axn + bf dx] , ra + np + lL v ' J v ' J ' - ^ \-xm+1(axn + b)p+1 + (m + n + np + 1) / xm(azn + 6)p+1 dx] , = -; 1—— |xm+1(a:rn + b)p+1 - a(m + n + np + 1) f xm+n{axn + b)p dx] , = \xm-n+l(axn + b)p+1 - (m - n + 1N / xm-n(axn + b)p dx] a(m + np + l) L v ' v W v y J 21.7.3 Integrale trigonometrischer Funktionen (Integrale von Funktionen, die neben Hyperbel- und Exponentialfunktionen auch die Funktionen sin x und cos x enthalten sind in den Tabellen Integrale anderer transzendenter Funktionen (s. 21 7 4. S 1080 aufgeführt ) 21.7.3.1 Integrale mit Sinusfunktion 274 / sin axdx = — cos ax a 275 / sin2 ax dx = -x — — sin 2ax. 2 4a h h
21 7 Unbestimmte Integrale 1071 /\ \ sin3 axdx = — cos ax -\ cos3 ax a 3a 277 / sin4axdx = -x — — sin2ax + 7^— sin4ax 278 8 4a 32a sinn_1 ax cos ax n — 1 r . _ . sin" "axcosax n - 1 r . __2 , . _ _. ^N . / sin ax ax = 1 / sin ax ax (n ganzzanlig, > 0) J na n J n„„ f . . smax xcosax 279. / x sin axdx = — . J al a 280 / xz sin ax dx = —r- sin ax — ( ) cos ax az \ a a- / x2 sin rt0. f 3 . _, /3x2 6\ . (x3 6x 281. / x sm axdx = — sinax — 7 7 \a2 a4J \a a3 /X^ T) f xn sin axdx = cos ax H— / xn-1 cos az dz (n > 0). a a y 6x^ I cos ax. 282, ^^^ /"sinax, (axK (axM (axO 283. /_(fa=ax-yr + i_i__L7if+. Das bestimmte Integral / dt nennt man Integralsinus (s. 8.2.5,1., S. 477) und bezeichnet es mit 0 si(x) Die Berechnung des Integrals s. 14 4 3.2,2., S. 719. Die Reihenentwicklung si(x) = x — -—— + -—— 3-3! 5-5! x7 —— + ••• s 8 2 5,1., S. 477. 7-7! . , sinax f cos axdx 284 ' ' • ' r smax , sinax r cos axdx , XT nnn. / ——dx = + a / (s. Nr.322). nnm, /'sinax , 1 sinax a rcosax , , AT rt^jX 285 / dx = + / dx (s. Nr.324). J xn n-\ xn~l n-lJ xn~l v ' nnn r dx f , 1, ax 1 . . N 286. / — = / cosec axdx = -In tan— = - m(cosecaxcotax). i sinai i a 2 a /; ^_ 1 dx 1 287. / -r-ö— = —cotax. dx cosax 1 ax -r-ö— = —-—r-ö 1- 7—In tan—-. sin ax 2a sin ax 2a 2 /" — cos ax n — 2 r dx J sinnax a(n - 1) sinn_1 ax n—lJ sinn_2ax f xdx 1 / 7 sinax a2 \ 0rt„ . _ . . (axK 7(axM 31(axO 290. / = — [ax+ V4r + . . ' , + ; 3-3! 3-5-5! 3-7-7!
1072 21. Tabellen + 127(ax)* 2B2^-l) + 3-5-9' + + Bn+l)! n( j Mit Bn sind die BERNOULLlschen Zahlen (s 7.2 4.2, S 428) bezeichnet. nM .xdx x 1 291 / t-ö— — ~-cotax-\—-lnsinax f x^x xcosax 1 n — 2rxdx J sinnax (n — l)asinn_1 ax (n — l)(n — 2)a2sinn-2ax n—lJ sinn-2ax a xdx nn ax (n — l)asinn_1 ax (n - l)(n - 2)a2sinn_2ax r dx \ (tt ax\ 293 / ; = — tan - - — . i l+sinaa; a V4 2 / f dx 1 (tt ax\ 294 / : = - tan - + — J 1 — sin ax a \ 4 2 / ^ f xdx x /TT ax\ 2 , /7T ax\ 295 / ; = tan - - — + — In cos - - — . J 1+sinax a \4 2 / a2 V4 2 / -«« f xdx x (tt ax\ 2 , . [TT ax\ 196 / : = - cot - - — + -TT lnsin - - — . J 1-sinax a W 2 ) a2 U 2 ) f sinaxdx , 1 (tt ax\ 297. / —— = ±x + - tan - =f — . i lisinaa; a V4 2 / ÄÄ„ f dx 1 /tt ax\ 1 . ax 298. / ,„ , . r = - tan - =F —- + - In tan —- J smax(l ±sinax) a \4 2 / a 2 ~~~ f dx \ (iT ax\ 1 o /7T ax\ 299 / - : = tan - - — - — tan3 - - — . J 1 + sinax2 2a V4 2/ 6a V4 2) 300. / ^ - = — COt ( t ~ ^ ) + TT ™t3 ( T ~ ^ A + sinax): r d: J A -sinaxJ 2a V4 2) ' 6a™ V4 2 f sinaxdx 1 /tt ax\ 1 ., /7r ax 301 / - : = -— tan - - — + — tan3 - - —- J A + sinaxJ 2a V4 2 ] 6a V4 2 /sin axdx 1 /7r ax\ 1 o /tt ax\ (l-SinaxP=-^COtD-Y) + ^COt U-y) ™« f dx 1 /3sin2ax-] 303 / r-ö— = —7=- arcsin ——s ./ 1 + sin ax 2\J2a \ sin ax + 1 f dx f dx 1 304. / —ö— = / —5— = - tan ax 7 1 — sm ax 7 cos ax a ™^ /" • • , , sin(a - 6)x sin(a + b)x ,.,,,,. ,... , , .,. *T rt„rx 305 smaxsmbxdx = —j -^ -j -^- (|a| ^ \b\, für |a| = |6| s Nr 275) f dx 2 otanax/2 + c ,. ,9 0 306 / ; = —. arctan . ' für b2 > c2 , 7 0 + csmax ay/b2 — c2 yb2 — c2 1 , b tan ax/2 + c — y/c2 — b2 . ., 9 = —/ » ni . / » für o < c • aVc2 - b2 otanax^ + c+Vc2-^
21 1 Unbestimmte Integrale 1073 rtrtÄ r sin axdx x b r dx , ___x 307 / —— = / ——, (s Nr 306) i o + csmax c c J o + csinax «~« /" d# 1 . ax c r dx /AT o^^n 308. / = — In tan / (s Nr 306) J smaxyb + csmax) ab 2 67 o + csinax nn„ f dx ccosax b f dx , 0^„x 309 / irr,—:—ü = -m—2üt^—•—t + ü—2 / rr—-— s- Nr-306 • J (o + csmaxJ a(b2 - c2)(b + csmax) b2 — c2 J o + csmax dx ccosax b f dx F +csinaxJ a{b2 — c2)(b -f csinax) b2 ¦ Ä„^ , sin axdx bcosax c f dx 310 ' ' r sin axdx bcosax c r dx , . J F +csinaxJ a(c2 — b2)(b-\-csinax) c2 — b2 J 6 +csinax r dx 1 \Jb2 + c2 tan ax ., . \ t^ ö ö— — , arctan (o > 0). J b2 + c2sin2ax aby/b2 + c2 b V ; „ ^ , dx 1 \Jb2 — c2 tan ax 312 ' —¦" — f dx 1 y/tr — cztanax /l9 9 . ^ / « 2 • 2 = ^7ro=^ arctan^ (b2 > c2 , 6 > 0), 7 b2 - c2sin ax aövo2 - c2 o 1 Vc2 - 62 tan ax + 6 2 2 In -=== (c2 > b2, o > 0) 2a6\/c2 — fr2 \/c2 — ö2 tan ax — b 21.7.3.2 Integrale mit Kosinusfunktion ¦ / 313. / cos axdx = - sin ax a /l i cos2 axdx = -x + — sin 2ax. 2 4a 315 / cos3 axdx = - sin ax — —- sin3 ax a 3a /« /3 1 1 cos4 axdx = -x + — sin 2ax + —— sin 4ax. 8 4a 32a n-.~ f , cos71-1 axsinax n—lr __2 317. / cos axdx = 1 / cos axdx. J na n J n_n f . cosax xsinax 318 / x cos axdx——- 1 J a2 a 2 ' sinax. o-.^ f 2 j 2x (x<1 2 319 / x cos axdx = —z cos ax + I : J a2 \a a- onA /3 _, /3x2 6\ ( 320. / x cos axdx = I — J cos ax + I oo-. f n j xnsinax n f n_1 . 321. / x cosax ax = Ix sin axdx. J a a J «~« /" cosax, . , , (axJ (axL (axN 322. |__dl = ln(aa;)_L:i. + L:ir_L:ir + ... Das bestimmte Integral — / dt nennt man Integralkosinus und bezeichnet es mit Ci(x) Es gilt die Reihenentwicklung Ci(x) = C + lnx - -^— + -^— - -^— + • • • (s. 8.2 5,2., S 477); mit C ist
1074 21. Tabellen die EULERsche Konstante (s 8 2 5,2., S 477)) bezeichnet " cos ax , cos ax f sin ax dx 323 rcosai , cosax fsmaxdx , XT ^ . / —— dx = a (s Nr 283) f cosax 7 cosax a fsmaxdx , . „w ^T ' ,. 324. / dx = -- r - / — (n^l)(s Nr.285). ««^ f dx 1 . . . . , . . 1 . fax 7r\ 1 325 / = - Artann Artanh(smax) = - In tan — + — = - misecax + tanax) J cosax a a \ 2 4/ a /dx 1 -— = -tanax cos2 ax a f dx sinax 1 , /n ax\ 327 / —3— = ö—2— + t~lntan 7 + ~r 7 cos*3 ax 2a cos2 ax 2a V 4 2 / f dx 1 sin ax n — 2 f dx 328 / = -7 TT i + 7/ 5 (n>l). 7 cosn ax a\n — 1) cosn_1 ax n — 1 J cosn_2 ax . „,_ 1 /(axJ (axL 5(axN 61(ax)8 1385(axI0 r xdx 1 ((axJ (axL 5(axN y cosax = ^ y 2 + 4-2' + 6-4' En(axf^ Bn + 2)Bn') Mit £n sind die EuLERschen Zahlen (s 7 2 4 2. S 429) bezeichnet , xdx x 1 330. 331. f xdx x I / -— = — tan ax H—- In cos ax y cos2 ax a a2 r x dx x sin ax 1 n — 2 r xdx J cosn ax (n — l)acosn_1 ax (n — l)(n — 2)a2 cosn_2 ax n — 1 J cosn_2 ax Ä„Ä /" dx 1 ax 332 / = - tan —. J 1 + cos ax a 2 ~~„ f dx 1 ax 333 /- = — cot — y 1 — cos ax a 2 xdx x ax 2 ax = - tan 1—-In cos — ¦f cos ax a 2 a2 2 . xdx x ax 2 , . ax 335 / = —cot — + — In sin — - cos ax a 2 a2 2 . cos axdx 1 ax 336. /- = x--tan —-. - cos ax a 2 nnmm / cos axdx 1 ax 337 / = -x cot — - cos ax a 2 /r /" COS( y t+~c /" COS( y r^ ~~~ f dx 1 , /TT ax\ 1 ax 338. / - = -lntan - + — --tan — J cosax(l + cosax) a \4 2J a 2 dx 1 _ /7T ax\ 1 ax r = - In tan I — 4- -7- 1 cot — cosax(l — cosax) a \4 2 / a 2
21 7 Unbestimmte Integrale 1075 r dx 1 ax 1 o ax 340 / - = — tan — + — tan3 —. J A + cosaxJ 2a 2 6a 2 /" dx 1 ax 1 a ax 341 / = - — cot — - — cot3 — Irr- A-cosaxJ 2a 2 6a 2 „ ,Ä f cos axdx 1 ax 1 ,ai 342 / = — tan tan3 —. J A + cosaxJ 2a 2 6a 2 nAn f cos axdx 1 ax 1 n ax 343. / - = — cot — - — cot3 — J A -cosaxJ 2a 2 6a 2 dx 1 . /1 — 3 cos2 ax 344 /tt cos ax 2v2a \ 1 + cos12 ax nAmf dx r dx 1 345 / — = / -r-s— = — cot ax J 1 — cos2 ax 7 sin ax a n*„ r 7 , sin(a - 6)x sin(a + b)x .. . ..... /r„ . . ... .. 01 .N 346 / cosax cos ax dx =—- -f- + —-7 rf- ( a Mb ); für a = 6 s Nr 314) 2(a — 0) 2(a + 0) f dx 2 (b — c)tanax/2 .... f9 9N 347 / — = arctan ^ ' 7 für b2 > c2) 7 0 + ccosax ayb2 — c2 vo2 — c2 l , (c — 6) tan ax/2 + \/c2 — b2 ,. j9 9. = —. In . (für b1 < &) aVc2-b2 (c-6)tanax/2-Vc2-62 cos axdx x b f dx r cos axdx x b r dx , __ rt.„. / ri = / rr (s Nr-347) J 0 + c cos ax c cJ 0 + c cos ax f dx 1 . /ax ir\ c f dx , nAnX \ n 7 = -7 Intan ( — + - ) - - / (s. Nr 347) J cos ax{b + ccos ax) ab \2 4/ 0./ 0 +ccosax f dx = csinax L_ f dx (S Nr.347) i F +ccosaxJ a(c2 — 62)F + ccosax) c2 — b2 J 6 +ccosax / cos axdx ösmax c f dx . . y F +ccosaxJ aF2 — c2)F + ccosax) b2 — c2 J 0 +ccosax „_ f dx 1 ötanax 352 / — = 7== arctan , n (b > 0) J 62 + c2cos2ax aov/PT^2 Vb2 + c2 V y r dx 1 btanax /l9 9 . rtX 353 ja—2—2—=-r7fr=farctan-?fr::^ (b2>c2,b>o). 7 ¥ - cz cos2 ax aby b - c2 v b2 — c2 1 , b tan ax — \/c2 — b2 /9 j9 . . In . (c2 > b2 , 6 > 0) 2aby/c2 — b2 ¦ b tan ax + \/c2 — b2 21.7.3.3 Integrale mit Sinus- und Kosinusfunktion 354 / sin ax cos axdx = — sin2 ax J 2a f . 2 2 1 x sin4ax 355 / sin ax cos ax dx = — ——. J 8 32a 356. / sinn ax cos ax dx = — sinn+1 ax (n ^ — 1). 7 a(n + l) v y
1076 21. Tabellen 357. / sin ax cosn ax dx = ; — cosn+1 ax (n ¦=£¦ -1). 7 a(n + l) \ t ) n-n f . « m , sin axcos^" ax n - 1 /" . __2 358 / sin ax cos axdx = ; 1 / sin ax cos axdx J ain + m) n + mJ sinn l ax cosm+1 ax n—l a(n + m) (Erniedrigung der Potenz n, m und n > 0) sinn+1 ax cosm_1 ax m — 1 m — 1 f . „ / sin n + m J a(n + m) (Erniedrigung der Potenz m; m und n > 0) /dx 1 = -lntanax. sin ax cos ax a 360 / — = - In tan - + — - - J sin ax cosax a L \4 2 J sinaxj _„ r dx 1 /. ax 1 \ 361. / 5— = - In tan— + J smaxcos^ax a \ 2 cosax/ f dx 1 / 1 \ 362. / —ö = - I mtanax ö— • J sin ax cosax a V 2sm ax) n„n f dx 1 / 1 \ 363. / 5— = - lntanax + 5— J smaxcos^ax a V zcos^ax/ axcosm 2axdx ~„< f dx 2 364. / —^ ^— = —cot2ax J sin sin2 ax cos2 ax a /" dx 1 r sinax 1 3, /n ax\~\ 365. / -7-5 — = - -2 : + -lntan - + — J sm axcosdax a Licos^ax sinax 2 \4 2 )\ ~„„ f dx 1/1 cosax 3, ax\ 366. / -7i — = 7r^5— + - In tan — ) J sin ax cos ax a \ cos ax 2 sin2 ax 2 2 / ' dx _ 1 r dx sin ax cosn ax a(n — 1) cosn_1 ax 7 sin ax cosn~2 ax 367 / — = - -r= —+ /- 9 (n^l) (s Nr 361 und 363) 7 sin ax cosn ax a(n — 1) cosn_1 ax J sin ax cosn~^ ax 368. /—=-^ = : r^—=zr—+ / n_2dX (n^l)(s Nr.360 und 362) y sin ax cosax a(n — l)sm ax 7 sin ax cosax r dx _ 1 1 n + m — 2/" dx 7 sinnaxcosmax a(n — 1) sinn-1 axcos771-1 ax n—l 7 sinn~2 ax cosm ax (Erniedrigung der Potenz n; m > 0, n > 1), 1 1 n + m — 2r dx a(m — 1) sinn_1 ax cosm_1 ax n—l 7 sinn ax cosm~2 ax (Erniedrigung der Potenz m ; n > 0 , ra > 1) ««.^ /"sin axdx 1 1 370. / - = = -secax. J cos^ax a cosax a
21 7 Unbestimmte Integrale 1077 371 372 373 374 375 376 377 378 379 380 sin ax dx r sin ax dx 1 I" ./ cos3ax a [ * sin2 ax dx 1 381 382 383 384. 385 386 387 ¦ + C = 1 2a cos2 ax 2a 1 a(n — 1) cosn_1 ax tan2 ax + C\. sin ax dx cosn ax sin2 ax dx cosax sin2 axdx 1 f sinax 1 . 1, /7T ax\ - - sin ax + - In tan I — + — a a \4 2 / 1 . /7T ax - In tan — + — 2cos2ax 2 V4 2 /"sin axdx sinax 1 f dx . . , nnr, nn„ nnn. / = -: : : / 5— (n 7^ 1) (s. Nr 325, 326, 328) J cos" ax a(n — 1) cosn_1 ax n — 1 J cosn 2 ax sin ax dx cos ax sin3 ax dx cos2 ax sin3 ax dx a(n - 1) 1 /sin2ax + In cos ax = - cos ax + - 1 )sax/ cos" ax sin" ax 1 (n — 1) cosn_1 ax (n — 3) cosn-3 ax (n ^ 1, n ^ 3) cosax sinn ax dx = dx - sin" " a(ra - 1) ax /• sinn 2 ax dx / (n ± 1). n — m + 2 cosm ax cos ax dx sin2 ax cos ax dx sin3 ax cos ax dx sinn ax cos2 ax dx sin ax cos2 ax dx sin3 ax cos2 ax dx sinn ax cos3 ax dx a(m — 1) cosm_1 ax sin"-1 ax a(n — ra)cosm_1 ax sin"-1 ax a(m — l)cosm_1 ax m 1 1 = — cosec ax a sin ax a 1 y co -dx n — 1 r sin" 2 ax dx n - 1 /• n — m J cogm-z ßT (*n*l), (ra 7^ n), (m^l). 1 2a sin2 ax 1 2a a(n — l)sinn l ax 1 / ax\ - cos ax + In tan — a V 2 7 1 /cos ax ax — —- I —-R in tan — 2a Vsin ax 2 1 (n — 1) yasin" ax 1 {cos2 ax . — h In sin ax 7 sin dx (n^l) (s Nr 289)
1078 21. Tabellen 388. 389. 390 391 f cos ax dx 1 / . 1 \ / ——ö = — sin ax + . J sin oi a \ sinax/ i 392 393. 394 395. 396. 397. 398. 399 cos3 ax dx /co: si / sin ax cosn ax (n —3)sinn 3 ax (n — l)sinn (n^ l,n^3) dx = smax cosn ax dx a(n — 1) 7 cosn 2axdx cosn+1 ax m + 2 /• cosn ax dx sin ax dx a(m — l)sinm ax cosn_1 ax -( x • m-i— + a(n — m) sin ax cosn_1 ax a(m — l)sinm_1 ax 1 n — m + 2 /* ra — 1 7 n — 1 /• 771 — 1 J n — l r m— 1 J 1 /* cosn 2 ax dx sin ax cosn_2 ax dx sinax(l ± cosax) dx cosax(l ± sinax) sin ax dx = ± = T 1 ax ^ .„ , r + — In tan — 2a(l± cosax) 2a 2 1 2a(l db sinax) 1 , (-K ax\ + ^lntanU + Y)- 1 1 ± cos ax = - In cosax(l ± cosax) a cosax cos ax dx sinax(l ± sinax) sin ax dx 1 . 1 ± sm ax --In—; . a sin ax cosax(l ± sinax) 2a(l± sinax) cos ax dx 1 1 /7T ax\ : — In tan — + — . 2a V4 2 ) sinax(l ± cosax) sin ax dx sin ax ± cos ax cos ax dx . 1 i ax 2a(l± cosax) 2a 2 - =F — m(sin ax ± cos ax). = ±—I lnfsin ax ± cos ax) sin ax ± cos ax 2 2a (m^l), (m 7^ n), (m ^ 1). 400. 401 402. 403. 404. f dx 1 . /ax , 7T\ / = —7= In tan — ± — 7 sin ax ± cos ax av2 V 2 8 / f dx , 1, / , ax\ / — = ±- In 1 ± tan — 7 1+ cos ax ± sm ax a \ 2 / /• dx 1 1 + ax + 0 J b sin ax + c cos ax a V&2 + c2 x" """" 2 f sinax dx 1 . .. x / = m(o + ccosax). J 6 +ccosax ac f cosax dx 1 . ,. . , / = — ln(o + csmax). J b + c sin ax ac mit sin 0 = Q Vb2 + c2
21 7 Unbestimmte Integrale 1079 dx mit sin 6 = / $ , r2 und tan 6 = — (s Nr 306) f — f \ aJ J b + c cos ax + / sin ax J b + \/c2 + /2 sin(ax + .™ f dx 1 /c \ 406. / — 5— = —— arctaii 7 tan ax J b1 cos2 ax + <r sin ax abc \b J r dx _ 1 ctaxLax + b J b2 cos2 ax — c2 sin2 ax labe c tan ax — b /cos(a + b)x cos(a — b)x , 9 . ,9. .„ . XT „_.. sin ax cos 6x dx = -7 -7 -7 -f- a2 ^ b2 ; für a - 6 s Nr 354 2(a + b) 2(a-b) v ^ ; v ; 21.7.3.4 Integrale mit Tangensfunktion 409 / tan axdx = — In cos ax A ^ f o , tanax 410. / tan axdx = • J a f 11 411 / tan3 ax dx = — tan2 ax + - In cos ax J 2a a 412 / tann ax dx = — tann_1 ax — / tann_2 ax dx J a(n — 1) J h 413. Ixunaxdx=- + — + — + — + ...+ (J+i)| Mit Bn sind die BERNOULLischen Zahlen (s. 7.2 4.2, S 428) bezeichnet. J3 2(axM 17(axO 22nB2n - l)Bn(axJn-1 x ~"~ ' 9 + 75 + 2205 + * ' + Bn - l)Bn') ' tann ax , 1 a(rc+l) ' dx , x 1 /¦tanaxdx (axK 2(axM 17(axO 22nB2n - l)J3n(axJ 414 / = ax + ^r^ + ^rA + „L: + • • + —At; ^ ,/ + • A^m f tan" ax , 1 _+1 , . 1N 415 / dx = — tan ax (n ^ — 1). J cos^ax a[n+ 1) /ax x 1 = ±—I lnfsin ax ± cos ax). tan ax ± 1 2 2a v ' ,„_ f tan axdx x 1 , , . , , 417 / = — qp — lnfsin ax ± cos ax) y tanaxil 2 2a v ; 21.7.3.5 Integrale mit Kotangensfunktion 418 / cot ax dx — - In sin ax J a ,-r> f 1 , cotax 419. / cot axdx = x J a 420 / cot3 ardx = cot2 ax In sin ax. J 2a a 421 / cotnaxdx = ; -cotn_1ax — / cotn~2 axdx (n^l). J a(n — 1) J
1080 21 Tabellen 422 / x cot ax dx = X a ax3 ~9~" a3x5 ~~225~~" Mit Bn sind die BERNOULLischen Zahlen (g 423 424. f cot ax dx J X f cotn ax / ~r~2 dx = 1 ax ~~^T, ax 3 1 n _L TA (axK 135 ¦ cotn+1 ax 22nBna2n- Bn + i 7 2.4.2, S 2(axM 4725 (n^- -lx2n+l 428) bezeichnet. i). 22nBn Bn- .(axJ" " l)Bn)! sin ax /* dx r tan axdx 425. / — = / —- s. Nr.417 J 1 ± cot ax J tan ax ±1 21.7.4 Integrale anderer transzendenter Punktionen 21.7.4.1 Integrale mit Hyperbelfunktionen 426. / sinh axdx = - cosh ax. J a 427 / cosh axdx = - sinh ax. J a f 1 1 428 / sinh2 axdx = — sinh ax cosh ax x. 2a 2 429. / cosh axdx = — sinh ax cosh ax -\- -x 2a 2 /¦ /< 430 / sinhn ax dx 431. 432 433. 434 435 436. = — sinhn l ax cosh ax / sinhn 2 ax dx an n J = — — sinhn+1 ax cosh ax / sinhn+2 ax dx a(n + l) n+lJ / coshn ax dx l.i i n-l n = — sinn ax cosh ax -\— an = ; r sinh ax coshn+1 a(n + l) f dx 1 . . ax / ^—: = - In tanh —. y smhax a 2 / — = - aictaneax. J coshax a / x sinh ax dx = -x cosh ax - 7 a / x cosh axdx = -xsinhax - J a / tanh axdx = - In cosh ax J a — \ r / coshn-2 ax dx n J , n + 2 f y.n+2 ax H / cosh T ax dx n + 1 7 - ^r sinh ax a2 —- coshax. a2 (für n > 0), (für n<0)(n ^-1). (für n > 0), (fürn<0)(n^ -1)
21.7 Unbestimmte Integrale 1081 437 / coth axdx = - In sinh ax a i 438 / tanh2axdx = x — 2 . tanh ax ixdx = x a coth ax Anrx f . 0 . coth 439. / coth axdx = x J a 440 / sinh ax sinh bx dx = ——— (a sinh 6x cosh ax — b cosh 6x sinh ax) (a2 ^ b2). J a2 — b2 441. / cosh ax cosh bx dx = ——— (a sinh ax cosh bx — b sinh 6x cosh ax) (a2 ^ 62) ./ a2 — b2 442 / cosh ax sinh 6x dx = — — (a sinh bx sinh ax — b cosh bx cosh ax) (a2 ^ b2). J a2 — b2 443 / sinh ax sin axdx = — (cosh ax sin ax — sinh ax cos ax) 444 / cosh ax cos axdx = — (sinh ax cos ax + cosh ax sin ax) 7 2a 445 / sinh ax cos axdx = — (cosh ax cos ax + sinh ax sin ax). 446 / cosh ax sin axdx = — (sinh ax sin ax — cosh ax cos ax) 21.7.4.2 Integrale mit Exponentialfunktionen 447 feaxdx = -eax J a 448 f xeaxdx = ^-(ax-1). 7 a2 ,*„ [in,, n<r (^ 2x 2 \ 449 / x2eax dx = eax\ 5- + -ö . y \a a2 a6 J 450. / xneaa; dx = -xneax - - f xn~leax dx. J a a J [ eax , , ax (axJ (axK 45i /_(fa = iIia: + _ + L:ir + LJr + ... X . /e — dt nennt man Integralexponentialfunktion (s. 8.2.5,4., S 478) und —oo zeichnet es mit Ei(x). Für x > 0 divergiert dieses Integral im Punkt t — 0, in diesem Falle versteht man unter Ei(x) den Hauptwert des uneigentlichen Integrals (s. 8.2.5,4.,S 478). ? e* , _, . . . x x2 x3 xn j -dt = c + in\x\ + — + _ + _ + ... + _ + ... —oo Mit C ist die EuLERsche Konstante (s 8 2.5,2., S. 477) bezeichnet /„ax i , ax * „ax x — dx = -( - + a / Tdx) (n^l). xn n - 1 V xn~l J xn~l ) y ' be-
1082 21. Tabellen 453. 454. 455. J i + f — J b + 1 ea: -Ingo. dx a 1 + e' a: 1 7 6T ceax 6 a6 eax da: _1_ ac cea- ln(b + ceax). \n{b + ceax). „r. f dX 1 /M/A 456. / = —p=arctan e \ - J beax + ce~ax aVbc \ V cj 1 , c + eax\f-bc . an 2a\J—bc c — eaxy—bc Fc > 0), Fc < 0). xeax dx f xeu- J Jl + axJ ~ a2(l + aa:)' /eax In x 1 /" eax ea:r In x dx = / — dx; a a J x /eax eax sin bx dx = ——— (a sin bx — b cos bx). az + er eax cos 6a; dx = ——— (a cos bx -\-b sin 6a:). az + 6 (s. Nr.451) /c sin a: eax sinn x dx = ———-— (a sin x — n cos x) a2 + riz n(n — 1) a2 + n2 J eax sinn xdx: /c cos a: ea;E cosn xdx = ———2— (a cos ^ + n SU1 ^) a2 + n2 n(n — 1) a2 + n2 J eaxcosn~2xdx, (s. Nr.447und459). (s. Nr 447 und 460). 463. xeaxsinbxdx 464 / a:eax cos 6a: da: a:e"x a2 + 62 a:eax" (a sin bx — b cos 6a:) — (a2 + 62J [(a2 — b2) sin 6a: — 2a6 cos bx] (a cos 6a: + 6 sin bx) — - a2 + 62V ; (a2 + 62J 21.7.4.3 Integrale mit logarithmischen Funktionen 465 \nxdx = xlnx — x. 466. [(lnxJdx = x(lnxJ-2xlnx + 2x. 467. /(In a:K da: = x(ln a:K - 3x(ln xJ + 6a: In a: - 6x. 468 f(\nx)ndx = x(\nx)n - n I\lnx)n~l dx (n ^ -1). [(a2 — 62) cos bx + 2a6sin 6a:]
21 7 Unbestimmte Integrale 1083 469. (lnxJ (lnxK f dx . . , (inxy (lnxr / — = In Ins + Ina? + ^—T + V^T + ' J \nx 2-2! 3-3' Das bestimmte Integral / -— nennt man Integrallogarithmus (s. 8.2.5,3., S. 477) und bezeichnet es o mit Li(x) Für x > 1 divergiert dieses Integral im Punkt t = 1 In diesem Fall versteht man unter Li(x) den Hauptwert des uneigentlichen Integrals (s. 8.2.5,3., S. 477) Der Integrallogarithmus hängt mit der Integralexponentialfunktion (s. 8.2.5,4., S. 478) zusammen. Li(x) = Ei(lnx) 470 r dx _ x 1 r dx J {lax)n ~"{n-l)(]nx)n-1 + n-li (Inj;)"-1 471 fxmlnxdx = xrn+1 (n^l); (s. Nr 469) [m+1 (ra+1J xm+1(lnx)n (lnx)n (ro^-1). r"mllnr)" n r xm(\nx)ndx = K—-!¦ xrn{\ivx)n-1 dx (m^-l,n^-l; (s. Nr.470). v } m+1 m + lJ v ' \ t , t , \ ) (lnx)n _ (lnx)n+1 473 /' -dx - 474. f — dx = - 475 476. r In J x' r{\nx)n J xm n + 1 lnx (m - l)^771-1 (m - lJxm_1 (lnx)n ra /" (lnx)"-1 7 dx = -, v ./_ , + / - - da; (m — l):*;™-1 m r xmdx r e~y , / 1 = / — d2/ J lux J y (m ^ 1). (m ^ 1), (s. Nr.474). mit 2/=-(ra +l)lnx, (s. Nr.451) y xm dx _ xm+1 m + 1 y xmcfa; * 7 (h^~~(n-l)(lnx)"-1+7rTy (lnx)-1 (n ^ ^ 478. /-^-= In Ins. 7 xlnx A„n f dx , , , 1N1 (n-lJ(lnxJ (n - lK(lnxK 479. / —-— = lnlna;-(n-l)lnx + - — - - — -¦ 2-2! 3-3! 480 f dx = Zl {n4l) ' J x{\nx)n (n-l)(\nx)n-1 K r }' f dx _ -1 p—lr dx / _z i\ J xP{\nx)n ~ x*>-l{n - l){\nx)n~l n-lJ ^(lnx)" Aan r . , x3 x5 22n-1Bnx2n+1 482. / In sin x dx = x In x — x — —- — —— - • • • — — J 18 900 nBn + l)! Mit ßn sind die BERNOULLischen Zahlen (s. 7 2.4 2, S 428) bezeichnet. 22n-lB2n_l)jBn^+i 483. /,„ cos x dx = ¦ 6 60 315 nBn + l)!
1084 21 Tabellen ,o. f, x" lxb 22nB2n-1-l)Bn 2n+1 484 / In tan x da: = x\nx-x + — +-— H 1 —yz ttj—x2n+1 + • J 9 450 rcBrc + l)! 485 / sin In x dx = — (sin In x — cos In x) /x cos Ina; da; — -(sin In x + cos In x). 487. / eax In a; dx = -eax In a? - - / — dx , (s Nr 451) 7 a a J x 21.7AA Integrale mit inversen trigonometrischen Funktionen 488. / aresin — dx = x aresin —h \/a2 — x2. Ja a /nß I nß^ n \ XX x aresin - dx = [ I aresin —I—Va2 — x2. a \2 4 j a 4 490 / x2 aresin - dx = — aresin —h -(x2 + 2a2) Va2 — x2 J a 3 a 9 aresin-da; x 3 1 . 3 a;5 1-3-5 a;7 491 / Ol = I I I h • • • J x a 2 - 3 • 3 a3 2-4-5-5 a5 2- 4-6-7-7 a7 aresin^da; x T 1 a + ^ZT^l 492 / ^— = — aresin In . J xz x a a x 493. / arecos - dx = x arecos Va2 — x2 Ja a 494 / x arecos — dx = arecos v'a2 — x2. J a V 2 4 / a 4 495. / x2 arecos — dx — — arecos -(x2 + 2a2)Va2 — x- J a 3 a 9 . arecos - dx /OüL Ks\^\JO U/O, _ S— = -Ina; x 2 TT, x 1 a;3 1 • 3 x5 1 • 3 • 5 x7 a 2-3 3 a3 2-4-5-5 a5 2-4-6-7-7a7 arecos^dx 1 x , ß + ^TT^ 497. / ^ = —arecos- + - In- J x2 x a a x 498 / aretan — dx — x aretan ln(a2 + x2). J a a 2 499. / x aretan - dx = -(x2 + a2) aretan — J a 2V J a 2 /o x x x ax a , 9 9. 500 / x aretan - dx = — aretan 1 lnia + x ) J a 3 a 6 6 v J ™-< f n X . XH+1 X ü f XU+1 dx . . _ 501. / x aretan - dx = aretan / — [n ^ — 1) J a n + 1 a n + lJ a2 + x2 ^ ^ > x f aretan - dx x x3 x$ xi \ ~— = --^-T + ?F5-^-7+--- (M < M)- J x a 32a3 52a5 72a7 502
21.7 Unbestimmte Integrale 1085 arctan ^dx x x x 2 + x2 503. / ^— = — arctan In -n—. a 2a xl r arctan - dx 1 /—^- = --' J xl x x , . arctan - dx arctan - ax 1 x a f dx , /1N 504 / ö— = —. arctan - + / ry^ — (n ^ 1) J xn (n-l)^ a n- 1 J xn~l{a2 + x2) v 505. / arccot - dx — x arccot - + - ln(a2 + x2) J a a 2 / X i / 2 2\ *^ flX 506. / x arccot - dx = -(# + a ) arccot —h — J a 2 a 2 507 / ar arccot - dx = — arccot —I lnfa + x ) 7 a 3 a 6 6 v ; -«« f » x 1 xU+1 x a f xn+1dx . . .,. 508. / x arccot - dx — arccot —I / — (n j* — 1). J a ra + 1 a n+lJ a2 + x2 v ^ ' x - arccot - dx ^ x x3 x5 x7 509 y^^-=2lnX-ä + 3^-5V-7V-"- arccot-dz 2 x x 2 + x2 510. / ^— = — arccot - + — In - J xl x a 2a x , . arccot - dx arccot-ax x x a f dx , , ^ 511 / ö— = -arccot -/ 77-^ ^ (n ^ 1). 7 xn {n-\)xn-1 a n- 1 J xn~l{a2 + x2) v ^ ' 21.7.4.5 Integrale mit inversen Hyperbelfunktion 512. / Arsinh - dx = x Arsinh Vx2 + a2. Ja a 513 / Arcosh - dx = x Arcosh Vx2 - a2. Ja a 514 / Artanh - dx = x Artanh - + - ln(a2 - x2) Ja a 2 515 / Arcoth - dx = x Arcoth - + - \n(x2 - a2). Ja a 2
1086 21 Tabellen 21.8 Bestimmte Integrale 21.8.1 Bestimmte Integrale trigonometrischer Funktionen Für natürliche Zahlen m, n gilt 2-k 2tt 2-k 1 sinnxdx = 0 B1.1) 2. cosnxdx = 0. B1.2) 3 / sinnxcosmxdx = 0 B13) ooo 0 für m ^ n , 7 ( 0 für m ^ n, r umrmf n, /• u iur m ^ n, 4 / sin rix sin mx dx = < B1.4) 5. / cos rix cos mx dx = < B15 J I 7T für m = n J I 7r für m = n o K o v 2 4 6 8 n-1 für n ungerade, /¦ — — — ~ im iL uiigcicwac , smnxdx=\ ^iH n-1 (n^2) B16> 1 2 2l6-'-^rfÜrngerade 7T/2 7a. Jsin^xcoS^xdx = ^^ß^ = 1-B(a + l,ß+l) B17a) ^(X)r(^) Mit B(x, y) = —— — ist die Betafunktion oder das EULERsche Integral 1 Gattung bezeichnet, mit v yj r(x + y) r(x) die Gammafunktion oder das EULERsche Integral 2. Gattung (s 8 2.5,6., S. 478) Die Formel B1 7a) gilt für beliebige a und ß, man verwendet sie z.B zur Bestimmung der Integrale tt/2 tt/2 tt/2 / Vsinx dx, / v^sin x dx, / ,. usw. J J J x/cosx o o Für a, ß ganzzahlig und positiv ergibt sich ^ alßt 7b. / sin2a+1 x cos2/H1 x dx = , a'f B1 7b) J 2(a + /?+l)' V ; Tsinax ( ~ füra>0, 8 / dx=l l B1.8) { x [ - - für a < 0. f cosaxdx /,,.,. x 9. / = oo (a beliebig) B19) o 10. 7^°*«** J I fÜra>°' B110) £ z [ - - für a < 0 f cos ax — cos bx , , b . 11 / dx = \n- 2111 J x a
21.8 Bestimmte Integrale 1087 2 für|a|<l, fsmxcosax \ % . „^ 12. / ds={?[ für |a| = 1, B112) o 4 l 0 für \a\ > 1. oo . oo fSmX , /"COSX , /7T /rt. „rt. 13 l^dx = lißdx = h- B113) 0 V 0 V oo . 14. / — dx = ±—e~'a6l (das Vorzeichen stimmt mit dem Vorzeichen von b überein). B1 14) J (X "i JL Zi 0 oo X5 /g> = ^. BU5) 0 ie.7=L^fc-J|a|. B1.16) 0 -j-oo +oo 17 / sin(x2) dx = f cos(x2) dx = J^. B1 17) TT/2 /• sinxdx 1 1 + fc . . /o-i io\ 18 / /i 72 • 2 = = ^ln! £ &**<!• B1.18) •/ V1 - k2 sin2 x 2/c 1 - k o tt/2 19 / . cosxdx : = larcsinA: für \k\ < 1. B119) •/ v 1 - A:2 sin x k o 20. 7 *E^^ 1(K-E) für |fe| <1. B1.20) ^ V1 - /c2 sm2 x Ä2 In diesem und dem folgenden Integral sind E und K vollständige elliptische Integrale (s. 8.1 4 3,2., S 454). E = E (k, ^) , K = F (k, ^) (s. auch Tabelle Elliptische Integrale, 21.9, S 1091). 21 / hC0S[X2dX, =p[E-(l-fc2)K]. B1.21) •/ V1 - k2 sin2 a; &2 22 o o cos ax dx nbc f cosaxdx nba , . , ,. n .,. ,rt., nn. / 1—^ nä = 1 ü bei ganzzahligem a > 0, \b < 1. B1 22) J 1 — Ab cos x + ir 1 — er 21.8.2 Bestimmte Integrale von Exponentialfunktionen (zum Teil kombiniert mit algebraischen, trigonometrischen und logarithmischen Funktionen) r(n+l) 23. o fxne-axdx= ^* ] füra>0, n>-l, B1.23a) = ^-7 füra>0,n = 0,l,2, . B1.23b)
1088 21 Tabellen Mit r(n) ist in dieser und in der nächsten Formel die Gammafunktion (s 8.2 5,6., S. 478) bezeichnet: (s auch Tabelle Gammafunktion 21.10, S 1093) 24 / xne'ax dx = )'( für a > 0, n > -1, B1 24a) 0 2a l-3---Bfc \)yß für n = 2fc (jfc = l,2,. ), a>0, B1.24b) 2/c+lafc+l/2 25. o 2ak+1 für n = 2k + 1 (fc = 0,1.2, ), a > 0 B1 24c) 26 o / e-a2x2 dx=jl für a > 0 B1 25) j x2e~a2x2 dx = ^ füra>0. B1 2G) 27 / e-a2a;2 cos bxdx = ^> e~b2/4a2 für a > 0. B1 27) J 2a o o 29 7^- = ^. B129) JeHl 12 v ' o dx = arccot a = arctan - für a > 0 B1 30) x a o oo 31. / e~x In x dx =-C « -0,5772 B1.31) o Mit C ist die EuLERsche Konstante (s 8 2 5,2., S 477) bezeichnet 21.8.3 Bestimmte Integrale logarithmischer Funktionen (kombiniert mit algebraischen und trigonometrischen Funktionen) i 32 / In | In x | dx = -C = -0, 5772 (wird zurückgeführt auf Nr. 2131). B1 32) o Mit C ist die EuLERsche Konstante (s. 8.2.5,2., S. 477) bezeichnet 1 1 2 33 f -^L dx = ?- (wird zurückgeführt auf Nr 21 28) B1 33) J x — 1 6 o 1 1 2 f -^- dx = -^— (wird zurückgeführt auf Nr. 21 29). B1 34) 34. ¦ lnX
21.8 Bestimmte Integrale 1089 35-/Ä^ = ?- B135) o 0 37. /(-) dx = r(a + l) für(-l<a<oo). B1.37) o Mit r(x) ist die Gammafunktion (s. 8.2 5,6., S 478) bezeichnet (s. auch Tabelle Gammafunktion 21.10, S 1093) TT/2 TT/2 38. [\nsinxdx= f In cos acte = ~ In 2 B1.38) 39. / a; In sin xdx = o 7T/2 40 ö 0 TT2 In 2 fx\nsmxdx = -* " . B1 39) o tt/2 / sin x In sin x dx = In 2 - 1. B1.40) 41. An(a±&cosx)<te = 7rln^i^ fura>6. B141) o } o o f27rlna für (a > b > 0), 42. /ln(a2-2a6cosx + 62)da;= ^ , ~ B1.42) J K B7rln6 für F > a > 0). K J TT/2 43 f \nta,nxdx = 0. B143) o tt/4 44 /ln(l + tana;)da; = ^ln2 B1.44) o 21.8.4 Bestimmte Integrale algebraischer Funktionen 45 }x«(l-xfdx = 2 ]x^\l-xydx=r{a + Y}^ { l r(a + P + 2) = B (a + 1, /? + 1), (wird zurückgeführt auf Nr. 21.7a). B1.45) rix) r(y) Mit B(x, y) = v ; vyy ist die Betafunktion (s. 21 8.4, S 1086) oder das EuLERsche Integral 1. Gattung bezeichnet, mit r(x) die Gammafunktion (s 8.2.5,6., S. 478) oder das EuLERsche Integral 2 Gattung oo 46. /, x =-ü— füro<l. B1.46) 7 (l-t-£)£a sina7T o
1090 21. Tabellen /dx — = -TT cot an für a < 1. B1 47) (l-x)xa v ' o ~a—1 48 fTZ^dx=r^ für0<a<6. B1.48) q ~*~ b sin — } dx ^P(-) 49. ^£= = jö^L. B1.49) Mit -T(x) ist die Gammafunktion (s. 8.2.5,6., S 478) bezeichnet (s. auch Tabelle Gammafunktion 21 10, S 1093) f dx a 50 /——^ , = -?- (<><a<£) B150) y l + 2rrcosa + £2 2sina V 2/ v ; o oo 51. 7—^ ; = ^- (o<a<£). B1.51) 7 l + 2zcosa + £2 sinx V 2/ v ;
21 9 Elliptische Integrale 21.9 Elliptische Integrale 21.9.0.1 Elliptische Integrale 1. Gattung F((p, fc), k == sin et w° 0 10 20 30 40 50 60 70 80 90 a/° 0 0,0000 0,1745 0,3491 0,5236 0,6981 0,8727 1,0472 1,2217 1,3963 1,5708 10 0,0000 0,1746 0,3493 0,5243 0,6997 0,8756 1,0519 1,2286 1,4056 1,5828 20 0,0000 0,1746 0,3499 0,5263 0,7043 0,8842 1,0660 1,2495 1,4344 1,6200 30 0,0000 0,1748 0,3508 0,5294 0,7116 0,8982 1,0896 1,2853 1,4846 1,6858 40 0,0000 0,1749 0,3520 0,5334 0,7213 0,9173 1,1226 1,3372 1,5597 1,7868 50 0,0000 0,1751 0,3533 0,5379 0,7323 0,9401 1,1643 1,4068 1,6660 1,9356 60 0.0000 0.1752 0,3545 0,5422 0,7436 0,9647 1,2126 1,4944 1,8125 2,1565 70 0,0000 0,1753 0,3555 0,5459 0,7535 0,9876 1,2619 1,5959 2,0119 2,5046 80 0,0000 0,1754 0,3561 0,5484 0,7604 1,0044 1,3014 1.6918 2,2653 3,1534 90 0,0000 0,1754 0.3564 0,5493 0,7629 1,0107 1,3170 1,7354 2,4362 oo 21.9.0.2 Elliptische Integrale 2. Gattung E (<£>, k), k = sin a w° 0 10 20 30 40 50 60 70 80 90 a/° 0 0,0000 0,1745 0,3491 0.5236 0,6981 0,8727 1,0472 1,2217 1,3963 1,5708 10 0,0000 0,1745 0,3489 0,5229 0,6966 0,8698 1,0426 1,2149 1,3870 1,5589 20 0,0000 0,1744 0,3483 0,5209 0,6921 0,8614 1,0290 1,1949 1,3597 1,5238 30 0,0000 0,1743 0,3473 0,5179 0,6851 0,8483 1,0076 1,1632 1,3161 1,4675 40 0,0000 0,1742 0,3462 0,5141 0,6763 0,8317 0,9801 1,1221 1.2590 1,3931 50 0,0000 0,1740 0,3450 0,5100 0.6667 0,8134 0,9493 1,0750 1,1926 1,3055 60 0,0000 0,1739 0,3438 0,5061 0,6575 0,7954 0,9184 1,0266 1,1225 1,2111 70 0.0000 0,1738 0,3429 0,5029 0,6497 0,7801 0,8914 0,9830 1,0565 1,1184 80 0,0000 0,1737 0,3422 0,5007 0,6446 0,7697 0,8728 0,9514 1,0054 1,0401 90 0,0000 0,1736 0.3420 0,5000 0,6428 0,7660 0,8660 0,9397 0.9848 1,0000
21. Tabellen 21.9.0.3 Vollständige elliptische Integrale K und E, k = sin a et/* 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 K 1,5708 1,5709 1,5713 1,5719 1,5727 1,5738 1,5751 1,5767 1,5785 1,5805 1,5828 1,5854 1,5882 1,5913 1,5946 1,5981 1,6020 1,6061 1,6105 1,6151 1,6200 1,6252 1,6307 1,6365 1,6426 1,6490 1,6557 1,6627 1,6701 1,6777 E 1,5708 1,5707 1,5703 1,5697 1,5689 1,5678 1,5665 1,5649 1,5632 1,5611 1,5589 1,5564 1,5537 1,5507 1,5476 1,5442 1,5405 1,5367 1,5326 1,5283 1,5238 1,5191 1,5141 1,5090 1,5037 1,4981 1,4924 1,4864 1,4803 1,4740 */° 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 K 1,6858 1,6941 1,7028 1,7119 1,7214 1,7312 1,7415 1,7522 1,7633 1,7748 1,7868 1,7992 1,8122 1,8256 1,8396 1,8541 1,8691 1,8848 1,9011 1,9180 1,9356 1,9539 1,9729 1,9927 2,0133 2,0347 2,0571 2,0804 2,1047 2,1300 E 1,4675 1,4608 1,4539 1,4469 1,4397 1,4323 1,4248 1,4171 1,4092 1,4013 1,3931 1,3849 1,3765 1,3680 1,3594 1,3506 1,3418 1,3329 1,3238 1,3147 1,3055 1,2963 1,2870 1,2776 1,2681 1,2587 1,2492 1,2397 1,2301 1,2206 */° 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 K 2,1565 2,1842 2,2132 2,2435 2,2754 2,3088 2,3439 2,3809 2,4198 2,4610 2,5046 2,5507 2,5998 2,6521 2,7081 2,7681 2,8327 2,9026 2,9786 3,0617 3,1534 3,2553 3,3699 3,5004 3,6519 3,8317 4,0528 4,3387 4,7427 5,4349 00 E 1,2111 1,2015 1,1920 1,1826 1,1732 1,1638 1,1545 1,1453 1,1362 1,1272 1,1184 1,1096 1,1011 1,0927 1,0844 1,0764 1,0686 1,0611 1,0538 1,0468 1,0401 1,0338 1,0278 1,0223 1,0172 1,0127 1,0080 1,0053 1,0026 1,0008 1,0000
21.10 Gammafunktion 1093 21.10 Gammafunktion X 1,00 Ol 02 03 04 1,05 06 07 08 09 1,10 11 12 13 14 1,15 16 17 18 19 1,20 21 22 23 24 1,25 r(x) 1,00000 0,99433 0,98884 0,98355 0,97844 0,97350 0,96874 0,96415 0,95973 0,95546 0,95135 0,94740 0,94359 0,93993 0,93642 0,93304 0,92980 0,92670 0,92373 0,92089 0,91817 0,91558 0,91311 0,91075 0,90852 0,90640 X 1,25 26 27 28 29 1,30 31 32 33 34 1,35 36 37 38 39 1,40 41 42 43 44 1,45 46 47 48 49 1,50 r(x) 0,90640 0.90440 0,90250 0,90072 0,89904 0,89747 0,89600 0,89464 0,89338 0,89222 0,89115 0,89018 0,88931 0,88854 0.88785 0,88726 0,88676 0,88636 0,88604 0,88581 0,88566 0,88560 0,88563 0,88575 0,88592 0,88623 X 1,50 51 52 53 54 1,55 56 57 58 59 1,60 61 62 63 64 1,65 66 67 68 69 1,70 71 72 73 74 1,75 r(x) 0,88623 0,88659 0,88704 0,88757 0,88818 0,88887 0,88964 0,89049 0,89142 0,89243 0,89352 0.89468 0,89592 0,89724 0,89864 0,90012 0,90167 0,90330 0,90500 0,90678 0,90864 0,91057 0,91258 0,91467 0,91683 0,91906 X 1,75 76 77 78 79 1,80 81 82 83 84 1,85 86 87 88 89 1,90 91 92 93 94 1,95 96 97 98 99 2,00 r(x) 091906 0,92137 0,92376 0,92623 0,92877 0,93138 0.93408 0,93685 0,93969 0,94261 0,94561 0,94869 0,95184 0,95507 0.95838 0,96177 0,96523 0,96877 0,97240 0,97610 0,97988 0,98374 0.98768 0,99171 0,99581 1,00000 Die Werte der Gammafunktion für x < 1 (x =^ 0,-1,-2, ..) und x > 2 lassen sich mit Hilfe der folgenden Formeln berechnen: r(x) = r(x + 1), r(x) = {x-i) r(x -1). ¦ Asr(o,7) = 4£ = ^ = i.2«»- v ; 0,7 0,7 ¦ B: rC,5) = 2,5 • TB,5) - 2,5 • 1,5 • T(l, 5) = 2,5 1,5-0,88623 = 3,32336.
^i^^M^ ^^j^ji^j^. S^S^S^^S* S^S^S^S^^ i0!0^60^0 J^J0!0!0!0 J~lJ~\,H~lJ~\!Ti ^i-1 h~' *-*£* 0000° 00P°0 ©~bo*VbVcn ^"ooIsdWo *cb*bo*WbVbt ^*co*k>W© *cbW^bVbi ^^ootSi-^o> *cb~oo"WbVcn ~rf^cokfh-'© ©*oo~WbVcn ^~wToh-'No ooooo ooooo ooooo ooooo ooooo ooooo ooooo ooooo ooooo ooooh ToIoTnd'kdoo *oo~co*co*oo*oo ^^*oo*bo*oo *oo*oo*ooT>o*kd Iommoo boHnlo ~ko*oo*oo~£>.*cn *cn*bVbVWs *oo*öo*oo © © © © © ©© O^CiCOtO d^Ol-qOOCO ©©©©00 ©d^KD©© KD004^©£* ©Cnh-'CTKD 004^©Cnh-* ©KD-^h-'© ©^00h->00 ©-J©©© ©©©©© IO i-i 05 00-q (-»KD©!—'© ^^OtOO £^CnKD©00 tOCnOOiOO MOOOCnM aOMCDÜi -4©h-'KD00 O-JO-slO -vl^COi—'Cn COOOl^IH O0©KDO0h-' OOOOKDh-'H WO^OOJ^ CnCn^O^CO 0000^00 ©h-»h-*©KD CnOOtOOCn rf^OOCnO I I I + + + + ooooo ooooo ooooo ooooo ooooo *ooTso1\3*kfto loV^h-»'"'»-' © © ©©©~h-> ^~k>lo*oo*oo "oo^'^^'rf^ i—'CO^ICnOO O-sIWOai KDh-»Cn©00 --1KD©©00 -<J©^~q© hf^OOCOOii—' KDh-*0000© -<JKDO0Cn~q CDOMOCO Cn©h-'OS -<I Cn h-» CT) t-i Q0©©O0© KDOOOOCn^ KD-OO0©»-' rf^-q©00h-' + + ooooo ooooo *Cn*Cn*cn*cn*cn *cn*cn*Cn*cn*cn tOCOCnCi-vI 0000S©Cn ©©©00© h->1-> -vi CO -4 tocooco-q tocnoococo + + + ooooo ooooo ooooo *Cn~cn^*4^^ *Vco*Oo"kd*KD Wh-* © © © ?£* kd ©-<j ?£>. ©©kdoo*^ coj^corf^o HtOOOOO Cn00©©KD ©00©©© (OOWCDM COOOO-JOO OOOCnCOO I I + + + + ooooo ooooo ooooo ooooo ooooo Ts3*kTto*kfH-> Wh-»©© © © ©"'?-'Wh-» *k>1o~bo~cooo W^*kf^"rf^ CO-<I^tOCO ©KD©Cnh-* KD©©4^00 KD©©^-J ©OOOiOOCO KDtOCOOOj^ O0©00©© CO ^ © -<1 CO CO CO S 00 Ci -<ICn©h-'00 H-CO^Cn^l O0©00t-'© >J^Cnh-»-<|© ©h-'©h-'© ©©CnOOh-' + + © ©©© © © © © © © ~Cn*cn*cn*cn*cn "^d^l^-Wco HMtOMH CO-<ICntO00 ©00©00© ©-qKD©KD £xh-'O0O0^ 004^©rf^4^ + + I I I ©©©©© ©©©©© ©©h-'J-' | *O0*KDT\D*h-'© ©©Woo*^ *©*00©*CnQ O000KD©O0 ©OOCO©^ ©©h->000 -qoiootooo cn©©oo4^ ©-aoo£^ ©Cni-'KDOO ©00-JCncn ©COh-'KD + I I I I I 00000 ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° ° °^J^J~' J-1^^00^ I ^h-'lsDloTsD'oO *bo*00*00*0o"oo ^^Wrf^*'^ ^*CO*CO*CO*O0 Tsslo'to'h-'"^ *h-i ©©©%-» "h^ToloCO^ **4^*Cn*©CWI *00"©*H-»Ts3^ ^I*tO*C0^O ooh->^-<i© kd*^©oo© ©I-»t-aH-»H-» ©oos^kd ©©kdoo4^ ©cn©cn© ©KDOorf^h-' -<i^kd©oo -q-a©©~q oo©KDcno h-'CO^00h^ ©OOOO^S -a^CiCn© h-'-J©©^ CnOO-JOOCn ©KDh-'i-'-vJ vJ^CO^-qtO ©001—'00 h-' O0O0O0©h-» ©OOCO© KD©Cn~q© ©?£*©©© OOh-'-vl^to ©©-q©~4 ©Cn©^© CnOOCn-q© 4^S-<iai0O h-» üx h-' h-' tO h-»h-'KD^Cn ©h-*00© Oirf^OOlOi—' ©COOOOOS Ci©ÜlCn^ ^rf^COCOCO OOtOtOtOtO tOh ©Oi^OOOO 00Cn-<I©00 i-'-4h^to© -qh-^oobo-a -q©oooo -ato-atooo enh-'ooento ©oocirf^to i-'©oo-<iOi 0O^^©00 ©Cnd^CncO rfx00bOrf^00 K3©O^Cnrf^ Cn OO -4 ?£» h-» OO-aNDOO© ©©©Ci© 00©^©S Cn^OOOObO CnOi©tO© oo©rf^oic» NDMMOO h-'OitOCOO 00-<|©t0 00 J^tOMOCO 0000^©05 CnÜirf^^CO ©©©©© ©©©©© ©©©©© ©©©©© J^^CncnOi •-'©OO 00© ©sto©© © © © © © oo©©© ©©©©© ^CncnCi-~J ÜiOOWO tOCnCntO-q t—'Cn^CnOO ©©©©© ©©©©h-' -4-4 00©h-' )_'©©©(-' 4^00 KD 00© ©oo-o© ©h-'^-qto h-^CO©© 00©CT5 00© © © © © © ©©©©© tOOOCns© ?J^©©Cn© oo-aco©© ©h-'-qoo© -<I00 00KDCn ©h-'^©00 ©©©©© ©©©©© tObObOOOOO h-'^s©^ ©©Cn©s ©h->©cn^ JjOJJOjJOJOJO *©*O0©Vl*Cn HOMÜtH O0h-»©Cn^I ¦»© ©©©©© ©©©©© tO©©-<ICn ©©h-»^© OOOOrf^Cnh-' ^oo h-"©© £M—'©00 00 00-<I©Cni—' Oos-<i©cn 00©h-'CO© CiS^--qcn h-iOO-slCntO ©©©©© ©©©©© ©©©©© ©©©©© ©©©©© 00 4^^-Cn© ©00©CntO ©ooto^co t—'tO©©Cn ©OOt—h-» S-v|00Oh ©©©©oo tOh-»tooo© h-' (—> t—' h-' KD KDrf^©00h-' OOCnCnOOOO 00©Cn©00 KDtOOOOOrf^ ^Sh>OtO 00 00 00 Ol h-' -<ItOCn©© rf^^COOOtO ©OO-qi—'Cn ^ItOh-'WSI h-»©©-a© 00000 ^*Cn"©Vl© 00©©-<ItO ©Cn©—q4^ -<IOOCnCnrf^ ©©©©© J^tOMOO ©O0©00© + © © © © © 'tO^h-'l-'©© ©Cn©Cn© rf^h-»©©© o-vIüiho J-'^-'J-'JvO "h-'*oo Vj*^ r h-*-4CntOC t^KDKD-a ©©©©© ©©©©© ©©©h-'h-' -q00©h-'KD ©00©!—'^ nd—qoorf^oo COKDOO ©©©©© ©©©©© H-i (-' H-' I—' KD rf^Cn-<I©KD ©-JOi-JKD ©h->ooco^ ©©©©© ©©©©© ©©©©© ©©©©© ©©©©© ooi-»i--i-» KD004^© ©©©©© KD KD 00 00^ CnOOi—'Cn© ©KD^COO^ ©©©©© ?ti.Cn cn©~q Cm—'-qcnoo KDh-'-JKDO0 COM J^OOCO ©©t-ih-'h-' O0©©KDO0 CO^SKD© -vi © CD -~J© KDO0 h-'h-'KD KD KD CnO0©4^~vj ©KD©©S oooorf^cn© -qoo©oo© h-'©-siooc KD-4O0©© h->©cn©cn OOCn-vlCnC ©KD^©h-* ©h-'©KD© ^©©CO OOCn©O0© CnOOOOOO^ 4^-©)©H0
O CO CO CO CO^CD o "co^ooVi"oVcn CO CO CO CO^Ö 00 OO 00 00 JX> ~co~c»VbVcn ^coTn^'o ppppj3i co~bo~-<fbVcn Cn Cn cn cn Ol Cn Cn Cn Cn^Ö* "coTxf-q Ci'cn ~4^co~toV^o I I O OOOOO 1o "toTololo^ 4^ ^cotooco Cn OtOMCOCO CO COCOOOOCO I I ++ + + + + + + I I OOOOO OOOOO OOOOO OOOOO OOOOO OOOOO OOOOO OOOOO OOOOO ~h-'"h-'~h-''h-'o ooooo ooWH-^h-* ^"kTkftoto Wtolo1s3~co TolsytoTolo To~toioH-^H-> Woooo ooW>-i"h-> -JCnCOt—'CO C7iCOH-*i-*4^ 0>cot0 4^~vl cOH-^COCnO -vjOOCOCOO COCOOO^ICi tMOOSCi tOCOCntOO rf^-^i-^rf^-q 0^04^0 CncOt0 4^>—' COOtO-qi—> 4^Cn4^H-'Ci OOOOCncOO OOCOCn^O COCOh-'^IO tOi-'CO-JC} hüiO^SI 00-4-^tOCO COtOCnCiCO tOOtOCn-<I 4^4^CiCiCO Oi tO i—' i—' t—> (—> H-'i—' O i—' COOO-<ICOCi O-JCOOOO tOOOCOCOO + + O OOOOO O ~o©*h-»Wh-» 4^ OiCOh'COOi CO OOtOOiCOt—' Cn ^OOCiCnCO + OOOOO "h-^to"to1olo i-'O-^tocn 05 4^4^4^-CO + OOOOO lololoto'to CnOiOi-q^l cn4^cotoco COl-i-4 00l-' + OOOOO loToTsoTo'to -^ OS Cn ^ CO OCn00-Nl4^ 00-400 0 + OOOOO H-'OOOCnCO to4^cototo + I o o o o o ~h->0000 O 00 Cn tO O COt0 4^Cn4^ OiO> co to-j OOOOO OOOOO OOO H-'H-' CO Ol CO tO Cn 4^ Cn Cn Cn CO cotocoooo t->tOtOtOtO OOOCOCn-j t—> 00 tO Cn Oi ot-^coco-j OOOOO © O O O O Tso~co~co"co"co co^co^co co~co CO(-H\DC04^ 4^4^4^COtO Cn (—' 4^ 4^ i—l Cn © CO -<1 -<l HOHOOJi. CO©bOi—'© + + O OOOOO © 0*H-iWh-»~H- Cn OOOtOCn-q Cn O^SOM ~q 4^CnCOtOtO + OOOOO CDOtOW^ ooo^ooco -4©cncoco + OOOOO lo'tOtolsoTo cn©-a-a-j COÜiOHO tOCO©CntO + O O O O © WkftoTo^to ©CnCnCOtO C75COOOOCO tOCni—'Müi + OOOOO IsdWh-'V'''»-' oooatM-1 © -q Cn tO -<I CntO00 4^CO + I OOOOO OOOOO COCiCOObO ©tOC0 4^Cn -joocotoco OOOOO OOOOO OOOOO OOOOO OOl-'H-'h-' CnOOt—'rf^-sj ©©©CnCO GG4^tOtOtO H-LtOtOtOtO coto4^©0o CO Cn 00 CO 00 COi->C0 4^tO CO CO CO CO CO Oh-iKDCOCO 4^ -4 00 Cn CO 4^-qt0 4^Cn CO CO CO CO CO 4^COCOtO© O-qi—'H-'OO tO4^C0©Cn + + O OOOOO lo kDtoloTolo 4^ 4^COtOi—'© CO 4^-<I00-<ICO o -qco-ji-'to + OOOOO 00©4^tO© -^coco-q^ i-' i-' i—' Cn CO + I p o p op OOOOO -q cn to o to co 4^001-'© CO^Ot-'tO OOOOO OOOOO OOOOO OOOOO OOOOO OOOOO OOH-'H-'I-' CnOOOCOCn coo^icooo CnOitOi-'h-» H-HOtOtOtO OOOtOt^Cn h-'C0 4^tOCO -qCOCOOOH-* tO tO tO KD CO -vjoococoo CO 4^ CO CO tO t—'CTL^Cn~<l cocotototo oocooo-~a CObOCn-sJi-' tOtOtOi-'i-' Cn4^tOCO-<r COtOtOCOCn CitOCOOOO v-'i-'OOO 4^ i-100 Cn tO oocooooco i-'to-qoooc + + OOOOO OOO^'h-' *->¦ 4^ -4 H-» 4^ O4^coco-a h-'cnto-jco tO tOtOtOt-»!—' 00 CnCOi—'CO-q i-» OtOi—'tOCn C7i h-'coco^aco r^^r^k^r^ CO CO 00-J C7i co^k^S «DOtOCnOO ^^^£gg Cncn^pp tO 00 4^~Cn tO OiCnCn4^4^ COCOCOtOtO tOtOtOh-^i—' i—^ i—* i—^ i—11—' tOCTU-^aitO OOCntOCOOi 4^tOOOOO Cn4^tOi-lO j-'pcnpj^i pj^coj£*oo 4^jOjOcnoo jjopj^ipp ^co^co bi"cn~ai '4^'^j~H-'~co'to wVcobb ^V'^bo^cn^co to tototoi-»!-1 OS 4^tOOOOOi -q toootocn h-' OO^IC7i4^00 CnCOtOi—'O O-a4^C0C0 00 I—» -nJ 4^ H-» CO00-<I~4CT> C0Cn-vjO4^ -<l tO Cn Cn H-' CnCn4i>.4^CO 00 CO 00 CO CO CO H-i CO CO CO Cn-<Icn4^Ci -dOOCnco COCOCOtOtO "co"H-'"co"to'a5 tOtOMMM tOO00-<JCn j-appoj-^p "to"bo~co^o 4^tOi—'OCO toco-q-si-<i 'h->~4^'~oo'co'-<i O OOOOO O OOOOO i—1 i—'tOtOtOCO -sj COi—»4^-nIO -<l -JCOCOOCO 00 CnCOOiCTiO^ OOOOO OOOOO CO CO 4^ 4^ Cn CO-<|i—'CnO coi—'to-qoo coOHcooo OOOOO OOOOO CnOiCi-qOO OtOCO-<IC^ CnOOOOOtO 4^ CO CO h-'O OOOOO O h-» H-* h-» h-» COOi—'00 4^ CnaiOOt-'CTi OOCTiCn-qcn oo OOOOO OOOOO OOOOO ooi-'h-'i-' h-» (-* (-»i-' tO (-'H-'tOtOtO tOC0C0C04^ 4^CnCnOi-<l OOOOHbO COCn-JCOK-' Ci000t04^ -<I04^00tO -qtOOOCntO OOOh-^4^ 004^tOi-'CO tOi—»i—'4^ CO -<I00COi—'4^ tOOsCntOCn OOOCO-sl4^ CTi^H-iOOCO con-'^oto to4^i-'-<roo ooto-<ioco cot-' tototococoo CO OS CO CO C5>s 00CnCT5OCOS Cn CO Oi 00 i—»^^ O OOOOO O OOOOO i-* totototoco 00 OCOCnOOt-' Cn tO tO CO CO O OOOOO OOOOO CO CO 4^ 4^ Cn Cn CO CO 00 CO MOtMsDCTS tOrf^OCn4^ OOOOO OOOOO CnCTi-qOOCO COCiCOtOi—' o^co-aoto 4^1—'4^00 OOOOO O t-' to CO cn H-*toCncOCn 4^ OO Cn Oi 4^ OOOOO OOOOO OOOOO OOt-'h-'h-' v-* >-> (-»tO tO tOtOCOC04^0 i—' i—'tOtOtO tOCOC04^4^ CnCnCiCi-q OOCOOtOCO 4^Oi00OtO CnCOtOCftO>-. -qcOK-»COC5 COtOClOCn OOtOCOS C7iO^00O4^ CO-qOOOlsD COOCOi-'4^S tOtO4^00Cn Cn 000^14^ CnCOOOCOCO COCOH-»Cn4^ COCOCiCOCTi -JOCOCDCn" C04^i—'COCO COOOtOOOtO COCiOOOCO COh-'
M k N^t tif ^ ti? ^ cC H Qf h cC 1-T ^ ll O CR lO 05 lO Ol h OCdOJ-^COO)^ OOCtKOOiN W OHH(N(N!N W ° o cf cf cf o o 1 1 1 1 1 1 LO CM 00 CO CO CO CM CN CO CO ^ O Tt< Ol rH Ol ^ N 00 CN (N CO CN CN T-H O O i-H cd cd cf cd cd cf ° 1 1 1 1 1 + ON00 WiON^f OCNOOCN N OliO ooiNioon^ O^ O^ i-^ CM^ CO^ CO^ CO^ CD CD o" CD CD CD CD ONOOOONQ lO ION CN CM NCN N CO CO Ol CO lO N CO CO CO CN CN H O o o cf o o o 0 + OMOCOOOliO O^NüOiOIN os^hoocooo O O H CN CN CO CO ° O CD CD CD CD O 1 1 1 1 1 1- O CN O CN O CN O o co in co o co lo O Ol 00 CO TP O CO io tp tp tp tp tp co cf O* CD CD CD CD CD 1 1 1 1 1 1 1 O LO O LO O LO O OOHH(N(NCO O O O O O O O 00 CO o 1 iO CN CN CM o LO CN CM co^ CD t- 00 o o 1 oo b- rH Tp o 1 CM CO r-H CO CD 1 LO CO o co TP o o 1 CO CM Ol CM o co o b- °i CD O CO i—< O 1 o o Tp Tp o 1 o o CO CM cf 1 o Tp o CO O 7—1 r-H O + o Ol CN CO o b- r-H Ol CD CD LO o CM o 1 CM b- tP tP o 1 CM CO Ol r-l CD 1 LO TP O r-l t- co o CM O CM CO cf cf CM 00 CO O CM l>- CO CM o o 00 CM oi oo 00 CM o o cf cf + 1 r-l O Ol Ol oo lo CN CO o o 1 1 LO H t- Ol co o TP TP o o 1 1 O CN LO CO CM TP H O CD CD 1 1 O LO LO LO o o CO CM CM CO cf 77 CM b- O CO CM LO r-l CD 1 o 00 o TP o 1 o o CO CO o 1 o o TP o cf + o CO o b- co b- CM cf t>- Tp CO o cd + LO o I>- CM cd 1 Tp 00 CM TP o 1 TP 00 oo CM o 1 00 CO CO r-H cf LO CO o CM o LO r-H o + CO LO CM cd" 1 CM LO CO CO cf 1 77 CM TP o 1 LO CM Ol o 1 o LO CO CM^ cf o b- o CM TP CO o o 1 00 o 00 CM CD 1 TP CO TP cf 1 ~ o LO co o 1 CO o t- o o 1 00 CO TP co^ cf LO 1>- o b- Ol CO CM o 1 00 Ol CO cf 1 LO Ol Ol CO cf 1 o CO CO CM o 1 o o 00 o o + o o CO tP^ cf o 00 o CO OO CN O r-H b- r-H O Ol CO r-H O CO CO O O^ O O O T-1 1 1 + O CM LO O CO r-H b- O O TP 00 O TP CM r-l O cf cf cfrH 1 1 + b- r-l b- O LO r-l CM O oo tp b- o CM O CO O^ Cf ©"* CD *-* 1 1 + CO Ol H O O b- tP O LO O LO O O CM LO O O O O rH 1 + CO LO TP O O CM 00 O tDNHO °i ^t ^ °~ cf cf cf r-T 00 O 00 O co lo co o 00 r-l LO O Lo^b-^oq^o^ cf cf cf r-T LO O LO O oo oi oi o O O O r-l
21.13 Laplace-Transformationen 1097 21.13 Laplace-Transformat ionen (s. 15.2.1 1,S 733) OO F(p) = f e~ptf(t) dt, f(t) = 0 für t<0 o Die in der Tabelle auftretende Konstante C ist die EuLERsche Konstante C = 0, 577216 (s 8.2 5,2., S 477) Nr 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Hp) 0 1 p 1 pH 1 (p — a)n 1 {p-a)(p- ß) P {p-a)(p- ß) 1 p2 + 2ap + ß2 OL p2 + a2 a cos /? + p sin /? p2 + a2 P p2 + 2ap + ß2 P P2 + OL2 p cos ß — öl sin /? p2 + a2 a p2 — a2 P P2 — OL2 f(t) 0 1 tn-l (^lj! y.n—1 eat (n-1)! e/3* _ ea* /3-a /?e# - aeat ß-a -<vt e • //32 2 + vF^?nm^ a sin at sin(at + /?) / n [ rn„ rm ~zn f " Pv^ a * v/^~z cosat cos(atf + /?) sinh at cosh at , — - \ "in JR1 n2 t —^siny^ a t\ e-at
1098 21 Tabellen Nr. 15 16 17 18 19 20 21 '22 23 24 25 26 27 28 29 F(p) 1 (p - a)(p - ß)(p - 7) 1 (p-a)(p-ßJ P (p-a)(p-ßJ P2 (p-a){p-ßf 1 (p2 + a2)(p2 + /?2) P (p2 + a2)(p2 + /?2) p2 + 2a2 p(p2 + 4a2) 2a2 p(p2 + 4a2) p2 - 2a2 p(p2 — 4a2) 2a2 p(p2 - 4a2) 2a2p p4 + 4a4 a{p2 + 2a2) p4 + 4a4 a(p2 - 2a2) p4 + 4a4 P3 pA + 4a4 ap (p2 4- a2J /« (/3 - 7)eat + G - a)e# + (a - ß)e7t (a-/?)(/?-7)G-a) eQ< - [1 + (a - /?)t] e^ (a-/?J aeat-[a + j9(a-]9)t]e(St (a-/?J aV - [2a - ß + /?(a - ß)t] ßeßt a sin ßt — ß sin at a/?(a2 - ß2) cos ßt — cos at (a2-/32) cos2 at sin2 at cosh2 at sinh2 at sin at • sinh at sin at • cosh at cos at • sinh at cos at • cosh at t . . - sin at
21.13 Laplace-Transformationen 1099 Nr. 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 F(P) ap (p2 _ Q2J aß (p2 — a2)(p2 - P -ß2) (p2 - a2){p2 - ß2) 1 Py/P 1 Pny/P 1 Vp + a y/p + a - \Jp + ß \J\/P2 + OL2 - p /\/p2 4-a2 -p V p2 + a2 /\/p2 + a2 +p V p2 + a2 / \/p2 - a2 - P V p2 - a2 /Vp2 - a2 + p V p2 - a2 1 py^pTä 1 (p + a)VpT^ /(*) - sinh at 2 ß sinh at a2 cosh at — a2 — 1 ~JTt — a sinh /?£ -ß2 cosh /ft /?2 2^ n\ 4n Bn)! 0F x/tt£ sinat tn 2 (n > 0, ganz) tV2?rt 2~ sinat cosat — sinh at irt / — cosh at 1 nt 2_ 2e~ dr x/(/3-«)t yJ*(ß-<*) i >~ dr
1100 21. Tabellen Nr 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 F(p) yJp + Ot P 1 y/p2 + <*2 1 y/p2 - a2 1 1 0) e1^ Py/P arctan — arctan arctan lnp P Inp (InpJ 2ap p2 - a2 + /?2 p2 - ap + ß aß In p — a P3^ . p + a rt . a In = zartann— p — a p In In p2+ß2 p2-ß2 e"ut 7^ dr Jo(at) (BESSEL-Funktion Oter Ordnung s 9.1.2.6,2.,2., S 527) Io(at) (modifizierte Bessel Funktion Oter Ordnung s. 9.1.2 6,2.,3.,S 528) -^.Js^lt e-at-J0(y/a^Ft) sinh2-\/t sin at t 2 - sin at • cos ßt eQt-l sin/ft -C-ln* ^(n)-lnfl, V(n) = l + i + ..- + i-C (ln£ + CJ - sinh atf cos /?£ — cos at i cosh ßt - cosh at i
21 13 Laplace-Transformationen 1101 Nr 61 62 63 64 65 66 67 68 69 70 71 72 F{p) e~a^P, Rea>0 ^-e~a^, Rea>0 (VP2 + OL2 - pj y/p2 + a2 )— y/p2 — a2) y/p2 - a2 Rev> -1 , Re^>-1 e~ßp (ß > 0, reell) /p2+a2 y/p2 + a2 y/p2 — OL2 yj(p + a){p + ß) p-ßy/p2+a2 -ßy/p2-a2 ß + y/p2 + a2 ß+- P2 — OL2 \ y/p2 — OL2 p-ßp _ p-ßy/P2+cc2 -ßy/p2-a2 _ f(t) -a2/4t lyft t\/i -a2/4t yfwt auJv(at) (s BESSEL-Punktion 9.1.2.6,2.,2., S. 527) auIu(at) (s. BESSEL-Funktion 9.1.2.6,2.,2., S. 528) ' 0 für t < ß kl für t > ß 0 für t < ß J0 (ay/t2 - ß2) fürt>ß 0 für * < ß h (ay/t2 - ß2) für t > ß fürt<> e-(«+0i/o (?L-ljt*-p\ imt>ß 0 für * < ß y/t2 - ß2 -Jx a^/t2 - /32) imt> ß 0 fürt<ß -——h Uy/t2 - ßA imt>ß 0 für * < ß -^J1(ay/F^p)fuit>ß 0 für t < ß
1102 21 Tabellen Nr. 73 74 F(P) 1 - e~ap P e-ap _ e-ßp P /(*) ( 0 für t > a { 1 für 0 < t < öl ( 0 für 0 < t < öl \ 1 für a < t < ß { 0 für * > ß
21 14 Fourier-Transformationen 1103 21.14 Fourier-Transformationen In den Tabellen vorkommende Symbole sind wie folgt definiert: C: EuLERsche Konstante (C = 0,577215...) 0-t+z-\ m Re 2 > 0 (Gamma-Funktion s 8.2.5,6., S 478), r(z) = J e-Hz~l dt o J (Z) = V l } [2 > (BESSEL-Funktionen s. 9 1.2.6,2.,2., S. 527), Kv{z) = |7r(sinGri/))-1[/-.(^) -/„(*)] mit 1 f cos t e ¦2l7ruJy{ze^lir) (modifizierte BESSEL-Funktionens 9.1.2 6, 2.,3., S 527), dt C(x) = -^= f r V2^J Vi „, x 1 fsin^ , S(x) = -= / —j=r dt } y/2^1 Vi Si(x) = f^dt o t si(z) = -7^dt = Si(x)-|; <*>cos£ Ci(x) = - / —— dt x t (FRESNEL-Integrale s. 14.4 3.2,5., S. 720), (Integralsinus s 8 2 5,1., S. 477), (Integralkosinus s 8 2.5,2., S. 477). In der Tabelle vorkommende Abkürzungen für Funktionen entsprechen den in den Kapiteln eingeführten Definitionen. 21.14.1 Fourier—Kosinus—Transformationen Nr. 1. 2. 3 4. 5. /(*) 1, 0<t<a 0, t> a t, 0<t<l 2-t, l<t<2 0, t>2 0, 0<t<a 1 t > a t 1 Vt —p , 0 < t < a Vi 0, t> a oo Fc(u>) = f f(t) cos{tu)dt 0 sin(ao;) u 4 ( cos u sin2 — j u~2 —Ci(au) PK 1 V2 V5 fW 2C{ouü) V2 y/ö
1104 21. Tabellen Nr. 6 7. 8. 9 10 11. 12. 13. 14 15. 16 17. 18. 19. /(*) 0 0<t<a —7= , t > a Vi (a + t), a>0 (a - £)_1 , a > 0 (a2 + ^2) (a2 -12)'1 b b b2 + (a - *J + 62 + (a + *J a + t a — £ 62 + (a + tJ + fc2 + (a - *J (a2 + ^2)-^ (a2 - £2)~^ , 0 < t < a 0, t> a t~u , 0<Rez/<l e-at e-w _ e-a< t v^e-a< e-at ~7t oo I Fc(a;) = J f(t) cos(tu)dt 0 /7fl-2C(acj) V2 V^ [— si (au) sin(aa;) — Ci(au) cos(acj)] cos(aa;) Ci(au) 4- sin(aa;) ( — + Si {au) 1 TT e-™ 2 a 7T sin(aa;) 2 ü 7T e_6ü; cos(acj) 7T e_öa; sin(au;) a:0 (a^) - JQ (au) sin(^) ra-i/)^-1 a ö2 + cj2 1 , /a2+u;2\ 2ln[WTu^) \pK . 2 2. 3 /3 /^\\ —- (a + u ) 4 cos 1 - arctan ( — 1 1 jW la + (a2+u2)lAl V2 y a2+u2 )
21 14 Fourier-Transformationen 1105 Nr 20. 21 22. 23 24. 25 26. 27. 28 29. 30. 31. 32. /(*) fe-flt tv-\ e-at 1 .1 1 7B + e-at2 1 a * 2e t 3 o £ 2e t Int, o, Int Vt {t2 - a2)-1 (t2 - a2) f ln(l + t) n\b-t\ e~at \nt 0< t < 1 t> 1  ln(tö) oo Fc(u) = f f(t) cos{tu)dt 0 n!a"+1(a2+)~"(n+1) E (-l)m(V~ ^ ("f ™ 0<2m<n+l \2m J \aj r(v) (a2 + lü2)~% cos (i/ arctan ( — 1 J _llnA_e-2-) -^—a 2e 4a /| e->/2a^(cos ^y^j _ sin y/2Öü) J^e-^^cosV^ä^ Si(w) -yr(c+i+ln4w) 7T 1 — - (sin(au;) Ci(acj) — cos(acj) si (aa;)) 7T 1 — - {sin(aa;) [Ci(au) — ln(ab)] — cos(aa;)si(aa;)} 1 2 [(°(!)H"(S)I 1 f 7T — < — [cosFu;) — cos(au;)] + cosFa;) Si (bu) + cos(aa;) Si (aw) — sin(aa;) Ci(acj) - sin(foj) Ci(bu) > c 1 \nC 1 ö Wn2 1 / >2+a;2 [ ' 2 ( ' ~ ;2) +a; arctan (—)
1106 21. Tabellen Nr. 33. 34 35. 36. 37 38 39 40. 41. 42. 43. 44. 45. fW <°(m) In a2 + t2 b2-t2 t \a-tj ln(a2 + *2) v^T*2 >K) In t2 sin(at) t t sin(at) t2 + b2 sin(at) t (t2 + b2) e~bt sin(at) e~l sin£ t sin2 (at) t sin(at) sin(bt) i oo I Fc(lü) = f f(t)cos(tu)dt 0 - (e"^ - e_au;) - (cos(M - e""") — 2 7T si (acj) -[(c + h(£))*0M] l-e_aw 1 7T 1 — cos(aa;) 7T 7T 2' w<0 TT — , lü = a 4 0 , u > a - e~ab coshFa;) , lü < a — — e_6a; tanh(afe) , lü > a ^b-2(l-e~ab coshFu;)), u < a ^b~2 e"^ tanh(afc) , lü > a 1 2 o + u> b2 + (a + LüJ a — lü b2 + (a-LüJ iarctang) J- i- i-4 a;2 (a + bJ - lü2 (a - bJ - uj2
21 14 Fourier-Transformationen 1107 Nr /(*) Fc(u) = f f(t) cos{tcü) dt o 4G. sin2 (at) ~T2 0, üü <2a lü > 2a 47 sin3 (at) - {(u; + 3a) ln(u; + 3a) +(u — 3a) In \uj — 3a| — (lü + a) ln(a; + a) — (a; — a) In \lü — a\\ 48. sin3 (at) ¦ Ca2 - J1) , ,2 4W 16 0, Ca - üjJ 0 < lü < a lü = a a < üü < 3a tu > 3a 49 1 — cos(at) In 50 1 — cos(at) ¦ (a — lü) , 0, 51 cos(a£) b2 + t2 TT e_a6 coshFcj) 2 b 7T e_6a; cosh(a6) 2 6 lü < a lü > a 52 e 6* cos(at) 1 62 + (a-ic/J 62 + (a + a>J 53 e M cos(at) 1 fW az +uü* yje" 46 coshg) 54. t b2 + t2 tan(ai) TT coshFcj)(l + e2afe)- 55. 62 + £2 cot (at) TT cosh(bLü)(e2ab-l)-1
21. Tabellen Nr 56 57 58. 59 60. 61. 62 63. 64. 65. 66 67. 68. Sit) sm(at2) sin[a(l-t2)] sin(at2) t2 sin(at2) t e at* sin(bt2) cos(at2) cos[a(l -12)] e-°<2 cos(bt2) 1 . fa\ -tSm{l) 7rnfi) (*)'-(?) 1 fa\ v*cosU) (^) cosG) Fc(u) =Jf{t)cos(tuj)dt 0 l^¥a{C0S{i)-Sin{^)) 1 /? / i w2\ -2VäcoT+i+iJ 7T 2W K=)-°(=) TT ll 2 |2 K9 • sin 1 nr r 2 V2a [ -]2 r ]+^sin^ + Q <m \ -\au2(a2 + tf 1 /6\ - arctan - 2 ^; cos(£) + sin(£). 6a;2 " 4(a2 + 62)_ 1 fW ( TT U2\ 2VäS1Ha+4 + 4ij • cos -±au,2(a2 + " 6a;2 _4(a2 + 62) b2)-1 i fb\ - arctan - 2 V»A - J0 B v/ötJ) - J^- [sinB VätJ) + cosB y/äü) - e^ i a/^ [sinB yfiü) + cosB Vau) + e~2^"] i \/?~ [cos^2 v^) " sin^2 ^^ + e~2^] i J^ [cosB s/Eü) - sinB Vau) + e~2^]
21 14 Fourier-Transformationen 1109 Nr /(*) Fc(lü) = f f(t) cos(toü)dt 0 69 -_ sin (a y/ij ¦ji °'=)*(=)-»(=)-(= 70 e~bt sm(ay/i) a2u> 3 fuo ______ --arctanf- 71 ¦(a>/t) 4a; / l 4a; 72 —= cosfa yi) Vi TT . TT ÖT u \4 4a; 73 yft sibVi) V5F(a» + wriC-ifl6?(fl2 + fia)'1 62o; 1 /oA — rr — - arctan — a2+o;2 2 \aj 4(a2+o;2) 74 - a y/i os(a y/i) _3 _oi y/Ü a Ba;) 2 e 2u; ^ 75. V* [cos(a y/i) — sin(av^)] e 2w 21.14.2 Fourier—Sinus-Transformationen Nr 1. 2 3 4 /(*) 1 , 0<t<a 0, * >a t, 0<t<l 2-t, l<t<2 0, t>2 1 7 - , 0 < t < a 0 , t > a Fs(uj) = Jf(t) sm{tu)dt 0 1 — cos(ao;) üü 4o;~2 sin _ sin2 ( — ) 7T 2 Si (ocj)
1110 21. Tabellen Nr. 5 6 7. 8. 9 10 11. 12. 13 14. 15 16 17. 18 f(t) 0, 0< t <a -, t>a 1 vi -7=, 0 < t < a Vi 0, t > a 0, 0<* <a 1 —f , t > a Vi ($ (a + t) (a>0) {a-t)~l (a>0) t a2 + t2 (a2 - *2)-1 6 6 62 + (a - tJ 62 + (a + *J a 4-1 a — t b2 + (a 4-1J 62 + (a - tJ * a2-*2 1 t (a2 -t2) 1 t (a2 +12) Fs(lj) =Jf(t)sin(tuj)dt 0 — si (au;) /7T 1 V2 75 /7f 2 ^(aa;) V2 v^J fW 1-2 S(au) V2 ^ \Ztt2u [sin(au) Ci(aa;) — cos(aa;) si (au)] sin(aa;) Ci(aa;) — cos(au) ( - + Si(acj)) 2 - [sin(ac<;) C\(au) — cos(au) Sifaa;) 7T e_öw sin(au;) 7T e_6w cos(au;) — — cos(aa;) 7T 1 — cos(aa;) 2 S TT l-e-™ 2 a^
21.14 Fourier-Transformationen 1111 Nr 19 20 21 22 23 24. 25. 26. 27 28 29 30 31 /(*) r*\ 0<Rez/<2 e-at e-at g-a* _ e~bt t2 Vte~at e-at ~7t tn e-at 4.1/—1 p—at e-\l {l - e-1)-1 te~at2 1 o t 2 e t 3 a t e~t Int, 0 < t < 1 0, Ol oo ¦F-M = J f(t)sm{tu)dt 0 cos(t0 J^1-")"" u 12+U2 arctan f — J 1 , (b2 + uj2\ , /oA /oA' - u In — + b arctan — 1 — a arctan — 2 \a2 + Lü2J \b J \aJ \ft / 2 2x-^ • T3 fU\] [a + u ) 4 sm - arctan — 1 2 v y L2 WJ | (a2+u;2J -a\ l a2+u;2 1 m = o \2ra + l) \aj r(u) (a2 + o;2)-^ sin v arctan ( — J — - tanhGru;) V a 4a JL e-\/2a^ [cos ^2Öüü + sin \/2äcJ] V 2üj f^e-V2^ Siny/2äw Ci(uj)-C~\nu tu
1112 21 Tabellen Nr. 32. 33. 34. 35 36 37. 38. 39 40. 41 42 43. 44. /(*) In* Int t(t2-a2)~l ln(to) t(t2-a2)-l\n(-) a e~at \nt i la + *l lnl^7| i la + *l In \a — t\ 1 /a + A2 , (a2 + t2 + t\ In f2 lnfg2 + (" + *H - lnll -a2t2| iln t 1-* t2 OO 1 Fs(u) = J f(t)sm{tu)dt 0 ~(C + lnw) V2w 12 J 7T — [cos(au;) (ln(afr) — Ci(aa;)) — sin(aa;) • si(aa;)] 7T — — [cos(aa;) Ci(au) + sin(au) si (au)] a' + u1 L Va/ 2 J — < In ( - 1 + cosFa;) CiFa;) — cos(aa;) Ci(au) + sin(öa;) Si(foj) — sin(acj) Si(au;) +— [sinFu;) 4- sin(aa;)] \ — sm(aa;j u 2ir — [1 — cos(au) — au si(au)] a 2tt -uJJ^\ . (u\ u \2J 2 — [C + \n(au) — cos(au) Ci(au) — sin(ac<;) Si(aa;)] u 2n — e-™ sin(bu) u -a(!) 7T [C + \n(au) - Ci(acj)]
21.14 Founer-Transformationen 1113 Nr. 45 46 47. 48. 49. 50 51 52 53 54. /(*) sin (ai) t sin(at) t2 sm(irt) 1-t2 sm(at) b2 + t2 e~bt sin(at) e~bt sin(at) t e~bt2 sin(at) sin2 (at) i sin(ai) sin(bt) t sin2 (at) T2 oc ¦F-M =If{t)sm{tu)dt 0 1 , la; + al - In 2 la; — al TT — lü , 0 < lü < a TT — a , to > a 2 sina; , 0 < lü < tt 0, LÜ>TT tt e~ab — —— tanhFa;) , 0 < lü < a 2 b tt e'0" — —— tanh(aö) , lü > a h 1 1 62 + (a-a;J 62 + (a + a;J 1 /62 + (a; + aJ\ 4 nV62 + (a;-aJy 1 fW 1 a2+u;2 , faU\ _^_e-5 b tanh(_j - , 0 < lü < 2a 4 TT 0 . a; > 2a 0, 0<a;<a-6 7T — . a — b < lü < a + b 4 0 , a; > a + b - \(lü + 2a) ln(a; + 2a) -\-(lü — 2a) In \lü — 2a| — -lü Ina;
1114 21. Tabellen Nr. 55 56. 57. 58. 59. 60. 61. 62. /(*) sin2 (at) cos(at) t t cos(at) b2 + t2 sin(at2) sin(at2) t cos(at2) cos(a£2) t e-aVi sm(a^) oo Fs(lü) = f f(t) sm{tu)dt 0 TT ( Lü\ -lü 12a- -J , 0 < u; < 2a TT o — a , lü > 2a 0 , 0 < lü < a TT — , lü = a 4 TT -, u>a - | e~ab tanhFu;) , 0 < lü < a — e-6u; cosh(afr) , lü > a Wa TT 2 ™(s)c(s)+'ta(s) K=H(=I nr V 2Ö TT 2 A HSM9-»© m+>m ~ a _«i 2üü y/üJ ° «(£)] *(=): 21.14.3 Fourier-Transformationen Obwohl die FOURIER-Transformation F(lü) durch die FOURIER-Kosinus-Transformation Fc(uj) und die FOURIER-Sinus-Transformation Fs(cj) gemäß A5 76a) in 15.3.1.2,2.,3., S 749 darstellbar ist, werden hier noch einige FOURIER-Transformationen F(lü) direkt angegeben Nr. 1 2. 3. /(*) S(t) (DlRACsche ^-Funktion) 6^(t) 6^{t-a) oo F(u) = f e-**f(t)dt —oo 1 Mn (iu;)ne-iaa; (n = 0,1,2,...)
21 14 Founer-Transformationen 1115 Nr 4 5 6. 7 8 9. 10 11 12 13 14 15 16 17 18 19 20 /(*) 1 tn H(t) = 1 für t > 0 H(t) = 0 für t < 0 (HEAVlSiDEsche Sprungfunktion s. 15 2 1.3, S. 737) tnH{t) e~at H(t) = e~at für t > 0 e-ai # (*) = 0 für t < 0 1 r-tVDa) V47ra J_P-«KI 2a ' 1 t2 + a2 t t2 + a? H(t + a)-H(t-a) = l für \t\ < a H(t + a)-H(t-a) = Q für \t\ > a eiat cos at sin at 1 cosht 1 sinh£ sin at2 cos a£2 oo F(lj) = f e-'^ f{t) dt —oo 2ttö(u) 2?rin^n)(cj) (n=l,2, .) — + 7tS(lü) ILO -^ + *in8W{u>) (n = l,2, ) —— (a > 0) e~auj2 (a > 0) -^—ä (a>0) üü2 + a2 a —i7re-a'w'signa; 2 sin au; 2tt5(uj — a) tt[ö(lü + a) 4- £(cj — a)] i7r[<5(a; + a) — £(u; — a)] 7T . 7TO; cosn — 2 7ra; —i7r tanh — £(=??) (•>•> ß(=-s) <•>»>
1116 21. Tabellen 21.14.4 Exponentielle Fourier—Transformationen Obwohl die exponentielle FOURIER-Transformation Fe(u) gemäß Fe(u) = -F(—u) (s. A5.77b) in 15.3.1.2,2.,3., S. 749) durch die FOURIER-Transformation F(u>) darstellbar ist, werden hier noch einige exponentielle FOURIER-Transformationen direkt angegeben. Nr. 1. 2 3. 4. /(*) f(t) = o 1 (a + it)" 1 (a-ity für a <t <b sonst für 0 < t < b sonst (n = l,2, .) Rei/>0 Re^ > 0 Fe(u>) =\ J f{t)e**dt —oo id(^_^) 1 2 n!(-iu;)-(n+1)-ei^y: —t (-iu)™-"-1 bm -^— tu e-™ für u > 0 r{y) 0 für uj < 0 0 für u > 0 r ^_ (-w)"-1 e^ für w < 0
21.15 Z-Transformationen 1117 21.15 Z-Transformat ionen Definition s 15 4.1.2, S. 757, Rechenregeln s. 15 4.1.3, S 758, Umkehrung s. 15.4 1.5, S. 760 Nr Originalfolge fn Bildfunktion F(z) = Z(fn) Konvergenzbereich ("l)n an 10 11 12 13 14 sin bn cos bn z z-\ z z + l (z-iy 2B + 1) B - 1K z(z + 4z B-1 z z - ea z + 1) L (z- az(z (*- (z- aJ + a) -af z l)k+i ('+')' z2- z z2- z sin b 2z cos ' z — cos 2z cos b+1 b) 6+1 > 1 > 1 > 1 > 1 > 1 >\ea\ >\a\ >0 >\a\ > 1 >0 > 1 > 1
1118 21 Tabellen Nr. Originalfolge fn Bildfunktion F(z) = Z(fn) Konvergenzbereich 15 16 17 18 19 20 21 22 23 24 25 26 27 28 ean sin bn ean cos 6n sinh bn cosh 6n an sinh bn an cosh 6n /„ = 0 für n^ k, A = l /2n — 05 /2n+l = 2 /2n = 0, /2n+1 = 2Bn + l) /2n = 0, 9 /2n+l — 7i7T COS 2 (n + l)ean pt(n+l) _ po(n+l) 2n + l z2 z2 z2 z2 z2 zea sin b - 2zea cos & + e2a z(z — ea cos 6) — 2zea cos 6 + e2a z sinh 6 — 2z cosh 6+1 2B — cosh b) — 2z cosh 6+1 za sinh 6 — 2za cosh 6 + a2 2B — a cosh 6) 22 — 2za cosh 6 + a2 22 22-l 2z(z2 + 1) (z2 - lJ 2-1 In 2 + 1 (n- l)ra(n + l) 22+l z2 B-e«J 22 B - ea) B - 22 -eb) B-1L >|e»| >|e*| > max(|eb|,|e-6|) >max(|e5|,|e-6|) > max(|ae6|,|ae~6|) > max(|ae6|,|ae~6|) >0 > 1 > 1 > 1 > 1 >M > max(|ea|,|e6|), a^b z\ > 1
21.15 Z-Transformationen 1119 Nr. 29 30 31 Originalfolge fn /o = 0, fn = -, n>\ n (-i)" Bn + 1)! (-1)" Bn)l Bildfunktion F(z) = Z(fn) 1„^- 2—1 ,- . 1 wz sin —= 1 COS -7= Konvergenzbereich \z\>\ |z| >0
1120 21. Tabellen 21.16 Poisson-Verteilung Wertetabelle der PoiSSON-Verteilung P(X = k) = — e~x (s auch 16.2.3.3, S. 780V k k 0 1 2 3 4 5 6 7 A 0,1 0,904837 0,090484 0,004524 0,000151 0,000004 0,2 0,818731 0,163746 0,016375 0,001091 0,000055 0,000002 0,3 0,740818 0,222245 0,033337 0,003334 0,000250 0,000015 0,000001 0,4 0,670320 0,268128 0.053626 0.007150 0.000715 0,000057 0,000004 0,5 0,606531 0,303265 0,075816 0,012636 0,001580 0,000158 0,000013 0,000001 0.6 0,548812 0,329287 0,098786 0,019757 0,002964 0,000356 0,000035 0,000003 k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 A 0.7 0,496585 0,347610 0,121663 0,028388 0,004968 0,000696 0,000081 0,000008 0,000001 0,8 0,449329 0,359463 0,143785 0,038343 0,007669 0,001227 0,000164 0,000019 0,000002 0,9 0,406570 0,365913 0,164661 0.049398 0,011115 0.002001 0,000300 0,000039 0,000004 1,0 0,367879 0,367879 0,183940 0,061313 0,015328 0,003066 0,000511 0,000073 0,000009 0,000001 2,0 0.135335 0.270671 0,270671 0.180447 0.090224 0,036089 0,012030 0,003437 0,000859 0,000191 0,000038 0,000007 0,000001 3,0 0,049787 0,149361 0,224042 0,224042 0,168031 0,100819 0.050409 0,021604 0.008102 0,002701 0,000810 0,000221 0,000055 0,000013 0,000003 0,000001
21.16 Poisson-Verteilung 1121 (Fortsetzung) k 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 A 4,0 0,018316 0,073263 0,146525 0,195367 0,195367 0,156293 0,104194 0,059540 0,029770 0,013231 0,005292 0,001925 0,000642 0,000197 0,000056 0,000015 0,000004 0,000001 5,0 0,006738 0,033690 0,084224 0,140374 0,175467 0,175467 0,146223 0,104445 0,065278 0,036266 0,018133 0,008242 0,003434 0,001321 0,000472 0,000157 0,000049 0,000014 0,000004 0,000001 6,0 0,002479 0,014873 0,044618 0,089235 0,133853 0,160623 0,160623 0,137677 0,103258 0,068838 0,041303 0,022529 0,011264 0,005199 0,002228 0,000891 0,000334 0,000118 0,000039 0,000012 0,000004 0,000001 7,0 0,000912 0,006383 0,022341 0,052129 0.091126 0,127717 0,149003 0,149003 0,130377 0,101405 0,070983 0,045171 0,026350 0,014188 0,007094 0,003311 0,001448 0,000596 0,000232 0,000085 0,000030 0,000010 0,000003 0,000001 8,0 0,000335 0,002684 0,010735 0,028626 0,057252 0,091604 0,122138 0,139587 0,139587 0,124077 0,099262 0,072190 0,048127 0,029616 0,016924 0,009026 0,004513 0,002124 0,000944 0,000397 0,000159 0,000061 0,000022 0,000008 0,000003 0,000001 9,0 0,000123 0,001111 0,004998 0,014994 0,033737 0,060727 0,091090 0,117116 0,131756 0,131756 0,118580 0,097020 0,072765 0,050376 0,032384 0,019431 0,010930 0,005786 0,002893 0,001370 0,000617 0,000264 0,000108 0,000042 0,000016 0,000006 0,000002 0,000001
CO00-JOSCn4^C0KDH-*O oooooooooO boooooooooooooooooOO ooooKi-qssi-siooiOl WHtOS^t000005|t OOOOÜCOOOffiüiy wwwwwcowwcow oooooooooO H-h-H-il-il-'OOOO© in CT Üi Ol Ol Cn Cn Üi CT Ül CDOOSOiÜl^WtOi-' O ooooooooop ^tOHOcooo-siaT^M MCOOOOJ^tOOSIOHj -vi^-q^-j^-q-vi-a^i CDOOSOiCn^WtOMO oooooooooO O^OOOüiCnCnCnüiÜl COOO-JCiCTi^WtOMO oooooooooO cocococococococococo ~<i —j -^i -<i —<i -<i —j —a —a ^^ OiCSüicn^wcotoi-'i-i SH050J^OOM05CDw OOOOOOOOOO oooooooooO boooooooooooboöoöoOo OiÜiCTiCTÜiCn^^^i^ M©SClC0O00 05C0H h-'CD^^MOoaii-'OOw tototototototototoio CDOO-nIOIÜiMUiMho oooooooooO coöoöoooboooboboboOO OCOCOCOCOCOCOOOOOOO HCOOOOl^tOOOOO^ ÜlSOtO^CiSIOOCD© oooooooooO COCOtOKDKDKDKDKDtOM mOÜ-nI05ÜiWMO@ CDOiWCDCTHaitOHio OSOsOSOSOSOSOSOSOsOS CDOOSIOiOli^COKJi-'O oooooooooO cocococDbcDcocobö ÜiÜiCTÜiCT^^^^i^ ÜiCrCnüTCnCn^^Wto booobooooooooooooooo COOOSOiÜl^COtOi-'O oooooooooO cocobcocococococo© H je« H je. H j& H je. H jSj o o CO 00 o o Cn Cn -vi -vi Cn i-1 CO 4^ o o co co CO OO o o CS OS Cn rfs» 1—' 00 -a o o o Cn cn CO 00 o o -vi -i to i—i KD CO 4^ O o o -vi -vi CO 00 o o -vi -vi 00 OO Cn KD to co o o CO CO CO 00 o o 00 00 CO CO OO OS CO Cn o -vi o Cn OS -vi Cn o CO -vi o CS 4^ 4^ CO o Cn "Vi o -vi CTl -v| o -vi -vi o -vi -vj CO 4^ o CO -J o 00 CO 4^ o o OS o Cn OS CO OS o CO os o CS 4^ o es o Cn OS o -vi kd CO o -vi OS o -vi -v| OS 4^ o CO Os o 00 CO Cn o Cn o Cn Cn CO OS o CO cn o CS CO cn O0 o Cn Cn o -vi o (X) OO o -4 Cn o -vi -vi CO 4^ o CO Cn o OO KD OO CO o 4^ o Cn C7\ Cn -4 o CO rf^ o CS CO CO 1—1 o Cn 4^ o -vi o Cn 4^ o -vi 4^ o -vi -vi o 4^- o CO 4^ o 00 kd OS 4^ o CO o Cn C71 -v| o CO CO o OS ro CO CO o cn CO o -vi o CO o -vi CO o -vi OS -vi CO o CO CO o OO KD CO OO o to o cn 4^ -vi 00 o o t—' o cn o o o Cn 4^ W CO OO o CO 00 o CO CO CO to o OS to cn Cn o Cn to o OS co <x> Cn o -vT to o -vi OS 4^ to o CO to o oo to to 1-1 o OS to -vi o Cn 1-1 o OS CO cn o o -vi *-* o -vi OS 1-1 o CO 1-1 o oo oo OS o o 05 l-L <1 CO o Cn o o CS CO M cn o -J o o -J Cn on o o CO o o oo Cn co o o co o cn CO Cn co o to CO o CT) 4^ 1-1 o 4^ CO o OS 00 -vi CO o OS CO o -vi Cn 4^ CO o oo CO o Oo co co o o 00 o cn CO CO o KD 00 o OS o CO o 4^ 00 o OS (X) 4^ 4^ o os 00 o -vi Cn -vi o 00 00 o oo o os o o -vi o cn KD -vi co o to -vi o os o OS 4>- o 4^ -vi o C7S <x> o 00 o os -vi o -vi 4^ (X) OS o 00 -vi o 00 o -vi CO o o OS o Cn kd CO CO o KD OS o OS o to OS o 4^ OS o OS -vi -v| to o OS OS o -vi 4^ cn d*> o 00 OS o 00 o Cn 1-1 o o Cn o Cn CO CO o IO Cn o Cn CO oo -vi o 4^ cn o os -vi CO OS o os Cn o -vi 4^ to to o 00 Cn o 00 o to CO o o o o o o 4^ CO tO o Cn OS o o KD 4^ o cn co 4^ oo o 4^ J^ o os -vi o o o OS 4^ o -vi CO (X) co o 00 4^ o -vi CO CO Cn o Cn to o o to CO o cn CO 1—' o o 4^ CO o OS OS OS 4^- o OS CO o -vi CO Cn -vi o 00 CO o "Vi CO OS -vi o cn <D (X) o o to to o Cn o o h-1 o cn o 4^ o o to 1-1 o C7\ o o o o Cn o o o o K3 o o Cn 00 00 -<I "vi o 4^ to o OS C7S KD 00 o OS to o -vi CO KD 4^ o oo to o -vi CO CO CO CO to o 4^ 1-1 o OS cn CO o os 1-1 o -vi KD CO 1-1 o oo 1-1 o -vi CO o CO CO o a^ o o OS Cn <?T\ ^ o OS o o -vi h0 cn -vi o 00 o o -vi (X) (X) 1-1 H ¦e. (X) H •e. H H ¦e« H H •©. H H •e. vS to M h-1 -4 M 2 0 3 CD •-S te Norma lvert ro 1-rf» c c OQ a> Ca o o o IA 8 IA M CO CO ö "D 31 o der i o rmier 3 •z ormalverteil ^ p cm Cß ,__! OS to 4^ KD oo -vi 00 KD to M M ^1 0 >-t B ro •-s rt- ro Normal < ro •-S e+ (D c ö QTQ
tototototototototofco oooooooooO cocococococococococo OOOOOOOOOOOOOOOOOOOO cocococococococococo cooosiaiüi^wioi-'o oooooooooO cocococococococococo cococococococooooooo t-'i-'i—' O O O O CO CO CO tOtOtOtOtONObOtOtOfcO oooooooooO cocococococococococo cocococococococococo tOHtDOOOJÜlOOHOoo tObOtOtOtOtOtOtObOfcO oooooooooO cocococococococococo cocococococococococo ^COtOMOCDOO-slOlüt tototototototototojO cocococococococococo ooopopooop cocococococococococo cocococococococococo OOOOOOOOOOOOOOOOOOOO totototototototototO OOOOOOOOOO oooooooooO cococococococoococo 0O0OO00OK(-^^(--J^S i—' i—'OOCOOOOOO-a^J -^tooocooocooccoooto totobotototototototo COOO-JOCn^COtOi-'O oooooooooO cocococococococococo OOOOOOOOOOOOOOOOOOOO COOOOOOO-vJSS0^0505 OSt^MOOCnMOO^i^ cooo-qaicnj^cotsDi—» o oooooooooO cocococococococococo cocococococococococo WCOWWtOtOtOtOtOM a^bOHCOSCTtOOoo tOtsOtOtsDtOtOtOtOtOtO OiOiÖiCiCTiCTiOO^OOi COOO-sIOiCn^COtOi—' © oooooooooO cocococococococococo cocococococococococo O^OiCTiOasCnCncncnül iMWtOHOCO^OlÜicj tototototototobotofco OOOOOOOOOOOOOOOOOOOO COOO-NlOiC^rf^COtOi—'O ooooooooop cocococococo-cocococo cocococococococococo 0000-v|-J-<|-<1-<1-<|-nIK| Hocoooo^-sicrioi^ H JS ^ H JS ^ H je* H ^ ^ w je CO CO H-» O o o 0 9987 0 9990 3.2Ö1 3 30 0 9993 0 9995 3.40 3.50 0 9997 0 9998 3 60 3.70 0 9998 0.9999 CO CO CO 00 o o 6666 0 6666 0 H je* w ^ h H je« H Ä ^ B
1124 21. Tabellen 21.18 x2-Verteilung Die Formel der x2~Verteilung s 16.2 4.6, S. 785 X2-Verteilung. Quantile x2,, Anzahl der Frei- heits- grade m 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 0,99 0,00016 0,020 0,115 0,297 0,554 0,872 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26 8,90 9,54 10,2 10,9 11,5 12,2 12,9 13,6 14,3 15,0 22,2 29,7 37,5 45,4 53,5 61,8 70,1 Wahrscheinlichkeit a 0,975 0,00098 0,051 0,216 0,484 0,831 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59 10,3 11,0 11,7 12,4 13,1 13,8 14,6 15,3 16,0 16,8 24,4 32,4 40,5 48,8 57,2 65,6 74,2 0,95 0,0039 0,103 0,352 0,711 1,15 1,64 2,17 2,73 3,33 3,94 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,1 10,9 11,6 * 12,3 13,1 13,8 14,6 15,4 16,2 16,9 17,7 18,5 26,5 34,8 43,2 51,7 60,4 69,1 77,9 0,05 3,8 6,0 7,8 9,5 11,1 12,6 14,1 15,5 16,9 18,3 19,7 21,0 22,4 23,7 25,0 26,3 27,6 28,9 30,1 31,4 32,7 33,9 35,2 36,4 37,7 38,9 40,1 41,3 42,6 43,8 55,8 67,5 79,1 90,5 101,9 113,1 124,3 0,025 5,0 7,4 9,4 11,1 12,8 14,4 16,0 17,5 19,0 20,5 21,9 23,3 24,7 26,1 27,5 28,8 30,2 31,5 32,9 34,2 35,5 36,8 38,1 39,4 40,6 41,9 43,2 44,5 45,7 47,0 59,3 71,4 83,3 95,0 106,6 118,1 129,6 0,01 6,6 9,2 11,3 13,3 15,1 16,8 18,5 20,1 21,7 23,2 24,7 26,2 27,7 29,1 30,6 32,0 33,4 34,8 36,2 37,6 38,9 40,3 41,6 43,0 44,3 45,6 47,0 48,3 49,6 50,9 63,7 76,2 88,4 100,4 112,3 124,1 135,8
21 19 Fishersche F- Verteilung 21.19 Fishersche F—Verteilung Die Formel der FlSHERsehen F-Verteilung s. 16.2.4.7, S. 785. FiSHERsche F-Verteilung Quantile /a,„ , für c :0,05 rri2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 125 00 1 161,4 18,51 10,13 7,71 6,61 5,99 5.59 5,32 5,12 4,96 4,84 4,75 4,67 4,60 4,54 4,49 4,45 4,41 4.38 4,35 4 32 4 30 4,28 4.26 4,24 4,23 4,21 4,20 4,18 4,17 4.08 4.00 3.92 3,84 2 199.5 19,00 9,55 6,94 5,79 5,14 4,74 4,46 4,26 4.10 3,98 3.89 3,81 3,74 3,68 3,63 3,59 3,55 3,52 3,49 3,47 3,44 3,42 3.40 3,39 3,37 3,35 3,34 3,33 3,32 3,23 3,15 3,07 3,00 3 215,7 19,16 9,28 6,59 5,41 4.76 4.35 4,07 3,86 3.71 3,59 3,49 3,41 3,34 3,29 3,24 3,20 3,16 3,13 3 10 3,07 3,05 3,03 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,84 2.76 2.68 2,60 4 224,6 19,25 9,12 6,39 5,19 4.53 4,12 3,84 3.63 3,48 3,36 3,26 3,18 3,11 3,06 3,01 2,96 2.93 2.90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,73 2,71 2,70 2,69 2.61 2,53 2,44 2,37 5 230,2 19 30 9,01 6,26 5,05 4,39 3,97 3,69 3,48 3.33 3,20 3,11 3,03 2,96 2,90 2,85 2,81 2,77 2,74 2,71 2.68 2.66 2,64 2.62 2,60 2,59 2,57 2,56 2,55 2,53 2,45 2,37 2,29 2.21 Tfl\ 6 234,0 19,33 8,94 6,16 4,95 4.28 3.87 3,58 3 37 3,22 3,09 3,00 2,92 2,85 2,79 2.74 2,70 2.66 2,63 2,60 2,57 2,55 2,53 2,51 2,49 2,47 2,46 2,45 2,43 2,42 2,34 2,25 2,17 2,10 8 238,9 19,37 8,S5 6.04 4,82 4,15 3,73 3,44 3.23 3,07 2,95 2,85 2,77 2,70 2,64 2,59 2,55 2,51 2,48 2,45 2,42 2,40 2,37 2,36 2.34 2,32 2,31 2,29 2,28 2,27 2,18 2,10 2,01 1,94 12 243,9 19,41 8,74 5,91 4,68 4,00 3,57 3,28 3.07 2.91 2,79 2.69 2,60 2,53 2,48 2,42 2,38 2,34 2,31 2,28 2,25 2,23 2,20 2,18 2,16 2,15 2,13 2,12 2,10 2,09 2,00 1.92 1,83 1,75 24 249,0 19,45 8,64 5.77 4.53 3,84 3,41 3,12 2,90 2,74 2,61 2,51 2,42 2,35 2,29 2,24 2,19 2.15 2,11 2,08 2,05 2,03 2,00 1,98 1,96 1,95 1,93 1,91 1.90 1,89 1,79 1,70 1,60 1,52 30 250,0 19.46 8,62 5,75 4,50 3,81 3,38 3,08 2,86 2.70 2,57 2.47 2,38 2,31 2,25 2,19 2,15 2,11 2,07 2,04 2,01 1,98 1.96 1,94 1,92 1,90 1,88 1,87 1,85 1,84 1,74 1,65 1,55 1,46 40 251,0 19,47 8,59 5,72 4,46 3,77 3,34 3,05 2,83 2,66 2,53 2,43 2,34 2,27 2,20 2,15 2,10 2,06 2,03 1.99 1.96 1,94 1,91 1,89 1,87 1,85 1,84 1,82 1,80 1,79 1,69 1,59 1,49 1.39 oo 254,3 19,50 8,53 5,63 4,36 3,67 3.23 2,93 2,71 2,54 2,40 2,30 2,21 2,13 2,07 2,01 1,96 1,92 1.88 1,84 1,81 1,78 1,76 1,73 1,71 1,69 1,67 1,65 1,64 1,62 1.51 1,39 1,25 1,00
£ 8 o TP o CO TP CM CM i—l OO CO LO Tp CO CM CO O (N CO CO iO rH ^P CO CT CO CO CT CN rH tv b- H ^P 00 TP TP tV co CT co co ct cm rH rH l>- O TP CO TP LO 00 CO CT CO CO LO CO O CO CO TP CO CT CO CT CO CO CT CM rH COM ION O TP O CO OKNH rH IV CT O oo co tp oo LQ CT IV TP Cft (N H CT CO i—l r-l LO CO CT CM lO O) N lO Ol IN H CO CO CM LO lo ct oo lo 0)(NH LO LO i—1 00 (NNNOl LO CT 00 LO OKMH co tv co ct CD rH TP CO io ei ei co CT CM i—i CT) O CM O CT) O 00 O ^©ooo CT CO rH CM O CM O LO LO rH CM ^00^ H CT CO CM 1—I CM CO TP CM O CT CT CM CT 00 co CT IV tP CT CT 00 CT CT CM O IV CO o T—t IV CT O i—i CT CO i—I rH CO O CM r—t IV CM CO rH CO CM CO r—t LO OO oo co TP IV co CM IV CO IV CM lV IV o 00 IV TP 00 LO IV 00 LO T-t CT 00 tv CT CM CT O ff CO CO LO CO LO CT LO CT CT LO IV O co IV TP CO TP oo CO CT tv CO TP IV LO 00 IV LO TP 00 LO LO CT LO CM CM IV CO oo TP CM LO o CM LO 00 CM LO IV co LO CO o CO IV co CO co CO co o IV CT LO tv LO co oo CO CM i—i oo CO TP tv LO TP LO CO TP CO IV tP 1—1 LO tV tP LO o 00 LO CO o CO CM TP CO CT CT CO CM O oo CO LO o r—t CT CT CO IV rH TP LO CM TP CO CO TP rH IV TP CO o LO CT CO LO TP co LO CT CT LO LO LO CO CO LO IV TP o o rH o CD CO co co 00 CO TP CT CO CM o TP o TP TP TP |V TP IV o LO CM CO LO IV CO LO CM CM CO CM tv LO co CT i—( CO CO co CM CO CO o IV co 00 IV co CO T—t TP o LO TP CM oo TP co o LO rH TP LO LO CT LO CO CT CO CO CO CT CM CO co co TP CO LO CO CT LO CO CO CT CO O CO TP CM CO TP CO 00 TP CM LO TP IV LO o IV CO IV o CT CO o o CO IV CM CO LO CO CO CO TP co o 00 CO TP rH TP co TP TP o IV tP TP o LO CO LO LO LO CO CO 00 00 TP IV OO CM CO rH CO CM CO CT CM co IV CO co o o TP CN CO TP CO LO TP CT 00 TP CM TP LO CO co co 00 CO oo LO LO IV CM CM o CO o CO oo i-H CO LO LO CO CT 00 CO o CM TP TP TP TP IV tv TP CT CM LO co CM co CO LO oo CO LO CO CM CM CT CM O o CO 00 o CO co TP CO CT IV CO o TP TP co TP IV CO TP oo LO T—t co o TP 00 IV IV LO CM TP 00 CM CM CT CM O o CO IV CO CO tv CO o TP LO CM TP 00 LO TP CT o LO o co CT CM 00 00 CT ^P CM co IV CM TP 00 CM CM CT CM O CO CO CO co CO TP CT co IV TP o LO TP o LO CO CT LO 00 00 CT CM TP CM CT CO CM 00 IV CM CO 00 CM CO CM CO CO LO CO IV 00 CO o TP CO TP TP TP CT TP LO 00 LO o 00 o CM CO CO CM TP CO CM CM tv CM o 00 CM IV co LO CO 00 CO TP o TP IV CO TP IV oo TP 00 tv LO CM o 00 CM CO CM 00 LO CM IV co CM LO IV CM CM co LO TP CO co IV CO CO CM CM TP LO CM CM CO CM O IV CN IV o co rH TP CO 1—1 tv co CT TP CT CT CO CO TP CM 00 TP CM tv LO LO CT IV CM CM co CO CM TP CO IV TP CO CO LO 00 oo N CO CM CM CM CT TP CM 00 LO CM CO CO CM co o CO CO CO CO IV CO co o CT co CM CM TP CM tv TP CO LO CM oo IV TP CM IV CM LO TP CM TP LO CM CM CO CM CT CT CM CM CO co co CO co CO 00 co oo TP oo CO TP tv LO LO IV tv IV LO CM CO CM CM TP CM O LO CM 00 LO CM CO CT CM CT CM CO CT LO CO CM 00 CO TP rH TP TP CO TP CO LO LO CM IV IV CO CM CD CM 00 CO CM IV TP CM LO LO CM CO CT CM CO CM CO CO LO CO oo IV co J—t TP o CO TP CT TP LO 00 CO IV IV CM CO CD CM LO co CM TP TP CM CM LO CM O CT CM CO CM CO co LO CO co IV co IV o TP IV LO TP LO TP LO TP CO IV oo CM CO o CM CO CO CM TP CM CT TP CM IV 00 CM o CM CO o LO CO CO IV co TP o TP TP LO TP CM TP LO o CO IV CT CM CD CM O CO CM 00 CO CM IV TP CM TP 00 CM IV co IV TP CO o IV co CM o TP LO TP CT CO LO CO LO IV o CO CO oo r"H T—i CM o CM CM CT CM CM co CO CM CT CT CM CT CM CO 7—i LO co CO 00 CO CO TP 00 I—1 LO T—i co IV o TP o CO rH TP CT ^ CO o CM CM CM o LO CM CM 00 CM CM co TP CO CO LO CO CO co T—1 TP 00 CT TP 00 o IV o CO tv O CO CD rH rH LO CT IV LO rH rH LO O 00 IV T—t rH TP CT CT IV H ^ CO 00 CO rH CM CM CO rH CO LO CM CM LO O CT 00 CM CM IV CM rH O CO CO 00 CM TP CO CO CO TP 00 CT IV co co 00 O IV CO TP TP TP CO oo co co co LO O CM O
bc • pH 0) ¦+J Sh 0) > 1 so ^H ü CO -H ö 0) T5 S 00 ^ 16.2 CO b0 C CD ert > Ö JÖ TSC ?: w u H C/J O* bn ilun -£ CD >> -li O sch H DEN £> CO bC Ö 3 Tn Fragest« CD '¦+3 ise 1 tSJ f-i ö ichkei inl che Wahrs Lnzahl er Frei- eits- rade 1 << T5 ^ bC O O o" CM O o o" o o CM o o" LO o o" 0,10 *^- r-H CO O CO Ol CO CO N rH (N 00 CD COCOH CO CO CM b- Ol CO CO CM r-i 00 OOCNONlO i-i CM i-i CO CM TP O CO NC0 00©O CO Cß iO ^ ^ CO (M N ^ LON 00 Ol LO b- CO H CO ^ CO CO co O00 00N t^ CO i-H t^ LO^ CM" Tp" CO" CM" CM" i-i CM LO CO i—i CO^ Ol C0_ H O^ co" cm" cm" cm" cm" r-H CM CO TP LO CO O tP 00 Ol O) "^ O N iO io in io -^ ^ i-i Ol O O tP CNNlOCOH LO TP TP TP tP HOÜION NiOCOlN H CO CO CO CO CO TP O O CM CO HOO00N CO CO CM CM CM LO CO i—( CO CO Tp_ CO CO^ CM^ CM^ cm" cm cm" cm" cm" TP Ol CO CO i—i o^ oq^ oq^ oq_ oq_ CO b- 00 Ol O TP CM CM TP b- tP CO CM i—i O tP tP tP tP tP co co m Ol co OO5 00NN tp co co co co h LO h co in i—i o o oi oi CO CO CO CM CM CM 00 LO CM O b- CO CO CO CO CM CM CM CM CM O 00 CO TP CO cm' cm" cm" cm" cm" O 00 b- CO LO °q. b-^ b-^ b-^ b-^ i—1 CM CO TP LO t-H CO O Ol TP CO Ol LO CO CO CO CO CM O Ol Ol CM CM 00 b- LO LO CM CM CM t-H cm" cm' LO TP b-b- CO b- CM 00 LO Ol 00^ 00^ co" co" co" t-H 00 LO CO LO LO CO CO CO 00 CO LO 00^ 00^ 00^ cm" cm" cm" LO TP CO LO LO LO CM CM CM OOOl cm" cm" cm" co co co b-^ b-^ b-^ 00 Ol O CM Ol b- TP CM 00 b- b- b- b- CO CO CO CO CO CO i—1 Ol b- LO LO LO TP TP TP CO CO CO CO CO CO CM i-H O Ol 00 00 00 00 b- CM CM CM CM CM CM t-H O Ol Ol LO LO LO TP TP CM CM CM CM CM 00 b- b- CO CO o_ o^ o^ o^ o^ cm" cm" cm" cm" cm" CM CM t-H t-H t-H b-^ b- b-^ b-^ b-^ i-H CM CO TP LO CM CM CM CM CM i—1 Ol CO CO LO b- CO CO CO CO CO CO CO CO CO TP CM O O Ol Tp tP tP tP CO CO CO CO CO CO 00 b- CO CO LO b- b- b- b- b- CM CM CM CM CM 00 b- CO CO CO CM CM CM CM CM CO LO LO LO TP R R R R R cm" cm" cm" cm" cm' »-H H O O O b-^ b-^ b-^ b-^ b- CO b- 00 Ol O CM CM CM CM CO LO CO b- Ol LO TP CO CM CO CO CO CO i—1 CO b- Ol CO CM t-H O CO CO CO CO O CO CM 00 b- CO CO LO CM CM CM CM CM Ol CO CO TP CO CO CO CM CM CM CM CM O 00 CO R R °l °l cm" cm" r* ,-T 00 b- CO TP co^ co^ co_ co^ O O O Q TP CO CM O 005 o o" o o o LO o o o" r—t o o LO CM o^ o" LO 0,0 bß Ö este Prag CD .bC '¦+3 sei Ö "cd J-i ¦3 Ö +J lichke Ü schei: r* 1 "cd o g <^ r?. <N Q
1128 21. Tabellen 21.21 Zufallszahlen Wegen der Bedeutung der Zufallszahlen s 16.3.5.2, S. 806. 4730 0612 0285 7768 4450 7332 4044 0067 5358 0038 8344 7164 7454 3454 0401 6202 8284 9056 9747 2992 6170 3265 0179 1839 2276 4146 3526 3390 4806 7959 8245 7551 5903 9001 0265 1530 2278 1888 9078 8085 6563 1643 7697 5256 4772 2271 7492 7616 6292 7414 0195 0338 0151 3840 8836 4595 8619 3949 6042 8078 9952 3809 7825 9286 5983 9611 4915 2744 4521 3305 8004 8634 9284 3428 8931 4013 9005 9278 7574 0449 4689 5157 8021 0067 3186 1077 4286 7260 7921 3342 2539 0814 6995 9650 9973 7945 5523 7012 5051 0204 0641 2913 7318 5070 3814 7993 2549 3672 2217 3162 7406 5969 4765 3219 6906 3835 8731 2995 5579 3081 7406 5969 4765 3219 6906 7592 5133 3170 3024 4398 5207 0648 9934 4651 4325 7024 9031 7614 4150 0973 3141 3737 7033 0293 9968 4439 9442 9647 2532 8859 2938 4980 7868 9028 5876 4439 9442 9647 2532 8859 1339 7995 9915 0680 3121 1967 3326 7022 1580 5039 3899 9735 5999 5059 4958 0103 7686 4844 3978 6369 5683 7696 4364 7577 5044 2671 8674 0683 5660 8150 5683 7696 4364 7577 5044 4802 8030 6960 1127 7749 7325 1933 2260 5004 7342 8981 7820 1246 5178 4830 4528 0723 0149 5933 1256 6877 7510 1037 2815 8826 4691 4506 3768 5006 1360 6877 7510 1037 2815 8826 5751 7408 2621 8088 8191 7584 6265 0190 8981 7252 1280 2478 9759 7130 6297 7988 4505 7412 1032 0416 2920 1620 4975 8696 6218 0559 7262 0625 8325 1868 2920 1620 4975 8696 6218 3785 2186 6718 0200 2087 3485 0649 1816 1950 2800 5678 9200 6565 2641 0575 4635 6841 6370 5192 4326 9588 4973 1998 9248 3206 8382 8127 9887 9677 9265 9588 6973 1998 9248 3206 7125 0725 4059 5868 8270 5832 6177 7933 2201 4706 8096 7269 1012 7812 4843 8478 1379 1884 1732 7840 3002 1911 1359 9410 9034 2825 2022 7060 2169 3277 3002 1911 1359 9410 9034 4922 5554 9919 0084 5233 8118 2139 2906 3852 6881 7010 6284 0059 1381 3437 9094 6460 0717 2137 6525 2869 1288 1346 9282 0843 4928 2178 0514 3196 8465 2869 1288 1346 9282 0843 8877 5664 1007 6362 3980 8433 7236 3030 6855 8828 1435 9861 2419 6158 5629 9077 1869 5740 9357 2608 3746 6160 6125 6572 9832 5379 7463 0034 0357 7502 3746 6160 6125 6572 9832 9530 6791 6469 6808 6774 0606 0441 6032 5489 2785 7631 2849 0036 9539 3496 5306 5700 8477 5941 5255 3690 9797 5078 3940 2703 8635 4842 8600 7811 6458 3690 9797 5078 3940 2703 6499 9677 5410 3727 8522 2719 1352 1685 6386 8375 7361 2208 2027 3356 5406 4357 5339 6583 6564 4811 6931 8755 6742 6655 8514 8135 4414 3727 5434 7195 2705 1547 3424 8969 5225 6432 3085 0246 8710 5736 2889 1499 3100 3736 7232 8903 8616 5467 5861 4790 8353 6862 0717 2171 3763 1230 6120 3443 9014 4124 7299 0127 5056 0314 9869 6251 4972 1354 3659 8898 1516 8319 3687 6065 3132 2765 3068 1929 0498 2483 8684 5865 5577 9371 9734
1129 22 Literatur 1. Arithmetik [1 1] Asser, G.: Grundbegriffe der Mathematik. Mengen. Abbildungen, natürliche Zahlen - Deutscher Verlag der Wissenschaften 1980 [1.2] Bosch, K.: Finanzmathematik. — Oldenbourg Verlag 1991 [1 3] Heilmann, W.-R.. Grundbegriffe der Risikotheorie — Verlag Versicherungswirtschaft 1986 [1 4] Isenbart, F., MÜNZER, H.- Lebensversicherungsmathematik für Praxis und Studium Verlag Gabler, 2 Auflage 1986 [1 5] DUCK, W.; KÖRTH, H.; Runge, W.; Wunderlich, L : Mathematik für Ökonomen, Bd 1 u. 2. — Verlag H. Deutsch 1989. [1 6] Fachlexikon ABC Mathematik. — Verlag H. Deutsch 1978 [1 7] Heitzinger, W.; Troch, L; Valentin, G.: Praxis nichtlinearer Gleichungen. C Hanser Verlag 1984 [1 8] Nickel, H. (Hrsg ): Algebra und Geometrie für Ingenieure — Verlag H Deutsch 1990 [1.9] Pfeifer, A.- Praktische Finanzmathematik Verlag H Deutsch 1995 [1 10] Wisliceny, J.: Grundbegriffe der Mathematik Rationale, reelle und komplexe Zahlen — Verlag H Deutsch 1988 2. Funktionen und ihre Darstellung [2 1] Asser, G.. Einführung in die mathematische Logik, Teil I bis III. - Verlag H Deutsch 1976- 1983 [2.2] Fetzer, A.; Fränkel, H.: Mathematik Lehrbuch für Fachhochschulen, Bd 1. — VDI -Verlag 1995 [2 3] Fichtenholz, GM.: Differential- und Integralrechnung, Bd 1 Deutscher Verlag der Wissenschaften 1964, Verlag H Deutsch 1989-1992, seit 1994 Verlag H Deutsch [2 4] GÖRKE, L.: Mengen - Relationen - Funktionen. -- Verlag H Deutsch 1974. [2 5] PAPULA, L.: Mathematik für Ingenieure, Bd 1 bis 3. — Verlag Vieweg 1994-1996 [2 6] Sieber, N.; Sebastian, H.J.; Zeidler, G.- Grundlagen der Mathmatik, Abbildungen, Funktionen, Folgen. — BSB B G Teubner, Leipzig, (MINÖL, Bd 1). 1973, Verlag H. Deutsch, (MINÖA, Bd 1), 1978. [2 7] Smirnow, W.I.: Lehrgang der höheren Mathematik, Bd 1 — Deutscher Verlag der Wissenschaften 1953; Verlag H. Deutsch 1987-1991, seit 1994 Verlag H Deutsch unter dem Titel Leln- buch der höheren Mathematik. [2 8] Stöcker, H. (Hrsg.): Analysis für Ingenieurstudenten, Bd. 1 — Verlag H Deutsch 1995 3. Geometrie [3 1] BÄR, G Geometrie B G Teubner 1996 [3 2] Baule, B.. Die Mathematik des Naturforschers und Ingenieurs, Bd. 1 u. 2. — Verlag H. Deutsch 1979. [3 3] BÖHM, J.: Geometrie, Bd 1 u. 2 — Verlag H Deutsch 1988 [3 4] DRESZER, J.: Mathematik-Handbuch für Technik und Naturwissenschaft — Verlag H Deutsch 1975. [3.5] Efimow, N.V.: Höhere Geometrie. Bd 1 u 2 — Verlag Vieweg 1970 [3 6] Fischer, G.: Analytische Geometrie — Verlag Vieweg 1988 [3.7] Kleine Enzyklopädie Mathematik — Verlag Enzyklopädie, Leipzig 1967. — Gekürzte Ausgabe Mathematik Ratgeber - Verlag H Deutsch 1988.
1130 22. Literatur [3.8] Klingenberg, W.: Lineare Algebra und Geometrie — Springer-Verlag 1993 [3 9] Klotzek, B.: Einführung in die Differentialgeometrie, Bd 1 u 2 — Verlag H. Deutsch 1995 [3.10] KOECHER, M.: Lineare Algebra und analytische Geometrie. — Springer-Verlag 1992 [3.11] Mangoldt, H. v.; Knopp, K.: Einführung in die höhere Mathematik, Bd IL — S. Hirzel Verlag 1978. [3 12] MARSOLEK, L.: BASIC im Bau- und Vermessungswesen. — B G Teubner 1986. [3.13] Matthews, V.: Vermessungskunde Teil 1 u 2 — B. G. Teubner 1993. [3.14] Nickel, H. (HRSG.): Algebra und Geometrie für Ingenieure. — Verlag H Deutsch 1990. [3 15] Pauli, W. (Hrsg.): Lehr- und Übungsbuch Mathematik, Bd. 2 Planimetrie, Stereometrie und Trigonometrie der Ebene — Verlag H. Deutsch 1989 [3.16] Raschewski, P.K.: Riemannsche Geometrie und Tensoranalysis. — Verlag H Deutsch 1995 [3.17] ROTHE, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil III. Flächen im Raum Linienintegrale und mehrfache Integrale. Gewöhnliche und partielle Differentialgleichungen nebst Anwendungen. — BSB B. G Teubner, Leipzig, 12 Auflage 1962. [3.18] Schöne, W.: Differentialgeometrie. — BSB B. G. Teubner, Leipzig, (MINÖL, Bd. 6), 1975; Verlag H Deutsch, (MINÖA, Bd. 6) 1978. [3.19] Schröder, E.: Darstellende Geometrie. — Verlag H. Deutsch 1980. [3.20] SlGL, R.: Ebene und sphärische Trigonometrie — Verlag H Wichmann 1977 [3 21] Steinert, K.-G.: Sphärische Trigonometrie. — B. G Teubner 1977. 4. Lineare Algebra [4.1] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs, Bd. 1 u. 2. — Verlag H Deutsch 1979. [4.2] Berendt, G.; Weimar, E.: Mathematik für Physiker, Bd 1. — VCH, Weinheim 1990 [4.3] Boseck, H.: Einführung in die Theorie der linearen Vektorräume. — Verlag H Deutsch 1984 [4.4] Bunse, W.; Bunse-Gerstner, A.: Numerische lineare Algebra — B. G Teubner 1985 [4.5] FADDEJEW, D.K.; FADDEJEWA, W.N.: Numerische Methoden der linearen Algebra. — Deutscher Verlag der Wissenschaften 1970 [4 6] JÄNICH, K.: Lineare Algebra. — Springer-Verlag 1993. [4.7] KIELBASINSKI, A.; SCHWETLICK, H.: Numerische lineare Algebra Eine computerorientierte Einführung. — Verlag H Deutsch 1988 [4.8] KLIN, M.Ch.; PÖSCHEL, R.; Rosenbaum, K.: Angewandte Algebra. — Verlag H. Deutsch 1988 [4.9] Klingenberg, W.: Lineare Algebra und Geometrie — Springer-Verlag 1993 [4.10] KOECHER, M.: Lineare Algebra und analytische Geometrie. — Springer-Verlag 1992. [4.11] Lippmann, H.: Angewandte Tensorrechnung. Für Ingenieure, Physiker und Mathematiker — Springer-Verlag 1993. [4.12] Manteuffel, K.; Seiffart, E.; Vetters, K.: Lineare Algebra. — BSB B G Teubner. Leipzig (MINÖL, Bd. 13), 1975; Verlag H Deutsch, (MINÖA, Bd 13), 1978 [4 13] Nickel, H. (Hrsg.): Algebra und Geometrie für Ingenieure — Verlag H. Deutsch 1990. [4.14] Pfenninger, H.R.: Lineare Algebra. — Verlag H Deutsch 1991. [4.15] Raschewski, P.K.: Riemannsche Geometrie und Tensoranalysis — Verlag H. Deutsch 1995 [4.16] SCHULTZ-PlSZACHiCH, W.: Tensoralgebra und -analysis. — BSB B G Teubner, Leipzig. (MINÖL, Bd. 11), 1977; Verlag H. Deutsch, (MINOA, Bd. 11), 1979. [4 17] Smirnow, W.I.: Lehrgang der höheren Mathematik, Teil 111,1. — Deutscher Verlag der Wissenschaften 1953; Verlag H Deutsch 1989-1991, seit 1994 Verlag H. Deutsch unter dem Titel Lehrbuch der höheren Mathematik.
1131 [4.18] ZURMÜHL, R.; Falk, S.: Matrizen und ihre Anwendung - 1. Grundlagen. — Springer-Verlag 1992 5. Algebra und Diskrete Mathematik Algebra und Diskrete Mathematik, allgemein [5 1] AiGNER, M. Diskrete Mathematik — Verlag Vieweg 1993. [5 2] Belkner, H.: Determinanten und Matrizen — Verlag H. Deutsch 1988 [5 3] Burris, S.; Sankappanavar, H. P.: A Course in Universal Algebra — Springer-Verlag 1981 [5.4] DÖRFLER, W.; PESCHEK, W.: Einführung in die Mathematik für Informatiker. — C. Hanser Verlag 1988 [5.5] Ehrig, H.; Mahr, B . Fundamentals of Algebraic Specification 1 — Springer-Verlag 1985. [5 6] Metz, J.; Merbeth, G.: Schaltalgebra— Verlag H Deutsch 1970. [5 7] Wechler, W.: Universal Algebra for Computer Scientists. — Springer-Verlag 1992 [5.8] Winter, R.. Grundlagen der formalen Logik — Verlag H Deutsch 1996 Algebra und Diskrete Mathematik, Gruppentheorie [5 9] Alexandroff, PS.: Einführung in die Gruppentheorie — Verlag H Deutsch 1992 [5.10] Belger, M., Ehrenberg, L.. Theorie und Anwendungen der Symmetriegruppen. — BSB B G. Teubner, Leipzig, (MINÖL Bd. 23), 1981; Verlag H Deutsch (MINÖA Bd. 23), 1981 [5 11] Fässler, A.; Stiefel, E. Gruppentheoretische Methoden und ihre Anwendungen — Birk- häuser-Verlag 1992. [5.12] Hein, W. Struktur und Darstellungstheorie der klassischen Gruppen. — Springer-Verlag 1990. [5.13] Heine, V.- Group Theory in Quantum Mechanics — Dover, Mineola 1993 [5 14] Lidl, R., Pilz, G.- Angewandte abstrakte Algebra I — BI-Wissenschaftverlag 1982. [5.15] Ludwig, W., Falter, C. Symmetries in Physics Group Theory Applied to Physical Problems — Springer-Verlag 1996 [5.16] Margen AU, M., Murphy, G.M. Die Mathematik für Physik und Chemie. — B. G. Teubner, Leipzig 1964, Verlag H Deutsch 1965. [5 17] Mathiak, K., Stingl, P. Gruppentheorie für Chemiker, Physiko-Chemiker, Mineralogen — Deutscher Verlag der Wissenschaften 1970. [5 19] Stiefel, E., Fässler, A. Gruppentheoretische Methoden und ihre Anwendung — B G. Teubner1979. [5 20] Varadarajan, V.: Lie Groups, Lie Algebras and their Representation — Springer-Verlag 1990. [5.21] Van der Waerden, B • Gruppentheoretische Methoden in der Quantenmechanik. — Springer-Verlag 1932 [5.22] WiGNER, E. Group Theory and its Application to the Quantum Mechanics of Atomic Spectra — Academic Press 1959. [5.23] Weyl, H.- The Theory of Groups and Quantum Mechanics — Dover, Mineola 1993 [5 24] Zachmann, H.G.. Mathematik für Chemiker — VCH, Weinheim 1990. Algebra und Diskrete Mathematik, Zahlentheorie [5.25] Bundschuh, P.- Einführung in die Zahlentheorie. — Springer-Verlag 1992. [5 27] Padberg, F. Elementare Zahlentheorie. — BI- Wissenschaftsverlag 1991 [5.28] Rivest, R.L., Shamir, A., Adleman, L.. A Method for Obtaining Digital Signatures and Public Key Cryptosystems. — Comm. ACM 21, A978), 12 - 126.
1132 22. Literatur [5 29] Scheid, H.. Zahlentheorie — BI- Wissenschaftsverlag 1991, 2. Auflage Spektrum Akademischer Verlag 1995 [5 31] Schulz, R.: Codierungstheorie — Verlag Vieweg 2001. Algebra und Diskrete Mathematik, Kryptologie [5 32] Bauer, F. L.: Kryptologie — Methoden und Maximen. — Springer-Verlag 1993 [5 33] Schneider, B.- Angewandte Kryptologie — Protokolle, Algorithmen und Sourcecode in C. — Addison-Wesley-Longman 1996. [5.34] Stinson, D.- Cryptography Theory and Practice. — CRC Press Company 2002 [5.35] WOBST, R.: Methoden, Risiken und Nutzen der Datenverschlüsselung. — Addison-Wesley- Longman 1997. [5.36] httpY/csrc nist gov/publications/fips/fips46-3/fips46-3.pdf [5 37] httpY/csrc.nist gov/publications/fips/fipsl97/fips-197.pdf. Algebra und Diskrete Mathematik, Graphentheorie [5 38] BiESS, G.- Graphentheorie. — Verlag H. Deutsch 1979 [5.39] Edmunds, J.. Paths, Trees and Flowers. — Canad J Math 17, A965), 449-467 [5 40] Edmunds, J., Johnson, E.L.- Matching, Euler Tours and the Chinese Postman. — Math Programming 5, A973), 88-129. [5.41] NÄGLER, G., Stopp, F.: Graphen und Anwendungen — B. G. Teubner 1995 [5 42] Sachs, H.. Einführung in die Theorie der endlichen Graphen — B G Teubner, Leipzig 1970 [5.43] Volkmann, L.. Graphen und Diagraphen. — Springer-Verlag 1991. Algebra und Diskrete Mathematik, Fuzzy-Logik [5.44] BANDEMER, H., GOTTWALD, S. Einführung in Fuzzy-Methoden - Theorie und Anwendungen unscharfer Mengen. — Akademie-Verlag, 4. Auflage 1993 [5 45] Driankov, D., Hellendorn, H., Reinfrank, M.: An Introduction to Fuzzy Control Springer-Verlag 1993 [5.46] Dubois, D., Prade, H.- Fuzzy-Sets and System-Theory and Applications — Academic Press, Ine , London 1980 [5.47] GOTTWALD, S.* Mehrwertige Logik. Eine Einführung in Theorie und Anwendungen - Akademie-Verlag, Berelin 1989. [5 48] Gräuel, A.. Fuzzy-Logik Einführung in die Grundlagen mit Anwendungen. — B.I Wissen- schaftsverlag, Mannheim 1995 [5.50] Kahlert, J., Frank, H: Fuzzy-Logik und Fuzzy-Control Eine anwendungsorientierte Einführung mit Begleitssoftware. — Verlag Vieweg 1993. [5 51] Kruse, R., Gebhardt, J., Klawonn, F.: Fuzzy-Systeme — B.G Teubner 1993. [5 53] PEDRYCZ, W.: Fuzzy Evolutionary Computations. Ch 2.3 — Kluwer Academic Publishers. Boston 1997. [5 56] Zimmermann, H-J., Altrock, C. Fuzzy-Logik, Bd. 1, Technologie. — Oldenbourg-Verlag 1993 6. Differentialrechnung [6 1] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs, Bd. 1 u 2 — Verlag H Deutsch 1979. [6.2] Fetzer, A.; Fränkel, H.: Mathematik Lehrbuch für Fachhochschulen, Bd. 1, 2 — VDI Verlag 1995. [6.3] Fichtenholz, G.M.: Differential- und Integralrechnung, Bd. 1 bis 3. — Deutscher Verlag der Wissenschaften 1964; Verlag H Deutsch 1989-92, seit 1994 Verlag H. Deutsch
1133 [6.4] Harbarth, K.; Riedrich, T.: Differentialrechnung für Punktionen mit mehreren Variablen. — BSB B G Teubner, Leipzig (MINÖL, Bd. 4), 1976; Verlag H. Deutsch, (MINÖA, Bd 4) 1978 [6 5] Joos, G.E.; Richter, E.: Höhere Mathematik Ein kompaktes Lehrbuch für Studium und Beruf — Verlag H. Deutsch 1994 [6 6] Knopp, K.- Theorie und Anwendung der unendlichen Reihen. — Springer-Verlag 1964 [6 7] KÖRBER, K.-H.; PFORR, E.A : Integralrechnung für Funktionen mit mehreren Variablen. — BSB B. G. Teubner, Leipzig, (MINÖL, Bd 5), 1974; Verlag H. Deutsch, (MINOA, Bd. 5), 1980 [6.8] MANGOLDT, H. v.; Knopp, K.: Einführung in die höhere Mathematik, Bd. 2 u. 3. — S. Hirzel Verlag 1978-81 [6.9] PAPULA, L.: Mathematik für Ingenieure, Bd. 1 bis 3. — Verlag Vieweg 1994-1996. [6 10] Pforr, E.A.; Schirotzek, W.: Differential- und Integralrechnung für Funktionen mit einer Variablen. —BSB B G Teubner, Leipzig, (MINÖL, Bd 2), 1973, Verlag H Deutsch, (MINÖA, Bd. 2) 1978 [6 11] Rothe, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil I. Differentialrechnung und Grundformeln deer Integralrechnung nebst Anwendungen. — BSB B. G. Teubner, Leipzig, 20 Auflage 1962. [6 12] SMIRNOW, W.I : Lehrgang der höheren Mathematik, Bd. II u III — Deutscher Verlag der Wissenschaften 1953; Verlag H. Deutsch 1987-1991, seit 1994 Verlag H. Deutsch unter dem Titel Lehrbuch der höheren Mathematik. [6 13] Stöcker, H. (Hrsg.): Analysis für Ingenieurstudenten — Verlag H. Deutsch 1995. [6 14] Zachmann, H.G.: Mathematik für Chemiker — VCH, Weinheim 1990 7. Unendliche Reihen [7 1] Apelblat, A.: Tables of Integrals and Series. — Verlag H Deutsch 1996 [7 2] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs, Bd. 1 u 2. — Verlag H. Deutsch 1979. [7 3] Fetzer, A.; Fränkel, H.: Mathematik Lehrbuch für Fachhochschulen, Bd. 1, 2. — VDI- Verlag 1995 [7 4] Fichtenholz, G.M.: Differential- und Integralrechnung, Bd. 1 bis 3 — Deutscher Verlag der Wissenschaften 1964, Verlag H Deutsch 1989-92, seit 1994 Verlag H. Deutsch. [7 5] Harbarth, K.; Riedrich, T.: Differentialrechnung für Funktionen mit mehreren Variablen. — BSB B. G. Teubner, Leipzig, (MINÖL, Bd. 4), 1976; Verlag H Deutsch, (MINÖA, Bd. 4), 1978. [7 6] Knopp, K.: Theorie und Anwendung der unendlichen Reihen — Springer-Verlag 1964. [7 7] KÖRBER, K.-H.; PFORR, E.A.: Integralrechnung für Funktionen mit mehreren Variablen. — BSB B. G Teubner, Leipzig (MINÖL, Bd. 5), 1974, Verlag H. Deutsch, (MINÖA, Bd. 5), 1980. [7 8] Mangoldt, H. v ; Knopp, K., Hrg. F. LÖSCH: Einführung in die höhere Mathematik, Bd. 1 bis 4 — S. Hirzel Verlag 1989. [7 9] PAPULA, L.: Mathematik für Ingenieure, Bd 1 bis 3 — Verlag Vieweg 1994-1996. [7 10] Plaschko, P.; Brod, K.: Höhere mathematische Methoden für Ingenieure und Physiker —Springer-Verlag 1989 [7 11] Pforr, E.A.; Schirotzek, W.- Differential- und Integralrechnung für Funktionen mit einer Variablen — BSBB G Teubner, Leipzig, (MINÖL, Bd 2), 1973; Verlag H. Deutsch, (MINÖA, Bd 2), 1978 [7 12] Rothe, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil IL Integralrechnung. Unendliche Reihen Vektorrechnung nebst Anwendungen. — BSB B G. Teubner, Leipzig, 17 Auflage 1965 [7 13] SCHELL, H.-J.: Unendliche Reihen. — BSB B G Teubner, Leipzig, (MINOL, Bd 3), 1974, Verlag H. Deutsch, (MINÖA, Bd 3), 1978.
1134 22. Literatur [7 14] SMIRNOW, W.L: Lehrgang der höheren Mathematik, Bd. II u. III. — Deutscher Verlag der Wissenschaften 1953; Verlag H Deutsch 1987-1991, seit 1994 Verlag H Deutsch unter dem Titel Lehrbuch der höheren Mathematik [7 15] Stöcker, H (Hrsg.): Analysis für Ingenieurstudenten. — Verlag H. Deutsch 4. Auflage 2000 8. Integralrechnung [8 1] Apelblat, A.: Tables of Integrals and Series — Verlag H Deutsch 1996 [8 2] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs, Bd 1 u 2 - Verlag H Deutsch 1979 [8.3] Brytschkow, J.A.; Maritschew, O.L; Prudnikov, A.P.: Tabellen unbestimmtei Integrale. — Verlag H. Deutsch 1992. [8 4] Courant, R.: Vorlesungen über Differential- und Integralrechnung, Bd 1 und 2 — Springer Verlag 19771-72 [8 5] Fetzer, A.; Fränkel, H : Mathematik Lehrbuch für Fachhochschulen, Bd 1.2 - - VDI Verlag 1995 [8.6] Fichtenholz, G.M.: Differential- und Integralrechnung, Bd 1 bis 3 — Deutscher Verlag der Wissenschaften 1964; Verlag H Deutsch 1989-92, seit 1994 Verlag H Deutsch [8 7] Harbarth, K.; RlEDRiCH, T.: Differentialrechnung für Funktionen mit mehreren Variablen — BSB B G Teubner, Leipzig, (MINÖL, Bd 4), 1978, Verlag H Deutsch, (MINÖA, Bd 4) 1978 [8 8] JOOS, G.E.; Richter, E.: Höhere Mathematik Ein kompaktes Lehrbuch für Studium und Beruf — Verlag H. Deutsch 1994 [8.9] Kamke, E.: Das Lebesgue-Stieltjes Integral — B. G. Teubner, Leipzig 1960 [8.10] Knopp, K.: Theorie und Anwendung der unendlichen Reihen. Springer-Verlag 1964 [8 11] KÖRBER, K.-H.; Pforr, E A.: Integralrechnung für Funktionen mit mehreren Variablen BSBB G Teubner, Leipzig, (MINÖL, Bd 5), 1974, Verlag H Deutsch, (MINÖA, Bd 5), 1979 [8.12] Mangoldt, H. v.; Knopp, K., Hrg. F. LÖSCH: Einführung in die höhere Mathematik. Bd 1 bis 4 — S Hirzel Verlag 1989. [8 13] Mangoldt, H. v.; Knopp; Lösch: Einführung in die höhere Mathematik, Bd IV S Hirzel Verlag 1975. [8.14] PAPULA, L.: Mathematik für Ingenieure, Bd. 1 bis 3 - Verlag Vieweg 1994-1996 [8 15] Pforr, E.A.; Schirotzek, W.: Differential- und Integralrechnung für Funktionen mit einer Variablen - BSB B. G Teubner, Leipzig, (MINÖL, Bd 2), 1973, Verlag H Deutsch, (MINÖA. Bd 2), 1978. [8 16] Rothe, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil I. Differentialrechnung und Grundformeln deer Integralrechnung nebst Anwendungen — BSB B G Teubner, Leipzig, 20 Auflage 1962 [8 17] Rothe, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil II Integralrechnung. Unendliche Reihen. Vektorrechnung nebst Anwendungen. — BSB B G Teubner, Leipzig, 17 Auflage 1965 [8 18] Rothe, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil III Flächen im Raum. Linienintegrale und mehrfache Integrale. Gewöhnliche und partielle Differentialgleichungen nebst Anwendungen - BSB B. G Teubner, Leipzig, 12. Auflage 1962 [8.19] Schell, H.-J.- Unendliche Reihen — BSB B. G Teubner, Leipzig, (MINÖL, Bd 3). 1974. Verlag H. Deutsch, (MINOA, Bd. 3), 1978. [8.20] Smirnow, W.L: Lehrgang der höheren Mathematik, Bd. II u. III — Deutscher Verlag der Wissenschaften 1953; Verlag H Deutsch 1987-1991, seit 1994 Verlag H Deutsch unter dem Titel Lehrbuch der höheren Mathematik [8 21] Stöcker, H. (Hrsg.): Analysis für Ingenieurstudenten — Verlag H. Deutsch 1995.
1135 [8 22] Zachmann, H.G.: Mathematik für Chemiker. — VCH, Weinheim 1990. 9. Differentialgleichungen Differentialgleichungen, allgemein [9 1] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs, Bd. 1 u 2 — Verlag H Deutsch 1979. [9 2] Braun, M ¦ Differentialgleichungen und ihre Anwendungen. — Springer-Verlag 1991. [9 3] COLLATZ, L : Differentialgleichungen — BG Teubner 1990. [9 4] COLLATZ, L.: Eigenwertaufgaben mit technischen Anwendungen. — Akademische Verlagsgesellschaft 1963 [9 5] COURANT, R.; HlLBERT, D.: Methoden der mathematischen Physik, Bd 1 u. 2. — Springer- Verlag 1968. [9 6] Fetzer, A.; Fränkel, H.: Mathematik Lehrbuch für Fachhochschulen, Bd 1, 2. — VDI- Verlag 1995 [9 7] Frank, Ph.; Mises, R. v.: Die Differential- und Integralgleichungen der Mechanik und Physik, Bd 1 u. 2 — Verlag Vieweg 1961 [9 8] GOLUBEW, V.V.: Differentialgleichungen im Komplexen. — Deutscher Verlag der Wissenschaften 1958. [9 9] Greiner, W.: Quantenmechanik, Teil 1 — Verlag H. Deutsch 1992. [9 10] Greiner, W.; Müller, B.: Quantenmechanik, Teil 2 — Verlag H. Deutsch 1990. [9 11] Heuser, H.: Gewöhnliche Differentialgleichungen. Einführung in Lehre und Gebrauch —- B G Teubner1991. [9 12] Kamke, E.: Differentialgleichungen, Bd 1-2 — B G Teubner, Leipzig 1969, 1965 [9.13] Kamke, E.: Differentialgleichungen, Lösungsmethoden und Lösungen, Teil 1 u. 2. — BSB B G Teubner, Leipzig 1977 [9.14] Kuntzmann, J: Systeme von Differentialgleichungen — Berlin 1970. [9 15] Landau, L.D ; LiFSCHlTZ, E.M.- Quantenmechanik — Akademie-Verlag 1979, Verlag H Deutsch 1992. [9.16] MAGNUS, K.: Schwingungen. — B G Teubner 1986 [9 17] Meinhold, P., Wagner, E.: Partielle Differentialgleichungen — BSB B G. Teubner, Leipzig, (MINÖL, Bd 8), 1975, Verlag H. Deutsch, (MINÖA, Bd. 8), 1979 [9 18] MlCHLlN, S.G.. Partielle Differentialgleichungen in der mathematischen Physik — Verlag H Deutsch 1978. [9 19] Petrowski, LG.: Vorlesungen über die Theorie der gewöhnlichen Differentialgleichungen. — B G. Teubner, Leipzig 1954. [9.20] Petrowski, I.G.: Vorlesungen über partielle Differentialgleichungen. — B. G. Teubner, Leipzig 1955. [9 21] POLJANIN, A.D.; Saizew, V.F.: Sammlung gewöhnlicher Differentialgleichungen. — Verlag H Deutsch 1996. [9.22] Rothe, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil III. Flächen im Raum Linienintegrale und mehrfache Integrale. Gewöhnliche und partielle Differentialgleichungen nebst Anwendungen. — BSB B. G. Teubner, Leipzig, 12 Auflage 1962. [9 23] Rothe, R.; SzabÖ, L: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil VI Integration und Reihenentwicklung im Komplexen. Gewöhnliche und partielle Differentialgleichungen — B G Teubner, Stuttgart, 2. Auflage 1958. [9 24] Smirnow, W.L: Lehrgang der höheren Mathematik, Teil 2. — Deutscher Verlag der Wissenschaften 1953, Verlag H Deutsch 1987-1991, seit 1994 Verlag H. Deutsch unter dem Titel Lehrbuch der höheren Mathematik. [9.25] Sommerfeld, A : Partielle Differentialgleichungen der Physik. — Verlag H Deutsch 1992. [9.26] Stepanow, W.W.: Lehrbuch der Differentialgleichungen. — Deutscher Verlag der Wissenschaften 1982.
1136 22. Literatur [9 27] Wenzel, H.: Gewöhnliche Differentialgleichungen 1 und 2 — BSB B. G Teubner, Leipzig. (MINÖL, Bd. 7/1, 7/2), 1974, Verlag H Deutsch, (MINÖA, Bd 7/1, 7/2), 1981 [9.28] Wladimirow, V.S.: Gleichungen der mathematischen Physik. — Deutscher Verlag dei Wissenschaften 1972. Nichtlineare partielle Differentialgleichungen, Solitonen etc. [9.29] Ablowitz, M.J., Clarkson, P.A : Solitons, Nonlinear Evolution Equations and Inverse Scattering. — Cambridge University Press 1991. [9 32] Eilenberger, G.: Solitons- Mathematical Methods for Physicists. — Springer-Verlag 1983 [9 33] Gu CHAOHAO (Ed.). Soliton Theory and Its Applications — Springer-Verlag 1995. [9.36] Nettel, S.- Wave Physics. Oscillations-Solitons-Chaos — Springer Verlag 1995 [9 38] TODA, M. Nonlinear Waves and Solitons. — Verlag Kluwer 1989. [9 39] VVEDENSKY, D.. Partial Differential Equations with Mathematica — Addison-Wesley 1993 10. Variationsrechnung [10.1] Blanchard, P.; BrÜning, E.: Variational methods in mathematical physics — Springer- Verlag 1992 [10 2] Klingbeil, E.: Variationsrechnung — BI-Verlag 1988. [10.3] Klötzler, R : Mehrdimensionale Variationsrechnung — Birkhäuser Veilag 1970 [10 4] KOSMOL, P.: Optimierung und Approximation — Verlag W de Gruyter 1991 [10.5] Michlin, S.G.. Numerische Realisierung von Variationsniethoden Akademie-Verlag 19G9 [10 6] Rothe, R., VON SCHMEIDLER, W : Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil VII Räumliche und ebene Potentialfunktionen Konforme Abbildung Integralgleichungen. Variationsrechnung — B G Teubner, Suttgart, 2 Auflage 1956 [10.7] SCHWANK, F.: Randwertprobleme — B. G Teubner, Leipzig 1951 11. Integralgleichungen [11.1] CORDUNEANU, I.C.: Integral Equations and Applications Cambridge University Press 1991 [11.2] ESTRADA, R.; Kanwal, R.P.. Singular Integral Equations. — John Wiley 1999 [11.3] FenyÖ, S.; Stolle, H.W.: Theorie und Praxis der linearen Integralgleichungen Bd 1 bis 4 — Birkhäuser-Verlag 1998. [11.4] HACKBUSCH, W.: Integralgleichungen. Theorie und Numerik. — B G Teubner 1989. Springer-Verlag 1995. [11.5] Kanwal, R.P.: Linear Integral Equations — Springer-Verlag 1996 [11.6] KRESS, R.: Linear Integral Equations — Springer-Verlag 1999 [11.7] Michlin, S.G , Prössdorf, S.: Singular Integral Operators — Springer Verlag 1986 [11 8] MUSCHELISCHWILI, N.I.: Singulare Integralgleichungen — Akademie-Veilag 1965 [11.9] Pipkin, A.C.: A Course on Integral Equations. — Springer-Verlag 1991 [11.10] POLYANIN, A.D.; Manzhirov, A.V : Handbook of Integral Equations — CRC Press 1998 [11 11] ROTHE, R., VON SCHMEIDLER, W.: Höhere Mathematik für Mathematiker, Physiker. Ingenieure, Teil VII. Räumliche und ebene Potentialfunktionen Konforme Abbildung Integralgleichungen Variationsrechnung — B G Teubner, Suttgart, 2. Auflage 1956. [11.12] SCHMEIDLER, W.: Integralgleichungen mit Anwendungen in Physik und Technik — Akademische Verlagsgesellschaft 1950 [11 13] SMIRNOW, W.I.: Lehrgang der höheren Mathematik, Bd IV/1 — Deutscher Verlag der Wissenschaften 1953, Verlag H Deutsch 1987-1993, seit 1994 Verlag H. Deutsch unter dem Titel Lehrbuch der höheren Mathematik , Bd. IV/1. 12. Funktionalanalysis
1137 12 1 12 2] 12 3 12 4] 12 5 12.6] 12 7] 12.8] 12.9] 12 10] 12 11 12 12] 12.13] 12 14] 12.15] 12.16] 12.17 12.18 12 19 12.20 12 21 12.22 12 23 12 24 12.25 12 26] 12.27] Achieser, N.I.; Glasmann, I.M.: Theorie der linearen Operatoren im Hilbert-Raurn — Berlin 1975 Aliprantis, C.D.; Burkinshaw, O : Positive Operators. — Academic Press Inc., Orlando 1985. Aliprantis, CD.; Border, K.C.; Luxemburg, W.A. J.: Positive Operators, Riesz Spaces and Economics — Springer Verlag 1991 Alt, H.W.: Lineare Funktionalanalysis — Eine anwendungdorientierte Einführung. — Springer-Verlag 1976. BALAKRISHNAN, A.V.: Applied Functional Analysis — Springer-Verlag 1976 BAUER, H.: Maß- und Integrationstheorie — Verlag W de Gruyter 1990. Bronstein, I.N.; SEMENDAJEW, K A.: Ergänzende Kapitel zum Taschenbuch der Mathematik. — BSB B G. Teubner, Leipzig 1970; Verlag H Deutsch 1990. COLLATZ, L.: Funktionalanalysis und Numerische Mathematik — Springer-Verlag 1964 DUNFORD, N.; Schwartz, J.T.: Linear Operators Teil I bis III. — Intersciences Publishers New York, London 1958, 1963, 1971. Edwards, R.E.: Functional Analysis. — Holt, Rinehart and Winston, New York 1965 Gajewski, H.; GrÖGER, K.; Zacharias, K : Nichtlineare Operatorengleichungen und Operatordifferentialgleichungen. — Akademie-Verlag 1974. GÖpfert, A.; RlEDRlCH, T.: Funktionalanalysis. — BSB B. G Teubner, Leipzig, (MINÖL, Bd 22), 1980; Verlag H Deutsch, (MINÖA, Bd.* 22), 1980 Halmos, P.R.: A Hubert Space Problem Book. — Van Nostrand Comp Piinceton 1967. HEUSER, H.: Funktionalanalysis. — B. G. Teubner 1986. Hutson, V.C.L.; Pym, J.S.: Applications of Functional Analysis and Operator Theory. — Academic Press, London 1980 Hewitt, E.; Stromberg, K.: Real and Abstract Analysis. — Springer-Verlag 1965 JOSHI, M.C.; BOSE, R.K.: Some Topics in Nonlinear Functional Analysis. — Wiley Eastern Limited, New Delhi 1985 Kantorowitsch, L.V., Akilow, G.P.: Funktionalanalysis (in Russisch) —Nauka, Moskau 1977 KOLMOGOROW, A.N.; Fomin, S.W.: Reelle Funktionen und Funktionalanalysis. — Akademie-Verlag 1975. KrasnoSEL'sku, M.A.; LiFSHiTZ, J.A., SOBOLEV, A.V.: Positive Linear Systems. — Heldermann Verlag Berlin 1989 Ljusternik, L.A.; SOBOLEW, W.I.: Elemente der Funktionalanalysis — Akademie-Verlag, 4. Auflage 1968, Nachdruck. Verlag H Deutsch 1975 Meyer-Nieberg, P.: Banach Lattices — Springer-Verlag 1991 Neumark, M.A.: Normierte Algebren. — Berlin 1959 RUDIN, W.: Functional Analysis — McGraw-Hill, New York 1973 SCHAEFER, H.H.: Topological Vector Spaces. — Macmillan, New York 1966. Schaefer, H.H.: Banach Lattices and Positive Operators. — Springer-Verlag 1974. YosiDA, K.: Functional Analysis. — Springer-Verlag 1965 13. Vektoranalysis und Feldtheorie 13 1] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs, Bd. 1 u 2 — Verlag H Deutsch 1979. 13.2] BREHMER, S.; Haar, H.: Differentialformen und Vektoranalysis. — Berlin 1972 13.3] DOMKE, E.: Vektoranalysis Einführung für Ingenieure und Naturwissenschaftler — BI- Verlag 1990. [13 4] Reichardt, H.: Vorlesungen über Vektor- und Tensorrechnung. — Deutscher Verlag der Wissenschaften 1968.
1138 22 Literatur [13.5] Rothe, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil II Integralrechnung Unendliche Reihen Vektorrechnung nebst Anwendungen — BSB B G Teubnoi. Leipzig, 17 Auflage 1965. [13.6] SCHARK, R.: Vektoranalysis für Ingcnieurstudenten — Verlag H Deutsch 1992. [13 7] Wunsch, G.: Feldtheorie. — Verlag Technik. Leipzig 1971 14. Funktionentheorie [14 1] Abramowitz, M.; Stegun, I. A.: Pocketbook of Mathematical Functions — Verlag H Deutsch 1984 [14 2] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs, Bd 1 u 2 — Verlag H Deutsch 1979. [14.3] BEHNKE, H.; Sommer, F. Theorie der analytischen Funktionen einer komplexen Veränderlichen — Springer-Verlag 1976 [14 4] Fichtenholz, G.M.: Differential- und Integralrechnung, Bd 2 — Deutscher Verag der Wissenschaften 1964, Verlag H Deutsch 1989-92, seit 1994 Verlag H. Deutsch [14.5] FISCHER, W.; Lieb, L. Funktionentheorie. Verlag Vieweg 1992 [14.6] Freitag, E.; Busam, R.: Funktionentheorie — Springer-Verlag, 2 , erweiterte Auflage 1994. [14.7] Greuel, O.: Komplexe Funktionen und konforme Abbildungen — BSB B G. Teubner. Leipzig, (MINÖL, Bd 9), 1978, Verlag H. Deutsch, (MINÖA, Bd 9) 1978 [14 8] Jahnke, E ; Emde, F.: Tafeln höherer Funktionen — B G Teubner, Leipzig 1960 [14 9] JÄNICH, K.: Funktionentheorie. Eine Einführung. - - Springer-Verlag 1993 [14.10] Knopp-Funktionentheorie — Verlag W de Gruyter 1976 [14 11] Lawrentjew, M.A.; Schabat, B.W.: Methoden der komplexen Funktionentheorie Deutscher Verlag der Wissenschaften 1966 [14 12] Magnus, W.; Oberhettinger, F.: Formeln und Sätze für die speziellen Funktionen der mathematischen Physik — Springer Verlag 1948. [14.13] Oberhettinger, F.; Magnus, W : Anwendung der elliptischen Funktionen in Physik und Technik - Springer-Verlag 1949 [14.14] Rothe, R., SzabÖ, I.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure. Teil VI Integration und Reihenentwicklung im Komplexen Gewöhnliche und partielle Differentialgleichungen. — B G. Teubner, Stuttgart, 2 Auflage 1958 [14 15] Rothe, R.; von Schmeidler, W.- Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teil VII Räumliche und ebene Potentialfunktionen Konforme Abbildung. Integralgleichungen Variationsrechnung. — B. G. Teubner, Suttgart, 2 Auflage 1956. [14 16] RÜHS, F.: Funktionentheorie - Deutscher Verlag der Wissenschaften 1976 [14 17] SCHARK, R : Funktionentheorie für Ingenieurstudenten. — Verlag H. Deutsch 1993 [14.18] Smirnow: Lehrgang der höheren Mathematik, Bd III —Deutscher Verlag der Wissenschaften 1954, Verlag H. Deutsch 1987-91, seit 1994 Veilag H Deutsch unter dem Titel Lehrbuch der höheren Mathematik [14.19] Wunsch, G : Feldtheorie — Verlag Technik 1975 15. Integraltransformationen [15.1] Blatter, C: Wavelets - Eine Einführung — Vieweg 1998 [15 2] Doetsch, G.: Handbuch der Laplace-Transformation, Bd 1 bis 3. — Birkhäuser Verlag 1950 1958. [15 3] Doetsch, G : Anleitung zum praktischen Gebrauch der Laplace Transformation - Olden- bourg-Verlag, 6. Auflage 1989 [15 4] Fetzer, V.: Integral-Transformationen. — Hüthig Verlag 1977 [15.5] FÖLLINGER, O.: Laplace und Fourier Transformation — Hüthig, 6 Auflage 1993 [15 6] GAUSS, E.: WALSH-Funktionen für Ingenieure und Naturwissenschaftler - B G. Teubner 1994
1139 [15 7] Gelfand, I.M ; SCHILOW, G.E.: Verallgemeinerte Funktionen (Distributionen), Bd 1 bis 4 — Deutscher Verlag der Wissenschaften 1962-66 [15 8] Hubbard, B.B.: Wavelets Die Mathematik der kleinen Wellen — Birkhäuser 1997 [15 9] JENNISON, R.C.: Fourier Transforms and convolutions for the experimentalist — Pergamon Press 1961 [15 10] Louis, A. K.; Maass, P.; Rieder, A.: Wavelets. Theorie und Anwendungen. — B G Teub- ner Stuttgart 1994 [15 11] Oberhettinger, F.: Tabellen zur Fourier-Transformation — Springer-Verlag 1990 [15 12] Oberhettinger, F.; Badil, L.: Tables of Laplace Transforms — Springer-Verlag 1973. [15.13] Stopp, F.: Operatorenrechnung. — BSB B G Teubner. Leipzig, (MINÖL, Bd. 10), 1976, Verlag H Deutsch, (MINÖA, Bd 10), 1978 [15.14] ViCH, R.: Z Transformation, Theorie und Anwendung — Verlag Technik 1964 [15 15] Voelker, D.; Doetsch, G.: Die zweidimensionale Laplace-Transformation — Birkhäuser Verlag 1950. [15 16] Wagner. K.W. • Operatorenrechnung und Laplacesche Transformation —JA Barth Verlag 1950. [15 17] Zypkin, J.S.: Theorie der linearen Impulssysteme. — Verlag Technik 1967. 16. Wahrscheinlichkeitsrechnung und mathematische Statistik [16 1] Bandemer, H.; Bellmann, A. Statistische Versuchsplanimg —BSB B G Teubner, Leipzig, (MINÖL, Bd. 19/2), 1976, Verlag H Deutsch, (MINÖA, Bd 19/2), 1979 [16 2] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs. Bd. 1 u. 2. — Verlag H Deutsch 1979 [16.3] Behnen, K., Neuhaus, G. Grundkurs Stochastik. — B G Teubner, 3 Auflage 1995 [16 4] Beyer, O. et al • Wahrscheinlichkeitsrechnung und mathematische Statistik — BSB B G Teubner, Leipzig, (MINÖL, Bd 17). 1976, Verlag H Deutsch, (MINÖA. Bd 17), 1980 [16 5] Beyer, O. et AL.: Stochastische Prozesse und Modelle. — BSB B. G. Teubner, Leipzig, (MINÖL, Bd 19/1), 1976. Verlag H. Deutsch. (MINÖA, Bd. 19/1), 1980 [16 6] Fisz, M.: Wahrscheinlichkeitsrechnung und mathematische Statistik. — Deutscher Verlag der Wissenschaften, 11 Auflage 1988. [16.7] Friedrich, H.; Lange, C* Stochastische Prozesse in Natur und Technik. — Verlag H Deutsch 1999 [16 8] Gnedenko, B.W.: Lehrbuch der Wahrscheinlichkeitstheorie 10 Auflage - Verlag H Deutsch 1997 [16.9] Hartmann; Lezki; Schäfer: Mathematische Methoden in der Stoffwirtschaft. — Deutscher Verlag für Grundstoffindustrie. [16 10] Heinhold, J.; Gaede, K.-W.: Ingenieurstatistik — Oldenbourg-Verlag 1964. [16 11] Hochstädter, D.: Statistische Methodenlehre. — Verlag H Deutsch 1993. [16 12] Hochstädter, D., Kaiser, U.: Varianz- und Kovarianzanalyse. - Verlag H Deutsch 1988 [16 13] HÖPCKE, W : Fehlerlehre und Ausgleichrechnung — Verlag W de Gruyter 1980. [16 14] HÜBNER, G.: Stochastik Eine anwendungsorientierte Einführung für Informatiker. Ingenieure und Mathematiker - - Vieweg, 3 Auflage 2000 [16.15] Kolmogoroff: Grundbegriffe der Wahrscheinlichkeitsrechnung. — Springer-Verlag 1977 [16 16] Krengel, U.. Einführung in die Weahrscheinlichkeitstheorie und Statistik — Vieweg 1991. [16 17] Lahres. Einführung in die diskreten Markoff-Prozesse und ihre Anwendungen — Verlag Vieweg 1964 [16 18] Manteuffel, K.; Stumpe, D.: Spieltheorie — BSB B G Teubner, Leipzig, (MINÖL, Bd 21/1), 1977; Verlag H Deutsch, (MINÖA, Bd 21/1I979 [16 19] Piehler, J.; Zschiesche, H.-U.: Simulationsmethoden — BSB B G. Teubner, Leipzig, (MINÖL, Bd 20), 1976, Verlag H. Deutsch, (MINÖA, Bd. 20), 1978.
1140 22 Literatur [16.20] Precht, M.; Voit, K.; Kraft, R.: Mathematik 1 für Nichtmathematiker. — Oldenbourg- Verlag 1990. [16.21] Reny, A.: Wahrscheinlichkeitsrechnung — Deutscher Verlag der Wissenschaften 1966 [16.22] Rinne, H.: Taschenbuch der Statistik. — Verlag H. Deutsch, 2. Auflage 1997. [16.23] Sobol, I.M.: Die Monte-Carlo-Methode — Verlag H. Deutsch 1991. [16 24] Storm, R.: Wahrscheinlichkeitsrechnung, mathematische Statistik und statistische Qualitätskontrolle. — Fachbuchverlag, 10. Auflage 1995. [16.25] Taylor, J.R.: Fehleranalyse. — VCH, Weinheim 1988. [16.26] WEBER, E.: Grundriß der biologischen Statistik für Naturwissenschaftler, Landwirte und Mediziner. — Gustav Fischer Verlag 1972. [16.27] Weber, H.: Einfuhrung in die Wahrscheinlichkeitsrechnung und Statistik für Ingenieure. — B. G. Teubner, 3. Auflage 1992. [16.28] ZURMÜHL, R.: Praktische Mathematik für Ingenieure und Physiker. — Springer-Verlag 1984 17. Dynamische Systeme und Chaos [17.1] Afraimovich, V.S.; Ilyashenko, Yu.S.; Shilnikov, L.P.: Bifurcations. — In: Dynamical Systems, 5. Springer-Verlag 1991. [17.2] Argyris, J.; Faust, G.; Haase, M.: Die Erforschung des Chaos. — Verlag Vieweg 1994 [17.3] Arrowsmith, D.K.; Place, C.M.: An Introduction to Dynamical Systems. — Cambridge University Press 1990. [17.4] Boichenko, V.A.; Leonov, G.A.; Reitmann, V.: Dimension Theory for Ordinary Differential Equations. — B.G. Teubner 2005. [17.5] BRÖCKER, Th.: Analysis III. — Wissenschaftsverlag Zürich 1992 [17.6] De Melo, W.; Van Strien, S.: One-Dimensional Dynamics — Springer-Verlag 1993 [17.7] Edgar, G.A.: Measure, Topology and Fractal Geometry. — Springer-Verlag 1990 [17 8] FALCONER, K.: Fractal Geometry. — Wiley 1990. [17.9] Grebogi, C.; Ott, E.; Pelikan, S.; Yorke, J.A.: Strange attractors that are not chaotic — Physica 13 D 1984. [17.10] Guckenheimer, J.; Holmes, P.: Nonlinear Oscillations, Dynamical Systems and Bifurcations of Vector Fields. — Springer-Verlag 1990. [17.11] HALE, J.; Kocak, H.: Dynamics and Bifurcations. — Springer-Verlag 1991. [17.12] Kantz, H.; Schreiber, T.: Nonlinear Time Series Analysis. — Cambridge University Press 1997 [17.13] Kirchgraber, U.: Chaotisches Verhalten in einfachen Systemen. — Elemente der Mathematik 1992. [17.14] Kuznetsov, Yu., A.: Elements of Applied Bifurcation Theory, 112. In. Applied Mathematica Series. — Springer-Verlag 1995. [17.15] Leonov, G.A., Reitmann, V.; Smirnova, V.B.: Non-Local Methods for Pendulum-Like Feedback Systems — B. G. Teubner 1987. [17 16] Leven, R.W.; Koch, B.-P.; Pompe, B.: Chaos in dissipativen Systemen. — Akademie- Verlag 1994. [17.17] Marek, M.; Schreiber, L: Chaotic Behaviour of Deterministic Dissipative Systems — Cambridge University Press 1991. [17 18] Medved' , M.: Fundamentals of Dynamical Systems and Bifurcations Theory — Adam Hilger 1992. [17.19] Perko, L.: Differential Equations and Dynamical Systems. — Springer-Verlag 1991 [17.20] Pesin, Ya.B.: Dimension Theory in Dynamical Systems. Contemporary Views and Applications. Chicago Lectures in Mathematics. The University of Chicago Press 1997. [17.21] Pilyugin, S. Yu.: Introduction to Structurally Stable Systems of Differential Equations. — Birkhäuser 1992. [17.22] Reitmann, V.: Reguläre und chaotische Dynamik. — B. G. Teubner 1996.
1141 [17 23] Sauer, T., Yorke, J. A.; Casdagli, M.: Embedology. — J Stat Phys.. 65 C/4) A991) 579 616. [17 24] Takens, F.: Detecting stränge attractors in turbulence In Dynamical Systems and Turbu- lence Editors RAND, D. A.; Young, L. S. Lecture Notes in Mathematics 898. - Springer- Verlag 1981, 366-381 18. Optimierung [18 1] Bellman, R.: Dynamic Programming — Princeton University Press 1957 [18.2] BERTSEKAS, D.P.: Nonlinear Programming — Athena Scientific 1999. [18 3] Chvatal, V: Linear Programming — W.H Freeman 1983 [18.4] Dantzig, G.B.: Linear Programming and Extensions. — Princeton University Press 1998 [18 5] ELSTER, K.-H.: Einführung in die nichtlineare Optimierung — B G Teubner 1978. [18.6] Grossmann, C.; Kleinmichel, H.: Verfahren der nichtlinearen Optimierung — B G. Teubner, Leipzig 1976 [18 7] Grossmann, Terno, J.: Numerik der Optimierung — B G Teubner 1997 [18.8] KOSMOL: Methoden zur numerischen Behandlung nichtlinearer Gleichungen und Optimierungsaufgaben — B G. Teubner, 2 Auflage 1992 [18 9] Kost, B.: Optimierung mit Evolutionsstrategien. — Verlag Harri Deutsch 2003 [18 10] Krelle, W.; KÜNZI, H.P., Randow, R V.: Nichtlineare Programmierung - Springer- Verlag 1979. [18.11] Kuhn, H.W.: The Hungarian Method for the Assignment Pioblem — Naval Res Logist Quart , 2 A995) [18 12] Optimierung und optimale Steuerung Lexikon der Optimierung -- Akademie-Verlag 1986 [18 13] Pontrjagin, L S. et al.: Mathematische Theorie der optimalen Prozesse — Deutscher Verlag der Wissenschaften 1964 [18 14] Rockafellar, R.T.: Convex Analysis — Princeton University Press 1996 [18 15] Seiffart, E.; Manteuffel, K.: Lineare Optimierung — BSB B. G Teubner, Leipzig, (MINÖL, Bd. 14), 1974, Verlag H. Deutsch, (MINÖA, Bd 14), 1981 [18 16] THAPA, M.N.; DANTZIG, G.B.: Linear Programming 1. Introduction. Springer-Verlag 1997 19. Numerische Mathematik [19 1] Chapra, S.C.; Canale, R.P.: Numerical Methods for Engineers — McGraw-Hill Book Co 1989. [19.2] COLLATZ, L.: Numerical Treatment of Differential Equations. — Springer 1966 [19 3] Davis, P.J.; Rabinowitz, P: Methods of numerical Integration — Academic Press 1984 [19 4] De Boor, C.: A practical guide to splines — Springer-Verlag 1978 [19 5] Engeln-MÜllges, G.; Reutter, F.: Formelsammlung zur Numerischen Mathematik mit FORTRAN 77-Programmen. — Bibliographisches Institut 1988 [19 6] Engeln-MÜllges, G.; Reutter, F.: Numerische Mathematik für Ingenieure — Bibliographisches Institut 1987 [19 7] Engeln-MÜllges, G.; Reutter, F.. Numerik-Algorithmen. Entscheidungshilfe zur Auswahl und Nutzung — VDI-Verlag, Düsseldorf 1996 [19.8] Golub, G., ORTEGA, J.M.- Scientific Computing — B. G. Teubner 1996. [19 9] GROSSMANN, Ch.; ROOS, H.-G.: Numerik partieller Differentialgleichungen — B G Teubner 1992 [19 10] HÄMMERLIN, G ; Hoffmann, K.-H : Numerische Mathematik — Springer-Verlag, 4 Auflage 1994 [19 11] Heitzinger, W.; Troch, I.; Valentin, G.: Praxis nichtlinearer Gleichungen - C Hanser Verlag 1984
1142 22 Literatur [19.12] KIELBASINSKI, A.; SCHWETLICK, H.: Numerische lineare Algebra. Eine computerorientierte Einführung. — Verlag H. Deutsch 1988. [19.13] Knothe, K.; Wessels, H.: Finite Elemente Eine Einfuhrung für Ingenieure. — Springer Verlag 1992. [19 14] Lancaster, P; Salkauska, S.K.: Curve and Surface Fitting. — Academic Press 1986. [19.15] Locher, F.: Numerische Mathematik für Informatiker. — Springer-Verlag 1992 [19.16] Maess, G.: Vorlesungen über numerische Mathematik, Bd 1 u. 2. — Akademie-Verlag 1984- 1988 [19.17] Meinardus, G.; Merz, G.: Praktische Mathematik. Für Ingenieure, Mathematiker und Physiker, Bd. 1 u. 2. — Bibliographisches Institut 1979-82 [19.18] Meis, T.; Markowitz, U.: Numerische Behandlung partieller Differentialgleichungen - Springer-Verlag 1978. [19.19] MÜHLIG, H.; Stefan, F.: Approximation von Flächen mit Hilfe von B-Splines. — Wiss Z TU Dresden 1991 [19.20] MULANSKY, B.: Glättung mittels zweidimensionaler Tensorprodukt-Spline-Funktionen Wiss. Z TU Dresden 1990. [19.21] Myschkis, A.D.: Angewandte Mathematik für Physiker und Ingenieure. — Verlag H Deutsch 1981. [19.22] Reinsch, Chr.: Smoothing by Spline Functions — Numer. Math. 1967. [19.23] Samarskii, A.A.: Theorie der Differenzenverfahren. — Akademische Verlagsgesellschaft 1984. [19.24] SCHWARZ, H.R.: Methode der finiten Elemente. — B. G. Teubner Stuttgart, 3 Aufl. 1991. [19 25] SCHWARZ, H.R.; Kockler, N.: Numerische Mathematik. — B G. Teubner Stuttgart, Leipzig, Wiesbaden, 5. Aufl. 2005 [19.26] Schwetlick, H.; Kretzschmar, H.: Numerische Verfahren für Naturwissenschaftler und Ingenieure — Fachbuchverlag 1991. f [19.27] Späth, H.: Spline-Algorithmen zur Konstruktion glatter Kurven und Flächen. — Olden- bourg-Verlag 1983 [19.28] Stoer, J.; BULIRSCH, R.: Numerische Mathematik, Bd. 1 u 2. — Springer-Verlag 1989-90 [19 29] Stroud, A.H.: Approximate calculation of multiple integrals — Prentice Hall 1971 [19.30] Stummel, F.; Hainer, K.: Praktische Mathematik — B.G Teubner Stuttgart, 2 Auf! 1982 [19.31] TÖRNIG, W.: Numerische Mathematik für Ingenieure und Physiker, Bd. 1 u. 2 — Springer- Yerlag 1990 [19 32] Überhuber, C: Computer-Numerik 1, Computer-Numerik 2 — Springer-Verlag 1995. [19.33] Weller, F.: Numerische Mathematik für Ingenieure und Naturwissenschaftler. — Verlag Vieweg 1995. [19.34] WERNER, J.: Numerische Mathematik, Bd. 1 u. 2. — Verlag Vieweg 1992. [19.35] Willers, F.A.: Mathematische Maschinen und Instrumente — Akademie-Verlag 1951 [19.36] Willers, F.A.: Methoden der praktischen Analysis. — Akademie-Verlag 1951. [19.37] ZurmÜhl, R.: Praktische Mathematik für Ingenieure und Physiker. — Springer-Verlag 1984. 20. Computeralgebrasysteme [20 1] Benker, M. Mathematik mit Mathcad. — Springer-Verlag 1996 [20.2] Burkhardt, W. Erste Schritte mit Mathematica. — Springer-Verlag, 2. Auflage 1996 [20.3] Burkhardt, W.: Erste Schritte mit Maple. — Springer-Verlag, 2 Auflage 1996. [20 4] Char, Geddes, Gönnet, Leong, Monagan, Watt: Maple V Library, Reference Manual — Springer-Verlag 1991. [20.5] Davenport, J.H., Siret, Y.; Tournier, E.: Computer Algebra. — Academic Press 1993. [20 6] Gloggengiesser, H.: Maple V. — Verlag Markt & Technik 1993 [20 7] Grabe, H.-G.; Kofler, M. Mathematica Einführung, Anwendung, Referenz — Addison Wesley 1999.
1143 [20 8] Jenks, R D ; SuTOR, R.S.: Axiom. — Springer-Verlag 1992 [20 9] Kofler, M.: Maple V, Release 4, —Addison Wesley, (Deutschland) GmbH, Bonn 1996 [20 10] Maeder, R : Programmierung in Mathematica, Second Edition. — Addison Wesley 1991 [20 11] Wolfram, S : The Mathematica Book. — Cambridge University Press 1999 -- Addison Wesley 1992 21. Tabellen [21.1] Abramowitz, M.; Stegun, I. A.: Pocketbook of Mathematical Functions — Verlag H. Deutsch 1984. [21 2] Apelblat, A.. Tables of Integrals and Series. — Verlag H. Deutsch 1996 [21.3] Brytschkow, Ju A.; Maritschew, O.I.; Prudnikow, A.P.: Tabellen unbestimmter Integrale — Verlag H Deutsch 1992. [21.4] Emde, F.: Tafeln elementarer Funktionen. — B. G. Teubner, Leipzig 1959. [21 5] Gradstein,LS ; Ryshik, I.M.: Summen-, Produkt- und Integraltafeln, Bd 1 u. 2 --Verlag H Deutsch 1981 [21 6] GrÖbner, W.; Hofreiter, N.: Integraltafel, Teil 1. Unbestimmte Integrale, Teil 2: Bestimmte Integrale. — Springer -Verlag, Teil 1, 5 Auflage 1975, Teil 2, 5. Auflage 1973. [21.7] a) ISO 1000' 11 92-SI units and recommendations for the use of their multiples and of certain other units b) ISO 31-0 bis ISO 31-XIII [21 8] Jahnke, E.; Emde, F., LÖSCH, F.: Tafeln höherer Funktionen. — B G. Teubner, Leipzig 1960 [21 9] Madelung , E.: Die mathematischen Hilfsmittel des Physikers — Springer - Verlag, 7. Auflage 1964 [21.10] Magnus, W ; Oberhettinger, F.: Formeln und Sätze für die speziellen Funktionen der mathematischen Physik — Springer-Verlag 1948 [21 11] Meyer zur Capellen, W.: Integraltafeln. — Springer-Verlag 1950 [21 12] Mohr, P. J; Taylor, N.: physics.nist gov./constants, CODATA Recommcnded Values of the Fundamental Physical Constants J Phys. a. Chem. Ref. Data 28[6] A999). Rev Mod. Phys 72[2] B000) [21 13] Mohr, P. J; Taylor, N.: physics nist.gov./constants; CODATA Recommended Values of the Fundamental Physical Constants 2002 [21 14] Müller, H.P.; Neumann, P ; Storm, R.: Tafeln der mathematischen Statistik. — C Hanser Verlag 1979. [21.15] Poljanin, A D ; Saizew, V.F.. Sammlung gewöhnlicher Differentialgleichungen Verlag H Deutsch 1996 [21 16] PTB-Broschüre. Die gesetzlichen Einheiten in Deutschland. — Phys Techn. Bundesanstalt [21 17] Richtlinie 80/181/EWG des Rates über Einheiten im Meßwesen vom 20 12 1979 (Abl.Nr.L39/40 vom 15.12.1980. geändert durch Richtlinie 89/617/EWG.) [21 18] SCHÜLER: Acht- und neunstellige Tabellen zu den elliptischen Funktionen, dargestellt mittels des jACOBischen Parameters q — Springer-Verlag 1955 [21.19] SCHULER, M.; GEBELEIN, H.: Acht- und neunstellige Tabellen zu den elliptischen Funktionen — Springer-Verlag 1955 [21 20} Schütte, K.: Index mathematischer Tafelwerke und Tabellen — München 1966 22. Gesamtdarstellungen der höheren Mathematik [22 1] Abramowitz, M.; Stegun, I. A.: Pocketbook of Mathematical Functions — Verlag H Deutsch 1984. [22.2] Baule, B.: Die Mathematik des Naturforschers und Ingenieurs, Bd 1 u. 2. — Verlag H Deutsch 1979 [22 3] Berendt, G.; Weimar, E.. Mathematik für Physiker, Bd 1 u 2 — VCH, Weinheim 1990 [22 4] Bronstein, J.N.; Semendjajew, K.A.: Taschenbuch der Mathematik. — B G Teubner Leipzig 1976, 17 Auflage, Verlag H Deutsch 1977
1144 22 Literatur [22.5] Bronstein, J.N.; Semendjajew, K.A.: Taschenbuch der Mathematik. — B. G Teubner Leipzig 1989, 24., neubearbeitete Auflage, Verlag H Deutsch 1989, [22 6] Bronstein, J.N.; Semendjajew, K. A.: Taschenbuch der Mathematik, Ergänzende Kapitel. — Verlag H. Deutsch 1991. [22.7] Bronstein, J.N.; Semendjajew, K.A.; Musiol, G.; Mühlig, H.: Taschenbuch der Mathematik 5. überarbeitete und erweiterte Auflage — Verlag H. Deutsch 2000. [22.8] Bronstein, J.N.; Semendjajew, K.A.; Musiol, G.; Mühlig, H.: Handbook of Mathe- matics. 4th Edition — Springer-Verlag 2004. [22 9] Dallmann, H.; Elster, K.-H.; Elster, R.: Einführung in die höhere Mathematik, Bd 1- 3. — Gustav Fischer Verlag 1991. [22.10] Dreszer, J.: Mathematik-Handbuch für Technik und Naturwissenschaft. — Verlag H Deutsch 1975. [22.11] Fachlexikon ABC Mathematik. — Verlag H Deutsch 1978 [22.12] Fichtenholz, G.M.: Differential- und Integralrechnung, Bd. 1 u. 3. — Deutscher Verlag der Wissenschaften 1964, Verlag H. Deutsch 1989-92, seit 1994 Verlag H. Deutsch [22.13] Fischer, H.; Kaul, H.: Mathematik für Physiker, 1. — B. G. Teubner 1990. [22.14] Hainzl, J.: Mathematik für Naturwissenschaftler. — B. G. Teubner 1985. [22.15] Joos, G.; Richter, E.W.: Höhere Mathematik für den Praktiker. — Verlag H Deutsch 1994 [22.16] Kleine Enzyklopädie Mathematik. — Verlag Enzyklopädie, Leipzig 1967 — Gekürzte Ausgabe Mathematik Ratgeber. — Verlag H. Deutsch 1988. [22.17] Mangoldt, H. v.; Knopp, K., Hrg. F. Lösch: Einführung in die höhere Mathematik, Bd 1 bis 4 — S Hirzel Verlag 1989 [22 18] MARGENAU, H.; Murphy, G.M.: Die Mathematik für Physik und Chemie, Bd 1 u 2 — Verlag H Deutsch 1965-67. [22.19] Mathematik für Ingenieure, Naturwissenschaftler, Ökonomen und Landwirte — BSB BG Teubner, Leipzig, (MINÖL, Bd. 1 bis 23), 1973 bis 1981. Mathematik für Ingenieure, Naturwissenschaftler, Ökonomen und sonstige anwendungsorien- tierte Berufe. — Verlag H. Deutsch, (MINÖA, Bd. 1-23) 1973-1981. [22.20] NETZ, H.; Rast, J.: Formeln der Mathematik. — C. Hanser Verlag 1986 [22 21] Papula, L.: Mathematik für Ingenieure, Bd. 1 bis 3. — Verlag Vieweg 1994-1996 [22.22] PLASCHKO, P.; Brod, K.: Höhere mathematische Methoden für Ingenieure und Physiker — Springer-Verlag 1989. [22.23] Precht, M.; Voit, K.; Kraft, R.: Mathematik für Nichtmathematiker, Bd lu 2 - Oldenbourg-Verlag 1991. [22.24] Rothe, R.: Höhere Mathematik für Mathematiker, Physiker, Ingenieure, Teile I bis VII — BSB B G. Teubner Leipzig, Teile I bis V 1962 - 1965; B. G. Teubner Stuttgart, Teile VI, VII 1956 - 1958 [22.25] Schmutzer, E.: Grundlagen der theoretischen Physik, Bd. 1 u. 4. — Deutscher Verlag der Wissenschaften 1991 [22.26] Smirnow, W.L: Lehrgang der höheren Mathematik, Bd. 1 bis 5. — Deutscher Verlag der Wissenschaften 1953; Verlag H. Deutsch 1987-1991, seit 1994 im Verlag H. Deutsch unter dem Titel Lehrbuch der höheren Mathematik. [22.27] Stöcker, H.: Taschenbuch mathematischer Formeln und moderner Verfahren. — Verlag H Deutsch, 3 Auflage 1995. [22 28] Zeidler, E. (Hrsg.). Teubner-Taschenbuch der Mathematik. — B. G. Teubner, Stuttgart, Leipzig, Teil 1 1996, Teil 2 1995.
Stichwortverzeichnis 1145 Stichwortverzeichnis Abbildung, 303, 305 äquivalente, 869 Bäcker-, 850 Bernoulli-Shift-, 852 bijektive, 306, 620 chaotische, 852 eineindeutige, 305 Einheitskreis, 869 Funktion. 49 geliftete, 869 Henon-, 822, 836 Hufeisen-, 850 injektive. 305, 620 Kern, 312 komplexe Zahlenebene, 706 kontrahierende, 628 lineare, 327, 329, 620 Modulo-, 840 Poincare-, 834 reduzierte, 861 reguläre, 328 Rotations-, 841 Shift-, 844, 852 surjektive, 306, 620 topologisch konjugierte, 837 Umkehr-, 306 Zelt-, 840 zwischen Gruppen, 312 Abbildung, konforme, 696 Exponentialfunktion, 701 Fixpunkt, 698 gebrochenlineare Funktion, 698 Inversion, 698 Kreisverwandtschaft, 698 lineare Funktion, 697 Logarithmus, 701 quadratische Funktion, 699 Quadratwurzel, 700 Summe aus linearer u gebrochenlinearer Fkt , 700 Abbrechpunkt, 240 AßELsche Gruppe, 309 Integralgleichung, 611 Abgeschlossenheitsrelation, 638 Abhängigkeit, lineare lineare Gleichungssysteme, 280 Vektorraum, 327 Ableitung äußere, 397 Bruch, 397 Distribution, 661 eine Veränderliche, 394 FRECHET-, 652 Funktion elementare, 395 implizite, 398 inverse, 398 komplexe, 693 mehrere Veränderliche, 408 mittelbare, 397 Parameterdarstellung, 399 gemischte, 411 höherer Ordnung, 401, 411 inverse Funktion, 402 Parameterdarstellung, 402 innere, 397 linksseitige, 395. logarithmische, 397 partielle, 408 räumliche, 671 rechtsseitige. 395 Richtungs-, 670 Tabelle, 396 Vektorfunktion, 663 verallgemeinerte, 660 Volumen-, 670 Abschlag, 21 Abschließung einer Menge, 627 Abschluß, transitiver, 305 Abschreibung, 26 arithmetisch-degressive, 26 digitale. 27 geometrisch-degressive, 27 lineare, 26 Abschreibungsgefälle, 26 Absolutbetrag komplexe Zahl, 35 Vektor, 185 Absolutglieder, 280 absolutintegrier bar, 472 absolutkonvergent, 472 absolutstetig, 659 Absorptionsgesetz Aussagenlogik, 296 BoOLEsche Algebra, 355 Mengen, 302 Abstand Ebenen, 223 Gerade, 201 Hamming, 625 metrischer Raum, 624 Punkt-Ebene, 222 Punkt -Gerade, 224 sphärischer, 163 zwei Geraden, 225 zwei Punkte, 197 zwei Punkte, Raum, 218 Abstieg, 925 Abstiegsverfahren, 895 Abszisse, 195, 214 Abszissenachse, 195 Abweichung Meßfehler, 811 signifikante, 802 Abwickelkurve, 244 Adäquatheitstest, 806 Addition, 969 komplexe Zahlen, 36
Addition Attraktor Polynome, 11 rationale Zahlen, 1 Additionstheoreme Areafunktionen, 94 Hyperbelfunktionen, 91 inverse trigonometrische Funktionen, 87 trigonometrische Funktionen, 80, 82 Additivität, cr-Additivität, 656 Adjazenz, 361 Adjazenzmatrix, 363 Adjunkte, 267 Admittanzmatrix, 368 Ahnlichkeitsdifferentialgleichung, 506 Ahnlichkeitstransformation, 288, 289 Äquivalenz Beweisführung, 5 logische, 296 topologische, 834 Wahrheitstafel, 295 Aquivalenzklasse, 306 Aquivalenzrelation, 306 Algebra BoOLEsche, 355, 770 endliche, 356 BORELsche er-, 656 Faktor-, 353 freie, 354 kommutative, 634 lineare, 259 normierte, 634 ft-Algebra, 353 D-Unteralgebra, 353 Schalt-, 355, 358 «T-Algebra, 655 BORELsche, 656 Term-, 354 universelle, 353 Algorithmus Aitken-Neville, 946 Dantzig, 371 EuKLlDischer, 3, 14 naturliche Zahlen, 333 Polynomringe, 325 FORD-FULKERSON, 372 GAUSSscher, 284, 918 Graphentheorie, 361 Kruskal-, 369 Maximalstrom, 372 QR-Algorithmus, 291 Rayleigh-Ritz, 291 Remes, 953 Romberg, 928 Satz zum EuKLlDischen, 334 Allquantor, 298 a-Grenzmenge, 823, 829, 836 a-Schnitt, 378 scharfer, 378 Alternantenpunkt, 951 Alternantensatz, 951 Altgradeinteilung, 133 Amplitude, 76, 83 Amplitudenfunktion, 726 Amplitudenspektrum, 750 Analyse harmonische, 954 Multi-Skalen-, 766 Anfangsbedingungen, 504 Anfangsphase, 76, 83 Anfangswertaufgabe, 504, 931 Anhangen, polares, 150 Ankathete, 133 Annuität, 23 Annuitätentilgung, 24 Annulator, 644 ANOSOV-Diffeomorphismus, 852 Ansatzverfahren, 936, 939 Antikink-Soliton, 570 Antisoliton, 569 Apollonius, Satz, 204 Applikate, 214 Approximation, 945 5-Funktion, 740 gleichmäßige, 951 im Mittel, 947 Einordnung, 418 sukzessive BANACH-Raum, 642 Differentialgleichungen, 513 Integralgleichungen, 587 TschebYSCHEFFsche, 951 Zahlen, 4 Approximationsaufgaben Lösung durch Extremwertbestimmung, 418 Approximationsproblem, 636 Approximationssatz Liouville, 4 Weierstrass, 627 Arbeit allgemein, Integration, 486 speziell, Integration, 467 ARCHlMEDlsche Spirale, 105 Areafunktion, 92 Areakosinus, 92 Areakotangens, 93 Areasinus, 92 Areatangens, 93 Argument, 48, 120 ARNOLD-Zunge, 871 Artikelnummer, europaische, 343 ASCII, 965 Assoziativgesetz Aussagenlogik, 296 BoOLEsche Algebra, 355 Matrizen, 262 Mengen, 302 Tensoren, 272 Vektormultiplikation, 189 Astroide Definition, 104 Flächeninhalt, Integration, 491 Asymptote, 241 Definition, 241 Kurve, 238 Attraktor, 824 chaotischer, 852
Attraktor BESSELsc/ie fraktaler, 852 Henon-, 849, 852 hyperbolischer, 852 Lorenz-, 850 seltsamer, 852 Aufgabe diskrete, 948 mehrdimensionale, 949 stetige, 947 Auflösung, Torus, 868 Aufschlag, 21 Aufzinsungsfaktor, 22 Ausdruck algebraischer, 10 Manipulation, 1010 allgemeingültiger, 297, 299 analytischer, 49 Definitionsbereich, 49 explizite Darstellung, 49 implizite Darstellung, 49 Parameterdarstellung, 50 Aussagenlogik, 295 BoOLEscher, 356 finiter, 935, 938 ganzrationaler, 11 gebrochenrationaler, 11, 14 Interpretation, 298 irrationaler, 11, 17 nichtalgebraischer, Manipulation, 1012 Prädikatenkalkül, 298 Prädikatenlogik, 298 transzendenter, 11 vektoranalytischer, 680 Ausgangsgrad, 361 Ausgleichsaufgabe lineare, 920 nichtlineare, 110, 924 verschiedene Bezeichnungen, 418 Ausgleichsrechnung, 945, 947 diskrete Aufgabe, 948 mehrdimensionale Aufgabe, 949 Meßfehler, 811 stetige Aufgabe, 947 Ausgleichssplines, 960 bikubische, 962 kubische, 960 Ausklammern, 11 Auslöschung, 969 Aussage duale, 355 logische, 295 Aussagenlogik, 295 Ausdruck, 295 Grundgesetze, 296 Aussagenvariable, 295 Aussagenverbindung, 295 extensionale, 295 Austauschschema, 279 Austauschschritt, 279 Austauschverfahren, 279, 282 Matchings, 370 Autokorrelationsfunktion, 842 Axialfeld, 664 Axiome abgeschlossene Menge, 627 der Halbnorm, 645 einer Algebra, 634 geordneter Vektorraum, 621 metrischer Raum, 624 normierter Raum, 631 offene Menge, 626 Skalarprodukt, 635 Vektorraum, 616 Azimut, 164 Azimutalgleichung, 562 Bahn, elementare, 371 BAiREsche Kategorie, 2 , 839 BAIRSTOW-Verfahren, 916 BANACH-Raum, 632 Beispiele, 633 Reihe, 632 Bandstruktur, 922 Basis kontravariante, 274 kovariante, 274 Potenz, 8 Vektorraum, 327, 619 Basisinverse, 877 Basissatz, 312 Basisvariable, 877 Basisvektor kontravarianter, 274 kovarianter, 274 Baum, 367 geordneter binärer, 368 Höhe, 367 regulärer binärer, 367 Wurzel, 367 BAYESscher Satz, 773 B-B-Darstellung Flache, 962 Kurve, 962, 963 Bedienungstheorie, 792 Bedingung Caratheodory, 651 DiRiCHLETsche, 438 Kuhn-Tucker, 889 Belegung, Wahrheitswert, 296 Beobachtungswert, 811 Bereich, zulässiger, 874 BERGEscher Satz, 370 Bernoulli, Gesetz der großen Zahlen, 787 BERNOULLi-L'HosPiTALsche Regel, 56 BERNOULLISche Ungleichung, 31 Zahlen, 428 BERNOULLI-SHIFT-Abbildung, 852 BERNSTEiNsche Grundpolynome, 962 Besetztheit, schwache, 922 Besetzungszahl, 796 BESSEL-Funktion, 527 modifizierte, 528 BESSELsche Differentialgleichung, 526, 745 Ungleichung, 638
Bestapproximation Clebsch-Gordan Bestapproximation, 638 Betafunktion, 1086 Beweis direkter, 5 durch Widerspruch, 5 indirekter, 5, 297 konstruktiver, 6 Schluß von n auf n + 1, 5 vollständige Induktion, 5 Beziehung, <-Beziehung, 299 Bibliotheken numerischer Verfahren, 973 Aachener , 975 IMSL-, 974 NAG-, 974 Bifurkation Bogdanov-Takens-, 860 Flip , 862 Gabel-, 859. 863 globale, 856, 864 homokline, 866 Hopf-, 857, 860 Kodimension, 856 lokale, 856 Sattelknoten-, 857 Spitzen 859 transkritische, 857 Bild Funktion, 49 Unterraum, 328 Bildbereich. 730 Menge, 49 Bildfunktion, 730 Binom lineares, 71 quadratisches, 71 Binomialkoeffizient, 13 Binomialverteilung, 777 Binormale, Raumkurve, 246. 248 Bisektionsverfahren. 291 Bit, 965 Bitumkehr, 958 Bogen, Graph. 361 Kette, 371 Länge, 364 Bogendifferential, 253 Bogenelement, 233 Bogenfolge, 371 Bogenlänge ebene Kurve, 144, 466 Ellipse, 205 Hyperbel, 208 Kreissegment, 144 Kurvenintegral 1 Art, 482 Parabel, 210 räumliche Kurve, Integration, 482 Raumkurve. 254 Bogenmaß 133 Bogenschnitt, 153 Bolzano-Weierstrass- Eigenschaft, 648 BoOLEsche Algebra. 355, 770 endliche, 356 Funktion, 296, 356 n-stellige, 356 Variable, 356 BoOLEscher Ausdruck, 356 BOREL- Menge. 656 BORELsche cr-Algebra, 656 Brachistochronenproblem, 573 Bravais-Gitter, 320 Breite, geographische, 165, 252 Breit WiGNER-Kurve 95, 754 Brennpunkt Ellipse; 204 Hyperbel, 206 Parabel, 208 Brennpunktradius, 206 Briefträgerproblem, chinesisches, 366 Bruch Dezimal-, 1 echter, 15 Ketten-, 3 unechter. 15 Byte, 965 Cantor Funktion, 871 Menge, 846, 847, 850 CARATHEODORY-Bedingung, 651 CARDANOsche Formel, 41 Carson Transformation, 731 CASSiNlsche Kurve, 100 CAUCHY-Folge, 628 CAUCHY-Integral, 613 CAUCHY-RiEMANNsche Differentialgleichung, 694 CAUCHYsche Integralformel. 711 Anwendungen. 717 CAUCHYscher Hauptwert 474 CAUCHYsches Prinzip, 628 CAUCHYsches Problem, 536 CAUCHY-SCHWARZsche Ungleichung, 31 CAVALiERisches Prinzip, 467 CAYLEY Satz, 312 368 Tafeln, 309 Chaos, 566, 821, 868 eindimensionale Abbildungen, 852 seltsame Attraktoren, 852 Übergänge zum Chaos, 865 über Intermittenz, 869 vom Torus zum Chaos 868 Wege zum Chaos, 856 Charakter Darstellung, 315 Gruppenlement, 314 charakteristischer Streifen, 537 X2-Aiipassungstest, 798, 799 Chiffrierung s Kryptologie, 346 Chinesischer Restsatz, 338 X2-Verteilung, 785 Cholesky Verfahren 286, 920 Zerlegung, 920 CLAiRAUTsche Differentialgleichung, 509, 538 Clebsch Gordan Koeffizient, 316
Clebsch-Gordan Differential Reihe, 316 Theorem, 316 Code Abstand, 343 ASCII, 965 fehlerkorrigierender, 343 linearer, 344 t- fehlerkorrigierender, 343, 344 ^-perfekt, 344 zyklischer, 344 Codewort. 343 Codierung, 341 Computeralgebrasysteme Anwendungen, 1010 Differential- und Integralrechnung, 1023 Elemente der linearen Algebra, 1019 Funktionen, 985 Gleichungen und Gleichungssysteme, 1015 Graphik, 1030 Hauptstrukturelemente, 984 Infix-Form, 985 Listen, 985 Manipulation algebraische Ausdrucke, 1010 Mengen, 985 Objekte, 984 Operatoren, 985 Präfix-Form, 985 Programmierung, 984 Suffix-Schreibweise, 985 Terme, 985 Typen, 984 Variable, 985 Zahlen, 984 Zielstellungen, 982 Computernutzung, 965 CORNU-Spirale, 107 COULOMB-Feld, Punktladung, 667, 690 CRAMERsche Regel, 283 Dampfung, Schwingungen, 84 Dämpfungsparameter, 924 D'ALEMBERTsche Formel, 556 DARBOUXscher Vektor, 250 Darstellung adjungierte, 313 äquivalente, 314 direkte Summe, 315 direktes Produkt, 315 Eigenschaften, 313 explizite, 49 Gruppe, 313 inäquvalente, 314 irreduzible, 315 treue, 313 unitäre, 313 Unterräume, 314 vollständig reduzible, 316 Darstellungsmatrix, 313 Darstellungsraum, 313 Darstellungssatz, 378 Datentyp, 353 Deckabbildung, 309 Decodierung, 343 DEDEKlNDscher Schnitt, 301, 307 Defekt, 936, 940 Vektorraum, 328 definit negativ, 289 positiv, 289, 920 Definitionsbereich, 121 Funktion, 48 Menge, 49 Operator, 620 Deflation, 293 Defuzzifizierung, 388 Dekrement, logarithmisches, 84 DELAMBREsche Gleichungen, 172 E-Distribution, 661 5-Funktion, 656, 661 Anwendungen, 740 Approximationen, 740 DiRACsche, 737 E-Funktional, 644 Deltatensor, 273 de MORGANsche Regel, 297, 302 BoOLEsche Algebra, 355 Derive, 982 DESCARTESsche Regel, 45 Determinante, 267 Berechnung, 269 Differentiation, 269 Funktional-, 653 Jacobi-, 653 Multiplikation, 269 Nullwerden, 268 Rechenregeln, 268 Spiegelung, 268 Wronski-, 518, 826 Deviationsmoment, 271 Dezimalbruch, 1 irrationale Zahlen, 2 Dezimalsystem, 965 Dezimalvorsätze, 1043 Dezimalzahl, 965 normalisierte, 968 Dezimalzahldarstellung, 965 Diagonalmatrix, 260 Diagonalstrategie, 919 Diagonalverfahren, MAXWELLsches, 706 Dichtemittel, Meßwerterfassung, 797 Diedergruppe, 309 Diffeomorphismus, 822 Anosov, 852 orientierungstreuer, 870, 871 Differential 2 Ordnung, 411 Begriff, 408 Bogen, 253 Haupteigenschaften, 409 höherer Ordnung, 410 Integrabilität, 485 partielles, 410 totales, 410 vollständiges, 410, 411 n-ter Ordnung, 412 2 Ordnung, 411
Differential - Operationen Differentiation Differential-Operationen räumliche, 670 Rechenregeln, 679 Übersicht, 679 Vektorkomponenten, 680 Verknüpfungen, 679 Differential-Operatoren Maple, 1007 nichtlineare, 651, 652 Hammerstein-, 651 Nemytskij-, 651 Urysohn -, 652 räumliche, 670, 677 Divergenz, 673 Gradient, 671 LALACE-Operator, 678 Nablaoperator, 677 Rotation, 675 Vektorgradient, 673 Differentialgeometrie, 232 Differentialgleichung, 504 1 Ordnung, allgemeine Lösung, 504 Anfangsbedingungen 504 Anfangswertaufgabe, 504 auf dem Toms, 827, 870 autonome, 824 BERNOULLlsche, 508 BESSELsche, 526 CLAlRAUTsche, 509, 538 definierende Gleichung, 526 Differentialvariationsgleichung, 972 Eigenfunktion, 533, 560 Eigenwert, 533, 560 elliptischer Typ, 540, 542 EULERsche, 522 Variationsrechnung, 575 exakte, 506 Existenzsatz, 505 Fluß, 821 FOURIER-Transformation, 754 gewöhnliche, 504 genäherte Integration, 931 lineare, 754 graphische Integration, 514 HAMiLTONsche, 825, 867 HELMHOLTZsche, 559 HERMiTEsche, 532 homogene, 506 hyperbolischer Typ, 540, 542 hypergeometrische, 531 implizite, 504, 509 Integral, 504 Integralfläche, 536 Integralkurven, 505 integrierender Faktor, 507 konstante Koeffizienten, 518, 744 LAGRANGEsche, 509 LAGUERREsche. 531 LAPLACEsche, 691 LEGENDREsche, 529 lineare, 825 1 Ordnung, 507 2 Ordnung, 525 Hauptsatz. 826 homogene. 826 inhomogene, 825 mit periodischen Koeffizienten, 827 n-ter Ordnung, 518 Lösung, 504 Matrix-Differentialgleichung, 826 numerische Integration, 514 Orthogonalitätsrelation, 533 parabolischer Typ, 540, 542 partielle, 535, 746, 755 1 Ordnung, 535 2 Ordnung, 540 genäherte Integration, 938 lineare, 535 nichtlineare, 566 quasilineare, 535 vollständiges Integral, 537 partikuläre Lösung, 504 PoiSSONsche, 557, 689, 691 Quadratur, 519 Randwertaufgabe, 504 Randwertbedingungen, 504 Randwertproblem, 532 reduzierte, 856 RiCCATische, 508 Richtungsfeld, 505 selbstadjungierte, 532 Semifluß, 821 Separationsansatz, 559 singulärer Punkt, 511 steife, 935 topologisch äquivalent, 834 ultrahyperbolischer Typ, 542 Van DER-Po-Lsche 859 Variation der Konstanten, 519 veränderliche Koeffizienten, 745 vollständig integrier bare, 540 WEBERsche. 564 Differentialgleichungen CAUCHY-RiEMANNsche, 548 Charakteristik des Systems, 536 charakteristische Streifen, 537 charakteristisches System, 535 Feldtheorie 691 Fundamentalsystem, 518 höherer Ordnung, 515 kanonisches System, 537 Normalform, 522 Normalsystem. 538 partielle, 535 Superpositionssatz, 518 System linearer, 522 Systeme, 515 Zerlegungssatz, 518 Differentialquotient (s auch Ableitung), 394 Differentialrechnung, 394 Hauptsätze, 403 Differentialtransformation, affine. 696 Differentiation Funktion
Differentiation Dreieck eine Veränderliche, 394 elementare, 395 implizite, 398, 413 inverse, 398 komplexe, 693 mehrere Veränderliche, 408 Parameterdarstellung, 399 graphische, 399 Grundregeln, 395 höherer Ordnung inverse Funktion, 402 Parameterdarstellung, 402 logarithmische, 397 mehrere Veränderliche, 413 mittelbare Funktionen, 413 Quotientenregel, 397 unter dem Integralzeichen, 476 Vektorfunktion, 663 zusammengesetzte Funktion, 413 Differentiationsregeln Ableitung höherer Ordnung, 401 Funktion einer Veränderlichen, 395 Funktion mehrerer Veränderlicher, 395, < Tabelle, 400 Vektoren, 663 Differenz, 303 beschränkte, 380 symmetrische, 303 Differenzenbildung finite Ausdrucke, 935 Z-Transformation, 759 Differenzengleichung, 757, 938 2 Ordnung, 762, 763 lineare, 761 Randwerte, 763 Differenzenquotient, 925 Differenzenschema, 18 Differenzenverfahren, 553, 935, 938 Differenzierbarkeit Funktion einer Veränderlichen, 394 Funktion mehrerer Veränderlicher, 410 komplexe Funktion, 693 nach den Anfangsbedingungen, 821 stetige, 652 Diffusionsgleichung, 571 dreidimensionale, 556 Diffusionskoeffizient, 557 Dimension, 845 auf invariante Maße zurückgehende, 848 Douady-Oesterle-, 850 Einbettungs-, 853 eines Maßes, 848 Hausdorff-, 846 Informations-, 848 Kapazitats-, 847 Korrelations-, 848 Lyapunov-, 849 metrische, 845 obere punktweise, 848 Renyi-, 849 untere punktweise, 848 Vektorraum, 327, 619 verallgemeinerte, 849 Dimensionsformel, 328 DiRAC-Maß, 656 DiRACsche Distribution, 661 DlRACscher Satz, 367 DlRlCHLETsche Bedingung, 438 DiRiCHLETsches Problem, 547, 691 disjunkt, 301 Disjunktion, 295 Diskretisierungsfehler globaler, 934 lokaler, 934 Diskretisierungsschrittweite, 925 Diskriminante, 540 Dispersion, 776 Distanz, metrischer Raum, 624 Distanzmatrix, 364 Distribution, 660, 661, 740 DiRACsche, 661 reguläre, 661 * Distributionsableitung, 660 Distributionstheorie, 737 Distributivgesetz Aussagenlogik, 296 Boc-LEsche Algebra, 355 Matrizen, 262 Mengen, 302 Ring,Körper, 323 Tensoren, 272 Vektormultiplikation, 189 Divergenz Differential-Operation Definition, 673 Hinweis, 671 mit Nablaoperator, 677 Vektorfeld, 673 Vektorkomponenten, 680 verschiedene Koordinaten, 674 Zentralfeld, 674 Reihe, 425 Zahlenfolge bestimmte, 421 unbestimmte, 421 Division, 969 komplexe Zahlen, 37 Polynome, 14 rationale Zahlen, 1 Dodekaeder, 158 Doppelgerade, 211 Doppelintegral, 488 Anwendungen, 491 Doppelpunkt, Kurve, 240 Drehfehler, 342 Drehungsinvarianz, 273 Drehungsmatrix, 196, 217, 265 orthogonale, 270 Drehungswinkel, 218 Dreibein, begleitendes, 246 Dreieck Bestimmungsgrößen, 135 ebenes, 135 Flächeninhalt, 145, 147, 199 Grundaufgaben, 147 Inkreisradius, 146
Dreieck Element rechtwinkliges, 145 Sätze des Euklid, 145 schiefwinkliges, 145, 146 Tangensformeln, 146 Umkreisradius, 146 EuLERsches, 168 gleichschenkliges, 135 gleichseitiges, 135 Höhe, 135 Inkreis, 135 Mittellinie, 136 Mittelsenkrechte, 135 Orthozentrum, 135 PASCALsches, 13 rechtwinkliges, 136 Schwerpunkt, 135 Seitenhalbierende, 135 sphärisches, 166 Berechnung, 173 EuLERsches, 168 Grundaufgaben, 173 rechtwinkliges, 173 schiefwinkliges 175 Umkreis, 135 Winkelhalbierende, 135 Dreiecke ähnliche, 137 kongruente, 136 Dreieckskoordinaten, 944 Dreiecksmatrix, 261 obere, 261 untere, 261 Dreiecksschema, 18 Dreiecksungleichung komplexe Zahlen, 30 metrischer Raum, 624 Normaxiome. 266 Normen, 631 reelle Zahlen, 30 unitärer Raum, 635 Vektoren, 186 Dreieckszerlegung. 918 Dreifachintegral, 491 Anwendungen, 497 Dreikant, 168 Dritter, ausgeschlossener 296 Druck, Integration, 468 dual. 355 Dualisieren. 355 Dualität lineare Optimierung, 882 nichtlineare Optimierung. 889 Dualitätssatz, starker, 890 Dualitätsprinzip, BoOLEschen Algebra, 355 Dualsystem, 965 Dualzahl, 965 DuHAMELsche Formel, 745 Durchmesser, 143 Ellipse, 204 Hyperbel, 207 konjugierter Ellipse, 204 Hyperbel. 207 Parabel, 209 Durchschnitt, 301 Fuzzy-Mengen, 379 Mengen, 301 unscharfe Mengen, 378 Ebene Punkte. 197 Raum, 154, 220 rektifizierende, 246. 248 Vektorgleichung, 193 Ebenen Orthogonalitätsbedingung, 223 parallele. 154 Abstand, 223 Parallelitätsbedingung, 223 Ebenengleichung, 220 Achsenabschnittsform, 221 allgemeine, 220 HESSEsche Normalform, 221 Ecke, 155 dreiseitige. 155 konvexe. 155 symmetrische, 155 Eigenfunktion, 533, 560 Integralgleichung, 585, 590 normierte, 534 Eigenvektor Eigenwertaufgaben, 286 Hauptachsenrichtung, 272 Operator, 643 Eigenwert, 286, 533, 560 Integralgleichung, 585 590 Operator, 643 Eigenwertaufgabe, 286 Eigenwertbedingung, 287 Eigenwertproblem allgemeines, 286 spezielles, 286 Einbettung, 853 Einbettungsdimension, 853 Eingangsgrad. 361 Einheitliches Kontormmmernsystem EKONS, 342 Einheitsmatrix, 261 Einheitsvektor, 186, 188 Einheitswurzel, 956 Einhüllende, Kurvenscharen, 244 Einschrittverfahren, 932 EiNSTElNsche Summenkonvention. 270 Einzahlung einmalige. 22 nachschüssige. 22 regelmäßige, 22 unterjährige, 22 vorschüssige, 22 Einzelschritt verfahren, 922, 924 Einziel verfahren, 937 Einzugsgebiet, 824 Element, 300 finites. 553, 941 generisches, 839 inverses, 309 neutrales, 308
Element Exzentrizität, numerische positives, 621 singuläres, 510 Elementardisjunktion, 358 Elementarereignis, 770 Elementarformel, 298 Elementarintervall, 457 Elementarkonjunktion, 358 Elementarzelle Kristallgitter, 320 nichtprimitive, 320 primitive, 320 Elementbeziehung, 300 Eliminationsprinzip, GAUSSsches, 284 Eliminationsschritt, 918 Ellipse, 204 Binom, 71 Bogen, 205 Brennpunktseigenschaften, 204 Definition, 204 Durchmesser, 204 Flächeninhalt, 205 Halbparameter, 204 Krümmungskreisradius, 205 Tangente, 204 Transformation, 211 Umfang, 205 Ellipsengleichung, 204 Ellipsoid, 226 Fläche 2 Ordnung, 230 imaginäres, 230 Mittelpunksfläche, 230 Endomorphismus, 621 Endpunkt, 361 Entartung, 561 Entfernungsmatrix, 364 Entropie metrische, 843 topologische, 843, 853 verallgemeinerte, 849 Entwicklung FOURIER-Entwicklung, 440 LAURENT-Entwicklung, 714 McLAURiN-Entwicklung, 435 TAYLOR-Entwicklung, 405, 434 Entwicklungskoeffizient, 188 Entwicklungssatz, LAPLACEscher, 267 Enveloppe, 244 Epitrochoide, 105 Epizykloide, 103 verkürzte, 105 verlängerte, 105 Epsilontensor, 273 ERASTOSTHENES-Sieb, 330 Ereignis, 770 Elementar-, 770 sicheres, 770 unabhängiges, 773 unmögliches, 770 zufälliges, 770 Ereignisart, 770 Ereignismenge, 770 Ereignissystem, vollständiges, 773 Erfüllungsgrad, 387 Ergiebigkeit, Quelle, 690 Erwartungswert, 776 Erweiterungsprinzip, 382 Erzeugende, 159 geradlinige, Fläche, 229, 257 Erzeugendensystem, 310 EuKLiDische Norm, 328 Vektornorm, 266 EuKLlDischer Algorithmus, 3, 14 Polynomringe, 325 Vektorraum, 328 EuLER-HiERHOLZER-Satz, 365 EuLERsche Differentialgleichung, 522 Formel, 255 Formeln, 437 Funktion, 341 Konstante, 477 Linie, 365 Relation, 36 komplexe Zahlen, 721 Winkel, 218 Zahlen, 429 EuLERscher Polyedersatz, 159 EuLERsches Integral 1 Gattung, 1086 Integral 2 Gattung, 476 Polygonzugverfahren, 931 Evolute, 244 Evolutionsfunktion, 567 Evolutionsgleichung, 567 Evolutionsstrategien, 897 Evolvente, 244 des Kreises, 107 Exponent, 8 Exponentialfunktion allgemeine, 721 komplexe, 701 naturliche, 720 Exponentialsumme, 73 Exponentialverteilung, 783 Extensionalitätsprinzip, 300 Extrapolationsprinzip, 929 Extremale, 574 Krümmungsradius, 578 Extremwert, 51, 405 absoluter, 405 relativer, 405 von Funktionen, 417 Extremwertbestimmung, 406 allgemeine Regel, 407 globale Extremwerte, 407 höhere Ableitung, 406 implizite Funktion, 407 Nebenbedingungen, 419 Vorzeichenvergleich, 406 Exzentrizität, numerische Ellipse, 204 Hyperbel, 206 Kurve 2 Ordnung, 212 Parabel, 208
Exzeß, sphärischer Fläche Exzeß, sphärischer, 168 Faktor Multiplikation. 7 Polynome, 43 Faktoralgebra, 353 Faktorgruppe, 312 Faktormenge, 306 Faktorregel. 395 Faktorring. 324 Fakultät, 13, 479 FALKsches Schema, 263 Faltung einseitige, 752 FOURIER-Tiansformation, 752 LAPLACE-Transformation, 736 Z-Transformation. 759 zweiseitige. 752 Fehler Abbruchfehler, 971 absoluter, 815, 968 Maximalfehler, 815 definierter, 816 Diskietisierungsfehler, 971 einfacher mittlerer. 812 Eingangsfehler, 970 Einzelmessung, 813 Fehlerfunktion, 478 Meßfehlereinteilung qualitative Merkmale, 811 quantitative Merkmale, 813 mittlerer. 812, 814, 815 quadratischer 438, 814, 815 prozentualer, 815 relativer, 815, 968 Maximalfehler, 816 Resultatfehler, 969 Rundungsfehler, 971 scheinbarer, 814 Standardabweichung, 814 Verfahrensfehler, 971 wahrer, 813 wahrscheinlicher. 812-815 Zusammenhang zwischen Fehler arten, 813 Fehlerabschätzung Iterationsverfahren, 924 Mittelwertsatz, 405 Fehleranalyse. 819 Fehlerarten, Computerrechnen, 970 Fehlerfortpflanzung, 818 Fehlerfortpflanzungsgesetz. GAUSSsches, 815, 818 Fehlergleichung, 920 Fehlerintegral, GAUSSsches, 478, 782 Fehlerkorrektur, Codes, 343 Fehlernormalverteilung, 812 Fehlerorthogonalität, 936 Fehlerquadratmethode, 110, 285, 936, 940, 947 Ausgleichsrechnung, 811 GAUSSsche Einordnung, 418 Regressionsanalyse, 803 Fehlerquadratsumme, 285, 921, 948 Fehlertheorie direkte Aufgabe, 970 inverse Aufgabe; 970 Fehler verteilungsdichte. 811 FEIGENBAUM-Konstante, 863, 865 Feld Axialfeld, 664 COULOMB-Feld, Punktladung, 667, 690 Fluß, 685 Gravitations Feld, Punktmasse, 690 konservatives, 683 Kreisfeld, 667 Kugelfeld, 664 NEWTONsches, 667 Potentialfeld, 683 Quellenfeld, 689 Skalarfeld, 664 Superposition, 690 zentralsymmetrisches, 664 zylindersymmetrisches, 664 Feldfunktion, 703 Feldlinie, 669 Feldtheorie Differentialgleichungen, 691 Grundbegriffe, 663 FEM, 940 Fernpunkt, 198 Festpunktzahl, 966. 967 FFT. 955 FlBONACCI Folge, 334 Zahlen, 334, 871 Finanzmathematik, 21 Fixpunkt konforme Abbildung, 697, 698 stabiler, 862 Fixpunktgleichung, 911 Fixpunktsatz Banach, 628, 651 Brouwer, 653 Schauder, 653 Fläche, 251 2 Ordnung, 226, 230 Gestalt, 230 Invariantenvorzeichen, 230 Mittelpunktsflächen, 230 1 quadratische Fundamentalform, 254 2 quadratische Fundamentalform, 256 abwickelbare, 258 B-B-Darstellung, 962 Darstellung mit Splines, 959 GAUSSsche Krümmung, 257 geodätische Linie 258 geradlinige Erzeugende, 229, 257 Gleichung, 219 Hauptkrümmungskreisradius, 255 Hauptnormalschnitt, 255 Kegelfläche, 220 konstanter Krümmung. 257 Krümmungslinie, 256 Krümmung von Kurven, 255 Linienelement, 253 Metrik, 254 Minimalfläche, 257 mittlere Krümmung, 257
Fläche FOURIER-Transformaüon Normalenvektoi, 252 orientierte, 499 Regelfläche, 257 Rotationsfläche, 220 Tangentialebene, 252, 253 transversale, 830 Zylinderfläche, 220 Flächenelement, 254 Ebene, Tabelle, 492 gekrümmte Flächen, 499 Integralrechnung Tabelle, Ebene, 492 Tabelle, Raum, 499 Parameter form, 498 Vektorkomponenten, 681 Flächenformel, HERONische, 147 Flächengleichung, 219, 230 in Normalform, 226 Raum, 251 Flächeninhalt ähnlicher ebener Figuren, 137 Doppelintegral, 491 Dreieck ebenes, 145, 199 ebenes, schiefwinkliges, 147 sphärisches, 169, 172 ebene Flächen, 465 Ellipse, 205 Flächenstück, 254 gekrümmtes Flächenstück, 499 Hyperbel, 208 Kreis, 143 Kreisabschnitt, 144 Kreisringteil, 144 Kreissektor, 144 krummlige Begrenzung, 465 Kurvensektor, 465 Parabel, 210 Parallelogramm, 138, 194 Polyeder, 194 Rechteck, Quadrat, 138 Rhombus, 138 Sehnenviereck, 140 Tangenten viereck, 140 Teilmenge, 655 Vieleck, 199 Flächennormale, 252, 253 Flächenpunkt, 256 elliptischer, 256 hyperbolischer, 257 Kreisfläche, 256 Kreispunkt, 257 Nabelpunkt, 257 parabolischer, 257 singulärer, 252 Flächenstuck, Flächeninhalt, 254 Fluchtlinien-Nomogramm, 128 Fluchtlinientafel, 127, 128 Fluß Differentialgleichung, 821 Skalarfeld, 685 Vektorfeld Skalarfluß, 685 Vektorfluß, 686 Folge, 420 beschrankte, 618 Cauchy-, 628 finite, 618 fundamentale, 628 konvergente, 626 metrischer Raum, 626 zu Null konvergente, 618 Form, quadratische reelle, 289 reelle, positiv definite 290, 920 Formel binomische, erste, 12 binomische, zweite, 12 Cardano, 41 D'ALEMBERTsche, 556 DuHAMELsche, 745 EuLERsche, 255 FRENETsche, 250 geschlossene. 298 HERONische, 147 KiRCHHOFFsche, 555 Liouville, 518, 826 MOIVRE Hyperbelfunktionen, 91 komplexe Zahlen, 38 trigonometrische Funktionen, 81 PARSEVALsche, 752 PESlNsche, 845, 851 Plemelj, Sochozki, 613 PoiSSONsche, 556 Rechteck-, 926 RiEMANNsche, 549 Schwarz-Christoffel. 701 Simpson-, 927 STlRLINGsche, 479 TAYLORsche, 405 Formelmanipulation, 983 Formeln, EuLERsche, 437 Fortsetzung analytische, 714 linearer Funktionale, 645 Fortsetzungssatz von Hahn, 645 FOURIER-Analyse. 437 FOURIER-Entwicklung, 437 Formen, 440 FOURIER-Integral, 441, 747 äquivalente Darstellungen, 747 komplexe Darstellung, 747 FOURIER-Koefnzienten, 437, 954 Bestimmung, 418 numerische Bestimmung, 441 FouRiER-Reihe, 437 BESSEL-Ungleichung, 638 Bestapproximation, 638 HlLBERT-Raum, 638 komplexe Darstellung, 438 FOURIER-Summe, 438, 954 komplexe Darstellung, 956 FOURIER-Transformation, 747 Additionssatz, 751
Fourier- Transformation Ahnlichkeitssatz, 751 Bildfunktion, 753 Dämpfungssatz, 751 Definition, 748 Differentiation Bildbereich, 751 Originalbereich, 751 diskrete komplexe, 956 exponentielle, 749 » Faltung einseitige, 752 zweiseitige, 736, 752 FOURIER-Kosinus-Transformation, 748 FOURIER-Sinus-Transformation, 748 Integration Bildbereich, 751 Originalbereich, 752 inverse, 748 Linearitätssatz, 751 schnelle, 955 Spektralinterpretation, 749 Tabellen, 749 Übersicht, 731 Vergleich mit LAPLACE-Transformation, 753 Verschiebungssatz, 751 Fraktal, 845 Fraktil, 775 Frames, 766 FRECHET-Ableitung, 652 FREDHOLMSche Alternative, 592, 650 Integralgleichung, 583, 629 1 Art, 598 2 Art, 584 Lösungsmethode, 589 Sätze, 589 Fremdpeilung, 177 FRENETsche Formeln, 250 Frequenz, 76, 83 Kreisfrequenz, 83 Frequenzkopplung (frequency locking), 871 Frequenzspektrum, 750 diskretes, 441 kontinuierliches, 441 FRESNELsches Integral, 720 Fundamentalform 1. quadratische der Fläche, 254 2 quadratische der Flache, 256 Fundamentalmatrix, 826-828 Fundamentalsatz Algebra, 43 elementare Zahlentheorie, 331 Fundamentalsystem, Differentialgleichungen, 518 Funktion abhängige, 124 absolutintegrierbare, 472, 475 algebraische, 62 analytische, 694 Areafunktion, 92 Arkusfunktion, 85 beschränkte, 51 Bessel-, 527 Funktion modifizierte, 528 Betafunktion, 1086 BoOLEsche, 296, 356 Cantor-, 871 Definitionsbereich, 48 diskrete, 757 doppelperiodische, 726 eigentlich monotone, 50 eine Veränderliche, 48 Einheits-, 737 elementare Definition, 62 transzendente, 720 elliptische, 715 EuLERsche, 341 Exponential-, 63, 72 komplexe, 701 Extremwert, 51 Fehlerfunktion, 478 Funktionenreihe, 430 ganzrationale, 62 1 Grades, 64 2 Grades, 64 3 Grades, 64 n-ten Grades, 65 gebrochenlineare, 62, 66 gebrochenrationale, 62, 66 gerade, 51 goniometrische, 76 GREENsche, 550 Grenzwert, 53 im Unendlichen, 54 iterierter, 125 linksseitiger, 54 rechtsseitiger, 54 TAYLOR-Entwicklung, 57 unendlicher, 54 Grenzwertsätze, 55 Größenordnung, 57 Hamilton-, 538, 825 harmonische, 691, 694 Heaviside, 662 holomorphe, 694 homogene, 124 Hyperbelfunktion, 88 hyperbolische, 134 hypergeometrische, 531 integrierbare, 458 inverse, 52 Ableitung, 398 Ableitung höherer Ordnung, 402 Existenz, 61 Hyperbelfunktion, 92 trigonometrische, 63, 85 irrationale, 63, 71 Komplement, 382 komplexe, 48, 693 beschränkte, 695 gebrochen lineare, 698 lineare, 697 quadratische, 699 Quadratwurzel, 700 komplexer Veränderlicher, 693
Funktion komplexwertige, 48 Kosekans 78 Kosinus 76 Kotangens, 77 Kugel- L Art, 529 2 Art, 530 Kugelflächen-, 564 Lagrange, 888 LAPLACEsche, 691 lineare, 62, 64 logarithmische, 63, 73 Logarithmus, komplexe Funktion, 701 lokalsummier bare, 660 Lyapunov-. 827, 828 MACÖONALDsche, 528 mehrerer Veränderlicher 48, 120 meromorphe, 715, 726, 742 meßbare, 657 mittelbare Ableitung, 397 Zwischenveränderliche, 397 Mittelwert, 461 monoton fallende, 50 wachsende, 50 nichtelementare, 62 Parameterdarstellung Ableitung höherer Ordnung, 402 periodische, 52, 739 positiv homogene, 578 Potenzfunktion. 71 quadratische, 62 reelle, 48 reguläre, 694 RlEMANNsche, 548 Sekans, 78 Sinus, 76 Sprung-, 737 Stetigkeit, 58 einseitige, 59 im Intervall, 59 stückweise, 59 Stichprobenfunktion, 794 streng monotone, 50 stückweise stetige, 58 STURMsche, 44 Summe aus linearer u gebrochenlinearer Fkt , summierbare, 657 Tangens, 77 transzendente, 63 trigonometrische, 63, 76, 133 Umkehrfunktion, 52 unabhängige, 124 ungerade, 51 Unstetigkeitsstelle, 58 endlicher Sprung, 59 hebbare Unstetigkeit, 59 Verlauf ins Unendliche, 59 verallgemeinerte. 660. 661. 740 Verteilungsfunktion, 774 Wahrheitsfunktion, 295, 296 WEBERsche, 527 Wertebereich, 48 Zufallsgrößen, 774 zusammengesetzte, 63 zyklometrische, 85 Zylinder-, 527 Funktion, elliptische, 453, 726 Amplitudenfunktion, 726 JACOBI-Funktion, 726 Thetafunktion, 727 WEIERSTRASSSche, 728 Funktion, komplexe algebraische, 720 elementare, transzendente, 720 inverse, trigonometrische, 722 trigonometrische, 721 Funktional 574, 639 Definition, 48 lineares, 329, 620. 621 stetiges, 643 stetiges im L;,-Raum. 644 Funktionaldeterminante. 274, 490, 653 Funktion mehrerer Veränderlicher, 124 Funktionalmatrix, 653 Funktionaloperator. 1007 Funktionensystem orthogonales, 947 orthonormiertes, 948 Funktionentheorie, 693 Funktionsbegriff. 48 Funktionsgraph, 48 Funktionspapier Begriff 118 doppelt logarithmisches, 118 einfach logarithmisches, 118 reziproke Skala, 118 Fuzzy Inferenz. 386 Linguistik, 375 Logik. 374 Regelung, 389 Relation, 383 Relationenprodukt, 385 Relationsmatrix. 384 System, 392 Systeme. Anwendungen, 389 Wertigkeit, 383 Fuzzy-logisches Schließen, 386 Fuzzy-Menge Ähnlichkeit, 378 Durchschnitt, 378 Höhe, 378 Komplement, 378 leere, 377 normale, 378 Schnitt, 378 Darstellungssatz, 378 subnormale, 378 Teilmenge, 377 Toleranz, 377 Träger, 374 universelle, 377 Vereinigung, 378
Fuzzy-Menge Gleichung Verkettung, 385 Verknüpfung, 378 Verknüpfungsoperator, 385 Fuzzy-Mengen Durchschnitt, 379 Schnitt-Mengen, 379 Vereinigung, 380 GABOR-Transformation, 766 GALERKIN-Verfahren, 936 Galois field, 325 Gammafunktion, 476, 478, 1093 Ganzzahligkeitsforderung, 874 Gauss Schritt, 284 Transformation, 285, 806, 921 GAUSS-KRÜGER-Koordinaten, 166 GAUSS-NEWTON-Verfahren, 924 ableitungsfreies, 925 GAUSSsche Fehlerquadratmethode, 921, 947 Einordnung, 418 Glockenkurve, 73, 782 Koordinaten, 251 Krümmung, Fläche, 257 Summensymbolik, 948 Zahlenebene, 35 GAUSSscher Algorithmus, 284, 918 Integralsatz, 687 GAUSSsches Eliminationsprinzip, 284 Eliminationsverfahren, 918 Fehlerfortpfianzungsgesetz, 818 Fehlerintegral, 478, 782 Gauss-Seidel-Verfahren, 922 Gebiet, 121 abgeschlossenes, 121 drei- und mehrdimensionales, 121 einfach zusammenhängendes, 121, 709 mehrfach zusammenhängendes, 121 nicht zusammenhängendes, 121 offenes, 121 zweidimensionales, 121 zweifach zusammenhängendes, 121 Gebietskollokation, 940 Gebietsmethode, 939 Geburtsprozeß, 792 Gegenkathete, 133 Gegenpunkt, 163 GENAU DANN, WENN, 295 Genauigkeit, 812 Genauigkeitsmaß, 812 Generizitat, 839 metrische, 854 Geometrie, 131 analytische, 185 Ebene, 195 Raumes, 213 Differentialgeometrie, 232 Gerade, 64, 131 Gleichung Ebene, 199 Raum, 223 imaginäre, 211 Raum, 154, 223 Vektorgleichung, 193 Geraden Gleichung, 223 kreuzende, 154 orthogonale, 131, 202 parallele, 131, 154, 202 Schnittpunkt, Ebene, 201 senkrechte, 131, 202 windschiefe, 154 Winkel zwischen, 202 Geradenbüschel, 201 Geradengleichung Ebene, 199 Achsenabschnittsform, 200 allgemeine, 200 durch einen Punkt, 200 durch zwei Punkte, 200 HESSEsche Normalform, 200 Polarkoordinaten, 201 im Raum, 223 Richtungskoeffizient, Ebene, 200 Geradenpaar, Transformation, 211 Gerüst, 367, 368 Gesamtschritt ver fahren, 922, 923 Gesetz der großen Zahlen, 787 Gewicht Messung, 817 Orthogonalität, 533 statistisches, 776 Gewichtsfaktor, statistischer, 813 ggT und kgV, Zusammenhang, 334 Girard, Satz, 169 Gitter Bravais-Gitter, 320 Kristallographie, 320 Gitterpunkt (bei Splines), 961 Glättungsparameter, 960 Gleichheit asymptotische, 435 komplexe Zahlen, 35 Matrizen, 262 Vektoren, 185 Gleichheitsbeziehung, Identität, 10 Gleichung, 10 1 Art, 650 1 Grades, 39 2 Art, 650 2 Grades, 40 3 Grades, 40 4 Grades, 42 algebraische, 38, 43 charakteristische, 286, 511, 520, 523 definierende, 526 DiOPHANTische, 335 Ebene allgemein, 220 im Raum, 220 Ellipse, 204 Exponentialgleichung, Lösung, 46 Fläche, 219
Gleichung Grenzwert 2 Ordnung, 230 im Raum, 251 Normalform, 226 Gerade Ebene, 199 im Raum. 223 Grad, 39 homogene, 650 Hypeibel, 206 Hyperbelfunktion, Lösung, 47 inhomogene, 650 KORTEWEG-DE VRIES, 568 Kreis, 202 kubische, 40, 64 Kugel, 251 Kurve 2 Ordnung, 210 Ebene, 199, 232 Lösung, 38 lineare, 39 logarithmische, Lösung, 46 logistische, 822, 863 nichtlineare, numerische Lösung, 911 Normal form, 38 n-ten Grades, 43 Operatorengleichung, 650 Parabel, 209 PARSEVALsche, 438, 534, 600, 638 quadratische, 40, 64 Raumkurve, 220, 245 Vektorform, 246 SCHRÖDINGER lineare, 557 nichtlineare, 567, 569 Sinus-GORDON, 569 Systeme, 39 Termalgebra, 354 transzendente, 38 trigonometrische, Lösung, 46 vektorielle. 192 Wurzel, 38 Gleichungen DELAMBREsche, 172 L'HuiLiERsche, 172 MOLLWElDEsche, 146 NEPERsche, 172 Gleichlingssystem gestaffeltes, 284, 918 homogenes, 280 inhomogenes, 280 lineares, 279, 280, 917 Austauschverfahren, 282 Fundamentalsystem, 281 triviale Lösung, 281 überbestimmtes, 285, 920 nichtlineares, 917, 923 numerische Lösung, 917 direktes Verfahren, 917 Iterationsverfahren, 918 überbestimmtes, 917 unterbestimmtes. 917 Gleitpunktzahl, 966, 967 halblogarithmische Form, 967 IEEE-Standard, 967 Maple, 1000 Mathematica, 987 Goldener Schnitt, 198 Goldenes Mittel, 871 Grad (Winkel) Altgrad, 133 Neugrad, 133 Gradient Definition 671 Hinweis, 671 mit Nablaoperator, 677 Skalarfeld, 671, 672 Vektorkomponenten, 680 verschiedene Koordinaten, 672 Gradientenverfahren, 581, 895 Gradmaß, 133 Graeffe Verfahren, 917 GRAM-ScHMiDTsches Orthogonalisierungsverfahren, 288 Graph Baum, 362 bewerteter, 364 Bogen, 361 ebener, 362, 370 Funktionsgraph, 48 gemischter, 361 gerichteter. 361 Isomorphie, 362 Kante, 361 Knoten, 361 Komponenten, 364 Kreis, 371 nichtplanarer, 370 paarer, 362 planarer, 370 regulärer, 362 schlichter, 361 spezielle Klassen, 362 stark zusammenhängender, 371 Strom, 372 Transportnetz, 362 unendlicher, 362 ungerichteter, 361 Untergraph, 363 Unterteilung, 370 vollständig paarer, 362 vollständiger, 362 zusammenhängender, 364, 371 Zyklus 371 Graphentheorie, Algorithmen, 361 Gravitationsfeld, Punktmasse, 690 GREENsche Funktion. 550 Integralsätze, 688 Methode, 550, 551 Grenzpunkt, 244 Grenzwert bestimmtes Integral, 457 Folge im metrischen Raum, 626 Funktion einer Veränderlichen, 53 komplexer Veränderlicher, 693 mehrerer Veränderlicher, 125
Grenzwert Höhenwinkel Funktionenreihen, 430 Partialsummen, 430 Reihe, 422 Zahlenfolge, 421 Grenzwertsatze Funktionen, 55, 421 Zahlenfolgen, 421 Grenzwertsatz BERNOULLlscher, 787 Lindeberg-Levy,788 Grenzzyklus, 830, 859 instabiler, 830 stabiler, 830 Größe, infinitesimale, 458, 464 Größenordnung, Funktion, 57 größter gemeinsamer Teiler (ggT), 333 Linearkombination, 334 Großkreis, 163, 179 Grundaufgaben ebene Trigonometrie, 147 sphärische Trigonometrie, 173 Grundformeln ebene Trigonometrie, 145 sphärische Trigonometrie, 169 Grundgesamtheit, 793 zweistufige, 777 Grundgesetze Aussagenlogik, 296 Mengenalgebra, 302 Grundintegrale Begriff, 445 Tabelle, 445 Grundvektor, 191 reziproker, 191 Gruppe, 309 ABELsche, 309 Diedergruppe, 309 Faktorgruppe, 312 Homomorphiesatz, 312 Untergruppe, 310 Gruppenhomomorphismus, 312 Gruppenisomorphismus, 312 Gruppentafel, 309 Gruppieren, 11 Häufigkeit, 771, 796 absolute, 796 relative, 771, 796 Summenhäufigkeit, 796 Häufigkeitsverteilung, 796 Häufungspunkt, 627 Hakenintegral, 719 Halbgruppe, 308 Halbnorm, 645 Halbordnung, 307, 621 Halbparameter, 204 Parabel, 71 Halbseitensatz, 170 Halbwinkelsatz ebene Trigonometrie, 82, 146 sphärische Trigonometrie, 170 HAMEL-Basis, 619 Hamilton Differentialgleichung, 825, 839, 867 Funktion, 538, 825 Kreis, 366 Operator, 558 System, 839 Hamiltonian, 558 HAMMING-Abstand, 625 HANKEL-Transformation, 731 Harmonische Analyse, 945 HASSE-Diagramm, 307 Hauptachsenrichtung, 273 Hauptachsentransformation, 272, 289 Hauptaufgabe 1 , der Triangulierung, 151 2 , der Triangulierung, 152 Hauptgröße, 11 Hauptideal, 324 Hauptkrummungskreisradius, Fläche, 255 Hauptkrümmungsrichtung, Fläche, 255 Hauptnormale, Raumkurve, 246, 248 Hauptnormalschnitt, Fläche, 255 Hauptsatz Funktionentheorie, 710 homogene lineare Differentialgleichungen, 826 inhomogene lineare Differentialgleichungen, 826 Integralrechnung, 458, 475 Hauptwert Argument der komplexen Zahl, 35 Arkusfunktionen, 85 CAUCHYscher, 474 Integral, uneigentliches, 471 inverse Hyperbelfunktion, 722 inverse trigonometrische Funktion, 722 Logarithmus, 721, 722 HAUSDORFF-Dimension, 846 Heaviside Einheitsfunktion, 737 Entwicklungssatz, 741 Funktion, 662 HELMHOLTZsche Differentialgleichung, 559 HENON-Abbildung, 822, 836 HENON-Attraktor, 849 HERMlTEsche Polynome, 532, 565, 637 HESSE-Matrix, 895 HESSEsche Normalform Ebenengleichung, 221 Geradengleichung, Ebene, 200 Hexadezimalsystem, 965 Hexadezimalzahl, 965 HlLBERT-Matrix, 1020 HiLBERT-Raum, 636 isomorpher, 639 Skalarprodukt, 635 Histogramm, 796 Hodograph, Vektorfunktion, 663 Höhe Dreieck, 135 Kegelfiguren, 160 Kugelteile, 161 Polyederfiguren, 156 Zylinderfiguren, 159 Höhenlinie, 121 Höhenwinkel, 148
HOLDER Stetigkeit Integral Holder Stetigkeit, 612 HÖLDERsche Ungleichung, 32 Hohlzylinder. 160 Holladay, Satz, 959 Holoedrie, 321 Homöomorphismus, 834 konjugierender, 837 orientierungstreuer, 870 Homogenitätsgrad, 124 Homomorphiesatz, 353 Gruppen, 312 Ring, 324 Homomorphismus, 312, 353, 621 Algebren, 634 natürlicher, 312, 324 Ring, 324 Vektor verbände, 623 HOPF-Bifurkation, 857 HOPF-LANDAU-Modell der Turbulenz, 868 HORNER-Schema, 914, 966 zweizeiliges, 915 HOUSEHOLDER Tridiagonalisierung, 291 Verfahren, 286, 948 Hülle abgeschlossene lineare, 636 konvexe. 619 lineare, 617 transitive, 305 Hufeisen-Abbildung, 850 L'HuiLlERsche Gleichungen, 172 Hyperbel, 206 Asymptoten, 207 Binom, 71 Brennpunkt, 206 Brennpunktseigenschaften, 206 Definition, 206 Durchmesser, 207 Flächeninhalt, 208 gleichseitige, 66, 208 Halbparameter, 206 konjugierte, 207 Krümmungskreisradius, 208 Leitlinieneigenschaft, 206 Scheitel, 206 Tangente, 207 Tangentenstück, 207 Transformation, 211 Hyperbelbogen, 208 Hyperbelfunktion, 133, 134 komplexe, 721 inverse, 722 Hyperbelgleichung, 206 Hyperbelkosekans, 88 Hyperbelkosinus. 88 Hyperbelkotangens, 88 Hyperbelsegment, 208 Hyperbelsekans, 88 Hyperbelsinus, 88 Hyperbeltangens, 88 Hyperboloid, 226 einschaliges, 226. 229 Mittelpunksfläche, 230 zweischaliges, 227 Mittelpunksfläche, 230 Hyperebene, 645 Hyperfiäche, 121 Hyperteilraum, 645 Hypotenuse, 133 Hypotrochoide, 105 Hypozykloide, 104 verkürzte, 105 verlängerte, 105 Ideal, 324 Hauptideal, 324 Idempotenzgesetz Aussagenlogik, 296 BoOLEsche Algebra, 355 Mengen, 302 identisch erfüllt, 11 Identität, 10 BoOLEsche Funktion, 357 LAGRANGEsche, 190 IEEE-Standard, 967 Ikosaeder, 158 Imaginärteil, 34 imaginäre Einheit, 34 Zahlen, 34 Immersion, 853 Implikation, 295 Beweisführung, 5 implizite Darstellung, 49 Impulsfunktion, 737 Individuenbereich, 298 Induktionsschluß, 5 Infimum, 623 infinitesimal, 458 Infixschreibweise, 308 Informationsdimension, 848 Inkommensurabilität, 4, 830 Inkreis, 135 Dreieck, ebenes, schiefwinkliges. 146 Tangentenviereck, 140 Inkrement, 409 Innenproduktraum, 635 Instabilität Rundungsfehler, numerische Rechnung, 971 Integrabilität Differential, 485 vollständige, 540 Integrabilitätsbedingung, 485, 486, 683 Integral absolut konvergentes, 475 elementare Funktionen, 445 EuLERsches. 476, 478 FOURIER-Integral, 441, 747 FRESNELsches. 720 komplexe Funktion, 657 Kurvenintegral, 479 LEBESGUE-Integral, 657 Vergleich mit RlEMANN-Integral, 470 Linienintegral, 479 nichtelementare Funktionen. 448 nichtelementares, 477
Integral Integraltransformation Oberflächenintegral, 496 Parameterintegral, 476 RlEMANNsches, 458 Vergleich mit STIELTJES-Integral, 470 singuläres, 510 Stammfunktion, 444 STIELTJES-Integral Begriff, 470 Hinweis, 648 Vergleich mit RlEMANN-Integral, 470 Umlaufintegral, 479, 485 Integral, bestimmtes, 457 Begriff, 444 Differentiation, 460 Tabelle, 1086 algebraische Funktionen, 1089 Exponentialfunktionen, 1087 logarithmische Funktionen, 1088 trigonometrische Funktionen, 1086 Integral, elliptisches, 453 1 Gattung, 448, 453, 725 2 Gattung, 453 3 Gattung, 453 bestimmtes, 454 Reihenentwicklung, 479 unbestimmtes, 453 unvollständiges, 454 vollständiges, 454 Integral, komplexes bestimmtes, 707 unbestimmtes, 708 Integral, unbestimmtes, 444 andere transzendente Funktionen Tabelle, 1080 Begriff, 445 elementare Funktionen, 445 Tabelle, 1053 Exponentialfunktionen Tabelle, 1081 Grundintegrale, 445 Hyperbelfunktionen Tabelle, 1080 inverse Hyperbelfunktionen Tabelle, 1085 inverse trigonometrische Funktionen Tabelle, 1084 irrationale Funktionen Tabelle, 1060 Kosinusfunkt ionen Tabelle, 1073 Kotangensfunktion Tabelle, 1079 logarithmische Funktionen Tabelle, 1082 Sinus- und Kosinusfunktionen Tabelle, 1075 Sinusfunktionen Tabelle, 1070 Tabelle Grundintegrale, 445 Tabellen, 1053 Tangensfunktion Tabelle, 1079 trigonometrische Funktionen Tabelle, 1070 Integral, uneigentliches, 457 Begriff, 470 divergentes, 473 Hauptwert, 471, 474 konvergentes, 471, 473 Integralexponentialfunktion, 478 Tabelle unbestimmte Integrale, 1081 Integralfläche, 536 Integralformel CAUCHYsche, 711 Gauss, 687 Integralgleichung 1 Art, 583 2 Art, 583 ABELsche, 611 ausgearteter Kern, 584, 598 charakteristische, 612 Eigenfunktion, 585 Eigenwert, 585 FREDHOLMsche, 629 1 Art, 598 2 Art, 584 homogene, 583 inhomogene, 583 Iterationsverfahren, 587 iteratives Verfahren, 604 lineare, 583 quadratische Integrierbarkeit, 599 singulare, 611 transponierte, 585, 612 VOLTERRAsche, 630 1 Art, 583, 605 2 Art, 605 Integralgleichungen, Orthogonalsystem, 599, 603 Integralkosinus, 477 Integralkriterium, Cauchy, 425 Integralkurven, 505, 822 Integrallogarithmus, 448, 477 Tabelle unbestimmte Integrale, 1082 Integralnorm, 660 Integralrechnung, 444 Hauptsatz, 458, 475 Mittelwertsatz, 461 Integralsatz, 687 Cauchy, 710 Gauss, 687 Green, 688 Stokes, 687 Integralsinus, 477, 719 Integraltransformation, 730 Anwendung, 732 Bildbereich, 730 CARSON-Transformation, 731 Definition, 730 eine Veränderliche, 730 FOURIER-Transformationen, Übersicht, 731 GABOR-Transformation, 766 HANKEL-Transformation, 731 Kern, 730 LAPLACE-Transformation, Übersicht, 731 Linearität, 732
Integraltransformation Kantenfolge mehrere Veränderliche, 732 Mehrfach-Integraltransformation, 732 MELLIN-Transformation, 731 Operatorenmethode, 732 Originalbereich, 730 schnelle Wavelet-Transformation, 766 spezielle, 730 Stieltjes- Transformation, 731 WALSH-Transformation, 767 Wavelet-Transformation, 763, 765 Integrand, 445 Integraph, 464 Integration allgemeine Regel, 445 Funktion, nichtelementare, 477 graphische, 449, 463 im Komplexen, 707, 717 Intervallregel, 460 Konstantenregel, 445 logarithmische, 447 mit Hilfe von Reihenentwicklung, 448 numerische, 925 mehrfache Integrale, 930 partielle, 448 rationale Funktionen, 449 Reihenentwicklung, 462, 477 Substitutionsmethode, 448 Summenregel, 446 unter dem Integralzeichen, 476 Vektorfelder, 681 Vertauschungsregel, 461 Volumen, 467 Integrationsgrenze, 458 obere, 458 parameterabhängige, 476 untere, 458 Integrationsintervall, 458 Integrationskonstante, 445 Integrationsregeln bestimmte Integrale, 458 unbestimmte Integrale, 447 Integrationsvariable, 458 Begriff, 445 Integrationsweg, 480 Integrierbarkeit p-fache, 659 quadratische, 599 integrierender Faktor, 507 Intensität, Quelle, 690 Intermittenz, 865, 869 Internationale Standard-Buchnummer ISBN, 342 Interpolation Aitken-Neville, 946 Fuzzy-Systeme, 392, 393 Spline, 945 trigonometrische, 945, 954, 955 wissensbasierte, 392 Interpolationsbedingung, 945 Interpolationsformel LAGRANGEsche, 945 NEWTONsche, 945 Interpolationsquadratur, 926 Interpolationssplines, 959 bikubische, 961 kubische, 959 Interpretation, Ausdruck, 298 Intervall, 2, 796 Null (O)-Intervall, 622 Intervallregel, 460 Invariante, 728 Fläche 2 Ordnung, 231 Kurve 2 Ordnung, 211 skalare, 190, 218 Invarianz Drehungsinvarianz, 273 Transformationsinvarianz, 273 Translationsinvarianz, 273 Inverse, 621 Inverses, Gruppenelement, 309 Inversion kartesisches Koordinatensystem, 277 konforme Abbildung, 698 Raum, 277 Involute, 244 Inzidenzfunktion, 361 Inzidenzmatrix, 363 Irrationalität algebraische, 2 quadratische, 2 Irrfahrtsprozesse, 809 Irrtumswahrscheinlichkeit, 776, 799 Isometrie, Raum, 631 Isomorphie Graphen, 362 Vektorräume, 621 Isomorphismus, 312, 353 BoOLEsche Algebra, 356 Iteration, 911 inverse, 291 Iterationsverfahren, 291, 911, 918, 922 gewöhnliches, 911, 923 JACOBI Determinante, 653 Funktion, 726 Matrix, 653, 924 dynamische Systeme, 822 Verfahren, 291, 922 Jacobian, 653 Jordan Matrix, 290 Normalform, 290 Junktor, 295 KAM-Theorem, 839 kanonisches System, 537 Kante, Figur, 155 Kante, Graph, 361 Bewertung, 364 Länge, 364 Kantenfolge, 364 Elementarkreis, 364 geschlossene, 364 Kreis, 364 offene, 364 Weg, 364
Kantenwinkel Komplementfunktion Kantenwinkel. 155 Kapazitätsdimension, 847 Kapazität, Bogen, 372 Kardinalzahl, 300, 307 Kardioide. 99 kartesisches Blatt, 96 Kaskade. Periodenverdopplungen, 865, 869 Kategorie, 2 BAlREsche, 839 Katenoide, 89, 108 KDNF, 358 Kegel. 160, 227, 634 erzeugender, 622 imaginärer, 230 Mittelpunktsfläche, 230 normaler. 634 regulärer. 634 solider, 634 Vektorraum, 620 Kegelfläche. 160, 220 Kegelpunkt, 252 Kegelschnitte, 161, 210, 212 zerfallende, 212 Kegelstumpf, gerader. 160 Keil. 158 Keilwinkel, 166 Kennzahl. 10 Ker. 621 ker, 354 Kern. 312 Homomorphismus, 354 Integralgleichung, 584 ausgearteter, 584, 595 iterierter, 588. 607 lösender 588, 590 Integraltransformation, 730 Kongrucnzrelation, 354 Operator, 621 Ring, 324 Unterraum, 328 Kernapproximation Integralgleichungen, 594 Spline-Ansatz, 595 Tensorprodukt-Approximation, 595 Kette, 307 Graph, 371 elementarer, 371 MARKOFFsche, 789 homogene, 789 stochastische, 788 STURMsche, 44 Kettenbruch, 3 Kettenlinie, 89, 108, 576 Kettenregel, 664 mittelbare Funktion, 397 Kink-Soliton, 570 KlRCHHOFFsche Formel, 555 KKNF, 358 Klasse gleichungsdefinierte 354 Meßwerterfassung, 796 Klassenmitte, Meßwerterfassung, 797 Kleinkreis, 163, 180 Bogenlänge, 181 Kurswinkel, 181 Radius, ebener, 180 Radius, sphärischer, 180 Schnittpunkte. 181 KLElNsche Vierergruppe, 311 kleinstes gemeinsames Vielfaches (kgV), 334 Klothoide, 107 Knickpunkt, 240 Knoten. 833 Abstand, 364 Approximationsintervalle, 959 dreifach zusammengesetzter, 859 Graph, 361 isolierter, 361 Niveau. 367 Quelle. 372 Sattelknoten, 828, 833 Senke, 372 stabiler, 828 Knotenebene, 561 Knotengrad, 361 Knotenpunkt, 511 KoCHsche Kurve, 847 Kodierung, 347 Kodimension, 856 Koeffizient, 39 algebraischer Ausdruck, 11 Clebsch-Gordan, 316 metrischer, 191 Vektorzerlegung, 187 Koeffizientenmatrix, 280 erweiterte, 281, 919 Körper, 323 endliche, 324 Erweiterung, 323 Er weiter ungs-, 326 Kollinearität Vektoren. 189 Kollokation Gebietskollokation 940 Randkollokation, 940 Kollokationsmethode, 596, 936, 940 Kollokationsstellc 936, 940 Kombination, 768 mit Wiederholung, 768 ohne Wiederholung, 768 Kombinatorik, 768 Kommensurabilität, 4 Kommutativgesetz Aussagenlogik, 296 BooLEsche Algebra, 355 Matrizen, 262, 263 Mengen, 302 Vektoren 263 Vektormultiplikation, 189 Kommutator, 329 Komplement, 301 algebraisches, 267 Mengen, 301 orthogonales, 636, 644 Sugeno- Komplement, 383 unscharfe Mengen. 378 YAG ER-Komplement, 383 Komplementfunktion, 382
Komplementsätze Koordinatensystem Komplementsätze, 80 Komplementwinkel, 132 komplexe Zahlen, 34 Komplexifikation, 621 Konchoide allgemeine, 98 der Geraden, 98 des Kreises, 98 des Nikodemes, 97 Konditionszahl, 921 Konfidenzbereich, 804 Konfidenzintervall, 804 Kongruenz algebraische, 337 ebener Figuren, 136 Ecken, 155 gleichsinnige, 136 lineare, 338 nichtgleichsinnige, 136 Polynomkongruenz, 340 quadratische, 339 simultane lineare, 338 System simultaner linearer, 338 Kongruenzmethode, 807 Kongruenzrelation, 353 Kern, 354 Kongruenzsätze, 136 Kongruenztransformation, 136 konjugiert komplexe Zahlen, 36 Konjugiertheit, topologische, 837 Konjunktion, 295 konkav, 235 Konklusion, 386 Konsistenz, 934 Ordnung p, 934 Konstante aussagenlogische, 295 EuLERsche, 477 in Polynomen, 62 Tabelle, 1041 Konstanten fundamentale physikalische, Tabelle, 1041 Konstantenregel, 395 Kontinuum, 308 Kontonummernsystem, einheitl., EKONS, 342 Kontradiktion, BoOLEsche Funktion, 357 Kontraktionsprinzip, 628, 629 Kontrapositionsgesetz, 297 Konvergenz, 934 absolute, 425, 432, 712 BANACH-Raum, 632 bedingte, 425, 712 gleichmäßige, 431, 432 Funktionenfolgen, 626 im Mittel, 438 Integralkriterium, 425 Konvergenzsatze, 422 Ordnung p, 934 Quotientenkriterium, 424 Reihe, 423, 425 Reihe, komplexe Glieder, 711 schwache, 649 unendliche Reihe, komplexe Glieder, 712 ungleichmäßige, 431 Vergleichskriterium, 423 WEIERSTRASS-Kriterium, 431 Wurzelkriterium, 424 Zahlenfolge, 421 komplexe Glieder, 711 Konvergenzbereich, 430 Konvergenzintervall, 432 Konvergenzkreis, 712 Konvergenzkriterium Cauchy, 53, 125 Integralkriterium, 425 LEiBNizsches, 426 Quotientenkriterium, 424 Vergleichskriterium, 423 Wurzelkriterium, 424 Konvergenzordnung, 934 Konvergenzradius, 432 Konvergenzsätze, 658 Konvertierung, Zahlensysteme, 965 konvex, 235 Koordinaten affine, 188, 191 baryzentrische, 944 DESCARTESsche, 195 Dreieckskoordinaten, 944 GAUSSsche, 251 Gauss-KrÜGER, 165 gemischte, 275 Geodäsie, 148 geographische, 165 kartesische, 187, 191, 196 Ebene, 195 Raum, 214 kontravariante, 193 kovariante, 193 krummlinige, 195, 251, 274 dreidimensionale, 215 Kugelkoordinaten, 215 Polarkoordinaten, 195, 196 räumliche, 215 Punkt, 195 rein kontravariante, 276 rein kovariante, 276 Soldner, 165 Vektor, 187 verzögerte, 853 vorauseilende, 853 Zylinderkoordinaten, 215 Koordinatenachse, 195 Koordinatendarstellung Skalarfelder, 665 Vektorfelder, 667 Koordinatenfläche, 215, 274 Koordinatengleichung ebene Kurve, 199 Raumkurve, 248 Koordinateninversion, 277 Koordinatenlinie, 215, 274 Koordinatensystem doppelt logarithmisches, 118 Ebene, 195 einfach logarithmisches, 118
Koordinatensystem Kryptologie, klassische Gauss-Krüger, 148 linkshändiges, 213 orthogonales, 186 orthonormiertes, 186 Raum, 213 rechtshändiges, 213 SOLDNERsche, 148 Transformation, 270 Koordinatentransformation, 196, 217, 275, 668 Kurvengleichungen 2 Ordnung Mittelpunktskurven, 211 parabolische Kurven, 212 Koordinatenursprung Ebene, 195 Raum, 214 Korrektor 933 Korrekturform, 923 Korrelation, lineare, 802 Korrelationsanalyse, 802 Korrelationsdimension. 848 Korrelationskoeffizient. 803 empirischer, 803 Korrelationssumme, 848 KORTEWEG-DE-VRIES-Gleichung, 567 Kosekans, 78 hyperbolicus, 88 Kosekansfunktion, 133 Kosinus, 76 hyperbolicus, 88 Kosinusfunktion, 133 hyperbolische, 134 Kosinussatz, 146 polarer, 169 sphärischer, 169 Kotangens, 77 hyperbolicus, 88 Kotangensfunktion, 133 Kovarianz, zweidimensionale Verteilung, 803 Kredit, 22 Kreis apollonischer, 704 Definition, 142, 202 Ebene, 202 gefährlicher. 153 Graph, 371 Großkreis, 163, 179 Hamilton, 366 Kleinkreis, 163, 180 Tangente 203 Kreisabbildung, 869, 871 Kreisabschnitt, 144 Kreisausschnitt. 144 Kreisfeld, 667 Kreisfiguren, ebene, 142 Kreisflächenpunkt, 256 Kreisfläche, 142 Kreisfrequenz, 83 Kreisfunktion, 133 Kreisgleichung kartesische Koordinaten, 202 Parameterdarstellung, 203 Polarkoordinaten, 203 Kreiskegel, 160 Kreislinie, 142 Kreisperipherie, 142 Kreispunkt, 257 Kreisring, 144, 161 Kreissegment, 144 Kreissektor, 144 Kreistonnenkörper, 162 Kreisumfang, 142 Kreiszylinder, 159 Kristallklassen. 321 Kristallographie Gitter, 320 Symmetroegruppen. 320 Kristallsysteme, 321 Kriterien Funktionenreihen, 430 Konvergenz von Reihen, 422 Konvergenz von Zahlenfolgen, 421 Teilbarkeit, 332 KRONECKER Produkt, 266 Symbol, 261, 273 Krümmung ebene Kurve, 236 Fläche, 255, 257 konstanter Krümmung, 257 GAUSSsche Fläche, 257 Kurven auf einei Fläche, 255 minimale Gesamtkrümmung. 959 mittlere der Fläche, 257 Raumkurve, 248 Totalkrümmung, 250 Krümmungskreis, 237 Krümmungskreismittelpunkt, 237 Krümmungskreisradius, 237 ebene Kurve, 236 Extremale, 578 Kurve, 236 Kurven auf einer Fläche, 255 Raumkurve 249 Krümmungslinie, Fläche, 256 Kryptoanalysis, klassische Methoden, 349 KASISKI-FRIEDMAN-Test, 349 statistische Analyse, 349 Kryptologie, 346 AES-Algorithmus. 352 Aufgabe, 346 DiFFiE-HELLMAN-Konzept, 350 Einwegfunktionen. 351 IDEA-Algorithmus, 352 Kryptosystem, 346 mathematische Präzisierung, 346 One-Time-Tape, 350 RSA-Verfahren, 351 Sicherheit von Kiyptosystemen, 347 Verfahren mit öffentlichem Schlüssel, 350 Verschlüsselung kontextfreie, 346 kontextsensitive, 346 Kryptologie, klassische Methoden, 347 affine Substitutionen, 348
Kryptologie, klassische Kurve HiLL-Chiffre, 348 Matrixsubstitutionen, 348 VlGENERE-Chiffre, 348 Substitution, 347 monoalphabetische, 347 monographische, 347 polyalphabetische, 347 polygraphische, 347 Transposition, 347 Kuan, 366 Kubikwurzel, 8 Kugel, 161 als Ellipsoid, 226 Gleichung in drei Formen, 251 metrischer Raum, 626 Kugelabschnitt, 161 Kugelausschnitt, 161 Kugelfeld, 664 Kugelflächenfunktion, 564 Kugelfunktion 1 Art, 529 2 Art, 530 Kugelkoordinaten, 215 Vektorfeld, 668 Kugelschachtelungssatz, 628 Kugelschicht, 161 Kugelzweieck, 166 KUHN-TUCKER-Bedingungen, 889 Hinweis, 646 KURATOWSKI-Satz, 371 Kursgleiche, 182 Kurswinkel, 164 Kurve 3 Ordnung, 67, 95 4 Ordnung, 97 Abbrechpunkt, 240 algebraische, 95, 199 n-ter Ordnung, 241 ARCHiMEDische Spirale, 105 Areakosinus, 92 Areakotangens, 93 Areasinus, 92 Areatangens, 93 Arkuskosinus, 85 Arkuskotangens, 85 Arkussinus, 85 Arkustangens, 85 Astroide, 104 Asymptote, 238, 241 asymptotischer Punkt, 240 B-B-Darstellung, 962 CASSiNische, 100 Darstellung mit Splines, 959 Doppelpunkt, 240 ebene, 232 Bogenelement, 233 Normale, 233 Richtung, 232 Scheitelpunkt, 239 Tangente, 233 Winkel, 235 empirische, 109 Enveloppe, 244 Epitrochoide, 105 Epizykloide, 103 Evolute, 244 Evolvente, 244 des Kreises, 107 Exponentialkurve, 72 Punktion, 48 GAUSSsche Glockenkurve, 73, 782 gedämpfte Schwingungen, 84 Gleichung Ebene, 199 Raum, 220 Hyperbelkosinus, 89 Hyperbelkotangens, 90 Hyperbelsinus, 89 Hyperbeltangens, 90 hyperbolische Spirale, 106 hyperbolischer Typ, 70, 72 Hypotrochoide, 105 Hypozykloide, 104 imaginäre, 199 Involute, 244 isolierter Punkt, 240 Kardioide, 99 kartesisches Blatt, 96 Katenoide, 108 Klothoide, 107 Knickpunkt, 240 KoCHsche, 847 Konchoide des Nikodemes, 97 konkave, 235 konvexe, 235 Kosekans, 78 Kosinus, 76 Kotangens, 77 Krümmung, 236 Krummungskreisradius, 236 Länge, Kurvenintegral 1 Art, 482 Lemniskate, 101 logarithmische, 73 logarithmische Spirale, 106 LORENTZ-Kurve, 95 Mehrfachpunkt, 241 n-ter Ordnung, 65, 199 parabolischer Typ, 65 PASCALsche Schnecke, 98 Rückkehrpunkt, 240 Raum, 245 Schleifenserie, 1038 Sekans, 78 Selbstberührungspunkt, 240 semikubische Parabel, 95 Sinus, 76 sphärische, 163, 179, 664 Spirale, 105 Strophoide, 96 Tangens, 77 Traktrix, 108 transzendente, 199 Trochoide, 102 Versiera der Agnesi, 95 Wendepunkt, 238 Zissoide, 96
Kurve Linearfonn Zykloide. 101, 102 Kurven 2 Ordnung, 210 Mittelpunktskurven, 211 Polargleichung, 213 sphärische, 179 Schnittpunkte, 184 Kurvengleichung 2 Ordnung, 210 Ebene, 199, 232 komplexe Form, 723 Raum, 220 Kurvenintegral, 479 1 Art. 480 Anwendungen, 482 2 Art, 482 allgemeiner Art, 484, 683 Vektorfeld, 681 Kurvenpunkt, ebene Kurve, 238 Kurvenschar, Einhüllende, 244 Kurvenuntersuchung,allgemeine 243 Länge Bogen, 254 geographische, 165, 252 Intervall, 655 Kurvenintegral 1 Art, 482 reduzierte 179 Vektor, 194 Lagrange Funktion, 888 Funktionen, 419 Identität, 190 Interpolationsformel. 945 Multiplikatorenmethode, 419 Satz, 311 LAGUERREsche Polynome, 531, 638 LANCZOS-Verfahren, 291 LANDAU-Symbole, 57 LAPLACE-Operator, 667 Polarkoordinaten, 417 Vektorkomponenten, 680 verschiedene Koordinaten. 678 Wellengleichung, 555 LAPLACEsche Differentialgleichung, 557, 691 LAPLACEscher Entwicklungssatz, 267 LAPLACE-Transformation, 733 Additionssatz, 734 Ahnlichkeitssatz, 734 Bildbereich, 733 Bildfunktion, 733 Dämpfungssatz, 734 Definition, 733 Differentation Bildbereich, 735 Originalbereich, 735 Differentialgleichung, 744 konstante Koeffizienten, 744 partielle, 746 veränderliche Koeffizienten, 745 diskrete, 759 Divisionssatz, 736 Faltung, 736 einseitige 736 komplexe, 737 Integration Bildbereich. 735 Originalbereich, 735 inverse, 733, 741 Konvergenz, 733 Linearitätssatz, 734 Originalbereich, 733 Originalfunktion 733 Partialbruchzerlegung, 741 Reihenentwicklung, 742 Sprungfunktion. 737 stückweise differenzierbare Funktion, 738 Tabelle. 1097 Übersicht, 731 Umkehr integral, 743 Vergleich mit FOURIER-Transformation, 753 Verschiebungssatz, 734 Zusammenhang mit Z-Transformation, 759 Laurent Entwicklung, 714 Reihe, 714, 759 LEBESGUE Integral, 657 Vergleich mit Riemann -Integral. 470 LEBESGUE-Maß, 656 LEGENDRESche Differentialgleichung. 529 Polynome 1 Art, 529, 637 2 Art, 530 assoziierte, 530 zugeordnete, 530 LEGENDRE-Symbol 339 LElBNlZsche Regel, 401 Leistungsspektruni, 843 Leitkurve, 159 Leitlinie Ellipse, 204 Hyperbel. 206 Parabel, 208 Traktrix, 108 Leitlinieneigenschaft Ellipse, 204 Hyperbel, 206 Kurven 2 Ordnung, 212 Parabel, 208 Lemma Jordan, 717 Schur. 316 Lemniskate, 101, 241 Limes bestimmtes Integral, 457 Funktion, 53 Reihe. 422 superior, 432 Zahlenfolge, 421 linear abhängig, 327 unabhängig, 327 Linearcode. 344 Linearform, 620, 621
Linearform Maple stetige, 643 Linearkombination Vektoren, 84, 186, 189 Linie EuLERsche, 365 offene, 366 geodätische, 163, 258 Linienelement Flache, 253 Vektorkomponenten, 681 Linienintegral, 479 Linksdreiecksmatrix, 919 Linksnebenklasse, 310 Linkspol, 167 Linksschraube, 249 Linkssingulärvektor, 293 Linkssystem, 213 Linsenform, Ellipsoid, 226 LlOUVILLE Approximationssatz, 4 Formel, 518, 826 Satz, 825 LiPSCHiTZ-Bedingung, 505, 515 Lösungsmannigfaltigkeit, 917 Lösungspunkt, 874 Logarithmentafel, 10 Logarithmieren, 9 logarithmische Nor mal Verteilung, 782 logarithmisches Dekrement, 84 Logarithmus binärer, 10 BRiGGSscher, 9 Definition, 9 dekadischer, 9 dualer, 10 Haupt wert, 721 komplexe Funktion, 701 natürlicher, 9, 721 NEPERscher, 9 Logik, 295 Aussagenlogik, 295 Fuzzy-Logik, 374 Pradikatenlogik, 298 LORENTZ-Kurve, 95, 754 LORENZ-System (Attraktor), 822, 825, 850, 865 Lot, sphärisches, 175 Loxodrome, 182 Bogenlänge, 182 Kurswinkel, 183 Schnittpunkte, 183 Schnittpunkte zweier Loxodromen, 184 Lp-Raum, 659 LR-Faktorisierung, 918 Lyapunov Dimension, 849 Exponenten, 844 Funktion, 827 Satz, 827 Stabilität, 827 MAcDONALDsche Funktion, 528 MACLAURiNsche Reihe, 435 Macsyma, 982 Mächtigkeit, Menge, 307 Majorante, 429 MAMDANI-Methode, 389 Manipulation algebraische Ausdrucke, 1010 nichtalgebraische Ausdrucke, 1012 Mannigfaltigkeit instabile, 830, 836 invariante, 830, 836 stabile, 830, 836 Mantelfläche Kegel, 160 Kugel, 161 Polyeder, 156 Pyramide, 157 Quader, 156 Tonnenkörper, 162 Torus, 161 Würfel, 156 Zylinder, 159 Mantisse, 10, 968 Maple algebraische Ausdrucke, 1001 Manipulation, 1012 Multiplikation, 1012 Attribute, 1008 Ausdruck, 998 Differentialgleichungen, 1029 Differentialoperatoren, 1007 Differentiation, 1027 Ein- und Ausgabe, 979, 982, 999 Elemente der linearen Algebra, 1021 Ergänzungen zur Syntax, 1008 Faktorenzerlegung, Polynome, 1013 feldartige Strukturen, 1003 Folgen, 1002 Formelmanipulation, Einfuhrung, 983 Funktionaloperator, 1007 Funktionen, 1006 Gleichungen eine Unbekannte, 1017 transzendente, 1018 Gleichungssysteme, 1018 Eigenwerte und Eigenvektoren, 1023 lineare, 1021 Gleitpunktzahlen, Konversion, 1000 Graphik, 1037 dreidimensionale, 1039 Einfuhrung, 984 zweidimensionale, 1037 Hauptstrukturelemente, 998 Hilfe und Informationen, 1009 Integrale bestimmte, 1028 Mehrfachintegrale, 1028 unbestimmte, 1028 Kontexte, 1008 Kurzcharakteristik, 982 Listen, 1002 Manipulation, allgemeine Ausdrucke, 1014 Matrizen, 1003 Name, 999 indizierter, 999
Maple Mathematica numerische Berechnung, Einfuhrung, 983 Numerische Mathematik, 979 Ausdrücke und Funktionen, 979 Differentialgleichungen 981 Gleichungen, 980 Integration, 980 Objekte, 998 Objektklassen, 998 Operationen auf Polynomen, 1014 wichtige, 1017 Operatoren wichtige, 1001 Partialbruchzerlegung, 1014 Programmierung, 1008 Prozeduren, 1005 Spezialpaket plots. 1039 Symbol, 999 Systembeschreibung. 998 Tabellenstrukturen, 1003 Typen, 998 Umgebungsvariable, 1009 Vektoren, 1003 Zahlenarten, 1000 Zahlenkonversion, verschiedene Basis, 1000 Masche (bei Splines), 961 Maß, 656 auf eine Menge konzentriertes, 840 DiRAC-, 656 einer Dimension, 848 ergodisches, 841 Hausdorff-, 846 invariantes, 840 Lebesgue-, 656, 840 natürliches, 841 physikalisches, 841 SBR-, 841 <7-endliches, 659 Träger, 840 Wahrscheinlichkeits-, 659 Masse Doppelintegral, 491 Dreifachintegral, 497 Kurvenintegral 1 Art, 482 Massenmittelpunkt, 197, 219 Maßraum, 656 von unten, 656 Maßstab, 1 Maßstabsfaktor, 116, 150 Matching, 369 gesättigtes, 369 maximales, 369, 370 perfektes, 369 Mathcad. 982 Mathematica 3D-Graphik, 1036 algebraische Ausdrücke Manipulation, 1010 Multiplikation, 1010 Apply, 995 Attribute, 996 Ausdrücke, 986 Differential- und Integralrechnung, 1023 Differentialgleichungen, 1026 Differentialquotienten, 1023 Differentiation, 995 Ein- und Ausgabe, 975, 982, 986 Elemente, 986 der linearen Algebra, 1019 Faktorenzerlegung, Polynome, 1010 FixedPoint, 995 FixedPointList, 995 Flächen und Raumkurven, 1035 Formelmanipulation, Einführung. 983 Funktionaloperationen, 994 Funktionen, 993 inverse, 994 Gleichungen, 1016 Manipulation, 1015 transzendente, 1016 Gleichungssysteme, 1017 allgemeiner Fall, 1019 Eigenwerte und Eigenvektoren. 1020 Spezialfall, 1019 Gleitpunktzahlen, Konversion, 988 Graphik, 1030 Einführung, 984 Funktionen, 1032 Optionen, 1031 Primitive I, 1030 Primitiveil 1030 Hauptstrukturelemente, 986 Integrale bestimmte, 1025 Mehrfachintegrale 1025 unbestimmte, 1024 Kontexte, 996 Kopf, 986 Kurven Parameterdarstellung. 1034 zweidimensionale 1033 Kurzcharakteristik, 982 Listen, 989 Manipulation von Matrizem, 991 Manipulation von Vektoren, 991 Map, 995 Matrizen als Listen, 991 Meldungen, 997 Muster, 993 Nest, 995 NestList, 995 numerische Berechnung, Einführung, 983 Numerische Mathematik, 975 Differentialgleichungen. 978 Integration, 977 Interpolation, 976 Kurvenanpassung, 976 Polynomgleichurigen, 977 Oberflächen, 1035 Objekte, dreidimensionale, 1036 Operationen, auf Polynomen, 1011 Operatoren, wichtige, 988 Partialbruchzerlegung, 1011 Programmierung, 995 Schreibweise, 988 Syntax. Ergänzungen, 996
Mathern at/ca Menge Systembeschreibung, 986 Vektoren als Listen. 991 Zahlcnarten. 987 Matrix, 259 Adjazenz 363 adjungierte 259. 268 antihermitesche. 261 antisymmetrische, 260 block ti idiagonale, 939 Diagonalmatrix, 260 Drehungsmatrix. 265 Dieiecksmatiix, 261 Di eieckszei legung, 918 Einheitsinatiix, 261 Entfemungs, 364 Funktional , 653 Hauptdiagonalelement, 260 hermitesche 261 Hesse-Matrix, 895 inveise, 264. 268 Invertierung, 280 Inzidenz, 363 Jacobi-, 653 JORDANsche, 290 komplexe, 259 konjugieit komplexe, 259 normale, 260 Nullmatrix, 259 orthogonale, 265 positiv definite, 290 quadratische, 259, 260 Rang, 264 rechteckige, 259 reelle, 259 reguläre, 264 reziproke, 264 schiefsymmetrische, 260 schwach besetzte, 939 selbstadjungierte, 261 singulare, 264 Skalarmatrix, 260 Spur, 260 stochastische, 789 symmetrische, 260 transponierte, 259 unitäre, 265 Valenz, 368 Vollrang, 285 Matrix-Exponentialfunktion, 826 Matrix-Gerüst Satz, 368 Matrixprodukt skalares, 262 Verschwinden, 265 Matrizen Assoziativgesetz, 262 Distributivgesetz, 262 Division, 262 Eigenvektoren, 286 Eigenwertaufgabe, 286 Eigenwerte, 286 Gleichheit, 262 Kommutativgesetz, 262, 263 Multiplikation, 262 Potenzieren, 266 Rechenoperationen, 262 Rechenregeln, 265 max-min-Verknüpfung, 385 Maximalpunkt, 874 Maximalwertsatz, 695 Maximum absolutes, 51, 406 globales, 51, 406 lokales, 51 relatives, 51, 405 Maximum-Kriterium-Methode, 388 MAXWELLsches Diagonalverfahren, 706 Median Meßwerterfassung, 797 Stichprobenfunktionen, 795 Mehriach-Integr altr ansformation, 732 Mehrfachintegral, 488 Mehrfachkante, 361 Mehrfachpunkt, 241 Mehrschritt verfahren, 932 Mehrzielverfahren, 937 MELLiN-TYansformation, 731 MELNIKOV-Methode, 867 Membranschwingungsgleichung, 545 Menge abgeschlossene, 627 Abschließung, 627 absorbierende, 823 abzählbar unendliche, 307 Axiome der abgeschlossenen, 627 Axiome der offenen, 626 beschränkte im metrischen Raum, 626 BOREL-Menge, 656 dichte, 627 disjunkte, 301 Element, 300 Faktormenge, 306 fundamentale, 636 Fuzzy, 374 ganze Zahlen, 1 gleichmächtige Mengen, 307 invariante, 823 chaotische, 852 fraktale, 852 stabile, 823 irrationale Zahlen, 1 kompakte, 648, 824 komplexe Zahlen, 34 konvexe, 619 Koordinaten {x,y), 303 leere, 300 lineare, 617 Mächtigkeit, 307 Mengenbegriff, 299 meßbare, 656 natürliche Zahlen, 1 offene, 626 ordnungsbeschränkte, 622 Potenzmenge, 300 rationale Zahlen, 1 reelle Zahlen. 2 relativkompakte, 648
Menge Multiplikation Schranke, 622 Teilmenge, 300 uberabzählbar (unendliche), 307 unendliche, 307 unscharfe, 374 Mengenalgebra, Grundgesetze, 302 Mengenlehre, 299 Mengenoperation, 301 Differenz, 303 Durchschnitt, 301 kartesisches Produkt, 303 Komplement, 301 symmetrische Differenz, 303 Vereinigung, 301 Meridian, 165, 252 Meridiankonvergenz, 174 Meßfehlereinteilung qualitative Merkmale, 811 quantitative Merkmale, 813 Meßfehlerverteilung, 811 Meßfehlerverteilungsdichte, 811 Meßfunktion, 853 Meßprotokoll, 811 Meßwert, 811 Meßwerterfassung, 795 Strichliste, 796 Methode BERNOULLische, 916 der finiten Differenzen, 553 der finiten Elemente, 553, 581, 940 der Flächenhalbierung, 388 der größten Fläche, 388 der kleinsten Quadrate, 948 Einordnung, 418 der parametrisierten Flächenhalbierung, 388 der statistischen Versuche, 810 der unbestimmten Koeffizienten, 16 GREENsche, 550 Mamdani-, 389 Maximum-Kriterium-, 388 Mean-of-Maximum-, $88 mittlere Ziffern von Quadraten, 806 Monte-Carlo-, 806 RiEMANNsche, 548 schrittweise Näherung, 513 Sugeno-, 389 sukzessive Approximation, 513 BANACH-Raum, 642 ungarische, 887 Variation der Konstanten, 519 Metrik, 624 Flache, 254 Maximum-, 625 Meusnier, Satz, 255 Minimalflache, 257 Minimalgerust, 369 Minimalpunkt, 888 globaler, 888 lokaler, 888 Minimum absolutes, 51, 406 globales, 51, 406 lokales, 51 relatives, 51, 405 Minimumaufgabe, 874 MiNKOWSKische Ungleichung, 33 Mittel arithmetisches, 19, 776 geometrisches, 20 gewogenes, 776, 817 harmonisches, 20 quadratisches, 20 Mittellinie, Dreieck, 136 Mittelpunkt sphärischer, 180 Strecke Ebene, 197 Raum, 219 Mittelpunktsflächen, 226 Mittelpunktskurve, 211 Mittelpunktsregel, 933 Mittelpunktswinkel, 133 Mittelsenkrechte, Dreieck, 135 Mittelwert, 19, 776 Funktion, 461 gewichteter, 813 gleichgewichteter, 813 Meßwerterfassung, 796 Stichprobenfunktionen, 794 zweidimensionale Verteilung, 803 Mittelwertformel, 926 Mittelwertmethode, 109 Mittelwertsatz Differentialrechnung, 404 verallgemeinerter, 405 Integralrechnung, 461 verallgemeinerter, 461 Modalwert, Meßwerterfassung, 797 Modul, 185 analytische Funktion, 694 eines Elements, 623 komplexe Zahl, 35 Modulo-Abbildung, 840 MoiVREsche Formel Hyperbelfunktionen, 91 komplexe Zahlen, 38 trigonometrische Funktionen, 81 MOLLWEiDEsche Gleichungen, 146 Moment (Tragheits-), 468 Moment (Statistik) Ordnung n, 776 zentrales, Ordnung n, 776 Monodromie-Matrix, 827, 828, 836 Monotonie, 656 Funktion, 50 Zahlenfolge, 420 Monotoniebedingung, 403 Monte-Carlo- Methode, 806 Anwendung in der numer Mathematik, 808 gewöhnliche, 808 Simulation, Beispiel, 808 MORSE-SMALE-Systeme, 839 Multi-Skalen-Analyse, 766 Multiindex, 633 Multiplikation, 969
Multiplikation Oberfläche, Doppelintegral komplexe Zahlen, 37 Polynome, 11 rationale Zahlen, 1 Multiplikatoren, 827, 828 836 Multiplikatorenmethode, LAGRANGEsche, 419 Muster, periodische, 566, 567 Mutation, 897 Nabelpunkt, 257 Nablaoperator Definition, 677 zweifache Anwendung, 678 Nachrichtenwort, 343 Näherung, asymptotische, 15 Näherungsformeln empirische Kurven, 109 Reihenentwicklung, 435 Näherungsgleichung, 513 NAND-Funktion, 297 nat, 354 Nautik, 177 Navigation, 179 Nebenbedingung dynamische, 905 statische, 905 Variationsaufgabe, 572, 576 Nebenwinkel, 132 Negation. 295 BoOLEsche Funktion, 357 doppelte, 297 Neigungswinkel. 148 NEPERsche Gleichungen, 172 Netz, isometrisches, 697 Netztafel 127 drei Veränderliche, 127 mehr als drei Veränderliche, 130 NEUMANNsche Reihe, 588, 607 NEUMANNsches Problem, 691 NEWTONsche Interpolationsformel 945 NEWTON-Verfahren. 652, 912. 924 adaptives, 981 modifiziertes, 652, 912 nichtlineare Optimierung, 895 gedämpftes, 896 NICHT, 295 Nichtbasisvariable, 877 nichtnegative ganze Zahlen, 1 Niveaufiäche, 665 Niveaulinie 121, 665 Nomogramm, 127 Nomographie, 127 NOR-Funktion, 297 Nordrichtung geodätische, 174 geographische, 174 Norm. 285 EuKLiDische, 266, 328 Integralnorm 660 Matrizennorm, 266 Spaltensummennorm, 267 Spektralnorm, 267 Zeilensummennorm, 267 zugeordnete Norm. 267 normierter Raum, 631 Operator. 826 Operator-Norm. 639 6-Norrn. 379 i-Norm, 379 Vektor norm, 266 Betragssummennorm, 266 EuKLiDische Norm, 266 Matrizennorm, 266 Normale, ebene Kurve, 233 Normalebene, Raumkurve. 246, 248 Normalenabschnitt, 234 Normalenvektor Ebene, 220 Fläche, 252 Normalform, 358 Gleichung einer Fläche, 226 JORDANsche, 290 kanonisch disjunktive, 358 kanonisch konjunktive, 358 lineare Optimierung, 875 reduzierte Differentialgleichung, 856 Normalgleichung, 921 947, 948 Normalgleichungssystem, 805, 947 Normalteiler, 311 Normalverteilung, 780 logarithmische, 782 normierte, 782 Tabelle, 1122 zweidimensionale, 803 Normal Verteilungsgesetz, 780 Beobachtungsfehler, 73 Normierungsbedingung, 560 Normierungsfaktor, 200 Normisomorphic. 646 Notation polnische, 368 Postfix- Notation. 368 Präfix-Notation, 368 umgekehrte polnische. 368 Null (OHntervall. 622 Nullmatrix, 259 Nullpunkt, 1 Nullpunktsschwingungsenergie, 565 Nullpunktstranslationsenergie, 561 Nullstelle, komplexe Funktion, 695 Nullstellengleichung, 911 Nullteiler, 324 Nullvektor, 186 Numerik-Bibliothek, 911 Numerus, 10 Nutationswinkel 218 NYSTRÖM-Verfahren 593 Obelisk, 158 Oberflächeninhalt Kegel, 160 Kugel. 161 Polyeder, 156 Tonnenkörper, 162 Toms, 161 Zylinder, 159 Oberfläche, Doppelintegral, 491
Oberflächenintegral Optimierungsverfahren Oberflächenintegral, 496, 684, 685 1 Art, 496 2 Art, 499, 500 allgemeiner Art, 502 ODER, 295 exklusives, 357 Oktaeder, 158 Oktalsystem, 965 Oktalzahl, 965 u;-Grenzmenge, 823, 829, 836 Operation, 308 äußere, 308 algebraische, 272 arithmetische, 1 assoziative, 308 binäre, 308 kommutative, 308 n-stellige, 308 Operator abgeschlossener, 641 adjungierter, 646 Begriff, 49 beschränkter, 639 demistetiger, 655 differenzierbarer, 652 endlichdimensionaler, 649 Gamma-, 382 Hamilton-, 558 Hammerstein-, 651 idempotenter, 648 inverser, 621 isotoner, 654 koerzitiver, 655 kompakter, 649 kompensatorischer, 382 kontrahierender, 628 Lambda-, 382 linearer, 329, 620 beschränkter, 639 stetiger, 639 ' linearer, Begriff, 329 linearer, Kommutativität, 329 linearer, Produkt, 329 linearer, Vertauschbarkeit, 329 monotoner, 655 Nemytskij-, 651 ODER-, 382 positiv definiter, 648 positiver, 623 selbstadjungierter, 648 singulärer, 612 stetiger, 631 inverser, 641 streng monotoner, 655 UND-, 382 Urysohn-, 652 Verknüpfungs-, 385 vollstetiger, 649 Operatorenmethode, 552 Integraltransformation, 732 Operatorenschreibweise, Differentialgleichungen, Operatornorm, 826 Optimalitätsbedingung, 888, 890 hinreichende, 889 Optimalitätsprinzip, BELLMANsches, 907 Optimierung, diskrete dynamische, 905 Einkaufsproblem, 905 Funktionalgleichungen, 907 BELLMANsche, 906 Funktionalgleichungsmethode, 908 kontinuierlich dynamische, 905 Kostenfunktion, 906 Minimumvertauschbar keit, 907 n-stufige Entscheidungsprozesse, 905 optimale Einkaufspolitik, 909 optimale Politik, 908 Rucksackproblem, 906, 909 Optimierung, lineare, 873 allgemeine Form, 873 Basis der Ecke, 876 Dualität, 882 Ecke, 875 Eckpunkt, 876 Eigenschaften, 875 entartete Ecke, 876 Formen, 873 Grundbegriffe, 875 Nebenbedingung, 873 Reihenfolgeproblem, 887 Rundreiseproblem, 887 Transportproblem, 884 Verteilungsproblem, 887 Zuordnungsproblem, 886 Optimierung, nichtlineare, 888 Abstiegsverfahren, 895 Barriere-Verfahren, 903 Dualität, 889 Evolutionsstrategien, 897 Gradientenverfahren, 895 Ungleichungsrestriktionen, 898 konvexe, 646, 890 Konvexität, 891 Mutation, 897 NEWTON-Verfahren, 895 numerisches Suchverfahren, 893 Prinzip der Strahlminimierung, 895 quadratische, 890 Rekombination, 897 Richtungssuchprogramm, 898 Sattelpunkt, 888 Selektion, 897 Optimierungsaufgabe duales Problem, 882 konvexe, 890 lineare Basislösung, 877 Normalform, 877 nichtlineare, 954 primales Problem, 882 Optimierungsproblem dynamisches, 905 lineares, 884 Optimierungsverfahren des steilsten Abstiegs, 895 DFP-Verfahren, 896
Ophrnierungsverfahren PARSEVALSche FiBONACCi-Veifahren, 894 gedämpftes, 896 Goldener Schnitt, 894 Hildreth-d'Esopo. 893 Kelley, 904 konjugierte Gradienten 896 projizierte Gradienten, 900 Schnittebenen- Verfahren. 904 Straf- und Barriere-Verfahren, 902 unrestringierte Aufgabe, 895 Wolfe, 891 zulassige Richtungen, 898 Orbit, 821 heterokhner, 832 homokliner, 832, 867 periodischer, 821 hyperbolischer, 829 sattelartiger, 829 zweifach zusammengesetzter, periodischer, Ordinate, 195, 214 Ordinatenachse, 195 Ordnung, 307 Flächen 2 , 226 Kurve n-ter Ordnung, 199 Kurven 2 , 210 lexikographische, 307 partielle, 307 vollständige, 307 Wavelet, 764 Ordnungsintervall, 622 Ordnungsrelation, 306 vollständige, 307 OREscher Satz, 367 Orientierung, 277 Koordinatensystem, 213 Zahlengerade, 1 Originalbereich, 730 Menge 49 Originalfunktion, 730 Ort gegißter, 182 geometrischer, 199 Orthodrome, 179 Bogenlänge, 180 Kurswinkel, 179 nordpolnächster Punkt, 179 Schnittpunkte, 180 zweier Orthodromen, 184 Orthogonahsierungsvcrfahren, 920, 921 GiVENSsches, 922 GRAM-ScHMiDTsches, 288. 638 HouSEHOLDERsches, 286, 922 ScHMiDTsches, 599 Oithogonalität Geraden, 131 Gewicht, 533 HlLBERT-Raum, 636 reeller Vektorraum, 328 trigonometrischer Funktionen, 328 Vektoren, 189 Orthogonalitätsbedingung Ebenen, 223 Gerade-Ebene. 226 Geraden im Raum, 225 Orthogonalitätsrelation, 533 Orthogonaliät Eigenvektoren, 288 Orthogonalpolynom, 948 Orthogonalraum, 636 Orthonormierung, Vektoren, 270 Orthozentrum, 135 Ortskoordinaten, Spiegelung, 277 Ortskurventheorie, 916 Oszillator, linearer harmonischer, 564 Paar, geordnetes, 303 Parabel, 208 Achse, 208 Binom. 71 Brennpunkt, 208 Definition 209 Durchmesser, 209 Flächeninhalt, 210 Gleichung, 209 Halbparameter, 208 Krümmungskreisradius 210 kubische. 64 Leitlinie, 208 n-ter Ordnung, 66 Parameter, 209 quadratisches Polynom. 64 Scheitel, 208 semikubische, 95 v Tangente, 209 Transformation, 211 Parabelbogen, Länge, 210 Paraboloid, 228 elliptisches, 228 hyperbolisches, 228, 229 Mittelpunksfläche, 230 Invariantenvorzeichen elliptisches, 230 hyperbolisches, 230 parabolisches, 230 Rotations-, 228 Parallelepiped, 156 Parallelitätsbedingung Ebenen, 223 Gerade-Ebene, 226 Geraden im Raum, 225 Parallelkreis, 252 Parallelogramm, 138 Parallelogrammgleichung, unitärer Raum, 635 Parameter algebraischer Ausdruck, 11 Funktion, 50 Parabel, 209 statistische. 796 Parameterdarstellung, 50 Kreis, 203 Parameterintegral, 476 Parameter räum, Stochastik, 788 Parität, 564 PARSEVALSChe Formel, 752 Gleichung, 438, 534, 600, 638
Partialbruchzerlegung Partialbruchzerlegung, 15 spezielle Fälle, 1059 Partialsumme, 422 Partikulärintegral, 459 Partikularisator, 298 PASCALsche Schnecke, 98 PASCALsches Dreieck, 13 Pendel FoucAULTsches, 978 mathematisches, 725 Pendelgleichung, 867 Periode, 52, 83 Sekans, 78 Sinus, 76 Tangens, 77 Periodenparallelogramm, 726 Periodenverdopplung, 862 Kaskade, 863, 869 Periodisierungsfaktor, 739 Peripheriewinkel, 143 Permutation, 768 Permutationsgruppe, 311 Permutationsmatrix, 919 PESiNsche Formel, 845, 851 PESIN-TEMPELMAN-Satz, 848 Pfeildiagramm, 304 Pharmazentralnummer, 342 Phase, 83 Sinus, 76 Phasenporträt, 824 Phasenraum, 821 Stochastik, 788 Phasenspektrum, 750 Phasenverschiebung, 83 Physikalische Einheiten, 1043 PiCARDsches Iterationsverfahren, 587 Pivot, 918 Pivotelement, 279, 879 Pivotspalte, 279, 879 Pivotzeile, 279, 879 Planimeter, 464 Planimetrie, 131 PoiNCARE-Abbildung, 834 PoiSSONsche Differentialgleichung, 557, 689, 691 Formel, 556 PoiSSONsches Integral, 552 PoiSSON-Verteilung, 780 Pol analytische Funktion, 695 auf der Kugel, 167 Funktion, 60 Koordinatenursprung, 186, 195 Ordnung m, komplexe Funktion, 715 Vielfachheit m, komplexe Funktion, 715 Polabstand, 252 Polarachse, 195 Polardreieck, 167 Polare, 167 Polargleichung, 562 Kurve 2 Ordnung, 213 Polarkoordinaten, 195, 196 räumliche, 215 Prä-HlLBERT -Raum Polarnormalenabschnitt, 235 Polarsubnormale, 235 Polarsubtangente, 235 Polartangentenabschnitt, 235 Polarwinkel, 195 Polyeder, 156 konvexes, 159 reguläres, 158 Polyedersatz, EuLERscher, 159 Polygon, 140 Polygonierung, 151 Polygonzugverfahren, EULERsches, 931 Polynom, 11, 64 1 Grades, 64 2 Grades, 64 3 Grades, 64 charakteristisches, 286 ganzrationale Funktion, 62 irreduzibles, 325 Minimal-, 326 n-ten Grades, 65 primitives, 325 quadratisches, 64 trigonometrisches, 954 Polynome BERNSTEINsche Grundpolynome, 962 HERMiTEsche, 565, 637 LAGUERREsche, 531, 638 LEGENDREsche, 529, 637 Produktdarstellung, 43 TSCHEBYSCHEFF-Formel, 88 TSCHEBYSCHEFFSChe, 951 Polynomgleichung, Lösung, 914 Polynominterpolation, 945 Polynomring, 323, 325 PoSAscher Satz, 367 positiv definit, 920 Postfix-Notation, 368 Potential komplexes, 703 konservatives Feld, 683 retardiertes, 556 Potentialfeld, 683 Rotation, 677 Potentialgleichung, 557 Potenz Begriff, 8 reziproke, 70 Potenzieren komplexe Zahlen, 38 Matrizen, 266 reelle Zahlen, 8 Potenzmenge, 300 Potenzreihe, 432 asymptotische, 435 komplexe, 712 Umkehrung, 434 Potenzreihenentwicklung, 434 analytische Funktion, 711 Prädikat, 298 n-stelliges, 298 Prädikatenlogik, 298 Prä-HiLBERT-Raum, 635
Prävalenz Quadratmittelproblem Piävalenz, 854 Präzessionswinkel 218 Prediktoi, 933 Prediktor-Konektor Verfahren, 933 Primelemente, 330 Primfaktorzerlegung, 331 kanonische, 331 Primzahl. 330 Drillinge, 331 FERMATsche. 331 MERSENNEsche, 331 Vierlinge, 331 Zwillinge, 331 Prinzip «• CAUCHYsches, 628 CAVALiERisches. 467 der Zweiwertigkeit, 295 NEUMANNsches. 317 Prisma, 156 gerades, 156 reguläres, 156 Problem CAUCHYsches, 536 DlRlCHLETsches, 547, 691 inhomogenes, 556 isoperimetrisches, allgemeines, 573 kürzester Weg, 364 NEUMANNsches, 691 regularisiertes, 286 STURM-LlOUViLLEsches, 533 Problemstellung, korrekte. 554 Produkt, 7 algebraisches, 380 direktes Gruppen, 311 f2-Algebra, 354 drastisches, 380 dyadisches Tensoren, 272 Vektoren, 263 kartesisches, 303, 383 n-faches, 384 Kronecker , 266 n-faches direktes, 356 Produktzeichen, 7 Rechenregeln, 7 vektorielles, 188 Produktansatz, 543 Produktregel. 396 Programmierung Computeralgebrasysteme, 984 Maple, 1008 Mathematica, 995 Projektionssatz, 146 Orthogonalraum. 636 Projektor, 648 Proportionalität direkte, 64 umgekehrte, 66 Proportionalitätsfaktor, 64 Proportionen 17 Protokoll, 795 Prozent, 21 Prozentrechnung, 21 Prozeß Geburtsprozeß, 792 PoiSSON-Prozeß, 791 stochastischer, 788 Todesprozeß 792 Prüfverfahren Prinzip, 802 statistische, 797 Prüfzeichen, 342 Prüfziffer, 342 Pseudoskalar, 278 Pseudotensor, 277, 278 Pseudovektor, 277, 278 Pseudozufallszahlen, 807 PTOLEMÄUS, Satz, 139 Punkt, 131 asymptotischer, 240 Berührungs-, 627 der größten Annäherung, 244 Häufungs-, 627 innerer, 626 isolierter, 240, 627 Koordinaten, 195 77 -dimensionaler Raum, 120 nichtwandernder, 839 rationaler, 1 Sattel . 512 singulärer, 232, 240, 510, 511 isolierter, 511 Knoten-, 511 Strahl-, 512 Strudel-, 512 Wirbel-. 512 stationärer, 889 transversaler homokliner, 837 Umgebung, 626 uneigentlicher, 198 Punktspektrum, Operator, 643 Pyramide, 157 gerade, 157 n-seitige, 157 reguläre, 157 Pyramidenstumpf, 157 Pythagoras rechtwinkliges Dreieck, 145 schiefwinkliges Dreieck, 146 QR-Algorithmus, 291 QR-Zerlegung, 921 Quader, 156 Quadrant, 195 Quadrantenrelationen 79 Quadrat, 138 quadratische Form reelle, 289 reelle, positiv definite, 290, 920 Quadratmittelaufgabe, 917 nichtlineare, 950 verschiedene Bezeichnungen, 418 Quadratmittelmethode, 806 Quadratmittelproblem lineares, 285, 921
Quadratmittelproblem Rechtecksumme rangdefizienter Fall, 286 Quadraturformel, 925 GAUSS-Typ, 927 HERMlTEsche, 926 Integralgleichung, 592 Interpolationsquadratur, 926 LoBATTOsche, 928 Quadratwurzel komplexe, 700 naturliche Zahlen, 8 Quadrupel, 303 Quantenzahl, 560 Bahndrehimpuls-, 562 magnetische, 563 Schwingungs-, 565 Quantifizierung, beschränkte, 299 Quantil, 775 Quantisierungsbedingung, 565 Quantor, 298 quasiperiodisch, 830 Quelldichte, 689 Quelle, 828, 836 Knoten, 372 Vektorfeld, 673 Quellenfeld reines, 689 wirbelfreies, 689 Quellenverteilung diskrete, 690 kontinuierliche, 691 Quersumme 1 Stufe, 332 2 Stufe, 332 3 Stufe, 332 alternierende 1 Stufe, 332 2 Stufe, 332 3 Stufe, 332 Quintupel, 303 Quotientenregel, 397 Rabatt, 21 Radialgleichung, 562 Radiant, 133 Radikal, 510 Radikand, 8 Radius Kreis, 143 Polarkoordinaten, 195 Radiusvektor, 186 komplexe Zahlenebene, 35 Radizieren, 8 komplexe Zahlen, 38 Rahmen, YouNGscher, 316 Randbedingung, 572 Randintegralgleichungsmethode, 553 Randkollokation, 940 Randmethode, 939 Randverteilung, 777 Randwertaufgabe, 504, 935 Randwertbedingungen, 504 Randwertproblem, 532 HiLBERTsches, 613 Index, 614 homogenes, 532 inhomogenes, 532 lineares, 532 Rang Matrix, 264 Vektorraum, 328 Raum abstrakter, 49 endlichdimensionaler, 648 geordneter normierter, 634 HlLBERT-Raum, 635 isometrischer, 631 KANTOROVICH-Raum, 623 linearer, 616 Lp-Raum, 659 mehrdimensionaler, 120 metrischer, 624 normierbarer, 632 normierter, Axiome, 631 RlESZscher-Raum, 623 separabier, 627 SOBOLEW-Raum, 633 unitärer, 635 vollständiger, 628 Rauminversion, 277 Skalarprodukt, 278 Spatprodukt, 278 Raumkurve, 245 begleitendes Dreibein, 246 Binormale, 246, 248 Gleichung, 220, 245 Hauptnormale, 246, 248 Koordinatengleichung, 248 Krümmung, 248 Krummungskreisradius, 249 Normalebene, 246, 248 Richtung, 246 Schmiegungsebene, 246, 248 Tangente, 246, 248 Vektorgleichung, 246, 248 Windung, 250 Windungsradius, 250 Raumrichtung, 185, 216 Raumwinkel, 155 RAYLEiGH-RiTZ-Algorithmus, 291 Reaktion, chemische, Konzentration, 118 Realteil, 34 Rechenschieber, 10 logarithmische Skala, 116 Rechnen mit Polynomen, 326 Rechnen, numerisches, 971 Computer, 968 Genauigkeit, 970 Grundoperationen, 969 Rechte-Hand-Regel, 189, 684 Rechteck, 138 Rechteckformel linksseitige, 926 ' rechtsseitige, 926 Rechteckimpuls, 719, 737 Rechtecksumme, 926
Rechtsdreiecksmatrix Richtung Rechtsdreiecksmatrix, 919 Rechtsnebenklasse, 310 Rechtspol, 167 Rechtsschraube, 249, 684 Rechtssingulärvektor, 293 Rechtssystem, 213 Reduce, 982 Reduktionsformeln, trigonometrische Funktionen, Regel Bernoulli -L'HospiTALsche, 56 CRAMERsche, 283 DE MoRGANsche, 297 DESCARTESsche, 45 GuLDiNsche, 1 , 469 GüLDlNsche, 2 , 470 LEiBNizsche, 401 linguistische, 390 NEPERsche, 173 SARRUSsche, 269 Regelfläche, 257 Regression lineare, 803 mehrdimensionale, 804 Regressionsanalyse, 802 Regressionsgerade, 803, 804 Regressionskoeffizient, 804 Regula falsi, 913 Regularisierungsparameter, 286 Regularisierungsverfahren, 294 Regularitätsbedingung, 889, 903 Reihe absolute Konvergenz, 432 allgemeines Glied, 422 alternierende, 426 arithmetische, 18 BANACH-Raum, 632 binomische, 14 CLEBSCH-GORDAN-Reihe, 316 divergente, 422 Divergenz, 425 endliche, 18 FOURIER-Reihe, 437 komplexe Darstellung, 438 Funktionenreihe, 430 geometrische, 19 unendliche, 19, 422 harmonische, 422 hypergeometrische, 531 Integralkriterium, 425 konstante Glieder, 422 konvergente, 422 Konvergenz, 425 gleichmäßige, 431, 432 ungleichmäßige, 431 Konvergenzbereich, 430 Konvergenzsätze, 422 MAcLAURiNsche, 435 NEUMANNsche, 640 Partialsumme, 422 Potenzreihe, 432 Quotientenkriterium, 424 Restglied, 422, 430 Summe, 422 TAYLOR-Reihe, 405, 434 unbestimmter Koeffizienten, 514 unendliche, 420, 422 Vergleichskriterium, 423 WEIERSTRASS-Kriterium, 431 Wurzelkriterium, 424 Reihenentwicklungen, 742 Reihenfolgeproblem, 887 Reihenrest, 422 Abschätzung, 429 Rekombination, 897 Rekonstruktion (System aus Zeitreihen), 853 Rekonstruktionsabbildung, 853 Rekonstruktionsraum, 854 Rekonstruktionssatz Sauer, Yorke, Casdagli, 854 Takens, 853 Rektifizierung, 109 Relation, 303 Aquivalenzrelation, 306 binäre, 304 fuzzy-wertige, 383 inverse, 304 Kongruenzrelation, 353 n-stellige, 303 Ordnungsrelation, 306 Relationenprodukt, 304 Relationsmatrix, 304 Relaxationsparameter, 923 Relaxationsverfahren, 923 Relief, analytische Funktion, 694 Rem ES-Algorithmus, 953 Rente ewige, 24 nachschussig konstante, 25 Rentenbar wert, 25 Rentenendwert, 25 Rentenrechnung, 24 RENYl-Dimension, 849 Residualspektrum, Operator, 643 Residuensatz, 715, 716 Anwendungen, 717 Residuum, 285, 716, 920 Resolvente, 588, 590, 607 Resolvente, Operator, 642 Resolventenmenge, Operator, 642 Resonanz-Torus, 868 Rest, quadratischer modulo ra, 339 Restglied, 422 Restklasse, 337 prime, 338 primitive, 338 Restklassenaddition, 337 Restklassenmultiplikation, 337 Restklassenring, 323, 337 modulo m, 337 Restspektrum, Operator, 643 Rhombus, 138 Richtung ebene Kurve, 232 Raum, 185, 216 Raumkurve, 246
Richtungsableitung Satz Richtungsableitung, 670, 672 Skalarfeld, 670 Vektorfeld, 670 Richtungsfeld, 505 Richtungskoeffizient, 67, 188 Ebene, 200 Richtungskosinus, Raum, 216 Richtungstripel, 186 kartesische Koordinaten, 187 Richtungswinkel, Geodäsie, 149 RlEMANN-Integral, 458 Vergleich mit LEBESGUE-Integral, 470 Vergleich mit STIELTJES-Integral, 470 RlEMANNsche Fläche, mehrblättrige, 707 Formel, 549 Funktion, 548 Methode, 548 RlEMANN-Summe, 458 Ring, 323 Faktorring, 324 Homomorphiesatz, 324 Polynom-, 323 Unterring, 324 Ringhomomorphismus, 324 Ringisomorphismus, 324 Risikotheorie, 21 RlTZ-Verfahren, 581, 936 Rn (n-dimensionaler euklidischer Vektorraum), 262 ROMBERG-Verfahren, 928 Rotation Definition, 675 Hinweis, 671 mit Nablaoperator, 677 Potentialfeld, 677 Vektorfeld, 675 Vektorkomponenten, 680 verschiedene Koordinaten, 676 Rotations-Abbildung, 841 Rotationsellipsoid, 226 Rotationsfläche, 220 Rotationskörper, Mantelfläche, 466 Rotationsparaboloid, 228 Rotationszahl, 870 Rotator, raumfreier starrer, 561 Ruckkehrpunkt, 240 Rückversetzung, 179 Rückwärtseinsetzen, 918 Rückwärtseinschnitt Cassini, 153 Snellius, 152 RüELLE-TAKENS-NEWHOUSE-Szenario, 868 Ruhelage, 821 hyperbolische, 828 Rundreiseproblem, 887 Rundung, 968 Rundungsfehler, 971 RuNGE-KuTTA-Verfahren, 931 Saitenschwingungsgleichung, 543 SARRUSsche Regel, 269 Sattel, 828, 836 Sattelpunkt, 512, 888 Satz Abel, 432 abgeschlossener Graph, 641 Afraimovich-Shilnikov, 868 Andronov-Pontryagin, 838 Andronov-Witt, 828, 829 Apollonius, 204 Arzela-Ascoli, 649 BAiREscher Kategoriensatz, 628 Banach, 641 Banach-Steinhaus, 641 Bayes, 773, 774 Berge, 370 Beschranktheit einer Funktion eine Veränderliche, 62 mehrere Veränderliche, 126 binomischer, 12 Birkhoff, 354, 841 Block, Guckenheimer, Misiuriewicz, 853 Bogoljubov-Krylov, 841 BOLZANO eine Veränderliche, 61 mehrere Veränderliche, 126 Cayley, 312, 368 Chinesischer Restsatz, 338 Denjoy, 870 Differenzierbarkeit n d Anfangsbedingungen, 821 DlRAC, 367 Douady-Oesterle, 850 Euklid, (Sätze), 145 Euler, 341 Euler-Hierholzer, 365 EuLERscher Polyedersatz, 159 Fatou, 659 Fermat, 341, 403 Fermat-Euler, 341 Floquet, 827 Fundamentalsatz Algebra, 43 elementare Zahlentheorie, 331 Girard, 169 Grobman-Hartman, 835, 837 Hadamard-Perron, 831, 836 Hahn (Fortsetzungssatz), 645 Hauptsatz Funktionentheorie, 710 homogene lineare Differentialgleichung, 826 inhomogene lineare Differentialgleichung, 826 Integralrechnung, 458, 475 Hellinger-Toeplitz, 641 HlLBERT-SCHMIDT, 650 Holladay, 959 Hurwitz, 520 Integralsatz, Cauchy, 710 Konstanz, analytische Funktion, 695 Krein-Losanowskij, 641 Kugelschachtelungssatz, 628 Kupka-Smale, 853 Kuratowski, 371 Lagrange, 311 Lebesgue, 659 Ledrappier, 849 Leibniz, 426
Satz Schwerpunktmethode Leray-Schauder,654 Levi. B . 658 Liouville, 695, 825 Lyapunov, 827 Maximalwert, analytische Funktion, 695 Meusnier, 255 Ore, 367 Oseledec, 844 Palis-Smale, 840 Pesin-Tempelman, 848 PlCARD-LlNDELÖF, 630, 821 Poincare-Bendixson, 830 Posa. 367 Ptolemaus, 139 Pythagoras Orthogonalraum, 636 rechtwinkliges Dreieck, 145 schiefwinkliges Dreieck, 146 Radon-Nikodym,659 Riemann, 426 Riesz, 644 Riesz-Fischer, 638 Rolle, 404 Sauer, Yorke, Casdagli, 854 Schauder, 649 SCHWARZscher Vertauschungs-, 411 Sharkovsky, 853 Shilnikov, 866 Shinai, 853 Shoshitaishvili, 856 Smale, 866 Stabilität in erster Näherung, 828 Stabilität zeitdiskreter Systeme, 836 Superpositionssatz, 690 Takens, 853 Taylor, 405 Tschebyscheff, 453 Tutte, 369 Variation der Konstanten, 826 vollständige Wahrscheinlichkeit, 773 Weierstrass, 431, 627 eine Veränderliche, 62 mehrere Veränderliche, 126 Whitney, 853 Wilson, 341 Wintner-Conti, 824 Wurzelsatz, VlETAscher, 44 Young, 848 Zentrumsmannigfaltigkeit Abbildungen, 861 Differentialgleichungen, 856 Zerlegungssatz, 306 zum EuKLlDischen Algorithmus, 334 Schatzwert, 794, 802 Schaltalgebra, 355, 358 Schaltfunktion, 358 Schaltwert, 358 Scheitel ebene Kurve, 239 Ellipse, 204 Parabel, 208 Scheitelpunkt, 131 Scheitelwinkel, 132 Schema, FALKsches, 263 Schenkel, 131 Schieberegister, lineare, 326 Schießverfahren, 937 einfaches, 937 Schleifenfunktion, 1038 Schleppkurve, 108 Schlinge. Graph, 361 Schlüsselgleichung, 127 Schlupfvariable, 874 Schluß von n auf n + 1, 5 Schmiegkreis, 237 Schmiegungsebene, Raumkurve, 246, 248 Schnitt DEDEKlNDscher, 301, 307 Fuzzy-Menge, 378, 379 goldener, 198 Mengen, 301 scharfer a-, 378 unscharfe Mengen, 379 Schnittebene, 163 Schnittebenen-Verfahren, 904 Schnittkreis, 163 Schnittpunkt drei Ebenen, 222 Ebene und Gerade, 225 Geraden, 201 Geraden im Raum, 225 vier Ebenen, 223 Schnittwinkel, 164 SCHOENFLIESS-Symbolik, 317 Schranke Folge, 420 Funktion, 51 Menge, 622 unscharfe, 383 Schraubenlinie, 249 Schrittweite, 931 Schrittweitenparameter, 924 Schrittweitensteuerung, 932 SCHRÖDINGER-Gleichung lineare, 557 nichtlineare, 567, 569 zeitabhängige, 558 zeitunabhängige, 559 Schwankung, Funktion, 62 ScHWARZ-BuNJAKOWSKi-Ungleichung, 635 SCHWARZ-CHRISTOFFEL-Formel, 701 SCHWARZscher Vertauschungssatz, 411 SCHWARZsches Spiegelungsprinzip, 703 Schweredruck, Integration, 468 Schwerpunkt, 197, 219 beliebige ebene Figur, Integration, 470 Bogenstuck, Integration, 469 Dreieck, 135 geschlossene Kurve, Integration, 469 Trapez, Integration, 470 Schwerpunktkoordinaten Doppelintegral, 491 Dreifachintegral, 497 Kurvenintegral 1 Art, 482 Schwerpunktmethode, 388 parametrisierte, 388
Schwerpunktmethode Spaltensummenkriterium verallgemeinerte, 388 Schwingung, harmonische, 83 Schwingungsdauer Pendel, 725 Schwingungen, 83 Sehne, 144 schneidende, 142 Sehnensatz, 142 Sehnentangentenwinkel, 143 Sehnenvieleck, 140 Sehnenviereck, 139 Sehnenwinkel, 143 Seitendruck, Integration, 468 Seitenfläche, 155 Seitenhalbierende. 135, 146 Seitenkosinussatz, 169 Sekans, 78 hyperbolicus, 88 Sekansfunktion. 133 Sekante, 142 Sekantensatz, 142 Sekantentangentensatz, 143 Sekantentangentenwinkel, 143 Sekantenwinkel, 143 Sektorformel, 687 Selbstähnlichkeit, 847 Selbstberührungspunkt, 240 Selektion, 897 semimonoton, Norm, 634 Semiorbit, 821 Senke, 828, 836 Knoten, 372 Vektorfeld. 673 sensitiv bezüglich der Anfangswerte, 852 Separationsansatz, 543, 559 Separationskonstante, 560 Separatrixfiäche, 830, 836 Separatrixschleife, 832. 866 Sexagesimaleinteilung, 133 SHIFT-Abbildung, 844, 852 Sicherheit, statistische, 799, 800 Sieb des Erastosthenes, 330 Sierpinski Drachen, 847 Teppich, 847 er-Additivität, 656 cr-Algebra, 655 BORELsche, 656 Signal, 763 Signalanalyse, 763 Signalsynthese, 763 764 Signatur, 353 Signifikanz, 802 Simplexschritt, revidierter, 882 Simplextableau, 878 Hilfsprogramm 880 revidiertes, 881 Simplex verfahren, 877, 878 revidiertes, 881 SiMPSON-Formel, 927 Simulation digitale, 806 Monte-Carlo Begriff, 806 Singleton, 377 Singulärwerte, 293, 844 Singulärwertzerlegung, 293 Singularität analytische Funktion, 695 außer wesentliche, 715 hebbare, 695 isolierte, 715 wesentliche, 695, 715 Sinus, 76 hyperbolicus, 88 Sinus-Kosinussatz, 169 polarer, 170 Sinusfunktion, 133 hyperbolische, 134 Sinus-GORDON Gleichung, 567, 569 sinusoidale Größen, 83 Sinussatz, 146, 169 Skala Begriff, 116 logarithmische, 116 Skalar. 185 Drehinvarianzeigenschaft, 278 invarianter, 271 Skalarfeld. 664 Axialfeld, 664 ebenes, 664 Gradient, 671, 672 Koordinatendarstellung, 665 Richtungsableitung, 670 Zentralfeld, 664 Skalarmatrix, 260 Skalarprodukt, 188, 328 HiLBERT-Raum, 635 kartesische Koordinaten, 190 Koordinatendarstellung, 192 Vektoren, 263 zwei Funktionen, 947 Skalengleichung, 116 SLATER-Bedingung, 890 SOBOLEW-Raum, 633 Solenoid, 851 Soliton Antikink, 570 Antisoliton, 569 boussinesc, 571 Burgers, 571 Hirota, 571 Kadomzev-Pedviashwili, 571 Kink, 570 Kink-Antikink, 570 Kink-Antikink Dublett, 570 Kink-Antikink-Kollision, 570 Kink-Gitter, 571 Kink-Kink-Kollision, 570 KORTEWEG-DE VRIES, 568 nichtlineares SchrÖdinger-, 569 Solitonen, 566 Wechselwirkung, 567 SOR-Verfahren, 923 Spaltenpivotisierung, 919 Spaltensummenkriterium, 922
Spannungstensor Stützstelle Spannungstensor, 271 Spannweite Meßwerterfassung, 797 Stichprobenfunktionen, 795 Spatprodukt, 190 kartesische Koordinaten, 190 Koordinatendarstellung, 192 Spektralradius, linearer stetiger Operator, 640 Spektraltheorie, lineare Operatoren, 642 Spektrum FOURIER-Transformation, 750 kontinuierliches, 643 linearer Operator, 642 Operator, 643 stetiges, 643 Spiegelsymmetrie, Ebene, 136 Spiegelung am Kreis, 698 am Punkt, 136 an der Geraden, 136 Ortskoordinaten, 277 Spiegelungsprinzip, SCHWARZsches, 703 Spirale, 105 ARCHiMEDische, 105 CORNUsche, 107 hyperbolische, 106 logarithmische, 106, 240 Spline-Interpolation, 945 Splines Ausgleichssplines, 960 Basissplines, 961 bikubische, 961 Ausgleichssplines, 962 Interpolationssplines, 961 Interpolationssplines, 959 kubische, 959 Ausgleichssplines, 960 Interpolationssplines, 959 natürliche, 959 normalisierte ß-Splines, 961 periodische, 959 Sprung, endlicher, 59 Sprungfunktion, 737 spezielle Definition, 719 Spur Matrix, 260 Tensor, 274 Stabilität, 934 absolut stabil, 934 erste Näherung, 828 invariante Mengen, 823 Lyapunov, 827 orbitale, 827 periodische Orbits, 828 Ruhelagen, 828 Rundungsfehler, numerische Rechnung, 971 Störung der Anfangswerte, 934 strukturelle, 837, 838 zeitdiskrete Systeme, 836 Stabschwingungsgleichung, 544 Stammfunktion, 444 Standardabweichung, 776, 814, 815, 817 Standardform, Kreisabbildung, 869, 871 Startpunkt, 361 Stationierung, freie, 151 Statistik, 768 Berechnung von Unsicherheiten, 811 beschreibende, 795 mathematische, 768, 793 Meßwerterfassung, 795 Schätzwert, 794 Stichprobenfunktion, 794 STEFFENSEN-Verfahren, 913 Steigung, Tangente, 234 Steradiant, 155 Stereometrie, 154 Stetigkeit, Funktion, 59 eine Veränderliche, 58 elementare, 60 komplexe, 693 mehrere Veränderliche, 126 mittelbare, 61 Stichprobe, 777, 793 Umfang, 777 zufällige, 793 Stichprobenfunktion, 794 Stichprobenvariable, 793, 794 STIELTJES-Integral Begriff, 470 Hinweis, 648 Vergleich mit RiEMANN-Integral, 470 STIELTJES-Transformation, 731 STiRLiNGsche Formel, 479 Stochastik, 768 Begriffe, 788 Störung, 554 STOKESscher Integralsatz, 687 Strahl, 131 Strahlensatze, 137 Strahlpunkt, 512 Strategie Evolutions-, 897 mit Rekombination, 897 Mutations-Selektions-, 897 Strecke, 131 Streifen, charakteristische, 537 Streuung, 776 Meßwerterfassung, 797 Stichprobenfunktionen, 794 zweidimensionale Verteilung, 803 Strichliste, 796 Strom, Bogen, 372 Stromfunktion, 703 Strophoide, 96 Strudel, 828, 833 Sattelstrudel, 828, 833 zusammengesetzter, 858 Strudelpunkt, 512 Struktur algebraische, 295 klassische algebraische, 308 Stutzfunktional, 646 Stützhyperebene, 646 Stutzpolygon, 963 Stutzstelle, 925, 945 aquidistante, 931
Stufenwinkel TAYLOR-Entwicklung Stufenwinkel, 132 STURM-LlOUViLLEsches Problem, 533 STURMsche Funktion, 44 Kette, 44, 916 Subnormale, 235 Substitution affine, 348 Integrationsmethode, 452, 455 Intergrationsmethode, 448 Kryptologie, 347, 348 Subtangente, 235 Subtraktion, 969 komplexe Zahlen, 36 Polynome, 11 rationale Zahlen, 1 Suchverfahren, numerisches. 893 SuGENO-Methode, 389 Summe, 6 algebraische, 380 drastische, 380 Rechenregeln, 6 Summenzeichen, 6 Summenhäufigkeit, 796 Summenkonvention, EiNSTElNsche, 270 Summenregel, 395 Summensymbolik, GAUSSsche, 948 Summierbarkeit quadratische, 659 Superposition Felder, 690 nichtlineare, 569 Schwingungen, 83 Superpositionsprinzip, 705 Superpositionssatz, 690 Differentialgleichungen, 518 Supplementsätze, 80 Supplementwinkel, 132 Supremum, 623 Sylvester, Trägheitsgesetz, 290 Symbol Kronecker, 273 Landau, 57 Legendre, 339 Symmetrie axiale, 136 FOURIER-Entwicklung, 439 Spiegelsymmetrie, 136 zentrale, 136 Symmetriebrechung, Bifurkation, 861 Symmetrieelement, 317 Symmetriegruppe, 317 Symmetriegruppen Kristallographie, 320 Symmetrieoperation, 317 Drehspiegelung, 317 Drehung, 317 Kristallgitterstrukturen, 320 ohne Fixpunkt, 317 Spiegelung, 317 System aus vier Punkten, 219 chaotisches, nach Devaney, 852 Differentialgleichungen höherer Ordnung, 515 kanonisches, 537 Lösungs-, 515 lineare, 522 Normal-, 538 dynamisches, 821 Bewegung, 821 chaotisches 852 Cr-glattes, 821 dissipatives, 822 ergodisches, 841 invertierbares, 821 konservatives, 822 mischendes, 842 Rekonstruktion aus Zeitreihen, 853 stetiges. 821 volumenerhaltendes, 822 volumenschrumpfendes, 822 zeitdiskretes, 821. 822. 836 zeitdynamisches, 822 zeitkontinuierliches, 821 Gleichungen lineare. 281 nichtlineare, 923 numerische Lösung, 917 überbestimmtes, 285 kognitives 390 lineares, 279 mischendes, 852 Normalgleichungen, 285 orthogonales, 637 orthonormiertes. 637 trigonometrisches, 637 vollständiges, 638 wissensbasierte Interpolation. 392 zeitdiskretes, strukturstabiles, 838 Tabelle mit doppeltem Eingang, 121 Tangens, 77 hyperbolicus, 88 Tangensformeln, 146 Tangensfunktion, 133 hyperbolische, 134 Tangerissatz, 146 Tangente ebene Kurve, 233 Kreis, 142, 203 Raumkurve, 246. 248 Tangentenabschnitt 234 Tangentenneigungswinkel, 234, 394 Tangentensteigung, 234 Tangenten vieleck, 140 Tangentenviereck, 140 Tangentenwinkel, 143 Tangentialebene, 163, 410 Fläche, 252, 253 Tangiermeridian, 182 Tautologie Aussagenlogik, 297 BoOLEsche Funktion, 357 Prädikatenlogik. 299 TAYLOR-Entwicklung, 57, 405
TAYLOR-Entwicklung Transposition eine Veränderliche, 434 m Veränderliche, 413 Vektorfunktion, 664 zwei Veränderliche, 412 TAYLOR-Formel, 405 TAYLOR-Reihe, 405, 434 analytische Funktion, 713 eine Veränderliche, 434 m Veränderliche, 413 zwei Veränderliche, 412 Teilbarkeit, 330 Teilbarkeitskriterien, 332 Teilbarkeitsregeln, elementare, 330 Teiler, 14, 330 größter gemeinsamer (ggT), 333 ganze Zahlen, 333 Linearkombination, 334 Polynome, 14 positiver, 331 teilerfremd indirekter Beweis, 5 Polynome, 14 Zahlen, 333 Teilgraph, 363 Teilmenge, 300 Teilraum, 617 affiner, 617 Teilung äußere, 197 harmonische, 198 innere, 197 stetige, 198 Strecke Ebene, 197 Raum, 219 Telefongesrächsverteilung, 792 Telegrafengleichung, 549 Tensor, 270 0 Stufe, 271 1 Stufe, 271 2 Stufe, 271 Addition, Subtraktion, 276 antisymmetrischer, 272 Definition, 270 Deltatensor, 273 dyadisches Produkt, 272 Eigenwert, 272 Epsilontensor, 273 invarianter, 273 Komponenten, 270 Multiplikation, 276 n-ter Stufe, 270 Rechenregeln, 272 schiefsymmetrischer, 272, 277 Spur, 274 symmetrischer, 272, 276 Überschiebung, 276 Verjüngung, 272, 276 Tensorinvariante, 273 Tensorprodukt, 272 Ansatz, 962 Vektoren, 263 Term, 10 Termalgebra, 354 Termersetzungssystem, 353 Testaufgabe, lineare, 934 Tetraeder, 157, 158, 219 Teufelstreppe (devil's staircase), 871 Theorem, STURMsches, 45 Thetafunktion, 727 Tilgung, 23 Tilgungsrecrmung, 23 Todesprozeß, 792 Toleranz, 378 Tonnenkörper, 162 parabolischer, 162 topologisch äquivalent, 834 konjugiert, 834 Torus, 161, 851, 852 Abspaltung, 863, 868 Auflösung, 868 Differentialgleichung auf dem, 827 Glattheitsverlust, 868 invariante Menge, 830 m-dimensionaler (Definition), 830 Resonanztorus, 868 Totalkrummung, 250 Träger Funktion, 595 Geradenbuschel, 201 kompakter, 766 Maß, 840 Zugehörigkeitsfunktion, 374 Trägermenge, 353 Trägheitsgesetz, Sylvester, 290 Trägheitsindex, 290 Trägheitsmoment Doppelintegral, 491 Dreifachintegral, 497 Integration, 468 Kurvenintegral 1 Art, 482 Trägheitstensor, 271 Trajektorie, 821 Traktrix, 108 Transformation geometrische, 145 Hopf-Cole, 571 kartesische in Polarkoordinaten, 416 lineare, 270, 329, 620 rechtwinklige Koordinaten, 217 Wavelet-Transformation, 763 Transformationsdeterminante, 217 Transformationsinvarianz, 273 Transformationsmodul, 9 Transformationsverfahren, 291 Transitivitat, 29 Translation Koordinatensystem, 273 primitive, 320 Translationsinvarianz, 273 Transportnetz, 372 Transportproblem, 884 Transposition Kryptologie, 347, 348
Transposition Varianz Matrizen, 266 Trapez, 138 Trapezformel, 926 HERMlTEsche, 927 Trapezsumme, 926 HERMlTEsche, 927 Trennbarkeit von Mengen, 646 Trennung der Variablen, 543 Trennungssätze, 646 Treppenfunktion, 757, 767 Triangulierung FEM, 941 Vermessungstechnik, 151 Tridiagonalisierung, 291 Triederecke, 168 Trigonometrie ebene, 145 sphärische, 163 Tripel, 303 Trochoide, 102 TSCHEBYSCHEFF Approximation, 951 diskrete, 953 Polynome, 951 Formel, 88 Satz, 453 Ungleichung, 31 Tupel, n-Tupel, 120 Turbulenz, 822, 868 TUTTE-Satz, 369 Typ, 353 Überdeckung, offene, 824 Übergangsmatrix, 789, 790 Übergangs Wahrscheinlichkeit, Stochastik, 789 Überschiebung, 274 Umfang Ellipse, 205 Kreis, 143 Vieleck, 141 Umformung, identische, 11 Umgebung eines Punktes, 626 Umkehrabbildung, 306 Umkehrfunktion, 52 Hyperbelfunktionen, 92 trigonometrische, 85 Umkehrtransformation, 730 Umkreis, 135 Dreieck, ebenes, schiefwinkliges, 146 Sehnenviereck, 139 Umlaufintegral, 479, 485 Vektorfeld, 683 Verschwinden, 487 Umlaufsinn Figur, 136 Spiegelsymmetrie, 136 Unabhängigkeit lineare Elemente des Vektorraumes, 619 Gleichungssysteme, 280 vom Integrationsweg, 485, 709 UND, 295 unendlich, 1 abzählbar 307 überabzählbar, 307 Ungleichung, 28 1 Grades. 33 2 Grades, 33 arithmetisches Mittel, 30 BERNOULLIsche, 31 BESSELsche, 638 binomische, 31 CAUCHY-SCHWARZsche. 31 Dreiecks-, 30 geometrisches Mittel, 30 HÖLDERsche, 32 MiNKOWSKische, 33 quadratisches Mittel, 30 SCHWARZ-BUNJAKOWSKI -, 635 spezielle, 30 TSCHEBYSCHEFFSche, 31, 777 verschiedene Mittelwerte, 30 Universalsubstitution, 455 Unsicherheit absolute, 815 fuzzy, 374 Meßergebnisse, 811 relative, 815 Unstetigkeit, hebbare, 59 Unstetigkeitsstelle, 58 Unterdeterminante, 267 Untergraph, 363 induzierter, 363 Untergruppe. 310 triviale, 310 zyklische, 310 Untergruppenkriterium, 310 Unterraum, 328 invarianter, 314 Unterraumkriterium, 328 Unterring. 324 trivialer, 324 Unterringkriterium. 324 Untervektorraum instabiler, 831, 836 stabiler, 831, 836 Urbildbereich Menge, 49 Urliste (Meßprotokoll). 795, 811 Urnenmodell, 777 Vagheit, 374 Valenzmatrix, 368 VAN-DER-PoLsche Differentialgleichung, 859 Variable abhängige, 48, 279 Aussagenvariable, 295 BoOLEsche, 356 freie 298 gebundene, 298 künstliche, 880 linguistische, 375 unabhängige, 48, 120, 279 Variablentrennung, 543 Varianz, 776
Variation Vektorverbände, homomorphe Variation, 708, 7G9 mit Wiederholung, 769 ohne Wiedei holung, 769 Variation dei Konstanten 519 Satz, 826 Vaiiationsaufgd.be, 936 allgemeinem, 580 einfac he eine Veränderliche. 574 mehrere Veränderliche, 579 Variationsgleichung, 828, 836, 845, 941 Variationsproblem, 572 1 Ordnung 572 DiRiCHLETsches, 580 höherer Ordnung, 572 Parameterdarstellung, 572 Variationsrechnung, 572 1 und 2 Variation, 582 numerische Lösung, 580 Ritz Verfahren, 581 Varietät, 354 Vektor 185,261,617 Absolutbetrag, 185 axialer, 185 Spiegelungsverhalten, 277 DARBOUXscher, 250 Differentiationsregeln, 663 ebenes Flächenstück, 684 Einheitsvektor, 186 freier, 185 gebundener, 185 gemischtes Produkt, 190 Grundvektor, 191 kollineaier, 186 komplanarer, 186 Komponenten, 669 konjugierter, 896 Koordinaten, 187 Länge, 194 linienfluchtiger, 185 linkssingulärer, 293 Modul 185 Nullvektor, 186 orthogonaler, 189 polarer, 185 Spiegelungsverhalten, 277 Radiusvektor, 186 rechtssingulärer, 293 reziproker, 191 reziproker Grundvektor, 191 skalar invarianter, 678 Spaltenvektor, 261 stochastischer, 789 Zeilenvektor. 261 Zerlegung, 187 Vektor algebra, 185 Vektoranalysis. 663 Vektordiagramm,Schwingungen, 84 Vektoren dyadisches Produkt, 263 Kommutativgesetz, 263 Skalarprodukt 263 Tensorprodukt. 263 Winkel zwischen, 194 zyklische Vertauschung, 213 Vektorfeld 665, 821 Divergenz. 673 kartesische Koordinaten, 667 Komponenten, 669 Koordinatendarstellung, 667 Kreisfeld, 667 Kugelkoordinaten, 668 punktförmige Quellen, 690 Quelle, 673 Richtungsableitung, 670 Rotation, 675 Senke, 673 sphärisches 667 Umlaufintegral, 683 zentrales. 666 Zylinderkoordinaten, 668 zylindrisches, 667 Vektorfunktion Ableitung, 663 Hodograph, 663 lineare, 275 skalare Variablen, 663 TAYLOR-Entwicklung, 664 Vektorgleichung Ebene, 193 Gerade, 193 Raumkurve, 246, 248 Vektorgradient, 673 mit Nablaoperator, 677, 678 Vektoriteration, 291. 293 Vektorpotential, 689 Vektorprodukt, 188 doppeltes. 190 Hinweis, 264 kartesische Koordinaten, 190 Koordinatendarstellung, 192 Vektorraum. 327, 616 alle Nullfolgen, 618 beschränkte Folgen, 618 ß(T), 618 C([o, 6]). 618 C(fc>([a,6]), 618 EuKLiDischer, 328 n-dimensionaler, 262 finite Zahlenfolgen, 618 Folgen, 617 f(T), 618 Funktionen, 618 geordneter, 621 Halbordnung, 621 K",617 komplexer, 617 konvergente Folgen, 618 LP, 659 F, 618 n-dimensionaler, 327 reeller, 327. 617 s aller Zahlenfolgen, 618 unendlichdimensionaler, 327 Vektor verbände, homomorphe, 623
Vektorverband Volumen Vektorverband, 623 Vektorzerlegung, 187 VENN-Diagramm, 301 Verband, 355 distributiver, 355 Vereinigung Fuzzy-Mengen, 380 Mengen, 301 unscharfe Mengen, 379 Verfahren Adams-Bashforth-, 933 Austausch-, 279 Bairstow-, 916 Bisektions-, 291 Cholesky-, 286, 920 Galerkin-, 9ß6 Gauss-Newton-, 924 ableitungsfreies, 925 Gauss-Seidel-, 922 Graeffe-, 917 GRAM-SCHMiDTsches, 288 HOUSEHOLDER-, 286, 948 Iterations-, 291 Jacobi-, 291 Lanczos-, 291 Milne-, 933 Newton-, 912, 924 modifiziertes, 912 Orthogonalisierungs-, 286, 288 Prediktor-Korrektor-, 933 Ritz-, 936 Romberg-, 928 runge-kutta-, 931 SOR-, 923 Steffensen-, 913 Transformations-, 291 Vergleichsfunktion, Variationsaufgabe eine Veränderliche, 574 mehrere Veränderliche, 579 Verifizieren, Beweisführung, 5 Verjüngung, 272 Tensor, 276 Verkettung, 385 Verknüpfung max-average, 386 max-min, 385 max-prod, 386 Verknüpfungsoperator, 385 Verknupfungsprodukt, 385 Verknupfungsregeln, 386 Versicherungsmathematik, 21 Versiera der Agnesi, 95 Vertauschbarkeit, lineare Operatoren, 329 Vertauschung, zyklische Seiten und Winkel, 145 Vektoren, 213 Vertauschungssatz, SCHWARZscher, 411 Verteilung Binomial-Verteilung, 777 X2-Verteilung, 785 diskrete, 777 FlSHER-Verteilung, 785 Häufigkeitsverteilung, 796 hypergeometrische, 777, 779 logarithmische Normal-Verteilung, 782 Meßfehlerverteilungsctichte, 811 Normalverteilung, 780 PoiSSON-Verteilung, 780 stetige, 780 Student-Verteilung, 786 i-Verteilung, 786 Weibull-Verteilung, 784 Verteilungsdichte, mehrdimensionale, 777 Verteilungsfunktion, 774 stetige, 775 Verteilungsproblem, 887 Vertrauensgrenze Mittelwert, 800 Regressionskoeffizient, 804 Streuung, 801 Vorgabe, 816 Vervollständigung, 631 Vieleck ähnliches, 137 Außenwinkel, 141 Basiswinkel, 141 ebenes, 140 Flacheninhalt, n-Eck, 141 Inkreisradius, 141 Innenwinkel, 141 regelmäßiges, konvexes, 140 Seitenlänge, 141 spezielle regelmäßige, 141 Umfang, 141 Umkreisradius, 141 Zentriwinkel, 141 Vielfaches, 14 des Teilers, 330 kleinstes gemeinsames (kgV), 334 Vielflach, 155 Viereck, 138, 139 konvexes, 139 Umfang, 140 Vierergruppe, KLElNsche, 311 VlETAscher Wurzelsatz, 44 Vollwinkel, 132 ebener, 133 räumlicher, 156 VOLTERRASChe Integralgleichung, 630 1 Art, 583, 605 2 Art, 605 Volumen Doppelintegral, 491 Dreifachintegral, 497 Hohlzylinder, 160 Kegel, 160 Keil, 158 Kugel, 161 Obelisk, 158 Polyeder, 156 Prisma, 156 Pyramide, 157 Quader, 156 Teilmenge, 655 Tetraeder, 219
Volumen Winkel Tonnenkörper, 162 Torus, 161 Würfel 156 Zylinder, 159 Volumenableitung, 670 672 Volumenelement beliebige Koordinaten, 495 kartesische Koordinaten, 492 Kugelkoordinaten, 495 Tabelle. 496 Vektorkomponenten, 681 Zylinderkkordinaten, 493 Volumenintegral, 491 Volumenskala, 117 Vorwärtseinschnitt auf der Kugel. 177 durch zwei Strahlen, 151 ohne Visier, 152 Vorzeichenfunktion, 50 vrai sup, 659 Wärmeleitungsgleichung dreidimensionale. 556 eindimensionale, 547, 746 Wahrheitsfunktion, 295, 296 Äquivalenz, 295 Disjunktion, 295 Implikation. 295 Konjunktion, 295 NAND- Funktion, 297 Negation, 295 NOR-Funktion, 297 Wahrheitstafel. 295 Wrahrheitswert. 295 Wahrscheinlichkeit, 772 bedingte, 773 Flächeninterpretation. 775 vollständige, 773 Wahrscheinlichkeitsdichte, 775 Wahrscheinlichkeitsintegral 782 Wahrscheinlichkeitsmaß, 840 ergodisches, 844 invariantes. 841 Wahrscheinlichkeitspapier. 797 Wahrscheinlichkeitsiechnung, 768 770 Wahrscheinlichkeitsvektor, 790 Walsh Funktionen, 767 Walsh Systeme, 767 Warteschlange, 792 Wavelet 764 Daubechies- Wavelets, 766 Haar- 764 mexikanischer Hut 764 orthogonales, 766 Wavelet-Transformation, 763, 765 diskrete 766 Haar Wavelet Transformation, 766 dyadische 765 schnelle. 766 WEBERsche Funktion. 527 Wechsel winkel, 132 Wechselwirkung Kraftbegriff, 558 Solitonen, 567 Weg, Giaph alternierender, 370 zunehmender, 370 Wegberechnung, Integration. 467 WEIBULL-Verteilung, 784 Weierstrass Approximationssatz, 627 elliptische Funktion, 728 Satz, 431 eine Veränderliche, 62 mehrere Veränderliche, 126 Welle ebene, 764 nichtlineare, 567 Wellenfunktion klassisches Problem, 555 SCHRÖDINGER-Gleichung, 557 Wärmeleitungsgleichung 557 Wellengleichung eindimensionale, 755 n dimensionale, 555 Wellenlänge, 83 Wendepunkt, 238, 405. 407 Wendepiinktbestimmung gemäß Gleichung, 243 gemäß höherer Ableitungen, 406 WENN DANN Regel Fuzzy -Logik, 386 Logik, 295 Wert, wahrer, 813 Wertebereich Funktion, 48 Menge, 49 Operator, 620 Wertesystem, 120 wertverlaufsgleiche Ausdrücke, 296, 358 Windung, Raumkurve. 250 Windungsradius, Raumkurve, 250 Windungszahl, 870 Winkel, 131 an Geraden, 132 an Parallelen, 132 Bogenmaß, 133 ebene Kurven, 235 Ebenen, 222 ebener, 155 entgegengesetzte, 133 EuLERsche, 218 Gegenwinkel, 132 Gerade und Ebene, 226 Geraden, Raum, 225 gestreckter. 132 Gradmaß, 133 Raumwinkel 155 rechter, 132 Rück Versetzung, 179 spitzer, 132 Stufenwinkel, 132 stumpfer, 132 überstumpfer, 132 zwischen ebenen Kurven, 235
Winkel Zins es Zinsrechnung Raumkurven, 254 Vektoren, 194 Winkelbegriff, 131 Winkelbezeichnungen, 132 Winkelfunktion, 76 Winkelhalbierende, 135, 146 Winkelkosinussatz, 169 Winkelsumme ebenes Dreieck, 135 sphärisches Dreieck, 168 Wirbeldichte, 689 Wirbelfeld quellenfreies, 689 reines, 689 Wirbelflußdichte, 691 Wirbellinien, 675 Wirbelpunkt, 512 Wort IEEE-Standard, 968 metrischer Raum, 625 Worthalbgruppe, 308 WRONSKI-Determinante, 518, 826 Würfel, 156, 158 Wurzel Begriff, 8 Gleichung, 43 Wurzelbaum, 367 Wurzelkriterium, 424 Wurzelsatz, VlETAscher, 44 Wurzelziehen komplexe Zahl, 38 positive Zahl, 8 XOR (exklusives ODER), 357 YoUNGscher Rahmen, 316 Zahlen, 1 Approximation, 4 BERNOULLische, 428 EuLERsche, 429 FERMATsche, 331 Fibonacci, 334, 871 ganze, 1 imaginäre, 34 irrationale, 1, 2, 307 komplexe, 34 Absolutbetrag, 35 Addition, 36 algebraische Form, 34 Argument, 35 Division, 37 Exponentialform, 36 Hauptwert, 35 Modul, 35 Multiplikation, 37 Potenzieren, 38 Radizieren, 38 Subtraktion, 36 trigonometrische Form, 35 konjugiert komplexe, 36 MERSENNEsche, 331 naturliche, 1 nichtnegative ganze, 1 Primzahlen, 330 rationale, 1 reelle, 2 teilerfremd, 333 transzendente, 1, 2 zusammengesetzte, 330 Zahlendarstellung, interne, 966 Zahlenebene GAUSSsche, 35 komplexe Abbildung, 706 Zahlenfolge, 420 beschrankte, 420, 618 Bildungsgesetz, 420 Divergenz, 421 finite, 618 Glieder, 420 Grenzwert, 421 im metrischen Raum, 626 konvergente, 626 Konvergenz, 421 monotone, 420 obere Schranke, 421 unendliche, 420 untere Schranke, 421 zu Null konvergente, 618 Zahlengerade, 1 erweiterte, 656 Zahlenintervall, 2 Zahlensystem, 965 Zahlentheorie, elementare, 330 Zeichendarstellung, interne, 965 Zeichenregel, kartesische, 915 Zeilensummenkriterium, 922 Zeit-Frequenz-Analyse, 766 Zeitreihe Ordnung p, 853 Zelt-Abbildung, 840 Zenit, 148 Zenit winkel, 148 Zentralfeld, 664 Zentralwert, Stichprobenfunktionen, 795 Zentriwinkel, 133 Kreis, 144 Vieleck, 141 Zentrum, Vektorfeld, 666 Zentrumsmannigfaltigkeit, 856 Abbildungen, 861 Differentialgleichungen, 856 lokale, 861 Zerfall radioaktiver, 791 Torus, 868, 869 Zerlegung, 306 orthogonale, 636 Zerlegungssatz, 306 Differentialgleichungen, 518 Zielfunktion, lineare, 873 Zielpunkt, 361 Zigarrenform, Ellipsoid, 226 Zinsen, 22 Zinseszins, 22 Zinseszinsrechnung, 22
Zinssatz Zylinderkoordinaten Zinssatz, 22 Zissoide 96 Z-TVansformation, 757 Bildfunktioii, 757 Dämpfung, 759 Definition 757 Diffeientation, 759 Differenzcnbildung. 759 Faltung, 759 Integiation, 759 inverse, 760 Originalfolge, 757 Rechenregeln, 758 Summa<"ion, 758 Translation, 758 Z-transformierbar. 757 Zusammenhg m LAPLACE-Transformation, 759 Zufallserscheinung, 768 Zufallsgröße, 774 diskrete, 774 kontinuierliche, 774 stetige. 775 unabhängige. 802 zweidimensionale, 802 Zufallsvektor mathematische Statistik, 793 mehrdimensionale Zufalls veränderliche, 777 Zufallsveränderliche 774 mehrdimensionale, 777 unabhängige, 777 Zufallszahlen, 793, 806 andere Verteilung, 807 Anwendung, 807 Erzeugung, 807 gleichverteilte. 806 Kongruenzmethode, 807 Pseudozufallszahlen, 807 Tabelle 1128 Zugehörigkeitsfunktion, 374, 375 glockenförmige, 376 trapezförmige, 375 Zugehörigkeitsgrad 374 Zuordnungsproblem, 886 Zustand entarteter, 561 stationärer, 559 Teilchen. 557 Zustandsraum, Stochastik, 788 Zuverlässigkeitsuntersuchung, 792 Zuwachsfunktion, 934 Zweieck, sphärisches, 166 Zweifachintegral, 488 Zweiflach, 155 Zweikörperproblem, 538 Zwischenveränderliche, 397 Zwischenwertsatz eine Veränderliche, 61 mehrere Veränderliche, 126 Zykloide, 101 Basis, 101 gewöhnliche, 101 kongruente, 101 verkürzte, 102 verlängerte. 102 Zyklus Grenzzyklus, 859 Kette, 371 Zylinder, 159. 230 elliptischer, 230 hyperbolischer, 230 Invariantenvorzeichen elliptischer, 230 hyperbolischer, 230 parabolischer, 230 parabolischer, 230 Zylinderabschnitt, 159 Zylinderfläche, 159, 220 Zylinderfunktion, 527 Zylinderhuf, 159 Zylinderkoordinaten, 215 Vektorfeld, 668
MATHEMATISCHE ZEICHEN Beziehungszeichen = gleich = identisch gleich = gleich per definitionem C sehr viel kleiner « ungefähr gleich < kleiner > größer » sehr viel größer < > ± ll> kleiner oder gleich größer oder gleich ungleich, verschieden von entspricht x <x' und x y x' Reihenfolgerelationen in Mengen Griechisches Alphabet A a Alpha H rj Eta Nu Ny T t Tau const TT = 3,14159 A,B ->A,Ä AaB,h AV B,U A^B A&B A, B, C, A AcB ACB A\B AAB AxB x e A caidA AHB AuB Vz {x e X p(x)} T X—*Y e H = Hl®H2 B ß Beta r 7 Gamma 9 6 •& Theta I1 Iota E £ Xi O 0 Omikron T v Ypsilon ^ ^ Phi A 6 Delta K k Kappa 77 TT Pi X x Chi Konstanten konstante Größe (Konstante) Verhältnis des Kreisumfanges zum Kreisdurchmesser C = 0,57722 e = 2,71828 Algebra Aussagen Negation der Aussage A Konjunktion, logisches UND Disjunktion, logisches ODER Implikation, WENN A, DANN B Äquivalenz, A GENAU DANN, WENN B Mengen Abschließung der Menge A oder Komplement von A bezuglich einer Grundmenge A ist echte Teilmenge von B A ist Teilmenge von B Differenz zweier Mengen symmetrische Differenz kartesisches Produkt x ist Element von A Kardinalzahl der Menge A Durchschnitt zweier Mengen Vereinigung zweier Mengen für alle Elemente x Teilmenge aller x aus X mit der Eigenschaft p(x) Abbildung T aus dem Raum X in den Raum Y Restklassenaddition orthogonale Zerlegung des Raumes H N Z Q R R+ Rn C RoS x <£ A 0 niLi^i LEU* 3x {x p(x)}, {x\p{x)} 9* ~fi 0 A ® B Ee Epsilon Z C, Zeta A \ Lambda M p My P p Rho E a Sigma $ ip Psi I? u) Omega Eulersche Konstante Basis der natürl Logarithmen Menge der naturlichen Zahlen Menge der ganzen Zahlen Menge der rationalen Zahlen Menge der reellen Zahlen Menge der positiven reellen Zahlen n dimension euklid. Vektorraum Menge der komplexen Zahlen Relationenprodukt x ist nicht Element von A leere Menge, Nullmenge Durchschnitt von n Mengen A% Vereinigung von n Mengen Aj es existiert ein Element x Menge aller x mit der Eigenschaft p(x) Isomorphie von Gruppen Aquivalenzrelation Restklassenmultiplikation KRONECKER-Produkt supp Träger (support) sup M Supremum Kleinste obere Schranke der nach oben beschränkten, nichtleeren Menge M (M C R) inf M Infimum Größte untere Schranke der nach unten beschränkten, nichtleeren Menge M (M C R)
Mathematische Zeichen 1193 [a, b] abgeschlossenes Intervall, d h {.r G R a < x < b} (a, b), ]o, ö[ offenes Intervall, dh {zeRa<r<b} (a, b], ]a, b] linksoffencs Intervall, d h {x € R a < x < b} [a, 6), [a, 6[ icchtsoffenes Intervall dh {x 6 R a < x < b} signa Voizeichen (signum) der Zahl o,zB sign (±3) = ±1. signO = 0 | a | Absolutbetiag der Zahl a am a in der m-ten Potenz ec bzw expx Exponentialfunktion y/ä Quadratwurzel aus a yfä n-te Wurzel aus a log6 a Logarithmus der Zahl a zur Basis 6, z B log2 32 = 5 log a dekadischer Logarithmus (Basis 10) der Zahl o,zB lg 100 = 2 In a natürlicher Logarithmus (Basis e) der Zahl a.zB In e = 1 a\ b a teilt b a\b a teilt b nicht a = b mod rn. a = b(m) a ist kongruent zu b modulo m, dh b — a ist durch m teilbar ggT(ai.a2, ,aTl) größter gemeinsamer Teiler von ai,a2, ,an kgV(ai,a2, ,an) kleinstes gemeinsames Vielfaches von a\,a2, ,an :) Binomialkoeffizient LEGENDRE-Symbol \bJ n' = 1 2 3 n Fakultät, zB 6'= 123456 = 720, speziell 0» = 1' = 1 Bn)" = 246 Bn) = 2n n\ speziell 0" = 1" = 1 Bn +1)» = 1 3 5 Bn + l) A = (üij) Matrix A mit den Elementen a^ AT transponierte Matrix A_1 inverse Matrix det A, D Determinante der quadratischen Matrix A E = i^ij) Einheitsmatrix 0 Nullmatrix 6ij KRONECKER-Symbol Sij = 0 für i ^ j und Sij = 1 für i = j a Spaltenvektor im Rr' a° Einheitsvektor in Richtung a 11 a 11 Norm von a a, b , c Vektoren im R3 i, j k ex . ev , e2 Basisvektoren (orthonormiert) des kartesischen Koordinatensystems ax , üy , az Koordinaten (Komponenten) des Vektors a | a | Betrag, Länge des Vektors a a a Multiplikation eines Vektors mit einem Skalar a b, ab, (ab), (a, b) Skalarprodukt a x b , [a x b], [a, b] Vektorprodukt a (b x c) = abc Spatprodukt (gemischtes Produkt) 0, Ö Nullvektor T Tensor G = (V,E) Graph mit der Knotenmenge V und der Kantenmenge E
1194 Mathematische Zeichen _L # A * orthogonal (senkrecht) gleich und parallel Dreieck Geometrie rad Bogenstuck, z B AB Winkel, zB £ABC Grad ^ Minute > als Maß für Winkel und Kreisbogen, z B 32° 14' 11,5" Sekunde J Neugrad C60° = 400 gon, s Tabelle 3 5, S 149 und Tabelle 21 4, S 1044) parallel ähnlich, z B AABC ~ ADEF, proportional Radiant Komplexe Zahlen i (mitunter j) Im (z) arg z z oder z* Imaginäre Einheit (i2 = — 1) Imaginarteil der Zahl z Argument von z Die zu z konjugiert komplexe Zahl, zB-2 = 2 + 3i,f = 2-3i Re(*) 1*1 Ln2 Realteil der Zahl z Betrag von z Logarithmus (natu plexen Zahl Kreisfunktionen, Hyperbelfunktionen sin tan sec Arsinh Artanh Arsech aresin arctan arcsec sinh tanh sech Sinus Tangens Sekans Areasinus Areatangens Areasekans Hauptwert von Arkussinus Hauptwert von Arkustangens Hauptwert von Arkussekans Hyperbelsinus Hyperbeltangens Hyperbelsekans cos cot cosec Arcosh Arcoth Arcosech arccos arccot arccosec cosh coth cosech Kosinus Kotangens Kosekans Areakosinus Areakotangens Areakosekans Hauptwert von Arkuskosinus Hauptwert von Arkuskotangens Hauptwert von Arkuskosekans Hyperbelkosinus Hyperbelkotangens Hyperbelkosekans lim xn = A n—»oo lim X—»O / = / = A = A = i=l n. f(x) = B o(g) für x O(g) für : = max' = max SU lE-i /(), <p{ ) A d d dx' d2 dx2' '¦ —> a v —* a dn dxn Analysis A ist Grenzwert der Folge (xn) Man schreibt auch xn —> A für n —? oo, zB lim (l + ^)n = e B ist Grenzwert der Funktion f(x), wenn x gegen a strebt LANDAU-Symbol „klein o" bedeutet f(x)/g(x) —> 0 für x —? a LANDAU-Symbol „groß O" bedeutet f{x)/g{x) —> C {C = const, C ^ 0) für x -* a Ausdruck A ist zu maximieren, analog min', extrem' Ausdruck A ist maximal, analog min, extrem Summe, in der i (der Laufindex) von 1 bis n läuft Produkt, in dem i (der Laufindex) von 1 bis n läuft Bezeichnung einer Funktion, z B y = f{x), u = <p(x,y, z) Differenz oder Zuwachs, z B Ax Differential, z B dx Bildung der ersten, zweiten, , n-ten Ableitung
Mathematische Zeichen 1195 /'(*), rix),/" /D)(*), ,/(ri oder y,y, , <9 <9 dxdy L> grad div rot j,l») «92 <9x2' rxi Jry '(*), 0 ,/yy: erste, zweite, , n-te Ableitung der Punktion f(x) Bildung der ersten, zweiten, , n-ten partiellen Ableitung Bildung der zweiten partiellen Ableitung zunächst nach x, dann nach y erste, zweite, partielle Ableitung der Funktion f(x,y) Differentialoperator, z B Dy = y', D2y = y" Gradient eines skalaren Feldes (grad <p = V<p) Divergenz eines Vektorfeldes (div v = V v) Rotation eines Vektorfeldes (rot v = V x v) V = — i + — j + — k Nablaoperator, hier in kartesischen Koordinaten (auch HAMiLTONscher Differentialoperator genannt, nicht zu verwechseln mit dem Hamilton- Operator der Quantenmechanik) dx dy dz d?_ d?_ <?_ dx2 dy2 dz2 a & d2 d2 T A = £-2 + w~ö + «-ö LAPLACE-Operator — Richtungsableitung, d h Ableitung eines Ca Q(n skalaren Feldes <p nach der Richtung a — = a grad ip da. b b / f(x)dx, / f(x)dx bestimmtes Integral der Funktion / zwischen den Grenzen a und b / f(x, y, z)ds Kurvenintegral 1 Art bezüglich der Raumkurve K mit der Bogenlänge s K <b (P dx + Q dy) Integral über eine geschlossene Kurve (Umlaufintegral) (K) I / f(x,y)dS Doppelintegral über einem ebenen Flächenstuck S (S) / f(x, y, z) dS Oberflächenintegral 1 Art über einer raumlichen Flache S s „ U dS — (h)U(r) dS Oberflächenintegral 2 Art über einer geschlossenen Oberfläche (S) (S) / f(x, y, z) dV, I f(x, y, z) dV Dreifachintegral oder Volumenintegral über dem Volumen V
Tabelle 6.1 Ableitungen elementarer Funktionen in Intervallen, in denen diese definiert und die auftretenden Nenner ^ 0 sind (s. S. 396) Funktion C (Konstante) X xn (n G R) 1 X 1 xn y/x ^(n6R,n/0,i>0) ex ebx FgR) ax (a > 0) abx (b G R, o > 0) Ina; logax (o > 0, a ^ 1, x > 0) lg x (x > 0) sinx cosx tanz (x ^ Bfc+l)^, fceZ) COtX (x 7^ /C7T, /c G Z) Ableitung 0 1 nxn~l 1 X2 1 2^/i 1 n/ r, 1 n vxn x 6e6x a^lno babx In a 1 X - lOga e = —i x xlno 1, 0,4343 - lg e « X X cosx — sinx 1 2 —^— = sec x cosJx -1 2 —ö~ = — cosec x sin x Funktion secx cosec x aresin x (|x| < 1) arecosx (|x| < 1) aretan x arecot x aresee x sinhx coshx tanhx coth x (x^0) Arsinhx Arcoshx (x > 1) Artanhx (|x| < 1) Arcothx (|x| > 1) [f(x))n (n G R) ln/(x) (/(x)>0) Ableitung sinx cos2x — cosx sin2x 1 %/1-x2 1 Vl-x2 1 1 + x2 1 1 + x2 1 x\Jx2 — 1 1 x\Jx2 — 1 coshx sinhx 1 cosh2 x 1 sinh x 1 y/l+x2 1 Vx2-1 1 1-x2 1 x2-l n[f(x)]n-lf(x) fix)
TabelJe 8.1 Grundintegrale (s S 446) Potenzen J*nd*=WTl t"*-1)- /f = '"W Trigonometrische Funktionen / sin x dx = — cos x, / cos x dx = sin x 1 tan x dx = — In | cos x\ / cot xdx = In | sin a:| -dx- =tanx, /-^f—= -cotx J cos" x J sin x Gebrochenrationale Punktionen / dx _ 1 \rtanh z _ 1 i 1 a + x 1 Jal-jl aJVTlanna '2am\a-x\ (für |x| < a) f dx _ 1 A^tu £ _ 1 i„ 1 x — a 1 J x2 _ a2 - -äArcotn ä - 2S ln 1 xTä (für |x| > a) Exponentialfunktionen /ex dx = ex, fax dx = ^ Hyperbelfunktionen / sinh xdx = cosh x, / cosh xdx = sinh x / tanh x dx = In | cosh x| / coth x dx = In | sinh x| / dxi = tanh x, / d\ = - coth x y cosh x J sinh x Irrationale Funktionen / dx nrrHn x 7 x/a2 - x2 arCuin * r j / dx Anirih x — In lr 1 i/r2 1 rr2l y Va2+x2 Ar°mna lnF ' vx ' a 1 / dx ArrrHn x' In lr 1 -»Ar2 ,r2l Tabelle 8.5 Wichtige Eigenschaften bestimmter Integrale (s S 459) Eigenschaft Hauptsatz der Integralrechnung Vertauschungs- j f{x)dx = -J f{x)dx a b Intervallregel Unabhängigkeit von der Bezeichnung der Integrationsvariablen Differentiation nach variabler oberer Grenze Mittelwertsatz der Integralrechnung Formel b f f(x) dx = F{x) \ba= F(b) - F(a) mit F(x) = / /(x) dx + C bzw F'{x) = f(x) Gldche Integration. jf(x)dx = 0 beb / /(x) dx = / /(x) dx + / /(x) dx a a c b b b 1 f(x) dx = 1 f(u) du = / /(x) dx a a o ±jf(x)dx = f(x) b Jf(x)dx = (b-a)f(t) (a<£<6) a
Tabelle 8.2 Wichtige Integrationsregeln für unbestimmte Integrale (s S 447) Regel Integrationskonstante Integration und Differentiation Faktorregel Summenregel Partielle Integration Substitutionsregel Spezielle Form des Integranden Integration der Umkehrfunktion Formel für die Integration / f(x) dx = F(x) + C (C const) F<W = f = /(*) / af(x) dx — a f(x) dx (a const) / [u(x) ± v(x)] dx = / u(x) dx ± v(x) dx / u(x)v'(x) dx = u(x)v(x) — / u'(x)v(x) dx x = u(t) bzw t = v(x), u und v seien zueinander Umkehrfunktionen 1 f{x)dx= f f(u{t))u'{t)dt bzw J JK ) J v'(u(t)) f f'(x) 1 / dx — In |/(a;)| + C (logarithmische Integration) J /(r) 2 Jf'(x)f(x)dx=^f2(x) + C u sei inverse Funktion zu v / u(x) dx = xu(x) — F(u(x)) + C\ mit F(x) = / u(x) dx + C2 (Ci, C2 const) Tabelle 3.22 Zusammenhang zwischen kartesischen, Kreiszylinder- und Kugelkoordinaten (s S 216) Kartesische Koordinaten X y z V*2 + y2 y arctan — X z y/x2 +y2 + z2 arctan — z arctan - X Zylinderkoordinaten = gcos(f = q sin ip = z = Q = ip = z = y/g2 + z2 Q = arctan - z = <P Kugelkoordinaten = r sin "d cos ip = r sin d sin <p = rcos'd = rsm.'d = <p = r cos d = r = <P
Tabelle 8.7 Kurvenelemente (s S 482) Ebene Kurve in der x,y- Ebene Raumkurve Kartesische Koordinaten x,y = y(x) Polarkoordinaten </?, p = p{<p) Parameterdarstellung in kartesischen Koordinaten x = x(t), y = y(t) Parameterdarstellung in kartesischen Koordinaten x = x(t),y = y(t), z = z(t) ds=y/l + [y'{x)]2dx ds = y/p2(ip) + [p'(cp)]2dcp ds = y/[x'(t)]2 + [y'{t)]2dt ds = vW)]2 + ly'(t)J + [z'(t)]Ht Tabelle 8.8 Ebene Flächenelemente (s S 492) Koordinaten Kartesische Koordinaten x, y Polarkoordinaten p, </? Beliebige krummlinige u, i>-Koordinaten Flächenelemente dS = dx dy dS = pdp d(p dS = \D\dudv D Funktionaldeterminante Tabelle 8.11 Volumenelemente (s S 497) Koordinaten Kartesische Koordinaten #, y, z Zylinderkoordinaten p,<p,z Kugelkoordinaten r, d, </? Beliebige krummlinige Koordinaten u, v, w Volumenelemente dV = dx dy dz dV = pdpdip dz dV = r2 sin fl dr dfi d<p dV = \D\dudvdw D Funktionaldeterminante Tabelle 8.12 Flächenelemente gekrümmter Flächen (s S 499) Koordinaten Kartesische Koordinaten x,y,z = z(x,y) Zylindermantel R (konstanter Radius), Koordinaten </?, z Kugeloberfläche R (konstanter Radius), Koordinaten -d, <p Beliebige krummlinige Koordinaten w, v {E, F,Gs Differential des Bogens, 3 6 3 3,1., S 253) Flächenelemente ^-^i^g)'** dS = Rdipdz dS = R2 sintf dtf d<p dS=\/EG-F2dudv
Tabelle 13.1 Zusammenhang zwischen den Komponenten eines Vektors in kartesischen, Zylinder- und Kugelkoordinaten (s S 669) Kartesische Koordinaten V = Vxex + Vvey + Vzez yx Vy vz Vx cos <p + Vy sin ip — Vx sin <p + Vy cos v? Vz Vx sin $ cos <p+Vv sin -d sin <p + Vz cos ti Vx cos d cos <p + Vy cos i9 sin ip — Vz sin d — Vx sin (f + Vy cos <£ Zylinderkoordinaten Ke7> + K»e* + Vz^z = Vp cos ip — V<p sin v? = Vp sin ip + Vj, cos <p = vz = ^p = v„ = Vz = Vp sin # + Vz cos # = Vp cos $ — Vz sin $ = Vy Kugelkoordinaten Vrer + Vd£ß + V^e~ = Vr sin d cos </? + V? cos d cos </? - VpSilK/? = Vr sin tf sin <p + V,j cos i9 sin </> + V^ cos (p = Vrcosr?-Vtfsint? = Vrsin# +Vtfcostf = v* = V costf- Vtfsintf = Vr = V* = K> Tabelle 13.3 Vektoranalytische Ausdrücke in kartesischen, Zylinder- und Kugelkoordinaten (s S 680) ds = dr gradt/ divV rotV At/ Kartesische Koordinaten e^dx + e'ydy + ezdz ^dU ^dU ^dU e*dx+eydy+ezdz dvL + dV1 + dvz_ dx dy dz (SV, _ 9Vy\ ' \dy dz) ¦^(¦äT-ftTJ <92t/ d2u d2u dx2 dy2 dz2 Zylinderkoordinaten epdp + e^pdip + e^dz ^dU ^ldU ^dU dp p dip dz lö.,n 1 <9V, ÖV2 pdp H p dp dz p \p dtp dz J +e-; -— pV^ --—^ VpÖ/9 ^ JOÖV'/ 1 ö / dU\ 1 d2£/ pdp \ dp J p2 dtp2 d2U + dz2 Kugelkoordinaten erdr + e^rdd + e^r sin i9dtp ^dU _ldU w 1 0t/ dr r dv r sin ü cv 41^^) + —^^(V*sintf) r2 dr r sin # cW i i dvv rsini? dtp rsintf [ö?9 ^ d<p J r |_sin# <9</? dr ^ J Ufa™) r2 dr \ dr J 1 d ( . dU\ + r2ünvdv \Sm^dv) 1 d2U + r2sin2v d<p2