Автор: Weber H.  

Теги: algebra   mathematik   algebra-lehrbuch  

Год: 1898

Текст
                    Cornell University Library
reformatted this volume
to digital files to preserve
the informational content
of the deteriorated original.
The original volume was scanned
bitonally at 600 dots per inch
and compressed prior to storage
using ITU Group 4 compression.
1997


WLmvttmty fpitomg BOÜGHT WITH THE INCOME FROM THE SAGE ENDOWNENT FUND THE GIFT OF Süenry m. 189X
s LEHRBUCH DBS. ALGEBRA ERSTER BAND
LEHEBÜCH DEE ALGEBRA VON HEINRICH FEBER PROFESSOR DER MATHEMATIK'AS DER, UNIVERSITÄT STRÄSSBÜRG ZWEITE AUFLAGE EESTEE BAND BRAÜNSCHWEIG DRÜCK UND VERLAG VON FRIEDRICH VIEWEG UND SOHN 18 9 8
Alle Hechte, namentlich dasjenige der Uebersetzung in fremde Sprachen, vorbehalten.
VORWORT ZUR ERSTEN AUFLAGE. J3ei der Entwickelung, welche die Algebra in den letzten Jahrzehnten genommen hat, dürfte eine zusammenfassende Dar- Darstellung und Verknüpfung der verschiedenen theoretischen Be- Betrachtungen und mannigfachen Anwendungen auch nach dem für seine Zeit trefflichen Lehrbuch von Serret nützlich sein. Seit Jahren hege ich den Plan eines solchen Unternehmens, das ja gross und weitaussehend erschien, und mancherlei Vor- Vorarbeiten erforderte. Erst nachdem ich in Universitätsvorlesungen mehrmals das Gebiet im Ganzen durchwandert und einzelne Theile spezieller behandelt hatte, entschloss ich mich, an die Ausführung des Werkes zu gehen, von dem jetzt der erste Band vollendet vorliegt. Es war meine Absicht, ein Lehrbuch zu geben, das, ohne viel Vorkenntnisse vorauszusetzen, den Leser in die moderne Algebra einführen und auch zu den höheren und schwierigeren Partien hinführen sollte, in denen das Interesse an dem Gegen- Gegenstande erst recht lebendig wird. Dabei sollten die erforderlichen Hülfsmittel, die elementaren sowohl als die höheren, aus dem Gange der Entwickelung selbst abgeleitet werden, um die Dar- Darstellung von anderen Lehrbüchern möglichst unabhängig zu machen. Zwei Dinge sind es, die für die neueste Entwickelung der Algebra ganz besonders von Bedeutung geworden sind; das ist auf der einen Seite die immer mehr zur Herrschaft gelangende Gruppentheorie, deren ordnender und klärender Einfluss überall zu spüren ist, und sodann das Eingreifen der Zahlentheorie.
VI Vorwort zur ersten Auflage. Wenn auch die Algebra zum Theil über die Zahlentheorie hin- hinausgeht, und in andere Gebiete, z. B. die Functionentheorie, oder in ihren Anwendungen auch in die Geometrie hinüber greift, so ist doch die Zahlenlehre immer das vorzüglichste Beispiel für alle algebraischen Betrachtungen, und die Fragen der Zahlen- Zahlentheorie, die heute im Vordergrund des Interesses stehen, sind vorwiegend algebraischer Natur. Hierdurch war der Weg be- bezeichnet, den ich in meiner Arbeit zu gehen hatte. Der grosse Stoff ist in zwei Bände vertheilt. Der erste Band enthält den elementaren Theil der Algebra, den man mit einem hergebrachten Ausdruck als Buchstabenrechnung bezeichnen kann, sodann die Vorschriften über die numerische Berechnung der Gleichungswurzeln und die Anfänge der Galois'schen Theorie. Der zweite Band, der dem ersten hoffentlich in kurzer Zeit folgen wird, soll die allgemeine Theorie der endlichen Gruppen, die Theorie der linearen Substitutionsgruppen und Anwendungen auf verschiedene einzelne Probleme bringen und soll abschliessen mit der Theorie der algebraischen Zahlen, wo der Versuch gemacht ist, die verschiedenen Gesichtspunkte, unter denen diese Theorie bisher betrachtet worden ist, zu vereinigen. Endlich soll der zweite Band ein alphabetisches Register über beide Bände bringen. Wie es bei einer Disciplin, die in rascher Entwickelung begriffen ist, und an der von den verschiedensten Seiten gearbeitet wird, nicht anders sein kann, ist auch in der Algebra der Sprach- Sprachgebrauch und die Bezeichnungsweise sehr mannigfaltig und häufig nicht übereinstimmend. Dadurch wird eine einheitliche Dar- Darstellung und das Eindringen in die verschiedenen Arbeiten sehr erschwert. Ich habe mich daher bemüht, eine möglichst zweckmässige Ausdrucksweise einheitlich beizubehalten, und habe mich dabei vielfach mit Fachgenossen berathen. Ich darf die Hoffnung aus- aussprechen, dadurch zur Befestigung einer einheitlichen Termino- Terminologie beigetragen zu haben. Die Literaturnachweisungen und historischen Notizen, die in dem Buche gegeben sind,.machen in keiner Weise den An- Anspruch auf Vollständigkeit, wenn ich auch bemüht gewesen bin,
Vorwort zur ersten Auflage. VII nach Möglichkeit die wichtigsten Quellen und literarischen Hülfs- mittel an geeigneter Stelle zu erwähnen. Es ist mir eine angenehme Pflicht, so manchem Freunde und Collegen, der an dem Fortschreiten meiner Arbeit regen und thatkräftigen Antheil genommen hat, hier meinen Dank auszu- auszusprechen. Zuerst gilt dieser Dank meinem Freunde Dedekind für seine treue Hülfe bei der Correctur, und wenn er auch auf den Plan und die Ausführung meines Werkes keinen Einfluss ausgeübt hat, so möchte ich doch nicht unerwähnt lassen, dass ich schon vor vielen Jahren durch ein Heft einer Vorlesung, die er im Winter 1857/58 in Göttingen über höhere Algebra, ins- insbesondere über die Theorie von Galois gehalten hat, ein noch lebhafteres Interesse für diese Theorie gewonnen habe, die vordem auf unseren Hochschulen in solcher Vollständigkeit wohl noch nicht vorgetragen war. Auch der mannigfachen Anregung und Belehrung habe ich hier zu gedenken, die ich meinem Freunde und Collegen F. Klein verdanke, der das Fortschreiten der Arbeit mit regstem Interesse begleitet hat und dessen sachkundiger, stets bereitwilligst ge- gegebener Rath in manchen Theilen des Buches von grossem Einfluss gewesen ist. Ich kann hier nicht alle Fachgenossen und Freunde namhaft machen, die mich durch ihren Rath unterstützt haben, wie der Leser an den betreffenden Stellen finden wird. Aber der Herren E. Hess in Marburg, Fr. Meyer in Clausthal, R. Fricke in Braunschweig, die durch kundige und sorgfältige Ausführung der mühevollen Correctur der Druckbogen Genauigkeit und Richtigkeit des Textes gefördert haben, muss ich hier noch gedenken. Endlich gilt mein Dank der Verlagsbuchhandlung, die durch bereitwilliges Eingehen auf meine Wünsche, durch Sorgfalt in Druck und Ausstattung wesentlich zum Gelingen des Ganzen beigetragen hat. Göttingen, im November 1894. Der Verfasser.
VORWORT ZUR ZWEITEN AUFLAGE. JL/as Lehrbuch der Algebra geht hiermit zum zweiten Male in die Oeffentlichkeit. Plan und Gang der ersten Auflage sind durchweg beibehalten. Trotzdem ist das ganze Gebiet wiederholt durchgearbeitet, und manches Neue ist hinzugenommen, theils zur Berichtigung einzelner Irrthümer oder zur Erhöhung der Klarheit und Verständlichkeit, theils um durch Berücksichtigung neuer Arbeiten der Vollständigkeit näher zu kommen. Eine wesentliche Erweiterung hat die Theorie der Elimination im vierten Abschnitt gefunden. Es ist mir abermals eine erfreuliche Pflicht, den zahlreichen Freunden des Buches, die mich durch Mittheilungen in der Neu- Neubearbeitung unterstützt haben, meinen Dank zu sagen. Ausser den in der Vorrede der ersten Auflage Genannten gilt dieser Dank vorzugsweise den Herren Hensel, Frobenius, Netto, sowie einem unbekannten Freunde und sorgfältigen Leser des Buches. Strassburg, im Januar 1898. Der Verfassern
INHALT DES ERSTEN BANDES. Seite Einleitung 1 Erstes Buch. Die Grün dlagen. Erster Abschnitt. Rationale Functionen. §. 1. Ganze Functionen . • 25 §. 2. Ein Satz von G a u s s .27 §. 3. Division 30 §. 4. Theilung durch eine lineare Function 32 §. 5. Gebrochene Functionen; Theilbarkeit 34 §. 6. Grösster gemeinschaftlicher Theiler 37 §. 7. Producte linearer Factoren 41 §. 8. Der binomische Lehrsatz 45 §. 9. Interpolation 47 §. 10. Lösung des Interpolationsproblems durch die Differenzen ... 49 §. 11. Arithmetische Reihen höherer Ordnung 50 §. 12. Der polynomische Lehrsatz 53 §. 13. Derivirte Functionen 54 §. 14. Derivirte eines Productes 57 §. 15. Partialbrüche 59 §. 16. Entwickelung eiuer gebrochenen Fuuction nach fallenden Potenzen der Variablen 62 §. 17. Ganze Functionen mehrerer Veränderlichen: Formen 64 §. 18. Die Derivirten von Functionen mehrerer Variablen 67 §. 19. Das Euler'sche Theorem über homogene Functionen 70 §. 20. Zerlegbare und unzerlegbare Functionen 71 Zweiter Abschnitt. Determinanten. §. 21. Permutationen von n Elementen 78 §. 22. Permutationen erster und zweiter Art 79 §. 23. Determinanten 82
X Inhalt des ersten Bandes. Seite §. 24. Hauptsätze über Determinanten 84 §. 25. Unterdeterndinanten 86 §. 26. Die Unterdeterminanten im weiteren Sinne 91 §. 27. Lineare homogene Gleichungen .r 96 §. 28. Elimination aus linearen Gleichungen 102 §. 29. Unhomogene lineare Gleichungen 104 §. 30. Multiplikation von Determinanten 108 §. 31. Determinanten der Unterdeterminanten 113 §. 32. Determinantensatz von Sylvester 115 Dritter Abschnitt. Die Wurzeln algebraischer Gleichungen. §. 33. Begriff der Wurzeln. Mehrfache Wurzeln 117 §. 34. Stetigkeit ganzer Functionen 119 §. 35. Vorzeichenwechsel von f(x). Wurzeln von Gleichungen nn- ^ geraden Grades und von reinen Gleichungen '. 123 §. 36. Lösung reiner Gleichungen durch trigonometrische Functionen >127 §. 37. Befreiung einer Gleichung vom zweiten Gliede ' . 130 §. 38. Cubische Gleichungen. Cardanische Formel , . 132 §. 39. Der Cayley'sche Ausdruck der Cardanischen Formel . . . 134 §. 40. Die biquadratische Gleichung 135 §. 41. Beweis des Fundamentalsatzes der Algebra 137 §. 42. Algorithmus zur Berechnung der Wurzeln 143 §. 43. Zahlenwerthe ganzer Functionen 147 §. 44. Stetigkeit der Wurzeln 148 Vierter Abschnitt. Symmetrische Funetionen. §. 45. Begriff der symmetrischen Functionen. Symmetrische Grund- functionen 154 §. 46. Die Potenzsummen 156 §. 47. Beweis des Hauptsatzes für zwei Variable 160 §, 48. Allgemeiner Beweis des Hauptsatzes 161 §. 49. Zweiter Beweis des Satzes von den symmetrischen Functionen 163 §. 50. Discriminanten 167 §. 51. Kennzeichen für die Anzahl der verschiedenen Wurzeln . . . 170 §. 52. Discriminanten der Formen dritter und vierter Ordnung . . . 172 §. 53. Resultanten 175 §. 54. Bestimmung der gemeinschaftlichen Factoren 179 §. 55. Elimination. Theorem von Bezout 185 §. 56. Elimination aus drei Gleichungen . . . ' . . . . 190 §. 57. Grad und Gewicht der Resultanten. Das Theorem von Bezout 193 §. 58. Tschirnhausen-Transformation ¦. . 199 §. 59. Anwendung auf die cubischen und biquadratischen Gleichungen 202 §. 60. Die Tschirnhausen-Transformation der Gleichung 5ten Grades 204
Inhalt des ersten Bandes. XI Seite Fünfter Abschnitt. Lineare Transformation. Invarianten. §. 61. Einführung der linearen Transformation 207 §. 62. Quadratische Formen 208 §. 63. Transformation der quadratischen Formen iu eine Summe von Quadraten 210 §. 64.. Trägheitsgesetz der quadratischen Formen 212 §. 65. Transformation von Formen wten Grades 214 §. 66. Invarianten und Covarianten 216 §. 67. Lineare Transformation der binären Formen 219 §. 68. Binäre cubische Formen 223 §. 69. Das volle Formensystem der binären cubischen Form 226 §. 70. Biquadratische Formen 229 §. 71. Auflösung der biquadratischen Gleichung 231 §. 72. Die Covarianten 233 §. 73. Das volle Invariantensystem der binären biquadratischen Form 236 Sechster Abschnitt. T s eMrnli au sen- Transformation. §. 74. Die Hermite'sche Form der Tschirnhausen-Transformation . 240 §. 75. Invarianteneigenschaft der Tschirnhausen-Transformation . . . 242 §. 76. Ausführungen über den Hermite'schen Satz 245 §. 77. Transformation der cubischen Gleichung 248 §. 78. Allgemeine Ausführung der Transformation 253 §. 79. Die Bezoutiante 255 §. 80. Transformation der Gleichung fünften Grades 260 §. 81. Normalform der Gleichung fünften Grades 263 Zweites Buch. Die Wurzeln. Siebenter Abschnitt. Realität der Wurzeln. §. 82. Allgemeines über Realität von Gleishungswurzeln und über Discriminanten 271 §. 83. Discussion der quadratischen und cubischen Gleichung .... 273 §. 84. Discussion der biquadratischen Gleichung 276 §. 85. Die Bezoutiante und ihre Bedeutung für die-Wurzelrealität . . 281 §. 86. Die Trägheit der Formen zweiten Grades 284 §. 87. Quadratische Formen mit verschwindender Determinante . . . 287 §. 88. Quadratische Formen mit nicht verschwindender Determinante 290 §. 89. Anzahl der positiven und negativen Quadrate 291 §. 90. Anwendung auf die Bezoutiante 296
XII Inhalt des ersten Bandes. Seite Achter Abschnitt. Der Sturm'sehe Lehrsatz. §. 91. Das Sturm'sche Problem 301 §. 92. Die Sturm'schen Ketten 302 §. 93. Erstes Beispiel: Kugelfunctionen 304 §. 94. Zweites Beispiel 307 §. 95. Die Sturm'schen Functionen 311 §. 96. Hermite's Lösung des Sturm'schen Problems 313 §. 97. Bestimmung der Hermite'schen Form S 314 §. 98. Die Determinante der Hermite'schen Form 316 §. 99. Formulirung der Aufgabe durch Hurwitz 318 §. 100. Grundzüge der Charakteristikentheorie 323 §. 101. Charakteristik eines Systems von drei Functiönen 325 §. 102. Beziehung der Charakteristik zu den Schnittpunkten 327 §. 103. Anwendung der Charakteristiken auf die Eingrenzung der complexen Wurzeln einer Gleichung 329 §. 104. Bestimmung der Charakteristik 331 §. 105. Gauss' erster beweis des Fundamentalsatzes der Algebra . . 333 §. 106. Der Satz von Hurwitz 335 Neunter Abschnitt. Abschätzung der Wurzeln. §. 107. Das Budan-Fourier'sche Theorem 341 §. 108. Die Newton'sche Hegel 345 §. 109. Der Cartesische Lehrsatz 350 §. 110. Das Jacobi'sche Kriterium 353 §. 111. Kleins geometrische Yergleichung der verschiedenen Kriterien 354 §. 112. Bestimmung einer oberen Grenze für die Wurzeln 358 §. 113. Abschätzung der imaginären Wurzeln 360 §. 114. Das Theorem von Holle 361 §. 115. Die Sätze von Laguerre für Gleichungen mit nur reellen Wurzeln 364 Zehnter Abschnitt. Genäherte Berechnung der Wurzeln. §. 116. Interpolation. Regula falsi ' 372 §. 117. Die Newton'sche Näherungsmethode 376 §. 118. Die Näherungsmethode von Daniel Bernoulli und ver- verwandte Methoden 383 §. 119. Die Näherungsmethode von Gräffe 386 §. 120. Trigonometrische Auflösung cubischer Gleichungen . . . * . 391 §. 121. Die Gauss'sche Methode der Auflösung trinomischer Glei- Gleichungen 393 §. 122. Berechnung der imaginären Wurzeln einer trinomischen Gleichung 397
§• §• §• §• §• §¦ §. §¦ §• §• §. §• §• 123. 124. 125. 126. 127. 128. 129. 130. 131. 132. 133. 134. 135. 136. 137. 138. Inhalt des ersten Bandes. XIII Seite Elfter Abschnitt. Kettenbrücke. Verwandlung rationaler Brüche in Kettenbrüche 400 Kettenbruchentwickelung irrationaler Zahlen 403 Die. Näherungsbrüche 404 Lösung unbestimmter Gleichungen mit zwei Unbekannten . . 407 Convergenz der Näherungsbrüche 411 Aequivalente Zahlen 413 Entwickelung äquivalenter Zahlen in Kettenbrüche ...... 417 Quadratische Irrationalzahlen 419 Reducirte Zahlen mit negativer Discriminante 428 Reducirte Zahlen mit positiver Discriminante 427 Entwickelung reeller quadratischer Irrationalzahlen in Ketten- Kettenbrüche . 429 Beispiele 435 Die Pell'sche Gleichung ^ 438 Ableitung aller Lösungen der Pell'sehen Gleichung aus der kleinsten positiven 442 Genäherte Berechnung der reellen Wurzeln einer numerischen Gleichung durch Kettenbrüche 445 Rationale Wurzeln ganzzahliger Gleichungen. Reducible Gleichungen 447 Zwölfter Abschnitt. Theorie- der Einheitswurzeln. §. 139. Die Einheitswurzeln 452 §. 140. Primitive Einheitswurzeln 455 §. 141. Gleichungen für die primitiven Einheitswurzeln wten Grades . 458 §. 142. Die Discriminante der Kreistheilungsgleichung ....... 462 §. 143. Primitive Congruenzwurzeln 466 §. 144. Multiplikation und Theilung der trigonometrischen Functionen 474 §. 145. Vorzeichenbestimmung. Quadratische Reste . . . 480 Drittes Buch. Algebraische Grossen. Dreizehnter Abschnitt. Die Galois'selie Theorie. §. 146. Der Körperbegriff 491 §. 147. Adjunction 493 §. 148. Functionen in einem Körper 494 §. 149. Algebraische Körper 497 §. 150. Gleichzeitige Adjunction mehrerer algebraischer Grossen . . . 499
XIV Inhalt des ersten Bandes. Seite §. 151. Primitive und imprimitive Körper ¦ . 501 §. 152. Normalkörper. Galois'sche Resolvente 505 §. 153. Die Substitutionen eines Normalkörpers 508 §. 154. Zusammensetzung der Substitutionen 511 §. 155. Permutationsgruppen 513 §. 156. Galois'sche Gruppe 517 §. 157. Transitive und intransitive Gruppen 523 §. 158. Primitive und imprimitive Gruppen 524 Vierzehnter Abschnitt. Anwendung der Permutationsgruppen, auf Gleichungen. §. 159. Wirkung der Permutationsgruppen auf Functionen von un- unabhängigen Veränderlichen 529 §. 160. Zerlegung von Permutationen in Transposition und in Cyklen 533 §. 161. Divisoren der Gruppen, Nebengruppen und- conjugirte Gruppen 542 §. 162. Reduction der Galois'sehen Resolvente durch Adjunction. Normaltheiler einer Gruppe 548 §. 163. Die Gruppe der Resolventen 553 §. 164. Reduction der Galois'schen Gruppe durch Adjunction belie- beliebiger Irrationalitäten 555 §. 165. Imprimitive Gruppen 558 Fünfzehnter Abschnitt. Cyklisehe Gleichungen. §. 166. Cubische Gleichungen 564 §. 167. Permutationsgruppen von vier Elementen 566 §. 168. Auflösung der biquadratischen Gleichungen 570 §. 169. Abel'sche Gleichungen 575 §. 170. Reduction der Abel'sehen Gleichungen auf eyklische .... 579 §. 171. Resolventen von Lagrange 584 §. 172. Auflösnng der cyklischen Gleichungen 588 §. 173. Theilüng des Winkels 593 Sechzehnter Abschnitt. Kreistheilung. Irredueibilität der Kreistheilungsgleichung 596 Die Kreistheilungsperioden und die Periodengleichungen . . . 601 Gauss'sche Methode zur Berechnung der Resolventen .... 606 Zurückführung der Kreistheilungsgleichung auf reine Glei- Gleichungen 610 Eigenschaften der Zahlen ty 617 Die Gauss'schen Summen 621 Die Perioden vou Vs(w— 1) und % (w— 1) Gliedern 628 Die complexen Zahlen von Gauss 635 Der Körper der dritten Einheitswurzeln 641 §. §• §¦ §• §• §• §• 174. 175. 176. 177. 178. 179. 180. 181. 182.
Inhalt des ersten Bandes. XV Seite Siebzehnter Abschnitt. Algebraische Auflösung von Gleiehungen. Reduction der Gruppe durch reine Gleichungen 644 Metacyklische Gleichungen 646 Einfachheit der alternirenden Gruppe 649 NichtmetacyMische Gleichungen im Körper der rationalen Zahlen 652 Auflösung durch reelle Radicale 655 Metacyklische Gleichungen von Primzahlgrad 658 Anwendung auf die metacyklischen Gleichungen 5*en Grades . 670 Die Gruppe der Resolvente 676 Achtzehnter Abschnitt. Wurzeln metaeykliselier G-leieliungen. §. 191. Stellung der Aufgabe. Hülfssatz 680 §. 192. Sätze über die Resolventen 683 §. 193. Wurzeln metacyklischer Gleichungen 688 §. 194. Befreiung von den beschränkenden Voraussetzungen 691 §. 195. Realitätsverhältnisse 697 §. 196. Metacyklische Gleichungen 5*en Grades 698 §. §• §• §. §• §• §• §• 183. 184. 185. 186. 187. 188. 189. 190.
EINLEITUNG. Wir setzen bei unseren Betrachtungen die natürlichen Zahlen 1, 2, 3 . . . und die Regeln, nach denen mit diesen Zahlen gerechnet wird, als bekannt und gegeben voraus. Die fundamentalen Rechenarten, die sogenannten vier Species, sind die Addition, die Multiplication, zu der als Wiederholung das Potenziren gehört, die Subtraction und die Division. Die beiden ersten heissen die directen Rechenoperationen; sie sind dadurch ausgezeichnet, dass sie im Reiche der natürlichen Zahlen unbegrenzt ausgeführt werden können. Die erste der indirecten oder inversen Operationen, die Subtraction, lässt sich nur dann ausführen, wenn der Minuend grösser ist als der Sub- Subtrahend. . Die Aufgabe der Division kann man auf zwei Arten auf- auffassen. Bei der ersten elementaren Auffassung wird gefragt, wie oft der Divisor im Dividenden enthalten ist. Eine Zahl ist nicht in einer kleineren enthalten. Ist aber der Dividend gleich oder grösser als der Divisor, so giebt die Beantwortung der Frage einen Quotienten und in den meisten Fällen einen Rest, der kleiner als der Divisor ist. Wenn kein Rest bleibt, so sagt man, die Division geht auf, oder der Dividend ist durch den Divisor theilbar, oder der Divisor ist ein Factor oder Theiler der Zahl, die den Dividenden bildet. Diese Aufgabe, die sich schon auf den ersten Stufen der Rechenkunst einstellt, führt zu einer tiefer liegenden Unter- Unterscheidung der Zahlen, die das Fundament aller Zahlentheorie ist. Da ein Factor nie grösser sein kann als die Zahl, deren Factor sie ist, so hat jede Zahl nur eine endliche Anzahl von Factoren. Jede Zahl ist durch 1 und durch sich selbst theilbar, und eine Zahl, die sonst keinen Theiler hat, heisst eine Prim- Primzahl. Die Zähl 1 selbst pflegt man aus Zweckmässigkeitsgründen "Weber, Algebra. I. 1
2 ¦ Einleitung. nicht als Primzahl zu bezeichnen. Sind zwei Zahlen durch eine dritte theilbar, so ist auch die Summe und die Differenz der beiden ersten durch die dritte theilbar; und ist eine Zahl durch eine zweite, diese durch eine dritte theilbar, so ist auch die erste durch die dritte theilbar. Zwei Zahlen haben immer den gemeinsamen Theiler 1. Wenn sie keinen anderen gemeinsamen Theiler haben,' wie z.B. die Zahlenpaare 5 und 7 oder 21 und 38, so heissen die beiden Zahlen relative Primzahlen oder auch theilerfremde Zahlen. Unter den gemeinsamen Theilern von irgend zwei gegebenen Zahlen wird einer der grösste sein, und es ist eine sehr wichtige Aufgabe, diesen grössten gemeinschaftlichen Theiler zu finden.' Dazu führt ein Verfahren, das unter dem Namen Algorithmus des grössten gemeinschaftlichen Theilers bekannt ist, und sich schon bei Euklid1) findet. ¦ Sind a, % die beiden Zahlen, so nehme man die grössere von ihnen, die a sei, als Dividenden, die kleinere at als Divisor, und bestimm^* den Quotienten #i; und wenn die Division nicht aufgeht, den Rest. a?, also a = qt % -f- a2, so dass a2 <C ax ist. Jeder gemeinschaftliche Theiler von a und ax ist dann auch ge- gemeinschaftlicher Theiler von ax und a2 und umgekehrt. Verfährt man mit %, a3 ebenso wie mit a und at und setzt, wenn die Division nicht aufgeht, % = g2 a2 + «3, so ist wieder 03 <C «2, und jeder gemeinschaftliche Theiler von % und a.2 ist auch gemeinschaft- gemeinschaftlicher Theiler von a2 und az und umgekehrt. Fährt man auf diese Weise fort zu dividiren, so muss, da die Zahlen a,Oi,a2,«3... immer abnehmen, nothwendiger Weise die Division nach einer endlichen Anzahl von Schritten aufgehen, und es muss also zuletzt ein Paar von Gleichungen av_2 = <fr-i «v—i -j- ar, ar—i = <Z»ßv auftreten. Dann ist av ein gemeinschaftlicher Theiler aller vor- vorausgehenden a, also auch von a und aa, und jeder gemein- gemeinschaftliche Theiler von a und at ist Theiler von av. Also ist ar der grösste gemeinschaftliche Theiler von a und %, und wir sind zugleich zu dem Satze gelangt, dass jeder gemein- gemeinschaftliche Theiler zweier Zahlen in ihrem grössten gemein- gemeinschaftlichen Theiler aufgehen muss. . Sind a und % relative Primzahlen, so ist der letzte Divisor av = 1. Multiplicirt man unter dieser Voraussetzung die vor- J) Elemente, Buch YII, II, Bd. II der Heiberg'scten Ausgabe (Leipzig, Teubner, 1883). :
Zerlegung in Primzahlen. 3 stehenden Gleichungen mit irgend einer Zahl b, so folgt, dass b der grösste gemeinschaftliehe Theiler von a b und ax b ist, und dass also jeder gemeinschaftliche Theiler von ab und aj oder von a und aj b Theiler von b sein muss. Ist also % relativ prim zu a und zu b, so ist es auch relativ prim zu ab, und aus der speciellen Annahme, dass a^ eine Primzahl sei, ergiebt sich, dass ein Product nur dann durch eine Primzahl theilbar sein kann, wenn wenigstens einer der Factoren durch sie theilbar ist. Ist also das Product ab durch ax theilbar und ist % relativ prim zu a, so muss b durch a1 theilbar sein. Sind a, b irgend zwei Zahlen mit dem grössten gemeinschaft- gemeinschaftlichen Theiler d und ist a = da', b = dV, so sind a! und V relativ prim zu einander. Jede Zahl m, die zugleich ein Viel- Vielfaches von a und von b ist, hat die Form m = 'am' = da!m' und darin muss a'm' ein Vielfaches von V sein, also muss auch m! ein Vielfaches von V sein, d. h. jede Zahl, die zugleich ein Vielfaches von a und von b ist, ist durch a'b'd theilbar. Diese Zahl a'b'd, die selbst ein gemeinschaftliches Vielfaches von ä und b ist, heisst daher das kleinste gemeinschaftliche Viel- Vielfache von a und b. Wenn eine Zahl durch zwei relative Primzahlen theilbar ist, so ist sie auch durch ihr Product theilbar, und wenn also eine Zahl m durch mehrere Zahlen theilbar ist, von denen je zwei zu einander relativ prim sind, so ist sie auch durch das Product aller dieser Zahlen theilbar. Jede Zahl m, mit Ausnahme von 1, ist durch eine Primzahl theilbar. Denn ist m nicht selbst eine Primzahl, so hat m einen von 1 verschiedenen Theiler m', der kleiner als m ist. Ist m' auch keine Primzahl, so hat es einen kleineren Theiler m", der grösser als 1 ist, und der auch Theiler von m ist, u. s. f., und so gelangt man auf einen Primzahltheiler von m. Eine Potenz aa einer Primzahl a kann durch keine von a verschiedene Primzahl b theilbar sein, weil eben sonst a durch b theilbar sein müsste. Folglich kann a" keine anderen Theiler haben, als Potenzen von a, deren Exponent nicht grösser als « ist. Potenzen verschiedener Primzahlen, wie aa, b?, sind daher stets relativ prim. Hierauf gründet sich der Beweis des wichtigen Satzes, dass eine Zahl m immer und nur auf eine einzige Weise als ein 1*
4 Einleitung. Pro'duct von Primzahlen dargestellt werden kann. Denn da der Theiler nicht grösser sein kann als der Dividend, so kann m sicher nur durch eine- endliche Anzahl von Primzahlen theilbar sein. Ist a eine von diesen Primzahlen und a" die höchste Potenz von a, die in m aufgeht, so ist auch « eine bestimmte Zahl. Es seien nun ebenso bß, C . . . die höchsten Potenzen der .übrigen in m aufgehenden Primzahlen b, c . . ., durch die sich m theilen lässt, dann muss, da je zwei der Zahlen aa, fr*, C . . . relativ prim sind, m auch durch das Product aa fr*' c* . . . theilbar sein, und es muss m diesem Producte gleich sein, da sonst noch eine andere Primzahl oder eine höhere Potenz einer der Primzahlen a, b, c . . . in m aufgehen müsste. Wir geben nun eiuen Ueberblick über diel in der Mathe- Mathematik nothwendigen und allmählich eingeführten] Erweiterungen des Zahlenbegriffes. Wir verstehen unter einer Mannigfaltigkeit oder Menge, oder dem abkürzenden Zeichen -K ein System von Objecten oder Elementen irgend welcher Art, das so in sich abgegrenzt und vollendet ist, dass von jedem beliebigen Object vollkommen be- bestimmt ist, ob es zu. dem System gehört oder nicht, gleichviel, ob wir im Stande sind, in jedem besonderen Falle die Ent- Entscheidung wirklich zu treffen oder nicht. Eine Menge heisst geordnet, wenn von irgend zwei/unter- zwei/unterschiedenen/ihrer Elemente immer ein in sich vollkommen^ be- bestimmtes als das grössere gilt, und zwar so, dass aus a >> b, b >> c stets a > c folgt. Ist a >> b und 6 > c oder a >> b > c, so sagen wir, dass b zwischen a und c liegt. Die natürlichen Zahlen bilden eine geordnete Menge; zwischen zwei auf einander folgenden ihrer Elemente liegt kein weiteres Element. Eine solche Mannigfaltigkeit heisst eine discrete. Eine geordnete Menge von der Eigenschaft, dass zwischen je zwei Elementen immer noch andere Elemente gefunden werden, heisst dicht. Eine dichte Menge kann man bilden, wenn man die natürlichen Zahlen in Paaren zusammenfasst, und diese Paare als Elemente einer Menge auffasst. Diese Paare sollen Brüche genannt und mit m: n oder — bezeichnet werden, und zwei solche Brüche m:n und m':n' werden, einander gleich gesetzt, wenn mn' = nm' ist. Fasst man alle iunter einander gleichen^ Brüche
. Schnitte. 5 zu einem Element zusammen, so erhält man eine Mannigfaltig- Mannigfaltigkeit, die geordnet ist, wenn man noch festsetzt, dass m: n grösser als ml: n' ist, wenn mn'\> nm' ist. Dass diese Mannigfaltigkeit dicht ist, sieht man so ein: sind (i = m : w, ft' = m! : n' zwei Brüche und ii^>(i', so kann man, wenn h eine willkürliche Zahl ist, hmn' , hm' n hnnn hnn' setzen, und darin ist hmn' ^> Jim'n. Man kann h immer so annehmen, dass zwischen hmn' und hm'n noch Zahlen liegen, und wenn jo eine solche Zahl ist, so liegt p : hnn' zwischen p und 11'. Die Punkte einer geraden Linie kann man auch als eine geordnete Menge auffassen, wenn man unter grösser und kleiner irgend eine Ortsbeziehung, z. B. weiter rechts und weiter links oder höher und tiefer versteht. , / / Eine Eintheilung einer geordneten Menge 2JI in zwei Theile A, B der Art, dass jedes Element a von A kleiner ist als jedes Element b von B, wird ein Schnitt in Tt genannt und wird passend durch (A, S) bezeichnet. Ein solcher Schnitt entsteht, wenn man irgend ein Element (t, von -K herausgreift, alle kleineren Elemente zu A, alle grösseren zu B und [i selbst nach Belieben zu A oder zu B rechnet. (Es entstehen, genau gesagt, je nachdem man das eine oder das andere thut, zwei Schnitte, die wir aber immer als gleich betrachten wollen?) Wenn in einem Schnitt (A, B) entweder A ein grösstes oder B ein kleinstes Element p enthält, so sagen wir, dass (i den Schnitt (A, B) er- erzeugt. Es kann aber auch der Fall vorkommen, dass weder A ein grösstes noch B ein kleinstes Element besitzt. Wenn jeder Schnitt in einer dichten Menge durch ein bestimmtes Element p erzeugt wird, so heisst die Menge stetig. Stetigkeit sowohl als Dichtigkeit sind Eigenschaften, die der Natur der Sache nach unserer Sinneswahrnehmung unzugänglich sind; sie lassen sich daher auch an Dingen der Aussenwelt, an Raumgrössen, Zeiträumen, Massen, niemals mit Strenge nach- nachweisen, wie sehr sie uns auch im Wesen unserer Anschauung zu liegen scheinen. Es lassen sich aber sehr wohl reine Begriffs-
6 Einleitung. Systeme construiren, denen die Dichtigkeit ohue die Stetigkeit oder auch Dichtigkeit und Stetigkeit zukommenl). Ein Beispiel einer dichten Menge bieten die rationalen Brüche. Diese Mannigfaltigkeit, die wir mit 91 bezeichnen wollen, ist keine stetige. Denn nehmen wir irgend einen rationalen Bruch p = m : n, worin m und n keinen gemeinschaftlichen Theiler haben und nicht beide Quadratzahlßn sind, so ist (t, nicht das Quadrat eines rationalen Bruches. Denn wäre (t, = p^ : g2, so würde mg2 = np2 folgen, und daraus, wenn auch p und q ohne gemeinschaftlichen Theiler angenommen werden, m = p2, n — g2, was durch die Voraussetzung ausgeschlossen ist. Wenn wir also einen Schnitt (A, B) in der Mannigfaltigkeit 91 bilden, indem wir jedes Element a von 91 zu A rechnen, dessen Quadrat kleiner als (i ist, und jedes Element b zu B, dessen Quadrat grösser als (i ist, so ist weder in A ein grösstes noch in B ein kleinstes Element enthalten, und, der Schnitt (A, B) wird nicht durch ein Element in 91 erzeugt. Denn angenommen, es sei a = p : q irgend ein Element in A, also p2 : q2 •< m : n oder np2 <«f; dann nehmen wir eine natürliche Zahl y beliebig und wählen eine andere natür- natürliche Zahl x so, dass x >> y und x (mq* — np2) >> ny B p -f- 1), woraus folgt: s2(»f — w^2) > nx«/Bp -f- 1) > n Bpxy + J/2), . also auch mq2x2 >• n(px -\- y)K Setzen wir also a' = (px -f- y) : qx, so ist al > a und a'2 -< (i, also.a' auch in A enthalten; und ebenso kann man zeigen, dass es in B kein kleinstes Element giebt. Die Mannigfaltigkeit 91 kann uns aber als Ausgangspunkt dienen, um eine stetige Menge zu construiren. Die Gesammtheit aller Schnitte in 91 ist gewiss eine Mannigfaltigkeit, die mit © bezeichnet sein mag. Betrachten wir zwei verschiedene ihrer Elemente « = (A, B), «' = (A\ B'), so wird entweder A ein Theil von A' oder A' ein Theil von A sein. Denn wenn irgend 2) Dies ist von Dedekind nachgewiesen, dem wir überhaupt die oben gegebene Definition der Stetigkeit verdanken. Vgl. die Schriften von Dedekind, „Stetigkeit und irrationale Zahleu", BrauDschweig 1872, 1892. „Was sind und was sollen die Zahlen?", Braünschweig 1888, 1893. Andere Mannigfaltigkeiten, denen die Stetigkeit zukommt, sind von Weierstrass und G. Cantor gebildet.
Stetigkeit. 7 ein Element a m A gehört, so gehört auch jedes kleinere Ele- Element von 91 zu A. Ist A ein Theil von A', so wollen wir a kleiner als «' nennen, und dadurch ist die Menge © zu einer geordneten geworden. ~~~ Sehen wir die durch die rationalen Brüche erzeugten Schnitte als gleichwertig mit diesen rationalen Brüchen selbst an und nennen sie kurz rationale Schnitte, so enthält die Menge © die Menge 9t, und © ist also jedenfalls eine dichte Menge. Die Menge © ist aber auch stetig; denn bezeichnen wir die Theile von © durch die grossen deutschen Buchstaben 51, SB ... und be- betrachten irgend einen Schnitt C1, SB) in der Mannigfaltigkeit der Schnitte, so können wir ein Element in © bestimmen, a = (A, B), indem wir in A jeden rationalen Bruch aufnehmen, der einen der Schnitte von 2t erzeugt, und alle anderen rationalen Brüche, die also die rationalen Schnitte in SB erzeugen, nach B werfen. Dieser Schnitt a in 91 erzeugt den Schnitt Bt, SB) in ©. Dies wird nachgewiesen sein, wenn gezeigt ist, däss jedes Element «' in ©, was kleiner ist als a, zu 2t gehört, und jedes Element ß in ©, was grösser ist als a, zu 33. Sei also «' = (A\ B') und a' <[ a, dann giebt es rationale Brüche in A, die nicht in A' enthalten sind; es giebt also ein rationales (i, so dass. a' <; fi <; a, und dieses p erzeugt einen Schnitt, der in 21 enthalten ist, gehört also selbst zu 2t; da «' <^ li ist, so gehört auch a' zu 2t. Ganz ebenso zeigt man, dass jedes ß\ das grösser als a ist, zu SB gehört, und damit ist die, Stetigkeit von © nachgewiesen. Diese sehr abstracte Betrachtungsweise giebt uns die Sicher- Sicherheit, dass die Annahme einer stetigen Menge keinen Widerspruch enthält, dass solche Mengen wenigstens im Reiche der Gedanken' existiren. Die Geometrie wie die Analysis, die immer gern an' die geometrische Anschauung anknüpft, hat lange stillschweigend' die Existenz stetiger Mengen, z. B. bei den Punkten einer ge- geraden Linie oder irgend eines anderen zusammenhängenden' Linienzuges, als eine Art von Axiom angenommen. Auch der Unterschied zwischen dichter und stetiger Menge, der der Unter- Unterscheidung commensurabler und incommensuräbler Strecken zu Grunde liegt, ist den Alten nicht entgangen i). 1) Euklid, Elemente, Bach X.
8 Einleitung. Auch wir wollen in der Folge nicht auf das Hülfsmittel der geometrischen Anschauung verzichten, und z.B. die Punkte einer geraden: Linie unbedenklich als eine stetige Menge betrachten. Eine geordnete Menge 2JI heisst messbar unter folgenden Voraussetzungen: Addition und Vervielfältigung sind in Ü){ all- allgemein ausführbar, ebenso Subtraction eines kleineren von, einem grösseren Element, d. h. aus irgend zwei Elementen a, & (die auch identisch sein können) kann nach einer bestimmten Vor- Vorschrift ein neues Element, a -f- b, von 3Jt abgeleitet werden, so dass a -\- b grösser als a und als b ist, und dass die bekannten, in den Formeln a -f- b = b -j- a, (a -\-b) -\- c — a -\- (b -\- c) ausgedrückten Regeln der Addition gelten; nnd zu zwei Ele- Elementen a, c, von denen das zweite grösser ist, kann ein drittes Element b gefunden werden, so dass a -f- b = c ist, was auch durch das Zeichen der Subtraction b == c — a ausgedrückt wird. Zwei ungleiche Elemente von -K haben also immer eine bestimmte Differenz. Aus diesen Voraussetzungen folgt, dass eine Summe grösser wird, wenn einer der Summanden sich vergrössert. Die wiederholte, etwa »w-malige Addition desselben Elementes a heisst Vervielfältigung und ihr Ergebniss wird mit ma bezeichnet. Es kommt endlich noch eine Voraussetzung hinzu, nämlich die, dass bei jedem gegebenen a ein hinlänglich hohes Vielfaches ma grösser ist, als ein beliebig gegebenes anderes Element b. Unter den Elementen einer messbaren Menge giebt es also kein grösstes. In einer dichten messbaren Menge giebt es auch kein kleinstes Element; denn wäre, a das kleinste und b ein beliebiges Element, so könnten zwischen b und b -\- a keine Elemente liegen, weil, wenn b <^ c <C b -f- a wäre, aus der Definition der Messbarkeit folgen würde, dass af = c — b kleiner als a wäre. Es folgt auch umgekehrt, dass eine messbare Menge, in der kein kleinstes Element vorkommt, dicht ist. Denn sind a und a -\-b irgend zwei Elemente, so braucht man ja zu a nur ein Element zu addiren, was kleiner als b ist, um ein Element zwischen a und a -\- b zu erhalten. Ist eine Menge stetig, so lassen sich die Voraussetzungen für die Messbarkeit noch vereinfachen, weil dann die Subtraction eine Folge der Addition ist. Sind nämlich a und c zwei Ele- Elemente einer stetigen geordneten Menge 9JJ, in der die Addition
Messbare Mengen. 9 besteht, und ist c 5> a, so erhält man einen Schnitt (A, J5) in 9JI, wenn man alle Elemente: x, für die a -j- x ^ c ist, nach ^4, und für die a -f- x >> c ist, nach 2? verweist. Dieser Schnitt wird durch ein Element b erzeugt, für das a -f- b = c sein muss. Die natürlichen Zahlen bilden nach unserer Definition eine messbare Menge, in der ein kleinstes Element, nämlich 1, vor- vorkommt. Die Mannigfaltigkeit der rationalen Brüche wird eben- ebenfalls messbar, wenn man Addition und Subtraction nach den bekannten Regeln der Bruchrechnung erklärt. Besonders wichtig und gleichsam typisch für die messbaren Mengen ist die Mannig- Mannigfaltigkeit der geradlinigen Strecken oder Längen einer Linie, die einfach durch Aneinanderlegen addirt werden. Auch Stoff- Stoffmengen, durch die Wage verglichen, und Zeiträume, mit der Uhr gemessen, liefern: Beispiele messbarer Mengen. Die Art des Messens liegt nicht in der Natur der Mannigfaltigkeit selbst, sondern wird durch den denkenden Beobachter hineingelegt; so würde es z. B. ebenso gut zulässig sein, unter der Summe a -\-b zweier Strecken a und b die Hypotenuse eines rechtwinkligen Dreiecks mit den Katheten a, b zu verstehen, statt, wie es ge- gewöhnlich angenommen wird, die aus a und b durch Aneinander- Aneinanderlegen zusammengesetzte Strecke. Um die stetige Menge © der Schnitte in der Mannigfaltig- Mannigfaltigkeit der rationalen Brüche 91 zu einer messbaren zu machen, beachte man zunächst Folgendes. Ist a, = (A, B). ein Element in @ und (i ein beliebig ge- gegebener rationaler Bruch, so kann man immer ein Element a! in A so bestimmen, dass a! -f- (i = V in B enthalten ist.. Denn wählt man iu A, B zwei beliebige Elemente a, b, so kann man die natürliche Zahl m so bestimmen, dass m\x, ^> b — a ist,,so dass a -f- m p in B enthalten ist. Ist dann h die kleinste ganze Zahl, für die a -f- h ^ in 33 enthalten ist, so ist a-\-Qi— l)ji ¦= al in A und also a! -\- (i = V in B enthalten. Wir verstehen nun unter der Summe (A, B) + (A\ B') = (J.", B") oder «-(-«' = a" den Schnitt in 9i, den man erhält, wenn man einen rationalen Bruch a" nur dann nach A" verweist, wenn.ein a in A und ein a' in A' existirt von der Beschaffen- Beschaffenheit, dass a" ^ a -f- a' ist. In der That ist (A", B") ein Schnitt; denn ist a" in A" enthalten, so gilt dasselbe von jedem-, kleineren Bruch, und es giebt Brüche, die in A", und Brüche, die nicht in A" enthalten sind, nämlich die Brüche von der Form a--\- a'
10 : Einleitung. und b ^- b'. Es ist ferner «" grösser als a und a'. Denn A" enthält zunächst alle A, und wenn a' ein beliebiger Bruch in A' ist, so kann man a in A so wählen, dass das Element a -\- a' von A" in B enthalten ist; also ist A" umfassender als A. Die durch rationale Brüche (i, p' erzeugten Schnitte ergeben durch Addition den durch (i -\- p' erzeugten Schnitt. Die Bedeutung dieser Definition erweist sich in folgendem Satze: Ist 9Jt eine stetige messbare Mannigfaltigkeit, und 50?! ein Theil von -DJ, der gleichfalls stetig und nach der in 2Jt geltenden Regel messbar ist, so ist ^\ mit 2JI identisch. Der Beweis ergiebt sich folgendermaassen: 1. Ist 2Jtx von -K verschieden, so giebt es in W Elemente «, die kleiner sind als alle Elemente von SDlj. 'Denn sei a ein nicht in Wx enthaltenes Element von "JR. Wenn es in SJij Elemente giebt, die kleiner als a sind, so bringt a einen Schnitt (A1: _BX) in l!fft1 hervor, den man erhält, wenn man alle Elemente von 9Jlx, die kleiner als a sind, in Ax aufnimmt, die anderen in Bx. Dieser Schnitt muss aber wegen der voraus- vorausgesetzten Stetigkeit von 2Jtx auch durch ein Element ax m W\ erzeugt werden, und weil 5KX ein Theil von -K ist, so muss % auch in 9)i vorkommen. Wenn aber a nicht in 9)ix vorkommt, so sind a und ax von einander verschieden, und kein "zwischen a und % gelegenes Element von W kann zu 9)ix gehören. Denn ist z. B. «<«], und bt ein Element von ^, was der Bedingung a <C bi <C % genügt, so müsste &x, weil es kleiner als ax ist, zu Alt und weil es grösser als a ist, zu Bx gehören. ¦ Folglich giebt es kein Element in 3Jlx, was kleiner ist als <h — o (oder a — %), w. z. b. w. 2. Wir bestimmen nun einen Schnitt (.4, S) in 9I so, dass ' in B alle Elemente von -K aufgenommen werden, von denen ein Element in üüij erreicht oder übertrofien wird, nach A also nur die Elemente «, die kleiner sind als alle Elemente von üftj. Dieser Schnitt werde durch das Element a in -K erzeugt. Ist dann a' irgend ein Element in Tt, und a' >> a, so giebt es zwischen a und a! immer ein und folglich auch beliebig viele Elemente von 2J?X, während es in ^ kein Element giebt, was kleiner als a ist. Nimmt-man nun
Nicht messbare Mengen. 11 al — a <C a, » < «i < öj < «', worin a^, at zwei von einander verschiedene Elemente von Wi-i sind, so ist a2 — «i <C ai un(i doch ist, wegen der Messbarkeit, die Differenz a2 — ax in 9Jlj enthalten, worin ein Widerspruch liegt. Es giebt also in 2JI kein Element, was nicht auch in Üftj enthalten wäre. : r Der: zuletzt bewiesene Satz gilt/nicht mehr für stetige Mengen, denen die Messbarkeit nicht, zukommt. Um dies^ an einem, Bei- Beispiel zu zeigen, nehmen wiri die/oben definirte jMannigfaltigkeit © der Schnitte a, und fügen noch ein mit 0 zu bezeichnendes Element hinzu, welches kleiner, sein soll als alle a. Diese Menge bezeichnen wir mit %.x. Hierauf wird eine neue Menge 5l2 con- struirt, die aus den Paaren («, ß) besteht, worin «/und ß je ein beliebiges Element aus 9XX darstellen. Diese Elemente werden so geordnet, dass die kleineren « den grösseren a vorangehen, während b;ei gleichen a die Elemente mit kleineren ß vorangehen. Die Menge 5l2 enthält hier, wenn wir a = («, 0) annehmen, die Menge 3tx, ohne mit ihr identisch zu sein. Die Stetigkeit kommt hier beiden Mengen zu, nicht aber die Messbarkeit. Ebenso kann man noch reichere Mengen 313 bilden, die aus den Elementen (a, ß, y) besteh/en, worin jedes der Zeichett a, ß, y die Elemente von 9Ij durchläuft, u. s. f. "Ein anderes lehrreiches Beispiel einer stetigen, nicht mess- messbaren Menge erhält man, wenn man auf einer geraden Linie, etwa von links nach rechts auf einander folgend, drei feste Punkte a, b, c annimmt, und dann die Menge, 9Jt der Punkte dieser Geraden betrachtet, die links von a und rechts von c liegen, und den einen zwischenliegenden Punkt b hinzufügt. Hier ist sogar in unserer räumlichen Anschauung eine Lücke \von endlicher Ausdehnung vorhandenJ). Dass diesie Menge trotzdem noch als eine stetige bezeichnet wird, rechtfertigt sich, wenn inan die ent- entsprechende Mannigfaltigkeit in der Zahlenreihe aufsucht.. Wir greifen aus der Menge © eine Theilmenge ©x heraus, indem wir alle Schnitte/'«< 1 und ß ^> 3 und ausserdem die Zahl 2 in ©x aufnehmen. l) Auf diese Art stetiger Mengen hat mich G. Cantor aufmerksam gemacht.
12 Einleitung. Die Elemente von @x haben eine durch © bestimmte Ord- Ordnung, und man kann die Elemente von ©x in völlig eindeutiger Weise .auf die Elemente.von © beziehen, so dass die Ordnung gewahrt bleibt. Man ordne nämlich die Elemente a <; 1 in ©x denselben Elementen in © zu, das Element 2 in ©x dem Element 1 in @, jedes Element ß >> 3 in ©j dem Element ß — 2 in ©. Es haben idann, wenn man von © zu ©x übergeht, die Elemente gewissermaassen nur andere Namen erhalten. Wir gehen nun über zu der Definition der Verhältnisse, die von Alters her als Grundlage der Zahlenlehre betrachtet werden, und folgen dabei zunächst Euklid1). Wenn man die Elemente einer stetigen messbaren Menge 9Jt zu Paaren verbindet, und diese Paare an sich als Elemente be- betrachtet, so entsteht eine neue Mannigfaltigkeit; wir bezeichnen ein solches Paar mit a : b, oder auch mit -j-, unterscheiden aber, wenn a und b verschiedene Elemente sind, a : b von b : a, und nennen a den Zähler und b den Nenner von a : b. Diese Paare wollen wir Verhältnisse nennen und wollen diese neue Menge nun ordnen und messbar machen. Nehmen wir zunächst an, dass zwei ganze Zahlen m, n exi- stiren, so dass na = mb wird, wie es z. B. immer der Fall ist> wenn a, b zwei natürliche Zahlen oder zwei commensurable Strecken sind; dann ist, wenn p, q zwei andere ganze Zahlen sind, dann und nur dann qa = pb, wenn mq = np ist. Denn aus na = mb folgt qna = qmb, und wenn also qa = pb ist, pnb = qmb, und folglich pn,= qm. 'Das Zahlenpaar p, q ist durch diese Forderung vollständig bestimmt, wenn noch die Be- Bedingung hinzukommt, dass p, q relative Primzahlen sein sollen. Dann kann, wenn h eine beliebige ganze Zahl ist, m = hp, n z=Jiq sein. In diesem Falle nennen wir das Verhältniss a : b ein rationales und setzen es gleich dem rationalen Bruch m : n oder p : q. Diese rationalen* Brüche können hiernach als Ver- Verhältnisse ganzer Zahlen aufgfefasst werden. Alle unter einander gleichen rationalen Verhältnisse bilden eine rationale Zahl, und die rationalen Zahlen bilden, wie die ratio- rationalen Brüche, eine geordnete, dichte und messbare Mannigfaltigkeit. i) Elemente, Buch V.
Verhältnisse. 13 In die Mannigfaltigkeit der rationalen Zahlen ordnen sich die natürlichen Zahlen selbst mit ein, wenn man unter einer natürlichen Zahl m das Verhältniss m : 1 versteht. Wir kehren jetzt zu irgend einer messbaren Mannigfaltigkeit 9JJ zurück und nehmen aus ihr irgend zwei Elemente a und b. Wählt man, was immer möglich ist, zwei natürliche Zahlen >», w, so dass «« > mb, so heisst das Verhältniss a : b grösser als das rationale Verhältniss m : n oder am und wenn m : n > p : q, so ist auch a : b > p : g. Ebenso folgt, wenn n' a <^ m'b ist, a rrt_ Ist a : i ^> m : n, so kann man eine und folglich auch be- beliebig viele rationale Zahlen nii -. nx finden, so dass a nii in ist, d. h. man kann zwischen a :b und m : n beliebig viele rationale Verhältnisse einschalten. Um dies zu zeigen, wähle man eine beliebige ganze Zahl h und bestimme die ganze Zahl h so, dass h(na — mV) > hb wird, was immer möglich ist; dann ist a hm -\- fc m T> hn >"w"' Und ebenso folgt, wenn n'a <^m' 6, ~ti (m! b — n! a) >> 7c' a ist, a h'm' m! Wenn nun a : b und « : ß irgend zwei Verhältnisse sind, die wir der Kürze wegen auch mit e, s bezeichnen wollen, deren Elemente derselben oder auch verschiedenen Mannigfaltigkeiten angehören, so sind zwei Fälle möglich: 1) Es liegt kein ratio- rationales Verhältniss [i zwischen e und s, oder 2) es liegt ein ratio- rationales Verhältniss zwischen e und s. Im Falle 1) heissen die peiden Verhältnisse e nnd s ein- einander gleich, und man sieht, dass zwei Verhältnisse, die einem dritten gleich sind, auch unter einander gleich sind; denn ist e <Z (i << £, so ist jedes andere Verhältniss e' entweder kleiner oder gleich oder grösser als p. Ist e' gleich /*, so liegen so-
14 Einleitung. wohl zwischen e und e' als zwischen e' und s rationale Verhält- Verhältnisse. Ist aber e' kleiner als: (i, so liegt p, zwischen e' und s, und ist e' grösser als p, so liegt (i zwischen e und e'; also kann e' nicht zugleich gleich e und gleich s sein. ; — Im Falle 2) heissen die Verhältnisse e, s ungleich. Es kann also entweder «) e <; [i -< s oder ß) e > \t! > ,s sein, und diese beiden1 Fälle schliessen sich aus, weil aus e < (i < j, s <C ft' folgt, dass f«. << ft', und folglich e -< ft' ist. Die Grössenbeziehung 2 «) oder 2 ß) bleibt auch bestehen, wenn e oder £ durch ein ihm gleiches Element ersetzt wird. Denn ist f«. < s und f«. ^ s\ so liegt zwischen ^ und s' ein rationales Verhältniss und s, s' sind nicht gleich. Im Falle 2 «) heisst e kleiner als s, im Falle 2 ß) heisst e grösser als £. Zwischen zwei ungleichen Verhältnissen kann .man eine be- beliebige Anzahl rationaler Verhältnisse einschieben. Wenn wir nun alle unter einander gleichen Verhältnisse zu- zusammenfassen, so erhalten wir einen Gattungsbegriff, den wir als Zahl im allgemeinen Sinne des Wortes bezeichnen. Die Zahl ist also ein Name oder Zeichen für eine gewisse Mannigfaltigkeit, deren Elemente eben die/mit einem unter ihnen gleichen Ver- Verhältnisse sind1). Unter diesem Zahlbegriff sind die rationalen Verhältnisse und folglich auch die natürlichen Zahlen als die Verhältnisse m : 1 mit enthalten und bilden die rationalen Zahlen. Zahlen, die nicht aus rationalen Verhältnissen entspringen, heissen irrationale Zahlen. Nach dem, was bis jetzt ausgeführt ist, bilden die Zahlen eine geordnete Menge, und man kann ihre Ordnung fest- feststellen, wenn für jede Zahl irgend eines der\ darunter enthal- enthaltenen Verhältnisse als Eepräsentant gewählt wird. Von zwei Verhältnissen mit demselben Nenner und un- ungleichen Zählern ist das das grössere, dessen Zähler grösser ist, und von zwei Verhältnissen mit demselben Zähler und ungleichen Nennern ist das das kleinere, dessen Nenner grösser ist. l) Auf den Gattungsbegriff lassen sich auch die natürlichen Zahlen in einfacher und folgerichtiger Weise zurückführen.
Zahlen. 15 Sind nämlich a, a1, b beliebige Elemente einer messbaren Menge und d > a, so wähle man zunächst eine ganze Zahl n so., dass na > b und n {a! — a) > b. Hierauf nehme man die kleinste ganze Zahl m, die der .Bedingung mb > na ge- genügt; dann ist na <z mb, aber mb < na'. Denn wäre mb ^> w a' J> w a -|- w (a' — a), so wäre mb > na -\- b; also wäre gegen die Voraussetzung schon {m — l)b > na. Dann ist a m a! y<¥<:T' also a:b < a':&; und ganz ebenso kann man beweisen, dass, wenn b' > b ist, a ¦. b ;> a : V wird. Man drückt diesen Satz auch so aus, dass ein Verhältniss zugleich mit dem Zähler wächst und mit wachsendem Nenner abnimmt. Hieraus ergiebt sich auch leicht der folgende Satz: Sind a, b, c, d Elemente derselben messbaren Menge und ist a : b = c : d, so ist auch a : c = b : d. Denn angenommen, es wäre a : c < b : d, so müsste es zwei ganze Zahlen m, n geben, so dass n a < m c nb > md. Dann aber wäre nach dem eben bewiesenen Satze na : nb < mc : md, also auch a : b < c : d, entgegen der Voraussetzung. Hieran schliesst sich nun folgender Hauptsatz. Wenn von den vier Grossen a, b, c, d irgend drei aus einer stetigen messbaren Menge beliebig gegeben sind, so lässt sich die vierte in derselben Menge so bestim- bestimmen, dass a : b = c : d ist. Der Satz ist eine unmittelbare Folge der vorausgesetzten Stetigkeit. Denn wenn man z. B. ein Element x von 9Jt in A oder in S aufnimmt, je nachdem x : b kleiner oder grösser als c : d ist, so erhält man einen Schnitt, der durch ein Element a erzeugt wird, das der Bedingung a : b = c : d genügt. Es gilt aber dieser Satz auch in gewissen nicht stetigen Mengen, z. B, für die rationalen Brüche. Hieraus folgt, dass man als Repräsentanten zweier Zahlen immer zwei Verhältnisse wählen kann, deren Elemente derselben Mannigfaltigkeit angehören, und die denselben beliebig zu wählen- wählenden Nenner haben. Die Addition wird dann so erklärt, dass
}Q Einleitung. a . b a -\-b e ' e c ist. Diese Regel umfasst als speciellen Fall die Addition der rationalen Brüche, und um sie allgemein zu rechtfertigen, braucht dann nur noch gezeigt zu werden, dass, wenn a : c = a' : d und b : c = V : c',. auch (a -\- b) : c = {a! ~-\- V) -. d sein muss. Wir beweisen dies, indem wir zeigen, dass, wenn a : c = a': d und (a -f- b) : c > (a' -)- b'): c' ist, auch b : c > 6' : d sein muss. Es sei also, wenn m und n zwei ganze Zahlen sind, a -{-b m a' -\- V ~~c~ >^> d ; dann ist n (a + 6) > mc und ind ^> na' -\- b. Dann ist um so mehr md >¦ w a' und wegen a: c — a': d auch «ic>»«. Es ist also auch & m c — n a md — na' V c «c ' nd d ' Andererseits folgt aber leicht aus der Voraussetzung a : c = al : c', dass auch mc — na md — na' nc nd ist, also b:c^> b' :d, w. z. b. w. Hiermit ist also nachgewiesen, dass auch die Zahlen, wie wir sie definirt haben, eine meSsbare Menge bilden. Sind a und c einer stetigen Mannigfaltigkeit entnommen, so bilden auch bei feststehendem c die Verhältnisse a: c eine stetige Menge und es folgt also, da es überhaupt stetige Mengen giebt, dass auch die Zahlen eine stetige Menge bilden. Sind «, ß, y, d jetzt Zahlen, so kann man aus der Proportion a: ß = y: § eine beliebige der vier Zahlen durch die drei anderen gegebenen: bestimmen. Setzt man 8 = 1 und sucht «, so erhält man die Multiplication a = ßy, und die Vertauschbarkeit der Factoren ist eine Folge des Satzes, dass a:y = ß:d aus a:ß = y.d folgt. Sucht man y, so erhält man die Division; und aus der oben gegebenen Definition der Addition folgt die Grund- Grundformel a(ß-\-y) = ct,ß-\-ay. Die vier Grundrechnungsarten sind also in dem Gebiete der Zahlen ausführbar mit der einzigen Beschränkung, dass bei der Subtraction der Subtrahend kleiner sein muss als der Minuend.
Zahlenreihen. 17 Die Construction eines Schnittes in der Reihe der Zahlen liefert stets den Beweis für die Existenz einer Zahl, die bestimmten Anforderungen genügt. So erhält man einen Schnitt (A, JB), wenn man alle und nur die Zahlen, deren Quadrat kleiner als eine bestimmte Zahl « ist, in A aufnimmt; diesem Schnitt ent- entspricht eine bestimmte Zahl, deren Quadrat gleich « ist und die mit V« bezeichnet wird, und dadurch wird die Existenz der Quadratwurzeln nachgewiesen. Auf die Schnitte lassen sich auch die von G. Cantor zur Definition der Irrationalzahlen eingeführten Zahlenreihen zurückführen l). Nach Cantor ist unter einer Zahlenreihe irgend ein un- unbegrenztes, in hestimmter Weise geordnetes System von Zahlen zu verstehen: 8 = #!, x2, xs, Xi . . . von der Beschaffenheit, dass es eine bestimmte Zahl g giebt, unter die keine der Zahlen S heruntersinkt, und dass, wenn d eine beliebig gewählte Zahl ist, und xn, xm verschiedene Ele- Elemente aus S sind, xn — xm oder xm — xn immer kleiner bleibt als d, wenn m und n eine hinlänglich grosse Zahl überschritten haben. Es giebt immer Zahlen, die von den Zahlen einer solchen Reihe nicht überschritten werden; denn hat man 8 gewählt und n passend bestimmt, so überschreitet xm, welchen Werth auch m haben mag, niemals die grösste der Zahlen x±, x% . . . xm xn -\- 8. Andererseits giebt es auch Zahlen, die von unendlich vielen xn überschritten werden, z. B. jede Zahl, die kleiner ist als g. Man erhält nun einen Schnitt (A, JB), wenn man die Zahlen nach JB wirft, die, wenn n einen hinlänglich hohen Werth hat, von keinem xn mehr überschritte^ werden (die also von keinem oder nur von einer endlichen Anzahl von ocn über- überschritten werden), und alle anderen Zahlen (die also von unend- unendlich vielen xn überschritten werden) nach A. Wird dieser Schnitt durch die Zahl « erzeugt, so giebt es, wie klein auch 8 sei, immer unendlich viele Zahlen xn zwischen a — s und a, und man kann sagen, dass diese durch S vollkommen bestimmte Zahl x) Cantor, Ueber die Ausdehnung eines Satzes aus der Theorie der trigonometrischen Reihen. Mathematische Annalen, Bd. 5 A872)- vergl. auch Heine, Elemente der Functionenlehre. Journal für Mathematik, Bd. 74 A872). Weber, Algebra. L 2
18 Einleitung. « durch die Zahlenreihe S erzeugt wird. Nach Cantor ist die Zahlenreihe S geradezu die Definition der Zahl «. Selbstver- Selbstverständlich kann eine und dieselbe Zahl « durch sehr verschiedene Zahlenreihen erzeugt werden. Diese Zahlenreihen sind aber alle als unter einander gleich zu betrachten. Man kann unter Anderem die Zahlen von S alle als rationale Brüche annehmen. Es lässt sich auch umgekehrt leicht nachweisen, dass man zu jeder gegebenen Zahl « immer Zahlenreihen S angeben kann, durch die a erzeugt wird, so dass also die Gesammtheit der Zahlen- Zahlenreihen S gleichfalls eine stetige Menge bildet. Bei der Erklärung der Grundrechnungsarten hat sich bei der Subtraction eine unbequeme Beschränkung ergeben, von der wir uns frei machen durch Einführung der Null und der nega- negativen Zahlen. Es möge x jedes Element des bisher definirten Zahlensystems bedeuten, das wir jetzt als das System der positiven Zahlen bezeichnen wollen. Wir nehmen dies Zahlensystem ein zweites Mal und bezeichnen zum Unterschied in diesem zweiten System, das als das System der negativen Zahlen bezeichnet werden soll, jedes Element mit — x. Das zweite System ordnen wir nun dem ersten gerade entgegengesetzt, so dass überall, wo in dem System x „grösser" steht, in dem System —¦ x „kleiner" gesetzt wird, und umgekehrt. Addition und Subtraction werden in — x ebenso erklärt wie in xr so dass (— x) -f- (— y) = — (x -\- y); (— x) — (— y) = — (x — y) sein soll. Wir wollen aber diese beiden Zahlensysteme in der Weise zusammenordnen, dass jedes — x kleiner sein soll als jedes x. Wir erhalten so eine geordnete Menge, in der kein grösstes und kein kleinstes Element vorhanden ist. Dieses System ist auch im Allgemeinen stetig, nur der einzige Schnitt (— x, x) wird durch kein Element erzeugt, und hier, wo beide Systeme zu- sammenstossen, ist also noch eine Verletzung der Stetigkeit vor- vorhanden. Um die Stetigkeit herzustellen, müssen wir also dem Schnitt (— x, x) entsprechend noch eine Zahl Null oder 0 hinzufügen, die eben durch diesen Schnitt definirt ist. Dann haben wir eine geordnete stetige, beiderseits unbegrenzte Menge, die vollständige Reihe der reellen Zahlen. In dem so erweiterten Zahlenbereiche erklären wir nun die Addition allgemein, indem wir definitionsweise setzen:
Negative Zahlen. 19 x -f- (-- x) = 0, a; + 0 = x, x -+- (— y) = x — y, wenn' a; >¦ y, = — (y — x), wenn y > x. Bei dieser Erklärung der Addition gelten, wenn zx, 0.,, 03 irgend drei Zahlen des ganzen Zahlenbereiches sind, die Gesetze: *1 + *ä' = ^2 + *1, (*1 + ^a) + ^3 = ^1 + (>2 + %), die man das commutative und das associativ.e Gesetz nennt. Man bildet die Summe aus einer beliebigen Anzahl von Summanden, indem man nach Belieben der Reihe nach je zwei Summanden zu einer Summe vereinigt. Die Subtraction braucht nicht mehr besonders berücksichtigt zu werden, wenn man sx — s2 durch sx -\- (— z2) erklärt und — (— z) = z setzt. Man stellt die Zahlenreihe anschaulich durch Punkte dar, indem man von einem festen mit 0 bezeichneten Punkte einer geraden Linie die positiven Zahlen als Strecken nach der einen, etwa der rechten, die negativen Zahlen nach der anderen (linken) Seite aufträgt. Das Bild der Summe zweier Strecken z-^ -\- 3% erhält man, wenn man von dem Punkte zx aus die Strecke von der Länge + z2 nach der rechten oder nach der linken Seite abträgt, je nachdem ^2 positiv oder negativ ist. Die Multiplication und Division wird in dem erweiterten Zahlenbereich durch die Gleichungen x {—y) = (— x) y = — xy (—x) (—y) = xy, 01 = 0 erklärt. Die Division als die Umkehrung der Multiplication ist immer möglich, ausser wenn der Divisor Null ist. Für ein Product aus mehreren Factoren und für den Quo- Quotienten zweier solcher Producte gilt der Satz, dass sein Werth positiv oder negativ ist, je nachdem die Anzahl der überhaupt darin (im Zähler und Nenner) vorkommenden Factoren gerade oder ungerade ist. Eine fernere Erweiterung des Zahlbegriffes bestellt in der Einführung der complexen Grossen. Wir combiniren je zwei Zahlen der gesammten Zahlenreihe zu Paaren (x, y), und be- betrachten zwei solche Paare (x, y) und (a, b) nur dann als gleich, wenn x = a, y = i ist. Diese Zahlenpaare bilden eine Mannig- Mannigfaltigkeit , deren Elemente zwar nicht geordnet werden, mit denen aber die Rechenoperationen der Addition, Subtraction, 2*
20 Einleitung. Multiplication und Division vorgenommen werden sollen, nach folgenden Regeln. Es sei O, y) + («> &) = O + «, 2/ + &)> (a>, y) (a, 6) = (*« — yb, xb + ya), und wir setzen ausserdem fest, dass (x, 0) = x sei, was diesen Gleichungen nicht widerspricht. Es ist (x, y) nur dann = 0, wenn x und y beide gleich Null sind. Ferner bezeichnen wir zur Abkürzung @, 1) mit i. Dann ergeben obige Gleichungen die Folgerungen: (x, 0) @, 1) = @, x) oder = ix, (x, 0) + @, y) = (x, y) = x + yi, % + yi + a 4- bi == O + «) + B/ + 6)* und die Umkehrung der Addition: # + yi — (a + ii) = (x — a) + i (y — b), ferner die Multiplication: (x -(- yi) (a -\~ bi) = xa — yi -j- i(a;6 -(- 2/a)> *2 = — 1> (ä 4- yi) (x — yi) = x** + j/2, . . . , . T . (a — bi) (x + V*) g + y» = (a + 6«V (a» + 5^ oder x -\- yi ax -\- by -\- i {ay — bx) a -\-bi ~ «2 + ß ' wodurch die Division erklärt ist, ausser wenn a -\- bi = 0 ist. Zahlen von der Form ix heissen rein imaginäre Zahlen und i die imaginäre Einheit. Eine Zahl ix soll positiv oder negativ imaginär heissen, je nachdem x positiv oder negativ ist. Die Zahlen a -\- bi heissen imaginär oder complex. Das System der reellen und der rein imaginären Zahlen sind darunter als Specialfälle enthalten. Es sind also in dem Gebiete der complexen Zahlen x -\- yi die Grundrechnungsarten unbegrenzt auszuführen (mit Ausnahme der Division durch Null), und die Rechnung mit den reellen Zahlen ist ein Specialfall davon. , Man stellt die complexen Zahlen e = x -\- yi nach Gauss geometrisch durch die Punkte einer Ebene dar, indem man ein rechtwinkliges Coordinatensystem zu Grunde legt und den- Punkt mit den Coordinaten x, y als Bild des Zahlwerthes s betrachtet. Die Punkte der #-Axe stellen in der oben besprochenen Weise
Imaginäre Zahlen. 21 die reellen Zahlen x dar. Die Punkte der y-Kxe sind die Bilder der rein imaginären Zahlen yi. Der Coordinatenanfangspunkt ist das Bild der Zahl 0. Der Radius vector vom Nullpunkte nach dem Punkte s hat den Zahlwerth q = Vx2 -+- y*, und wird der absolute Werth oder der Betrag oder, nach älterer Ausdrucks- Ausdrucksweise, der Modulus der complexen Zahl z genannt. Die einzige Zahl 0 hat den absoluten Werth 0. Jede positive Zahl kommt bei unendlich vielen complexen Zahlen als absoluter Werth vor und die Bildpunkte aller Zahlen mit demselben abso- absoluten Werthe liegen auf einem Kreise, dessen Mittelpunkt im Coordinatenanfangspunkte liegt. Zwei imaginäre Zahlen, die sich nur durch das Vorzeichen von i unterscheiden, also x -(- yi und x — yi, heissen conjugirt imaginär. Ihr Product ist das Quadrat des absoluten Werthes von jeder von ihnen Wenn von zwei conjugirt imaginären Zahlen die eine gleich Null ist, so ist auch die andere gleich Null, und man kann also in jeder richtigen Zahlengleichung i durch — i ersetzen, ohne dass die Richtigkeit gestört wird. Wir wollen noch den oft angewandten Satz anführen, dass der absolute Werth einer Summe zweier von Null verschiedener complexer Zahlen niemals grösser ist, als die Summe der abso- absoluten Werthe der Summanden, und nur dann gleich, wenn das Verhältniss (der Quotient) beider Summanden reell und positiv ist. Sei nämlich 8 = x + yi, c = a + bi, Z = (x -f a) -f- (y + b)i, q* = x^ + y\ r2 = tt* + b2, B2 = (x + aJ + (y + i)% dann ist das ist sicher positiv, wenn ax -\- by <j; 0 ist. Wenn aber ax -\- by >¦ 0 ist, so folgt aus r2^2 — (ax + byJ = (ay — bx)\ dass rg ^ ax -\- by ist, und nur dann gleich, wenn ay — bx = 0. Daraus also ergiebt sich, dass r -f- g ^> H ist und nur in dem besonderen Falle r -\- q = H, wenn ay — bx = 0, ax -(- by ^> 0, woraus das Gesagte folgt. Bei der geometrischen Darstellung ist dieser Satz ein Aus- Ausdruck dafür, dass in einem Dreieck eine Seite kleiner ist, als die Summe der beiden anderen. Der Satz hat noch die andere
22: . Einleitung. Folge, dass der absolute Werth einer Summe nicht kleiner sein kann, als die Differenz der absoluten Werthe der Summanden. Denn wenden wir den vorigen Satz auf die Summe c == Z — s an, so folgt r ^ B -\- q oder B %-r — Q. Die Gleichheit findet hier nur dann statt, wenn der Quotient e : c reell und negativ ist. Es ist noch ein Wort über das wichtigste Hülfsmittel der Algebra, die Buchstabenrechnung, zu sagen. Die Anwendung dieses Hülfsmittels ist so allgemein, dass man bisweilen das Wort Buchstabenrechnung geradezu synonym mit Algebra gebraucht. Die Regeln, wie mit solchen Buchstabenausdrücken gerechnet wird, setzen wir als bekannt voraus. Gleichungen zwischen Buchstabenausdrücken können von zweierlei Art sein; entweder es sind sogenannte Identitäten, d. h. die zwei einander gleich gesetzten Ausdrücke können durch Anwendung der Eechenregeln so umgeformt werden, dass beide Ausdrücke genau überein- übereinstimmen. Man erhält dann aus solchen Bachstabengleichungen richtige Zahlengleichungen, wenn die Buchstaben durch irgend welche, sei es reelle, sei es complexe Zahlen ersetzt werden, vorausgesetzt, dass dabei nicht die Forderung der Division durch Null auftritt. Die Buchstaben in solchen Gleichungen werden oft auch als Variable bezeichnet, weil man sich vorstellen kann, ohne je zu einem Widerspruch zu gelangen, dass für die Buch- Buchstaben nach und nach andere und andere Zahlwerthe gesetzt werden. Eine andere Art von Gleichungen zwischen Buchstabenaus- Buchstabenausdrücken haben nicht diesen Charakter der Identität. Sie enthalten vielmehr eine Forderung, die an solche Zahlen gestellt wird, die man, ohne die Gleichungen unwahr zu machen, für die Buch- Buchstaben einsetzen darf. Die Algebra hat die Aufgabe, Zahlwerthe zu ermitteln, die einer solchen Forderung genügen, die Gleichung zu lösen. In diesen Gleichungen werden die Buchstaben auch als „Unbekannte" bezeichnet. Es kommen sehr häufig in ein und derselben Gleichung Buchstaben von zwei Arten vor, solche, für die beliebige Zahlwerthe gesetzt werden sollen, und andere, deren Zahlwerth erst ermittelt werden soll.
EESTES BUCH. DIE GRUNDLAGEN.
Erster Abschnitt. Rationale Funetionen. §. 1. Ganze Functionen. Nächster Gegenstand der Betrachtung sind ganze rationale oder auch kurz ganze Functionen einer Veränderlichen. Wir verstehen darunter Ausdrücke von folgender Form: A) f(x) = aoxn + a^»-1 + a2tf»-2 -| 1- dn-iX -f- an, worin n ein ganzzahliger Exponent, der Grad der Function f(x) ist. Der Grad ist eine natürliche Zahl. Bisweilen ist aber auch nützlich, von ganzen rationalen Functionen Oten Grades zu sprechen, worunter ein von x unabhängiger Ausdruck verstanden wird, x heisst die Veränderliche, a0, %, a2 ... «„_!, an die Coefficienten. Sowohl x als a0, Oj . . . an sind Symbole für unbestimmte Grossen, mit denen nach den Regeln der Buch- Buchstabenrechnung verfahren wird, für die auch unter Umständen bestimmte Zahlwerthe gesetzt werden können (vgl. die Einleitung). Wenn die Function fix) in der Weise wie in A) geschrieben ist, so nennen wir sie nach absteigenden Potenzen von x geordnet. Die Summanden können in jeder beliebigen anderen Reihenfolge angeordnet, also z. B. auch nach aufsteigenden Po- Potenzen von x geordnet sein: f(x) = a„ -)- a„-!X + • • • + «ja:«-1 -)- aoa^. Durch Addition (Subtraction) und Multiplication ganzer rationaler Functionen entstehen wieder ganze rationale Func- Functionen. Die Vorschriften der Buchstabenrechnung geben un- unmittelbar die Bildungsgesetze dieser neuen Functionen. Bei der Addition ist der Coefficient irgend einer Potenz xv in der Summe gleich der Summe der Coefficienten von xv in den einzelnen Summanden. Der Grad der entstandenen Function ist
26 Erster Abschnitt. §. 1. gleich dem höchsten der Grade der Summanden und kann sich nur in dem besonderen Falle erniedrigen, wenn der höchste Grad in mehreren Summanden vorkommt und die Summe der Coefficienten der höchsten Potenzen gleich Null ist. Bei der Multiplication zweier öder mehrerer ganzer rationaler Functionen entsteht eine Function, deren Grad gleich der Summe der Grade der Factoren ist. Um für das Product das Bildungsgesetz der Coefficienten zu übersehen, setzen wir A(x) = a^x™ -)- «jx™-1 4- W B(x) = 6az« + \oc"-t + C) A(x)B{x) = C(x) — coxm+n - und erhalten d = a0 b\ -)- ax b0, c2 = a0 b2 -\- av \ oder in allgemeinen Zeichen, wenn v eine der Zahlen 0, 1, 2 ... m -(- n bedeutet: D) cv = a^bv -f- »ihv-i -f- a2bv—^ -[-••• a.-i\ + av60, worin alle a, deren Index grösser als m, und alle b, deren Index grösser als n ist, gleich Null zu setzen sind. Denn cv ist der Coefficient von xm+M~", und es entsteht also cvxm+n~v durch Multiplication aller Glieder von der Form a^x—^ mit allen Gliedern der Form bv-.floen~v+ii und darauf folgende Addition. Sind «o und b0 = 1, so ist auch c0 = 1. Hat in allen Factoren eines solchen Productes die höchste Potenz von x den Coefficienten 1, so ist auch im Product der Coefficient der höchsten Potenz = 1. Aus diesen Vorschriften für die Rechnung mit ganzen Func- Functionen folgt, dass die Regeln des Rechnens, die sich in Formeln' wie ab = ba, (abjc = a(bc), (a -(- b)c == ac >-\- bc und ähn- ähnlichen aussprechen, auch wenn a, b, c ganze Functionen von x sind, gelten, und zwar in dem Sinne, dass ganze Functionen nur dann als gleich gelten, wenn gleich hohe Potenzen gleiche Coeffi- Coefficienten haben. ¦ ' ~ Unter ganzen Functionen mehrerer Veränderlichen verstehen wir Summen von Producten Ton ganzen, positiven Potenzen der Veränderlichen x, y, s . . . mit irgend welchen Coefficienten,-die
§. 2. Rationale Functionen. 27 als constant gelten. Man kann sich diese Functionen entstanden denken aus den Functionen einer Veränderlichen x, wenn man darin die Coefficienten. a0, % . . . a» selbst wieder als ganze rationale Functionen von anderen Verhältnissen y, 0 ... auf- fasst. So entstehen Functionen von m Veränderlichen aus Func- Functionen von m — 1 Veränderlichen. Alle Glieder einer solchen Function sind von der Form xr ys z* . . ., multiplicirt mit einem Coefficienten, und wenn die Function gehörig zusammengefasst ist, so kommt jede Combination der Exponenten r, s, t . . .nur einmal vor. Zwei so geordnete ganze Functionen gelten nur dann als einander gleich, wenn sie dieselben Producte xrys0t . . . mit denselben Coefficienten enthalten; und eine geordnete ganze Function ist nur dann gleich Null, wenn alle ihre Coefficienten verschwinden. §• 2. Ein Satz von Gauss. Wir wollen sogleich eine Anwendung der Multiplicationsregel zweier ganzer rationaler Functionen machen zum Beweise eines Satzes von Gauss, der uns später noch nützlich sein wird, hier aber zur Einführung in die ßechnungsweise und als Beispiel dienen soll1). Wir betrachten hier den Fall, dass die Coefficienten in den Functionen A(x), B(x) ganze Zahlen sind, so dass nach D) auch die Coefficienten von C(x) == A(x)B(x) ganze Zahlen sind. Wenn die sämmtlichen ganzzahligen Coefficienten a0, «j,... am einer Function A(x) keinen gemeinschaftlichen Theiler haben, so heisst die Function A(x) eine ursprüngliche oder primitive Function, und der Satz, den wir beweisen wollen, lautet: Wenn A (x) nnd B (x) ursprüngliche Functionen sind, so ist auch ihrProduct C(x) eine ursprüngliche Function. Der Beweis ergiebt sich fast unmittelbar aus dem Anblick der Formel D), §.1. Wenn nämlich die sämmtlichen Coefficienten c0, cv c2... cm+n, wie sie dort angegeben sind, einen gemeinschaftlichen Theiler haben, der grösser als 1 ist, so muss es auch wenigstens eine Gauss, Disquisitiones antkmeticae, Art. 42.
28 Erster Abschnitt. §• 2. Primzahl geben, die in allen diesen Coefficienten aufgeht. -Es sei p eine solche Primzahl; diese kann nach der Voraussetzung, dass A(x), B(x) ursprünglich seien, weder in allen a0, <h • • • am, noch in allen 60, bx . . . b„ aufgehen. Es möge nun p aufgehen in: a0, % ... «r-i) aber nicht in ar, in 60, &i . . . &s_i, aber nicht in bs, dann ist nach Voraussetzung r ^ m und kann auch gleich Null sein, wenn p schon in a0 nicht aufgeht. Ebenso ist s <n. Bilden wir nun nach D) cr+s und ordnen es in folgender Weise: qn cr+s = arbs -)- ar-ibs+1 -f- a,.-2&s+2 + • • • so sieht man unmittelbar, dass cr+s nicht durch p theilbar sein kann, wie doch angenommen war; denn das erste Glied arbs ist durch ja nicht theilbar, während alle anderen Glieder, da sie mit einem der Coefficienten a0, % ... ar-i, b0, bi ¦ • ¦ bs-i multiplicirt) sind, durch p theilbar sind. Die Annahme also, dass C(x) nicht ursprünglich sei, während es A (x) und B (x) sind, führt zu einem Widerspruch. Dieser Satz lässt sich übertragen auf Functionen von meh- mehreren Veränderlichen. Wir nennen eine ganze rationale Function von m Veränderlichen mit ganzzahligen Coefficienten ursprüng- ursprünglich oder primitiv, wenn die Coefficienten keinen gemeinsamen Theiler haben, und wir sprechen den Satz aus, dass das Pro- duct von zwei ursprünglichen Functionen wieder eine ursprüngliche Function ist. Um seine Wahrheit einzusehen, brauchen wir nur in der oben durchgeführten Betrachtung die Coefficienten a0, a^, a2 . . . bo, bu b2 . . . nicht als ganze Zahlen, sondern als ganze rationale Functionen von [i — 1 Veränderlichen y, z . . . anzunehmen und eine solche Function durch eine Primzahl p theilbar zu nennen, wenn alle ihre Coefficienten durch p theilbar sind. Setzen wir dann voraus, der zu beweisende Satz sei bereits für Functionen von ji. — 1 Variablen bewiesen, dann ergiebt die Formel A) seine Richtigkeit für Functionen von ji. Variablen, also seine allgemeine Gültigkeit durch den Schluss der vollständigen In- duction oder den Schluss von fi v— 1 auf ji..
§; 2. Kationale Functionen. 29 Durch dieselbe Betrachtungsweise schliesst man auch, dass ein Product von zwei oder mehreren ganzen Functionen nicht verschwinden kann, wenn nicht einer seiner Factoren ver- verschwindet. Denn eine verschwindende Function ist durch j e d-e Primzahl j) theilbar. Eine imprimitive Function ist eine solche, deren ganzzahlige Coefficienten alle einen gemeinsamen Theiler haben. Den grössten dieser Theiler nennen wir den Theiler der Function. Dann, können wir den bewiesenen Satz auch so ausaprßßhen: Der Theiler eines Productes zweier ganzer Func- Functionen ist gleich dem Product der Theiler beider Functionen. Denn sind PA und QB zwei ganze Functionen mit den Theilern P und Q, so sind A und B ursprüngliche Functionen. Also ist auch AB = C eine ursprüngliche Function und PQ ist der Theiler der Function PA . QB = P QC. Wir können dem Satze, insofern er sich auf Functionen . einer Veränderlichen bezieht, ohne seinen Inhalt wesentlich zu ändern, folgende Fassung geben, in der er besonders nützlich ist. Sind <p (x) = #» -f~ "i x™—1 + w2 x™—* -[- • • • -f- am 1>(x) = x» -f- ftaf-» + ß2x»-* -\ h ß» zwei ganze rationale Functionen, in denen die höchsten Potenzen von x den Coefficienten 1 haben, während die übrigen Coefficienten rationale Zahlen sind, so können in dem Product <p(x)ip(x) — xm + n 4- y1xm+n~1 -f- y2xm + n-2 + • • • + 7m + n die Coefficienten y nicht alle ganze Zahlen sein, wenn die Coefficienten w, ß in q>(x) und tl>{x) nicht alle ganze Zahlen sind. Denn bezeichnen wir den kleinsten Hauptnenner der Coeffi- Coefficienten w von <p mit a0, der Coefficienten ß von ip mit b0, so sind a0 <p(x) — A(x), boip(x) = B(x) primitive Functionen von x. Ihr Product a0 b0 <p (x) ty (x) hätte, wenn die Coefficienten y ganze Zahlen wären, den Theiler a0 bo und wäre also, wenn a0 und b0 nicht beide gleich 1 wären, nicht primitiv; dies aber wäre ein Widerspruch mit dem oben bewiesenen Satze.
30 Erster Abschnitt. §. 3. &. 3. Division. Es seien, wie bisher A = A(x) = aoxm -|- «x«™-1 + • • • ( ' B = B(x) = &„«»+&! o"-1 -| zwei ganze rationale Functionen von a;; es soll jetzt vorausgesetzt werden, dass m 5; n sei und dass a0 und &0 von Null verschieden sind. Dann ist die Differenz B) A — £ #»—.B auch eine ganze rationale Function von x, deren Grad aber kleiner ist als m, da die höchste Potenz in beiden Gliedern der Differenz denselben Coefficienten hat und also herausfällt. Wir setzen diese Differenz: C) Ä = A'(x) = a'ox™' -\- a'ix'-1 -\- ¦ • •, m' < m. Ist nun m' noch ^ n, so können wir in B) A' an Stelle von A setzen und dieselbe Schlussweise wiederholen. So ergiebt sich eine Kette von Gleichungen: A — %- x™-n B = A', D) K B — A, A" — ^ x^"-"B = A"\ und diese Kette lässt sich so lange fortsetzen, bis der Grad der entstandenen Function kleiner als n geworden ist. Da nun in der Reihe der Functionen A, A', A" . . . der Grad jeder folgenden jnindestens um eine Einheit erniedrigt ist, so besteht die Kette der Gleichungen D) höchstens aus m — n -\- 1 Gliedern; sie kann aber auch weniger Glieder enthalten, wenn sich gleich- gleichzeitig mehrere Potenzen herausheben. Addiren wir die sämmt- lichen Gleichungen D), bezeichnen die letzte der Functionen A, A' . . . mit C und setzen zur Abkürzung E) Q=°f ^-»+!^'-»+...,
§. 3. Division. 31 so dass auch Q eine ganze rationale Function von x ist, so folgt F) A = QB + G. Die hier geschilderte Operation, durch die aus A, B die Functionen Q, G gefunden werden, heisst Division. A ist der Dividendus, B der Divisor, C der Rest und Q der Quo- Quotient. Der Grad des Restes ist immer niedriger als der Grad des Divisors. Die Coefficienten der Functionen Q und C sind aus den Coefficienten a und b durch Addition, Subtraction, Multiplication und Theilung zusammengesetzt. Im Nenner kommen aber nur Potenzen von b„ vor, und wenn also b0 = 1 ist, so sind die Coefficienten von Q und C ganze Functionen der a und b. Die höchste Potenz von bt), die im Nenner auftreten kann, ist die (m — n -\- l)te, da in der Kette D) in jeder folgenden Gleichung im Nenner einmal der Factor b0 hinzukommt. Es kann aber in besonderen Fällen die höchste Potenz von b0 in allen Nennern niedriger sein. Nehmen wir z. B. für A eine Function dritten Grades G) f(x) = «o«3 + «l«2 + «2^ + «3 und für B die sogenannte erste Derivirte von f(x), die vom zweiten Grade ist (8) /'(«) = 3 0,«» + 2 0!« + a2, so erhält man: c _ ßa0a2 — lal ^ 9a,«,- a^a% J . 9a0 •" 9a0 Wie man. die in den Gleichungen D) vorgeschriebene Rech- Rechnung zweckmässig anordnet, darf hier aus den Elementen als bekannt vorausgesetzt werden. Wir machen auf die Analogie aufmerksam, die zwischen dieser Rechnung und der Division im dekadischen Zahlsystem besteht. Eine Function fix) stellt eine dekadisch geschriebene Zahl dar, wenn die Coefficienten a0, Oj ... ganze Zahlen zwischen Null (einschliesslich) und 10 (ausschliesslich) sind, und x = 10 gesetzt wird. Lässt man in den Coefficienten auch Zahlen zu, die grösser als 10 sind, so kann man eine Zahl auf verschiedene Arten durch f(x) dar- darstellen. Man wendet dies bei dem Divisionsverfahren an, um auf
32 Erster Abschnitt. §. 4. die einfachste Weise in den Resultaten gebrochene und negative Coefficienten zu vermeiden. Ebenso wie man bei der Rechnung mit dekadischen Zahlen eine nicht aufgehende Division durch die Decimalbrüche fort- fortsetzen kann, so kann man auch bei der Division von Functionen die Rechnung noch weiter führen. Ist nämlich jetzt 9(x) eine Function mten Grades und/(#) eine Function #en Grades, wobei über die Grössenbeziehung von m und n nichts festgesetzt werden soll, so nehme man einen beliebig hohen Exponenten v, und wende die Regel der Division durch f{x) auf die Function xv<I>(x) an. ' Bezeichnet man einen Rest von höchstens (n — l)tem Grade mit <&„(¥), so ergiebt sich: A1) a?Q(x) —f(x) {cn-m-1x™-»+* + cn-mxm-n+*-1 -\ + c,^} + *,(*). Die Coefficienten c„_m_i, c„_m, cw_m+i . . . sind rational aus den Coefficienten von f(x) und <P (x) gebildet. Der Coeffi- cient cx ist von der Wahl von v unabhängig, sofern nur v > x ist. Denn wenn man in A1) f(x) = aox» + «i«»-1 -\ \- an ®(x) = b^x™ + b1xm~1 -) \- bm setzt, so erhält man zur successiven Berechnung der c„_m_x cn-m, cn-m+1 ... die Gleichungen floCn-m-l = ^0 ,, m «0 C„_m -(- «j Cn—m-\ = ^1 flo^ m + 1 ~y~ ®lCn—m ~\~ (^2^n — m—2 ==  und diese Kette von Gleichungen kann beliebig weit fortgesetzt werden, wobei die a, deren Index grösser als n, und die b, deren Index grösser als m ist, gleich Null zu setzen sind. §.4. Theilung durch eine lineare Function. Wir wollen die allgemeine Vorschrift für die Division noch auf einen besonderen Fall anwenden. Es sei der Dividend A) f(x) = aoxn + a^"-1 + a2«»-2 -\ \-a„ beliebig, dagegen der Divisor vom ersten Grade oder, wie man auch sagt, linear. Wir wollen auch den Coefficienten der ersten
§. 4. Division durch lineare Funotionen. 33 Potenz von x im Divisor = 1 voraussetzen und also den Divisor in der einfachen Form (x — a) annehmen, worin a beliebig bleibt. Der Quotient Q ist in diesem Falle vom (n — l)ten Grade und der Rest G vom Oten Grade, d. h. von x unabhängig. Setzen wir also B) /(*) = (x-a)Q + C, so enthält C die Variable x nicht mehr, und wenn wir C) Q = qox«-i + qLx"^ + ••• + qn-*x + gn_a setzen, so folgt aus B): D) f(x) = qox»^- ft«»-H h <ln und aus der Vergleichung mit A): E) F) Daraus erhält = «0 ¦— Oq m = aoa- 0.1 ¦ 0a q.n-1 C man 4- i 2 + — «3o — Mi — uqn-2 «On-l dt «1« + = «! — a2 = »n-l = an. «2 2 -) aM_a C entsteht aus /(ic), wenn man a; = « setzt, und kann also auch mit /(«) bezeichnet werden. Demnach haben wir auch die Formel G) /(^-/W^ v y a; •—• a *v y worin ^ (a;) eine ganze Furiction vom Grade w — 1 ist. Wenn wir in den Ausdrücken F) an Stelle der unbestimmten Grosse a das Zeichen x setzen, so entsteht daraus eine Reihe von ganzen rationalen Functionen von x, die wir, wenn wir der Einfachheit halber a0 = 1 setzen, so schreiben: Weber, Algebra. I.
34 ... Erster Abschnitt. '" §; 5; /o =1, ' ' ¦;¦¦; ;¦¦" /i = # + «i, (8) /a — tf2 + «^ + a2, Diese Functionen fo, fi • • • fn-i werden uns später noch gute Dienste leisten. Für jetzt fügen wir noch folgende Bemer- Bemerkungen bei. Man kann nach (8) die Potenzen 1, x, x2 . . . xn~1 von' x, linear ausdrücken durch die Functionen /0, fx . . . fn—i, und zwar so, dass in den Coefficienten nur ganze rationale Verbindungen der a vorkommen, z. B. 1 =/o, x = /i — «i/o, *2 =/2 — «1/1 + («i2 — «2)/o, und daraus folgt, dass man jede ganze rationale Function von;a;, deren Grad nicht grösser als n — 1 ist, gleichfalls linear durch /oi /ii • • -i fn—i ausdrücken kann in der Form (9) Wo +yifl-\ H Vn-lfn-l, worin die Coeficienten y0, yt . . . y„—i von x unabhängig sind. Ist also F(x) eine beliebige ganze rationale Function von x, so kann man nach §. 3, indem man f(x) als Divisor betrachtet A0) F(x) = Qf(x) + ,2/c/o + yj, -\ 1- yn-xfn-V setzen, worin auch Q eine ganze rationale Function von x ist. Zur recurrenten Berechnung der Functionen fv(x) ergiebt sich aus (8) die Eelation: ..,;'¦ ¦ A1) . fvip) — xfv-i(x) = ar. §. 5: Crebrochene Functionen; Theil-barkeit. Wenn F(x) und/(#) zwei ganze rationale :Functionen, von x sind, so heisst der Bruch ,. .. • {) • fix) ¦'¦- '" eine gebrochene rationale oder auch kurz gebrochene oder rationale Function von x.
§. 5. Theilbarkeit ganzer Functionen. 35 Ist der Grad des Zählers niedriger als der Grad des Nenners, so heisst die Function echt gebrochen, im entgegen- entgegengesetzten Falle unecht gebrochen. Nach §. 3 lassen sich die ganzen rationalen Functionen Q und <p(x) so bestimmen, dass B) F(x) = Qf(x) + cp(x), und der Grad von tp(x) kleiner als der Grad von f(x) ist; dem- demnach ist 7M 7W und daraus der Satz: Jede gebrochene Function kann in die Summe aus einer ganzen und einer echt gebrochenen Function zer- zerlegt werden. Ist n der Grad von f(x), so ist der Grad von q> (%) höchstens n — 1, er kann aber auch niedriger sein; insbesondere kann auch der Fall eintreten, dass q>(x) identisch verschwindet. Dann heisst die Function F(x) durch f(x) theilbar. Die Function F(x) ist in diesem Falle nur scheinbar gebrochen, in Wirklichkeit der ganzen Function Q gleich. Die Formel D) ± A — xm~x -\- xm~2 -f xm-3 -| 1-1 giebt hierfür ein einfaches Beispiel. Es ist dies die bekannte Formel für die Summe der geometrischen Progression 1 -)- x -\- #2 + • • • -f x™-1. Für die Heilbarkeit von Functionen gelten dieselben Ge- Gesetze, wie für die Theilbarkeit der Zahlen, insbesondere die folgenden: ' 1. Wenn die Function F(%) durch die Function f(x), f(x) durch eine dritte Function q>(x) theilbar ist, so ist auch F(x) durch <p(x) theilbar. Denn ist ' ¦ ¦. ¦ : F= Qf, ^ f=q9i _, , _ ..1 . \ worin Q und q ganze rationiale Functionen. sind, so¦ ist ,'.'.". : ;.' .:. ; F—Qq<p, - ;'.-.-; ..' - :: .:.! und da Q q eine ganze rationale Function ist, F durch q>> theilbar. 3*
36 Erster Abschnitt. §. 5. 2. Ist F(x) durch f(x) theilbar und Q eine beliebige ganze rationale Function, so ist auch QF(x) durch f(x) theilbar. 3. Ist F(x) und/(#) durch q> (x) theilbar, so ist auch F(x) +f(x) durch cp(x) theilbar, oder allgemeiner: 4. Sind jp7!, F2 . . . durch f(x) theilbar und Q„ Q2 . . . beliebige ganze rationale Functionen, so ist auch QiFi + Q3F2 + • • • durch f(x) theilbar. Der letzte Satz umfasst die beiden vorhergehenden und wird einfach so bewiesen. Sind Fu 1^ ... durch / theilbar, so kanu man die ganzen rationalen Functionen ©j, <P.2 . . . so bestimmen, dass F^VJ, . Fa = *,/... und folglich Q1F1 + ft-fi H = (öi®i + ft®2 H )/• Da nun Q1^>1 -\- Q^z -\- • • • eine ganze rationale Function ist, so ist der Satz bewiesen. 5. Jede Function ist durch sich selbst theilbar. In Bezug auf die Theilbarkeit oder Untheilbarkeit von Func-, tionen wird nichts geändert, wenn die Functionen mit beliebigen von x unabhängigen Factoren multiplicirt werden. Eine von x unabhängige, von Null verschiedene Grosse kann als Function nullten Grades aufgefasst werden. Nennen wir eine solche Grosse eine Constante, so können wir sagen: 6. Jede Function ist durch jede Constante theilbar. Wenn eine Function durch eine andere theilbar ist, so ist der Grad des Quotienten gleich der Differenz des Grades des Dividenden und des Grades des Divisors. Ersterer kann also nicht kleiner sein als letzterer. Sind die Grade gleich, so ist der Quotient eine Constante, und daraus folgt: . 7. Wenn von zwei ganzen rationalen Functionen gleichen Grades die eine durch die andere theilbar ist, so unterscheiden sie sich nur durch einen con- stanten Factor von einander, und es ist auch die zweite durch die erste theilbar. 8. Nach §. 4 ist die nothwendige und hinreichende Bedingung dafür, dass die Function f(x) durch die lineare Function x — a theilbar ist, die, dass /(«) = 0 sei
§. 6. Grösster gemeinschaftlicher Theiler. 37 §.6. Grösster gemeinschaftlicher Theiler. Es ist eine Aufgabe von fundamentaler Bedeutung, zu ent- entscheiden, ob zwei ganze rationale Functionen ausser den Con- stanten noch einen anderen gemeinschaftlichen Theiler haben. Man findet die Lösung durch den Algorithmus des grössten gemeinschaftlichen Theilers ganz in derselben Weise, wie die entsprechende Frage in Bezug auf die Theilbarkeit ganzer Zahlen beantwortet wird. (S. die Einleitung.) Es seien A) f(x) = 4 <p(x)=A' zwei gegebene Functionen; der Grad von <p (x) möge niedriger oder wenigstens nicht höher als der von f(x) sein. Wir dividiren A durch A' und bezeichnen den Rest, dessen Grad niedriger ist als der Grad von A', mit A", also: A = Q'A> + A"; nun dividiren wir A durch A' und bezeichnen den Eest mit A'", und fahren so fort in der Bildung der Functionenreihe: B) A, A\ A", A" . . ., deren Grade n, n', n", n'" . . . immer abnehmen und folglich nach einer endlichen Anzahl von Divisionen auf Null heruntergehen. Der letzte Rest vom Grade Null, der also eine Constante ist, sei AW. Dann haben wir die Kette der Gleichungen: A = Q'A' + A" A' = Q"A" + A" C) worin Aw eine Constante ist. Wenn nun A, A' irgend einen gemeinsamen Theiler haben, so ist dieser nach den Sätzen des vorigen Paragraphen, wie der Anblick der Gleichungen C) lehrt, auch Theiler von A", A'", A"" u. s. f. bis Am. Ist J.w eine von Null verschiedene Con- Constante, so kann also kein von x abhängiger Theiler von f(x) und cp(x) existiren. Solche Functionen heissen theiler fremd oder relativ prim. Man sagt auch, indem man nur die von %
38 Erster Abschnitt. §. 6. abhängigen Theiler berücksichtigt, die Functionen haben keinen gemeinsamen Theiler. Die Bedingung, dass die beiden Functionen einen gemein- gemeinsamen Theiler haben, ist also: D) ¦ Am = 0. In diesem Falle ist Ä(v~1) Theiler von A(v~2\ wie die letzte Gleichung C) zeigt, und nach der vorletzten dieser Gleichungen Theiler von A!y~S) u. s. f., also auch Theiler von A und A\ d. h. von f und cp. Und da umgekehrt jeder gemeinsame Theiler von A, A' auch Theiler von A("~1) ist, so heisst A(v~v der grösste gemeinsame Theiler von / und <p. Der Algorithmus C) zeigt, dass man Aw oder A(v~x) aus den Coefficienten von / und cp durch die rationalen Rechenoperationen ableiten kann, und zwar so, dass immer nur durch die Coefficienten der höchsten Potenzen von x in den Functionen A, A', A" . . ., die von Null verschieden sind, dividirt wird. Wir wollen diese Betrachtungen auf zwei Beispiele an- anwenden. Es seien zunächst: ,-v A = aox2 -j- a\x + «2 W B = bhX> + blX + b2 zwei Functionen zweiten Grades, also a0, i0 von Null ver- verschieden. . Der erste Schritt ist die Bildung der Gleichung "F) A = £b + C, worin • G) C =cox -f c„ ¦ und \°) Co v , Ci r Ist c0 = 0; also G constant, so haben A, B nur dann einen gemeinsamen Factor, wenn auch cx = 0 ist, und dann ist A durch B theilbar, d. h. A und B unterscheiden sich nur durch einen constanten Factor. Ist aber c0 von Null verschieden, so setzen wir die Rechnung fort, indem wir B = QC+D setzen, worin (nach §. 4, wenn dort « = — cx : c0 gesetzt wird)
§. 6. Quadratische, und cubische Functiou. 39 /q\ '. j\ Qq Q{ — fei co fr ~t o Ist D von Null verschieden, so sind A, B ohne gemein- gemeinschaftlichen Theiler. Ist aber D = 0, so ist 0 der grösste ge- gemeinschaftliche Theiler von A und B. Setzt man die Werthe c0, fr aus (8) in (9) ein, so erhält man mit Weglassung des Nenners boc^ die Bedingung für die Existenz eines gemeinsamen Theilers C von A und B in der Form A0) ao26| -\- «22&02 — 2«o«2&<A — ai«2&<A — a^^b^ -j- a0a2b? -(- c^&o&j = 0 oder A1) (ao62.— &o«2J + (»o&i — «i&o) («2&i — «1^2) = 0. • Diese Bedingung ist auch erfüllt, wenn c0 und cx gleich Null sind, und ist also die nothwendige und hinreichende Be- Bedingung dafür, dass A, B einen gemeinsamen Theiler haben. Die linke Seite von A0) oder A1) heisst die Kesultante der Functionen A und B. Als zweites Beispiel nehmen wir das schon im §. 3. gewählte. Setzen wir fi.X)= «0^3 + alX2 + «2^ + «3 = Ä /'(*) = 3ao^2 + 2% a; +a2 = J5, und setzen a0 von Null verschieden voraus, so haben wir nach §. 3: A3) ¦ A = QB + C, ' ; A4) 0 = c0* + Cii worin ' y 90» . ' Cl~ 9^ Wenn c0 gleich Null ist, so ist hiermit der Algorithmus schon geschlossen; wenn cx von Null verschieden ist, dann haben A und B keinen gemeinsamen; Theiler; ist aber cx auch gleich Null, so ist B selbst der grösste gemeinsame Theiler von A und B, d. h. A ist durch B theilbar. Die Bedingungen hierfür sind also: A6) _..-..- 3 ao.a? — «i2 =. 0, 9 a0a3 — a-^a^ = 0. Ist Co nicht gleich Null, so gehen wir einen Schritt weiter und setzen A7) . B =PC + D, worin, D constant wird und den.Ausdruck erhält: 3ct0C2
40 Erster Abschnitt. §: 6. Ist dieser Ausdruck von Null verschieden, so sind A und B theilerfremd, ist er gleich Null, so haben A und S den grössten gemeinschaftlichen Theiler G. Setzen wir für c0, q dieWerthe(lö) ein, lassen den Nenner weg, heben noch den von Null verschie- verschiedenen Factor 9a0 heraus und kehren das Vorzeichen um, so erhält diese Bedingung nach einfacher Kechnung die Gestalt: A9) a-fa/ -\- 18ao«i«2«3 — 4ao«23 — ^afcts — 27a02a32 = 0. Sie ist, wie man leicht durch Kechuung oder auch aus A8) sieht, auch dann erfüllt, wenn die Bedingungen A6) bestehen, und ist also die nothwendige und hinreichende Bedingung dafür, dass f(x) und f'(x) einen gemeinsamen Theiler haben. Die linke Seite von A9), die eine ganze rationale und homogene Function der Coefficienten von f{x) ist, heisst die Discrimi- nante der Function f(x). Wir leiten noch einen Satz aus dem Algorithmus C) her, der oft angewandt wird. Aus der ersten dieser Gleichungen folgt: B0) A" = A — Q'A\ und wenn man diesen Werth von A" in die folgende Gleichung einsetzt: A'" = A + Q'Q")Ä — Q"A also, wenn mit p, p' ganze rationale Functionen bezeichnet werden, B1) A'" = pA+ p'A'. Setzt man die Ausdrücke B0), B1) in die dritte Gleichung C) ein, so ergiebt sich für AI'" wieder ein Ausdruck von der Form B1) und so kann man fortfahren, und erhält schliesslich: B2) A(r) = P A -f- P'A', worin P, P' ganze rationale Functionen sind, deren Coefficienten durch rationale Kechenoperationen aus den Coefficienten von A und A' zusammengesetzt sind. Die Gleichung B2) bleibt richtig, wenn man P durch P — Q A' und P' durch P' -\- QA ersetzt, worin Q eine beliebige ganze Function von x ist. Sind nun n und n' die Grade von A und A', so kann man Q nach §. 3 so bestimmen, dass der Grad von P— QA' nicht grösser als ri — 1 wird, und dann folgt, da in B2) die höchsten Potenzen von x sich wegheben müssen, dass der Grad von P' -)- QA nicht höher als n — 2 sein kann.
§. 6. Producte linearer Functionen. 41 In der Formel B2) ist J.w eine Constante. Besonders wichtig ist dieser Satz in dem Falle, wo A^ von Null verschie- verschieden, also A, A' relativ prim sind. Setzen wir in diesem Falle P = A<r)F(x), F' = Am®(x), so können wir nach Weglassung des Factors A(v) dem Satze fol- folgenden Ausdruck geben: I. Sind f(x) und cp(x) zwei ganze Functionen ohne gemeinsamen Theiler von den Graden n und m, so kann man zwei andere ganze Functionen F(x) und # (x) bestimmen, deren Grade nicht höher als m—1 und n—1 sind, die der Gleichung B3) F(x)f(x) + 0(x)tp(x) = 1 identisch genügen. Der Satz lässt sich noch verallgemeinern. Multipliciren wir die Gleichung B3) mit einer beliebigen ganzen Function %(x), so folgt: B4) F(x) X (x)f(x) + $>(x)X (x) <p(x)^% (x), und nach §. 3 können wir B5) *(x)%(x) = QW(x) + 4>(x) setzen, so dass Q(x), 1>(%) ganze Functionen von x sind, und der Grad von if>(x) kleiner ist als der von f(x). Setzen wir dies in B4) ein und setzen an Stelle von F(x)%(x) -\- Q(x)q>(x) wieder F(x), so erhalten wir: F(x)f(x) + 9 («)*(«) = %{x). Wir können daher den vorigen Satz so verallgemeinern: II. Sind/(a;), q>(x), %(x) gegebene ganze rationale Functionen, und f(x) und <p (x) ohne gemein- gemeinsamen Theiler, so lassen sich die ganzen rationalen Functionen F(x), ip(x) und zwar il>(x) von niedrigerem Grade als fix) so bestimmen, dass die Gleichung B6) F(x)f (x) +1>(x)<p (x) = x (oo) identisch befriedigt ist. Producte linearer Factoren. Nach §. 1 erhalten wir durch Multiplication ganzer Func- Functionen ebensolche Functionen von höherem Grade, und zwar be-
42 Erster Abschnitt. §.7. stimmt sich der Grad des Productes durch die Summe: der Grade der einzelnen Factoren. Wenn wir also n lineare Factoren mit einander, multi- pliciren, so entsteht eine Function wten Grades, deren Bildungs- Bildungsweise wir etwas genauer untersuchen müssen. Wir wollen die linearen Factoren in der einfachen Form x — a15 x — «2, . . ., x — Kn annehmen, und setzen, da der Coefficient der höchsten Potenz = 1 ist, A) fix) = (x — aj (x — O . . . (x — O = #"-!-«! X" — 1 -f- Eine leichte Ueberlegung lässt folgendes Bildungsgesetz der Coefficienten aa, a2 . . . an erkennen: Es ist — üi gleich der Summe «, a2 gleich der Summe derProducte von je zweien der et,, — a3 die Summe der Pro- dücte von je dreien der «, allgemein (— 1)" av die Summe der Producte von je v der Grossen a, oder in Formeln ausgedrückt: ¦ ¦ " — a, = Eax «2 ^ '.¦-¦' ' ¦ : : (— Vf av = (— lfan:= Um aber noch deutlicher die Richtigkeit dieses Bildungs- Bildungsgesetzes einzusehen, bedient man sich der vollständigen In- duetioh. Man bestätigt die Richtigkeit zunächst in den ersten Fällen durch wirkliche Ausführung -der Multiplication (X- «x) (X «2) = X? Nehmen wir die Richtigkeit unseres Bildungsgesetzes bei n — 1 Factoren als bewiesen an und setzen: ix ~ ax) (x — «2) ... (x — «„_!) = z»-1 -\- a!Xn-2 + ••• a'n-x, so findet man durch Multiplication mit x — ccn:
§. 7. Producte linearer Faetoren. 43 a1 = a[ — «„ "«2 = «2 «n«l «3 = «3 «»«2 C) ........ «v = flv — nnav—i und daraus ist die Richtigkeit der Formeln B) unmittelbar er- ersichtlich. Es ist von Wichtigkeit, die Anzahl der Glieder zu bestim- bestimmen, die in jeder der Summen B) vorkommen. Wir bezeichnen die Anzahl derTerme, die in der Summe (—Vfav vorkommen, mit B^; es ist die Anzahl der Combinationen ohne Wiederholung von n Elementen zur vUn Classe (d. h. von je v verschiedenen der n Elemente). Um sie zu bestimmen, denke man sich zu- zunächst die Btüi Combinationen zur (y — l)ten Classe gebildet. Aus jeder dieser Combinationen kann man durch Hinzufügung je eines der fehlenden n — v -\- 1 Elemente n — v -j- 1 Combi- Combinationen zur vien Classe ableiten. Auf diese Art aber wird jede Combination frnal, nämlich durch Hinzufügung jedes ihrer Ele- Elemente gebildet, so dass man die Relation erhält, während B^ offenbar denWerth n. hat. Wenn man also die aus D) folgenden Gleichungen = n \ 2~~ multiplicirt, so folgt ,„, w.) _ n (n - 1) (n - 2) . .. (n - v +ü) (b) ±tv — 1.2.3...V Wir werden in der Folge oft, wenn m eine beliebige positive ganze Zahl ist, das Zeichen ' ¦ G) II (m\ =1.2.3.. . w, iT@) = 1 benutzen, so dass (8) II(m) = nll(m — 1).
44 Erster Abschnitt. §. 7. Mit Hülfe dieses Zeichens lässt sich der Ausdruck für _B(„n) übersichtlicher so darstellen: (9) Bv —H»-y-i2( der, wenn Bi"* = 1 gesetzt wird, auch noch für v = 0 und v = n gilt, und die Unveränderlichkeit von B^ bei der Vertauschung von v mit n — v erkennen lässt. Das Product II (m) wird auch die Facultät von m genannt und mit 1 . 2 . 3 . . . m = m\ bezeichnet. Die Ableitung der Formel D), die wir soeben nach den Vorschriften der Combinationslehre gegeben haben, ist zwar vollkommen richtig und einleuchtend, erfordert aber zur ge- genauen Begründung einige Ueberlegung, die sich nicht gut in kurze Worte fassen lässt. Wir wollen daher nachträglich noch durch das Mittel der vollständigen Induction die Richtigkeit beweisen. Die Formeln C) geben nämlich die folgenden Recursions- formeln: A0) Nun lässt sich die Formel F) für die ersten Werthe von n sehr leicht durch Abzählen bestätigen. Nimmt man sie für n — 1 als richtig an, so ergiebt A0): (B) 12 (w—1) 77 (w — 1) woraus nach (8) n(n) -n(v)n(n-vy und hierdurch ist die Allgemeingültigkeit der Formel (9) bewiesen. Aus der Bedeutung von B^ ergiebt sich, und wird auch aus den Formeln A0) durch vollständige Induction bewiesen, dass die B^ positive ganze Zahlen sind.
§. 8. Binomial-Coefficienten. 45 §.8. Der binomische Lehrsatz. Wenn wir in der Formel A) des vorigen Paragraphen die bisher willkürlichen Grossen «j, «2 . . . an einander gleich setzen, so erhalten wir den binomischen Lehrsatz, der in nichts Anderem besteht, als in der Ordnung der wten Potenz eines Binomiums x -f- y nach Potenzen von x. Wenn wir nämlich setzen, so ergiebt die Formel B) worin nach der Definition des vorigen Paragraphen B("} die An- Anzahl der Terme der Summe bedeutet, die alle einander gleich und gleich (— l)** yv werden. Demnach ergiebt sich oder entwickelt geschrieben: (x -\- y)n = x™ -|- nxn~1y -| ^—-^—^ xn~iy2 -{- • • • -\- y" die letzte Summe über alle nicht negativen ganzzahligen Werthe «, ß erstreckt, die der Bedingung a -f- ß = n genügen. Hiernach heissen die Coefticienten B^ die Binomial- coefficienten. Wir setzen der Uebersicht wegen eine kleine Tabelle der ersten Werthe der Binomialcoefficienten hierher: » = 1 1,1, n = 2 1, 2, 1, n = 3 1, 3, 3, 1, n = 4 1, 4, 6, .4, 1, «=5 1, 5, 10, 10, 5, 1, »= 6 1, 6, 15, 20, 15, 6, 1, »= 7 1, 7, 21, 35, 35, 21, 7, 1.
46 Erster Abschnitt. §. 8. Wir wollen unter den verschiedenen Eigenschaften der Bino- mialcoefficienten zwei ableiten, von denen wir nachher eine interessante Anwendung machen werden. Aus A) ergeben sich, wenn man x, y durch 1, x ersetzt, und n = 0, 1, 2, 3 . . . nimmt, die Formeln 1 -f x = B@1) -f B?x B) A + x)' = Bf -f Bfx + Bfx* A -f xy = B$> + B^x + B?>x>-\ Wir machen nun von der Summenformel der geometrischen Reihe Gebrauch: 1 + A + *) + A + x)» + ..: + A + xY = (-i + X) Uz die man aus §. o D) erhält, wenn man dort x durch 1 "—(— o? er- ersetzt. Entwickelt man hier wieder A -f- a;)M+1 nach der Bino- mialformel, indem man in der letzten Formel B) n in n + 1 verwandelt und. Bo>+1) = 1 setzt, so erhält man für die rechte Seite: C) A + *)n+1 - 1 = JJJ.+1) + Bin+i)x + . . . + 50.+«^. 00 ' ' ' Vergleicht man dies mit der Summe der rechten Seiten von B) und setzt den Vorschriften des §. 1 gemäss die Coefficienten. entsprechender Potenzen von x einander gleich, so folgt: -p(n) T>(n + 1) • . . -D» ' -— -En + 1 i oder allgemein - E) .BW _jl'.#'+» _| )-&?> = &&» ' W'enn man aber die Gleichungen B) der Reihe nach mit -t>0 5 -Dl ) -f- -L>2 , • • \± -D„ , inultiplicirt (wo das, obere Zeichen bei geradem, das untere bei ungeradem n gilt), so/ergiebt die;Summe,der linken Seiten nachA), Bf - B^ A -f x)~+ BV\l ¦•+ *J - • • -'± B(:\l +'¦«)« = [!-(!+ *)]- = (- *)»,
§. 9. Interpolation. 47 und die Gleichsetzung der Coefficienten gleich hoher Potenzen auf der rechten und linken Seite liefert das Formelsystem 0 = .BM0 — .BW + BfB{n) ± 0 = ± 1 = ± &?&?• Dies Formelsystem lässt sich in umgekehrter Reihenfolge mit Benutzung der Relation B^ = B("-v auch so darstellen: 1 = B^B^ 0 = B^B^ — Bfr-^B?* G) 0 = EPBP - Bf-^BP + B^-^B^ 0 = B^B^ - B^lfB?* + B(:z?B(? + B$>B(:i) oder auch in zusammenfassender Bezeichnung: (8) h (— XfB^-pB^ =1 ^ = 0 0,|« = 0 [i = 1, 2 . . . w. §.9. Interpolation. Wir wollen von den zuletzt gewonnenen Formeln eine An- Anwendung machen auf eine Aufgabe aus der Theorie der Inter- Interpolation. Es soll eine ganze rationale Function wten Gra- Grades bestimmt werden, die für n -j- 1 gegebene Werthe der Veränderlichen x vorgeschriebene Werthe hat. Es handelt sich also um die Bestimmung der n + 1 Coeffi- Coefficienten a0, «!,... an in A) . , f{x) = aox» -f- diX»—1 -f • • -On-xX + an aus den w -f- 1 Gleichungen B) - /(«) == ^o, /K) = ^ ... /K) == A, wenn a0, «j ... «n die gegebenen Werthe von *, und Ao, Ax ... An die entsprechenden Werthe von f{x) sind. Die Gleichungen B) sind ein System von Gleichungen ersten Grades für die Unbe- Unbekannten «o, «i,, • '._•¦> an, die sich im Allgemeinen durch Deter- Determinanten auflösen lassen, wie wir im nächsten Abschnitt sehen
48 Erster Abschnitt. §. 9 werden. Wir kommen später auf diese Aufgabe zurück, be- behandeln sie aber jetzt unter der besonderen Voraussetzung, dass die gegebenen Werthe von x die n -\- 1 ersten ganzen Zahlen 0, 1, 2, ... n seien. Die Binomialcoefficienten B^\ wie sie durch §. 7 F) definirt sind, behalten ihren guten Sinn, auch wenn n keine ganze Zahl ist, wie bisher vorausgesetzt war, sondern eine beliebige veränder- veränderliche Grosse. Es ist dann C) Bv - 1 . 2 . 3 . . . v eine ganze rationale Function vten Grades von x1). Der Coeffi- cient von xv ist von Null verschieden und daher kann auch xv ausgedrückt werden durch B^f1 und durch niedrigere Potenzen von x. Es lässt sich also auch jede ganze Function wten Grades fix) von x linear ausdrücken durch Bf\ B^ . . . B^ in der Form: D) f(x) = M0BP + MtB^ + • • • + MnBt\ worin ilf0, M1 ... Mn Constanten sind, und die Function fix) ist bestimmt, wenn diese Constanten bestimmt sind. Es sei nun nach unserer Voraussetzung/@),/(l),/B) .. •/(«) gegeben; da nach C) B^ immer verschwindet, wenn x einen der Werthe 0, 1, 2, ... v — 1 hat, so ergeben sich aus D) die fol- folgenden linearen Gleichungen für die Unbekannten M: /(O) = /(l) = E) Diese Gleichungen .sind nun in Bezug auf Jf0, Mx . . . M„ aufzulösen, was sehr leicht mit Hülfe der Schlussgleichungen (8) des vorigen Paragraphen geschieht. Die erste Gleichung E) er- giebt nämlich direct F)Mo x) Die Bedeutung dieser verallgemeinerten Binomialcoeffieienten für die EntwickelQng 4er Potenzen des Binoms gekört nicht Werner, sondern in die Analysis.
§. 10. Interpolationsproblem. 49 Multiplicirt man die erste Gleichung E) mit Bf\ die zweite mit — -Bix) und addirt, so erhält man nach dem erwähnten Formelsystem (auf n = 1 angewandt): und so allgemein, indem man die v ersten Gleichungen E) der Reihe nach mit B(J\ — BP, + B%> ¦ ¦ ¦ ± B? multiplicirt und addirt: wodurch nach D) die Function F(x) bestimmt und die Aufgabe gelöst ist. Es ist klar, dass, so lange wir über die Werthe /@), /(l), . . ./(«) keine besondere Voraussetzung machen, in dieser Form jede beliebige ganze rationale Function von x dargestellt werden kann. §. 10. Lösung des Interpolationsproblems durch die Differenzen. Die Definition der ganzen rationalen Function B^ m Rw — * Qc ~ 1) • • • fr — * + 1) K } " ~~ 1 . 2 . 3 ... v giebt die früher schon für den speciellen Fall eines ganzen positiven x bewiesene Relation: Daraus erhalten wir für die Coefncienten Mo, Mt . . . Mn eine Bestimmungsweise, die für die praktische Rechnung viel be- bequemer ist, als die Anwendung der Formeln des vorigen Para- Paragraphen. Es ist nämlich nach den Formeln D) und F), §. 9, und wenn wir darin x durch x -)- 1 ersetzen und die Differenz bilden, mit Rücksicht auf B) E) /ix = Mx -j- M^Bf* -\- M%B'ii -j- • • • -f- MnB(nLi, woraus sich ergiebt [da E) eine Gleidhung von derselben Art wie C) ist, nur dass n — 1 an Stelle von n getreten ist]: Weber, Algebra. I. a
50 Erster Abschnitt. M, = z/0 = /(l) - /@). 5. 11. Setzen wir F) ¦^x + 1 ^x — -^x i so wird also hiernach Mo = /@), 3/i = 4>, und die Formel C) ergiebt G) f(x) = /(o) + z/0 j^"' + ^0 5?) H h 4*)Ä"), und ebenso kann man die Functionen z/,,., z/^, z/^' . . . ausdrücken: = 4'o ...Mn = (8) Die z/,., J'm z/ä, • • • 4(" r) sind ganze rationale Functionen der Grade n — 1, n — 2, ... 0, die letzte von ihnen also con- stant. Um sie alle darzustellen, braucht man nur die Werthe /@), z/0, z/q, z/ö, . . . 40n~1\ die man am leichtesten berechnet, wenn man eine Tabelle anlegt, die für den Fall n = 3 z. B. folgende Form haben würde: /@) /(l) und, wenn die/@),/(l), . . . gegeben sind, durch einfache Sub- tractionen berechnet wird. §• 11. Arithmetische Reihen höherer Ordnung. Das Vorhergehende ist die Grundlage für die Theorie der arithmetischen Reihen höherer Ordnung. Wir bezeichnen mit A) t»0, «1, «2, «3, • • • ¦ irgend eine unendliche Reihe von Grossen und mit
§. 11. Arithmetische Reihen. 51 B) Jo = «! — Mo, J\ = M2 — «i, z/2 = % — M2 . . . die Reihe ihrer Differenzen, mit C) /r*=.Ax — Ao, z/i = 4, — A± . . . die Reihe ihrer zweiten Differenzen u. s. f. Es ist klar, dass die Reihe A) vollständig bestimmt ist, wenn ihr erstes Glied und die Reihe ihrer ersten Differenzen gegeben ist; denn es ist «1 = «0 + 4), «2 = «0 + ^0 + ^1 • • •> Mm = Mo + ^0 + ^1 + • • • + ^m-1- Ebenso ist die Reihe A) völlig bestimmt, wenn die beiden ersten Glieder und die Reihe ihrer zweiten Differenzen gegeben ist u. s. f. Die Reihe A) wird eine arithmetische Reihe wter Ordnung genannt, wenn die Reihe ihrer wten Diffe- Differenzen constant ist, also die Reihe der (w -j- l)ten Differenzen aus lauter Nullen besteht. Man erhält eine arithmetische Reihe wter Ordnung, wenn man in einer ganzen Function wten Grades f(x) für x die Zahlen 0, 1, 2, 3 ... einsetzt. Denn setzt man An-l) An —2) Än — H) so ist Jx vom (n — l)ten, A'x vom (n — 2)ten Grade in Bezug auf x, und also J^1^ constant. Ist nun Mo, Mj, M2 • • • eine arithmetische Reihe wter Ordnung, so ist die ganze Reihe vollständig bestimmt, wenn die n Werthe m0, Mi, m2 . . . m„_j und ausserdem die constante wte Differenz gegeben sind. Diese letztere ist aber bestimmt, wenn auch noch das (n -)- l)te Glied m„ gegeben ist. "Wir können also den Satz aussprechen: Eine arithmetische Reihe wter Ordnung ist voll- vollständig bestimmt, wenn ihre w -\- 1 ersten Glieder gegeben sind. Da nun eine Function f{x) vom wten Grade gleichfalls durch die willkürlich gegebenen Werthe 4*
52 Erster Abschnitt. §.11. völlig bestimmt ist, so folgt, dass aus den ganzen ratio- rationalen Functionen wten Grades f(x) alle arithmeti- arithmetischen Reihen nter Ordnung erzeugt werden, wenn man darin für x die Reihe der natürlichen Zahlen setzt. Der Ausdruck des allgemeinen Gliedes ist dann durch die Formel G) des vorigen Paragraphen gegeben. Die Summen der m -\- 1 ersten Glieder einer arithmetischen Reihe wter Ordnung bilden eine arithmetische Reihe (n -j- l)ter Ordnung, da ihre ersten Differenzen Sm-t-l Sm = Um + i eine arithmetische Reihe wter Ordnung bilden. Es lässt sich also mit Hülfe der Formel G) des §. 10 die Summe sm allgemein bestimmen, wenn man s0, sx . . . sn+1 als bekannt annimmt. Um die erzeugende Function F(x) von sm zu finden, wenn f(x) die erzeugende Function von um ist, setzt man und hat dann in der Formel G), §. 10: F(x) = F@) -f B0Bix) + D'0Bf -\ zu setzen: . D0 = -F(l)--F@)=/(l), D'o=/B) A = FB) - F(l) =/B), Di =/C) -/B) = So erhält man: F(x) =/@) +/A)-B?) + ^^ + 4-B?} H Nehmen wir z. B. /(«) = x2, so giebt uns j'(w) die Summe der m ersten Quadratzahlen. Es ist
§. 12. Der polynomische Lehrsatz. 53 also F(x) = x -f- 3 - ^ \~ 2 = ^—5 _ a;(a;4- 1) B a; + 1) ~~ 6 Für f(x) = xz ergiebt dieselbe Rechnung: Die Summe der m ersten Cuben ist also gleich dem Quadrat der wten Trigonalzahl. §• 12. Der polynomische Lehrsatz. Im §. 8 ist für den binomischen Lehrsatz die Form ab- abgeleitet : A) (X i yy _ jj(w) "V ^ , <2j JI(«) n (ß) ^ ,...„ in der sich die Summe auf alle Combinationen zweier Zahlen «, ß erstreckt, deren keine negativ ist und die der Bedingung B) « + ß = n genügen. Diese Form gestattet, zunächst durch Induction, eine Ver- Verallgemeinerung auf die »te Potenz eines Polynoms: mit der Bestimmung, dass «, ß, y . . . alle positiven oder ver- verschwindenden ganzzahligen Werthe durchlaufen, die der Be- Bedingung D) « + 0 + y + . • . = n genügen. Um aber die Eichtigkeit dieser Formel allgemein zu beweisen, nehmen wir an, sie sei bewiesen, wenn das Polynom ein Glied weniger enthält, wie sie es in der That ist, wenn das Polynom nur zwei Glieder enthält. Wir setzen dann E) . u = y-\-e-\ und wenden auf {x -\- u) die Formel A) an, aus der sich er- ergiebt :
54 Erster Abschnitt. §. 13. a>v XaUv F) (x + y + m +..•)•= ü(») ^ 77(WO7(,) mit der Beschränkung G) k -\- v = n. Nun ist aber nach der Annahme schon bewiesen: (8) * = n(v) V (9) /S + y H = v, und wenn dies in F) eingesetzt wird, so ergiebt sich unmittel- unmittelbar die Formel C), und G) geht in D) über. Die Coefficienten die ihrer Bedeutung nach ganze Zahlen sind, heissen die Poly- nomialcoefficienten. Beispielsweise erhält man für die dritte Potenz des Trinoms: A1) (X -\- y + ZY = «3 _|_ yZ _|_ g% _^_ %Xiy _|_ 3^^ -\-Sx20-\-Sx^-\-ßy2z-{-3yz2-\-6 xyz. Wenn » eine Primzahl ist, so hat in A0) der Zähler den Factor n, während der Nenner JT(a)J7(/3) JT(y) . . . den Factor n nur dann enthält, wenn eine der Zahlen «, ß, y . . . gleich n, die übrigen gleich Null sind. Es folgt hieraus, dass die Poly- nomialcoefncienten P«"^ . . . alle durch n theilbar sind, mit Ausnahme der Coefficienten von x", yn, z*, . . . die gleich 1 sind. Von diesem wichtigen Satze werden wir später häufig Ge- Gebrauch machen. §¦ 13. Derivirte Functionen. Es sei A) f(x) = aoxn + a^-1 + a2a;n-2 -| \- an eine ganze rationale Function »ter Ordnung. Wenn wir darin x durch ein Binom x -\- y ersetzen, so können wir auf jedes einzelne Glied den binomischen Lehrsatz anwenden, und können das Ergebniss nach fallenden oder nach steigenden Potenzen von x oder von y ordnen. Wir wollen die Ordnung nach steigenden Potenzen von y ausführen. Die höchste
§. 13. Derivirte Functionen. • 55 Potenz von y, die vorkommt, ist die wte, und der Coefficient der nullten Potenz von y ist dieFunction/(a?) selbst, wie man erkennt, wenn man y = 0 setzt. Wir setzen also, indem wir die anderen Coefficienten mit 1 W' JTB)' JZC) bezeichnen, B) /(* + y) = /(*) ^ ±4ö 0, n v ' Die Functionen /'(x), f"(x),/'"(x) . . . heissen die erste, zweite, dritte, . . . Derivirte oder Abgeleitete von f(x). Es sind ganze Functionen von x und ßv)(x) kann den Grad n — v nicht übersteigen, da die Summe der Exponenten von x und y in keinem Gliede den Grad n übersteigt. Die erste Derivirte, die also der Coefficient der ersten Potenz von y in der Entwickelung von/(a; -f- y) nach steigenden Potenzen von y ist, erhält man durch Anwen- Anwendung des binomischen Lehrsatzes auf A): C) f'(x) = na^x*-1 + (n — l)^"-2 + (n — 2)a2xn~3 -| Der Hauptsatz über die derivirten Functionen ergiebt sich aus B), wenn wir x in x -\- s oder y in y -\~ s verwandeln: J 2 tt 0,n ^ ' 0,n ^ ' Bezeichnen wir mit /**>¦"> (x) die (tte Derivirte von /W («), so ist nach B) E) /« (x + e) = 2 ^10^ 0,n —» und nach dem binomischen Satze: Setzen wir dies in D) ein, so folgt: G) Die letzte Summe ist über alle nicht negativen Zahlen ß, y zu erstrecken, deren Summe den Grad n von fix) nicht über
56 Erster Abschnitt. §. 13. steigt. Dieselben Zahlencombinationen durchlaufen aber auch die Exponenten v, {i auf der linken Seite, und die Vergleichung der Coefficienten gleicher Potenzen und Producte ergiebt (nach §. 1): also den Satz: Die (tte Derivirte von der vten Derivirten ist die (v -f- (t)te Derivirte der ursprünglichen Function. Man erhält also die sämmtlichen höheren Derivirten, indem man nach der Regel C) aus jeder vorangehenden die erste Deri- Derivirte bildet: /(*) = (9) /(*) = /' (x) = n (n —-1)UqX»-2 -|- (» — 1) (» — 2) i Eine etwas einfachere Form nehmen diese Derivirten an, wenn man sich einer anderen Bezeichnungsweise bedient, die häufig im Gebrauch und für gewisse Zwecke fast unentbehrlich ist, die wir im Anschluss hieran besprechen wollen. Es liegt wegen der Unbestimmtheit der Coefficienten «oi «i • . • «n offenbar keine Beschränkung darin, wenn wir eine ganze rationale Function »ten Grades so darstellen: A0) f(x) = aox» + JBfV«»-1 + B^a2xn-2 -\ \-an, oder ausführUch: A1) /(*) = aox» + »Oi«—i + ^-=^ a,x«-> -\ Wenn eine Function /(a;) so dargestellt ist, werden wir sagen, sie sei „mit den Binomialcoefficienten geschrieben". Grössere Uebereinstimmung zeigen hierdurch bereits die Formeln (9), die dann so lauten: f(x) = n(n1) + n »(» _ 2)aix»-*
§. 14. Derivirte eines Productes. 57 worin die rechten Seiten alle auch mit den Binomialcoefficienten geschrieben erscheinen. Wir werden später den Nutzen dieser Bezeichnungsweise noch weiter kennen lernen, müssen aber schon hier hervorheben, dass die Wahl der einen oder anderen Dar- Darstellungsweise doch nicht ganz gleichgültig ist, die erste oft auch den Vorzug verdient. Besonders in den Fällen, wo die Coefficienten Zahlen sind und es auf das zahlentheoretische Ver- Verhalten dieser Coefficienten ankommt, darf man nicht ausser Acht lassen, dass durch die Binomialcoefficienten ein der Sache fremdes numerisches Element eingeführt wird. Dass Gauss in der Theorie der quadratischen Formen (in den Disq. ar.) die Schreibweise mit den Binomialcoefficienten anwendet, wenn er die quadratischen Formen durch ax* -\- 2b xy -\- cy% darstellt, und dass diese Bezeichnung allgemein Eingang gefunden hat, hat in der Zahlentheorie zu einer unnöthigen und sehr bedauer- bedauerlichen Complication geführt. §. 14- Derivirte eines Productes. Die derivirten Functionen, die wir hier betrachtet haben, sind keine anderen als die aus der Differentialrechnung bekannten Differentialquotienten; wir haben den Begriff aber hier, wo es sich um ganze rationale Functionen handelt, ohne Anwendung der Infinitesimalrechnung gewonnen aus den Entwickelungscoeffi- cienten der Potenzen von y in derFunction/(a; -\- y). Bezeichnen wir die vte Ableitung von f{x) mit Dvf, so ist nach B), §. 13: und darans ergeben sich sofort die beiden Grundsätze, die sich in den Formeln B) Dv(Cf) = CDrf, C) D,(/ + y) = Dvf + D,v ausdrücken, worin C eine Constante, <p eine zweite ganze ratio- rationale Function von x ist. Eine Verallgemeinerung der Formel B) giebt die Darstellung der Derivirten des Productes ftp. Setzt man nämlich nach A) abkürzend
58 Erster Abschnitt. §. 14, f(x -\- y) = m0 -\- y ut -f- y2u2 -\- • • • yn un also D) q> (x -f- y) = v0 -f- yvx + t/2v2 -\ • ymvm, M so ergiebt die Ausführung der Multiplication der beiden Formeln D), wenn man in dem Product den Coefficienten von y" auf- aufsucht : F) n oder G) Dv [ftp) = tp Dvf + .#> X»v_x worin jBir), jB^v) ... die ßinomialcoefficienten sind. In ähnlicher Weise kann man unter Anwendung der Polynomialcoefficienten die Deriräten eines Productes von mehr als zwei Factoren bilden. Wir wollen die erste Derivirte, die wir jetzt mit D statt mit Dx bezeichnen, für ein Product von »Factoren danach bilden. Für zwei Factoren erhalten wir nach G): und allgemein, wenn wir die Factoren mit ttj, w2. • ¦ • M» i die Derivirten mit u[, «4 . ... u'n bezeichnen: (8) Z»(miM.2 ...u„) = U\U.2 . . . U„ -\- Mx«2 ...«» + '•• + oder kürzer: . . . u„) -^-i Duv . . . Un ^-* Uv Wenn wir also ein Product aus linearen Factoren (9) f(x) = (x — O (x — a2) . . . (x — «„) betrachten, so erhalten wir, da die ersten Derivirten von x — «L, x — c«2, . . . x — an sämmtlich gleich 1 sind, f'(x) == (x — «j) (x — a3) ....(* — «„) + (« — «i) (« — «3) . . . (X — «„) + (x — %) (« — k2) . . . (x — a„_i), wofür man auch setzen kann:
§. 15. Partialbrüche. 59 (ii) f{x) = X Ein sehr wichtiges Resultat ergiebt sich hieraus, wenn x gleich einem der Wertbe «l5 «2 . . . a„ gesetzt wird, nämlich /' («0 = («i — «2) («1 — «3) • • • («1 — ««) A2) /'W = (Ki ~ a^ (a* — cc-i) . . . («a — an) /'(«„) = (ccn — «,) («n — Oj) . . . (a„ — «„_!). §. 15. Partialbrüche. Die zuletzt abgeleiteten Formeln können dazu dienen, die in den Paragraphen 9 und 10 behandelte Interpolationsaufgabe in einer neuen Form zu lösen. Es habe/(a?) dieselbe Bedeutung wie oben, nämlich (!) f(x) = 0 — O (x — «2) • • • 0 — O, und «!, «2 . . . «n seien beliebige, jedoch von einander verschie- verschiedene Grossen. Wir setzen zur Abkürzung = (* - «2) (* - «.0 • • • (* - O B) /«(Ä) = /ZT^ = (» — «1) (* — «»)...(« — «») /»(*) ¦= ~^ = (* — «1) (*-«,)...(*- «•-1), so dass nach den Formeln A2) des vorigen Paragraphen/x («^ —/'(ai)> /i(a2) = 0, ebenso allgemein, wenn (i und v ver- verschiedene der Indices 1, 2 ...» sind: C) /,(«,)=/'(«,), /,(«^) = 0. Wenn nun Au A2, . . . An ein System gegebener Grossen ist, so hat die ganze Function (n — l)ten Grades wegen C) die Eigenschaft, für x = av in Av überzugehen, und es ist also eine ganze Function (n — l)ten Grades q>(x) dar- dargestellt, die für n Werthe von x gegebene Werthe annimmt, wie
60 Erster Abschnitt. §. 15. in §. 9. Für besondere Werthe der Av und «v kann der Grad von <p (x) auch noch niedriger werden. Die Formel D) ist die Interpolationsformel von Lagrange. Sie lässt sich nach B) auch so darstellen: ¦ | 9 K) und hierin kann <p(%) jede beliebige ganze Function (n — l)ten oder auch niedrigeren Grades bedeuten. Ist <D(x) eine Function von höherem als (n — l)ten Grade, so kann man nach §. 3: F) ®G*) = G/(*) + v(*) setzen, worin Q eine ganze Function und q>(x) höchstens vom (n — l)ten Grade ist Zugleich ist aber wegen A) G) und folglich /O) ~ v ^ /' («i) (*—«i) ^ /' K) 0 - «2) ^ ^/'(*„) (X-Vn) Durch diese Formel ist der Bruch &(x):f(x) in eine Summe aus einer ganzen Function Q und aus Brüchen mit constantem Zähler und linearem Nenner zerlegt. Diese Brüche heissen die Partialbrüche der gebrochenen Function <D(x) -f(x). Sie spielen bekanntlich eine wichtige Rolle in der Integralrechnung. Wir leiten aus diesen Resultaten noch einige Folgerungen ab: Setzen wir q>(x) = xm+1, so bleibt die Formel E) anwend- anwendbar, wenn m<^n — 1 ist. Setzen wir voraus, dass von den Grossen «l5 «2, ...,«„ keine verschwindet, so wird die linke Seite von E) gleich Null für x = 0, und wir erhalten den Satz: m = 0,l, % ... n — 2. Für 3> (x) = xn kann die Formel (8) angewandt werden, in der sich Q = 1 ergiebt, und es folgt: »—1 «—2 n—1 ^1"*i_ . . . 1 ^2 — 1 Die Formeln (9) und A0) gelten auch dann noch, wenn
§. 15. • Partialbrüche. 61 eine der Grossen « verschwindet. Dies ist ohne Weiteres klar, wenn m ;> 0 ist. Aber auch für m — 0 ergiebt sich (9) in diesem Falle aus der Formel E), die für q>(x) = x, «x = 0 so lautet: x «2 . | an f'(x) - (* —O/>2) "i r (x _««,,)/'(«,,)' was für x = 0 wieder die Formel (9) ergiebt. Wir haben bei diesen Betrachtungen ausdrücklich ange- angenommen, dass die Grossen «l5 «2, . . ., «„ von einander ver- verschieden sind; anderenfalls würden einige der Grossen /' (<%), /'(a2), . . ., /'(«„) verschwinden. Verstehen wir aber allge- allgemeiner unter f(x) ein Product aus Potenzen von einander ver- verschiedener Linearfactoren der Form x — «, und unter &(x) eine beliebige ganze Function, so lässt sich auch jetzt noch die ge- gebrochene Function &(x) : f(x) in .eine ganze Function und eine Summe von Partialbrüchen zerlegen, wenn wir allge- allgemeiner unter Partialbrüchen Brüche verstehen, die einen constanten Zähler und eine Potenz des Binoms (x — «) im Nenner enthalten. Um dies durch vollständige Induction nachzuweisen, setzen wir A1) /(*) = (* —«)a/i(«) und verstehen unter fx (x) ein Product aus Potenzen von Linear- Linearfactoren, unter denen x — « nicht mehr vorkommt. Nun lässt sich nach §. 5 die Constante A so bestimmen, dass A2) 0 (x) — Afx (x) = (x — «) 0, (x) durch (x — «) theilbar wird. Es ist nur a — #(a) zu setzen, und dann ergiebt sich aus A1) und A2): f f(x) {x-ayf^a)^ {x-ay-\fx{xy Auf den zweiten Bruch auf der rechten Seite dieser Formel, der den Factor (x — «) einmal weniger im Nenner enthält, als der ursprünglich gegebene Bruch (&(#) :f(x), lässt sich dasselbe Verfahren wieder anwenden, und damit kann man so lange fortfahren, bis die gewünschte Darstellung durch Partialbrüche erreicht ist.
62 . Erster Abschnitt. §. 16. §• 16. Entwickelung einer gebrochenen Function nach fallenden Potenzen der Variablen. Wir haben im §. 3 für einen beliebigen positiven Expo- Exponenten v die Formel abgeleitet: A) a?Q(x) worin /, (Z>, <bv ganze Functionen von x der Grade n, m, n — 1 waren, und worin die c und ebenso die Coefficienten von (Z>1 rational aus denen von / und von <Z> abgeleitet sind. Dividirt man diese Formel durch xvf(x), so folgt: B) j±-± = C„^m-1Xm~n -f Cn-mZ™-"-1 + ... + Cv_x , + _. De,r. ins Unbestimmte fortgesetzte Theil dieses Ausdrucks C) C-m-l r»-» + Cn_m X'»-»-1 -) heisst die Entwickelung des Bruches #(«):/(«) nach fal- fallenden Potenzen von x und die c,- die Entwickelungscoeffi- cienten. Das weggelassene Glied x~*<&v(x) : f(x) heisst der Rest. Mit welchem Rechte man unter Umständen die Entwicke- Entwickelung für die Function selbst setzen kann, ist eine Frage, die in die Analysis gehört, auf die wir hier nicht einzugehen brauchen. Wenn 0(x) : f(x) eine echt gebrochene Function ist, so enthält die Entwickelung nach fallenden Potenzen nur negative Exponenten von x. Ist aber (& : / unecht gebrochen, so scheidet sich noch eine ganze Function oder eine Constante ab. Der Theil mit negativen Potenzen X """ X'i "T" X\ "^ ' ' ' ist der wichtigste. Er ist für alle Functionen (& derselbe, die bei der Theilung durch f denselben Rest geben. Die Entwickelung B) ist in dem Sinne eindeutig bestimmt, dass, wenn wir einen Ausdruck von der Form annehmen:
§. 16. Entwickelung einer gebrochenen Function etc. 63 y±) ,, T" Wi — m — l <*¦ T^ yn—m <*¦ und nur voraussetzen, dass in der gebrochenen Function £1 der Grad des Nenners höher sei als der Grad des Zählers, dann nothwendig ,,, , n &(x) E) « = «, a = ±f sein muss. Es folgt nämlich zunächst aus der Annahme D) durch Multiplication mit xvf(x), dass £lf(x) eine ganze Function von x ist, deren Grad also nach unserer Annahme höchstens = n — 1 ist, und dann werden die c'i durch Vergleichung mit der Formel A) den a gleich gefunden, was dann für Sl den Aus- Ausdruck E) nach sich zieht. Daraus folgt weiter, dass man die Entwickelungscoefficienten für die Summe von zwei oder mehr gebrochenen Functionen er- erhält, wenn man die entsprechenden Coefficienten der einzelnen Summanden addirt, und dass man die Entwickelung eines Pro- ductes zweier Functionen dadurch bilden kann, dass man hin- hinlänglich weit fortgesetzte Stücke der Entwickelungen der ein- einzelnen Factoren mit einander multiplicirt, und das Ergebniss wieder nach absteigenden Potenzen der Variablen ordnet. Hier- Hierbei kann man einfach die Regel der Multiplication (§. 1) auf ganze Functionen von 1 : x anwenden. Für den einfachen Bruch 1 X — K ergiebt sich die Entwickelung 1 + ^. + ^ + ^! + .. X ~ X'2~ X* ~^X* ¦ ' wie man leicht aus §. 3, A2) findet, und daraus, wenn man einen nach §. 15, (8) in Partialbrüche zerlegten Bruch hat: | r/'( für die Coefficienten c0, cu c2 • • • die folgenden Ausdrücke: worin sich das Summenzeichen auf «j, cc3, ...,«„ erstreckt.
64 Erster Abschnitt. §. 17. Nehmen wir insbesondere 0 (x) = f (x) an, so werden die Grossen c0) cl5 c2 • • • identisch mit den Summen der Potenz der k: F) c0 = n, d = 2 Ki, C2 = 2 af, . . . §. 17. Ganze Functionen mehrerer Veränderlichen: Formen. Wir haben bisher vorzugsweise die ganzen rationalen Func- Functionen von einer Veränderlichen betrachtet; wir können uns aber nicht immer darauf beschränken und haben ja auch schon oben Functionen mehrerer Veränderlichen benutzt. Unter einer ganzen rationalen Function nten Grades mehrerer Veränderlichen F(x, y, 0, . . .) verstehen wir eine Summe von Gliedern: ß worin k, ß, y . . . ganzzahlige, nicht negative Exponenten sind, deren Summe u -f- ß -f- y -(-.... den Werth n nicht übersteigt, und wenigstens in einem Gliede auch wirklich erreicht. Der Grad wird also bestimmt durch den grössten Werth, den die Summe a -f- ß -\- y -}-••• annimmt. Die J.«,ß,Y... -können be- beliebige Grossen darstellen und heissen die Coefficienten. Wenn die Summe der Exponenten a -f- ß -f- y -f- • • • in allen Gliedern denselben Werth hat, so heisst die Function homogen. Eine fundamentale Eigenschaft der homogenen Func- Functionen wten Grades ist die, dass, wenn alle Va- Variablen mit demselben Factor vervielfältigt wer- werden, der Erfolg derselbe ist, wie wenn die Function mit der wten Potenz vervielfältigt wird; in Zeichen, wenn t eine beliebige Veränderliche bedeutet: A) F(tx, ty, ts ...) = t«F{x, y,e...)\ denn ersetzt man in dem Product x" y? zy . . ¦ die Variablen durch tx, ty, tz, . . ., so erhält es den Factor ta + fl + y + •••. hat nun a -\- ß -\- y -\- ¦ • • in allen Gliedern denselben Werth n, so kann der Factor tn vor die Summe F herausgenommen werden. Hat aber die Summe cc -f- ß -\- y -f- • - • in den ein- einzelnen Gliedern verschiedene Werthe, so kann ein solcher ge- gemeinschaftlicher Factor nicht herausgenommen werden, wenig-
§. 17. Formen. 65 stens nicht, ohne dass noch verschiedene Potenzen von t in den einzelnen Gliedern bleiben. Durch Vermehrung der Veränderlichen kann man jede nicht homogene Function in eine homogene von gleichem Grade verwandeln. Ist nämlich m — 1 die Anzahl der Variablen in einer nicht homogenen Function wten Grades, so setzen wir und erhalten in n -p fx± 3-2 #3 eine ganze homogene Function wten Grades der Variablen xx, x2 ¦ . . Xm, die wir mit y^it ^2 • • • ^tn) bezeichnen. Es empfiehlt sich bisweilen, die homogenen Functionen meh- mehrerer Variablen mit den Polynomialcoefficienten zu schreiben. Wir setzen daher B) O(x x x ) ^ n(n) . a a (a2) . ..n{ccm) JLa»"'---am x^ ^¦¦¦xm wo sich die Summe auf alle nicht negativen, der Bedingung C) % -4- cc2 -\- ¦ • • -(- am = m genügenden Zahlen erstreckt. Diese Bezeichnungsweise, ohne die Beschränkung C), ist auch auf nicht homogene Functionen an- anwendbar. Man kann aber die homogene Function auch so darstellen: D) 0 fa, X2 . . . Xm) = Z ÄVu »s . . . *„ Xn XH . . . Xv worin jeder der Indices vt, v2 . . . vn von den übrigen unabhängig die Werthreihe 1, 2 . . . m zu durchlaufen hat. Die Summe D) besteht also aus mn Gliedern, die aber nicht alle von einander verschieden sind. Das Product xVl %vt... %vn bleibt nämlich un- geäudert, wenn die Indices vu v2 . . . vn beliebig unter einander permutirt werden. Die Anzahl der Permutationen von n Ele- Elementen beträgt aber II (n). Sind unter diesen Elementen je Weber, Algebra. L 5
66 Erster Abschnitt. §. 17. «!, «2 . . . einander gleich, so reducirt sich die Zahl der Permu- Permutationen auf woraus sich ergiebt, dass in D) irgend ein Product x^xl*... genau mal vorkommt. Setzt man also noch fest, dass AVlt ,.„...» sich nicht ändern soll, wenn die Indices beliebig permutirt werden, so erweisen sich die Bezeichnungsweisen B) und D) als iden- identisch, wenn durch Zusammenfassen gleicher Factoren XVl Xr, . . . Xyn = X? X\* . . . 0T«m und gesetzt wird. Bezeichnen wir die Anzahl der Glieder, die in der Function 0 [nach B)] auftreten, mit (m, »), so findet man, indem man zu- zunächst die Glieder zählt, die den Factor xx haben und dann die übrigen, die eine homogene Function wter Ordnung von den übrigen m — 1 Variablen bilden, die ßecursionsformel: E) (*», n) = (m, n ~ 1) + (m — 1, »), mit deren Hülfe man durch vollständige Induction den Ausdruck: (e>\ (m m\ — m (w + 1) • • • 0" + " — 1) _ J7 (m + n — 1) der sowohl für n = 1 als für m = 1 richtig ist, als allgemein gültig erkennt. Die ganzen homogenen Functionen werden auch Formen genannt. Man unterscheidet nach der Anzahl der Variablen unäre (einfache Potenzen), binäre, ternäre, quaternäre Formen. Die binären Formen sind es, die uns hier besonders interessiren, deren Theorie im Wesentlichen identisch ist mit der Theorie der ganzen rationalen Functionen einer Veränder- Veränderlichen. Man gelangt von den binären Formen zu diesen Func- Functionen zurück, wenn man eine der homogenen Variablen als con- stant ansieht, z. B. ihr den Werth 1 giebt.
§• 18. .Rationale Functionen. 67 §• 18. Die Derivirten von Functionen mehrerer Variablen. Wir haben im §. 13 die derivirten Functionen einer ganzen rationalen Function einer Veränderlichen definirt. Der Begriff lässt sich unmittelbar übertragen auf Functiouen mehrerer Variablen, indem man die Ableitungen in Bezug auf jede Variable für sich, als ob sie die einzige wäre, bildet. So erhält man, wenn man etwa wie in §. 17 A) F(x, y,z...) = SA setzt, die' erste Derivirte nach x: B) F' (x) = oder nach y: C) F'(sf) u. s. f. Aus diesen Functionen kann man nach denselben Regeln wieder die Ableitungen nach den verschiedenen Variablen bilden und erhält so die höheren Ableitungen. Um die Resultate übersichtlicher darzustellen, sei 3> (xa, x2... xm) eine ganze rationale Function wter Ordnung der m Veränderlichen Xi, x2 . . . xm. Wir ersetzen diese Veränderlichen durch Binome: X\ -\~ |i, X2 -\~ g2v • • •» xm ~T Sm und entwickeln in jedem Gliede der Function *(«1 + In «2 + l2, • • ••> ^m + im) = $(X -f i) durch Ausführung der Multiplication (X, + Ix)«' (X2 + &)«. . . . (Xm + Infm nach Potenzen von li, & • • • im- Fassen wir gleiche Potenzen und Producte der Variablen £ je in ein Glied zusammen, so ergiebt sich in der Bezeichnung B) §. 17 für &(x -\- |) eine Darstellung, die in der Differentialrechnung die Taylor'sehe Entwickelung heisst: D; Die Coe'fficienten, die wir mit bezeichnen, sind Functionen der Variablen x und heissen, wenn 5*
68 Erster Abschnitt. §. 18. Ki —1~ oea —|— - - • —J— Km = v ist, die Derivirten vter Ordnung der Function (P. Man stellt sie auch nach der in der Differentialrechnung gebräuchlichen Bezeichnungsweise so dar: E) #»i,«....«„® = 0a; Das Bildungsgesetz der Derivirten lässt sich in folgende Sätze zusammenfassen, wobei wir der Kürze wegen die Indices bei dem Zeichen D weglassen. I. Ist G eine Constante, so ist = CD®. II. Sind 0 und *P" irgend zwei Functionen, so ist I)(® -\--W).*= D0 -f DW. Beides folgt unmittelbar aus D). Wir können also leicht die derivirten Functionen allgemein bilden, wenn wir sie für den specieilen Fall kennen, in dem <P ein Product von Potenzen ist, also wenn wir kennen, worin die (x beliebige, nicht negative Exponenten sind. Nun ist aber und folglich: F) fc + I0 • • • (a» + und es ergiebt also die Vergleichung mit D) und F): G) T) (VUl r1*™) \' J J-'al ...am \ß>i . • • %m ) ! so lange «j ^ f<j . . . am ^ [im. Dagegen ist sobald einer der Indices cc grösser ist als der entsprechende Exponent (i.
§. 18. Rationale Functionen. 69 Bezeichnen wir nun mit ßi, ßa . . . ßm ein zweites System von Indices, und bilden von der Function G) die Ableitung Jjflu |js... ßm, so ergiebt sich durch nochmalige Anwendung der- derselben Formeln G) und (8): (9) 2>A...^^...^(^..a^) = 2>A + a1.../jw + ^D1...aÄ"), und daraus folgt nach II. die allgemeine Gültigkeit des Satzes: HL ^1,...ßmDa1,...am^ = I)ßl + ai,...ßm + amO>, was eine Verallgemeinerung des Satzes (8), §.13 ist, und man kann also die höheren Derivirten durch fortgesetzte Ableitung der niederen bilden. Für die ersten Derivirten einer Function <Z> A, 0 . . . 0 #, Do, 1 ... 0 #, ... -Do, 0 ... 1 0 brauchen wir auch die kürzeren Zeichen &'(xj, & (x3), . . . & (xm), ebenso für die zweiten Dit 0 ... 0, Dl, 1 ... 0, . . die Zeichen 0" (x„ Xl\ 0" fo, x,) = 9" («,, x,), . . . Auch diese Bezeichnung lässt sich verallgemeinern nnd würde zu einem der Formel D), §. 17 entsprechenden Ausdruck führen. Alles dies behält seine Gültigkeit, mag die Function 0 homogen sein oder nicht. Wir erwähnen des häufigen Gebrauches wegen die Formeln für die quadratischen Formen besonders. Setzen wir A0) ®(x) = 2aitlcscixk, worin i, To von einander unabhängig die Reihe der Zahlen 1, 2 . . . m durchlaufen und a^ Ä = a^ i ist, so ist Va#'(*i) = <h, i X\ + «i, 2 «2 H V «i, mXm A1) Va &' («2) = «2, 1 «1 + «2, 2 «2 + • • • + «2, m«m 1/2 ©'(iCm) = «m, 1^1 + «m, 2^2 + • • • + «in,».*«., und wir setzen noch A2) 9(x, i) = 0A 7) = Sii0'(xt) = Dann ist A3) 0(x-j-g) = 0 [x) -
70 Erster Abschnitt. §. 19. Die Function <&(#,•£) wird die Polare von 9 genannt. Sie ist linear und homogen sowohl in Beziehung auf die x, wie in Beziehung auf die £. ¦ Sie kann ausgedrückt werden durch A4) Q>(x,£) = 2Zaile!iixle und genügt der Bedingung A5) ®(x,x) = 2®(x). §. 19. Das Euler'sche Theorem über homogene Functionen. Aus den vorstehenden Entwickelungen lässt sich mit Leich- Leichtigkeit ein Fundamentalsatz über- homogene Functionen her- herleiten, der von Euler entdeckt und nach ihm benannt ist. Wir erhalten ihn am einfachsten aus der Formel D) des vorigen Paragraphen, wenn wir darin 3>.als homogene Function annehmen. Ist dann t eine beliebige Veränderliche und A) & = txu ga = tx2 . . ., gm = txm, so ergiebt die Fundamentalformel §. 17 A) für die homogenen Functionen Wendet man auf der linken Seite von B) den binomischen Satz an, und setzt dann die Coefficienten gleich hoher Potenzen von t beiderseits einander gleich, so ergiebt sich für jedes v = 1, 2 ... n: a = 2 worin sich die Summe auf alle der Bedingung D) «l+«2"j (- K* = V genügenden Werthsysteme der a erstreckt. In dieser Form ist das zu erweisende Theorem in seiner Allgemeinheit enthalten. Für den besonderen Fall v = 1 erhalten wir die Formel E) n^{xx, x2 . . . xm) =.x1
§. 20. Zerlegbare und unzerlegbare Functionen. 71 wovon die Formel A5) des vorigen Paragraphen ein specieller Fall ist, und für v = 2: F) n(n — 1) <&(*!, %2 ¦ . . xm) = E xt xh 0" (#f, «*,), worin die Summe von i = 1 bis * = m und von 1c = 1 bis i = m zu erstrecken ist, so dass jedes Glied mit ungleichen i, 1c zweimal in der Summe auftritt. Setzen wir, wenn die cc der Bedingung D) unterworfen sind G) &v(£, x) = 2j so ist nach D) des §. 18: (8) 9(x + i) = ®{x) + 0t (x,® + *,(«,ö H (- 04^,1), und da die linke Seite ungeändert bleibt, wenn a; mit § ver- vertauscht wird, so ergiebt sich die Relation: (9) $«-* (x, 8 = 0, (& «), also insbesondere A0) ®.(«,«) = ®(ö. Die Function #„ (x, |) wird, als Function von x betrachtet, die vte Polare der Function 0 für das Werthsystem § genannt. Wir wollen die Formel C) noch für den Fall einer binären Form (m = 2) specialisiren. Wir bezeichnen die Variablen mit x, y und setzen zur Abkürzung 0 {x, y) = u, I)hi r_a 0 =f uh und erhalten aus D) vX) n{n-v) ff n(h)ii(v - h) UhX y ' worin v jeden beliebigen Werth, der nicht grösser als n ist, annehmen kann. ¦ ¦ " §.20. Zerlegbare und unzerlegbare Functionen. I ' Das Product von ganzen Functioneu ist wieder eine ganze Function, die, wenn die Factören von Null verschieden sind, selbst von Null verschieden ist (§. 2), und deren Grad gleich
72 Erster Abschnitt. §..20. der Summe der Grade der Factoren ist. Dies ist zunächst evi- evident, wenn die Factoren, und folglich auch das Product, homo- homogene Functionen sind, und es folgt dann allgemein aus der Bemerkung, dass sich jede nicht homogene ganze Function in eine Summe von homogenen Functionen verschiedener Grade zer- zerlegen lässt, deren höchster den Grad der Function bestimmt. Wir haben nun unter den ganzen Functionen. solche zu unterscheiden, die als Producte von zwei oder mehr ganzen Functionen, deren keine vom nullten Grade (also constant) ist, dargestellt werden können, und solche, bei denen dies nicht mög- möglich ist. Die ersten heissen zerlegbar, die anderen unzer- unzerlegbar. Wenn eine ganze Function zerlegbar ist, so ist der Grad . jedes der Factoren niedriger als der Grad der Function selbst. Eine lineare Function ist also immer unzerlegbar, und jede ganze Function lässt sich in eine endliche Zahl unzer- unzerlegbarer Factoren zerlegen. Wir nennen eine ganze Function W durch eine andere w theilbar, wenn eine dritte ganze Function (oder auch eine Con- stante) w' existirt, so dass W =. ww' ist. Daraus folgt dann, dass, wenn U eine durch w theilbare und V eine beliebige ganze Function ist, auch das Product UV durch w theilbar ist, und dass, wenn U, U', U" . . . durch w theilbare, F, F', V" . . . beliebige ganze rationale Functionen sind, auch UV-\- U'V -f TJ"V" -| durch w theilbar ist. Ist W durch w theilbar, so sagt man auch, w geht in W auf. Zwei ganze rationale Functionen U V, die nicht durch eine und dieselbe ganze rationale Function theilbar sind, heissen relativ prim oder theilerfremd. Wir beweisen den Satz: I. Sind ü, F, v ganze Functionen irgend welcher Veränderlichen, sind U und v relativ prim und UV durch v theilbar, so ist F durch v theilbar. Dieser Satz entspricht genau einem bekannten Fundamental- satz aus der Lehre vou den ganzen Zahlen, dass nämlich, wenn ein Product von zwei ganzen Zahlen durch eine dritte ganze
§. 20. Zerlegbare und unzerlegbare Fuuctionen. 73 Zahl theilbar ist, die zu dem einen Factor theilerfremd ist, der andere Factor durch diese Zahl theilbar sein muss. Wir beweisen ihn durch vollständige Iiiduction. Sind U,Vv nur von einer Veränderlichen x abhängig, so ist der Satz richtig; denn nach §. 6 (Satz I) kann man in diesem Falle, wenn U und v relativ prim sind, zwei andere ganze Functionen P und j) von x so bestimmen, dass woraus durch Multiplication mit V p u.r + pVv = v folgt, und daraus ersieht man, dass, wenn UV durch v theilbar ist, auch V durch v theilbar sein muss. Wir nehmen also an, der Satz, den wir beweisen wollen, sei für Functionen von n und weniger Veränderlichen bewiesen, und wir leiten daraus seine Richtigkeit für Functionen von n -J- 1 Veränderlichen ab. Dazu ist erforderlich, dass wir aus dein als richtig voraus- vorausgesetzten Theorem I. einige Folgerungen ziehen, als deren Schluss sich dann die Gültigkeit des Theorems für die nächst höhere Variablenzahl ergiebt. Ist v eine unzerlegbare Function, so ist eine andere Fuuc- tion U derselben Veränderlichen entweder relativ prim zu v oder durch v theilbar. Daraus folgt nach I., dass ein Product von zwei Functionen JJV nur dann durch v theilbar sein kann, wenn einer der beiden Factoren durch v theilbar ist. Dasselbe gilt für ein Product von mehreren Functionen, und so folgt aus I. das Theorem: IL Ein Product aus mehreren ganzen Functionen ist nur dann durch eine unzerlegbare Function v theilbar, wenn wenigstens einer der Factoren des Productes durch v theilbar ist. Wenn eine ganze rationale Function U auf zwei Arten in unzerlegbare Factoren zerlegt ist, [/¦= vv'v" ¦ • • = ww'w" . . ., so muss nach II. wenigstens einer der Factoren v, v', v" . . . durch w theilbar sein, also etwa v. Dann aber kann, da auch v unzerlegbar ist, v von w nur durch einen constanten Factor verschieden sein.
74 Erster Abschnitt. §.20. Demnach ist, wenn c dieser constante Factor ist, c v' v" • • • = w' w" . . ., woraus folgt, dass eine der Functionen v\ v" . . ., etwa v', durch w' theilbar ist, und sich also von w' nur durch einen constanten Factor unterscheidet u. s. f. Wir erhalten also als zweite Folgerung aus dem Theorem I: III. Eine ganze Function kann, von constanten Fac- toren abgesehen, nur auf eine Art in unzerleg- unzerlegbare Factoren zerlegt werden. Hieraus ergiebt sich der Begriff des grössten gemein- gemeinschaftlichen Theilers von zwei oder mehr ganzen rationalen Functionen U, V. . . Man versteht darunter das Product aller unzerlegbaren Factoren, die in den Zerlegungen jeder der Func- Functionen U, V. . . vorkommen, oder die Function möglichst hohen Grades, die in allen Functionen U, V. . . aufgeht. Nach III. ist diese Function, von einem constanten Factor abgesehen, für jedes Functionensystem U, V. . . vollständig bestimmt. Mehrere Functionen U, V, W. . . heissen relativ prim, wenn keine zwei von ihnen einen gemeinsamen Theiler haben. Alle diese Definitionen und Sätze sind genau analog mit sehr bekannten Sätzen der elementaren Zahlenlehre, die dort als Folgerungen des Algorithmus des grössten gemeinschaftlichen Theilers auftreten, nur dass hier die unzerlegbaren Functionen die Rolle der Primzahlen übernehmen. Wir führen noch einen solchen Satz an: IV. Sind m, v relativ prim und Uu, Uv durch w theil- theilbar, so ist U durch w theilbar. Denn zerlegt man die ganzen rationalen Functionen U, u, v, w in ihre unzerlegbaren Factoren, so muss irgend ein Factor von w, da er nicht in u und v zugleich vorkommen kann, in U auf- aufgehen. Hebt man ihn aus U und w weg, so kann man ebenso für einen nächsten Factor von w schliessen u. s. f. Wir betrachten nun ganze rationale Functionen einer Ver- Veränderlichen t .... .-¦¦¦¦ ., "• '/(*) — t«o*" -f m^-1 h + «*_!* -f um, ¦ ¦ ¦¦ dereu Coefficienten ganze rationale Functionen von n Veränder- Veränderlichen «sind,, von denen t unabhängig ist. '.. ¦ ¦ Sind die Coefficienten u0, u{ . . . um ohne gemeinsamen
§. 20. Zerlegbare und unzerlegbare Functionen. 75 Theiler, so heisst f(t) primitiv, im anderen Falle wird der grösste gemeinschaftliche Theiler der Coefficienten u0, ut ¦ ¦ . um der Theiler der Function f(t) genannt (vergl. §. 2). Wir schliessen, immer unter Voraussetzung der Gültigkeit von I: V. Das Product von zwei primitiven Functionen f(t) und (p{t) ist wieder eine primitive Function und der Theiler eines Productes zweier imprimitiver Functionen ist gleich dem Product der Theiler beider Factoren. Der Beweis ist ganz so wie für den entsprechenden Satz in §. 2. Es seien W <p (t) = M" -f t>! P-1 -\ 1- t>„ zwei primitive Functionen und B) F(t) = Uo P»+t* + Di *» + "-» -\ 1- D"m+„ ihr Product. Es ist dann, wenn r und s irgend zwei Ziffern aus den Reihen 0, 1 ... m, und 0, 1, 2 ... ft bedeuten (§. 2) C) . Ur + s = UrVs -\- Ur-!VS + 1 -{-'•• -j- Ur+iVs-t -j Wenn nun w irgend eine unzerlegbare Function ist, die weder in allen ur noch in allen vs aufgeht, so wählen wir in C) r und s so, dass ur das erste nicht durch w theilbare u ist, also ur-i, Mr_2 . . . durch w theübar sind, und dass ebenso vs das erste, nicht durch w theilbare v wird. Dann kann auch Ur + S nicht durch w theilbar sein, weil alle Glieder, mit Ausnahme des ersten, durch w theilbar sind, d. h. F(t) ist primitiv. Daraus folgt unmittelbar, wenn p und q irgend welche ganze rationale Functionen der x sind, dass pq der Theiler des Pro- Productes der beiden imprimitiven Functionen pf(t), qfp(t) ist, also der zweite Theil des Satzes V. Daraus folgt weiter: VI. Wenn eine ganze rationale Function F(t) der n -\- 1 Variablen x und t in zwei Factoren zer- zerlegbar ist, die in Bezug auf t ganz, in Bezug auf die x wenigstens rational sind, so ist sie auch in zwei Functionen zerlegbar, die in x und t ganz und rational sind.
76 . Erster Abschnitt. §. 20. Denn nach der Voraussetzung giebt es eine ganze rationale Function w der x allein und zwei ganze rationale Functionen der x und t, ft (t), cp. (t), so dass i und nach V. muss w in dem Product der Theiler von f. (t) und 9j (t) aufgehen, so dass wir auch erhalten, worin f(t), <p (t) gleichfalls ganze rationale Functionen von x und t, und zwar in Bezug auf t von demselben Grade wie /i (t) und 9j (t) sind, w. z. b. w. — Hieraus schliessen wir weiter, dass zwei Functionen .F(<),/(<), die als ganze rationale Functionen der n -\- 1 Veränderlichen x und t betrachtet, in dem oben defi- nirten Sinne relativ prim sind, sich auch, als Functionen von t allein betrachtet, und nach dem Algorithmus des grössten gemein- gemeinschaftlichen Theilers behandelt (§. 6), als relativ prim erweisen müssen. Denn wenn sie einen gemeinsamen Theiler hätten, der in Bezug auf t ganz, in Bezug auf die x gebrochen wäre, so Hesse sich eine ganze Function T von x und t und eine ganze Function P der x allein so bestimmen, dass PF(t) = TF.it), P/{t) = Tf.it) wäre, worin Fu /i ganze Functionen ohne gemeinsamen Theiler sind. Wenn also Pl5 fr, M die Theiler der Functionen Ft(t), /j (£), T sind, so sind P. und fr relativ prim, und P. M und pk M sind durch P theilbar, also ist nach IV. auch M durch P theilbar; mithin sind Fit) und fit) durch die ganze Function T:P theilbar, also nicht relativ prim, wie doch vorausgesetzt war. Es ergiebt sich also nach §. G, dass sich zwei ganze Func- Functionen Q, q von x und t und eine ganze Function X von den x allein so bestimmen lässt, dass die Identität D) QFit) + qfit) = X besteht. Ist nun &H) eine weitere ganze Function von x und t, so folgt aus D) durch Multiplication mit <&(£) Q ^ (t) Fit) + 2 <D @ /(*) = X * it), und wenn also 3>(f) Fit) durch f(t) theilbar ist, so ist auch X 0 it) durch fit) theilbar. Demnach können wir, wenn <jp(£) und i>it) wieder zwei ganze Functionen von x und t bedeuten, setzen:
§. 20. Zerlegbare und unzerlegbare Functionen. 77 {) F(tH(t) = Multiplicirt man die zweite dieser Gleichungen mit X und setzt aus der ersten für X&(t) den Ausdruck <p(t)f(t) ein, so lässt sich f(t) wegheben und es folgt <p(t)F(t) = Xt(t). Es muss also X sowohl im Theiler von cp(t)f(t) als in dem von <p(t)F(t) aufgehen, und da f(t) und F(t) und mithin auch ihre Theiler relativ prim sind, so muss X im Theiler von <p(t) aufgehen (nach IV). Setzen wir demnach so folgt aus E) *(<) = 9l (<)/(*), d. h. 0(t) ist durch f(t) theilbar; also: VII. Sind F(t) und/(f) relativ prim und ®(f)F(t) durch f(t) theilbar, so ist &(t) durch f(t) theilbar. Dies aber ist nichts Anderes als das Theorem I. für Func- tionen von n -\- 1 Variablen, und I. somit allgemein bewiesen. Zugleich sind damit auch die aus I. gezogenen Folgerungen bewiesen, insbesondere die, dass eine Function von einer belie- beliebigen Anzahl von Variablen, abgesehen von constanten Factoren, nur auf eine Art in unzerlegbare Factoren zerlegt werden kann.
Zweiter Abschnitt. Determinanten. §• 21. Perniutationen von n Elementen. Wir betrachten ein System von n unterschiedenen Elementen irgend welcher Art, z. B. die n Ziffern 1, 2, 3 ... n, deren Complex in dieser bestimmten Anordnung wir mit 91 be- bezeichnen wollen. Die Elemente von 9t lassen sich auf verschie- verschiedene Art anordnen, z. B.: 2, 1, 3 ... n. Der Uebergang von einer Anordnung zu einer anderen heisst eine Permutation. Bezeichnen wir die Anzahl der verschiedenen Anordnungen, die nur von der Anzahl n der Elemente abhängen kann, mit II(n), so ergiebt sich zunächst IIA) = 1, 11B) = 2, uud um die Zahl allgemein zu bestimmen, denken wir uns zu n — 1 Elementen ein wtes hinzugefügt. In jeder Anordnung der n — 1 Elemente kann nun das wte Element an n verschiedene Stellen gesetzt werden, nämlich vor das erste, zwischen das erste und zweite, zwischen das zweite und dritte u. s. f., endlich nach dem (n — l)ten, und alle die so entstandenen Anordnungen sind von einander verschieden. Daraus folgt: A) JI(n) = nJI(n— 1), woraus sich durch vollständige Induction B) n(n) = 1.2.3 ...» ergiebt. so dass das Zeichen II(n) hier dieselbe Bedeutung hat, wie im ersten Abschnitt (§. 7).
§. 22. Permutationen erster und zweiter Art. 79 Irgend eine Anordnung des Systems 31 bezeichnen wir mit 91', oder ausführlicher, wenn «j, «j . . . «„ die Ziffern 1, 2 ... n in irgend einer Reihenfolge bedeuten, mit C) 21' = «!, «, , . . a». Man kann auf sehr verschiedene Arten aus einer Anordnung eine beliebige andere ableiten, d. h. eine Permutation ausführen. Unter den verschiedenen Möglichkeiten sind für uns die durch sogenannte Transpositionen, d. h. durch successive Ver- Vertauschung von nur zwei Elementen ausgeführten, von besonderem Interesse. Durch mehrere, nach einander ausgeführte Transposi* tionen lässt sich aus jeder Anordnung, z. B. aus % jede andere 91' herleiten. Man kann zu diesem Zwecke etwa so verfahren, dass man in 3t zunächst das Element 1 mit dem, was in 31' an erster Stelle steht, also mit «,, vertauscht (falls nicht at = 1 ist), dann, wenn «2 nicht schon = 2 ist, 2 mit «2 u. s. f. Um z. B. von A, 2, 3, 4) zu D, 3, 2, 1) zu gelangen, bildet man die Anordnungen A, 2, 3, 4), D, 2, 3, 1), D, 3, 2, 1). Bezeichnen wir eine Transposition kurz durch die beiden vertauschten Ziffern, also die Vertauschung von 1 mit 2 durch A, 2), so haben wir hier nach einander die Transpositionen A, 4), B, 3) ausgeführt. Es ist zu bemerken, dass der Uebergang von einer Anord- Anordnung zu einer bestimmten anderen auf unendlich viele verschie- verschiedene Arten durch auf einander folgende Transpositionen erreicht werden kann. So geht die Anordnung A, 2, 3, 4) auch durch die Transpositionen A, 2), A, 3), B, 4), A, 2) in D, 3, 2, 1) über. Man kann auch etwa zunächst beliebig oft blindlings trans- poniren, und dann erst anfangen, die Transpositionen in der angegebenen Weise planmässig einzurichten. §• 22. Permutationen erster und zweiter Art. Die II (n) Anordnungen von n Elementen lassen sich nach folgendem Gesichtspunkte in zwei Arten zerlegen. Aus den n Elementen unseres Systems lassen sich —L—'- und nicht mehr Paare bilden. Wir wollen nun den n Elementen
80 Zweiter Abschnitt. §. 22. 1, 2, .'¦.'. n in bestimmter Weise n reelle Zahlwerthe %, a2, . • • an zuordnen, und aus diesen Zahlwerthen die —^r—'- Differenzen «i — «a, cti — as . . . bilden, wobei der niedrigere Index dem Minuenden angehören soll. Das Differenzenproduct A) P — (% — a2) («i — a%) ...(«! — a„) («2 — as) . . . (a2 — an) (an_! — an) wird, wenn die ax, a2 . . . an von einander verschiedene Zahl- Zahlwerthe sind, einen von Null verschiedenen Werth haben, z. B. einen positiven, wenn ai ^> a2 ^> as . . . ^> an angenommen war. Wenn wir nun die Indices 1, 2, 3 ... n irgendwie unter ein- einander vertauschen, also etwa von 21 zu 21' übergehen, so geht P in B) P' = (aai — a«2) (aai — aa,) . . . (aai — a«M) (a«2 — aUa) . . . (aUi — a«n) über, und dies Product besteht, abgesehen vom Vorzeichen, aus denselben Factoren wie P, d. h. es ist P' entweder gleich P oder entgegengesetzt zu P. I. Wir rechnen nun die Anordnung 21' und also auch die Permutation, die 21 in 21' verwandelt, zur ersten oder zur zweiten Art, je nachdem P mit P' gleich oder entgegengesetzt ist, so dass 21 selbst zur ersten Art gehört. II. Durch eine einfache Transposition (h, &), worin Ä, 1c irgend zwei der Ziffern 1, 2 ... n bezeich- bezeichnen, ändert sowohl P als P' sein Vorzeichen. Denn die Factoren, die h und 1c gar nicht enthalten, werden durch diese Transposition nicht berührt; dann haben wir in P und P' den Factor + (ah — aft) und die Factorenpaare + (% — «r) («s — av), wo v die Reihe der Zahlen 1, 2 . . . n, mit Ausnahme von h, 1c durchläuft. Der erstere Factor ändert aber sein Zeichen, während das Factorenpaar ungeändert bleibt bei der Transposition (h, h). Daraus folgt:
§. 22. Permutation erster und zweiter Art. 81 III. Die Permutationen der ersten Art sind aus einer geraden Anzahl von Transpositionen zusammengesetzt, und die der zweiten Art aus einer ungeraden Anzahl. Zu der ersten Art ist dann auch die sogenannte identische Permutation zu rechnen, die 2t • ungeändeft lässt. ! Daraus ergiebt sich noch die Folgerung: Auf wie verschie- verschiedenen Wegen man auch 21' aus 21 durch Transpositionen ab- ableiten mag, die Anzahl dieser Transpositionen ist bei allen diesen Arten übereinstimmend gerade oder ungerade (je nachdem 2t' zur ersten oder zur zweiten Art gehört). Wenn wir in den sämmtlichen Anordnungen 21, 21', 21" ... der n Elemente eine Transposition, etwa A, 2), vornehmen, so geht jede dieser Anordnungen in eine bestimmte andere über, etwa 21 in SS, 21' in 33', 2t" in 33" . . ., und wenn wir dieselbe Transposition noch einmal wiederholen, so geht 33 wieder in 21, 33' wieder in 21' ... über. Daraus folgt, dass die Anordnungen 33, 33', 23" . . . alle von einander verschieden sind und folglich in ihrer Gesamnitheit mit der Gesammtheit der 2t überein- übereinstimmen. Da nun, wie wir oben gesehen haben, die sämmtlichen Differenzenproducte die aus P mit den verschiedenen Anordnungen 2t, 21', 2t"... gebildet sind, durch eine Transposition das Zeichen ändern, so folgt, dass jedem 2t der ersten Art ein 33 der zweiten Art ent- entspricht und jedem 2t der zweiten Art ein 23 der ersten Art. IV. Hiernach ist die Anzahl der Anordnungen der ersten Art ebenso gross, wie die Anzahl der Anordnungen der zweiten AiJ;, nämlich — 77 (wI). Für n = 3 haben wir die folgenden sechs Anordnungen, von denen die erste Horizontalreihe die erste Art bildet: a) A, 2, 3), B, 3, 1), C, 1, 2) K C, 2, 1), B, 1, 3), A, 3, 2) J) Diese Sätze sind hier aus der Betrachtung des Productes P, also einer • Zahlgrösse, gewonnen. Wie man ohne Benutzung einer solchen Function zu denselben Ergebnissen gelangen kann, werden wir im XIV. Ab- Abschnitt sehen. Weber, Algebra. I. g
82 Zweiter Abschnitt. §.. 23. §. 23. Determinanten. Wir betrachten jetzt ein System von w2 beliebigen Grossen, mit denen die rationalen Rechenoperationen ausgeführt werden können. Zu einer einfachen Bezeichnung dieser Grossen wählen wir einen Buchstaben mit einem doppelten Index af>, worin i sowohl als Je die Reihe der Ziffern 1, 2, 3 ... n durchlaufen soll. Zur besseren Uebersicht ordnen wir diese Grossen in ein Quadrat, so dass alle a mit demselben oberen Index in einer Horizontal- Horizontalreihe, alle a mit demselben unteren Index in einer Verticalreihe stehen, und bezeichnen dies Quadrat mit z/, also: a«, a«, a?) . . . a« af), of), af> . . . affl a?\ af\ af> . . . af A) z/ = a[n\ Der Kürze halber nennt man die Horizontalreihen Zeilen, die Verticalreihen Colonnen oder Spalten. Die Grossen e4ft) heissen die Elemente des Systems z/. Wir wollen aber unter dem zwischen verticalen Strichen eingeschlossenen Quadrat nicht nur den Complex der Grossen a verstehen, sondern eine bestimmte arithmetische Verbindung dieser Grösseu, die sich ausrechnen lässt, sobald die a numerisch gegeben sind, und die wir jetzt beschreiben wollen. Man bilde das Product aller Elemente a, die in der von links oben nach rechts unten gehenden Diagonale stehen: B) M = aW cd® aW . . . a(M). leite daraus II(n) Producte M, M', M" . . . her, indem man die unteren Indices permutirt, und gebe jedem so entstandenen Product das positive oder negative Zeichen, je nach- nachdem die angewandte Permutation zur ersten oder zur zweiten Art gehört, also nach der Bezeichnung des vorigen Paragraphen: C) Jf' = £o«o«...aW. Die Summe aus diesen Producten M + M + M " + ••• = EM
§. 23. Determinanten. 83 soll z/ sein, z/ wird die Determinante der w2 Elemente af> genannt, und zwar, wenn die Unterscheidung nothwendig ist, eine w-reihige Determinante (auch Determinante wten Grades oder wter Ordnung). Das Glied M dieser Summe, d. h. also das Product "aller in der Diagonale des Quadrates stehenden Elemente, wird das Hauptglied genannt. Nehmen wir z. B. n = 2, so erhalten wir D) // = flpaf-fl«a(a\ und für n = 3 [nach C) des vorigen Paragraphen]: 4 = a<paf>af> + a^af^af -f *• ' — F) = ad — bc. ab'c" -\-bc'a" -\- ca'b" oder in anderer Bezeichnung: a, b c, d a, b, c a', b', & a", b", c" Es ist dem Leser zu empfehlen, die Berechnung solcher Determinanten an Zahlenbeispielen einzuüben. Die Bezeichnung A) ist in vielen Fällen zu umständlich; es sind daher noch andere, kürzere Zeichen im Gebrauch. So setzt Jacobi, indem er nur das Hauptglied der entwickelten Deter- Determinante ausführlich schreibt: (8) z/ = 2 •+- «W a<2> . «(») und Kronecker noch kürzer: (9) z/ = | af |. Beide Bezeichnungen sind aber nur dann ganz deutlich, wenn die Elemente in der hier vorausgesetzten Weise durch zwei Indices bezeichnet sind, und durchaus unanwendbar, wenn die Elemente z. B. numerisch gegeben sind. Es kommen bisweilen Determinanten vor, bei denen af> = -ap ist, bei denen also in A) die symmetrisch zur Diagonale des Quadrates stehenden Elemente einander gleich sind. Wir werden in diesen Fällen gewöhnlich beide Indices (um ihre Gleichwerthig- keit anzudeuten) unten hinsetzen, also ai,lc =• <h,i setzen. Solche Determinanten heissen symmetrisch. 0*
84 Zweiter Abschnitt. §. 24. §• 24. Hauptsätze über Determinanten. Aus dem Begriff der Determinante ergeben sich leicht die ersten Sätze, die für die Anwendung geeignet sind. Wenn wir in dem Product [§. 23, C)] A) M> = ±a%a%...a% die Factoren umstellen, so ändert sich sein Werth nicht. "Wir können also die Factoren auch so anordnen, dass die unteren Indices in ihrer natürlichen Eeihenfolge 1, 2 . . . n erscheinen. Dabei werden dann die oberen Indices in einer gewissen Weise permutirt erscheinen, also M' die Form erhalten: B) ±af*afi> ...a{ln\ worin (ft, &.../}») = 33, ebenso wie («!, «2 ... «„) = 31 eine Anordnung der Ziffern 1, 2 . . . w bedeutet. Man kann die Anordnung 93 dadurch erhalten, dass man in den Factoren von M' die Transpositionen, die zu 51 geführt. haben, von der letzten anfangend, rückgängig macht, um in der Reihe der unteren Indices wieder die ursprüngliche Anordnung zu erhalten. Die dabei sich ergebende Reihenfolge der oberen Indices ist dann die Anordnung 93. Es folgt daraus, dass 33 zur ersten oder zur zweiten Art gehört, je nachdem 31 zur ersten oder zur zweiten Art gehört, da beide durch die gleiche Anzahl von Transposi- Transpositionen entstehen. Die Gesammtheit der 18 stellt ebenso wie die Gesammtheit der 51 alle Permutationen der n Elemente dar, da zwei verschiedene 51 niemals zu demselben 18 führen können. Damit ist bewiesen: • I. Die Determinante <d kann auch dadurch gebildet werden, dass man in dem Hauptgliede a<l>a<2>... «W die oberen Indices auf alle möglichen Arten per- permutirt, jedem der so gebildeten Producte das positive oder negative Zeichen giebt, je nachdem die angewandte Permutation zur ersten oder zweiten Art gehört, und dann die Summe aller dieser Producte nimmt.
§. 24. Determinanten. - 85 In der Darstellung §. 23, A) von z/ werden durch die oberen Indices die Zeilen, durch die unteren Indices die Colonnen gekennzeichnet,. und demnach können wir diesem Satze auch den folgenden Ausdruck geben: II. Eine Determinante ändert sich nicht, wenn die Zeilen zu Colonnen und die Colonnen zu Zeilen gemacht werden. Wenn wir in den sämmtlichen Anordnungen 91, 91', 91" ... der n Elemente irgend zwei Elemente mit einander vertauschen, so bleibt die Gesammtheit dieser Anordnungen ungeändert, aber es geht jede Anordnung erster Art in eine Anordnung zweiter Art über und umgekehrt. Wenn wir also in den Gliedern M, M', M" . . ., aus denen z/ zusammengesetzt ist, irgend zwei untere Indices vertauschen, so geht jedes Glied mit positivem Zeichen in ein anderes über, das in 4 mit dem negativen Zeichen behaftet war und umgekehrt, also es ändert d sein Vorzeichen. Daraus folgt mit Hülfe von II. der Satz: III. Wenn man in z/ zwei untere oder zwei obere In- Indices mit einander vertauscht, so ändert die Determinante nur ihr Vorzeichen. Etwas anders ausgedrückt: Wenn man zwei Zeilen oder zwei Colonnen mit einander vertauscht, so ändert die Determinante nur ihr Vorzeichen, und daraus allgemeiner: IV. Wenn in einer Determinante die Zeilen oder die Colonnen permutirt werden, so ändert sich der absolute Werth nicht, und das Vorzeichen ändert sich nicht oder geht in das entgegengesetzte über, je nachdem die angewandte Permutation zur ersten oder zweiten Art gehört. Aus III. erhält man den folgenden Fundamentalsatz: V. Wenn in zwei Zeilen oder in zwei Colonnen die an gleicher Stelle stehenden Glieder einander gleich sind (kürzer ausgedrückt: wenn zwei Rei- Reihen einander gleich sind), so hat die Deter- Determinante den Werth Null. Denn die Vertauschung der zwei Reihen ändert nach III. das Zeichen, kann aber andererseits, da beide Reihen, identisch
86 Zweiter Abschnitt. §. 25. sind, nichts ändern, so dass für z/ nur der Werth Null übrig bleibt. Man drückt den Satz V nur anders aus, wenn man sagt: VI. Man erhält eine verschwindende Determinante, wenn man die Elemente einer Reihe durch die entsprechenden Elemente einer anderen Reihe, oder, kurz gesagt, wenn man einen unteren oder oberen Index durch einen anderen ersetzt. §. 25. . Unterdeterminanten. In jedem Gliede der entwickelten Determinante 2 ±a<»af> .. . a«, deren Werth wir jetzt mit A bezeichnen wollen, kommt jede der Zahlen 1,2...« ein und nur einmal als unterer Index vor. Es wird also ein gewisser Complex von Gliedern den Factor ap> enthalten, ein anderer Complex den Factor a<2> u. s. f., end- endlich ein Complex den Factor af>; jedes Glied der Determinante kommt in einem und nur in einem dieser Complexe vor. Bezeichnen wir also den ersten dieser Complexe mit a<J> Af>, den zweiten mit af> A{2\ den letzten mit a<n> A[n\ so können wir die Determinante folgendermaassen darstellen: A) ' Ä = aWAV -f a<2> A{» -| 1- a<»> A<?\ An Stelle des unteren Index 1 hätten wir ebenso gut jeden anderen, v, herausgreifen und daher B) A = a« Af + af A? + h <& ^ setzen können. Darin bedeutet das Product a^Ar den Complex aller Glieder der Determinante, die den Factor aV enthalten. Da dieselben Regeln wie für die unteren so auch für die oberen Indices gelten, so kann man die Determinante auch noch in der folgenden Weise schreiben: C) A = aVAV + «M0 H h ^^\ worin (i gleichfalls jeden der Indices 1,2...« bedeuten kann.
§.25. Unterdeterminanten. 87 Die hierdurch vollständig definirten Grossen J.£u) heissen die Unterdeterminanten der Determinante A. Um ihre Bildungs- Bildungsweise genau kennen zu lernen, betrachten wir zunächst den Complex ail)A?\ Man erhält ihn, wenn man in dem Product „B) An) den unteren Index 1 ungeändert lässt und nur die übrigen In- dices 2, 3 ... n auf alle Arten permutirt und die Summe der entstandenen Glieder mit Rücksicht auf die Zeichenregel bildet, d. h. es ist A^ die (n — 1)reihige Determinante: D) ,,B) «2 , (8) «3 «2 , «3 oder die Determinante, die man aus A erhält, wenn man in dem A darstellenden Quadrat [§. 23, A)] die erste Zeile und die erste Colonne weglässt. Daraus ergiebt sich leicht die Bedeutung von Jiu); man kann, indem man v — 1 Zeilenvertauschungen vornimmt, die vte Zeile zur ersten machen, und wenn man noch ft — 1 Ver- Vertauschungen der Colonnen hinzunimmt, die ftte Colonne zur ersten; im Uebrigen bleiben die Reihen in ihrer Aufeinanderfolge ungeändert. Die Determinante selbst hat den Factor (— 1}"+" angenommen und ist dem absoluten Werthe nach ungeändert geblieben (§. 24, IV). In der so umgeänderten Reihenfolge ist aber das Element aV an die Stelle des Elementes a^ getreten, und daraus schliesst man auf folgendes Bildungsgesetz: Man erhält die Unterdeterminante A^ dadurch, dass man in dem die Determinante darstellenden Qua- Quadrat die beiden Reihen weglässt, die sich in aj;u) kreuzen, und den Factor (— 1)"+'' hinzufügt. So erhält man z. B. für die dreireihige Determinante die folgende Darstellung: E) a, 5, c d, V, d a", V, c" = a V, b", & c" — b a', a", c' c" 4-c d, a", V b" _ c>v>) .j. b(c'a" — d c") + e(db" — b'a").
88 Ä Zweiter Abschnitt. §. 25. Da der untere Index v in if' gar nicht vorkommt, so ändert sich Af^ nicht, wenn der untere Index v durch einen anderen ersetzt wird. Dann aber verschwindet nach §. 24, "VI. die Determinante. Wir erhalten demnach aus B) die folgende wichtige Relation, in der (t, v irgend zwei von einander ver- verschiedene Ziffern 1, 2 ... n sein können: F) 0 = <Af -f af Af-\ h o?} Ä?\ und ebenso bekommt man aus C): G) 0 = «?'> AP + a^ A?^ h «2° A*>. Beispielsweise ergiebt sich aus E), wenn a, 5, c durch a', &', c' ersetzt werden': (8) et (V c" — c' b") -f V (c'a" — «' c") + c' (et l" — 5' a") = 0, eine Formel, von deren Richtigkeit man sich durch die einfachste Rechnung überzeugt. Wenn wir die Relation F) mit einem beliebigen Factor X multipliciren und zu B) addiren, so erhalten wir die Formel: (9) A = (a?> + l af) A*> + (o» + l af) A? + \-(aP + X<P)AP, die uns den folgenden Satz ausdrückt: VII. Die Determinante ändert ihren Werth nicht, wenn man zu den Elementen einer Zeile die mit einem beliebigen gemeinschaftlichen Factor multiplicirten entsprechenden Elemente einer anderen Zeile addirt. Derselbe Satz gilt auch von den Colonnen. Er wird zur Vereinfachung und numerischen Berechnung von Determinanten oft mit Nutzen verwendet. Wir fügen noch folgende Sätze bei, die sich aus den Darstellungen B), C) sofort ablesen lassen. VIII. Wenn alle Elemente einer Zeile oder einer Co- lonne einen gemeinschaftlichen Factor haben, so kann dieser weggelassen und als Factor vor die Determinante gesetzt werden. Denn es ist nach B): jp a?} AP + p af Af -\ 1- p ain) A^ =pA. IX. Wenn in einer Zeile oder in einer Colonne alle Elemente bis auf eines verschwinden, so.reducirt
§• 25. Unterdeterminanten. sich die Determinante auf das Product dieses einen Elementes mit der entsprechenden Unter- Unterdeterminante. Denn wenn a^\ af1 . . . a^ mit Ausnahme von ai* ver- verschwinden, so ist nach B): der Werth von A ist dann von den a&\ aW . . . «2° (mit Aus- Ausnahme von a?^) ganz unabhängig. Um von diesen Sätzen eine Anwendung zu machen, wollen wir den Werth ,der Determinante 1, a, a* 1, 5, 5* bestimmen, worin a, b, c beliebige Grossen seien. Multipliciren wir die zweite Colonne mit a und subtrahiren sie von der dritten, darauf die erste mit a und subtrahiren sie von der zweiten, so folgt nach VII: 1, 0, 0 1, 5-—a, 5{5 — a) 1, e — a, c(c — a) und nach IX: und endlich nach VIII: A0) z/ = (b — a) (c — a) 5 — a, 5E — ä) c — a, c(e — a) 1, e — a)(c — a) (c—b). Auf die gleiche Weise kann man auch die w-reihige Deter- Determinante 1, öj, al . . . a?-1 1, Cto% Q/a . . . Cl, n—1 P2 an, al . . . al 1 behandeln und findet ihren Werth gleich (a2 — «0 (a3 — <%) . . . (an (a3 — a2) . . . (an A1) — a2) (a„ — aM_i
90 Zweiter Abschnitt. §.25. Ordnet man die Colonnen in umgekehrter Reihenfolge, so sind dazu, je nachdem n gerade oder ungerade ist, n ' «— 1 _ oder —r- Vertauschungen erforderlich, so dass sich die so geordnete Determinante von J durch den Factor n(n—1) (-1) 2 unterscheidet. Es kommt auf dasselbe hinaus, wenn man den —^—n Factoren des Productes A1) das entgegengesetzte Vorzeichen giebt. Es besteht also zugleich mit A1) die Gleichung: (% —a2) (%—%) ... (%—«») A2) _ (a2—a3) . . . (a2 — o») (a„_! — an). Wir wollen hier noch eine Bezeichnungsweise der Unter- Unterdeterminanten erwähnen, die der Differentialrechnung entnommen ist und oft mit Nutzen verwendet wird, besonders wenn es sich um die Bildung von Derivirten handelt. Wenn die Grossen ajp als unabhängige Variable betrachtet werden, so ist die Determinante A in Bezug auf jede von ihnen nur vom ersten Grade. Die nach aP genommene Ableitung oder der Differentialquotient ist also gleich dem Coefficienten von af\ also: Wenn demnach z. B. die af* Functionen einer Variablen t sind, so ist auch A eine Fnnction von t, und man erhält nach den ersten Regeln der Differentialrechnung die Ableitung von A in Bezug auf t in der Form wenn * die Ableitung von af* nach t bedeutet. o t Wenn wir die a^ als von einander unabhängige Variable betrachten, so ist die Determinante A = £ ™
§. 26. Höhere Unterdeterminanten. 91 eine homogene Function wten Grades von n Variablen, jedoch von der besonderen Eigenschaft, dass jede einzelne Variable nur linear darin vorkommt. Aus der Darstellung durch die Unter- Unterdeterminanten B), C) lässt sich leicht schliessen, dass diese Function unzerlegbar ist. Denn ist F der unzerlegbare Factor von A, der die Variable af^ enthält, so muss dieser Factor F wegen B) eine lineare homogene Function der Variablen a(r\ <42) . . . ain) sein, und wegen C) eine lineare Function der Variablen ctf\ 4° . . . a(>? (§. 20). Es enthält daher F alle Variablen af und ist folglich mit A identisch. Wir sprechen also noch den Satz aus: X. Die Determinante ist eine unzerlegbare Function ihrer »^-Elemente. §. 26. Die Unterdeterminanten im weiteren Sinne. "Wir können nun die Betrachtungen des vorigen Paragraphen in folgender Weise verallgemeinern. Wie wir vorhin von der Aufgabe ausgegangen sind, alle Glieder in der entwickelten Determinante A aufzusuchen, die den Factor aW enthalten, so wollen wir jetzt alle die Glieder aufsuchen, die den Factor ^ af . . . a« enthalten, worin v eine beliebige Zahl unter « sein kann. Diese Glieder erhalten wir aus dem Hauptgliede .«?> <> . . . a« <*;& . . . <,("), ¦wenn wir bei der Permutation der unteren Indices 1, 2 ... v ungeändert lassen und nur v -\- 1, . . . n auf alle Arten permu- tiren unter Berücksichtigung der Vorzeichenregel. Demnach ist der Inbegriff der gesuchten Glieder * A) apafK. . a<;) I. Die hier als Factor auftretende Determi- Determinante von n — v Reihen, die wir mit A\\\\;;rv
92 Zweiter Abschnitt. §. 26. bezeichnen, entsteht aus A durch Weglassen der v ersten Zeilen und Colonnen. Dieses Resultat wollen wir nun auf folgende Art verall- verallgemeinern : "Wir wählen irgend v Elemente aus, jedoch so, dass nicht zwei Elemente in derselben Zeile oder in derselben Colonne vorkommen, d. h. so, dass nicht zweimal derselbe untere oder derselbe obere Index vorkommt, und be- bezeichnen den Inbegriff der Glieder der Determinante, die das Product dieser Elemente als Factor enthalten, mit B) aW oW ... aC"> 4/»" fr •••/»». Man kann durch Umstellen von Zeilen und Colonnen, wo- wodurch höchstens das Zeichen der Determinante geändert wird, immer erreichen, dass die Elemente C) fljf, o(W . . . «(f) . an die Stelle der Elemente oW, af) . . . a« gelangen; dann aber lässt sich die Regel I. auf die Bestimmung von Aa*t„l'.'.'.ar anwenden und es ergiebt sich: II. Man erhält (vom Vorzeichen abgesehen) -A«)', 4'.!!<*» als (w — i/)-reihige Determinante, wenn man in A alle Zeilen und Colonnen weglässt, die sich in einem der Elemente C) schneiden, und die übrig bleibenden Zeilen und Colonnen in ihrer Reihenfolge stehen lässt. Für die Zeichenbestimmung aber ergiebt sich folgende Vor- Vorschrift. Man ordne die unteren und die oberen Indices 1, 2 ...» in der Weise: D) «j, «2 . . . «„, ccv+1 . . . «„ E) ßt, ß2 ¦ ¦ ¦ ßv, ßv+\ • ¦ • ßm indem man ccv+1 . . . ccn und ebenso ßv+t . . . ßn der Grosse nach auf einander folgend annimmt. III. Die in II. beschriebene (n — i/)-reihige Deter- Determinante erhält das positive oder negative Zeichen, je nachdem die beiden Anordnungen
§. 26. Unterdeterminanten ^ter Ordnung. 93 D) und E) der Ziffern 1, 2 ... n beide zu der- derselben oder zu verschiedenen Arten gehören. Denn die Determinante ändert ihr Zeichen durch jede Ver- Vertauschung zweier unterer oder zweier oberer Irrdices. Um den allgemeinen Fall B) auf den besonderen Fall A) zurückzuführen, hat man so viele Transpositionen oberer und unterer Indices vorzunehmen, dass die Permutationen D) und E) beide in die ursprüngliche Anordnung 1, 2, 3 . . . n übergehen, und ebenso viele Zeichenwechsel haben stattgefunden. Die so definirten Grossen (?!, |}s. . ./}„ -ä.alt a2...av heissen die vten Unterdeterminanten oder Unter- Unterdeterminanten t>ter Ordnung. Sie sind dargestellt durch (n — v)- reibige Determinanten. Aus III. folgt in Bezug auf diese Unterdeterminanten der Satz: IV. Die Unterdeterminante ÄJ^ul'.'.'. a, ändert nur ihr Vorzeichen, wenn zwei ihrer unteren oder zwei ihrer oberen Indices vertauscht werden, oder allgemeiner: sie bleibt dem absoluten Werthe nach ungeändert, wenn die Anord- Anordnung der Indices %, «2 • • • ocv durch irgend eine andere Anordnung ersetzt wird und ändert das Zeichen oder nicht, je nachdem diese Permutation zur zweiten oder zur ersten Art gehört. Bezeichnen wir aber mit u[, «2 . . • «', irgend eine Anord- Anordnung der «!, «2 . . . ccv, so enthält die Determinante A auch den Complex der Glieder l ™a' a * " * av J^ali Ö2 • • • av' und wenn wir also alle diese Glieder sammeln, so erhalten wir den Complex: Die.hier auftretende v-reihige Determinante
94 Zweiter Abschnitt. §• 26. „(fix) „(fiO M „(fit) „(?*> Jh wollen wir die zu -44,4'"«» complementäre Unterdeter- Unterdeterminante nennen und mit B„l 4¦'¦'¦ '¦Z bezeichnen. Sie enthält genau die Zeilen und Colonnen, die in .4«,*'«*"'.«* fehlen und stimmt, abgesehen vom Vorzeichen, mit der Unterdeterminante (n — v)ter Ordnung aPv + i •¦ ¦ fin überein.1 Der Complex der Glieder F) wird also bezeichnet mit Wählen wir nun für ocj, a2 ...«»¦ jede Combination von v der Ziffern 1, 2 . . . w, deren Anzahl (nach §. 7) B^ ist, so erhalten wir, indem wir /515 /32 . . . ß„ festhalten, ebenso viele Complexe der Form G), und jedes Glied der Determinante A kömmt in einem und nur in einem dieser Complexe vor. V. Demnach erhalten wir, wenn wir alle Ausdrücke G) summiren, die Determinante A: iq\ A £ Ah'fc---?v -oft. fit ••¦/»» \y) ¦&¦ •^ ¦Ä«i, at...av -Dax, as... av Selbstverständlich kann man auch die Combination der « festhalten und in Bezug auf die ß summiren. Dies ist der Satz von Laplace. Als häufig vorkommender specieller Fall mag der erwähnt werden, wo ß1, /32 . . . ßv = 1, 2 . . . v und wo aW = 0 ist, wenn r einen der Werthe 1, 2 . . . v und gleichzeitig s einen der Werthe v -\- 1, ... n hat. Dann werden alle A\'^ «2;;; lv =0» mit Ausnahme von A\\ t'.'.'.l, und man erhält A Jl, 2 .••» TDl, 2 ... v ¦**¦ -, 2 .. . v -Dl, % ... v Der Satz wird durch folgendes Diagramm veranschaulicht, in dem das ganze Quadrat die Determinante A vorstellt, und wo in dem schraffirten Rechteck lauter Nullen stehen. Sind
§• 28. Unterdeterminanten j'ter Ordnung. 95 dann B und C die in den beiden kleinen Quadraten stehenden Determinanten von v und n — v Reihen, so ist (9) A = B C. Noch eine andere Darstellung der Determinante A durch die ersten und zweiten Unterdeter- Unterdeterminanten erhält man auf folgende Weise. Man wähle in A irgend zwei Reihen aus, die sich in einem Ele- Elemente, etwa in aW, schneiden. In jedem Gliede von A kommt ein Element mit dem unteren Index v und ein Element mit dem oberen Index (i vor. Wir haben also zunächst in A den Com- plex ai^ AvU) und ferner die verschie- verschiedenen Complexe afp a^ Ai^ worin i jeden von fi verschiedenen und Tc jeden von v verschiedenen Index bedeuten kann. VI. Wir können daher setzen: B C oder nach IV. Wir bemerken zu diesem Satze noch, dass A^,% die dem Ele- Elemente «W entsprechende erste Unterdeterminante der (w— 1)reihigen Determinante A^ ist; denn J.^ ist der Coefficient von ai^ a-i? in der Entwickelung von A und A^ der Coefficient von äf\ folglich A^]l der Coefficient von a® in der Determinante Af\ Man kann nach diesem Satze die sogenannte geränderte Determinante s«, a« . . . a«, «! ««, af u.2 x, v2 . . . vn, q nach den Elementen der letzten Zeile und Colonne entwickeln und erhält A2) CT= 2J. — v* Af
Zweiter Abschnitt. '§. 27. Man erhält diese Gleichung aus A0), wenn man n in n -\- 1 verwandelt, und die Elemente der letzten Zeile und Colonne durch eine andere Bezeichnung auszeichnet. Ersetzt man q durch q — u, worin u wieder eine beliebige Grosse ist, so ergiebt sich die oft angewandte Formel: A3) [), af "i ' . ,vn, q — u = U— Au, ¦worin U die Bedeutung A2) hat. Auch bei den höheren Unterdeterminanten ist bisweilen die Bezeichnung durch Differentialquotienten zweckmässig, so dass z. B. A4) gesetzt wird. 8 af d aW §. 27- Lineare homogene Gleichungen. Die häuptsächlichste Anwendung der Determinanten, der die ganze Theorie ihren Ursprung verdankt, ist die Auflösung linearer Gleichungen. Wir wollen hier die Aufgabe gleich in allgemeinster Weise in Angriff nehmen, da die specielle Form kaum eine Verein- Vereinfachung ist und sich nachher leicht aus dem allgemeinen Resul- Resultate ableiten lässt. Wir betrachten ein System von m Gleichungen ersten Grades, in denen n Unbekannte x^ x2 . . . x„ homogen vorkommen: af) af x \- xn = 0 -\ \- = 0, ¦worin die Coefficienten af> als gegebene Grossen betrachtet ¦werden. Ueber die Zahlen m, n wollen wir vorläufig noch gar keine Voraussetzung machen, sondern uns allgemein die Aufgabe
§..27. Lineare homogene Gleichungen. 97 stellen, alle Werthsysteme der Xj_, x2 . . . xn zu ermitteln, die den Gleichungen A) genügen. Eine Lösung der Gleichungen A) können wir sofort angeben: sie sind nämlich, was auch die Coefficienten af?) sein mögen, erfüllt, wenn B) ajj = 0, #2 = 0, ... xn = 0. Einen anderen extremen Fall können wir noch erwähnen; wenn nämlich die Coefficienten af> sämmtlich den Werth Null haben, dann sind die Gleichungen A) für beliebige Werthe von xv x2 . . . xn befriedigt. Der allgemeinen Beantwortung der Frage schicken wir fol- folgende Bemerkungen voraus. Wir schreiben das System der Coefficienten von A) in Form eines Rechtecks Ein solches Schema, das für sich noch keine numerische Bedeutung hat, heisst eine Matrix, insofern es als Quelle einer grösseren Anzahl von Determinanten betrachtet wird. Die der Matrix entstammenden Determinanten er- erhält man, wenn man beliebige Zeilen und Colonnen weg- lässt, in beliebiger, nur insoweit bestimmter Anzahl, dass die übrig bleibenden Elemente ein Quadrat bilden,' lind dieses Quadrat als Determinante auffasst. , ¦ :¦, So erhält man aus der Matrix einreihige, zweireihige ü. s. f. Determinanten. Die höchsten Determinanten sind n- oder m-reihig, je nachdem n oder m die kleinere Zahl ist (oder w-reihig, wenn n = m ist). , ; Wir machen nun die Annahme, dass unter den v-reihigen Determinanten der Matrix wenigstens eine von Null "ver- "verschieden sei, während die (v -f- 1) reihigen und folglich auch die höheren Determinanten, falls solche vorhanden sind, alle verschwinden sollen, v kann jede Zahl sein, die nicht grösser als die kleinere der beiden Zahlen ri oder^ n( ist (oder. falls n = m ist, diesen gemeinschaftlichen Wertlv nicht iiberfeifft). Eine solche Zahl -v wird sich immer- finden lassen, wenn wir Weber, Algebra. I. 7
98 Zweiter Abschnitt. §•27. den schon erledigten, ganz interesselosen Fall ausschliessen, dass alle Coefficienten af> verschwinden. Wir können, ohne die Allgemeinheit zu beschränken, zur Vereinfachung der Bezeichnung annehmen, die nicht verschwin- verschwindende v-reihige Determinante sei D) A == a[% Denn offenbar steht es uns frei, das Gleichungssystem A) in beliebiger Weise anzuordnen, und ferner können wir die Bezeich- Bezeichnung der Unbekannten x so wählen, dass irgend v von ihnen die v ersten sind. Die Unterdeterminanten von A bezeichnen wir wie früher mit Af>, worin i, h von 1 bis v gehen. Wenn nun zunächst v = n ist, was voraussetzt, dass m nicht kleiner als n ist, so haben die Gleichungen A) keine andere Lösung, als die in den Gleichungen B) enthaltene. Denn greifen wir die n ersten der Gleichungen A) heraus: 9. 2 I « tt Of) X1 x2 o«> xn == 0 «! + ^ «« = 0, multipliciren diese der Reihe nach mit J.^, J.'? . . . Aft\ worin ft jeder der Indices 1, 2 . . . n sein kann, und addiren sie, so folgt, weil nach §. 25 B) und F) f af = 0 oder = A ist, je nachdem X von (i verschieden ist oder nicht, AXa = 0, und da nach unserer Voraussetzung A von Null verschieden ist, Xf, = 0. Damit ist bewiesen: I. Wenn ein System von m linearen homogenen Gleichungen mit n Unbekannten eine Lösung hat, bei der nicht alle Unbekannte verschwinden, so
§. 27. Lineare homogene Gleichungen. 99 müssen, wenn m f> n ist, sämmtliche w-reihige Unterdeterminanten der Matrix der Coefficienten, C), verschwinden. Wir heben den am meisten angewendeten besonderen Fall m = n hervor und geben dem Satze für diesen Fall den folgen- folgenden Ausdruck: II. Wenn ein System von n linearen homogenen Gleichungen mit n Unbekannten eine von Null verschiedene Determinante hat, so haben sämmt- sämmtliche Unbekannte den Werth Null, oder: Wenn ein System von n linearen Gleichungen mit ebenso vielen homogen vorkommenden Un- Unbekannten eine Lösung hat, bei der nicht alle Unbekannten verschwinden, so verschwindet die Determinante des Systems. Unter der Determinante eines Systems von n linearen homogenen Gleichungen mit n Unbekannten ist hier die Determinante aus den »2 Coefficienten dieser Gleichungen ver- verstanden. Wir betrachten ferner den Fall, dass v kleiner als n ist. Da m gleich oder grösser als v sein muss, so wählen wir die v ersten Gleichungen des Systems A), und schreiben sie so: F) 1 l ' 2 2 ~ ~ * " + 1 + Wir bezeichnen wieder mit (i einen der Indices 1, 2 . . . v, multipliciren die Gleichungen F) der Reihe nach mit A$\ Af . . . A^ und addiren sie. Daraus folgt, wie vorhin, mit Benutzung von §. 25, B), F): G) Axfl — — Cv+^pXr + i — ... — Cn^x„, wenn zur Abkürzung gesetzt ist: (8) &,r — h af Af, l = v + 1, v + 2, . . . n. Nach §. 25, B) ist Gitfi die Determinante, die aus der durch D) definirten Determinante dadurch hervorgeht, dass man die 7*
100 Zweiter Abschnitt. §• 27. Elemente der fiten Colonne a«, af> ... a« durch af, af ... a^ ersetzt. Durch G) sind nun, da A von Null verschieden ist, die Xi, x2 . . . xv linear ausgedrückt durch xv + 1, . . . xn und durch die bekannten Grossen. Es ist nun noch zu zeigen, dass durch die Ausdrücke G) die Gleichungen A) befriedigt sind, welche Werthe auch Xv + i, ... xn haben mögen, dass also n — v von den Unbe- . kannten willkürlich bleiben, von denen die übrigen v nach G) abhängig sind. Um die Wahrheit dieses Satzes einzusehen, haben wir nur die Ausdrücke G) in die Gleichungen A) einzusetzen. Man ver- vereinfacht die Rechnung sehr durch Anwendung eines Summen- Summenzeichens 2, bei dem wir, wie schon oben, die Summationsbuch- staben oben, die Grenzen unten anhängen. Zunächst können wir dann..die Gleichungen G) so schreiben: (9) Ax„ = — 2 2 af Af xh, (i = 1, 2 . . . v. Wir multipliciren, wenn 1c irgend eine der Ziffern 1, 2 bedeutet, mit a® und summiren in Bezug auf (t: 10) A2a^x„ = —Zxh i? i a^ a\f Af, ft = 1, 2 . 1, v v + i,n 1, y l, v Dazu addiren wir beiderseits die Summe * m m. AZ xh und erhalten A1) AZaf x^ 1,» v af 1,» -1,» / Der Factor von xh in der Summe auf der rechten Seite ist , nach §. 26, A2). die Determinante A2) aP-\ aW af, a<?\ af>, und, verschwindet daher, wenn Je <,v ist, nach .§. 24, V., weil zwei Zeilen übereinstimmen, wenn aber 1c >. v ist, nach der
§. 27. Lineare homogene Gleichungen. 101 Voraussetzung, weil dann A2) eine v -j- 1 reihige Determinante der Matrix C) ist. Wir bekommen also aus A1), da A von Null verschieden ist, A3) iafxf, = 0, Tc=l,2...m, i,» d. h. das System der Gleichungen A) ist durch G) befriedigt. Damit ist bewiesen: III. Wenn in einem System von m linearen homogenen Gleichungen mit n Unbekannten alle v -\- 1 reihi- reihigen Unterdeterminanten der Matrix der Coeffi- cienten verschwinden, so hat das System eine Lösung, in der mindestens n — v von der Unbe- Unbekannten willkürlich bleiben. Ist »i < «, so giebt es immer eine Lösung, in der mindestens n — m der Unbekannten willkürlich bleiben; und hiervon ist ein häufig vorkommender specieller Fall: IV. Wenn die Determinante eines Systems von n line- linearen homogenen Gleichungen mit ebenso viel Unbekannten verschwindet, so können die Gleichungen so befriedigt werden, dass nicht alle Unbekannte verschwinden. Wir wollen von dem so bewiesenen Satze noch den anderen Fall hervorheben, dass m = n — 1 und v = n — 1 ist. In diesem Falle bleibt nur eine der Unbekannten beliebig und die Verhältnisse der Unbekannten sind völlig bestimmt. Wir können diesem Resultate folgenden Ausdruck geben: Bezeichnen wir die (n—1) reihigen Determinanten der Matrix mit abwechselndem Vorzeichen genommen durch A.I, Ajj . , . A„ und nehmen an, dass wenigstens eine von diesen Grossen von Null verschieden sei, so ist die Lösung des Systems:
102 Zweiter Abschnitt §. 28. \- aVxn = 0 A5) a[»-1>xl -f af-Vx* -\ 1- a%-»xn — 0 gegeben durch die Verhältnisse A6) xx : x% : ¦ • • : xn = AY : Ä-2 : • ¦ ¦ : An. So erhalten wir für n ^ 3 die Lösung des in der Geometrie oft vorkommenden Gleichungssystems (. , ax' -\- by -(- C0 = 0 *• ; a'x+b'y-\-e!e = 0 in der Form A8) x : y : s = bc' — cb' : cd — ad : ab' — ba'. §• 28. Elimination aus linearen Gleichungen. Es kommt bisweilen vor, dass es sich bei einem gegebenen System linearer Gleichungen nicht sowohl um die wirkliche Er- Ermittelung der Unbekannten handelt, als um die Beurtheilung der Möglichkeit ihrer Lösung, also um die Aufstellung der Bedingungs- Bedingungsgleichungen, die zwischen den Coefficienten bestehen müssen, wenn Lösungen oder Lösungen von bestimmter Art überhaupt vorhanden sein sollen. Die Aufstellung dieser Bedingungs- Bedingungsgleichungen heisst Elimination. Implicite ist die Lösung dieser Aufgabe schon im Vorhergehenden enthalten; wir wollen aber noch ausdrücklich auf einigel hierher gehörige Fragen zurückkommen. Wir betrachten, wie im vorigen Paragraphen, ein System von m linearen Gleichungen mit n homogen vorkommenden Unbekannten, und fragen: wann hat dies System eine Lösung, bei der nicht alle Unbekannten verschwinden? Wir haben schon gesehen, dass dies immer der Fall ist, wenn n >> m ist. Ist aber n 5 w*, so ist die nothwendige und hin- hinreichende Bedingung für eine solche Lösung die, dass alle w-reihigen Determinanten der Matrix verschwinden. Denn wenn eine von diesen nicht verschwindet, so sind nach §. 27, II. die Werthe der Unbekannten nothwendig Null, während, wenn sie
§. 28. Elimination. 103 alle verschwinden, eine Zahl v <^ n gefunden werden kann, so dass alle (y -j-1) reihigen Determinanten der Matrix Null sind, während von den v-reihigen wenigstens eine nicht verschwindet, so dass also nach §. 27, III eine Lösung von der verlangten Art vorhanden ist. Die Anzahl der aus einer Matrix von m Zeilen und n Colon- nen zu bildenden n-reihigen Determinanten ist, wenn n üg m ist) gleich der Anzahl der Combinationen von in Elementen zur wten Classe ohne Wiederholung, also (nach §. 7) gleich: m (m—1) . . . (in — w-f- 1) r72...n ' und so gross wäre also die Anzahl der Bedingungen. Ist n = m, so ist diese Zahl = 1 und wir erhalten den Fall §. 27, II. und wie zu erwarten war, eine Bedingung. Im Allgemeinen ist aber diese Anzahl der Bedingungen, obwohl sie alle erfüllt sein müssen, grösser als nöthig ist, weil einige von ihnen nothwendige Folgen der übrigen sind. Um ein System von notwendigen, hinreichenden und von einander unabhängigen Bedingungen zu erhalten, fassen wir die Fragestellung etwas präciser und fragen nach den Bedingungen: dass aus einem System von m linearen, homogenen Gleichungen mit n Unbekannten v von den Un- Unbekannten durch n — v willkürlich bleibende vollkommen bestimmt werden können. Auch diese Frage ist in §. 27 eigentlich schon beantwortet. Es muss unter den v-reihigen Determinanten eine von Null ver- verschieden sein, während die (y -\- l)reihigen alle verschwinden. Es genügt aber schon, wenn es von einer kleineren Anzahl der (v -j- 1)reihigen Determinanten feststeht, dass sie verschwinden. Nehmen wir an, die Unbekannten #» + 1, xv+z • • ¦ %n sollen willkürlich bleiben, xx, x2 . . . xr durch sie bestimmt sein, und nehmen die Determinante: Ä= a« als von Null verschieden an.
104 Zweiter Abschnitt. §•28. '¦ Wir berechnen'die" Unbekannten xly x2 . . .- xv nach §. 27, (9) und bilden die Summen §.27 A1), deren Verschwinden besagt, dass das gegebene Gleichlingssystem wirklich befriedigt ist. Die Bedingungen werden also: " . B) a<2>, af . . . af>, af af, a« oder anders geschrieben: C) o«), af = 0, und diese Bedingungen genügen auch. Die Gleichung B) oder C) ist aber identisch befriedigt, wenn h = 1, 2 . . . v oder Ja = 1, 2 ... v ist, und giebt also für diese Werthe keine Bedingung für die Coefficienten. Solche Bedingungen ergeben sich nur für . h = v -\- 1, v -f 2 . . . n - w ¦ k = v + 1, v -f 2 . . . m, also E) (» - v) (m - v\ der Zahl nach. Diese Bedingungen sind aber wirklich von einander unab- unabhängig , d. h. es folgt keine aus den übrigen; denn die linken Seiten von C) können durch geeignete Annahmen über die Coef- Coefficienten a für jede Indexcombination aus der Reihe D) einen ganz beliebigen Werth erhalten, wie man erkennt, wenn man sämmtliche a®, a® mit Ausnahme von affi gleich Null setzt. '§. 29. * ¦ Unhomogene lineare Gleichungen. Wir haben die Aufgabe, der. Auflösung linearer Gleichungen in den bisherigen Betrachtungen dadurch nicht unwesentlich vereinfacht und auf allgemeinere Gesetze zurückgeführt, dass wir die Gleichungen in Bezug auf die Unbekannten homogen
§. 29. Unhomogene Gleichungen. 105 vorausgesetzt haben. In den Anwendungen kommen aber häufig die Unbekannten nicht homogen vor, und wenn auch principiell der eine Fall von dem anderen nicht wesentlich verschieden ist, so wollen wir doch den Fall der nicht homogenen Gleichungen noch besonders betrachten. Wir können ihn aus dem Fall der homogenen Gleichungen dadurch ableiten, dass wir die Forderung hinzufügen, eine bestimmte der Unbekannten soll den Werth 1 haben. Wenn diese Unbekannte unter denen vorkommt, die das Problem willkürlich lässt, so entspringt daraus gar keine Schwierigkeit, weil wir sie ja nur = 1 zu setzen brauchen. Gehört sie aber zu denen, die durch die übrigen bestimmt sind, so müssen noch gewisse Bedingungen erfüllt sein, die besagen, dass der Werth 1 für diese Unbekannte zulässig ist. Wir wollen hier die Frage selbständig und in etwas geän- geänderter Bezeichnung behandeln, beschränken uns aber der Ein- Einfachheit halber auf den wichtigsten Fall, wo die Anzahl der Unbekannten mit der Anzahl der Gleichungen übereinstimmt. Es sei folgendes System von Gleichungen in Bezug auf die Unbekannten %, x2 . . . x„ aufzulösen: aVx1 + afx, -| \- aUxn = y, (]} o« xx + afx% H h «i2) *• = 2/2 a^x1 + af>x.2 -\ 1- a™xn = yn, worin dieCoefficientenaf-V und die unabhängigen Glieder yv y^...yn als gegeben betrachtet werden. Wir bezeichnen mit B) Ä = 2± af> af . . . «w die Determinante des Systems und wie früher mit Af^ die ersten Unterdeterminanten von A. Ist h einer der Indices 1, 2 ...» und multipliciren wir die Gleichungen A) der Reihe nach mit A*\ A® ... A^ und addiren sie dann, so erhalten wir C) xx i? af Af + x2 h 4> A$-\ h xn h a® Af = Syt Af. Nach §. 25, B) und F) verschwinden hier die Coefficienten der a?j, x2 . . . xn mit Ausnahme des einen Coefficienten von ajÄ, der den Werth A erhält, und sonach ergiebt sich: D) Axlc = ZtjiAg, und für den Fall, dass A von Null verschieden ist, können hieraus die Werthe der Unbekannten eindeutig
106 Zweiter Abschnitt. §.29. so berechnet werden, dass dadurch die Gleichungen A) wirklich befriedigt sind [§. 25, C), G)]. Setzen wir A® = A cc®, so können wir die Lösung in der Form schreiben: Xl = af>yx + «W yt ^ [~ «^V» deren Analogie^mit dem System A) in die Augen fällt. Wenn aber A = 0 ist, so lehren die Gleichungen D) nichts über die Werthe der x, sondern sie geben nur ein System von Bedingungen an, denen die y sicher genügen müssen, wenn die Gleichungen A) überhaupt lösbar sein sollen. Um zu einem allgemein gültigen Resultat zu kommen, verfahren wir ganz ähnlich wie bei den homogenen Gleichungen. Wir nehmen an, dass ausser der Determinante A auch noch alle Unterdeter- Unterdeterminanten bis zu einer gewissen Ordnung Null sind. Wir be- bezeichnen eine nicht verschwindende v-reihige Unterdeterminante mit F) B = o«, o o« o«, a« . . . o« ihre Unterdeterminanten mit B£\ worin h, h nur die Werthe von 1 bis v durchlaufen, und setzen nun voraus, alle (y -)- 1)- reihigen Unterdeterminanten von A verschwinden. Wenn wir die ersten v Gleichungen des Systems A) mit B%\ B$ ...Bf? multipliciren und addiren, so folgt [§.25, B), F)]: G) Bxk = '/t y% — z, xs z, Hit a-k , »¦ + 1,1- l,r Hierdurch sind v der Unbekannten x durch die übrigen bestimmt, und wir setzen, um zu sehen, inwieweit hierdurch die Gleichungen A) befriedigt sind, die Ausdrücke in A) ein. Wir multipliciren hierzu G) mit a<*), wo A die Werthe 1, 2 ...» durchläuft, und summiren in Bezug auf fc. So folgt: (8) B X afxu = 2 Bfa^ — z, xs * + !,» 1,» a (?) „$¦)
§. 29. Unhomogene Gleichungen. 107 und wenn wir beiderseits B h afook v + l,n addiren: (9) B 2 aPxt = 2 Bf a$ yt + 2 xs (b af - 2 Bf af l,n 1,* » + 1,» \ 1>* Nun ist nach §. 26, A2) der Coefficient von xs auf der rechten Seite eine (v -f- 1) reihige Unterdeterminante von A und also nach der Voraussetzung gleich Null. Nach A) soll 2 agix* = yi sein, und folglich genügen die Ausdrücke G) dann und nur dann den Gleichungen A), wenn A0) Byx = %$Bfog>yt l,v ist. Diese Gleichung ist, wenn X 5 v ist, wegen §. 25, B), F) immer befriedigt. Ist aber l = v -\- 1, v -f- 2 . . . n, so sind n — v Bedingungen für die y in A0) enthalten, die, da jede Bedingung eine neue der Grossen y enthält, von einander unab- unabhängig sind. Ist eine dieser Bedingungen nicht erfüllt, so hat das gegebene Gleichungssystem keine Lösung. Wenn wir in dem Gleichungssystem A) die x nicht als Unbekannte, sondern als Veränderliche betrachten, so werden auch die y veränderliche Grossen sein. Bei dieser Auffassung nennen wir das System A) eine lineare Substitution, inso- insofern dadurch der Uebergang von einem System von Variablen, zum anderen vermittelt wird. Nur wenn die Determinante A, die wir jetzt die Substitutions-Determinante nennen, von Null verschieden ist, werden die y als unabhängige Variable an- angesehen werden können. Ist dies der Fall, so ergiebt das System E) die Darstellung der Variablen x durch die y oder die zu A) inverse Substitution. Das bisher Bewiesene wollen wir schliesslich noch in einen allgemeinen Satz zusammenfassen. Ein System von m linearen Functionen j^, y2 . . . ym der n-Veränderlichen x1: x2 . . . xn, das durch die Ausdrücke: A1) yi = af>x1Jra^x2^-a^xn, i = 1, 2 . . . m bestimmt ist, heisst linear unabhängig, wenn eine Gleichung
108 Zweiter Abschnitt. §. 30. A2) hyi + hy-2-] \-i»y* = o mit constanten Coefficienten Xu A2 . . . lm identisch (d. h. für alle xx . . . x„) nur dann bestehen kann, wenn die l alle verschwinden. Im entgegengesetzten Fall heisst das System yt linear ab- abhängig. Dann gilt der Satz: V. Wenn die Functionen ylt y2 . . . ym linear unab- unabhängig sind, so lassen sich die %, x% . . . xn immer so bestimmen, dass die t^, y% . . . ym beliebig gegebene Werthe erhalten. Die Richtigkeit dieses Satzes ergiebt sich aus der Erwägung, dass nach §. 27, I und III die y< nur dann, und immer dann linear unabhängig sind, wenn m < n ist, und wenn aus der Matrix der Coefficienten a® wenigstens eine nicht verschwindende »w-reihige Determinante gebildet werden kann. §. 30. Multiplication von Determinanten. Der Satz, den wir jetzt noch beweisen wollen, lehrt, wie man das Product zweier Determinanten von gleich viel Reihen durch eine einzige Determinante von ebenso viel Reihen dar. stellen kann. Man wird am einfachsten darauf geführt, wenn man die Auflösung von zwei Systemen linearer Gleichungen betrachtet. Es seien jetzt die Coefficienten af\ bf\ wenn i, h die Reihe der Zahlen 1, 2 ... n durchlaufen, beliebige veränderliche Grossen, ebenso die Grossen a?,-, yi, £», die nur an die Relationen gebunden sind: A) S afxi = yk, B) . Zlfyie = zh: Wenn nun die Aufgabe gestellt wird, die "Variablen x durch die Variablen z zu bestimmen, so kann diese Aufgabe auf dop- doppelte, Art gelöst werden. Man kann nach §. 29, D) die Gleichungen A) in Bezug auf x, die Gleichungen B) in Bezug auf y auflösen, und die letzteren Ausdrücke in die ersteren ein- einsetzen. Bezeichnen wir mit A, _B die Determinanten der beiden Gleichungssysteme, also:
§.30. Multiplioation von Determinanten. 109 A = af\ af . . . oW »(> a< 6«, &« . b<*>, bf . bf und mit Af\ Bf* die ersten Unterdeterminanten, so erhält man C) Axt = D) Byt = und durch Substitution von D) in C): Man kann aber auch so verfahren, dass man aus A) die Ausdrücke für y in B) einsetzt, wodurch man, wenn F) gesetzt wird, erhält: 0) Wenn man nun (8) C = cf\ setzt, und mit C^ die Unterdeterminanten von C bezeichnet, so ergiebt die Auflösung von G): (9) C& =Seh Cih\ und die Vergleichung von E) mit (9) ergiebt A0) AB == G, und für die Unterdeterminanten A1) CP = ZAfBi\ In dieser Schlussweise ist aber noch eine Lücke, bedingt durch den Zweifel ob sich E) von (9) nicht durch einen beiden Seiten gemeinschaftlichen Factor unterscheiden könnte. Diesen Zweifel kann man durch eine sehr einfache Ueberlegung begegnen, die sich auf die Unzerlegbarkeit der Determinante (§. 25, X) und auf die Betrachtungen des §. 20 stützt. Es ergiebt sich nämlich
110 Zweiter Abschnitt. §. 30. zunächst durch die Vergleichung von E) und (9), wenn alle aÄ*' ^ ^ a^s unabhängige Variable betrachtet werden: CZzh hÄf Bf = ABZzh Cf\ und daraus Nach §. 20 muss der unzerlegbare Factor A in einem der Factoren der linken Seite aufgehen, und da die A^ von nie- niedrigerem Grade sind als A, so kann dies nur C sein. Aus dem gleichen Grunde muss B in G aufgehen und die Vergleichung der Grade und des ersten Gliedes giebt G = AB. Man kann aber auch auf einem mehr rechnenden Wege zum Ziele gelangen. Wir wollen das Hauptglied der Determinante G nach F) bilden, indem wir mit sl5 s2 . . . s„ von einander unabhängige Summationsbuchstaben bezeichnen, die von 1 bis n laufen: • . • Cn «1, Die Pennutation der unteren Indices der c entspricht der Permutation der unteren Indices der a, und wenn man also mit Rücksicht auf die Vorzeichenregel die Determinante G bildet, so erhält man A3) S-_ . . Vn £i 2C $1 •M'2 • • • "w Nun ist y? -\- n(s0 n,C3) n} n) — 12 n nach §. 24, VI. immer dann gleich Null, wenn unter den sx, s.2...s„ zweimal dieselbe Ziffer vorkommt; es behalten also nur die Glieder in A3) einen von Null verschiedenen Werth, in denen Sj, s2 . ... sn eine Anordnung der Indices 1, 2 . . . n ist, und zwar ist dieser Werth -\-A oder —A, je nachdem diese Anord- Anordnung zur ersten oder zur zweiten Art gehört (§. 24, IV). Demnach wird die rechte,Seite von A3): A s i x öi' »2 . . . on ,
§. 30. Multiplioation von Determinanten. 111 die Summe erstreckt über alle Permutationen sl7 s2 . . . sn. Diese Summe ist aber gerade die Determinante B und daher die Formel C = AB bewiesen. Das in der Formel F) enthaltene Bildungsgesetz der Ele- Elemente cf> können wir in Worten so ausdrücken: Um die Elemente der Determinante G, die das Product der beiden Determinanten A, B ist, zu erhalten, multiplicirt man die Elemente je einer Colonne von^. mit den entsprechenden Elementen einer Colonne von B und addirt die Producte. Nach den Sätzen über die Determinanten kann man die Form von G in mannigfacher Weise abändern. Wir wollen darüber Folgendes bemerken. Wenn man zwei Colounen in A oder in B vertauscht, so andern sich die Elemente cf> nicht, sondern vertauschen sich nur unter einander. Wenn man aber zwei Zeilen in A oder in B vertauscht, so ändern sich die c^, indem die Factoren in den einzelnen Pro- ducten der Summe anders zusammengefasst werden; wenn man aber entsprechende Vertauschungen in den Zeilen von A und von B gleichzeitig vornimmt, so bleiben die cf> ungeändert, weil dadurch nur die einzelnen Glieder der Summe vertauscht werden. Indem man in A oder in B oder in beiden zugleich die Zeilen zu Colonnen macht, erhält man noch drei verschiedene Arten für die Bildung des Products zweier Determinanten in Determinantenform. Letzteres kann man auch so ausdrücken: Um das Product zweier Determinanten zu bilden, kann man die Elemente der einzelnen Zeilen oder Colonnen des einen Factors mit den ent- entsprechenden Elementen der Zeilen oder der Co- Colonnen des anderen Factors multipliciren und die Producte addiren, und diese Productsummen als Elemente einer neuen Determinante auffassen. Auf ein Product zweier Determinanten mit verschiedener Elementenzahl lässt sich die Multiplicationsregel dadurch an-
112 . Zweiter Abschnitt. §. 30, wenden, dass man die Determinante mit geringerer Reihenzahl durch den Satz §. 25, IX. in eine andere mit mehr Reihen ver- verwandelt. Das Multiplicationstheorem gestattet noch eine Verall- Verallgemeinerung, die sich mit denselben Mitteln ableiten lässt. Wir erweitern die Formel F) dahin, dass wir setzen A4) cf> = 2 aP 6?\ l,m worin wir aber jetzt die Anzahl m der Summanden auf der rechten Seite grösser als n annehmen wollen, während i und h nach wie vor von 1 bis n laufen sollen. Wir bilden nun das Product wie in A2), und bilden die Determinante A3) ganz wie oben, nur mit dem Unterschiede, dass die Summationsbuchstaben s17 s2 . . . s„ jetzt von 1 bis m laufen. Wählen wir unter den Ziffern 1, 2 ...» irgend eine Com- bination von n verschiedenen Ziffern «j, k2 . . . «„aus, so enthält die jetzt erweiterte Summe A3) alle Producte von der Form s ± <&° <&>... ay, s ± bp> if*... *4H aber keine anderen Glieder, und die Determinante der 4A) ist also gleich der Summe aller dieser Producte. Wir haben also den folgenden Satz: Wenn die Elemente der Determinante fi -y I .0) .,B) J") die Form A4) haben, worin m >> n ist, so wähle man unter den Ziffern 1,2 . . . m auf alle möglichen Arten n verschiedene aus, die in einer beliebigen, aber festen Reihenfolge mit %, cc2 . . . <x„ bezeichnet werden. Ist dann jLa — ¦" it «i «2 . . ¦ a„ A5) Ba = s± if° if*... i{:«), so ist A6) C=2AaBa, wenn sich die Summe auf alle möglichen Combinationen der k erstreckt. Die Anzahl der Glieder dieser Summe ist gleich der Anzahl
§.31. Determinanten der Unterdeterminanten. 113 der Combinationen ohne Wiederholung von m Elementen zur »ten Classe, also (§. 7): m (m — 1) (m — 2) . . . (m — n -j- 1) 1 . 2 . 3 . . . n §• 31. Determinanten der Unterdeterminanten. Wir machen hier gleich eine Anwendung von dem Multi- plicationsgesetz der Determinanten. Es sei wie bisher: A) und B) A = %f\ af . . . al ß) Af\ Af . . . . A (n) A(n) A'.n) das System der Unterdeterminanten. Bilden wir aus B) die Determinante, die wir mit A bezeichnen wollen, so können wir auf das Product AA die Multiplicationsregel anwenden. Dies giebt aber nach §. 25, C) und G): J, 0 ... 0 0, A ... 0 A/l = = An, 0, 0 ... A und daraus durch Division mit A: C) A == An~\ Es ist also A die (n — l)te Potenz von A. Bei dieser Ableitung ist allerdings zunächst vorausgesetzt, dass A von Null verschieden sei. Da aber C) in Bezug auf die Elemente af* eine Identität ist, d. h. auch dann gilt, wenn diese Grossen unabhängige Variable sind, so folgt, dass auch noch in diesem Ausnahmefall die Formel C) gilt, d. h. dass,- wenn A ver- verschwindet, auch A verschwindet. Weber Algebra. I. 8
114 Zweiter Abschnitt. §.31. Dies Ergebniss ist ein specieller Fall eines 'allgemeineren- Satzes, nach dem jede beliebige Determinante der Matrix B) gebildet werden kann. Betrachten wir die D-reihige Unterdeter- Unterdeterminante D) w A™, aus der man durch Permutation der oberen und unteren Indices alle anderen v-reihigen Unterdeterminanten ableiten kann, so kann man die Multiplicationsregel anwenden, indem man dy nach der Bemerkung des letzten Paragraphen in eine w-reihige Determinante verwandelt: E) -eil i -"-2 • • • -a-y , Ji-v + i • . . -n-n 0, 0 0, 1 0 0, 0 ... 0, 0 ... 1 wobei n — v Zeilen und Colonnen beigefügt sind, von denen die ersteren ausser in den Diagonalgliedern lauter Nullen haben. Bildet man jetzt das Product Adv, so folgt F) AA = A, o, o, o, 0 0 0 0 und dies ist nach dem ... 0,a . . . A, a, ... 0, a! ... 0, a[ Satz IX., a(«) %u... r+l1). • • §. 25 . . c&+1 a i) n «S? at ) 3 Dividirt man hier durch A und wendet die Bezeichnung des §. 26 an, so folgt G) j* = A'^Aft::::.
§¦ 32. Determinantensatz von Sylvester. 115 Für v = 2 ergiebt sich das specielle Resultat (8) Die Formel (8) werden wir später öfter benutzen. In der Bezeichnung durch die Differentialquotienten lässt sie sich so darstellen _ dA dA dA dA p 8 af ~ 8 a<-p 8 af 8 af 8 a<£)' Besonders wichtig ist sie in dem Falle, wo A eine sym- symmetrische Determinante ist, wo also af> = aj>) ist; dann ist auch ZA _ dA worin bei der Differentiation nicht Rücksicht genommen ist auf die Abhängigkeit af> = ag>; dann wird die Formel (9) dA /8iV ) A0) A ?) 8 af> ~~ 8 a« 8 af \d af>) §. 32. Determinantensatz von Sylvester. Die zuletzt erhaltenen Resultate lassen sich noch in einer anderen Weise verallgemeinern nach einem Satze von Sylvester, den wir hier noch nach dem Vorgange von Frobenius beweisen wollen. Es sei A) A = 2±cPctf>...c&y eine Determinante, r irgend eine Zahl < n und B) Ar=Z±aWafK..arr) von Null verschieden. Mit A^ bezeichnen wir jetzt die Unter- Unterdeterminanten von Ar (nicht von A), und bilden das Product der beiden Determinanten
116 Zweiter Abschnitt. §.32. dessen Werth, was auch die T sein mögen, nach §.31 C) und §. 25, IX. den Werth D) AAnr~x hat. Bestimmen wir die Y und eine weitere Reihe von Grossen B^ aus den Gleichungen -.. + a? Ff + af^Ar = 0 aV Yf + «?> 4- = 0 et, = r -\- 1^. . .. n so folgt durch Elimination von Yf . . . Y(p nach §. 29, II. und §• 36, A3) F) a(*> . . . o« af a« . . . a«, af a^ . . . a(r\ affl et ct. ' it. und die Multiplication der beiden Determinanten C) ergiebt Ar, , 0, 0, , 0 , . . ., il-fj-i, JJr+i , . . ., -D^4 worin die X gewisse r-reihige Determinanten sind, auf deren Kenntniss es nicht ankommt Der Werth dieser Determinante ist aber nach §. 25, IX. und hieraus und aus D) ergiebt sich die Relation von Syl- Sylvester: G) 2 ± B?+P . . . B£° = Anr-r~x A, wo die Bf die Bedeutung F) haben, und die für r = n — 2 in die Relation §. 31, (9) übergeht1). x) Sylvester, Philosophical Magazine 1851. Frobenius, Crelle's Journal, Bd. 86, S. 53. Sitzungsberichte d. Berliner Akademie 1894, XII, XXIII.
Dritter Abschnitt. Die Wurzeln algebraischer Gleichungen. §. 33. Begriff der Wurzeln. Mehrfache Wurzeln. Nachdem in den beiden ersten Abschnitten die algebraischen Grossen mehr von der formalen Seite betrachtet waren, wobei es sich um identische Umformungen von Buchstabenausdrücken handelte, in denen die Buchstaben durchweg als Symbole für variable Grossen aufgefasst werden konnten, treten nun die Zahlengrössen mehr in den Vordergrund. Wir verstehen hier unter Zahlen, gemäss dem in der Ein- Einleitung Festgesetzten, reelle oder imaginäre Grossen von der Form a-\- bi, und stellen die reellen Grossen zur Veranschau- Veranschaulichung durch die Punkte einer geraden Linie, die imaginären durch die Punkte einer Ebene dar. Unter dem absoluten Werth einer imaginären Grosse a -\-bi verstehen wir ]/a2-j-&2 und bezeichnen ihn nach Weierstrass mit | 0 + 6» |. Es sei nun A) f(z) = aox» -^a^»-1 + o,«»-» -| \-an eine ganze Function von x, worin die Coefficienten irgend welche reelle oder imaginäre Zahlen sind, und der erste, a0, von Null verschieden vorausgesetzt wird. Wenn a eine Zahl ist, die für x gesetzt die Function f{x) zu Null macht, die also der Bedingung /(«) = 0 genügt, so heisst « eine Wurzel der Gleichung f(x) = 0.
118 Dritter Abschnitt. §. 33. Wir sagen auch kurz, a ist eine Wurzel von f(x). Nach §. 4 lässt sich dann f(x) durch x — « ohne Rest theilen, so dass man B) f(x) = (x-a)f1(x) setzen kann, worin fx (x) nur vom (n — l)ten Grade ist, und den- denselben ersten Coefficienten a0 hat, wie f(x), also fx (x) = a0 x»-1 -f- a\ xn~2 -| Die Coefficienten von _/i (x) sind in §. 4 F) angegeben. ¦Jede Wurzel von fi(x) ist also zugleich Wurzel von f(x) und umgekehrt ist jede Wurzel von f(x) entweder = « oder eine Wurzel von fx (x). Wenn eine Wurzel a von f(x) bekannt ist, so ist die Aufgabe, die übrigen zu finden, auf die Lösung einer Gleichung (n — l)ten Grades zurückgeführt. Das Ziel der Betrachtungen dieses Abschnittes besteht in dem Nachweis, dass jede Function f(x) vom nten Grade wenigstens eine Wurzel hat. Dieser Satz heisst der Fundamentalsatz der Algebra. Zunächst ziehen wir aus B) die wichtige Folgerung: L Eine Gleichung nten Grades kann nicht mehr als n Wurzeln haben. Denn hätte / (%) mehr als n Wurzeln, so hätte fx (x), was nur vom (n — l)ten Grade ist, mehr als n — 1 Wurzeln. Eine Gleichung ersten Grades hat aber nicht mehr als eine Wurzel, woraus die Richtigkeit unseres Satzes durch vollständige Induction folgt. Man giebt ihm bisweilen auch den Ausdruck II, Wenn eine Function nten Grades f(x) mehr als n Wurzeln hat, so müssen alle ihre Coefficienten Null sein. Ist ß eine Wurzel von _/i (x), so lässt sich ebenso setzen /i (*) = (* — /») f» (*), f(x) = (x — «)(x- ß)f2 (x), worin f3(x) = a0xn—2 -)-••• nur vom (n — 2)ten Grade ist. Nimmt man also an, dass jede der Functionen, die man durch diese Division erhält, fi(x), f$(x) . . . wenigstens eine Wurzel habe, so erhält man schliesslich C) f(x) = ao(x — a) (x — ß) . . . (x — v), und wir können also den Satz, den wir vorhin als das Ziel unserer Betrachtungen bezeichnet haben, auch so aussprechen: Es soll bewiesen werden:
§. 34. Stetigkeit. 119 Eine Function nten Grades lässt sich in n lineare Factoren zerlegen. Die Grossen a, ß . . . v sind dann alle Wurzeln von f(x) und ihre Zahl ist also n. Es ist aber nicht ausgeschlossen, dass unter den k, ß . . . v dieselbe Zahl mehrmals vorkommt. Dann würde / (x) weniger als n Wurzeln haben, während doch der Satz bestehen bleibt, dass f(x) in n lineare Factoren zerlegbar ist. Um die Uebereinstimmung herzustellen, ist man überein- übereingekommen, wenn x — a mehrmals in f (x) aufgeht, a unter den Wurzeln mehrfach zu zählen und also von einfachen, zweifachen, dreifachen etc. Wurzeln zu sprechen. Führen wir die derivirten Functionen ein, indem wir in §. 13, B) k und x — a an Stelle von x und y setzen, so folgt: D) f(x) = /(«) + (*-«) /' («) + ^=^ /" («) Wird also nun wieder angenommen, dass /(«) verschwindet, so ergiebt sich also Es ist also a eine Doppelwurzel von f(x), wenn mit /(«) gleichzeitig /'(os) verschwindet. Auch die Formel D) zeigt, dass nur unter dieser Voraussetzung f(x) durch (x — «J theilbar ist. Diese Schlussweise lässt sich weiter ausdehnen und führt zu dem Satze: III. Die nothwendige und hinreichende Bedingung dafür,' dass « eine »«-fache Wurzel von f(x) ist, ist die, dass /(«), /'(es), /"(«), • . . /^-^(a) ver- verschwinden, ßm)(cc) nicht verschwindet. §• 34. Stetigkeit ganzer Functionen. Wenn, wie bisher A) f(x) = a0 x» -f 0! x»-1 -) \-an eine ganze Function von x ist, so beweisen wir zunächst fol- folgenden Satz:
120 Dritter Abschnitt. §.34. IV. f{x) wird zugleich mit x unendlich gross. Das will sagen, wenn C eine beliebig gegebene positive Zahl ist, so kann man die positive Zahl It so wählen, dass \f(x)\>C wird, sobald der absolute Werth von x grösser als It wird; oder geometrisch ausgedrückt: man kann in der »-Ebene einen Kreis um den Nullpunkt so beschreiben, dass ausserhalb dieses Kreises der absolute Werth von fix) nicht mehr unter C herabsinkt, wie gross auch C angenommen ist. Der Satz ist einleuchtend für den Fall einer einfachen Potenz x"; denn ist r der absolute Werth von x, so ist r* der absolute Werth von xn, und r* ist, sobald r grösser als 1 geworden ist, grösser als r und wächst also mit r ins Unendliche. Um den Satz allgemein zu beweisen, bezeichnen wir die absoluten Werthe von x, a0, a1? a2 . . . an mit r, c0, cu c2 . . . c„. Dann ist BV fix) — r* aa A - -I—2. _i_ . . . __2. und, weil nach den in der Einleitung bewiesenen Sätzen der absolute Werth einer Summe nicht kleiner als die Differenz und nicht grösser als die Summe der absoluten Werthe der Sum- Summanden sein kann, xn 1 _|_ _-L 4_ _ x x2 ~*~ aJ* e2 Da die c0, cx . . . c„ fest gegebene Constanten sind, so kann man E so gross wählen, dass, sobald r > It ist, y l ^2 I yn beliebig klein, z. B. kleiner als x/a Co wird; dann ist , a« , , an a0 -\- und also nach B) also, wenn man x > Va Co, annimmt,
§. 34 Stetigkeit. 121 C) Hieran schliesst sich der Satz V. f(x) ist eine stetige Function von x. Damit soll Folgendes gesagt sein: Ist der absolute Werth von x kleiner als eine beliebige endliche Grosse R, so kann man, wie klein auch die positive Grosse ca angenommen wird, eine positive Grosse e derart finden, dass D) l/(* + A)-/(*)!<« wird, so lange der absolute Werth p von h kleiner als s bleibt, und zwar so, dass s nur von der Wahl von ca, nicht aber von x abhängig ist (gleichmässige Stetigkeit). Nach §. 13, B) ist E) /(* + h)-f(x) = hf{x) ^ ^ Nehmen wir nun den absoluten Werth von h kleiner als 1 an, so ist der absolute Werth der in der Klammer stehenden Grosse F) /'(x) -(- — /" (x) -)-•••-)- »o hn~i kleiner als eine bestimmte von Null verschiedene Zahl k, die man erhält, wenn man in F) h durch 1, die Coefficienten «o > % ... an—i durch ihre absoluten Werthe und x durch B ersetzt, weil dadurch jedes einzelne Glied der Summe F) durch seinen absoluten Werth oder durch eine grössere Zahl ersetzt wird. Wählt man £ so klein, dass £k < ca ist, so ist wegen E) die Forderung D) erfüllt, so lange Q < £ bleibt. Wir können dem Satze von der Stetigkeit der Function f(x) noch einen etwas anderen Ausdruck geben, der uns für die Folge wichtig ist. Nach dem Satze, dass der absolute Werth einer Summe von zwei Gliedern der Grosse nach zwischen der 'Summe und der Differenz der absoluten Werthe der Glieder liegt (vergl. Einleitung, S. 21, 22), erhalten wir aus E), wenn wir
122 Dritter Abschnitt. §. 34. 9>(A) = hf(x) + T^f"(x) + • • • +• »"«o setzen, \f(x) | - | 9(Ä) ! < |/(* + A) | < \f<x) | + I 9>(A) I. oder - I -9>(A) l< l/(* + A) I - I/O») I < I 9(A) |. Nun ist, wenn q < £ ist, | cpQi) | < co, und wir können also auch sagen VI. Der absolute Werth der Differenz I/O«+ A)|-|/(*) I ist kleiner als eine beliebig gegebene Grosse co, sobald der absolute Werth von h kleiner als ein genügend kleines s ist. Daraus können wir noch schliessen, wenn wir x. = y -\- ig setzen, und h entweder reell oder rein imaginär annehmen, dass \f{y-\-zi)\ bei feststehendem z eine stetige Function von y und bei feststehendem y eine stetige Function von z ist. VII. Sind die Coefficienten a0, %...«„ und die Va- Variable x reell, so kann man x dem absoluten Werthe nach so gross wählen, dass das Vor- Vorzeichen von fix) mit dem Vorzeichen des ersten Gliedes aox" übereinstimmt, also bei positivem a0 und geradem n positiv, bei ungeradem n für negative x negativ und für positive x positiv wird. Denn man kann in x dem absoluten Werthe nach so gross wählen, dass der absolute Werth von «1 I «2 , _|_ fl« X ' X "¦" ' ' Xn unter den von cto heruntersinkt und also der Klammerausdruck das Vorzeichen von a0 hat, was es dann für jedes absolut grössere x beibehält.. .
§. 35. Vorzeichenwechsel. ]23 §. 35. Vorzeichenwechsel von f(x). Wurzeln von Gleichungen ungeraden Grades und von reinen Gleichungen. Auf Grund der Sätze des vorigen Paragraphen können wir das folgende wichtige Theorem beweisen: VIII. Sind die Coefficienten von f(x) reell und exi- stiren zwei reelle Werthe a, b von x, so dass f(a) und f(b) entgegengesetzte Vorzeichen haben, so giebt es zwischen a und b wenigstens eine Wurzel % der Gleichung f(x) = 0. Wir wollen annehmen, es sei a < b und f(a) negativ, f(b) positiv. Wir theilen die Zahlen zwischen a und b so in zwei Theile 91 und SB, dass eine Zahl « zu 91 gehört, wenn zwischen « und a, die Grenzen eingerechnet, kein x liegt, wofür f(x) positiv wird, und eine Zahl ß zu SB, wenn zwischen ß und a wenigstens ein Werth von x liegt, für den f (x) positiv wird. Ein Drittes ist offenbar nicht möglich und jede Zahl zwischen a und b ist also in 91 oder in SB untergebracht. Wir rechnen noch die Zahlen, die kleiner als a sind, zu 9t, und die grösser als b sind, zu SB. Gehört « zu 91, so gehört auch jedes x, was kleiner ist als «, zu 91, und gehört ß zu SB, so gehört jedes grössere x zu SB. Es ist also jedes ß grösser als jedes « und die beiden Zahlengebiete 91, SB bilden einen Schnitt (Einleitung, S. 5) der durch eine Zahl § erzeugt wird, so dass jede Zahl «, die kleiner als § ist, zu 91 gehört, jede Zahl ß, die grösser als g ist, zu SB. Ist nun für irgend eine Zahl x0 der Werth von f(x0) negativ oder positiv, so lässt sich nach V. des vorigen Paragraphen eine positive Grosse s so bestimmen, dass für jedes x zwischen x0 — e und x0 -|- « die Werthe von f(x) immer negativ oder immer positiv sind. Daraus ergiebt sich, dass /(£) weder negativ noch positiv sein kann und also Null sein muss. Denn wäre /(§) negativ, so wäre auch f(x) zwischen § und § -|- e negativ; diese Werthe würden also zu 21 gehören, während sie doch grösser als £ sind; und wäre /(£) positiv, so wäre f(x) positiv, so lange x zwischen | — £ und | liegt; diese Werthe würden also, obwohl sie kleiner als | sind, zu SB gehören, und beides ist nach der Definition von
124 Dritter Abschnitt. §. 35. § unmöglich. ¦ Ganz ähnlich kann geschlossen werden, wenn f(a) positiv und f(b) negativ ist und nnser Satz ist also erwiesen. Hieraus ziehen wir zwei wichtige Folgerungen: Wenn /(§) verschwindet, so lässt sich ein Intervall | — £ <X <%-\- S so bestimmen, dass f(x) ausser für x = § in diesem Intervall nicht verschwindet. Es sind dann vier Fälle in Bezug auf die Vorzeichen von / (x) in den beiden Intervallen § — s < x < § und | < x < % -\- s möglich, die im folgenden Schema zusammen- zusammengestellt sind: §-£<£<! + * !•/(*) + - 2.f(x) - + ,3. /(*) + + 4. f{x) - -. Ist /w(a?) die erste unter den Derivirten von f(x), die für x = | von Null verschieden ist, so zeigt die Formel [§. 13, B)] dass diese vier Fälle durch folgende Kennzeichen unterschieden sind: 1. v ungerade /« (£) < 0 2. v ungerade /« (£) > 0 3. v gerade /« (£) > 0 4. v gerade /« (|) < 0. Wir sagen, dass im ersten Falle /(#) abnehmend, im zweiten wachsend durch Null geht. Im Falle 3. ist /(§) = 0 ein Minimum, im Falle 4. ein Maximum. Wenn insbesondere /'(§) von Null verschieden, § also eine einfache Wurzel ist, so ist das positive oder negative Vorzeichen von /' (|) das Kennzeichen für das Wachsen oder Abnehmen der Function f(x) beim Durchgang von x durch |. Wir beweisen mit diesen Hülfsmitteln noch zwei weitere wichtige Sätze. IX. Die Gleichung xn — a = 0 hat, wenn a eine positive Zahl ist, eine und nur eine positive Wurzel.
§. 35. Wurzeln reiner Gleichungen. 125 Denn setzen wir A) f(x) = x"-a, so ist f(x) nach §.34, VII. für ein hinlänglich grosses positives x positiv, und für x = 0 negativ; also giebt es einen positiven Werth von x, den man mit ]/ä bezeichnet, für den f(x) ver- verschwindet. Dass es aber nur einen solchen Werth geben kann, folgt daraus, dass xn, so lange x positiv bleibt, mit x fortwährend wächst Ist n ungerade, so existirt auch für negative a eine und nur eine negative Wurzel von A), was ebenso bewiesen wird. X. Eine Gleichung ungeraden Grades mit reellen Coefficienten hat immer wenigstens eine reelle Wurzel. Denn nach §. 34, Satz VII. kann f(x), wenn der Grad un- ungerade ist, sowohl positiv als negativ werden und f(x) = 0 hat also nach VIII. eine Wurzel. Wir beweisen endlich noch XI. Eine reine Gleichung hat immer eine Wurzel. Unter einer reinen Gleichung verstehen wir eine Gleichung von der Form B) xn — a — 0, wo a eine beliebige reelle oder complexe Grosse ist, Dass diese Gleichung für ein reelles positives a immer eine Wurzel hat, ist oben schon bewiesen, und für a = 0 wird sie offenbar durch x = 0 befriedigt. Der allgemeine Beweis kann in zwei Theile zerlegt werden; es genügt nämlich, wenn wir zunächst n = 2, dann n ungerade voraussetzen. Denn existirt die Grosse ~^ä und ^f a oder V'a für jedes a, so ist auch die Existenz von also von 1/a für jedes beliebige n sichergestellt. Es würde sogar genügen, die Existenz von p*'a für den Fall zu beweisen, dass n eine Primzahl ist. Daraus ist aber zunächst kein beson- besonderer Vortheil zu ziehen. Wir bezeichnen die complexe Grosse a mit b -\- c i und setzen, da x im Allgemeinen auch complex sein wird, x = y -\- i s.
126 Dritter Abschnitt. §. 35. Dann haben wir zunächst zu zeigen, dass C) (y + t*)» = & + »c welche reellen Werthe auch b, c haben mögen, durch reelle y, s befriedigt werden kann. Die Gleichung C) ist aber erfüllt, wenn D) 2/2_22 = &) 2yz = c, also . (yt _|_ ^2J _ £2 _|_ C2 und folglicli E) «/2 -f 22 = Vb2 + c2. Nach IX. existirt immer eine positive Quadratwurzel V&2 -\- cK Aus D,) und E) folgt nun b + VP-+T2 — & 4- * = 2 ' * =2 ' und die beiden Grossen + b -\- 'Vb^_-\-_ci sind offenbar positiv, da &2 + c2 > &2, also auch V&2 -j- c2 > V^ Wir erhalten daraus 2 2 worin aber das eine Vorzeichen durch das andere bestimmt ist durch die Bedingung 2yz = c; eines der beiden Vorzeichen aber bleibt willkürlich, so dass wir nicht nur eine, sondern zwei (entgegengesetzte) Lösungen von C) erhalten. Es sei ferner n ungerade; wir nehmen die zu lösende Gleichung in der Form an F) {y -\- i z)n = b 4- c i. Ist c = 0, also a reell, so können wir z = 0 setzen und erhalten nach IX. einen reellen Werth von x.. Nehmen wir aber c von Null verschieden an, so folgt aus F) (Einleitung, S. 21) G) (y — izf = b — c i. Multipliciren wir die beiden Gleichungen F), G) mit ein- einander, so folgt tyt _|_ giy> _ -ja 4. c\ und daraus (nach IX.)
§. 36. Keine Gleichungen. 127 (8) «/a _|_ Si = yb* + c2, wodurch der absolute Werth von x bestimmt ist. Es ergiebt sich ferner aus F) und G) -*<o = 0- ) = 2 2 Nun ist cp(y,z) eine ganze homogene Function wtenGrades der beiden Veränderlichen y, 0, und zwar mit reellen Coeffi- cienten (da die Vertauschung von i mit —¦ i in <p(y, z) nichts ändert), und wenn wir nach absteigenden Potenzen von y ordnen, so ist das erste Glied cyn, also nach Voraussetzung von Null verschieden. Setzen wir nun V = *>e, so erhalten wir aus (9) A0) cp (A, 1) = 0, also eine Gleichung wten Grades für X, die nach X. gewiss eine Wurzel hat. Ist l bestimmt, so folgt aus (8) Hierdurch sind die Gleichungen (8), (9) thatsächlich befrie- befriedigt; aus (9) aber folgt (y + * z)n («/ — * z)n b -\- ic b — *c ' und aus (8), dass der gemeinsame Werth dieser beiden Brüche + 1 ist. Wir haben daher (y -j- ig)» = ± (b -j- ci), (y — iz)n = ± (b — ci), und es kann also das Vorzeichen der Quadratwurzel in A1) so bestimmt werden, dass die Gleichungen F) und G) erfüllt sind §. 36. Lösung reiner Gleichungen durch trigonometrische Functionen. Weit vollständiger und einfacher kann die Auflösbarkeit einer reinen Gleichung dargethan werden, wenn man die trigono- trigonometrischen Functionen und ihre einfachsten Eigenschaften als bekannt voraussetzt. Freilich sind diese Functionen der eigent-
128 '; Dritter Abschnitt. §. 36. liehen Algebra fremd und darum ist es befriedigender die principiellen Fragen, so wie es im Vorhergehenden geschehen ist, und auch noch später geschehen soll, ohne ihre Hülfe zu beantworten. Für die Anwendung und eine bequemere An- Anschauung wollen wir aber dieses Hülfsmittel doch nicht ent- entbehren. Setzen wir, wenn b, c reelle Zahlen sind, A) b = r cos cp, c = r sin cp, so ist, wenn wir r positiv annehmen, der Winkel q> hierdurch bis auf ein Vielfaches von 2 n bestimmt. Er wird völlig be- bestimmt sein, wenn wir ein Intervall von der Grosse 2 % fest- festsetzen, in dem er liegen soll, z. B.: — a < y ^ a. In geometrischer Auffassung sind r, cp die Polarcoordinaten des Punktes, dessen rechtwinklige Coordinaten b, c sind. r ist der absolute Werth der complexen Grosse a = b -\- c i und cp wollen wir die Phase dieser complexen Grosse nennen. Das Product zweier complexen Grossen , . a = r (cos (p -\- i sin cp) \ ' a' — r' (cos <p' -\- i sin cp'), ergiebt sich in der Form C) aa' = rr'[cos (cp -|- cp') -j- isin (q> + <p')], und daraus erhält man, wenn n eine beliebige ganze positive (oder selbst negative) Zahl ist, den nach Moivre benannten Lehrsatz: D) (cos (p -f- * sin (jp)" = cos n cp -\- isrnn cp, der dazu geführt hat, die Grosse cos cp -j- * sin cp als Exponential- funetion mit imaginärem Exponenten zu betrachten, und demnaeh cos cp -\- isin cp = eif zu setzen. Dadurch erhalten die Formeln C) und D) die Gestalt E) e»>e*r/1' = e*w+'/>'M (fvy — &»<?. Wenn wir demnach F) a = r (cos q> -\- i sin cp), setzen und unter pV dem nach §. 35,. IX. existirenden und völlig bestinämten positiven Werth verstehen, dessen fite Potenz == r ist, so ist .
§• 36. G) Reine Gleichungen. = l/V (cos—4-^sin—) eine Grosse, deren nte Potenz = a ist, also eine Wurzel der Gleichung (8) x" = a, wenn unter n eine beliebige positive ganze Zahl verstanden wird. Derselben Forderung genügt aber auch jeder der Werthe ,„, i«/~r /<P -4~ 2hx\ . . . /w 4- 2kit\ (9) xjc ?= \/r \ cos ( -—! ) -+- % sm -—! wenn k eine beliebige ganze Zahl ist. In (9) sind aber n und nicht mehr verschiedene Werthe enthalten, die man erhält, wenn man A0) h — 0, 1, 2, . . . n — 1 setzt; denn vermehrt man h um ein Vielfaches von n, so ändert (9) seinen Werth nicht, während die n Werthe A0) lauter ver- verschiedene Werthe von x ergeben, weil sie verschiedene Phasen haben. Die Gleichung (8) hat demnach nicht nur eine, sondern n verschiedene Wurzeln. Fig. 1. Die geometrischen Bilder der Werthe x^ liegen alle auf einem Kreise mit dem Radius pV, und zwar um den Winkel 2 n : n von einander entfernt. Man erhält den ersten dieser Punkte dadurch, dass man den gegebenen Winkel <p in n gleiche Theile theilt. Der Radius pV ist grösser oder kleiner als r, je nachdem r kleiner oder grösser als 1 ist. Die beistehende Fig. 1 zeigt diese Verhältnisse für n = 3 unter der Voraussetzung, dass r > 1 ist. Man kann die verschiedenen Werthe von % dadurch erhalten, dass man den ersten von ihnen n ¦ • 9 sm — n. mit den verschiedenen Werthen von Weber, Algebra. I.
130 Dritter Abschnitt. §. 37. A1) £fc = cos 1- «sin K J n ' n multiplicirt. Die Grossen £k sind Wurzeln der Gleichung A2) xn = 1, und heissen die nten Einheitswurzeln. Es sind n und nur n verschiedene Werthe, von denen bei ungeradem n nur einer (für (n\ für h = 0 und ft = —) reell sind. Die geometrischen Bilder der nten Einheitswurzeln sind die Eckpunkte eines dem Kreise mit dem Radius 1 einbeschriebenen regelmässigen w-Ecks. Ihre algebraische Bestimmung ist Gegen- Gegenstand der Kreistheilungslehre. Bezeichnen wir den Werth von £fc für Tc = 1 mit e, setzen also jL 7t , . . itTC s = cos — 4- * sm —, n n so ist nach dem Moivre'sehen Satze £fc = £k, so dass alle »ten Einheitswurzeln als Potenzen von einer unter ihnen dargestellt sind.. §. 37. Befreiung einer Gleichung vom zweiten Gliede. Die Gewissheit der Existenz der Wurzeln reiner Gleichungen setzt uns in den Stand, die Wurzelexistenz bei den Gleichungen zweiten, dritten und vierten Grades oder, wie man auch sagt, bei den quadratischen, cubischen und biquadratischen Gleichungen nachzuweisen, indem wir die Bestimmung ihrer Wurzeln auf die Lösung reiner Gleichungen zurückfuhren. Wir werden auf diese Frage später von verschiedenen allgemeineren Standpunkten zurückkommen, besprechen aber hier in der Kürze die älteren Methoden der Auflösung, die, wenn sie auch wenig Einblick in den allgemeinen Zusammenhang dieser Fragen gewähren, doch in der Anwendung sehr einfach sind. Sie erwecken den Schein, als ob es sich um eine der Verallgemeinerung auf höhere Gleichungen fähige Methode handle, was aber nicht der Fall ist. Zunächst folgende allgemeine Bemerkung. Nehmen wir der Ein- Einfachheit halber in der Function
§. 37. Die Wurzeln algebraischer Gleichungen. 131 A) f(x) = ocn + <h a;—1 + a2 a;1—2 H )- an den Coefncienten von a;n gleich 1 an, was man im Allgemeinen durch Division mit dem Coefncienten von ccn erreicht, so können wir durch eine einfache Substitution B) ' * = *-¦£, fipo) in eine andere Function wten Grades <p(jf) transformiren, in" der das zweite Glied yn~1 nicht vorkommt; denn es ist nach dem binomischen Lehrsatz fi i xn _ yn _ ai yn-1 + _____ a*yn-i _J ^n-2 _ yn-% . . #) also Wenn wir die Transformation für die Fälle n = 2, 3, 4 wirklich ausführen, so erhalten wir n — 2 <p(y) = 2/2 _)_ a C) » = 3 9 («/) = 2/8 -)- a y -\- b n = 4 9(«/) = «/* -f ay% -f &«/ + c, wenn wir setzen für w = 2: a = j- + a2i für n = 3: a := ^- -|- a2 o D) 27 3 für » = 4: a = — —^- -\- a% o 256 ~f 6~ 4 "" a*' und die Lösung der Gleichung f(x) = 0 ist durch B) auf die Lösung von cp(y) = 0 zurückgeführt. Diese ergiebt zunächst für » = 2 9*
132 Dritter Abschnitt. §. 38. und folglich Wir haben also zwei Wurzeln E) j ) V% — 4 a2 P — ~ §. 38. Cubische Gleichungen. Cardanische Formel. Die Gleichung dritten Grades nehmen wir in der reducirten Form an A) y3 + ay -\- b = 0 und führen zwei neue Unbekannte u, v ein, indem wir B) y = u -\- v ¦ ¦ setzen. Dies in A) eingesetzt, ergiebt C) u3 -\- v3 -)- C uv -)- a) (u -)- v) -)- b = 0. Wir bestimmen eine der beiden Grossen u, v durch die andere nach der Gleichung D) 3 u v = — a, und erhalten aus C) E) m3 -J- w3 = — b. Aus D) und E) aber lassen sich u3 und «3 durch eine Quadratwurzel bestimmen. Man erhält nämlich _ , 4 a3 ~ "i" 27 Setzen wir zur Abkürzung G) E==X + 27' so findet sich M3 — «3 — 2 ]/R
§. 38. Die Wurzeln algebraischer Gleichungen. 133 Wir geben der YB, eines der beiden Zeichen und erhalten nach E) ! V = - \ - VE, und also (9) y = Die Multiplication der beiden Ausdrücke (8) ergiebt und zeigt, dass, wenn für t* ein bestimmter unter den drei Werthen der Cubikwurzel genommen wird. 00) jedenfalls einer der drei Werthe von y — 1_ V-R ist. Aus D) folgt aber, dass, nur wenn wir diesen Werth für v nehmen, die Gleichung A) durch y = u -\- v befriedigt ist. Wir erhalten so, den drei Werthen von u entsprechend, drei Wurzeln der Gleichung A). Aus der Existenz einer Wurzel der cubischen Gleichung ergiebt sich aber auch dadurch schon die Existenz von dreien, dass bereits nachgewiesen ist, dass die quadratische Gleichung zwei Wurzeln hat. Um aus der einen Wurzel (9) die beiden anderen abzuleiten, setzen wir « = u -j- v, und dividiren yz -\- ay -\- b durch y — a. Der Quotient, dessen Wurzeln die beiden anderen Wurzeln ß, y der cubischen Gleichung A) sind, ist 2/2 -f ay _|_ «2 -f a = 0, woraus man nach D) des vorigen Paragraphen — «d=V— 3«2 — 4a y- _ findet. Setzt man hierin « = u -|^ v, und nach D) a = — 3 u vt so folgt:
134 Dritter Abschnitt. §. 39. = — (u + v) ± V — 3 (u uv __ — (u -)- v) ± V — 3 (u — v) _ Setzen wir also woraus A2); £2 +£ £2 = ~ 2 folgt, so erhält man die drei Wurzeln der cubischen Gleichung F) a = t* -)- t? A3/ /S = su + £2t? y = s2u-\- sv. Darin ist s eine von 1 verschiedene dritte Einheitswurzel, die hier ohne die trigonometrischen Functionen algebraisch aus- ausgedrückt ist. Setzt man eu oder e2u für u, also s2v, sv für v, so vertauschen sich die drei Grossen «, /3, y unter einander. Der Ausdruck (9) für die Wurzel einer cubischen Gleichung wird die Cardanische Formel genannt. §. 39. Der Cayley'sche Ausdruck der Cardanischen Formel. Jede Cubikwurzel hat, wie wir gesehen haben, drei ver- verschiedene Werthe, die man aus einem von ihnen erhält durch Multiplication mit 1, s, a2. So hat also auch jede der beiden Grossen u, v, wie sie durch (8), §. 38 definirt sind, drei Werthe und die Summe u-\-v hat also, wenn man nur die Bedingungen (8) berücksichtigt, neun verschiedene Werthe; von diesen geben aber nur drei Lösungen der cubischen Gleichung, und erst durch Zuziehung der Relation D), §. 38 A) 3 uv = — a werden unter den neun Werthen die brauchbaren ausgesondert.
§. 40. Biquadratische Gleichungen. 135 Dies ist ein Mangel der Cardanischen Formel, die hiernach für sich noch nicht genügt, um die Wurzeln der cubischen Gleichung eindeutig zu geben. Diesem Mangel hat Cayley durch die folgende Darstellung abgeholfen. Man definire zwei neue Grossen |, rj durch die Gleichungen B) U=^7], « = |1J», woraus sich durch Multiplication mit Benutzung von A) C) ^ ergiebt; folglich ist, wenn dieser Werth in B) eingesetzt und für u, v ihre Ausdrücke §. 38, (8) substituirt werden, und wenn man also jetzt die Wurzel y der cubischen Gleichung in die Form E) y = Sn (£ + n) setzt, so erhält man einen Ausdruck, der, wenn man, von ein- einander unabhängig, g durch g, s f, e2!-, und 7] durch rj, srj, £2tj ersetzt, nicht neun, sondern nur die drei Werthe F) epTj + e^r]* £2£2^ + £^2 annimmt. Giebt man ausserdem der in D) vorkommenden Quadratwurzel das entgegengesetze Zeichen, so werden |, q mit einander vertauscht, und die drei Wurzeln F) nur unter einander permutirtJ). §• 40. Die biquadratische Gleichung. Ein ähnlicher Weg, wie bei der Lösung der cubischen Glei- Gleichung durch die Car danische Formel, lässt sich zur Lösung der Gleichung vierten Grades A) yi + «2/2 + 62/ + c = 0 einschlagen. x) Cayley, Phil. Mag., vol. XXI, 1861. Colleoted mathematical papers, vol. V, Nr. 310.
136 Dritter Abschnitt. §. 40. Wir setzen 2 y = u -j- v -\- w, und erhalten, wenn wir zur Abkürzung B) s = u2 -f- v2 -\- w2, t = setzen, \( 162/4 = s2 -)- 4s (vw -f- wu -\- uv) -\- At -\- 8 u v w (u + v -f- w). Wenn man dies in A) einsetzt, so findet sich s2 -\~ it -)- 4as + 16c -)- 8(w»w + 6) («t + » + w) —|— 4 (s —|— 2 a) (v w -\- w u -f- «t ü) = 0. Diese Gleichung wird aber durch die Annahme befriedigt s-f-2a = 0, «tt;M; + 5 = 0, s2 + 4* + 4 as -(- 16c = 0. Mit Hülfe der ersten dieser drei Gleichungen wird die dritte t = a2 — 4 c, und, wenn man für s, t die Werthe B) zurücksetzt, U2 _|_ V2 _|_ W2 — 2 ÖS C) v2w2 -f w2w2 + w2t?2 = a2 — 4c %»M) = — b. Nach §. 7 sind diese Gleichungen dann und nur dann befriedigt, wenn w2, t?2, w2 die Wurzeln der cubischen Gleichung D) s* -j- 2 az2 -\- (a2 — 4 c) 0 — 62 = 0 sind, und wenn die Vorzeichen von u, v, w so bestimmt werden, dass die letzte der Gleichungen C) befriedigt ist. Diese letztere Bedingung lässt noch vier verschiedene Vorzeichenbestimmungen zu, so dass man die vier Wurzeln der biquadratischen Gleichung in folgender Weise erhält: 2«= u -\- v -\- w ,., 2/3= u — v — w 2y = — u -\- v — w 2 8 .= — u — v -\- w. Die Lösung der biquadratischen Gleichung ist. damit auf die der cubischen Gleichung D) zurückgeführt. Diese Gleichung heisst eine cubische Resolvente der biquadratischen Gleichung.
§. 41. Fundamentalsatz. 137 §• 41- Beweis des Fundamentalsatzes. Wir gehen nun an den Beweis des Fundamentalsatzes der Algebra, dass jede Gleichung f(x) = 0 wenigstens eine Wurzel hat. Wir schicken einige allgemeine Sätze voraus: 1. Wenn 8 ein beliebiges System reeller Zahlen be- bedeutet, die alle grösser sind als eine bestimmte positive oder negative Zahl G (d. h. ein System, das keine unendlichen negativen Zahlen enthält), so existirt eine untere Grenze für die Zahlen 8. Unter einer unteren Grenze g ist eine solche Zahl zu verstehen, die von keiner Zahl des Systems 8 unterschritten wird, aber so beschaffen, dass, wenn d eine beliebig gegebene positive Grosse ist, zwischen g und g •-(- 8 (mit Einschluss der Grenzen) immer noch wenigstens eine Zahl des Systems 8 liegt, wie klein auch S sein mag. Der Beweis ergiebt sich unmittelbar aus der Möglichkeit eines Schnittes B1, 23), den man so construirt, dass man eine Zahl a nach 3t wirft, wenn sie von keiner Zahl des Systems 8 unterschritten wird, und eine Zahl ß nach 23, wenn sie wenigstens von einer Zahl in S unterschritten wird. Die durch diesen Schnitt bestimmte Zahl g wird von keiner Zahl in S unterschritten, denn sonst gäbe es auch Zahlen, die kleiner als g sind, und also zu 21 gehören, und die doch von Zahlen in S unterschritten werden, während andererseits jede noch so wenig über g liegende Zahl ß zu 23 gehört und also von einer Zahl in 8 unterschritten wird. Das sind aber die charakteristischen Merkmale der unteren Grenze. 2. Ist S' ein Theil von 8, so haben auch die Zahlen 8' eine untere Grenze g', und diese ist entweder gleich g oder grösser als g. Denn kleiner als g kann sie nicht sein, da sonst Zahlen in S' und folglich auch in 8 vorkämen, die unter g liegen. Es sei nun f(x) eine reelle Function von x, die in dem Intervall A) a <! x <f 6
138 Dritter Abschnitt. §. 41. nur endliche Werthe hat, und die ausserdem in diesem Intervall stetig ist; das will, in Uebereinstimmung mit §. 34, V und VI, besagen, dass B) . /(* + *)-/(*)• dem absoluten Werthe nach in dem ganzen Intervall unter einer beliebig gegebenen Zahl rj liegt, wenn das positive h kleiner als eine gewisse Zahl s ist. (Für x = a nehmen wir in B) nur das obere, für x = b nur das untere Zeichen, um mit x + h nicht aus dem Intervall herauszukommen.) Für die Werthe einer solchen Function in dem Intervall giebt es nach 1. eine untere Grenze g, und wir beweisen nun den Satz: 3. dass die Function f(x) den Werth g für irgend einen Werth | des Intervalles annimmt, wonach die untere Grenze zu einem Minimum der Func- Function f(x) in dem Intervall wird. Der Beweis ist folgender. Die untere Grenze der Functions- werthe in einem Theil des Intervalles A) ist nach 2. entweder gleich oder grösser als g. Wenn nun f(a) = g ist, so ist das zu Beweisende richtig; ist aber /(«)>#, so kann man wegen der Stetigkeit von f(x) ein Intervall a ^ x ^ a -)- h angeben, in dem f(x) > g bleibt und also die untere Grenze von f(x) grösser als g ist. Wir construiren nun in dem Intervall A) einen Schnitt C1, 33) der Art, dass wir einen Werth « des Intervalles A) zu 91 rechnen, wenn die untere Grenze von f(x) in dem Intervall a <! x <! « grösser als g ist, und einen Werth ß zu 33, wenn die untere Grenze im Intervall a ^ x ^ ß gleich g ist. 33 kann möglicherweise aus dem einzigen Werthe b bestehen; dann aber muss f(b) = g sein, und unsere Behauptung ist für x = b erfüllt; denn wäre f(b)>g, so könnte man eine Grosse g' zwischen f(b) und g und wegen der Stetigkeit ein Intervall b — h ^ x <*b so annehmen, dass in diesem Intervall alle Functionswerthe f(x) grösser als g', ihre untere Grenze also gleich oder grösser als g' und daher sicher grösser als g wäre. Da aber b — h zu 91 gehört, so ist auch in dem Intervall a <J x ^ b — h und folglich in dem ganzen Intervall A) die untere Grenze grösser als g, gegen die Annahme.
§. 41. Fundamentalsatz. 139 Ist also f(b) > g, so definirt der Schnitt B1, 23) eine Zahl | im Inneren des Intervalles A), von der wir nun zeigen können, dass sein muss. Ist /(!)># und f(£)>g'>g, so können wir wegen der Stetigkeit von f(x) ein Intervall £ — h^x^Z + h bestimmen, in dem alle Functionswerthe f(x) grösser als g' und also ihre untere Grenze grösser als g ist. Da aber | — h zu 21 gehört, so ist auch in dem ganzen Intervall a < x < i- -\- h die untere Grenze von f(x) grösser als g, während doch £ -j- h zu 23 gehört, worin der Widerspruch liegt. Es sei jetzt f(x) eine ganze rationale Function mit beliebigen complexen oder reellen Coefficienten, und die Variable oo soll gleichfalls complexe Werthe haben können. Nach §. 34, IV kann, wenn C ein beliebiger positiver Werth ist, die positive Grosse B so angenommen werden, dass D) \f{x)\>C ist, sobald E) | x | ^ B wird. Zur Veranschaulichung stellen wir das durch die Un- Ungleichung | x | < B begrenzte Gebiet (B) für die Variable x durch eine Kreisfläche vom Radius B in der Ebene der Variablen x = y -\- i s dar. Wenn wir' C grösser annehmen, als irgend einen Werth von | f(x~) | im Inneren des Gebietes (B), zum Beispiel grösser als | /@) |, so wird \ f(x) \ gewiss im Inneren des Gebietes (B) kleiner werden als an der Begrenzung. Da nun im ganzen Inneren von (B) die Function | f(x) \, die wir zur Abkürzung jetzt mit X bezeichnen wollen, nicht negativ wird, so giebt es für die Werthe von X eine untere Grenze g und wir haben den Satz zu beweisen; 4. Es existirt ein Werth £ von x im Inneren des Gebietes (B), so dass F) 1/AI=0
140 Dritter Abschnitt. Fig. 2. wird, dass also die untere Grenze auch hier ein Minimum ist. Die untere Grenze von X in irgend einem Theile des Be- Bereiches ist entweder gleich g oder grösser als g. Ein Grössengebiet, das durch die Ungleichheitsbedingungen. G) | x | ^ B, — B<^y<^a bestimmt ist, wird in unserer Fig. 2 durch das Segment (PQa Q'), das wir das Segment (P, «) nennen wollen, dargestellt. Wir bestimmen nun zunächst einen Werth rj von y durch einen Schnitt B1,23) folgendermaassen: Eine Zahl « zwischen — B und -f- B wird in 21 aufgenommen, wenn, die untere Grenze von X in dem Segment (P, u) grösser als g ist, und ein Werth ß wird in 33 aufgenommen, wenn die untere Grenze von X in dem Segment (P, ß) gleich <jr ist. Dieser Schnitt. B1, SB) definirt eine Zahl 7] von der Eigenschaft, dass die untere Grenze von X in dem Bereich (P, y), wenn y < tj ist, grösser als g, und wenn y > -q ist, gleich g ist. Nun ist nach §. 34, VI eine stetige Function von s in dem Intervall (8) — MB? — yf ^ e ^ ViZ2 — n\ was in der Fig. 2 durch Jf, JM7 bezeichnet ist. Diese Function erhält also nach 3. für irgend einen Werth t, von s in diesem Intervall einen Minimumwerth y, so dass, wenn gesetzt wird, (9) wird. 1/A) 1 =
§. 41. Fundamentalsatz. 141 Es ist nun ferner leicht einzusehen, dass y = g sein muss, denn da g die untere Grenze aller Werthe von X innerhalb (B) ist, so kann y zunächst nicht kleiner als g sein. Es kann aber y auch nicht grösser als g sein; denn alle Werthe, die X auf der Strecke MM' annimmt, sind J? y; ist aber y > g, so kann man eine Grosse g1 so annehmen, dass y > g' > g ist, und wegen der in §. 34, VI bewiesenen Stetigkeit von X lassen sich die Zahlen «, ß so bestimmen, dass «< n <ß und dass in dem ganzen Bereich (P, ß) — (P, «) = («, ß) (QNN'Q1 in der Fig. 2) X grösser als g1 bleibt. Folglich ist die untere Grenze von X in («, ß) grösser als g. Da nun die untere Grenze von X in (P, «) grösser als g ist, so ist sie auch in (P, /3), was aus (P, «) und («, /3) zusammengesetzt ist, grösser als g; ß gehört aber zu 23, woraus ein Widerspruch mit der Definition von 23 folgen würde. " Es bleibt also nur übrig, dass y = g ist, und der Satz 4. ist damit nachgewiesen, nämlich, dass es einen Werth | im In- Inneren von (E) giebt, für den \f(M)\=9 ist, dass also | f(x) | einen Minimuinwerth erreicht. Wir be- beweisen nun: 5. Wenn a irgend ein Werth von x ist, für den f(a) von Null verschieden ist, so lässt sich h so annehmen, dass ausfällt. Daraus folgt dann, dass, wenn /(£) von Null verschieden wäre, g nicht das Minimum der Function \f(%) | sein könnte; da dies aber bewiesen ist, so muss A1) /(ö = 0 sein, und | ist eine Wurzel der Gleichung f(x) = 0. Der Fundamentalsatz wird also dann bewiesen sein. Beim Beweise von 5. machen wir Gebrauch von dem schon bewiesenen Satz (§. 35), dass eine reine Gleichung immer eine Wurzel hat. Von den derivirten Functionen /'(«),/"(«) • ¦ • können einige verschwinden; die letzte/<">(«), die gleich II(n)a0 ist, ist aber
142 Dritter Abschnitt. §. 41. von Null verschieden; es mögen also /' («), /" («)... /('" verschwinden, /W(«) nicht verschwinden. Wir haben nach §.13 Jim A2) /(« -f K) =/(«) + j^y—. /(») («) + »+« /( Wir wählen, was nach §. 34, V stets möglich ist, eine tive Zahl £ so, dass | +\ /(m)(«) t(»-|l)(»+ 2) /( ist, sobald A4) | h | < £, und einen postitiven echten Bruch d so, dass dann posi- posi< 1 was, wenn /(«) nicht verschwindet, gleichfalls möglich ist. Dann bestimmen wir (auf Grund von §. 35) h aus der Gleichung woraus nach A5) h | < £ folgt. Aus A2) ergiebt sich jetzt, wenn man für hm den Werth aus A6) setzt, /(« + *) = (!-*)/(«) also A7) 2) /(»•) («) 1)/(»»(«) 2) /<m>(«) und wegen A3) A8) w. z. b. w. Damit ist also der Beweis des Fundamentalsatzes beendigt.
§. 42. Die Wurzeln algebraischer Gleichungen. 143 §• 42. Algorithmus zur Berechnung der Wurzeln. Der im vorigen Paragraphen gegebene Beweis für die Exi- Existenz einer Wurzel einer algebraischen Gleichung lässt zwar an Bündigkeit nichts zu wünschen übrig, er hat aber noch den Mangel, dass er nicht die Schritte erkennen lässt, wie man eine Wurzel durch ein convergentes Rechnungsverfahren berechnen kann. Wir fügen also noch die folgenden Betrachtungen hinzu, die diesem Mangel, wenn auch nur theoretisch, abzuhelfen be- bestimmt sind. Sie geben noch einen zweiten Beweis des Funda- mentalsatzes, der in der Hauptsache von Lipschitz stammt (Lehrbuch der Analysis, Bd. I, §. 61 ff.; Vereinfachungen sind dem Verfasser von Dedekind und Frobenius mitgetheilt). Wenn die beiden ganzen rationalen Functionen f(x) und f'(x) einen gemeinsamen Theiler haben, so kann dieser nach §. 6 durch rationale Operationen gefunden und beseitigt werden. Wir dürfen also voraussetzen, dass/(a;) und/'(#;) keinen gemein- gemeinsamen Theiler haben, dass sie also für keinen Werth von x beide zugleich verschwinden. Wir setzen nun voraus, dass die Wurzelberechnung für eine Function (w — l)ten Grades schon gelungen sei, und nehmen demnach /' (x) in lineare Factoren zerlegt an. Demnach sei, wenn A) f(x) = xn + «j x«-1 + a2 a;"-2 -| •, ist, B) f'(x) = K" + (n — l)«^"-2 • • • = n(x — ft) (x — ßt)...(x — ßn-i), worin die ßu ß2 . . . /?«_! als bekannte Zahlen angesehen werden, die auch theilweise identisch sein können. Nach unserer Voraus- Voraussetzung werden die absoluten Werthe C) |/(A)|, |/G32)|,--.|/(/3«-i)|, die wir mit D) &n b2 . . . &n_i bezeichnen, alle von Null verschieden sein; wir wollen die Be- Bezeichnung so gewählt annehmen, dass öj der kleinste unter ihnen
144 Dritter Abschnitt. §. 42. sei, oder wenigstens keinen der anderen an Grosse übertrifft. Nach dem Satz 5, §. 41 lässt sich dann ein Werth « von x so bestimmen, dass der absolute Werth a von/(«) kleiner als 6j wird, also: E) a < bx ^ 62 <; 63 . . . 5S 6n-i- Wir begrenzen nun ein Gebiet G für die Variable x derart, dass ausserhalb dieses Gebietes der absolute Werth von f(x) immer grösser als a ist, so dass G alle Punkte x enthält, in denen | f(x) | < a ist (aber auch noch andere Punkte). Dies ist nach §. 34, IV dadurch möglich, dass wir vom Nullpunkte als Mittelpunkt einen die Punkte «, ßv ß2 . . . /3n_i einschliessenden Kreis (B) von hinlänglich grossem Radius B legen und die Punkte ßi, j32 . . . ßn-i, in denen \f(x) | ja grösser als a ist, durch kreisförmige Hüllen von so kleinen, aber nicht verschwindenden Radien q1, q2 . . . pn_1 von diesem Kreise ausscheiden, dass im Inneren aller dieser Kreise (p^, (p2) ... (p„_i) der absolute Werth |/(«) | grösser als a bleibt (§. 34, V). Dann umschliesst keiner pj„ 3 dieser Kreise den Punkt k, in dem | f(x) \ = a ist. Das von den Kreisen (B), (Pl) • • • (P»-i) be- grenzte zusammenhän- zusammenhängende Flächenstück ist das Gebiet O. Wir bestimmen nun eine Zahlenreibe 05, 06', «", 06'" . . . derart, dass die absoluten Werthe von /(«), /(«'), /(oc") . . ., die wir mit a, a', a", a'" . . . bezeichnen, immer ab- abnehmen. Die so bestimmten Punkte a, oc', a," bleiben alle im Inneren des Gebietes G, weil ja in ihnen \f(x) | < a ist. Wir bedienen uns dazu eines Verfahrens, ganz ähnlich dem zum Beweis des Satzes 5, §. 41 angewandten, nur dadurch verein- vereinfacht, dass /'(«) schon von Null verschieden ist. Wir setzen, indem wir unter 8 einen noch näher zu bestimmenden, positiven, echten Bruch verstehen, in der Entwickelung
§. 42. Die Wurzeln algebraischer Gleichungen. 145 F) /(« + A) =/(«) + A/'(«) + |7"(«) + • • • und erhalten /'(«)» 3 /'(«K Nun ist nach B) /'(«) = n(a - ßL) (a — ßa) ...(« — /?„_,), also, wenn wir die absoluten Werthe von (« — ft), (« — ßz) ¦ • • {« — /3«_i) durch y1} r2 . . . rn-x bezeichnen, |/'(«) | = w »i r2 . . . r«—i- Da nun « ausserhalb des um jSi beschriebenen Kreises qx liegt, so ist rx > pj, und ebenso r2 > q2 • • •) und folglich also | /' («) | grösser als eine von der Lage von « innerhalb O unabhängige positive Zahl Tc. Daraus ergiebt sich, dass man eine hinlänglich grosse positive Zahl Q, die gleichfalls von der Lage von a und von dem echten Bruch 8 unabhängig ist, so wählen kann, dass j \y*) J \ / und dass zugleich Q>i ist. Man kann Q erhalten, wenn man auf der linken Seite von (9) in den Nennern /'(«) durch Ä, 8 durch 1, sonst alle Glieder durch ihre absoluten Werthe, endlich den absoluten Werth von a, durch den grössten Werth R ersetzt, und die so gewonnene Zahl, wenn nöthig, noch bis über 1 und sonst noch beliebig vergrössert. Dann ergiebt sich aber aus (8), wenn A0) a+A = «1, \f(u)\ = a, 1/@1I = 0! gesetzt wird, Setzt man hierin und in G), was gestattet ist, 8 = 1 : Q, so folgt Weber, Algebra. I. in
146 Dritter Abschnitt. .§. 42. A2) al< Wir leiten nun durch dasselbe Verfahren aus k1: Oj ein zweites Grössensystem oc2, a2 ab, dann aus «2, % ein drittes, e%, as, u. s. f. und erhalten so für die Reihe abnehmender posi- positiver Zahlen a, a15 a2, «s • • • die Umgleichungen A3) % < a ®, a2 < «i © • • . a» < «»-i ©> worin ein positiver echter Bruch ist. Aus A3) folgt aber durch Multi- plication av < a&v und daraus A4) Lim a, = 0. Nun ergiebt sich aus A1) und A2) woraus für jeden Index v /¦ie\ I , 2(«v Uv+i) A5) |«v — es,+1 | < -i jg ^-;< Nun ist, da der absolute Werth einer Summe kleiner ist, als die Summe der absoluten Werthe, für irgend zwei Indices (t, v, deren erster der kleinere ist, nach A5) | dp — a, | < | o«^ — «vi-! | -f" I «H-i — af«+2 I -\ \~ I «»-i —«v | 2 2 2 < j («/* — «f+0 + j K+i — «f+a) H h j (a"-1 ~ a-) und daraus A6) K-M<^^ und mit Hülfe von A4) Lim | «j, — o» | = 0, wenn jt und v unbegrenzt wachsen. Damit ist ausgedrückt (nach dem in der Einleitung erklärten Begriff der Zahlenreihe, S. 17), dass sich die Zahlen «, c^, «2 ... einer bestimmten Grenze nähern, die wir mit f bezeichnen wollen.
§. 43. Zahlenwerthe ganzer Functionen. 147 Aus der Stetigkeit der Function / (x) folgt aber dann leicht, dass /(£) =0 sein muss; denn wäre | /(§) | > 0, so könnten, da die «w dem Werthe § beliebig nahe kommen, die absoluten Werthe aW von /(«<*>) nicht unter jeden positiven Werth herunter- heruntersinken, was wir doch von ihnen nachgewiesen haben. §. 43. Zahlenwerthe ganzer .Functionen. Aus dem Fundamentalsatz von der Wurzelexistenz ergeben sich einige Sätze über die numerischen Werthe ganzer Functionen, die, so einfach sie sind, doch besonders hervorgehoben werden müssen: 1. Sind ®j (x, y,e.. .), #2 («, y, e ...), ®8 0, y,z ...),.. ganze Functionen der Veränderlichen x, y, z . . . mit numerischen Coefficienten, die in keiner der Functionen alle zugleich verschwinden, so kann man für die Veränderlichen auf unendlich viele Arten solche Zahlenwerthe setzen, dass keine der Functionen ®j, #2, <DS . . . verschwindet. Der Satz ist zunächst evident, wenn die Functionen 3>j, 3>2, <P3 . . . nur von einer Variablen abhängen; denn dann giebt es überhaupt nur eine endliche Anzahl von Zahlwerthen für diese Veränderliche, die eine dieser Functionen zum Verschwinden bringen. Dann aber können wir die Kichtigkeit des Satzes für Functionen von n -j- 1 Veränderlichen leicht einsehen, falls wir ihn für Functionen von n Veränderlichen als erwiesen betrachten. Denn ordnen wir die Functionen nach der (n -)- l)ten Veränder- Veränderlichen t, so können wir für die übrigen n Veränderlichen nach Voraussetzung solche Werthe setzen, dass in keiner der Func- Functionen die Coefficienten aller Potenzen von t verschwinden; dann haben wir Functionen der einen Veränderlichen t und können für diese einen solchen Werth setzen, dass keine der Functionen verschwindet. Damit ist der Satz bewiesen, und man sieht, dass er auch noch richtig bleibt, wenn für die absoluten Werthe der Zahlen, die für die Variablen zu setzen sind, beliebige obere Grenzen festgesetzt sind, oder wenn gefordert wird, dass nur rationale Zahlen für die Variablen zu setzen seien. 10*
148 Dritter Abschnitt. §• 44 2. Haben keine zwei der Functionen &1: <&2, 03 ¦ ¦ ¦ einen gemeinschaftlichen Factor (§. 20), so kann man für die Variablen solche Werthe setzen, dass eine dieser Functionen, die nicht eine Constante ist, verschwindet, während die übrigen von Null verschiedene Werthe erhalten. Um diesen Satz zu beweisen, nehme man an, es sei t eine der Variablen, die in (Pj wirklich vorkommt. Dann kann man für jede Funktion ®* aus der Reihe ®2, <P8 . . . nach dem Algo- Algorithmus des grössten gemeinschaftlichen Theilers die ganzen Functionen ©,-, <&, X{, deren keine identisch Null ist, so be- bestimmen, dass A) BiVi + %*! = Xt wird [§. 20, D)], dass X» von t unabhängig und nur von den übrigen Variablen x, y '. . . abhängig ist Nun setze man für die letzteren Variablen x, y . . . solche Werthe (nach dem Satze 1.), dass alle Functionen X{ von Null verschieden sind, und dass. Ot nicht von t frei wird, sondern in eine Function f(t) übergeht. Endlich setze man für t eine Wurzel der Gleichung f(t) = 0. Dann verschwindet ®l5 während nach A) keine der Functionen G>i verschwinden kann. Dies aber fordert der Satz 2. §. 44. Stetigkeit der Wurzeln. Wir beschliessen diesen Abschnitt mit dem Beweis des Satzes: Die Wurzeln einer algebraischen Gleichung sind stetige Functionen der Coefficienten. Wir haben zunächst die Bedeutung dieses Satzes zu erklären. Es sei A) f(x) ~xn~\-al x»-1 -{- a2 xn~2 ~\ eine ganze rationale Function von x vom nten Grade. Nach dem, was in den vorangegangenen Paragraphen bewiesen ist, lässt sich f(x) in n lineare Factoren zerlegen, die zum Theil einander gleich sein können. Wir setzen, indem wir gleiche Factoren zu- zusammenfassen und die Wurzeln mit k, ß, y . . . bezeichnen, B) f{x) = {x- af (x - ßf (x - yf . . , worin a, b, c . . , ganze positive Zahlen sind, deren Summe gleich n ist.
§• 44. Stetigkeit der Wurzeln. 149 Die Wurzeln a, ß, y . . . werden sich mit den Coefficienten «i, «2, «s •'• • ändern, auch der Grad ihrer Vielfachheit kann ein anderer werden. Wir bezeichnen die Aenderungen von au a2 • • . mit eu £2 ... und setzen C) 9>(s) = eia;-i +6, ««-* + ... Wir umgeben die Punkte a, ß, y . . . mit Gebieten von beliebiger Kleinheit, jedoch so, dass diese Gebiete sich gegen- gegenseitig ausschliessen, etwa dadurch, dass wir die Punkte k, ß, y ... durch Kreisperipherien mit den Radien p, g', q" . . . einschliessen, und bezeichnen diese Gebiete durch (g), (gr), (g") . . . Wenn die absoluten Werthe von s1, e2 • • • unter hinläng- hinlänglich kleinen Werthen liegen, so können wir von der Function /i (x) zunächst beweisen, dass sie keine Wurzeln ausserhalb der Gebiete (P), (?'), (9") ¦ ¦ • hat, und zweitens, dass die Anzahl der Wurzeln von fi(x) inner- innerhalb (g) genau a, innerhalb (q') genau b, inner- innerhalb (q") genau c u. s. f. beträgt. Bei dem letzten Theil des Satzes ist aber zu beachten, dass, wenn fi(%) mehrfache Wurzeln hat, diese nach ihrer Vielfachheit gezählt werden müssen. Fig. 4. Wir construiren nach §. 34, IV in der Ebene x einen Kreis mit dem Radius H und dem Null- Nullpunkt als Mittelpunkt, der die Gebiete (q) , (gJ), (g"). . . ein- schliesst, so dass ausserhalb dieses Kreises keine Wurzeln von /t (x) mehr liegen, und bezeichnen das innerhalb dieses Kreises, aber ausserhalb (g), (g1), (g") . . . liegende Gebiet mit Gr. Es ist dazu noch zu bemerken, dass B von den «l5 s2 . . . unabhängig angenommen werden kann, so lange für die absoluten Werthe dieser Grossen eine bestimmte obere Grenze festgesetzt wird.
150 Dritter Abschnitt. §. 44. Ist nun x ein Punkt des Gebietes Cf, so ist der absolute Werth von x — « grösser als q, der von x — ß grösser als q', u. s. f., und mithin nach B) E) \f(x)\>(f'^Q"':.. Ist nun «i eine Wurzel von /j (x), so folgt aus D) F) /(k1) = — <p («j), und «j kann daher nicht in dem Gebiete G liegen, wenn man dafür sorgt, dass innerhalb Q überall G) \<p(x)\<9°<>'* <,'"..., was durch genügende Verkleinerung der oberen Grenze von «x, £2 • •. immer möglich ist. Hiermit ist der erste Theil unserer Behauptung erwiesen, dass, wenn die Ungleichung G) befriedigt ist, keine Wurzeln von fr (x) ausserhalb der Gebiete (q), (q1), (q") ... liegen. Um den zweiten Theil zu beweisen, setzen wir (8) /(*)¦=?(«)(*-«)•, (9) t(x) = (x- ßf(x — yy... Wir wählen nun eine positive Zahl A, die aber von q un- unabhängig sein soll, so dass, so lange x im Inneren oder an der Peripherie des Gebietes (p) liegt, A0) | 1>(x) \>A, (für | x — « | ^ 9) bleibt. Eine solche Zahl erhalten wir z. B., wenn wir l gleich der Hälfte des kleinsten unter den Abständen (es, ß), (a, y) .. . annehmen und setzen; dann ist die in A0) ausgedrückte Forderung wenigstens so länge erfüllt, als q kleiner als l ist. Ist nur ein einziger Punkt a vorhanden, so ist ip (x) = 1 zu setzen, und für A kann jeder beliebige echte Bruch gesetzt werden. Es seien nun c^, «2 • • • die Wurzeln von fr (x)' innerhalb (q), und %, % ... die Grade ihrer Vielfachheit, und ßr, ß2 . ¦ ., bx, 63 • • •> 7\i 7i • • •¦> Ci) c2 . . • sollen dieselbe Bedeutung für die Gebiete (q'), (q") . . . haben; es ist dann A1) n = «!-)- a2 -\ 1- &! + b2 + • • • + Ci + c2 -\ , da die Gesammtzahl aller Wurzeln gleich n sein muss. Die Function fx (x) lässt sieh dann so darstellen: A2) fx (x) = ^ {x) (x — uCfi (x - «,)«« . . .,
§. 44 Stetigkeit der Wurzeln. 151 worin A3) ft (x) = (x — ß^ (x - ß,)h . . . Nun können wir eine von q, q', q" unabhängige positive Zahl B bestimmen, so dass, so lange x innerhalb oder an der Grenze von (q) bleibt A4) \1>1(x)\<B (für | x — u [ ^ q). Wir können z. B. eine Grosse L wählen, die grösser ist als die doppelte Entfernung des Punktes k von einem der Punkte ß, y . . . und jedenfalls grösser als 1 und dann .B> Ln annehmen. Nun folgt aus D) A5) l/(*)l<l/i(*)l + l9>(*)|, also nach (8) und A2) A6) \t(x)\.\x — K\a<\ip1(x)\.\x~(xl\ai.\x — (x2\^...-\-\^(x)\, und wenn wir nun «auf der Peripherie von (q) annehmen, also | x — a | = q setzen, so ist \ x — «j | < 2 p, \ x — ctg | < 2 p . . . folglich nach A0) und A6) A7) (fA<B(fy*+*+—B + | <p(x) |. Wir wollen nun die oberen Grenzen für die Coefficienten £1( a2 • • • von (p so klein annehmen, dass | <p(x) | <(pA' wird, worin A' eine Zahl bedeutet, die kleiner als A ist; dann folgt aus A7) A8) A — A' < 2ai + n2 + --- p-«+«i+««+--- B. Dies aber würde für ein hinreichend kleines p nicht mehr möglich sein, wenn a grösser als die Summe «j -J- a2 -(-••• wäre. Es folgt also A9) a 5! % + a2 H • Ebenso lässt sich beweisen, dass i> ^ 61 + h H B0) c ^ Cl + c2 H sein muss. Da aber die Summen der linken Seiten sowohl als
152 Dritter Abschnitt. §: 44. der rechten in den Ungleichungen B0), B1) gleich n sein müssen, so können nur die Gleichheitszeichen bestehen, also: a = ax -f- a2 -(-••• ¦ ' 6^6!+ 6, + ... C = Ci -f- C2 -f- •.- • wodurch auch der zweite Theil unseres Satzes bewiesen ist. Wir wollen dem bewiesenen Satze noch folgende, auf den Fall mehrfacher Wurzeln bezügliche Bemerkung beifügen. Die nothwendige und hinreichende Bedingung dafür, dass f(x) = 0 überhaupt mehrfache Wurzeln habe, ist die, dass f(x) und f'(x) einen gemeinsamen Factor haben. Wenn man also nach den im ersten Abschnitt entwickelten Principien den Algo- Algorithmus des grössten gemeinsamen Theilers auf diese beiden Functionen anwendet, so erhält man die Bedingung gemeinsamer Factoren daraus, dass man den letzten constanten Rest gleich Null setzt, in Gestalt einer Gleichung zwischen den Coefficienten: F(a1, aa...a„) — 0, worin F eine ganze rationale Function der Argumente al5 a2.... a„ ist, die die Discriminante von/heisst, deren Eigenschaften und Bildungsweise im nächsten Abschnitt noch eingehender behandelt werden soll; jedenfalls kann, da es überhaupt Glei- Gleichungen »ten Grades ohne mehrfache Wurzeln giebt, F nicht identisch verschwinden. Betrachten wir also jetzt F(at -)-<¦!, a2 -\- b2 ... a„ -f- £„), so wird auch diese Function, wenn die «], «2 • • • an bestimmte, die £lt s2 • • • £» aber unbestimmte Zahlen sind, nicht identisch verschwinden,. und man kann über die s so verfügen, dass ihr Werth von Null verschieden ausfällt, auch dann noch, wenn für die absoluten Werthe der 6 eine beliebige obere Grenze festgesetzt ist (§. 43). Man sieht also aus. diesen Betrachtungen, wie eine a-fache Wurzel k von f(x) bei stetiger Veränderung der Coefficienten in a einfache Wurzeln aus einander strahlt, so dass man auch von diesem Gesichtspunkte berechtigt ist, die «-fache Wurzel als durch das Zusammenfallen von a einfachen Wurzeln entstanden zu betrachten.
§. 44. Stetigkeit der Wurzeln. 153 Nehmen wir den Coefficienten der höchsten Potenz von x nicht gleich 1 an, untersuchen also die Gleichung in der Form B1) . aoxn -\- «!x"-1 -\- a2x»-2 -\- ¦ • • + an-xx -\- an = 0, so sind, wenn an = 0 ist, eine oder mehrere der Wurzeln gleich Null, und die Gleichung B1) lässt sich durch x oder eine höhere Potenz von x dividiren, wodurch eine Gleichung von entsprechend niedrigerem Grade entsteht, in der das letzte Glied von Null ver- verschieden ist. Wir wollen also von vornherein a„ von Null ver- verschieden annehmen und nun in B1) B2) x = - y setzen. Durch Multiplication mit yn und Division mit a„ geht dann B1) über in B3) VnJr~- T-1 + --- + t-» + 7L = °» an a„ an und wir können auf die Wurzeln dieser Gleichung den vorhin ausgesprochenen Satz anwenden, indem wir a0 = 0 annehmen, so dass eine der Wurzeln von B3) verschwindet. Wir erlangen so den Satz: Man kann in der Gleichung B1) a0 so klein annehmen, dass eine ihrer Wurzeln über alle Grenzen gross wird, während die anderen sich beliebig wenig von den Wurzeln der Gleichung (n — l)ten Grades % x"-1 -\- a2 %"~2 -\~ • • • -j- o-n-\ x -\- an = 0 unterscheiden. Man drückt das auch so aus, dass mit verschwinden- verschwindendem öf0 eine der Wurzeln von B1) unendlich wird. Wenn auch noch aY oder aY und a2 verschwinden, so werden zwei oder, drei Wurzeln unendlich u. s. f. Es rechtfertigt sich hierdurch der bisweilen gebrauchte Ausdruck, dass eine Gleichung wten Grades durch Unendlichwerden einer Wurzel in eine Gleichung (n — l)ten Grades übergehe.
Vierter Abschnitt. Symmetrische Functionen. §. 45. Begriff der symmetrischen Functionen. Symmetrische Grundfunctionen. Wir betrachten in diesem Abschnitt ganze Functionen beliebigen Grades von einer beliebigen Anzahl, n, von Veränder- Veränderlichen «i, a2 ... an. Eine solche Function heisst symmetrisch, wenn sie ungeändert bleibt, wenn die Variablen aL, k2 . . . an einer beliebigen Permutation unterworfen werden, und solche symmetrische Functionen sind es, deren Eigenschaften und Bildungsgesetze wir jetzt genauer kennen lernen müssen. Damit eine Function *&(<*!, a2 .. . ey) symmetrisch sei, ist es genügend, dass sie sich bei der Vertauschung von je zweien der Argumente a15 o^ . . . an nicht ändere, weil nach §. 21 alle Permutationen durch eine Keihe von Transpositionen gebildet werden können. Die Function <& wird im Allgemeinen nicht homogen sein, sondern Glieder verschiedener Dimension enthalten; wenn man aber alle Glieder gleicher Dimension zusammenfasst, so lässt sich jedes 0 durch eine Summe homogener Functionen ver- verschiedener Grade darstellen, und wenn <& symmetrisch sein soll, so muss jeder homogene Bestandtheil eines bestimmten Grades für sich symmetrisch sein, da durch die Permutationen der Variablen die Dimensionen der Glieder nicht geändert werden.
§. 45. Symmetrische Grundfunction. 155 Wir können uns hiernach auf die Betrachtung homogener, symmetrischer Functionen beschränken, aus denen alle anderen sich zusammensetzen lassen. Hiernach ist es leicht, die allgemeine Form einer symme- symmetrischen Function anzugeben. Wir erhalten sie, wenn wir in einem Gliede einer solchen Function (ähnlich wie bei der Bildung der Determinanten) die unteren Indices auf alle mögliche Art permutiren und die Summe aller so gebildeten Glieder nehmen. Eine solche Function können wir einen Elementarbestandtheil einer symmetrischen Function nennen. Nehmen wir mehrere solche Elementarbestandtheile, multipliciren sie mit beliebigen, von den a unabhängigen Factoren und addiren sie, so erhalten wir die allgemeinste symmetrische Func- Function. Die Anzahl der Glieder eines dieser Elementarbestand- Elementarbestandtheile ist, wenn die Exponenten vx, v2 . . . vn alle von einander verschieden sind, II(n); wenn aber ein und derselbe Exponent v mehrmals vorkommt, so hat man die Permutationen, die keine verschiedenen Glieder geben, wegzulassen. Es ist z. B. bei drei Veränderlichen, wenn vL, v2, v3 verschieden sind, ein Elementar- Elementarbestandtheil : wenn aber v3 = v% ist «n a»s «j» -f- «ji«»«etj« -f- «n «j-s«»«. Das einfachste Beispiel einer symmetrischen Function ist die Summe der Variablen «l + «! + «H h «n- Ebenso gehört das Product «j, a.2 . . . an dazu. Diese beiden sind die extremen Fälle einer Keine von sym- symmetrischen Functionen, die wir die symmetrischen Grund- functionen nennen und folgendermaassen erhalten. Das Product A) f(x) = {x — «,) (x — k.2) . . . (x — «„) ist, was auch x sein mag, wenn nur x von den et, unabhängig ist, eine symmetrische Function von et,, <% , . . an. Wenn wir also die Multiplication der einzelnen Factoren ausfuhren und
156 Vierter Abschnitt. §. 46. nach Potenzen von x ordnen, so sind die Coefficienten der ein- einzelnen Potenzen von x gleichfalls symmetrische Functionen. Denn sie ändern sich bei der Vertauschung der u ebenso wenig wie die Function f(x), Wir setzen B) f{x) = x" -\- a^-1 -\- a^x«-2 -| f- an^x -\- an. Die Functionen au a2 . . . an sind die Coefficienten der alge- algebraischen Gleichung, deren Wurzeln «l5 a2 . . . an sind. Sie werden die symmetrischen Grundfunctionen genannt. Diese symmetrischen Grundfunctionen haben wir schon im §. 7 gebildet; es ist, wie wir uns erinnern, ax die mit negativem Zeichen genommene Summe der a, a2 die Summe der Producte zu zweien, a% die mit negativem Zeichen genommene Summe der Producte zu dreien u. s. f., endlich an das Product sämmtlicher «, mit positivem oder negativem Zeichen, je nachdem n gerade oder ungerade ist. Wir setzen abkürzend aL = — 2 «i «2 = + 2 ««1 ««2 C) a% = — 2 ««i «2 «3 Das Ziel unserer Betrachtungen ist der Beweis des Haupt- Hauptsatzes, dass sich alle symmetrischen Functionen der et rational durch die Grundfunctionen ausdrücken lassen. §. 46. Die Potenzsummen. Wir beschäftigen uns zunächst mit einer anderen speciellen Art symmetrischer Functionen, den Potenzsummen. Bedeutet nämlich v irgend einen ganzzahligen positiven Exponenten, so gehört (i) Sr = < + «; + • • • + *: offenbar zu den symmetrischen Functionen, und sr wird die vu Potenzsumme genannt. Wir wollen Formeln ableiten, nach denen die Potenzstimmen durch die Grundfunctionen ausdrück- ausdrückbar sind. Wir bezeichnen in der Folge immer, wenn <p (x) irgend eine Function von x ist, mit
§. 46. Potenzsummen. 157 die Summe, die wir erhalten, wenn x in q>(x) durch jede der Variablen au a2 . . . an ersetzt und die so gebildeten Functionen addirt werden, also S[q>(et)] = (p («x) + (p(et,,) -\ \- (p («„). Hiernach ist z. B. 5 (es») = s, ¦ die vte Potenzsumme. Wir dividiren nun/(a;) nach §. 4 durch eine beliebige lineare Function x — a und erhalten worin [§. 4, (8)]: /i («) = « + «i g («) =:«¦! + «!« + a2 C) /3 («) = «3 -(- ax et2 -)- a2« -|- a3 3 -^ \- an^. Wir setzen in B) für a jede der Grossen «„ «a . . . es», wo- wodurch /(«) = 0 wird und bilden die Summe S. Die linke Seite ergiebt dann nach §. 14, A1) + (» — l)«!^-2 -f- (w — 2)a2a^-3 + • • • + «n-i, während die rechte Seite E) »*-* + «-«SQ/i(«)] + «-^-SfQ/iC«)] ^ h S[/-i(«)] wird, und die Vergleichung der Coefficienten gleicher Potenzen Ton x in D) und E) ergiebt «)] =(»-2)o, Es ist aber nach A) und C) S„_2 -4-
158 Vierter Abschnitt. §. 46. und demnach erhält man aus F) das folgende von Newton herrührende Formelsystem*): 0 = Si + «i 0 = s2 + % Si + 2 a2 G) 0 = s3 -+- % s2 + a2 sx -+- 3 Oj 0 = S„_2 -j- «x S„_2 + % S»-8 H h (» — 1) «»-!• Dies Formelsystem lässt sich aber noch weiter fortsetzen; denn da «[/(«)] = 0, S [«/(«)] = 0, S [««/(«)] = 0... ist, so folgt 0 = «n + «1 S«-l + 0 = s„+1 -\- axsn -f 0 = s„+2 + «i sn+i + «2s„ + • • • + «» Durch die Formeln G), (8) ist nun die Aufgabe gelöst, der Reihe nach die Functionen sL, s2, s3 . . . bis zu beliebiger Höhe als ganze rationale Functionen der symmetrischen Grund- functionen darzustellen, z. B.: Sl == — eh. s2 = -j- a\ — 2 a2 (9) s3 = — al -f- 3 «i a2 — 3 % s4 = + ai — 4 af a2 + 4 <h <h + 2 a| — 4 a4 ••.....••5 und die Bildungsweise dieser Ausdrücke zeigt, dase die Coeffi- cienten in diesen Darstellungen ganze Zahlen sind. Man kann auch umgekehrt mittelst der Formeln G) und (8) die symmetrischen Grundfunctionen au a2, % . . . rational durch die Potenzsummen s^, s2, s3 . . . ausdrücken. Diese Darstellung ist aber insofern weit weniger einfach, als die Coefficienten nicht ganze, sondern gebrochene Zahlen sind, z. B. (*! = — $! A0) 2 a2 = + sl — s2 6a8 = — sf -+- 3sxS2 — 2s3 ') Newton, Arithmetica universalis, edit. s'Gravesande, p. 592.
§. 46. Potenzsummen. • 159 Man kann das Formelsystem (8) auch nach der entgegen- entgegengesetzten Kichtung fortsetzen, wenn man die Gleichungen 8 [«-1 /(«)] = 0, 8 K2 /(«)] = 0 . . . bildet. Man erhält dadurch ein Mittel, um die Potenzsummen Sv auch für negative Exponenten v durch die Grundfunctionen auszudrücken. Diese Summen der negativen Potenzen gehören gleichfalls zu den symmetrischen Functionen, wenn auch nicht mehr zu den ganzen, sondern zu den gebrochenen. Sie gehen erst durch Multiplication mit Potenzen des Productes aL a2 . . . an in ganze Functionen über. Der Vollständigkeit wegen setzen wir die zwei ersten dieser Formeln hierher: 0 = s„_i + <hsn_2 -f- a2s„_3 -f- • • • -f- »«„-i -j- ans_i 0 = s„_2 + «! s„_3 -f- «2 s*-i + * h «n-i«-i + a»s_3, die sich nach G) auch so darstellen lassen: «„_! + a„s_! = 0, 2 a„_2 + a„_iS_i + a„s-2 = 0. Die in §. 15 abgeleiteten Formeln (9) und A0) ergeben für die Functionen /„ die später anzuwendenden Relationen 8 4rr = 0 v = 0, 1, 2 ...» - 1 A2) '» O /n-l(«) _ ! /'(«) "~ Im §. 4 haben wir für die Functionen fv{x) bereits die Relation kennen gelernt: fv (x) — xfv-i (x) = ar. Daraus ergiebt sich und daraus nach §.15 (9), so lange fi < n ist, Dies führt aber mit Hülfe von A2) zu dem Satze = 1 [i -\- v = n — 1, der für jedes v gültig ist, so lange ft < n ist. Diese Formeln bleiben auch dann noch richtig, wenn der Coefficient der höchsten Potenz von x in f(x) nicht gleich 1 ist, wenn also
160 Vierter Abschnitt. §. 47. f(x) = a0 x" -)- «! a;"-1 4 ••• + «»» und A4) fr(x) = aox^-\-a1x^-] \-av gesetzt ist. §. 47. Beweis des Hauptsatzes für zwei Variable. Wir gehen nunmehr zum Beweis des Fundamentalsatzes der Theorie der symmetrischen Functionen über, dass sie alle rational durch die symmetrischen Grundfunctionen ausdrückbar sind. Da wir die Yollständige Induction als Beweismittel anwenden, so leiten wir den Satz zunächst unter der Voraussetzung ab, dass nur zwei unabhängige Veränderliche a, ß gegeben seien, aber auf einem Wege, der zugleich für den allgemeinen Beweis den leiten- leitenden Gedanken hervortreten lassen wird. Wir bezeichnen die symmetrischen Grundfunctionen mit A) a = _(a + /3), b = aß und setzen demgemäss B) f(x) = (x — a) (x — ß) = x* -f ax -\- b. Es sei nun S(a, ß) irgend eine ganze rationale und sym- symmetrische Function von a und ß. Wir können für ß aus A) den Werth — (a -\- a) einsetzen und erhalten, wenn wir nach Po- Potenzen von k ordnen, C) S(a, ß) = S(a, — a — a) = A0ot,m -\- Äxa™-1 -\ -f- A>-i<« + Am worin die Coefficienten Ao, Ax . . . Am nur von a und von den in 8 etwa noch vorkommenden Coefficienten abhängen. Wir bemerken aber ausdrücklich, dass, wenn in S(a, ß) keine ge- gebrochenen , Zahlencoefficienten vorkommen, auch in den Coeffi- Coefficienten Ai A • • • A» keine Brüche auftreten. Wir setzen nun D) ®(x) = A^m + Ao1"-1 H h Am-ix -\- An, dividiren 9(x) durch f(x) (nach §. 3) und erhalten einen Quo- Quotienten Q und einen Rest, der in Bezug auf x höchstens vom ersten Grade ist, also: E) O(x)=
§. 48. Allgemeiner Beweis des Hauptsatzes. 161 hierin sind .nun A und B ganze Functionen von a und b, und auch sie enthalten keinerlei gebrochene Zahlencoefficienten, wenn in S keine solche vorkommen. Wenn wir nun x = a setzen, so ergiebt sich aus E) und C), da f(a) verschwindet, F) 8(u,ß) = A-\-B«. Da aber S(cc, ß) und ebenso A, B symmetrisch sind, so folgt durch Vertauschung von a und ß G) 8(a,ß) = A + Bß. Hieraus schliesst man, da « und ß von einander unab- unabhängige Variable sind, dass B = 0 und folglich (8) <8(«, ß) = A sein muss, womit der Fundamentalsatz für diesen Fall bewiesen ist. §• 48. Allgemeiner Beweis des Hauptsatzes. Wir setzen nun voraus, der Fundamentalsatz sei bewiesen für symmetrische Functionen von n — 1 Veränderlichen und leiten ihn durch ein Verfahren, was dem in §. 47 angewandten ganz analog ist, für n Variable her. Es sei wieder A) S = £(«!, «2 ...«„) , eine ganze symmetrische Function der n Veränderlichen «l5 a2... &,„. Wenn wir sie nach Potenzen von c^ ordnen und demgemäss setzen B) 8 = So < + S1 ««-1 -| h <Vi«! + 8» so sind die Coefficienten <S0, St . . . /Su ganze symmetrische Functionen der n — 1 Veränderlichen «2, . . . «„. Bezeichnen wir die symmetrischen Grundfunctionen dieser letzteren Variablen mit %, d% . . . ö4_i, so können wir die Coeffi- Coefficienten $o, $i ... S^ nach unserer Voraussetzung rational durch diese ausdrücken. Es ist aber nach §. 46, B) und C) a'i = /i (ph) — <*i + «i «2 =/2 («0 = «i2 + «i «l + «2 «3 — /3 Ol) = «1 + «1 «l2 + «2 «1 + % Weber, Algebra. I.
162 Vierter Abschnitt. §. 48. d. h. die Coefficienten Sai ^ ... S,, können ganz und rational durch c«!, «!, a% . . . an ausgedrückt werden. Wenn wir also, nachdem diese Ausdrücke eingeführt sind, in B) aufs Neue nach Potenzen von ax ordnen, so erhalten wir C) S = Äo «j» + Al «»-1 -\ (- A.-1 «i + Äm, worin im Allgemeinen m ein von ft verschiedener Exponent sein wird, und die Coefficienten Ao, ,A1 . . . Am ganz und rational von al5 %...«„ abhängen. Wir setzen wieder D) ®(x) = Aoaf-\- ALcc»>-i -j 1- Am-iX + A„ und dividiren <&(x) durch f(x) = xn -\- a,! x"-1 -f- cr2 ^»-2 -)- • • • + an = (x — «j) (a; — «2) . . . (x — «„). Es ergiebt sich ein Quotient und ein Best, der in Bezug auf x höchstens vom Grade n — 1 ist. Wir setzen also E) ®(x)=Qf(x)-\-ip(x) F) 10) = Co x»-i + d*«-• H [. Cn^x + CUx, und hierin sind Co, Cj . . . (?„_! ganze rationale Functionen von «d a2 • • • am in denen, wenn Ä in seiner ursprünglichen Form keine gebrochenen Coefficienten enthält, auch keine Brüche vor- vorkommen. Nun ist aber, da /(aj) verschwindet, und S — i&fa) ist, nach E) G) S=*(«i) und hierin kann, da S symmetrisch ist, at durch a2, «ä . . . ccn ersetzt werden. Hieraus ergeben sich die folgenden n Glei- Gleichungen : c0«j-i + c,«r2 H h <^«-2«i + (c*-! - iS) = 0 ci «r2 H h <^»-2«2 + (c»_i - s) = 0 «r1 Co «T1 + Ci <~2 H h ^»-2«n + (C_x - S) = 0. Betrachten wir dies System als ein System homogener linearer Gleichungen mit den n Unbekannten Gf,, Ci ... Gn—2i Cn—X — S, so ist seine Determinante
49. Zweiter Beweis des Hauptsatzes. 163 die nach §. 25, Formel A2) gleich dem Product aller Differenzen «1 — «25 «i — «3 • • • ist, von Null verschieden, und folglich ist nach dem Satz II. in §. 27: Go = 0, d = 0 . . . GM-2 = 0 und (9) S=O-i, worin der zu beweisende Fundamentalsatz enthalten ist. Zu demselben Resultat gelangt man auch durch den Satz II, §. 33; denn da die Function (n — l)ten Grades von a; Q /y.n—1 _|_ Q <ri—2 _|_ . . . _1_ Q x —I— C S für x = «i, «2 . . . an, also für mehr als w — 1 Werthe ver- verschwindet, so müssen ihre Coefficienten alle Null sein. Der Beweis, den wir hier für das Fundamentaltheorem im Anschluss an Cauchy1) gegeben haben, bietet zugleich ein Mittel, in besonderen Fällen den Ausdruck einer symmetrischen Function durch die Grundfunctionen wirklich zu berechnen. Dieselbe Möglichkeit bieten auch die anderen Beweise, die für das Theorem bekannt sind. Wir wollen noch einen zweiten Beweis hier mittheilen, der zu einer oft einfacheren Berechnungs- Berechnungsart führt2). §. 49. Zweiter Beweis des Satzes von den symmetrischen Functionen. Es sei S eine ganze symmetrische Function der Variablen «i, «2 • • • «m- Die einzelnen Glieder dieser Function sind alle von der Form ') Cauchy, Exercices de mathematiques, 4^m« annee. 2) Waring, Meditationes algebraicae. Gauss, Demonstratio nova altera theorematis omnem functionem algebraicam rationalem integram unius variabilis in factores reales primi vel secundi gradus resolvi posse. Werke, Bd. III, S. 36. 11*
164 • Vierter Abschnitt. §. 49. Map a\* . . . «*", worin M ein von- den « unabhängiger Coefficient ist. Diese Glieder sollen nun in bestimmter Weise angeordnet werden. Es soll, nachdem die Reihenfolge der Variablen u1, «2 . . . «„ fest- festgesetzt ist, von zwei Gliedern A = Map al* . . . an, AI = M' <'i <« ...«*" A das höhere genannt werden, wenn die erste der Differenzen l>! — VU V2 — V2 . . . Vn — Vm die von Null verschieden ist, einen positiven Werth hat, wenn also entweder v1 > v\ oder v1 = v{, v2 > v'% oder v1 = v[, v2 = v'i, v% > v'b etc. Da wir alle Glieder, in denen sämmtliche Exponenten vu v2 . . . vn übereinstimmen, in ein Glied vereinigt voraussetzen, so ist hiernach von je zwei Gliedern entschieden, welches das höhere ist, und wenn A höher als A!, A' höher als A" ist, so ist auch A höher als A". Ist nun nach dieser Anordnung A = Map «**... «*w das höchste Glied unserer Function <S, so folgt, dass sein muss; denn wäre vi < v2, so würde das Glied Jlf «** c^i . . . «*M, das wegen der Symmetrie gleichfalls in 8 vorkommen muss, in der Ordnung höher stehen als A, gegen die Voraussetzung. Ebenso folgt, dass v2 5 vz sein niiss, denn wäre v2 < v8, so würde M<i <3 «r*. •. «"" Lad n höher stehen als J. u. s. f. Wir schliessen also, dass die Expo- Exponenten in A vu v2, vs . . . vn eine abnehmende oder wenigstens niemals wachsende Zahlenreihe bilden, oder dass die Differenzen n — v2, v2 — i/3, ... vn_x — vn alle positiv oder wenigstens nicht negativ sind. Wir schliessen zweitens, dass in keinem Gliede der Function 8 ein höherer Exponent als vv vorkommen kann; denn sonst
§. 49. Zweiter Beweis des Hauptsatzes. 165 würde auch ein Glied vorkommen, in dem a^ diesen höheren Exponenten hätte, und dies wäre gegen die Voraussetzung von höherer Ordnung als A. Es sind also die Glieder, die in einer symmetrischen Funetion überhaupt vorkommen können, von den Coefficienten abgesehen, durch das höchste Glied vollkommen bestimmt, und die Anzahl der möglichen Glieder ist bei gegebenem höchsten Gliede nur eine endliche. Wir ordnen die symmetrischen Functionen nach der Expo- Exponentenreihe ihres höchsten Gliedes Oi, v2 . . . vn) in der Weise an, dass von zwei solchen Functionen 8, 8' mit den Exponentenreihen (^, v2 . . . vn) und (v[, v'% . . . v'n) S als die höhere gilt, wenn die erste nicht verschwindende unter den Differenzen vx — v\, v2 — v'% . . . vn — v'n positiv ist. Die niedrigste Ordnung ist hiernach die, in der alle diese Exponenten = 0 sind, und die symmetrische Funetion also eine Constante wird. Die nächst niedrige Ordnung ist A, 0, 0 ... 0), der die einzige symmetrische Funetion entspricht. Die nächstfolgende Ordnung ist A, 1, 0 ... 0), der die symmetrische Funetion M % -)- M' a2 entspricht, und so erhalten wir in den n ersten Ordnungen die Grundfunctionen selbst und ihre linearen Verbindungen, und keine anderen. Die nächstfolgende Ordnung ist charakterisirt durch B, 0, 0 ... 0) und enthält die linearen Verbindungen der Grundfunctionen mit der Summe der Quadrate. In allen diesen Fällen ist die Darstellbarkeit der symmetri- symmetrischen Functionen bereits bewiesen, und wir werden also jetzt den allgemeinen Beweis dadurch führen, dass wir die Darstellung der Funetion 8 von der Ordnung (vt, i/2 . . . vn) durch die Grundfunctionen unter der Voraussetzung ableiten, dass sie für die Functionen niedrigerer Ordnung schon bekannt sei, also durch das Schlussverfahren der vollständigen Induction. '
166 Vierter Abschnitt. §. 49. Wir bemerken hierzu, dass durch die Multiplication zweier symmetrischer Functionen 8 und #', deren höchste Glieder A = Mof* «£ . . . «*», AI = M' <i «£'« ...«*" sind, eine symmetrische Function entsteht, deren höchstes Glied das Product A AI = JOf'a*i+'"ia£s+1 . . . «**"+1/" ist. Denn nehmen wir an, es gebe in SS' ein höheres Glied als AA', das aus der Multiplication der beiden Glieder B = JV»ui a£s . . . «'"M, B' = N' a{"i «"'2 . . . «"" entsteht, also BB' = Mt(fi+.";«;»+c; ... <%»+ll\ und es sei nicht gleichzeitig B = A und 5' = .4/, so wäre die erste der Differenzen fh — vl + Fl ^i) f*2 vl -\- F2 V2, • • • F» vn + F» — v»i die von Null verschieden ist, positiv, was unmöglich ist, da die erste nicht verschwindende unter den Differenzen (h — vn f% — va . . . [in — vn und unter den Differenzen f*i — v'lt (i'a — v'2 . . . [i'n — ^ nach der Voraussetzung negativ ist. Durch Wiederholung dieses Schlusses ergiebt sich der allgemeinere Satz, dass man das höchste Glied eines Productes aus mehreren Factoren erhält, wenn man die höchsten Glieder der einzelnen Factoren multi- plicirt. Die höchsten Glieder der symmetrischen Grundfunctionen al5 «2i «g . • • a» sind nun, abgesehen vom Vorzeichen, «!, «! «2, «1 W2 W3l • • -, «1 «2 «3 • • • W>M und wenn wir also das Product bilden P — -j- JK"a^*a;is-*» . . . a*ü71~~1'M a^M, so erhalten wir eine symmetrische Function, deren höchstes Glied gleichfalls A ist, wie in 8. Die Differenz 8 — P = S' ist also wieder eine symmetrische Function, deren höchstes Glied niedriger ist als das von S, und die wir nach der Voraus-
§. 50. Discriminanten. 167 Setzung rational durch die Grundfunctionen darstellen können. Da P ebenso dargestellt ist, so ist das Ziel erreicht. Es erhellt auch hier wieder, dass durch die Darstellung mittelst der Grund- Grundfunctionen keine Brüche eingeführt werden, wenn ursprünglich in S keine enthalten sind. Diese Methode der Berechnung symmetrischer Functionen giebt uns zugleich Aufschluss über den Grad der ganzen ratio- rationalen Function von Oj, a2 . . . a„, durch die eine bestimmte symmetrische Function der «j, «%...«„ ausgedrückt wird. Wenn nämlich (vx, v2 . . . vn) die Ordnung der symmetrischen Function ist, so ist vx der Grad von P in Bezug auf sämmtliche av. a2 ... an, und in dem entwickelten Ausdruck für 8 kann kein Glied höheren Grades vorkommen; auch kann das Glied P durch keines der folgenden Glieder zerstört werden, da P durch die Ordnung von 8 völlig bestimmt ist, und die Ordnung von S' und aller folgenden symmetrischen Functionen niedriger ist, als die Ordnung von S. Setzen wir an Stelle von %, a2 . . . an: *i «2 an aa' a0 «o ' so ist aj» 8 eine ganze homogene Function vtten Grades von a0, ß] . . . an, und man kann 8 nicht durch Multiplication mit einer niedrigeren Potenz von a0 in eine ganze Function der a verwandeln. Der Exponent v1 ist also bestimmt durch die höchste Potenz, in der irgend eine der Wurzeln k in 8 vorkommt. §. 50. Discriminanten. Die im Vorhergehenden gewonnenen Sätze lehren, sym- symmetrische Functionen der Wurzeln einer Gleichung rational durch die Coefficienten der Gleichung auszudrücken; die Resultate sind zunächst abgeleitet unter der Voraussetzung, dass die Wurzeln, oder, was nach dem dritten Abschnitt damit gleichbedeutend ist, die Coefficienten unabhängige Variable waren; sie können aber nicht falsch werden, wenn dafür bestimmte numerische Werthe gesetzt werden, da wenigstens bei den ganzen symmetrischen Functionen keine Nenner vorkommen, die verschwinden können.
168 Vierter Abschnitt. * §. 50. Wir machen zunächst einige Anwendungen auf besondere symmetrische Functionen, die für die Folge wichtig sind. Schon im §. 22 ist bemerkt worden, dass das Differenzenproduct A) P = («! — Ojs) («! — «3) . . . («! — Kn) («3 «3) ... («2 — «») durch Umstellung zweier Elemente nur das Vorzeichen ändert. Das Quadrat dieses Productes wird also bei allen Vertauschungen, zweier der Variablen a und demnach auch bei allen Permu- Permutationen umgeändert bleiben, d. h. eine symmetrische Function der Variablen sein. Die Ordnung dieser symmetrischen Function ist, wie man aus A) sieht, gleich B n — 2, 2 n — 4, ... 2, 0). Wenn wir also die Function f(x), deren Wurzeln die au a%... an sind, in der Form annehmen f(%) — aoxn -\- axxn~Y -j- «2%"~2 + • • • + «n-i* + «n, so dass die höchste Potenz von x nicht gerade den Coefficienten 1 hat, so ist P2 eine ganze rationale Function von die durch Multiplication mit afn~i in eine homogene Function von a0, %, . . . an übergeht. Wir nennen diese homogene Func- Function, die also durch C) ao2«-2P2 = D definirt ist, die Discriminante der Function f(x). Setzen wir aa = 1, so erhalten wir die unhomogene Form der Discriminante1). Das Verschwinden der Discriminante ist die noth- wendige und hinreichende Bedingung dafür, dass zwei der Werthe at, «2 . . . k„ einander gleich werden. Wir können für die Discriminante noch einen zweiten Aus- Ausdruck aufstellen. Es ist nach §. 14, A2) n(n—1) *) Die Discriminante ist, vom Factor (— 1) 2 «o"~% abgesehen, dasselbe, was Gauss die Determinante der Function nennt A. c, art. 6).
§¦ 50. Discriminanten. 169 D) — «3) . . . («j — «„) — a3) . . . («2 — «„) /' («n) = «0 («» — «*i) («« «2) • • • («n — «m-i), folglich, da hier jeder Factor (uh — e%) zweimal mit entgegen- entgegengesetzten Zeichen vorkommt, E) D = (- 1) 2 «r2 /' («a) /' («2) • • • /' K> Um die Discriminante wirklich darzustellen, haben wir zu- zunächst ein allgemeines Mittel. Es war nach §. 25 F) (-1) 'P = 1, «!, «f und wenn wir nach §. 30 das Quadrat dieser Determinante durch Multiplication nach Verticalreihen als eine neue Determinante darstellen und »»= «r + «m— «r setzen G) 5.7, • . • Sn—1 . . . Sn s23). Die Grossen sm sind aber die Potenzsummen, die wir schon im §. 46 durch die Coefficienten ausgedrückt haben; nur sind an Stelle der ax, a^ . . . an die Quotienten B) zu setzen. So finden wir z. B. für n = 2 (8) D — a02 (s0 s3 — sf) = ö^2 — 4 a0 a2 und für w = 3 (9) D = a04 (s0 s2 s4 — s0 s32 -f 2 sx s2 s3 — sfs Hierin ist nach §. 46 zu setzen s0 = 3, «o sl = — % — 27 a02a32. ao S3 = — «i + 3 a0 «1 «2 — 3 a02 % a*s4 = af ¦— 4a0 afa.2 -f- 4 a02 c^ a3 wodurch man erhält A0) D = O]2^2 + 18 «o «1 «2 «3 — 4 a0 «| —
170 Vierter Abschnitt. §. 51. Die Discriminante I) ist eine unzerlegbare Funciion der Variablen a0, % . . . an (§. 20). Denn angenommen, JD habe einen rationalen Theiler Du so muss Dx homogen sein, und lässt sich daher, von einer Potenz von a0 als Factor abgesehen, rational durch die Variablen «!, «2 • • • an ausdrücken. Da nun D durch keine Potenz von a0 theilbar ist, so muss Dt, wenn es nicht constant ist, die Variablen ß15 «2 . . . e*n enthalten und muss daher wegen C) durch eine der Differenzen a,- — «fc theilbar sein. Da aber andererseits Dx in Bezug auf die «j, «2 . . . k„ symmetrisch ist, so ist es auch durch das Quadrat von «,• — «fc und durch das ganze Product P2 theilbar, also, von einem constanten Factor abgesehen, mit D identisch. §• 51. Kennzeichen für die Anzahl der verschiedenen Wurzeln. Das Verschwinden der Discriminante D ist, wie wir gesehen haben, die Bedingung dafür, dass zwei unter den Wurzeln «!, «2, • . . ot,n der Gleichung f(x) = 0 einander gleich werden. Man kann aber diesen Satz noch verschärfen und so ein genaues Kennzeichen für die Anzahl der verschiedenen Wurzeln von f(x) = 0 herleiten. Wenn, wie bisher, s0, sx, s2, . . . die Potenzsummen der k bezeichnen, so setzen wir nun für ein beliebiges v ^ n A) D, = j, . . . Sv so dass, wenn a0 = 1 angenommen wird, Dn mit der Discrimi- Discriminante D von f(x) übereinstimmt. Um diese Functionen Dv durch die Wurzeln «,¦ auszudrücken, beweisen wir. folgenden Satz: 1. Man wähle beliebig v unter den Grossen «j aus, etwa k1: «2 . . . av, und bezeichne das Differenzenproduct [§. 50, A)] dieser v Grossen mit
§. 51. Kennzeichen f. d. Anzahl d. verschiedenen Wurzeln. 171 B) P, = 1, «!,... «J-1 i,«,,... «r1 D, = 2 Wj Wj 2 K{ Kt 2^ &h Dann ist; worin sich die Summe 2 auf alle möglichen Arten, die v Grossen Oj, a.2, . . ., kv auszuwählen bezieht. Man kann diesen Satz auch so ausdrücken, dass Dv die Summe der Discriminanten aller der Gleichungen ist, die irgend v von den Grossen k{ zu Wurzeln haben. Um ihn zu beweisen, sei v irgend eine unter n gelegene Zahl. Schreiben wir dann die Determinante Dv in der folgenden Form: v-i 0 1 ¦«-! 0 v—1 2 <*. k{ , ... 2 «*,• «f V r/1 r/1 V /v1 r/~1 2«. »,,.-.1«, «, so können wir den Schlusssatz des §. 30 anwenden, wenn wir dort „(.*) j.(«) „*—i n h s setzen, und dann geht die Formel A6), §. 30 unmittelbar in die Formel C) über. Daraus erkennen wir zunächst nach §. 49, dass a%v~iDv eine ganze Function der a0, %, . . . a„ ist, die den Factor a0 nicht mehr hat. Es ergiebt sich aber auch daraus die folgende Be- Bedeutung der Dv für die Erkennung der Wurzelgleichheit: 2. Die nothwendige und hinreichende Bedingung dafür, dass unter den k1, m2, ...,«„ nicht mehr und nicht weniger als q verschiedene vor- vorkommen, ist -fy+i = 0, D?+3 = 0, . . . Dn = 0, D? von Null verschieden1). Denn ist v grösser als q, so kommen in jedem der Diffe- renzenproducte P„ der Formel C) zwei gleiche k vor, und sie verschwinden also alle. Ist aber v = q, so enthält die Summe x) Dieser schöne Satz ist von L. B a u r gefunden und dem Verfasser mitgetheilt (Mathematische Annalen, Bd. 50).
172 Vierter Abschnitt. §. 52. C) ein nicht verschwindendes Glied, nämlich das Differenzen- product der q verschiedenen Grossen ku «2, . . ., «?, während alle anderen Glieder der Summe verschwinden. §• 52. Discriminanten der Formen dritter u"nd vierter Ordnung. Bei den Functionen dritter und vierter Ordnung haben wir zur Berechnung der Discriminanten in den Auflösungen der Gleichungen dieser beiden Grade (§. 38, §. 40) ein einfaches Mittel. Was zunächst die Gleichung dritter Ordnung betrifft, so waren die drei Wurzeln von A) x°- + ax + b = 0 in der Form dargestellt: m = u -\- v B) ß = su -f- s^v y = 62M-(- ev, worin (S) die complexen dritten Einheitswurzeln sind und m, v durch §. 38, (8) bestimmt sind. Aus <3) folgt D) a— e* = V-r und aus B) a — ß = V— 3 («2« — ev) k — y = — V— 3 (eu — e2v) ß — y = V— 3 (tt — i;).n Hieraus durch Multiplication E) (« — /S) (« — y) (ß - y) = 3 Y=3 (tt» — »»> Erhebt man ins Quadrat, so erhält man für die Discri- minante der cubischen Gleichung A) nach §. 38, F) F) D = — B7 &2
§. 52. Discriminan^en. 173 Hieraus erhält man die Discriminante der allgemeinen Function G) a0 x% -j- ax x* -\- a2 x -\- a3, wenn man für a und b die Ausdrücke §. 37, D) einsetzt, in denen man %, a2, az durch % a% <h ersetzt, und mit a04 multiplicirt [§. 50, C)]. Man erhält so 3 a0 «2 — «i3 , 2al — 9 «o «i % -f- 27 a02 % °~ 27< ' und folglich (8) D = - 2^ {B af - 9 a0 % a2 + 27 a02a3 Wenn man das Quadrat und den Cubus ausrechnet, so kommt man zu der Formel A0) §. 50 zurück; es ist aber be- merkenswerth, dass die Formel (8) scheinbar den Nenner 27 a02 enthält, der sich beim Ausrechnen forthebt. Ebenso können wir bei den biquadratischen Gleichungen verfahren. Wir erhalten, wenn «, ß, y, ö die Wurzeln der bi- biquadratischen Gleichung (9) a^-f- ax2 -\- hx -\- c = 0 sind, nach §. 40, E) « — ß = v -j- w, y — ö = v — w, A0) cc — y = tc -j- tt, d — ß = w —¦ u, cc — d = u -\- v, ß — y = u — v. Danach wird die Discriminante der Gleichung (9) D = (|>2 — W2J (W2 — M2J (U2 — V2J, d. h. es ist D gleich der Discriminante der cubischen Resolvente §. 40, D) A1) s% + 2a.?2 -f («2 — 4c) s — Z>2 = 0, deren Wurzeln u'\ v2, w2 sind. Wenn man diese Discriminante aber nach der Formel A0), §. 50 bildet, indem man a0 = 1, öSj = 2 a, a2 = a2 — 4 c, % = — 52
174 Vierter Abschnitt. §. 52. setzt, so folgt A2) D= — 4a3&2_|_ U4ac62+ 16a*c — 128 a2e2 + 256 c3 — 27 R Wenn man dagegen zur Bildung der Discriminante der cubischen Gleichung A1) die Formel (8) anwendet, so erhält man A3) 27 D= 4(a2 -f 12 c)» — B «3 _ 72 ac + 27 Z>2J. Man leitet hieraus die Discriminante der allgemeinen Func- tion vierten Grades A4) f(x) = «o #* -|- ^i %3 -\- a2x2 -\- asx -j- a4 ab, indem man nach §. 37, D) a, 5, c durch — 3 a* . «1 «1 «2 , - 1 2"" + ^ — 3 aj4 , «j3 a2 % «3 , ~256 "" T6 4~ ' üi ausdrückt, dann %, a2, a3, a4 durch ersetzt und mit a06 multiplicirt. Setzt man nach Ausführung dieser einfachen Rechnung zur Abkürzung A5) A = a| — 3 % a3 -j- 12 a0 «4, A6) 5 = 27 fflj2^ + 27 a0 <as| + 2 a23 — 72 a0 a2 a4 — 9 % a2 a3, so erhält man aus A3) A7) 27D = 4:A3 — B2. Die Grossen A und B, die uns im nächsten Abschnitt noch beschäftigen werden, heissen die erste und zweite Invariante der biquadratischen Function /. Man kann also nach A7) die Discriminante rational durch diese Grossen ausdrücken, jedoch nicht so, dass die Coefficienten ganzzahlig werden; führt man die in A7) vorgeschriebene Rechnung aus, um D durch die Coefficienten aa, «!, «2) az selbst darzustellen, so muss sich der Factor 27 noch fortheben lassen. Wir wollen den langen Ausdruck, dessen Berechnung keinerlei Schwierigkeit bietet, nicht hierher setzen.
§. 53. Resultanten. ^ 175 §. 53. Resultanten. Eine andere Anwendung der Theorie der symmetrischen Functionen, die übrigens die Discriminantenbildung als speciellen Fall enthält, ist die Bildung der Resultanten. Es seien A) /(a?) = o0Ä» + «1»»-1 + oa»»-!'H h«», B) <p(x) = boxm-jt-blxm-1 + b2xm-z H \-bm zwei ganze rationale Functionen vom wten und mtm Grade und «i, «2, ... an seien die Wurzeln der ersten, so dass auch C) f{x) = a0 (x — «j) (x — ai)...(x — ccn) gesetzt werden kann. Nun ist das Product <P («i) 9 («2) • • • 9> («») eine symmetrische Function der Wurzeln von f(x) und kann also ganz und rational durch «i «2 _ _ «n fflo' ao «0 . ausgedrückt werden. Die Ordnung dieser symmetrischen Func- Function ist (m, m . . . m) (§. 49) und daher ist D) R = a™q> (%) q> («,)... q> (an) eine ganze rationale und homogene Function mter Ordnung von a0, aj ... aTC. Sie ist auch, wie ihr Ausdruck zeigt, eine ganze homogene Function wter Ordnung von b0, 5X . . . bm. Sie wird die Resultante der beiden Functionen f(x) und q>(%) genannt. Diese Bezeichnung rechtfertigt sich durch eine zweite Darstellung. Bezeichnen wir die Wurzeln von q>(x) mit &, ß2 . . . ßm, setzen also E) g>(x) = bo(x- ßt) (X-ß3)...(x — ßm), so wird nach D) F) B = a?b?II (cn - ft), worin das Productzeichen II sich auf alle Indices i = 1, 2 . . . n, Tc = 1, 2 . . . m bezieht.
176 Vierter Abschnitt. §. 53. Dieser Ausdruck zeigt nun, dass R, abgesehen von dem Factor (— l)mn, in der gleichen Weise von <p (x) abhängt, wie von f(x), und dass wir also auch setzen können G) (_ iyn R = bn /(&)/(&) . . . f(ßm). Die Discriminanten sind hiernach ein specieller Fall der Resultanten, den man erhält, wenn man für <p (x) die Derivirte f'(x) nimmt. Wie bei den Discriminanten, kann man auch von der Resultante nachweisen, dass es eine unzerlegbare Function der Variablen a, b ist. 1. Das "Verschwinden der Resultante von f(x) und q>(x) ist die nothwendige und hinreichende Bedingung dafür, dass die beiden Gleichungen f(x) = 0 und <p (x) = 0 eine gemeinsame Wurzel und folglich die Functionen fix) und q>(x) einen gemeinschaft- gemeinschaftlichen Theiler haben. Die Gleichung, die durch Nullsetzen der Resultante entsteht, wird auch die Endgleichung aus f(x) — 0 und q>(x) = 0 genannt und die Aufstellung der Endgleichung die Elimination von x. Zur Berechnung der Resultanten kann man den Algorithmus des grössten gemeinsamen Theilers anwenden (§. 6). Ist nämlich m ^ n, so kann man eine ganze Function Q und eine eben- ebensolche Function ip(x), deren Grad kleiner ist als m, so be- bestimmen, dass f(x)= Q9(x) + ^(x), also, wenn man für x eine der Wurzeln ß( setzt, (8) ist ml der Grad von 4>(x), so ist (9) h die Resultante von q>(x) und ip(x) und daher A0) ±R = bl-m'R'. Die Bildung der Resultante R ist hierdurch auf die Bildung von R' zurückgeführt. Man kann nun q>.(x) wieder durch i>(x)
§. 53. Resultanten. 177 theilen, und führt so die Bildung von B' auf die Bildung einer Resultante von Functionen immer niedrigeren Grades zurück, bis man schliesslich auf eine Constante, d. h. eine Function der Coefficienten a, b kommt, die mit der gesuchten Resultante iden- identisch sein muss. Die Berechnung der Resultanten ist meist sehr weitläufig. Wir wollen nur das einfachste Beispiel der Resultante zweier quadratischer Functionen anführen: f{x) = a0 x2 + ax x -\- a2 cp(x) = b0x2 + bxx-\- ~b%. Man kann hier direct das Product B = a02F0 «¦> +£>!«!+ b2) (b0a* + bt «2 + b2) berechnen, und erhält, wenn man «0 («1 + «ä) = «11 «o «1 «2 = «2 setzt, A1) B = agh* + a22502 — b0bt ax a2 — a0 «1 h h -\- b0 b% a? -\- a0 a2 6/ — 2fföJ0 <h b2, oder, was damit identisch ist, A2) B = («o &2 — «2 &0J — («o h — <h \) (% &2 — <h bi)- Die einzelnen Glieder der Resultante der zwei Functionen f(x) und 93 (x) vom wten und mien Grade haben, von einem numeri- numerischen (ganzzahligen) Factor abgesehen, die Gestalt A3) a;.«?...<.S'ff...e, worin, wie aus den oben bestimmten Graden hervorgeht, . ' ' vo + vi +. \- vn=m Wir können aber noch eine andere Relation zwischen diesen Exponenten angeben. Da nämlich [nach F)] B eine homogene Function wwton Grades von den n -\- m Variablen «, ß ist, da ferner a0 vom nullten, % vom ersten, a2 vom zweiten etc. Grade in den a, allgemein a& und bk vom &ten Grade in diesen Variablen sind, so folgt vi-f 2va-f 3vs-| \-nvn Weber, Algebra. I. 19
178 Vierter Abschnitt. §. 53. Wenn wir den Index Tt von a^ oder bb das Gewicht der betreffenden Grosse nennen und unter dem Gewicht eines Productes die Summe der Gewichte der einzelnen Factoren verstehen, so können wir der Formel A5) auch den wörtlichen Ausdruck geben: 2. Alle Glieder der entwickelten Resultante haben ein und dasselbe Gewicht mn. Summen, deren Glieder alle dasselbe Gewicht haben, heissen isobarische Functionen, und das Gewicht eines jeden Gliedes heisst das Gewicht der Function. Durch Multiplication mehrerer isobarischer Functionen entstehen wieder isobarische Functionen, und das Gewicht des Productes ist die Summe der Gewichte der Factoren. Die Resultanten sind isobarische Functionen der Variablen «fc, hc vom Gewichte mn. Die Functionen / und <p selbst kann man dadurch zu iso- isobarischen machen, dass man der Variablen * das Gewicht 1 beilegt. 3. Ersetzt man die Variablen in einer isobari- isobarischen Function durch homogene Functionen irgend welcher anderer Variablen vom Grade des Gewichtes der betreffenden Variablen, so entsteht aus der isobarischen Function eine homogene Function der neuen Variablen, deren Grad dem Gewichte der Function gleich ist. Wenn die Functionen f(%), q>(x) durch Ordnen zweier homogener Functionen der Variablen x, y, s . . . vom Grade n und m nach einer der Variablen x entstanden sind, so sind die Coefficienten as, b^ homogene Functionen vom Grade 1c der Variablen y, z . . . und aus 2. und 3. ergiebt sich der Satz: 4. Durch Elimination einer Variablen x aus zwei homogenen Functionen wten und wten Grades ergiebt sich eine Endgleichung vom Grade mn in den übrigen Variablen. Giebt man den Variablen a*, 5& nicht die Gewichte Tc, son- sondern (N -j- Tc) und (M -\- le), worin N, M irgend zwei Zahlen sind, so wird das Gewicht der Resultanten von / und <p, wie aus A4) und A5) hervorgeht,
§. 54. Bestimmung der gemeinschaftlichen Factoren. 179 A6) mN-{- nM -\- mn. Dies ist auch der Grad der Besultanten, wenn die a& und 5A durch Functionen von neuen Variablen der Grade N -j- h und M -\-lc ersetzt werden. §• 54. Bestimmung der gemeinschaftlichen Factoren. Eine elegante Lösung des Eliminationsproblems, wodurch wir zugleich die gemeinschaftlichen Factoren der beiden Func- Functionen f(x) und <p(%) erhalten, ergiebt sich, wenn man die in §. 4 eingeführten Functionen f3 (x) benutzt. Wir definiren aber jetzt diese Functionen so: /o 0») = «o ¦ft (x) = a0 x -f- % A) ft (a?) = fn(x) = aoxn -\- ^x»-1 -\- azx»-2 -j • -)- am so dass /„(#) mit der ursprünglich gegebenen Function f(x) identisch ist. Es ist aber fs (x) eine ganze Function sten Grades von x, und wenn wir B) /(*)==*—/.(a)+ #(aO setzen, so ist C) F. (x) = as+1 X»-*-* + as+2 x»-*-* -| \-an eine ganze Function vom Grade n — s — 1. Dieselbe Bedeutung mögen q>s{x) und 9s{x) für die Function <p (x) vom Grade m haben, so dass <p (x) = xi»-* <ps (x) -|- 0S (x) D) <ps(x) = Z>0 «• + 6i a^-1 H h^ #s (a?) = Z»s+1 a;"'-5-1 + 5s+2 a?»-«-2 -| 1- &m. Daraus ergiebt sich, wenn man s in B) und D) durch n — s und m — s ersetzt: ; E) q>fn-s —f<pm-s = (xs 9>OT_S + ^w_s)/n_s — (xsfn-s -f Fn_s) q>m_s = #OT_S/„_S — Fn_s 93m_s. Nehmen wir nun an, es sei :. F) »^ m, 12*
180 Vierter Abschnitt. §. 54. so ist die Function auf der rechten Seite der Gleichung E) vom Grade n — 1 in Bezug auf x. Wir setzen, indem wir s durch n — s -\- 1 ersetzen, G) $>/_! = A%sxn~^ + A%sxn~* -| hA« +/9>m-»+.-i, worin gjm_n+s_x = 0 zu setzen ist, wenn m — n -\- s — 1 negativ wird. Die Coefficienten J.r> s sind darin homogene lineare Functionen sowohl von den Coefficienten a< als von den Coefficienten b{. Sie sind zugleich isobarisch vom Gewichte (8) m — n -\- s -\- r — 1, wie man am einfachsten erkennt, wenn man nach der Vorschrift des vorigen Paragraphen der Variablen x das Gewicht 1 beilegt, wodurch die Functionen /s, <ps in isobarische Functionen mit dem Gewichte s übergehen. Wenn das Gewicht einen negativen Werth erhält, so ist die Function gleich Null. Beispielsweise ist, wenn n > m ist, und wenn n = m ist, -A.1>s = aobs — h0 as. Wir wollen aber die Formel G) nur so lange anwenden, als s > n — m ist, so dass darin nur positive Werthe von m — n -\- s vorkommen, also für s = n — m -)- 1, n — m -\- 2, . . ., n. Ist s <J n -r- m, so wollen wir setzen (9) <p a?-1 = Ä^x»-1 +. A^x"-* -| \- An,s s = 1, . . ., n — m. Diese Ar, s sind dann lineare Functionen der b allein. Sie sind nämlich, soweit sie nicht Null sind, geradezu den b gleich, so dass A0) Ar,s — bn-n+t+r-l, » — W + r^r + S^» + l und = 0, wenn m — n -\- s -\- r — 1 negativ oder grösser als m ist. Dann ist auch hier das Gewicht von Ar>s gleich m — n -\- s -\- r — 1, falls Ar, s nicht gleich Null ist. Um die Formeln (8), (9) zu vereinigen, wollen wir noch ein Zeichen ps einfuhren, so dass A1) ps = x8-1 für s = 1, . . ., n — m = /3-i „ s = n — m -\- 1, n — m -\- 2, . . ., n,
§. 54 Bestimmnng der gemeinschaftlichen Factoren. 181 und ps eine Function (s — l)ten Grades von x ist. Dann lassen sich die Gleichungen (8), (9) in die eine zusammenfassen: A2) q>ps = A^X»-1 + A,s«n-2 -\ h^v + «'/> worin qs = cpm^^^! oder (für negative m — n -j- s — 1) = 0 ist. Wenn nun für irgend einen Werth von x die Functionen f(x) und q> (x) zugleich verschwinden, so muss die Determinante des Systems verschwinden, das aus A2) hervorgeht, wenn wir / und <p = 0 setzen (§. 27, II). Die Bedingung hierfür ist also, wenn wir -™1, 1> -4-2, 1 • • • -o-m, 1 ,¦• n\ -p -, 2> -^-2, 2 • • • -o-M, 2 -n-1, Mi -42, n • • • -^m, n setzen, iJ = 0, und R ist daher die Resultante für / und <p. Man sieht auch hieraus sofort, nach den oben gegebenen Grad- und Gewichtsbestimmungen der J.r>s, dass R in Bezug auf die a vom Grade m, in Bezug auf die b vom Grade n und vom Gewichte mn ist, wie es sein muss. Wir wollen über die Determinante R und ihre Unter- Unterdeterminanten eine Reihe wichtiger Sätze ableiten. I. Wenn die beiden Functionen f und q> einen gemeinschaftlichen Theiler vom Grade n — r haben, so verschwinden alle Unterdetermi- Unterdeterminanten von R mit r -\- 1 Reihen. Um ihn zu beweisen, greifen wir aus der Reihe der Indices 1, 2, . . ., n irgend r -\- 1 heraus, «j, c^, . . ., «r+1, und bilden nach A2) die Gleichungen A4) Wenn nun cl5 c2, . . ., cr+1 irgend welche Constanten sind und P=C1pai -j-CzPas -) \~ Cr+lPar+1 A5) 0 = cx qai +c2qa2 -| 1- cr Cs :== Ci -o-s,«! ~r C2 -^-», «ä ~r " ' * ~r cr gesetzt wird, so folgt aus A4)
182 Vierter Abschnitt. §-54. A6) Nun kann man (§. 27, III) unter allen Umständen die Con- stanten cl5 c2, . . ., cr+J so bestimmen, dass A7) C, = 0, C2 = 0, . . ., Cr = 0 ist, und dann ist die Function C(x) auf der linken Seite von A6) höchstens vom Grade n — r — 1 in Bezug auf x. Wenn aber / und <p einen gemeinsamen Theiler (n — r)*131 Grades haben, so muss dieser nach A6) auch in C(x) enthalten sein, und dies ist nur möglich, wenn zugleich mit A7) auch die Gleichungen A8) Cr+i = 0, a+2 = 0, . . ., C„ = 0 befriedigt sind. Dann aber müssen nach §. 27, I. alle (r -\-1)- reibigen Unterdeterminanten der Matrix verschwinden, w. z. b. w. Es gilt auch der umgekehrte Satz: II. Wenn sämmtliche Unterdeterminanten von B mit r -\- 1 Reihen verschwinden, so haben die Functionen / und q> einen gemeinschaftlichen Theiler vom Grade n — r. Nehmen wir nämlich an, dass alle Unterdeterminanten von (r -\- 1) Reihen der Matrix A9) verschwinden, so kann man die Constanten cu . . ., cr+i so bestimmen, dass die Gleichungen A7), A8) befriedigt sind und folglich C(x) verschwindet, ohne dass alle d verschwinden. Nehmen wir B0) «n a2, . . .,•«,.+! == 1, 2, . . ., r + 1 an, so ist nach A5) P höchstens vom Grade r, und aus A6) folgt, dass <pP durch / theilbar ist. Demnach muss q> einen Theiler mit / gemein haben, dessen Grad mindestens = n — r ist. Wenn wir die Determinanten B1) Br = 2 ±A1AA2>2. .. Artr die Hauptunterdeterminanten von B nennen, so dass speciell Bn = B ist, so können wir dem zuletzt bewiesenen Satze die folgende weitergehende Fassung geben:
§. 54. Bestimmung der gemeinschaftlichen Factoren. 183 III. Die nothwendige und hinreichende Bedingung dafür, dass / und <p einen grössten gemein- gemeinschaftlichen Theiler vom Grade n — r, aber nicht von höherem Grade, haben, ist die, dass Rn, -ß„—i, . . ., -Rr+l verschwinden, während Mr von Null ver- verschieden ist. .Nehmen wir nämlich an, / und q> haben einen gemein- gemeinschaftlichen Theiler vom Grade n — r — 1, und es verschwinde äusserdem Br+1, dann machen wir über die « die Annahme B0) und können wegen Er+1 = 0 die Constanten c,-, nicht alle ver- verschwindend, so bestimmen, dass Cx = 0, 0, = 0, . . ., Cr+1 = 0 wird. Dann ist C(x) höchstens vom Grade n — r — 2, und muss daher, da es durch jeden Theiler von / und <p, also durch eine Function (n — r — l)ten Grades theilbar ist, identisch Null sein. Daraus können wir aber wie oben schliessen, dass / und <p einen gemeinschaftlichen Theiler vom Grade n — r haben. Da Ar,s nach A0) gleich Null ist, wenn r-\-s<n — m -f- 1, und gleich i0, wenn r -\- s = n — m -j- 1, so ist B2) Bn^ - (- if(n~mnn-m-i) irm- Dies ist also von Null verschieden, so lange <p wirklich den Grad m erreicht, in Uebereinstimmung damit, dass in diesem Falle der grösste gemeinschaftliche Theiler von / nnd <p den Grad m nicht übersteigen kann. IV. Wenn die Voraussetzungen des Satzes III er- erfüllt sind, so lässt sich der grösste gemein- gemeinschaftliche Theiler Tr von / und <jp durch die folgende Determinante darstellen: B3) Tr = ltl, Ä^.-.Ar-i,!, Ar>1 xn~r + Ar + ^z»-1—1 -\ 1- AnA i,2, A%2,...Ar-lti, Ar,2 xn~r -f- Ar+1,2*"-»—1 -j- 1- A, n J2,r,---^r-l,r, Ar,r 0Cn~r + Ar+ hrXn~'—1 -\ \~ An> Diese Function ist nämlich vom Grade (n — r) und der Coefficient von xn~r ist gleich Rr, also, nach Voraussetzung, von Null verschieden. Es ergiebt sich aber aus A2)
184 Vierter Abschnitt. §¦ 54. fPsfqs Ä1,sx A2,sx^r-i,. a;\ und folglich erhält man nach dem Determinantensatz von der Addition der Colonnen (§. 25, VII) B4) r-1,2, ,r, -Ar, • • • Är-hr, (p pr — fq oder, wenn wir nach den Elementen der letzten Colonne ordnen und B5) P — j. r — -a.1,2) -a.2,2, • • r—1,15 r—1,2) -o.l,n setzen B6) Tr = Pr<P — Qrf, worin Qr aus Pr hervorgeht, wenn man die pi durch die #»• ersetzt. Haben also, wie vorausgesetzt, / und <p einen gemeinschaft- gemeinschaftlichen Theiler (n — r)ten Grades, so muss dieser auch in Tr aufgehen, und also, da die Grade übereinstimmen, mit Tr iden- identisch sein. Die Function Tr ist in Bezug auf die Coefficienten b von q> homogen und vom Grade r, in Bezug auf die Coefficienten a von / ist der Grad aber nur r — n -\- m, da die ersten n — m Zeilen der Determinante B3) die a nicht enthalten. Bezeichnen wir den Grad von Tr in Bezug auf x mit s, setzen also n — r = s, so ist der Grad von Tr in den a gleich m — s in den b gleich n — s. Um das Gewicht von Tr zu erhalten, geben wir der Variablen x wieder das Gewicht 1. Dann ist die Determinante B3) eine Summe von Producten, deren Gewicht man nach (8) erhält, wenn man in m — n + h -\- h — 1 die Zahlen h und k beide in irgend einer Reihenfolge von 1 bis r gehen lässt und die Summe aller dieser Ausdrücke nimmt. Da hiernach die Summe aller h -\- h gleich r (r -j- 1) ist, so ergiebt sich das Gewicht gleich r (m — n -f- r), oder, wenn wieder n — r = s gesetzt wird, gleich (n — s) (m — s). Es folgt also:
§. 55. Elimination. 185 V. Die Function TM_S ist vom Grade s in x, m — s in den Coefficienten von /, n — s in den Coeffi- cienten von <p, und isobarisch und vom Gewicht (m — s) (n —- s). Wenn B, aber nicht die Unterdeterminante i?m_i, gleich Null ist, also nur eine gemeinschaftliche Wurzel von/ und <p vorhanden ist, so kann man die verschiedenen Potenzen der Unbekannten aus den Gleichungen A2) bestimmen, die dafür ergeben: -4i,»a!"-1 + A^af-* -\ 1- An,. = 0, s = 0, 2, . . ., n — 1, nnd man erhält also, wenn man die Unterdeterminanten von 2? mit R^k bezeichnet: „ O/ ---7t, 71 -"-"?!, 1t -"-"Tt," Darin ist -R„)M = -ßn—n und wenn wir -R„_1)B = 5«-i setzen, so ergiebt sich B8) x = ^=-1- §• 55. Elimination. Theorem von Bezout. Wenn in den beiden Functionen V J ff* f/y\ - 7) //iWJ- __!_ 7) /yWl—1 I ... I 7) die Coefficienten a, b selbst wieder ganze Functionen einer Grosse y sind, so wird auch die Resultante eine ganze Function von y werden, die wir mit F(y) bezeichnen wollen. Die Bildung dieser Gleichung ist die Elimination von x aus den beiden Gleichungen A). Die Gleichung B) F(y) = 0 hat alle die Werthe von y zu Wurzeln, wofür die beiden Gleichungen eine gemeinsame Wurzel haben. Ist die Bedingung B) befriedigt, so findet man die Werthe von x, die den zwei Gleichungen C) genügen, indem man den grössten gemeinschaftlichen Theiler von f{x) und cp(x) aufsucht. Dieser gemeinschaftliche Theiler
186 Vierter Abschnitt. §.55. ist vom ersten Grade und bestimmt also x rational, wenn nur eine solche gemeinschaftliche Wurzel vorhanden ist. Sind mehrere gemeinschaftliche Wurzeln vorhanden, so erfordert die Bestimmung von x noch die Lösung einer Gleichung höheren Grades. Gehört zu jeder Wurzel der Resultante nur eine gemein- gemeinschaftliche Wurzel x, so ist die Zahl der Werthepaare x, y, die den Gleichungen C) genügen, gleich dem Grade der Resultante in Bezug auf y. Sind also die Coefficienten a vom Grade v, b vom Grade ft in Bezug auf y, so ist nach der Gradbestimmung des §.53 der Grad der Resultante D) nv -\- m[i; so gross ist also die Anzahl der gemeinsamen Wurzelpaare. Diese Zahl kann aber noch dadurch modificirt werden, dass möglicherweise die Coefficienten so beschaffen sein können, dass die höchste Potenz von y aus der Endgleichung wegfällt. Man würde dann die Uebereinstimmung der Zahl mit D) nur durch die Hinzufügung unendlicher Wurzeln retten können. Auch mehrfache Wurzeln geben zu Bedenken Anlass. Man begegnet diesen Uebelständen theilweise dadurch, dass man die homogene Form der Gleichungen zu Grunde legt, eine Form, in der sich das Eliminationsproblem besonders in der Geometrie einstellt. Wenn nämlich die Function f (x) aus einer homogenen Function wter Ordnung der drei Variablen x, y, s (einer ternären Form) durch Ordnen nach Potenzen von x hervorgegangen ist, so sind die Coefficienten a„, %, a2 . . . a„ homogene Formen der beiden Variablen y, 0 von dem Grade, den der Index angiebt, also a0 eine Constante, a^ eine lineare, a2 eine quadratische Form u. s. f., und Entsprechendes gilt von den Coefficienten i0, ii . . . bm der Function q> (x). Bedeuten x, y, z Dreieckscoordinaten in der Ebene, so sind f(x) = 0, q>(x) = 0 die Gleichungen einer Curve wter und einer Curve mter Ordnung, und die gemeinsamen Wurzeln dieser beiden Gleichungen (die Verhältnisse x:y.d) bedeuten die Schnittpunkte der beiden Curven. Die Endgleichung, die man durch Elimi- Elimination von x erhält, ist eine homogene Gleichung, deren Grad sich aus A5), §. 53 gleich nm ergiebt. Eine Verminderung des Grades kann hier nicht stattfinden; immer ist die Endgleichung eine homogene Gleichung des ninten
§. 55. Elimination. 187 Grades für die beiden Unbekannten y, 0. Die einzige Ausnahme, auf die hier zu achten ist, ist die, dass die Resultante identisch (für alle y, s) verschwindet, dass also unendlich viele gemein- gemeinsame Wurzeln vorhanden sind. Dieser Fall tritt dann, aber auch nur dann ein, wenn / und q> als Functionen der Variablen x, y, 0 betrachtet, einen gemeinsamen Theiler haben (§. 20). Hierher ist auch der Fall zu rechnen, dass / und q> einen nur von y, 0 abhängigen gemeinsamen Theiler haben, der dann auch als Factor der Resultanten auftritt. Hier giebt es zwar nur eine endliche Zahl von Werthepaaren y.0, zu diesen aber unendlich viele Werthe von x. In der Geometrie haben diese Fälle die Bedeutung, dass die beiden Curveri einen Curventheil und nicht bloss einzelne Punkte gemein haben. Was sich von einem strengen algebraischen Standpunkte über diese Frage sagen lässt, ergiebt sich aus §. 54 Wir wollen die Coefficienten a^, bi in A) als ganze Functionen iten Grades einer Variablen y ansehen, so dass das Gewicht mit dem Grade in Bezug auf y übereinstimmt. Wenn / und q> als Functionen von x und y einen gemein- gemeinschaftlichen Theiler haben, so giebt es unendlich viele gemein- gemeinsame Lösungen von / = 0 und <jp = 0. Im anderen Falle bilden wir durch Elimination von x die Resultante B, die eine ganze Function muten Grades von y ist. Der Grad kann sich dadurch erniedrigen, dass die Coefficienten einiger der höchsten Potenzen verschwinden. Es giebt also jedenfalls nicht mehr als nin Werthe von y, für die B verschwindet. Ist ß einer dieser Werthe, so ist B durch y — ß theilbar. Wenn nun aber für y = ß die beiden Functionen / und q> einen grössten gemein- gemeinschaftlichen Theiler vom Grade s oder n — r haben, so sind nach §. 54, I, III die sämmtlichen Unterdeterminanten von B von r-f 1 Reihen durch (y — ß) theilbar, während Br nicht durch y — ß theilbar ist. Daraus ergiebt sich aber, am ein- einfachsten aus dem Sylvester'schen Theorem [§. 32, G)], dass B selbst durch (y — ß)" theilbar ist. Es kann aber B auch noch durch eine höhere Potenz von y — ß theilbar sein. Jeder Theiler sten Grades von / und <p absorbirt also mindestens s Wurzeln von B = 0, und wir erhalten hieraus das nach Bezoiit benannte Theorem in folgender, in geometrisches Gewand ge- gekleideter Gestalt.
188 Vierter Abschnitt. §. 55. I. Zwei Curven nter und wter Ordnung, die keinen Curventheil gemein haben, schneiden sich, höch- höchstens in nm Punkten. Dass die Maximalzahl mn für jeden Werth der Zahlen n und m unter Umständen erreicht werden kann, ersieht man aus dem Falle, dass / und <p in lauter in Bezug auf x und y lineare Factoren zerfallen. Will man, wie es in der Geometrie gebräuchlich ist, in dem Satze den Zusatz „höchstens" weglassen, so muss man unend- unendliche Wurzeln mitrechnen, was man durch Einführung homogener Variablen umgehen kann. Man muss aber auch noch Fest- Festsetzungen treffen, wonach in gewissen Fällen einige der Schnitt- Schnittpunkte mehrfach zu zählen sind. Nur wenn wir uns der oben erwähnten homogenen Form be- bedienen, oder, was auf dasselbe hinauskommt, wenn wir unendliche Werthe der Unbekannten zulassen, können wir den Satz aus- aussprechen, dass zwei Gleichungen mit zwei Unbekannten immer wenigstens eine Lösung haben. Die Theorie der Elimination setzt uns nun in den Stand, folgende Aufgabe zu lösen. II. Es sei ein System 8 von Gleichungen fx = 0, f2 = 0, /3 = 0, . . . zwischen den Unbekannten x, y, g, . . . gegeben. Die Anzahlen der Gleichun- Gleichungen und der Unbekannten sollen beliebig sein und brauchen nicht mit einander überein- übereinzustimmen. Es sollen alle Werthe der Unbe- Unbekannten ermittelt werden, die diesen Glei- Gleichungen zugleich genügen, wenn solche vor- vorhanden sind, und im entgegengesetzten Falle nachgewiesen werden, dass keine vorhanden sind. In dem Falle, wo nur eine Unbekannte vorhanden ist, hat man zur Lösung dieser Aufgabe zu untersuchen, ob die Func- tionen /1,/2,/s, • •. einen gemeinschaftlichen Theiler haben, und wenn ein solcher gefunden ist, giebt uns sein Verschwinden die Werthe der Unbekannten durch Auflösung einer algebraischen Gleichung mit einer Unbekannten. Wir nehmen also die Auf- Aufgabe für eine geringere Anzahl von Unbekannten, als die gegebene, als gelöst an, und wenden die vollständige Induction an.
§. 55. Elimination. 189 Wenn von den gegebenen Gleichungen nur eine, etwa fx = 0, die Unbekannte x enthält, so setze man in diese eines der Werthsysteme der y, 0, . . . ein, die den übrigen Gleichungen genügen, die, nach der Voraussetzung, als schon gefunden be- betrachtet werden. Dann sind drei Fälle möglich: Entweder fx verschwindet identisch, dann gehören zu diesem Werthsystem der y, 0, . . . unendlich viele Werthe von x, oder es geht x aus /1 heraus, ohne dass /i verschwindet, dann giebt es keinen Werth von x, oder endlich es ergiebt sich eine algebraische Gleichung für x, die eine endliche Anzahl von Wurzeln hat. Hierauf können wir nun das allgemeine Problem in folgen- folgender Weise zurückführen. Wir nehmen aus dem System zwei Gleichungen heraus, die die Variable x enthalten: f=aoxn-\~a1 xn~1 -f- • • • -j- an q> = b0 xm -j- h %m~Y -j H im, deren Coefficienten ganze Functionen der y, 0, . . . sind. Diese müssen in Bezug auf x einen gemeinschaftlichen Theiler vom ersten, zweiten, dritten,... Grade haben. Die Bedingungen dafür lassen sich nach §. 54 als rationale Gleichungen zwischen den y, 0, . . . darstellen, und ebenso ergiebt sich dann der grösste gemeinschaftliche Theiler von / und <p als rationale Function von x, y, 0, . . . Dadurch ist dann das System 8 auf ein anderes System 81 zurückgeführt, das zwar mehr Gleichungen enthalten kann als 8, in dem die Unbekannte x aber in einer Gleichung ¦weniger vorkommt als in 8. Durch Wiederholung dieses Ver- Verfahrens ist dann die Aufgabe gelöst. Es ist hierbei aber noch zu bemerken, dass man die verschiedenen Systeme SL be- betrachten muss, die sich aus der Annahme verschiedener Grade ¦des gemeinschaftlichen Theilers von/und q> ergeben; auch muss man darauf Rücksicht nehmen, dass möglicherweise a„, ba ver- verschwinden können, wenn man es nicht vorzieht, diese Möglichkeit dadurch auszuschliessen, dass man durch eine lineare Substitution in allen Gleichungen von 8 den Coefficienten der höchsten Potenz von x constant macht. Man erreicht dies etwa dadurch, dass man y = x -f- ayu 0 = x -\- ßeY, . . . setzt, worin «, ß, . . . beliebige, nicht verschwindende Constanten sind. Wenn sich im Verlaufe der Rechnung Gleichungen einstellen,
190 Vierter Abschnitt. §. 56. die einen rationalen gemeinschaftlichen Theiler haben, so kann man diesen abspalten, und die Aufgabe in mehrere einfachere der gleichen Art zerlegen. Es kann auch vorkommen, dass in den auf einander folgenden Systemen von Gleichungen eines auf- auftritt, dessen Gleichungen alle einen gemeinsamen Theiler haben. Enthält dieser mehrere der Unbekannten, so entspringt aus ihm ein System von unendlich vielen Lösungen, bei denen allen in diesem Factor vorkommenden Unbekannten, ausser einer, be-1 liebige Werthe ertheilt werden können. III. Das Problem II wird also nach dem geschil- geschilderten Verfahren immer gelöst durch Auf- Auflösung einer Kette von algebraischen Glei- Gleichungen mit nur einer Unbekannten unddurch Einsetzen willkürlicher Werthe für gewisse der Unbekannten. §. 56. Elimination aus drei Gleichungen. Die Principien der Elimination, die wir im Vorhergehenden auf zwei Gleichungen angewandt haben, lassen sich auf mehrere Gleichungen mit mehreren Unbekannten ausdehnen. Wir wollen auf den Fall von drei Gleichungen mit zwei Unbekannten etwas näher eingehen. Es seien A) f(x,y) = 0, <p(x,y) = 0, 4> (x, y) = 0 die drei gegebenen Gleichungen von den Graden n, m, l und wir setzen B) f(x, y) = aox»-{- a.x—1 -\ \-am darin aber sei C) aÄ = a^y* -+- a^f1 H h «*,*• In ganz entsprechender Weise bezeichnen wir die Functionen q> und ip, deren Coefficienten i und c sein mögen, so dass . i> — C0Xi + C^-l -\- \-Ci {J c* = cKay" -f Cs,!^-1 H fcft)ft wird. Wir bilden nun zunächst aus den beiden Functionen / und q> nach §. 54 die Resultante B„. Wir setzen dann unter der
§. 56. Die Resultante. 191 Voraussetzung, dass Bn—i von Null verschieden ist [nach §. 54, B8)]: E) x = |l=L in «/> (a;, y) ein, und erhalten Die rechte Seite dieses Ausdrucks ist eine ganze Function von y, deren Grad ft wir hier nicht näher zu bestimmen brauchen. Er lässt sich übrigens mit Hülfe der Gleichungen B7), §. 54 noch erniedrigen, worauf es hier nicht ankommt. Wir ordnen F) nach Potenzen von y und setzen G) Bln-iip(x,y) = W(y) = C^y11 -\- Ci^-1 -\- ¦ ¦ ¦ -f- C|u. Worauf es hier allein ankommt, ist, dass die Co, Ct,. . ., Cft ganze Functionen der a, b und lineare Functionen der c sind. Wir denken uns ferner die Resultante Bn nach Potenzen von y geordnet und erhalten (8) Bn = Aoymn -\- A1ymn-1 -j- • • • -\~ Am„, worin die Coefficienten Ai ganze Functionen der a, b allein sind. Nun bilden wir die Resultante [W, Bn] der beiden Func- Functionen G), (8). Diese ist eine ganze Function der a, b, c, homogen in Bezug auf jede der drei Variablen-Reihen a, b, c, deren Grad in Bezug auf a, b einstweilen nicht näher bekannt ist, deren Grad in Bezug auf die C und folglich auch in Bezug auf die c (nach §. 53) gleich mn ist. Wir sondern nun von der Function [W, Bn~\ einen von den a, b allein abhängigen Factor B möglichst hohen Grades ab, und setzen (9) [W, Bn] = B£l, so dass £1 keinen von den c unabhängigen Factor mehr enthält. I. Die auf diese Weise, bis auf einen numerischen Factor vollständig bestimmte rationale Fuuction der a, b, c, die in Bezug auf c vom Grade mn ist, nennen wir die Resultante der drei Functionen Hier ist nun zunächst zu bemerken, dass der Factor D nicht verschwinden kann, wenn die Resultante der beiden Func- Functionen Bn und i?„_! die wir mit z/ bezeichnen wollen, nicht verschwindet; denn wenn [W, B„] verschwindet, so haben W = 0 und Bn = 0 eine gemeinsame Lösung y. Wenn z/ nicht ver-
192 Vierter Abschnitt. §. 56. schwindet, so kann Mn nicht identisch verschwinden, und Mn—i kann für dieses y nicht Null sein; also giebt es eine gemeinsame Lösung x von der Form E) von / = 0 und <jp = 0, die dann auch 4> zu Null macht. Wenn aber das von den c unabhängige B gleich Null ist, so bleibt [W, En] Null, welche Werthe auch die c haben mögen, und man kann die c so annehmen, dass t\i = 0 keine Lösung mit / = 0 und q> = 0 gemein hat. Wenn also B = 0 ist, so muss z/ verschwinden. Damit ist Folgendes bewiesen: II. Wenn für die a, i, c solche Werthe gesetzt sind, dass ß = 0 und z/ nicht = 0 wird, so haben die drei Gleichungen / = 0, <p = 0, «/> = 0 eine ge- gemeinsame Lösung und umgekehrt: III. Haben /=0, q> = 0, ip = 0 eine gemeinsame Lösung, und ist z/ von Null verschieden, so ver- verschwindet £1. Es ist nicht leicht, sich auf rein algebraischem Wege von der unnöthigen Voraussetzung frei zu machen, dass z/ von Null verschieden sei. Einfacher aber gelangt man dazu durch Be- Benutzung der Stetigkeit. Angenommen, die drei Gleichungen A) haben eine gemeinsame Lösung x, y, während z/ = 0, aber £1 von Null verschieden ist Dann kann man die a, b beliebig wenig, aber so ändern, dass z/ einen von Null verschiedenen Werth erhält. Betrachtet man x, y als Lösung von / = 0 und <p = 0, so werden diese Grossen durch algebraische Gleichungen bestimmt, deren Coefficienten rational von a, b abhängen, und die sich also bei hinlänglich kleinen Veränderungen von a, b um beliebig wenig ändern (§. 44). Sie mögen in x\ y' übergehen. Dann kann man die Coefficienten c noch so ändern, dass ip (%', y') wieder verschwindet, und diese Aenderungen der c sind ebenfalls beliebig klein. Man kann also schliesslich diese Aenderungen alle so klein annehmen, dass ii nicht Null wird, und dann erhält man einen Wider- Widerspruch gegen III. In ähnlicher Weise lässt sich zeigen, dass auch wenn &l und z/ zugleich verschwinden, die drei Gleichungen A) eine gemeinsame Lösung haben. Wenn zunächst / und q> einen ge- gemeinsamen Theiler haben, so wird dieser und folglich auch/ und (jp mit 4>. eine gemeinsame Wurzel haben.
§. 57. Theorem von Bezout.' 193 Wenn dies nicht der Fall ist, so giebt es nur eine endliche Anzahl von Wurzeln x, y von / und <p. Wir wollen annehmen, dass für keine von diesen ip (x, y) verschwindet. Wir variiren nun a, b, c so wenig, dass alle diese tj> (x, y) von Null ver- verschieden bleiben, jedoch so, dass /l von Null verschieden wird, während ß Null bleibt. Dann haben wir einen Widerspruch gegen (II). Damit ist also bewiesen: IV. Die nothwendige und hinreichende Bedingung dafür, dass die Gleichungen /= 0, cp = 0, ^ = 0 eine gemeinsame Lösung haben, ist ß = 0. Es ist hierbei jedoch noch zu bemerken, was wir bei der Beweisführung der Kürze wegen nicht ausdrücklich hervorgehoben haben, dass der Satz II, und demgemäss auch III und IV nur dann allgemein gültig sind, wenn man auch unendliche Werthe von x, y zulässt, oder besser, wenn man die gegebenen Gleichungen in der homogenen Form f(x, y, z) = 0, cp (x, y, z) = 0, 4> (x, y, z) = 0 annimmt, wobei dann auch z = 0 unter den Lösungen auftreten kann. §• 57. Grad und Gewicht der Resultante. Das Theorem von Bezout. Näheren Aufschluss über die Natur der Resultante £1 von drei Gleichungen erhalten wir, wenn wir einen speciellen Fall betrachten, den nämlich, dass die drei Functionen /, cp, tp in lineare Factoren zerfallen. Es sei / = n («w x + o« y + <>) 1, n A) 9=jlßf>x = n (y W x + ) y worin die a, ß, y nun als unabhängige Variable gelten. Dieser Fall geht aus den allgemeinen dadurch hervor, dass man für die a, 6, c gewisse homogene Functionen a', b\ c' der Variablen Weber, Algebra. I. 13
194 Vierter Abschnitt. §. 57. a, ß, y setzt, und zwar sind die a vom wten Grade in den «, die b vom witen Grade in den ß, die c vom Zten Grade in den y. Das Ersetzen der a,b, c durch diese Functionen «', 6', c' wollen wir der Kürze wegen die Substitution © nennen. Die Functionen /, <p, ^, ß mögen durch die Substitution © in /, <p', ^', ß' übergehen. Es werden f, <p', ip' immer dann, aber auch nur dann, eine gemeinsame Wurzel haben, wenn eine der Determinanten B) «w, verschwindet. Die Anzahl dieser Determinanten beträgt Imn. Daraus folgt, dass auch £1' durch jede der Determinanten B), und folglich auch durch ihr Product theilbar sein muss. Daraus ergiebt sich nun der Beweis des folgenden wichtigen Satzes: I. Die Resultante ß ist als Function von a, b, e un- unzerlegbar. Es sei nämlich ßn ein in Bezug auf a, 6, c rationaler Theiler von ß, und durch die Substitution © gehe ßx in ßi über. Es muss dann ßi wenigstens durch eine der Determinanten zlh,i,ic theilbar sein. Da aber, wenn die Indices h, i, Je durch irgend drei andere h', i', Je' ersetzt werden, die a', b', c' und mithin auch ßi ungeändert bleiben, so muss ßi durch die sämmtlichen Determinanten B) und also auch durch deren Product theilbar sein. Da das Product aber in Bezug auf die c' vom Grade mn ist, so ist auch ii1 nicht von niedrigerem Grade in. Bezug auf die e. Da es aber auch nicht von höherem Grade sein kann, und da überdies nach Voraussetzung ß keinen von den c unab- unabhängigen Theiler hat, so ist ßx (von einem numerischen Factor abgesehen) mit ß identisch. Diese Betrachtung zeigt nun zugleich, dass ßi in Bezug auf die «', V und folglich ß in Bezug auf die a, b mindestens vom Grade ml und nl sein muss. Wenn wir aber nun die ganze Betrachtung des vorigen und dieses Paragraphen wiederholen, nur mit dem Unterschiede, dass wir / an die Stelle von tp, also die a an die Stelle der c treten lassen, so erhalten wir statt ß eine Function Slf, die in Bezug
§. 57. Theorem von Bezout. 195 auf die a vom Grade ml ist. Nach §. 56^ IV. verschwindet aber £1/ immer, wenn £1 verschwindet; und folglich muss £lf durch das unzerlegbare £1 theilbar sein (§. 43, 2.). Daraus ergiebt sich, dass £1 in Bezug auf die a höchstens vom Grade Im ist, und da dieselbe Betrachtung ein drittes Mal wiederholt werden kann, so ist bewiesen: II. Die Resultante £1 dreier Functionen von drei Variablen von den Graden n, m, l ist vom Grade ml in den Coefficienten der ersten, In in denen der zweiten und nm in denen der dritten Function. Daraus ergiebt sich, dass die Function £1' dem Producte der Determinanten B) gleich ist, oder die Formel C) fi' = J7^M>fc. Diese Formel gestattet die Bestimmung des Gewichtes von £1, das wir erhalten, wenn wir den Coefficienten a^*, b^-k, e&,& das Gewicht h beilegen, so dass [nach §. 53, C)] /, <p, ty in homogene Functionen wten, mten, Zten Grades übergehen, wenn für die Coefficienten homogene Functionen neuer Variablen vom Grade des Gewichtes gesetzt werden. Das Gewicht fc ergiebt sich nämlich für die aj^jt, %,&;, <4,fo> wenn wir in A) den «l5 «ä, ßx, ß2, yu y2 das Gewicht 0, und den ai i ßi i 7z das Gewicht 1 beilegen. Dadurch erhält aber z/Äi ^ fc das Gewicht 1 und £1' das Gewicht Imn. Dies ist dann aber auch das Gewicht von £1, das sich durch die Substitution @ nicht ändern kann. Diesem Satze über das Gewicht können wir den folgenden Ausdruck geben, in dem es das Bezout'sche Theorem enthält. III. Durch Elimination von zwei Unbekannten aus drei Gleichungen Zten, mten, wten Grades ergiebt sich für die dritte eine Endgleichung vom Grade Imn. Um daraus (wie in §. 55, I.) den geometrischen Satz ab- ableiten zu können, dass sich drei Flächen von den Graden l, m, n, die nicht unendlich viele Punkte gemein haben, höchstens in Imn Punkten schneiden, wäre noch zu zeigen, dass die End- Endgleichung in s, wenn zu demselben Werthe 0O vom s mehrere, etwa v Werthe von x, y gehören, wenigstens durch (z — 0O)V theilbar ist. 13*
196 Vierter Abschnitt. §. 57. Dieser Beweis würde auf algebraischem Wege nicht ohne Weitläufigkeit zu führen sein. Man kann diesem Mangel aber auch durch eine Stetigkeitsbetrachtung abhelfen, die hier, in geometrischem Gewände, kurz angedeutet sein mag. Nehmen wir an, die drei Flächen /, <p, ^ haben für einen Werth s = 0O v Schnittpunkte. Wir geben dem System der Flächen /, <p, ip, ohne ihre Gestalt und gegenseitige Lage zu ändern, eine unend- unendlich kleine Drehung um eine Axe, die in der Ebene 0 =¦ 0O liegt, aber mit keiner der Verbindungslinien der in dieser Ebene angenommenen v Schnittpunkte parallel ist. Dann sind nach der Drehung die ^-Ordinaten dieser Punkte alle von einander ver- verschieden; sie mögen gu g% . . . gv geworden sein. Diese Drehung findet aber ihren analytischen Ausdruck in gewissen Ver- Veränderungen der Coefficienten a, b, c von /, <p, i\>, die zugleich mit der Drehung unendlich klein werden. Wenn nun die Re- Resultante £l(g) durch diese Drehung in ß' übergegangen ist, so ist ß' durch (g — g{) @ — g2) . . . @ — gr) theilbar; und da die Drehung beliebig klein genommen werden kann, so ergiebt sich daraus nach §. 44, dass ß @) durch @ — 0o)r theilbar sein muss. Wir wollen hier noch einmal auf die Bildung der End- gleichung von zwei homogenen Gleichungen mit zwei Unbe- Unbekannten, also auf die Bestimmung der Schnittpunkte zweier Curven zurückkommen. Es seien diese beiden Gleichungen vom Grade n und m D) f(x, y, 0) = 0, tp 0, y, 0) = 0, mit den Coefficienten a und b. Die Endgleichung ergiebt sich in einer symmetrischen Form, wenn man eine lineare Gleichung E) ux -\- vy + wg = 0 mit unbestimmten Coefficienten w, v, w hinzufügt, und dann aus den drei Gleichungen E) und F) die x, y, 0 eliminirt. Man erhält dann nach B) eine Endgleichung F) ß («, v, w) = 0, die in Bezug auf u, v, w homogen und vom Grade mn ist. In den a ist sie vom Grade m, in den b vom Grade n. Setzt man in ß («, v, w) z. B. u = 0, v = 1, w = — y, 0 = 1, so ergiebt sich die Endgleichung für y in der früheren Gestalt.
§.57. Die Resultante. 197 Die Function ß verschwindet, wenn die Gleichungen D) und E) eine gemeinsame Lösung haben, d. h. so oft die durch E) dargestellte gerade Linie durch einen Schnittpunkt der beiden Curven / und cp hindurchgeht, und wenn daher u, v, w homogene Liniencoordinaten bedeuten, so ist ß = 0 im Sinne der analy- analytischen Geometrie die Gleichung des Schnittpunktsystemes der beiden Curven / und <p x). Die Function ß («, v, w) ist zwar als Function der Variablen a, b, u, v, w unzerlegbar; sie enthält aber für jedes besondere Zahlensystem a, b, wofür sie nicht identisch verschwindet, lineare Factoren in Bezug auf u, v, w, nämlich, wenn x, y, 0 die Coordi- naten eines der Schnittpunkte sind, den Factor ux -\- vy -f- v0. Haben wir also m n verschiedene Schnittpunkte, so zerfällt £l(u,v,w) in mn lineare Factoren. Hieraus kann man nun wieder durch Stetigkeitsbetrach- Stetigkeitsbetrachtungen nachweisen, dass ß auch im allgemeinen Falle, wenn es nicht identisch verschwindet, in m n lineare Factoren zerleg- zerlegbar ist. Um dies zu zeigen, seien P1? P3, . . . mit den Coordinaten xii 2/i > #1 > x%t yii 0i • • ' die Schnittpunkte von / und <p. Wir können den Coefficienten a, b unendlich kleine Aende- rungen ertheilen, so dass die Resultante mn verschiedene Wurzeln erhält, und folglich die variirten Curven /', cp' mn getrennte Schnittpunkte. Von diesen Schnittpunkten wird eine gewisse Zahl v1 unendlich nahe bei Px liegen, deren Complex wir mit PJ bezeichnen wollen, ebenso werden v.2 Punkte P% unendlich nahe bei P2 liegen u. s. f., so dass vx -f- v2 -f- • • • = m n ist. Es sei dann U-l =ux1 + vyx + W0l der dem Punkte Pt entsprechende Factor von ß = ß (u, v, w) und sei demnach ß = TJ-i. ßi. Durch die angegebene Variation der a, b gehe ß in ß' x) Diese Darstellungsweise der Resultanten findet sich, für den Fall von drei Flächen zweiten Grades, bei Hesse, Analytische Geometrie des Raumes (Leipzig, Teubner, 1. Auflage 1861, 3. Auflage 1876).
198 Vierter Abschnitt. §. 57. über; dann hat ß' die den vx Punkten PJ entsprechenden vx linearen Factoren d, DT, . . . und es sei ß' = UJ ßj so dass ßi noch durch TJ'-l ¦ . . theilbar ist. Wenn nun ßx nicht durch Uj, theilbar wäre, so könnte man über die «, v, w so verfügen, dass Z7X = 0, und ßx von Null verschieden wäre. Dann würde man aber, da die Variationen beliebig klein genommen werden können, und ßi dem Si^ also beliebig nahe gebracht werden kann, ein System vom Werthe u, v, w finden können, für die TJ'i verschwindet, während ßi von Null ver- verschieden ist. Dies ist aber unmöglich, weil ßi durch Z7i' theil- theilbar ist. Folglich muss ß durch J7i theilbar sein, und durch Wiederholung dieses Schlusses findet man, dass ß durch U[l theilbar ist. Wir haben also das Bezout'sche Theorem in folgender schärferen Form. IV. Die Resultante Sl(u,v,w) der beiden Curven / und <p verschwindet entweder identisch, und dann haben/ und <p unendlich viele gemeinschaftliche Punkte; oder es zerfällt £l(u,v,w) in mn lineare Factoren, die auch zum Theil einander gleich sein können, deren jeder, für sich gleich Null gesetzt, die Gleichung eines der Schnittpunkte der beiden Curven darstellt. Diese Formulirung des Satzes von Bezout giebt dann auch eine zweckmässige Bestimmung darüber, mit welchem Grade der Vielfachheit man jeden Schnittpunkt der beiden Curven zu zählen hat. Diese Betrachtungen sind, wie man leicht erkennt, einer Verallgemeinerung für den Fall einer grösseren Anzahl von Gleichungen mit einer gleich grossen Anzahl von Unbekannten fähig. Man hat z. B., um zu dem nächsten Falle überzugehen, aus den Voraussetzungen des §. 56 aus drei Gleichungen f(pc, y) = 0, <p (x, y) = 0, ij> (x, y) = 0, die eine gemeinsame Lösung haben, für diese Werthe von x, y rationale Ausdrücke durch die Coefficienten von /, <p, i\> abzuleiten. Wir wollen hier aber nicht näher darauf eingehen.
§. 58. Tschirnhausen-Transformation. 199 §. 58. Tschirnhausen-Transformation. Wir machen von der Theorie der symmetrischen Functionen und der Resultantenbildung noch eine wichtige Anwendung auf die von Tschirnhausen1) herrührende Transformation alge- algebraischer Gleichungen. Es sei A) f{x) = xn -f ö!^-1 + a^x"-* -j [. an^x -f an irgend eine Function wten Grades, und irgend eine (ganze oder gebrochene) rationale Function von x, bei der wir nur die eine Voraussetzung machen, dass f(x) und fy (x) keinen gemeinsamen Theiler haben sollen. Nach dem Schlusssatz von §. 6 können wir dann die Functionen F(x) und <p (x), letztere höchstens vom Grade w— 1, so bestimmen, dass C) % (x) = F(x)f(x) + <p (x) i> (x) wird, so dass, sobald für x eine Wurzel der Gleichung D) f(x) = 0 gesetzt wird, 4$ = 9 ix) wird. Da wir nun die Werthe von y nur für solche Werthe von x, die Wurzeln von D) sind, betrachten werden, so verlieren wir nichts an Allgemeinheit, wenn wir von vornherein y = cp(x), also gleich einer ganzen Function (« — l)ti!n Grades setzen. Es sei also E) y = (pix) = «o + «! x + «j,x* -) (- an^xn-\ worin die Coefficienten a vorläufig noch ganz unbestimmt bleiben. Bezeichnen wir mit F) Xlt X2, . . ., Xn *) Acta eruditorum, Leipzig 1683.
200 Vierter Abschnitt. §. 58. die Wurzeln der Gleichung D), so ergeben sich aus E) die ent- entsprechenden Werthe von y: G) yr = <p (x{), 2/2 = y (xa) . . . yn = <p (x„), und das Product (8) Q(y) = (y — yj (y — y2) . . . (y — yn) ist eine symmetrische Function der Grossen F), die sich also rational durch die Coefficienten von /(a;) aus- ausdrücken lässt. In dieser Weise dargestellt, möge <Z>(j/) den Ausdruck haben (9) <P(y) = y» + hy^ + hy»-* -] [- bn^y + bn. Die Coefficienten bv werden nach §. 7 durch die yi bestimmt mittelst der Formeln h = — Züi, h = Zyiüv h = — Et/iUaüs, ¦ • woraus sich ergiebt, dass bv eine ganze rationale und homogene Function vten Grades von den Variablen a0, «!,..., «M_j ist. 0 (i/) ist nichts Anderes als die Resultante der beiden Gleichungen A0) /(*) = <>, <p(x) - y = 0, und nach §. 54 kann man auch umgekehrt die gemeinsame Wurzel x dieser beiden Gleichungen A0), wenn y einem der Werthe Vn Vii • • -1 Vn gleich wird, rational durch die Coefficienten von A0), d. h. rational durch a4, a{, y ausdrücken, vorausgesetzt, dass nur eine solche gemeinsame Wurzel vorhanden ist. Dies wird dann eintreten, wenn die n Werthe yu y2, . • ., yn von einander verschieden sind. Dann erhält man einen Ausdruck * = ßo + ßiy + ß*y* -\ h ßn-iy"'1, der gültig ist, wenn für x einer der Werthe F) und für y der zugehörige Werth G) gesetzt wird. Die Grossen ßi sind aus den <Xi und «^ rational zusammengesetzt. Kommen aber unter den Werthen yx, y2, . . ., yn mehrere gleiche vor, so erfordert die Bestimmung der zugehörigen Werthe der x noch die Auflösung einer Gleichung des entsprechenden Grades. Dieser Grad ist aber immer kleiner als w, da die Function q> (x) höchstens für n — 1 Werthe von x denselben Werth y erhalten kann. Wenn also die Gleichung A1) <P(y) = 0
§. 58. Tschirnhausen-Transformation. 201 vollständig gelöst ist, so ist damit auch die Gleichung A) voll- vollständig gelöst [wenn A1) nur verschiedene Wurzeln hat] oder wenigstens auf die Lösung einer Gleichung niederen Grades zurückgeführt [wenn A1) gleiche Wurzeln hat]. Demnach betrachten wir A1) als eine Umformung der Gleichung A), und die Bildung von A1) aus A) heisst die Tschirnhausen-Transformation der Gleichung A). Der Zweck einer solchen Transformation ist, die Coeffi- cienten a{ so" zu bestimmen, dass <& (y) eine einfachere Gestalt erhält als f(x). Man kann die Coefficienten bv bilden, wenn man die Potenz- Potenzsummen der yi kennt (§. 46). Bezeichnen wir die Summen der mten Potenzen der Xi mit sm, der yi mit öm, also sm = Sx™, <sm = Syy, so können wir öm durch die sm auf folgende Art bilden. Wir entwickeln zunächst y™ nach dem polynomischen Lehr- Lehrsatz (§. 12), setzen also A2) ym = worin die Summe sich auf alle nicht negativen ganzzahligen Werthe von v0, v\, . . ., v„_i erstreckt, die der Bedingung A3) v0 + vx -) 1- v„_j = m genügen. Setzen wir dann in A2) x^ xit . . ., xn für x und bilden die Summe der so erhaltenen Werthe von y^, y*g, . . ., ym, so folgt A4) öm = ) • • • ^M "-1 Hierdurch ist öm als ganze homogene Function mter Ordnung der «0, «!,..., «„_! dargestellt. Eine etwas vereinfachte Schreib- Schreibweise erhält man nach der zweiten Darstellung von Formen (§. 17). Lassen wir ^t, /t2, . . ., pm unabhängig von einander die Reihe der Zahlen 0, 1, . . ., n — 1 durchlaufen, so wird, wenn in einer Combination v0 mal der Index 0, vx mal der Index 1, v2 mal der Index 2, ... v„_!mal der Index n — 1 vorkommt, Vo + vi + vi H h "*-i = m und
202 Vierter Abschnitt. §. 59. Cl+ftH • + f*m = Vx + 2f2 + • • • -f (W — 1)V„-1, und danach kann der Ausdruck für öm so dargestellt werden: ; /* A5) 6m = Ss^+^ + .-.+^a^tt^ . . . aßm. Beispielsweise wird A6) ö2 = h, i, fc worin h, i, h die Reihe der Zahlen 0, 1, 2, . . ., n — 1 durchlaufen. §. 59. Anwendung auf die cubischen und biquadratischen Gleichungen. Das Ziel, das schon Tschirnhausen bei dieser Trans- Transformation im Auge gehabt hat, bestand darin, durch Bestimmung der Substitutionscoefficienten aa, «i, • . ., «K—i in der umgeformten Gleichung <I> (y) = 0 so viele Glieder zum Verschwinden zu bringen, dass die Gleichung lösbar wird. Es gelingt dies leicht bei den Gleichungen dritten und vierten Grades, wenn es auch nicht einfach ist, und nicht ohne weitläufige Rechnungen mög- möglich scheint, die sonst bekannten Formeln auf diesem Wege abzuleiten. Nehmen wir zunächst die cubische Gleichung A) xz -\- a x2 -)- b x -\- c = 0, die wir durch die Substitution B) y = et -j- ßx -\- yx2 umformen. Um die Gleichung für y C) y3 -j- Ay2 -\- By -\~ C=0 auf eine reine cubische Gleichung zurückzuführen, haben wir die Verhältnisse a:ß:y aus den beiden Gleichungen D) A = 0, B = 0 zu bestimmen, von denen die erste linear, die zweite quadratisch ist. Die Gleichungen D) sind gleichbedeutend mit
§. 59. Gleichungen dritten und vierten Grades. 203 und ergeben also nach A6) des vorigen Paragraphen «s0 + ßsL -\-ys2 = 0, «2S0 -f 2aßs1 + 2uys2 -f /32S2 + 2ßyss -f y2s4 = 0, worin s0 = 3 ist. Multiplicirt man die letztere Gleichung mit s0 und zieht das Quadrat der ersten davon ab, so folgt F) ß* (So s2 - sf) + 2 ß y (s0 s3 — Sl s2) + r^(So §4 _ S|) = o. Die Discriminante dieser quadratischen Gleichung (S0 S3 — SX S2J — (So S2 — S/) (So Si — Sl) giebt entwickelt So (So S2 Si So S3 — Si S4 — S| -(- 2 Si S2 S3), ist also, wenn x; die Discriminante der cubischen Gleichung A) bedeutet [§. 50, (9)] gleich — 3D, und "die Auflösung von F) giebt also ß _ — (s0s3 — s2 s2) + V —3D G) y s0 s2 — $( Damit ist die Gleichung C) auf eine reine Gleichung zurück- zurückgeführt, die zu ihrer Lösung nur noch das Ziehen einer Cubik- wurzel erfordert. Welches Vorzeichen wir der in G) vorkommen- vorkommenden Quadratwurzel geben wollen,' steht in unserem Belieben. Um die Tschirnhausen-Transformation für die biquadratische Gleichung zu benutzen, kann man etwa so verfahren, dass man in der umgeformten Gleichung (8) yi + hxy* + b2y* -f bsy 4 &4 = 0 die «o, «i, «2, «j so bestimmt, dass (9) &i = 0, b3 = 0 wird, wodurch (8) in eine quadratische Gleichung für y2 über- übergeht, aus deren Wurzeln noch die Quadratwurzeln gezogen werden müssen, so dass, nachdem die Gleichungen (9) gelöst sind, noch zweimal eine Quadratwurzel gezogen werden muss. Wenn man mittelst der ersten Gleichung (9) aus der zweiten a0 eliminirt, so entsteht eine homogene cubische Gleichung zwischen c^, a2, as. Man kann daher eines von den beiden Ver- Verhältnissen k1:u2:cxs beliebig annehmen, z. B. a3 = 0 setzen, und erhält zur Bestimmung des anderen eine cubische Gleichung. Dadurch ist dann die Lösung der biquadratischen Gleichung auf die einer cubischen und auf Quadratwurzeln zurückgeführt.
204 Vierter Abschnitt. §. 60. §. 60. Die Tschirnhausen-Transformation der Gleichung fünften Grades. Will man auf die Gleichung fünften Grades A) X' -f- Oj X* -f" a2 X°" + «3 #* + ai X + ai = 0 die Tschirnhausen-Transformation anwenden, so hat man B) # = ao-pa1aj + a2aj2-|- a3 «3 + a4 a?*' zu setzen, und erhält die Transformirte C) t + Kt + 6ay« + 632/2 + &42/ + &5 = 0. Der nächstliegende Gedanke, wäre nun, die Verhältnisse der fünf Unbekannten a so zu bestimmen, dass D) hx = 0, h = 0, &3 = 0, &4 = 0 würde, wodurch C) auf eine reine Gleichung zurückkäme, und dies war auch das Ziel, das Tschirnhausen im Auge hatte. Aber von den vier Gleichungen D) ist die erste linear, die zweite quadratisch, die dritte vom dritten und die vierte vom vierten Grade. Die Endgleichung, die man daraus ableiten kann, wird daher (nach §. 57, III.) vom Grade 2.3.4 = 24, und daher kann daraus für die Lösung der Gleichung fünften Grades kein Nutzen gezogen werden. Man sucht daher zunächst nur den beiden Gleichungen zu genügen: E) \ = 0, b2 = 0, wodurch die Gleichung C) in eine Form übergeht, die nach F. Klein (Vorlesungen über das Ikosaeder) eine Haupt- gleichung fünften Grades genannt wird. Zur Befriedigung der beiden Gleichungen E) haben wir die Verfügung über die vier Verhältnisse a0 : % : a2 : Ms '¦ aii un^ wir können diese Grossen noch auf mannigfaltige Art zur Verein- Vereinfachung der Gleichung fünften Grades benutzen. Wir kommen in einem späteren Abschnitt ausführlicher auf diesen Gegenstand zurück und beschränken uns hier darauf, die Ziele im Allgemeinen zu bezeichnen. Der Anschaulichkeit wegen bedienen wir uns einer geometrischen Einkleidung, die übrigens zum Verständniss der algebraischen Theorie, wie sie später gegeben werden soll, durchaus nicht wesentlich ist.
§. 60. Hauptgleichung fünften Grades. 205 Wenn wir mit Hülfe der linearen Gleichung b\ = 0 von den fünf Grossen k die eine, etwa a0, durch die übrigen aus- ausdrücken, so können wir die vier übrigen ax, «<,, «3, ai als homo- homogene Coordinaten eines Raumpunktes betrachten. Die Gleichung b2 = 0 stellt dann eine Fläche zweiter Ordnung dar, bs = 0 eine Fläche dritter Ordnung, bi = 0 eine Fläche vierter Ord- Ordnung, b-0 = 0 eine Fläche fünfter Ordnung. Wollte man also 62, bs, bt zugleich zu Null machen und dadurch die gegebene Gleichung auf eine reine reduciren, so müsste man einen der 24 Schnittpunkte von drei Flächen zweiter, dritter, vierter Ordnung bestimmen, der von einer Gleichung 24ten Grades abhängt. Statt nun so zu verfahren, sucht man auf der Fläche b% = 0 eine gerade Linie zu bestimmen. Solcher gerader Linien giebt es auf jeder Fläche zweiter Ordnung eine oder zwei Schaaren (reell oder imaginär), und man kann eine dieser Geraden durch Quadratwurzeln bestimmen, wie weiter unten aus- ausgeführt werden soll. Die Ermittelung eines Schnittpunktes einer dieser geraden Linien mit der Fläche bz = 0 führt dann auf eine Gleichung dritten Grades, und wenn man noch durch Be- Bestimmung eines gemeinsamen Factors der et, den Coefficienten b± = 1 macht, so erhält die Gleichung für y die Gestalt F) 2/5 + 2/ + & = 0, wodurch y als algebraische Function einer Variabein b bestimmt ist. Diese Gleichungsform wird gewöhnlich nach dem englischen Mathematiker Jerrard genannt, der sie im Jahre 1834 bekannt machte. Sie ist aber schon viel früher A786) von E. J. Bring in Lund publicirt worden1). Wir nennen sie daher die Bring- Jerrard'sche Form. Ebenso gut könnte man durch eine Gleichung vierten Grades &4 = 0 machen, und würde eine zweite Normalform der Gleichung fünften Grades erhalten: G) r + t + & = 0, die die gleiche Berechtigung hat, wie die Bring-Jerrard'sche Form. Für die Lösung der Gleichung fünften Grades freilich wird durch diese Betrachtungen nichts gewonnen. Ihr Nutzen besteht Vgl. F. Klein, Vorlesnagen über das Ikosaeder, S. 143.
206 Vierter Abschnitt. §. 60. darin, dass die Gleichung fünften Grades auf eine Normal- form zurückgeführt wird, die nur von einem veränderlichen Coefficienten abhängt. Dies kann auf unendlich viele verschiedene Arten, erreicht werden, und gelingt am einfachsten, nämlich ohne Lösung einer Gleichung dritten oder vierten Grades, wenn man die Gleichung fünften Grades bs = 0 selbst als eine Umformung der gegebenen Gleichung fünften Grades betrachtet. Hat man nämlich die Gleichung b6 = 0 gelöst, so wird einer der fünf Werthe von y gleich 0, und die gegebene Gleichung fünften Grades ist damit zugleich gelöst.
Fünfter Abschnitt. Lineare Transformation. §. 61. Einführung der linearen Transformation. Wenn wir in irgend welchen Functionen, die von den m Veränderlichen a%, x2, ¦ . ., xm abhängen, für diese Veränderlichen lineare Ausdrücke einsetzen, die von m neuen Veränderlichen x'h x'2, . . ., x'm abhängen (i) ?r:v: ::7+:':+<"-: so nennen wir dies eine lineare Substitution, und das Er- gebniss eine lineare Transformation. Die Grosse B) «w, «f),.. ., heisst die Substitutionsdeterminante. Sie muss immer von Null verschieden sein, da sonst durch A) eine Abhängigkeit zwischen den Variablen xx, x2, . . ., xm ausgedrückt wäre. Durch eine lineare Substitution geht jede homogene Func- tion der Variablen x in eine homogene Function desselben Grades der Variablen x' über.
208 Fünfter Arbschnitt. §. 62. So geht beispielsweise jede lineare Function i y = SciiXi in eine ebensolche Function y< = Ea-x'i über, worin C) a!h Betrachten wir m solcher linearer Functionen i *«m>—•Mflfe^' = 2 a>i,v%i v = 1, 2,..., m, so erhalten wir m transformirte Functionen y'v = U^vx'i v = 1, 2,..., m. Die Determinanten der Systeme yn y'v 4 = 2 + (h,lCl2,2 • • • Om,m, 4' = 2 + 0^,10^,2 • . • 0!m,m stehen nach dem Multiplicationsgesetz der Determinanten in der Abhängigkeit D) J' = r4, so dass die eine nicht ohne die andere verschwindet. §• 62. Quadratische Formen. Von besonderer Wichtigkeit ist die Transformation der homogenen Functionen zweiten Grades oder der quadratischen Formen. "Wir bezeichnen sie, wie schon im ersten Abschnitt, so: A) g>(%7 ^25 • • -i ay) Durch die Substitution §. 61, A) geht <p über in B) * (x'v x'2, . . ., x'm) = 2a'i!htiü. Setzen wir x -(- £ für % und ebenso x' -f- |' für x1, so dass die |' mit den -| in derselben Abhängigkeit stehen, wie die af mit den x, so erhalten wir, wenn wir zur Abkürzung | <p' (xt) = ut, \ 0' (xi) = u'i setzen, durch Vergleichung der Glieder der ersten Dimension [§. 18, A2), A3)]:
§. 62. C) also, D) wie Nun in ist §• Quadratische Formen. 2?g,«, = 27g;«^ 61, C) 209 und demnach giebt uns D) die Transformation von m linearen Functionen. Die Coefficienten des transformirten Systems sind a^j, und des ursprünglichen, die man durch Einsetzen des ersten Systems E) in D) erhält, F) bk,h Die Determinante des ersteren Systems H' = S + ffli,i «3,2 • • • S ist nach §. 61, D) und nach F) ist die Determinante der by,^ Wenn wir also G) H = S ± ahl 02,3 ... anhm setzen, so haben wir den wichtigen Satz (8) H' = r"K Die Determinante H wird die Determinante der Form (p (x) genannt. Sie ändert sich also bei der linearen Transformation der Function q> nur um den Factor r2, und sie kann bei der trans- transformirten Form nicht verschwinden, wenn sie es bei der ursprüng- ursprünglichen nicht thut. Das Verschwinden der Determinante H hat die Be- Bedeutung, dass die Function <p(x) sich auffassen lässt als eine Function von weniger als m Veränderlichen, die lineare Functionen der x sind. Denn wenn erstens durch eine lineare Transformation y (x) in die Function <£ (x1) übergeht, die von einer der Veränderlichen) etwa von x'v unabhängig ist, so verschwindet H', da die Elemente in einer der Zeilen (und Colonnen) alle verschwinden, und also ist wegen (8) auch H = 0. Zweitens aber ist H die Determinante des Systems linearer Gleichungen Weber, Algebra. I. 14
210 ¦ Fünfter Abschnitt. §. 63. (9) .q>'(Xi) = 0, » = l, 2...m, und wenn diese Determinante verschwindet, so giebt es (§. 27, IV.) ein Grössensystem A0) 4°>, af > . . . a*»>, dessen Elemente nicht alle verschwinden, und die, für die % ein- eingesetzt, den Gleichungen (9) genügen. Nun hat man aber, wenn a?,-, x\ irgend zwei Grössensysteme sind, und X ebenfalls eine willkürliche Grosse bedeutet, die iden- identischen Gleichungen A1) <p(x + lad) = <p(x) k [§. 18, A2) bis A5)], so dass, wenn für x\ die Werthe xT gesetzt werden ganz unabhängig von X wird. Wenn wir nun annehmen, es sei scfV> von Null verschieden und wir setzen ferner: A3) y.2 = x2CC^> - ya = x3 af> — xx xf> , = xmxf — so folgt: A4) 4°>2 (p(x) = 9 @, 2/2, 2/3 ••• 2/m)> wodurch 9 (a;) durch die m — 1 Veränderlichen y2, y3 . . . ym aus- ausgedrückt ist. §. 63. Transformation der quadratischen Formen in eine Summe von Quadraten. ¦ Wir machen von dem zuletzt bewiesenen Satze sogleich eine wichtige Anwendung auf die Discriminante der Function A1) (als Function zweiten Grades von X betrachtet), wobei nicht mehr vorausgesetzt wird, dass die Determinante der Function <p verschwiudet. Diese Discriminante ist A) * {x) = [2 xt <p' {x'i)Y - 4 <p (a) <p (*0-
§. 63. Quadratische Formen. 211 Setzen wir in ihr x{. -\- X x\ an Stelle von x„ so ergiebt sich, wenn man für q>(x -\- Xx') den Ausdruck §. 62, A1) substituirt und ZJx'i (p' (x'i) = 2 q> (x'~) setzt, ip(x-\- Ix1) = 4>(x), woraus hervorgeht, dass il>(x) nur von m — 1 linearen Verbin- Verbindungen der m Veränderlichen abhängt. Setzt man für x'v x\...x'm beliebige specielle Werthe, für die <jp (x1) nicht verschwindet, und nimmt x\ von Null verschieden an, so wird x'lt\>(xu x2, . .. xn) == tp@, Xtx\ — xxx'2, . .. xmx\ — xxx'm), also eine Function der m — 1 Veränderlichen y3 = x.2 x\ — xx #2,. . . ym = xm x\ — xx x'm Man kann dies auch dadurch bestätigen, dass für xx, #2 . . . xm = x'x, x'2 . . . x'm alle zugleich verschwinden, dass also die Determinante der Function tp verschwinden muss. Die Formel A) enthält nun ein sehr wichtiges Resultat, das sich am besten übersehen lässt, wenn wir dieser Formel folgende Gestalt geben. Wir setzen ) ) und erhalten C) 9(x) = rx2 + xB/2,y% ¦¦¦ ym\ wodurch <p (x) dargestellt ist als Summe aus einem Quadrat einer linearen Function yx und einer Function % von m — 1 Variablen. Dabei ist Yx nicht linear ausdrückbar durch y2, ys . . . ym; denn für Xx, x.2, . . . xm = x'v x\, . . . x'm werden y^ ys . . . ym gleich Null, während Yj =~\/(p(x'), also von Null verschieden wird. Daraus folgt der wichtige Satz Eine quadratische Form von m Veränderlichen lässt sich immer darstellen als eine Summe von Quadraten von in oder weniger von einander unab- unabhängigen linearen Functionen. Dieser Satz ist offenbar richtig für eine Function von einer Variablen, die ja selbst ein Quadrat ist. Aus C) folgt aber die Richtigkeit des Satzes für eine Function von m Veränderlichen, wenn seine Richtigkeit für eine Function von m — 1 Veränder- Veränderlichen vorausgesetzt wird. 14*
212 Fünfter Abschnitt. §.64. Die Darstellung ist, wie B) zeigt, auf unendlich viele ver- verschiedene Arten möglich, da die willkürlichen Grossen x1 noch in dieser Formel vorkommen. Eine Darstellung durch weniger als m Quadrate ist nur dann möglich, wenn die Determinante der Function <p verschwindet. Da. in dem Ausdruck B) für Yt eine Quadratwurzel vor- vorkommt, so kann Yx reell oder imaginär sein, selbst wenn die Coefficienten von q> und die x und x' reell vorausgesetzt werden. Setzen wir aber in dem Falle, wo Y1 imaginär ist, i Yt an Stelle von Y1: so können wir unseren Satz auch so aussprechen: Eine reelle quadratische Form von m Veränder- Veränderlichen lässt sich als Summe von höchstens m positiven oder negativen Quadraten reeller linearer Functionen der x darstellen l). Zur Veranschaulichung dieser Betrachtungen mag noch be- bemerkt werden, dass im Sinne der analytischen Geometrie das Verschwinden der Determinante der Function <p bei drei Variablen die Bedingung ist, dass der Kegelschnitt q> = 0 in ein Linien- Linienpaar zerfällt, und bei vier Variablen, dass die Fläche <p = 0 in einen Kegel übergeht. Die in A) eingeführte Function $ stellt, gleich Null gesetzt, für vier Variable, den Tangentenkegel der Fläche 93 = 0 dar, der seine Spitze im Punkte x', hat. §• 64. Trägheitsgesetz der quadratischen Formen. Für die Zerlegung einer quadratischen Form in Quadrate gilt nun der folgende Satz, der von Sylvester den Namen des Gesetzes der Trägheit der quadratischen Formen erhalten hat (Philos. Mag. 1852). !) Für die allgemeine Theorie der linearen Transformation der Formen zweiten Grades sind ausser den Untersuchungen von Jacobi und Hesse (Hesse, „Vorlesungen über analytische Geometrie des Raumes", dritte Auflage, besorgt und mit Zusätzen versehen von Gundelfinger, Leipzig 1876) besonders die Arbeiten von Weierstrass und Kronecker (Monats- (Monatsberichte der Berliner Akademie 1868, 1874) von Bedeutung. Eingehende historische Darlegung der Entwickelung der Frage in dem „Bericht über den gegenwärtigen Stand der Invariantentheorie" von Franz Meyer (erster Jahresbericht der deutschen Mathematiker-Vereinigung, Berlin 1892).
§. 64. • Trägheitsgesetz. 213 Wie man auch eine reelle quadratische Form cp (x) in die Summe von positiven und negativen Quadraten linearer Functionen zerlegen mag, die Anzahl der posi- positiven und negativen dieser Quadrate, und also auch ihre Gesammtzahl, ist immer dieselbe, vorausgesetzt, dass zwischen diesen linearen Functionen keine lineare Ab- Abhängigkeit besteht. Der Beweis dieses wichtigen Satzes ist sehr einfach. Es seien A) <p(x)= Yj+Y* + .••Yi — Y? — Y* iy = Z\ + ZI -j ZI - Z* - Z'l - Z$ zwei Zerlegungen von cp (x) in Quadrate. Es seien also Ti, Y2 . . . Yn T\, Y'2 . . . Yv' homogene lineare Functionen von x, zwischen denen keine lineare Relation mit constanten Coeffi- cienten besteht und also v -\- v' ^ m; dieselben Voraussetzungen werden über die Functionen Z„ Z2...Zfl, Z[, Z'ii...Zfl, gemacht, so dass auch ft -f- fi' 3^ m ist. Angenommen, es sei v O, dann können wir die Variablen x den linearen Gleichungen , Yx = 0, T2 = 0 . . . Yv = 0 {"> Z\ = 0, Z'a = 0 . . . Zp = 0 unterwerfen, deren Anzahl v -\- ft' kleiner als m ist. Wenn nun die sämmtlichen Functionen Z^ Z2 . . . Z^ linear abhängig wären von den Functionen Ti, Y2... Yn Z'v Z'2...Z'p,, so könnte man aus diesen [i Gleichungen durch Elimination der v Variablen Yt, Y2 . ¦ ¦ Yv eine lineare Gleichung zwischen den ZL, Z2 . . . ZiU, Z'x . . . Z'^t herleiten, die nach Voraussetzung nicht bestehen soll. Es ist also das Verschwinden sämmtlicher Zu Zi . . . Zu nicht eine nothwendige Folge der Gleichungen B), und wir können zu den Gleichungen B) noch eine nicht homo- homogene hinzufügen, etwa Z1 = l; dann haben wir für die m Unbekannten x ein System von m oder weniger Gleichungen, die von einander unabhängig sind, sich also nicht widersprechen. (§. 29, V). Dann ergiebt aber die zweite Darstellung A) für cp (x) einen positiven Werth, während die erste einen negativen oder ver-
214 Fünfter Abschnitt. §. 65. schwindenden Werth giebt, worin ein Widerspruch liegt. Es folgt also v :> & und da man ebenso schliesst so bleibt nur v = [i übrig. In gleicher Weise kann man be- beweisen, dass v' = fi' ist, wodurch unser Satz vollständig be- bewiesen ist. §. 65. Transformation von Formen wten Grades/. Wenn eine Form wten Grades von m Veränderlichen, F(x), durch eine lineare Substitution [§. 61, A)] transformirt wird in 0{x'), so wird gleichzeitig die lineare Function der Veränder- Veränderlichen |l5 |2 .. . |m A) S^F(xt) durch dieselbe auf |< angewandte Substitution in B) i?S*(a4) transformirt, weil beide Ausdrücke den Coefficienten der ersten Potenz von t in der Entwickelung von nach Potenzen von t darstellen (§. 18). Desgleichen wird die quadratische Function C) 2kkF"(xixk) . in transformirt. Wenden wir das erste Resultat auf ein System von m Func- tionen F1 (x), Fz (x) . . . Fm (x) von beliebigen Graden an und bezeichnen mit J die Determinante . . . Fx{xn) . . . Ft(xm) J&), Fm(x2) . . . Fm(xm) während wir mit A' die entsprechende, aus den Functionen Oi, 0} . . . 0m gebildete Determinante bezeichnen, so erhalten
§. 65. Functional-Determinante. 215 wir nach §. 61, D), wenn wir wieder mit r die Substitutions- Substitutionsdeterminante bezeichnen, E) J' = r/1. Die Function J heisst die Functional-Determinante der m Functionen Fx, F2 . . . Fm. Desgleichen erhalten wir aus der Transformation C), D), wenn wir mit H die Determinante "(xv xj, F'fa, x2) ... F'(x1, xm) F'{x^ x{), F'(x2, x2) . . . F'ix» xm) F'(xm, xj, F'(xm Xi) ... F'(xm, xm) und mit E' die entsprechende Determinante für die transformirte Function <E> bezeichnen, nach §. 62, (8) jET heisst die Hesse'sche Determinante1) der Function F. In beiden Formeln E) und F) bedeutet r die Substitutions- Substitutionsdeterminante. Aus den Formeln B), C) F) ergiebt sich ferner, dass die Function G) Z durch die auf die | und die x gleichzeitig angewandte Substi- Substitution in S & & O>" (x-, 4) + (8) ^g übergeht, wenn X ein unbestimmter Coefficient ist. Betrachten wir also das System von n -j- 1 Variablen |l5 |27 • • • Im» A, so geht dies durch eine lineare Substitution, die aus §. 61, A) durch Hinzufügung der Gleichung V = r2l hervorgeht, und deren Determinante «CD, „(i), ... «0) 0 0, 0, 0, J) GeBannt nach Hesse, der in geometrischeB Untersuchungen, namentlich in der Theorie der Curven dritter Ordauag trad ia Eliminations- problemen diese Determinante vielfach anwandte und ihre Bedeutung erkannte.
216 Fünfter Abschnitt. §.66. ist in das System |'1}' |'2, . . . gm, V über und die quadratische Form G) wird dadurch in die quadratische Form (8) transformirt. Wenden wir also auf diese Form den Satz §. 62 (8) an, und bezeichnen die Hesse'sehe Determinante der Form G), also wenn JET fa), H'(xz), . . . H (xm) die Ableitungen von R sind, die Determinante F"(xx, x,), F'(xu x%), . . . F'(xlt xm), R'(xx) F"(x2,xL), F'(x^x%\. . . F'(x2,xm), H'(x2) (9) F"(xm,x{),F'(xm,x,):. . . F*(xm,xm), H'(xm) 0 mit C, so besteht die Eelation A0) C = r* C wenn C dieselbe Bedeutung für die transformirte Function 0 hat, wie C für F. Eine ähnliche Beziehung ergiebt sich auch, wenn man in (9) die H' (xi) durch die Ableitungen F (xi) ersetzt. Dann aber geht die Determinante (9) in das Product HF über, und wir erhalten also kein neues Eesultat. ' §. 66. Invarianten und Covarianten. Bei. der linearen Transformation der homogenen Functionen treten immer gewisse Functionen der Coefficienten auf, die, wenn man die Coefficienten der gegebenen Form durch die Coefficienten der transformirten Form ersetzt, sich nicht anders ändern, als dass sie einen Factor annehmen, der eine Potenz der Substitutions- Substitutionsdeterminante ist. Auch bei gleichzeitiger (simultaner) Trans- Transformation eines Systems von mehreren Formen kommen solche Functionen vor, die von den Coefficienten aller Formen des Systems abhängen. Solche Functionen sind z. B. bei einem System von n linearen Formen die Determinante des Systems, und bei einer quadratischen Form die Deter- Determinante dieser Form. Man nennt diese Functionen Invarianten der Form, oder wenn sie von mehreren Formen abhängen, simultane Inva- Invarianten des Systems.
§. fi6. ' Invarianten und Covarianten. 217 Wenn also I(a) eine Function der Coefficienten a einer Form F(x) ist, und wenn a' die Coefficienten der transformirten Form &(%') sind, so heisst I(a) eine Invariante, wenn die iden- identische Relation A) J(a') = rU(a) besteht. Der Exponent % heisst das Gewicht der Invariante. Ist dieser Exponent Null, so heisst /eine absolute Invariante. Man betrachtet meist nur ganze rationale Invarianten, d. h. solche Functionen I, die von den Coefficienten a rational abhängen und überdies ganze homogene Functionen von ihnen sind. Die simultanen Invarianten sollen in Bezug auf die Coefficienten einer jeden der Formen, von denen sie abhängen, homogen sein. Ausser den Invarianten giebt es auch Functionen, die neben den Coefficienten die Variablen selbst noch enthalten, im Uebrigen aber dieselben Eigenschaften wie die Invarianten A), „die In- varianteneigenscbaft" haben; also, wenn C(x, a) eine solche Function ist: B) C{af, a') = rl C(x, a). Solche Functionen heissen Covarianten der Form F{x). Die Functionaldeterminante ist eine simultane Covariante eines Systems von m Functionen und die Hesse'sehe Determinante einer Function von höherem als dem zweiten Grade, ist eine Covariante einer einzelnen Form. Ebenso ist die im vorigen Paragraphen betrachtete Function C eine Covariante von F. Auch unter den Covarianten betrachtet man vorzugsweise ganze rationale und homogene Functionen von x und von a. Ist m die Anzahl-der Variablen x, n der Grad der Function F(x), v und fi die Grade von C(x, a) in Bezug auf die x und a, so besteht zwischen den Zahlen A, [i, v, m, n die Relation C) n ft = m i. -f- v, die man dadurch beweist, dass man den Grad der rechten und linken Seite von B) in Bezug auf die Substitutionscoefficienten vergleicht. Die a! sind nämlich in den Substitutionscoefficienten vom wten Grade, r vom »»ten Grade, x vom ersten Grade, woraus sich C) ergiebt. Die entsprechende Formel für die Invarianten erhält man, wenn man v = 0 setzt, wie denn überhaupt die Invarianten als specieller Fall der Covarianten betrachtet werden können.
218 Fünfter Abschnitt. §.67. Ein allgemeines Gesetz zur Bildung von Invarianten und Covarianten, das wir in den besonderen Fällen des §. 65 schon gebraucht haben, wollen wir kurz besprechen. Wenn wir nach §. 18, D) die Function F(xL + «|„ x% + i|2 . . . xm -\- t£m) nach Potenzen von t ordnen, so erhalten- wir für den Coefficienten von V «1 + «2 +••• + «»» = V- Wenn wir auf die Variablen | und x gleichzeitig die lineare Transformation A), §. 61 anwenden, so geht _Fr(#,|) in <E>„ (x\ |') über, was man aus Fv erhält, wenn man gleichzeitig alle Buch- Buchstaben x, |, a durch x', |', a' und F durch <E> ersetzt. Daraus folgt: I. Betrachtet man Fv(x, |) als Form vten Grades von | und bildet eine Invariante dieser Form, deren Coefficienten also noch von den x ab- abhängen, so erhält man eine Covariante der Form F. Und da die Variablen x ¦ und | derselben Transformation unterliegen, so ergiebt sich ebenso: II. Bildet man eine Covariante der Function Fv(x, |) als Function von | betrachtet, und er- ersetzt darin die | durch die x, so erhält man eine Covariante der ursprünglichen Function F(x). Die gleichen Sätze gelten auch für simultane Invarianten und Covarianten. Von den Functionen Fv(x, |) gilt der Satz E) Fv(x, |) = *'„_>.(!, x), der sich durch die Vergleichung entsprechender Potenzen von t auf beiden Seiten der Identität F(x, + *&... aw + *£») = t-F^x, -f |i . . . ir-1xm + |m) ergiebt. Die Functionen
§. 67. Binäre Formen. 219 "werden die Polaren der Function F(x) genannt, und zwar lieisst Pv(x, |) die vte Polare. Auch von ihnen gilt der Satz Pv(x, g) = p„_, (g,«). Der constante Factor iT(v) TJ{n — v): II(n) ist zugesetzt, damit, wenn die Form F(x) mit den Polynomialcoefficienten geschrieben ist, die Functionen Pr möglichst einfache Coefficienten erhalten. Für die binäre Form f(x, y), auf die wir im Folgenden diese Definitionen hauptsächlich anwenden werden, ergeben sich für die Polaren folgende Ausdrücke: und allgemein n(» — 1) . . • (n — v -f 1) Wenn man zu einem System von Covarianten einer Form F wieder Covarianten bildet, so erhält man, wie unmittelbar einzusehen ist, Covarianten der ursprüng- ursprünglichen Form. So erhält man z. B. im Falle dreier Variablen, wenn man aus den drei in §. 65 betrachteten Formen F, H, C die Func- tionaldeterminante bildet, die neue Covariante von F: F) K= F'(x,), H'(x,), C'(x2) j. i«x/g ij J.-L [*&% u \j yy^z) die nach C) das Gewicht 9 hat, also der Bedingung G) K' = r9K genügt. §. 67. Lineare Transformation binärer Formen. Eine ganze rationale Function wten Grades von x A) fix) = «o #" -(- <h xn~1 -(- a2xn~i -\- • • ' -\- a„—iX -(- an
220 Fünfter Abschnitt. §. 67. wird in eine binäre Form verwandelt, wenn man x durch x : y ersetzt und mit «/" multiplicirt: B) /O, y) = «os" + «i«"~1 V-+a%a?"-V -| \-anr- Wenn man die Wurzeln von /(#)¦ kennt, so kann man /(#) in n lineare Factoren zerlegen: C) f(x) = a0 (x — c^) (x — a2) . . . (x — «„), und daraus ergiebt sich D) /(«» V) = ao(x — «!«/) (# — «2«/)... (a; — «„«/). Ersetzt man aber auch «l5 «2 . . . «„ durch Verhältnisse C6j: j81} «2: /S2, . . . «n: ß», so erhält man E) /(«, ^) = -^(«^1 — y«i) {xß2 —ya%). .. (xßn — yccn), wenn «o = A ßi ßa • • ¦ ßn gesetzt wird. Für die Factoren von f(x, y), die uns jetzt öfter begegnen, führen wir als Abkürzung das Zeichen, ein F) . . xßl — ya1 = (xß1). Ebenso werden wir setzen G) xt y2 — Xi y1 = (xL y%), worin xu yx und x2, y2 zwei beliebige Variablenpaare sind. Wenn wir die inhomogene Darstellung anwenden, so setzen wir noch kürzer ,g. x — «j. = @, 1), x — «2 = @, 2), . . . x — «„ = @, n) ^ J «i — a2 = A, 2), ... «j — «fc = (i, h). Machen wir in der Form B) eine lineare Substitution x = ax'-\~ßy' mit der von Null verschiedenen Determinante A0) r = a§ — ßY; so geht die Form f(x, y) in eine Form wten Grades F(x', y1) über, und es ist A1) F(af, y') = a'ox'» + «i^-1«/' + aia/—V* H <y"n- Die Coefficienten ab, a\ . . . a'n der transformirten Form er- erhält man als lineare und homogene Ausdrücke in den Coeffi- Coefficienten Oo, ax . . . o» und als homogene Ausdrücke wten Grades in den Substitutionscoefficienten a, ß, y, d. Man erhält so, wenn man x' = 1, y' = 0 oder x' = 0, y1 = 1 setzt, A2) oi =*/(«, y),- ait=f(ß,8).
§.67. Binäre Formen. 221 Die übrigen Coefficienten a' kann man durch die Derivirten der Function f(x, y) ausdrücken, z. B. was wir nicht weiter ausführen. Wenn wir auf die beiden Variablenpaare #, y und «&, /3fc gleichzeitig die Transformation (9) anwenden, so erhalten wir die linearen Factoren von f(x, y) transformirt, nämlich A3) &ß*) = r(xßk), wie man aus der Multiplicationsregel der Determinanten oder auch durch directes Ausrechnen findet. Diese Factoren {xß-^) sind also auch Covarianten von f(x,y), freilich aber irratio- irrationale, da.sie nicht rational von den Coefficienten von f(x) ab- abhängen. Ebenso ergiebt sich A4) KÄ) = r(akft), wonach die Determinanten (außk) als irrationale Invarianten zu betrachten sind. Wir wollen nun darlegen, wie man daraus rationale Invarianten und Covarianten bilden kann. Wir betrachten zu diesem Zweck am besten die lineare Transformation in der nicht homogenen Gestalt 05) * und wenden diese auf die Function f(x) in A) an. Es folgt dann, wenn F(af) = äox1" + a'ix'"'1 -f a^a;'»-2 -| \- a>n gesetzt wird A6) F(af) = (Vaf + 8)*f(x). Diese Gleichung schreiben wir auch so: Fix1) = (ax' + ß)"(a0 + a, I + a2 I • • •), woraus, wenn man x' = — d:y, also x = <x> setzt, oder, wenn ai, «2, ... «» ebenso von 0^, «2, ...-«„ abhängen, wie x' von x, also F{x') = aj(a/ - «;) (»' - «'2) ...(«' — <) gesetzt wird, A7) r»a0 = ai(y«; + ») (y«'2 + »)... (y«„ + 8) folgt.
222 Fünfter Abschnitt. §. 67. Nun ist nach der Transformation A5) x — <h = r{x' — aj) *) Wir bilden nun ein Product P aus irgend welchen der Factoren @, 1), @, 2) ... @, ») A, 2), A, 3) ... (» - 1,»), jedoch so, dass darin jede der Ziffern 1, 2 ... n im Ganzen gleich oft, etwa fxmal vorkommt. Der Index 0, d. h. die Variable x, möge i/mal vorkommen, und die Gesammtanzahl der Factoren soll q betragen. Es ist dann, da jeder Factor zwei Indices enthält, A9) v-\-np = 2q. Dann ergiebt sich aus A7) und A8), wenn P' aus P durch Vertauschung von x, «j mit x', a\ hervorgeht B0) a'f P = ajy»i"-a (y x' -\- 8)VP. Wir bilden nun B1) C(x,y,a) = die Summe genommen über alle Werthe, die man aus P erhält, wenn man die Indices 1, 2,3...» auf alle mögliche Arten mit einander vertauscht. Diese Summe ist dann eine sym- symmetrische Function der Wurzeln von A) und lässt sich also als ganze rationale Function der Verhältnisse a^-.a^ a2:ao-"fll»:ao ausdrücken, so dass kein Glied die (tte Ordnung übersteigt (§.49).. Die Function C(z, y, a) ist also eine ganze homogene Function von o0, % ... a„ von der ftten Ordnung und eine ganze homogene Function von x, y von der vten Ordnung. Da sie nach A9), B0) der Bedingung B2) _C(x\ y', a') = r*C(x,y,a), B3) A = wft — q, 2/L = wfi. — v genügt, so ist sie eine Govariante und in dem besonderen Falle, wo v = 0 ist, eine Invariante. Das Gewicht X ist, wie der zweite Ausdruck zeigt, immer positiv oder Null, da n[i mindestens gleich v ist. Der äusserste
§. 68. Binäre cubische Formen. 223 Werth n(i = v oder 1=0 kommt nur dann vor, wenn in P jeder der Indices 1, 2, 3 ... n nur mit 0 verbunden vorkommt, also P eine Potenz von f(x) selbst ist. §. 68. Binäre cubische Formen. Eine binäre quadratische Form giebt keine anderen in- invarianten Bildungen als die Discriminante. Mit diesen befassen wir uns daher nicht, und gehen gleich zur Betrachtung der cubischen Formen A) f{x,y) = a{jx*-\-axxt*y-\ra.1xy'>-\-a%y% über. Hier bilden wir als erste quadratische Covariante die Hesse'sehe Determinante. Wir wollen hier immer die Regel befolgen, dass wir die Formen mit ganzzahligen Zahlencoeffi- cienten ohne- gemeinsamen Factor schreiben. Dann müssen wir in der aus den zweiten Ableitungen von A) gebildeten Deter- Determinante den Factor 4 abwerfen und erhalten als erste Covariante oder B) H = A, wenn zur Abkürzung Ao \ C) Ai = 9ffioö!j — dx a2 A% = 3 % a% — a| gesetzt ist. Die Discriminante dieser quadratischen Form ist eine Inva- Invariante der gegebenen cubischen Form. Sie enthält aber den Factor 3 in allen numerischen Coefficienten, und demnach setzen wir D) 3D=4AA-i/, und dann stimmt D mit der Discriminante der cubischen Form [§. 50, A0)] überein: E) D = alal -\- 18ao%<V'3 — 4ao%3 — ±a\a% — 27afiag. Eine weitere cubische Covariante erhalten wir, wenn wir die Functionaldeterminante von f(x, y) und H(x, y) bilden:
224 Fünfter Abschnitt. §. 68. F) Q (x, y) = f (x) H> (y) - /' (y) H> (x) oder G) Q— Axx-\- 2Aly in der sich kein numerischer Factor wegheben lässt. Wir setzen die ausgerechneten Coefficienten von x3, x2y, xy2, ys, deren Bil- Bildung keine Schwierigkeit macht, der Reihe nach hierher: 27 a02o3 — 9 a0 Oj o2 -j- 2 of, — 27 a0 a2 a$ -\- 18 a?a3 — 3 — 27ao»32 + 9 »10203 — 2o23. Das Verhalten von S, D, Q bei linearer Transformation ergiebt sich aus §. 66, B), C); sind IZ7, B', Q' die entsprechenden Bildungen für eine transformirte Form, so hat man (8) H' = r2H, B = r*D,- Q' = r* Q. Die Covarianten können wir benutzen, um die cubische Form auf eine Normalform zu transformiren, die zugleich die Lösung der cubischen Gleichung giebt. Wir wählen die Normalform (9) fix, y) = F{1 n) = £3 + ^ worin §, v\ lineare Functionen von x, y sind; eine Form, die, wie sich gleich ergeben wird, immer hergestellt werden kann, wenn D nicht verschwindet, also die Gleichung / = 0 nicht zwei gleiche Wurzeln hat. Die Lösungen von / = 0 ergeben sich dann aus den linearen Gleichungen l + n = 0, I + Bf! = 0, 1 ¦ + e'n = 0, worin a eine imaginäre dritte Einheitswurzel ist. Um für die Normalform (9) die Formen S\ D', Q' zu bilden, haben wir a'o = a's = 1, a[ = a'% = 0 zu setzen und erhalten 1P = 9 |ij, Df=- 27, Q> = 27 (I» — ij»). Wenn die Normalform (9) durch lineare Transformation aus der allgemeinen Form fix, y) abgeleitet ist, so ergiebt sich nach (8) , 9£ - 27 = reD
§. 68. Binäre cubische Formen. 225 Daraus folgt # also, wenn für r3 aus der ersten Gleichung der Werth 9: V— 3 D gesetzt wird, 6|« y=WD = + Q 6r}3]/— 3D = - woraus £ und v\ durch zwei Cubikwurzeln bestimmt sind, von denen nach der ersten Gleichung A0) die eine durch die andere ausgedrückt werden kann. Darin liegt auch der Beweis, dass, wenn D von Null ver- verschieden ist, die Normalform durch lineare Transformation her- hergestellt werden kann. Denn unter dieser Voraussetzung zerfällt H in zwei von einander verschiedene lineare Factoren, und wenn man diese, von constanten Factoren abgesehen, für die neuen Variablen |, v\ einer linearen Transformation wählt, so wird Äü = 0, A'2 = 0; es folgt aber aus den identischen Relationen O (X§ -£Lq ~~\— Oi\ -^-2 ^2 -^-1 5 ^2 "^^0 —I— " ^0 -^-2 -~~ ^1 -^-li wenn nicht zugleich A\ = 0, was durch das nicht verschwindende D ausgeschlossen ist; a[ = 0, d% = 0, d. h. die transformirte Form von f enthält nur die Cuben von £ und jj. Eliminirt man |, jj, r aus den Gleichungen A0), so erhält man zwischen den Covarianten folgende identische Relation A2) 4fis -j- #2 _|_ 27 Dp = 0. Um die Transformation in die Normalform auszuführen, d. h. die Functionen |, rj wirklich zu finden, zerlegt man die Function H in ihre linearen Factoren 4AoH=BAox-\-Aiy-\-y— 3Dy) BA0x -\- Ax y—]/— 3 Dy). Dann unterscheiden sich |, i\ von diesen beiden Factoren von H nur um je einen constanten Factor. Wir setzen also, wenn wir zwei constante Factoren mit h, k bezeichnen, 2g 2n = hBAoX + A, y -f ]/— 3Dy), woraus sich durch Multiplication mit Rücksicht auf die beiden ersten Gleichungen A0) ergiebt: A4) 3hJcA0f— D = 1, Weber, Algebra. I. ' jg
226 Fünfter Abschnitt. §. 69. und die Gleichungen A1) geben durch Vergleichüng der Coeffi- cienten von xz 6h3A*]/—3D = + q0 + 3 ]/— 3Da0 A5) 6 fcs A* ]/_ 3_ J) — — q0 _|_ 3 V—- 3 D a0, wo g'o der Coefficient von #3 in <jM also A6) #0 = 27 a02 a3 — 9 »o «i «2 + 2 «i ist. Dass die Vorzeichen von V— 3D mit Rücksicht auf die Vorzeichen in A1) so zu nehmen sind, wie es in den Formeln A3) geschehen ist, ergiebt sich am einfachsten, wenn man die Rechnung für den besonderen Fall a0 = 0, % = 0 durchführt, in dem die Vergleichung von A1) mit A3) die Identität (axx — ea2yy = afxz — 3sala2x2y -j- 3 a2 a^a^xy* — a£y8 ergiebt, wenn e eine imaginäre dritte Einheitswurzel ist. §. 69. Das volle Formensystem der binären cubischen Form. Wir wollen noch nachweisen, dass die Invarianten und Covarianten der cubischen Form durch die Functionen D,f, H, Q erschöpft sind, d. h. dass sich alle Invarianten und Covarianten einer cubischen Form rational durch diese vier Formen aus- ausdrücken lassen. Sei also C = C(x, y, a) eine Covariante vom Grade v in den Variablen und vom Grade (i in den Coefficienten, von der wir voraussetzen wollen, dass sie nur ganzzahlige numerische Coefficienten hat. Es ist dann für irgend eine transformirte Form [§.66.B), C)] A) C=C($,ri,a') B) *=^ Wir verstehen jetzt unter |, t\ die Variablen unserer oben betrachteten Normalform. Bezeichnet dann e eine dritte Einheits- Einheitswurzel, so ist eine lineare Substitution mit der Determinante 1, durch die die Normalform §. 68, (9) in sich selbst übergeht. Es folgt also,
¦§. 69. Das volle Formensystem der cubischen Form. 227 dass sich, C nicht ändern kann, wenn |, r) durch e f, a2 jj ersetzt werden; es kann also C" nur von £?j, |8, jj3 rational abhängen. Die Vertauschung von f mit t\ entspricht einer Substitution mit der Determinante — 1; dadurch bleibt also C" ungeändert oder ändert sein Zeichen, je nachdem X gerade oder ungerade ist. Es besteht daher C aus einer Summe von Gliedern der Form worin M ein ganzzahliger Factor ist (da wir die numerischen Coefficienten in G und also auch in C als ganze Zahlen voraus- vorausgesetzt haben), und das obere oder untere Zeichen gilt, je nach- nachdem X gerade oder ungerade ist. Im letzteren Falle ist dieser Ausdruck durch £3 — jj3 theilbar und der Quotient ist durch |3 -f- jj3 und 1^ rational und ganzzahlig ausdriickbar (weil eine symmetrische Function von zwei Grossen so durch die Summe und das Product dargestellt werden kann). Setzen wir also % = 0 oder = 1, je nachdem X gerade oder ungerade ist, so ergiebt sich für C ein Ausdruck von der Form worin die M ganzzahlige Coefficienten sind und «, ß eine Reihe positiver ganzer Zahlen durchlaufen, die der Bedingung C) 3tr -|- 3ß -f- 2 a —v genügen. Aus A) ergiebt sich also, wenn wir mit einer hinläng- hinlänglich hohen Potenz von 3 multipliciren und |?j, £3 -\- jj3, £3 — 9j3 nach §. 68, A0) durch H, /, Q, und r durch D~* ausdrücken, D) 3aC= <F2MD*E*f, worin E) 6 y = X — 3 z — 2 a, und worin die M gleichfalls ganzzahlige Factoren sind. Zu jedem Werth von y gehört nach E) ein bestimmter Werth von « und nach C) ein bestimmter Werth von ß; ebenso sind durch einen Werth von a oder von ß jedesmal die beiden übrigen Zahlen bestimmt, so dass in D) jeder Exponent von D, H oder / nur einmal vorkommt. Dass y eine ganze Zahl ist, folgt leicht aus B), C), E); denn da nach der Definition X — 3r eine gerade Zahl ist, so ist zunächst 3 y eine ganze Zahl, und da ferner nach B) und C) 15*
228 Fünfter Abschnitt. §. 09. so ist 6y und mithin 3y durch 3 theilbar. Hieraus folgt, dass auch ö eine ganze Zahl ist. Dass aber y auch positiv sein muss, sehen wir so ein: Angenommen, auf der rechten Seite von D) kommen auch negative Potenzen vonD vor, so multipliciren wir diese Gleichung beiderseits mit einer so hohen Potenz von D, dass rechts keine negativen Potenzen von D mehr auftreten, dass aber auch die rechte Seite nicht den Factor JD erhält. Setzen wir in der so gewonnenen Gleichung F) a0 = 0, % = 1, a2 = 0, az = 0, so wird G) D = 0, H=—x\ f=x*y, Q = 2x\ Es würde also die linke Seite verschwinden, während die rechte Seite nicht verschwindet, worin ein Widerspruch liegt. Wir können aber endlich auch noch beweisen, dass auf der linken Seite von D) keine Potenz von 3 auftreten kann, die nicht in allen Factoren M enthalten ist, und sich also fort- fortheben lässt. Wir haben im §. 2 den Satz bewiesen, dass das Product zweier primitiver ganzer rationaler Functionen von beliebigen Variablen wieder eine primitive Function ist. Dabei ist unter einer primitiven Function eine solche verstanden, deren Coeffi- cienten ganze Zahlen ohne gemeinsamen Theiler sind. Es handelt sich nun hier darum, nachzuweisen, dass eine Summe der Form worin die M ganze Zahlen ohne gemeinsamen Theiler sind, nicht imprimitiv werden, und speciell den Factor 3 erhalten kann, wenn für Q, D, H, f ihre Ausdrücke in den a, x, y gesetzt werden. Nach dem erwähnten Satze genügt es, da Q eine primi- primitive Function ist, dies nachzuweisen für die Form (8) EMDyHaf. Hierin können wir überdies alle Glieder weglassen, deren M den Factor 3 schon hat, und endlich können wir wieder nach dem erwähnten Satze annehmen, dass der Ausdruck nicht durch D theilbar sei, dass er also ein Glied mit y = 0 enthält. Nehmen wir also an, es habe unter diesen Voraussetzungen der entwickelte Ausdruck (8) den Theiler 3, und substituiren nun die besonderen Werthe F), G), d. h. setzen wir D = 0, H = —x2,
§. 70. Biquadratische Formen. 229 f = x*y, so reducirt sich der Ausdruck auf das einzige Glied, in dem y = 0, 2 « = l ist, und es würde also folgen, dass dies M den Theiler 3 haben miisste, was gegen die Voraussetzung ist. Damit ist also be- bewiesen : Jede ganzzahlige Covariante der cubischen Form kann ganz und rational und mit ganzzahligen Coeffi- cienten M dargestellt werden durch einen der beiden Ausdrücke Die Invarianten sind als Specialfall unter den Covarianten enthalten und sind sämmtlich Potenzen von D. §. 70. Biquadratische Formen. Wir gehen nun zur Betrachtung der biquadratischen Form A) f(x, y) = aü x* -j- ax x* y -\- a2 x* y2 -j- azxyt -\- cs4 yi über. Wir haben zunächst die Hesse'sehe Determinante als Cova- Covariante vierter Ordnung, die wir, um sie von einem Zahlenfactor zu befreien, durch 3 theilen: 12 a0 x2 -\- 6 ax x y-j- 2 a2 y\ 3 <h x% -(- 4 a% xy ~\- 3»! oder worin Aü = 8 »o % — 3 a2, A± = 8 a2 »4 — ^Lj = 24 a0 a3 — 4 % »25 -^-3 = 24 ci^ a4 ^2 = 48 «o ^4 -f- 6 % a3 — 4 a22, und eine Covariante sechsten Grades W 12 Ä'(*), S»(y) Die Invarianten der biquadratischen Form bilden wir am einfachsten nach §.67 aus den Wurzeldifferenzen.
230 Fünfter Abschnitt. . §. 70. Wir erhalten so eine Invariante von der zweiten und eine von der dritten Ordnung in den Coefficienten: D) A = $ a> [A2)^ C4J + A3J B4J + A4J B3J]i E) J8 = a*27A2)»C4)*A3)D2), Ausdrücke, die sich übersichtlicher schreiben lassen, wenn man F) V = A2) C4), F = A3) D2), W = A4) B3) setzt, nämlich G) B=: a$\U\V— PF) + V\W-V)-^W^{TJ— F)] Zur Berechnung dieser Grossen sind die nöthigen Formeln schon in §. 52 entwickelt. Nach den dortigen Formeln A0) ergiebt sich (8) U = »2 — w2, V = w2 — u2, W = m2 — w2, und m2, w2, w2 sind die Wurzeln der cubischen Resolvente (9) zs -\-2as* -{-(a* — ±c)s — b* = 0. Die Ausdrücke für A, B ergeben sich nun aus der Be- Bemerkung, dass die drei Grossen yl = a0 (F— W) = »o (w2 + »2 + w2 — 3 «2) A0) 2/2 = »o ( W— U) = a0 (u2 -f- t;2 + w2 — 3 ü2) yg = «0 (U — F) = »o («2 + «2 + w2 — 3 w2) wegen G) und (8) die Wurzeln der cubischen Gleichung A1) y»-8Ay + B = 0 sind. Die Gleichung A1) muss also aus (9) durch die Substi- Substitution y = — a0 B a ~\- 3 z) hervorgehen, und es ergiebt sich daraus A = a%(a*-{- 12 c) B — «08Ba3 _ 72ac + 27&2), und durch die Coefficienten a0, a-^, a2, äz, a± ausgedrückt: A2) A = a$ — 3 ax a3 -}- 12 a0 a4 A3) JB = 27 »j2 a4 -(- 27 a0 a32 -j- 2 a23 — 72 a0 «2 a4 — 9 a, «2 a3, so dass A, B dieselbe Bedeutung haben, wie in §. 52. Auch die Discriminante der biquadratischen Gleichung als eine dritte, aber von A und B abhängige Invariante
§.71. Biquadratische Gleichungen. 231 A4) D = < V2 F2 W2 haben wir an der erwähnten Stelle schon gebildet und gefunden A5) 21D = ±A* — B\ Nach der Formel des §. 67, 2/1 = n(i — v, erhalten wir für die bis jetzt gefundenen invarianten Bildungen, die wir für eine transformirte Form mit Accenten bezeichnen, folgende Re- Relationen §. 71. Auflösung der biquadratischen Gleichung. Wir wollen eine Normalform durch eine lineare Substitution mit der Determinante 1 herstellen, zu deren Ableitung wird die gegebene biquadratische Form in lineare Factoren zerlegt an- annehmen : A) /(*> V) = «o (« — <*y) {% — ßy) (% — y y) (x — 8y). Wir setzen B) r y]/a — ß= | — fl, also x — ay = — ]/« — ß {% — 7 y) V« — ß = {ß — y) | — (« — y) n (X - §y)\/K-ß ^=(ß — S)i — (K-d)V, und dadurch geht f(x, y) über in D) F(&, n) = < £3n + < i2n2 + < ^3, und die Invarianten für diese Form sind A' — A — a'l — 3 a\ a'z, E) B' = B = 2 a'l — 9 a[ a\ o'„ D' = D = a'l dl a'l — 4 »'•> a,8. Die Coefficienten a\, a'2, a'3 sind nach C) leicht durch die «, /3, y, d auszudrücken:
232 Fünfter Abschnitt. §. 71. a\ = a0 (ß- y) (ß - 8) F) a'3 = a0 (a — y) (a — 6) a\ = - oo[(« - y) (|5 - 8) + (« - *) (ß - y)] Durch Vertauschung der Wurzeln können wir die Normal- Normalform D) auf sechs verschiedene Arten herstellen, die aber nur drei verschiedene Werthe von a'2 liefern. Diese drei Werthe sind, wenn wie oben U= (« -ß)(y — S), G) y = (« - r) (* - Ä, tf= (« - 8) (ß - y), U+ F+ TF=O gesetzt wird, a'2 = a0(F - W), (8) < = ao(PF-C/), <=«o(CT -F). Kennt man die a'2, a'%, a'£, so kann man auch die U, V, W bestimmen durch 3 a0 U = a" — o!'% (9) 3a0V=ä2-al 3 es0 W= a1; — a'2, woraus hervorgeht, dass, wenn von den drei Grossen a'2, a2, a'2" zwei einander gleich sind, eine der Grossen U, V, W ver- verschwindet, also zwei der Wurzeln der biquadratischen Gleichung einander gleich sind, und folglich ihre Discriminante verschwindet. Setzen wir noch A0) ay + */J = t>,. ud -j- ßy = w, so ist a0 (« -j- « + w) = »2, [die Summe der Producte der Wurzeln vonf(x,y) zu je zweien], TJ = v — w, . F = w — u, ¦ W= u — v, also 3 a0 u = a% — a'2, A1) 3aav = a2 —¦ a2, 3 aow = ft2 — ffj1'
§. 72. Covarianten. 233 Es sind also mit den Grossen a'2, a2, a'£ zugleich die u,v,w bekannt. Wenn man aber die Grossen «, v, w kennt, so ist die Lösung der biquadratischen Gleichung auf Quadratwurzeln zurückgeführt. Denn es ist aß -\- yd = u, aoaß.yS = ai und daraus Da man nun ebenso die Producte ccy, ccd, ßy, ßd bestimmen kann, so kann daraus a2 etwa aus aß . ay berechnet werden. Die Grossen a'2, a2, a2' sind aber, wie wir schon im vorigen Paragraphen gesehen haben, die Wurzeln der cubischen Gleichung A2) 0S — 3Ä0 JrB = 0. Dies ist wohl die einfachste Form, die man der cubischen Resolvente der biquadratischen Gleichung geben kann. §. 72. Die Covarianten. Wenn wir die Covariante E, nach §. 70, B) für die trans- formirte Form A) f(x, y) = bilden, so erhalten wir B) — E = 3 a? |* + 4 a\ a'2 g» n - F a\ a's — 4 ä*) g* ij» + 4a'8a'ggij* + 3o?ij*, und daraus folgt C) E + 4 «;/ = —• 3 « |2 - a'8 n*y. Es ist also diese Verbindung, von dem Factor — 3 ab- abgesehen, das Quadrat einer quadratischen Form, und dasselbe gilt, wenn wir a'2 durch a\, a'£ ersetzen. Wir setzen also zur Abkürzung
234 Fünfter Abschnitt. §. 72. lT+4a'/=—3>|. Von den drei Functionen ipt, i/>2, ip3 können keine zwei einen gemeinschaftlichen Theiler haben, wenn die Discriminante D von Null verschieden vorausgesetzt wird. Denn dann sind auch die drei Grossen a'2, a2, a2' von einander ver- verschieden. Wenn also i\>x und ty3 verschwinden, so müssen H und / verschwinden, d. h. ein gemeinsamer Theiler von ipt und ^2 müsste gemeinsamer Theiler von H und / sein. Nun war aber f ein beliebiger Lineartheiler von /. Dieser kann nach B) nur dann • Theiler von H sein, wenn a'3 = 0 ist, also wieder, wenn die Discriminante D verschwindet [§. 71, E)]. Nun ist die Functionaldeterminante T von / und H identisch mit der Functionaldeterminante von / und H -\- Xf, was auch X sein mag, und daraus ergiebt sich, wenn X = 4a'2 gesetzt wird: T=-\^\F (g) t\ fo) - F' (V) t\ (g)].. Es ist also T theilbar durch ijt-y, und aus gleichen Gründen durch ij>2 und ipz, und folglich ist T bis auf einen von |, v\ un- unabhängigen Factor identisch mit dem Product tyx $% i^3. Bilden wir demnach das Product der drei Gleichnngen D), so folgt mit Bücksicht auf die cubische Gleichung §. 71, A2), der die Grossen a'2, a2, a2' genügen: H3 — iSAHf — UBf = cTa, wo c eine noch zu bestimmende Constante ist. Nach §. 70, A6) bleibt c bei einer linearen Transformation ungeändert, und man findet also seinen Werth, wenn man aus der Normalform A), B) die Glieder mit der höchsten Potenz von | beiderseits einander gleich setzt, c = — 27. Wir haben also zwischen den Invarianten und Covarianten die folgende identische Relation E) Hz — 48 A Ef — 64 Bf = — 27 T2. Die Functionen ^, ij>2, i/>3 sind gleichfalls Covarianten, frei- freilich mit Coefficienten, die in den Coefficienten von / nicht ratio- rational sind. Wir können sie leicht durch die Wurzeln a, ß, <y, d von / = 0 ausdrücken. Setzt man zur Vereinfachung y = 1, so folgt nach §. 71, C) und F)
§. 72. Covarianten. - 235 tfi = «i I2 — a'z V2 _ „ (ß — y)(ß- S) (x — «)» - (« — y) (« - fl) (g - ft» -a° ^^Tß : Darin aber lässt sich <x — ß im Zähler und Nenner weg- wegheben, und man kann ^ in zwei Formen darstellen; um ip2 und ¦4>s zu erhalten, braucht man dann nur ß, y, 8 cyklisch zu ver- vertauschen. Man findet so: ^1 = (y - ß) (x - u) (x — d) — (a - 8) {x - ß) (x - y) = (8 — ß)(x — «) (x — y) — (a — y) (x - ß) (x - 8) F) h = (8-y)(x-a)(x—ß) — (a- ß) (x - y) (x - 8) = (ß — <y)(x— «) (x — 8) — (u — 8) (x — r)(x — ß) fl = (ß -8)(x-a) (x — y) — (a- y) (x - 8) (x - ß) = (y - 8) (x - u) (x — ß) — (a- ß) (x - 8) (x - y). Die Grossen tyf, ^22, ^32 kann man auffassen als die Wurzeln einer cubischen Gleichung, deren Coefficienten Covarianten sind. Man erhält diese Gleichung leicht aus D) in der Form Diese Gleichung ergiebt nach §.71, A2) und mit Benutzung des Ausdruckes E) für T2 G) s*- Es ist noch von Interesse, die Discriminante dieser Gleichung zu bilden. Man erhält sie am einfachsten aus dem Ausdruck wenn man die Ausdrücke D) einsetzt und dann für (a'2 — a'^J (a'z — a'g'J (a'ä — a'ä'J die Discriminante der Gleichung §. 71, A2) 27D^LS — .B2) = 36D setzt, wo dann D die Discriminante von / ist. Man erhält so (8) z/ = 212D/6.
236 ' Fünfter Abschnitt ' §. 73. §• 73. Das volle Invariantensystem der binären biquadratischen Form. Wir wollen noch beweisen, dass mit den Bildungen A, B das System der unabhängigen Invarianten der binären, biquadra- biquadratischen Form erschöpft ist. Während man sich aber gewöhnlich mit dem Nachweis begnügt, dass jede Invariante eine ganze ratio- rationale Function von A, B ist, wollen wir, wie wir es schon in §. 69 für die Covarianten der cubischen Form getban haben, auch die Frage nach den numerischen Coefficienten berühren, und hier zeigt sich eine neue Erscheinung. Die Invariante D z. B. ist zwar nach §. 70, A5) rational durch A, B ausgedrückt. Aber die Zahlencoefficienten sind nicht ganze Zahlen, sondern haben den Nenner 27, obwohl die Coeffi- Coefficienten in der entwickelten Function D alle ganze Zahlen sind. Wir betrachten also jetzt als ganze Invarianten ganze rationale homogene Functionen (tten Grades der fünf Veränder- Veränderlichen a0, au a2, a3, a4 A) I(a0, Ox, a2, a3, a4) = I(ä), deren Coefficienten ganze Zahlen sind, und denen die Inva- Invarianteneigenschaft B) I> = r^I zukommt, wenn V oder I(a') dieselbe Function der Coefficienten einer transformirten Function ist. Solche Invarianten sind A, B, D, zwischen denen die Rela- Relation besteht: C) 27 D= IA3 -B% und unser Ziel ist, zu beweisen, dass alle ganzen Invarianten ganze und ganzzahlige rationale Functionen von diesen dreien sind. Wenn wir die Function I' in der Normalform D) des §.71 bilden, so erhalten wir zunächst aus B), da r = 1 ist, I(a) = I @, äv «;, a's, 0), und diese Function I kann nur von a'2 und dem Product a\ a's abhängen; denn die Substitution
§. 73. Das volle Invariantensystem. 237 deren Determinante = 1 ist, lässt die Normalform §. 71, D) und in ihr a'2 ungeändert, während a\, a's in X2 a'v a's: A2 übergehen, und darin ist X eine -willkürliche Grosse. Wenn wir also «2 = S setzen, so ist D) 1=9 ((*>;,,«), wenn 95 eine ganze, rationale, ganzzahlige Function der beiden Argumente a\ a's und 0 ist. Nun ist aber nach §.71, E) 3 a\ a'a = 02 — A, und wenn wir also D) mit einer geeigneten Potenz von 3, etwa 3", multipliciren, so erhalten wir E) grI=1>(A,s), worin tp wieder eine ganzzahlige Function von A und 0 ist. Nach §. 71, A2) ist aber 0* = SA0 — B, und hiernach können wir alle höheren Potenzen von 0 durch die erste und zweite ausdrücken, erhalten also F) VI=%(A,B,0), worin % in Bezug auf 0 höchstens vom zweiten Grade ist. Die linke Seite von F) bleibt aber ungeändert, wenn 0 durch a'2, a'2, a'g', also durch drei verschiedene Wertbe, ersetzt wird, und folglich kann die Function % die Variable 0 überhaupt nicht mehr enthalten (§. 33, II). Es ist daher G) BVI=%(A,B), worin % eine ganzzahlige, ganze, rationale Function ist. Wenn wir in G) nach C) S2 = 1A3 — 27 B setzen, so folgt, dass G) eine der beiden folgenden Formen hat (8) BvI=<Z(A,B)y B$(A,I)), je nachdem der Grad von I gerade oder ungerade ist.
238 Fünfter Abschnitt. §. 73. Ist I eine ursprüngliche Function der a, d. h. eine solche, deren Zahlencoefficienten keinen gemeinsamen Theiler haben, so können die Coefficienten der Functionen <P jedenfalls keinen anderen gemeinschaftlichen Theiler haben, als eine Potenz von 3. Was uns zu beweisen obliegt, ist, dass sie alle durch 3r theilbar sind, oder was dasselbe ist, dass, wenn wir <5(^L, D) als ursprüngliche Function voraussetzen, v = 0 sein muss. Es ist also die Frage: Können aus der ursprünglichen Function <&(A, D) oder B<I>(A, D) Functionen mit dem Theiler 3 entstehen, wenn man die A, B, D durch ihre Ausdrücke in den a ersetzt? Da B ursprünglich ist, so kann nach §. 2 die in den a ausgedrückte Function 5$(i, D) nur dann den Theiler 3 haben, wenn ihn <£(A, D) hat. Also ist die Frage darauf zurückgeführt: Kann die ur- ursprüngliche Function <&(A, D), den Theiler 3 erhalten, wenn A, D durch ihre Ausdrücke ersetzt werden? Dass diese Frage verneint werden muss, können wir leicht so einsehen. Wir denken uns zunächst in 0 (A, D) alle die Glieder beseitigt, deren Coefficienten durch 3 theilbar sind; denn offenbar müssen auch die übrigen Glieder noch dieselbe Eigenschaft behalten, durch Substitution der Ausdrücke für A, D den Theiler 3 zu erhalten. Wir können zweitens annehmen, dass <&(A, D) nicht den Factor D hat, denn durch Weglassen dieses Factors würde nach dem schon erwähnten Satze (§. 2) die fragliche Eigenschaft nicht aufgehoben. Dann aber müsste aus 0 (A, D) eine durch 3 theilbare Zahl entstehen, wenn alle a, mit Ausnahme von a2, gleich Null, 02 = 1 gesetzt werden. Dadurch wird D = 0, A = 1, und es müsste also 0 A, 0) eine durch 3 theilbare Zahl sein; dies ist aber der Coefficient der höchsten Potenz von A in <3>(A, D), der nach Voraussetzung nicht durch 3 theilbar ist. Damit haben wir also bewiesen: Jede ganzzahlige Invariante der biquadratischen Form lässt sich rational und ganzzahlig durch A, B, D darstellen, und zwar in einer der beiden Formen
§. 73. Das volle Invariantensystem. 239 Dass auch umgekehrt jeder solche Ausdruck, wenn er in den Coefficienten a homogen ist, eine ganzzahlige Invariante darstellt, ist von selbst klar1). l) Die Theorie der Invarianten findet man ausführlich dargestellt in den Werken: Clebsch, „Theorie der binären algebraischen Formen". Leipzig 1872. Faä di Bruno, „Einleitung in die Theorie der binären Formen". Deutsch von Walter. Leipzig 1881. P. Gordan, „Vorlesungen über Invariantentheorie", herausgegeben von Kerschensteiner, Leipzig 1885. Vergl. auch Franz Meyer, „Bericht über den gegenwärtigen Stand der Invariautentheorie" im Jahresbericht der deutschen Mathematiker- Vereinigung 1890/91 (Berlin 1892). In Bezug auf die zuletzt behandelte Frage s. H.'Weber, „Zur Invariantentheorie". Göttinger Nachrichten 1893.
Sechster Abschnitt. Tschirnhausen-Transformation. §. 74. Die Hermite'sche Form der Tschirnhausen- Transformation. Wir haben im vierten Abschnitt den Grundgedanken der Tschirnhausen-Transformation schon kennen gelernt. Die Aufgabe war die, eine algebraische Gleichung wten Grades A) f{x) = aox» + dx"-1 -\ H an-ix + an = 0 durch eine Substitution (n — l)ten Grades B) y = «o -\- % x -f- «2 #2 -\- ¦ ¦ ¦ + an_i a;"-1 umzuformen, um in den willkürlichen Goefncienten a Mittel zu gewinnen, die Gleichung zu vereinfachen. Hermite hat dadurch, dass er der Substitution B) eine besondere Form gab, diese Aufgabe sehr vereinfacht und mit der Invariantentheorie in Verbindung gebracht1). Hermite benutzt dabei die Functionen /0, /i,/2 . . •/»—i, die uns schon früher beim Eliminationsproblem gute Dienste geleistet haben, durch die sich die Potenzen von x bis zur (n — l)ten rational ausdrücken lassen. Wir bezeichnen hier mit x eine Wurzel der Gleichung A), während unter t eine unbestimmte Veränderliche verstanden sein soll. Dann ist (wie im §. 4 und §. 46) J) Hei-mite, Sur quelques theoremes d'algebre et la resolution de l'equation du quatrieme degre, aus den Comptes rendus der Pariser Aka- Akademie besonders erschienen. Paris 1859.
§. 74. Hermite'sche Form d. Tschirnhausen-Transformation. 241 C) und /0 (#) = a0 /l (#) = «0 * + «1 D) /2(#) = ao#2 + Oi« -f a% fn_x{x) = ao^-1 + o^-2 + a2^-3 -| \- aM_! Wir nehmen nun die Substitution B) in der Form an E) y = 4- i/o (*) + <»_«/! (*)+ — +*i /»-2 (*) + <b/—i (*), worin die tn—ii tn—2 ¦ • • hi to <&e an Stelle der ex, getretenen unbestimmten Grossen, und nicht mit den Potenzen von t zu verwechseln sind. Es geht aber y aus dem Ausdruck C) hervor, wenn th durch 4 ersetzt wird. Bezeichnen wir durch das vor eine Function gesetzte Zeichen 8, dass die Summe über sämmtliche Wurzeln x der Gleichung A) zu nehmen ist, so^haben wir, wie im §. 46: 8 [/o OO] = na0 S[/,W] =(»1-1H! F) Slf2(x)] =(n-2)a2 8[fn-1(x)] = aM_!, also: G) S(y) = naot„-! -(-(»—l)a1i„_2H f- 2an_2*1 ein Ausdruck, der sich aus /' (f) ergiebt, wenn th durch t^ ersetzt wird [§. 46, D)]. Eliminiren wir mit Hülfe von G) die Variable tn—i aus E)i so folgt (8) y wenn E n ^ ; =/i - ) = t„-2 n — l n ¦Fo(*) + _l_ 2l w — 2 1 „_a =/„-i — — aB_1 = a0iC|-1 + a1a;''-2-| 1 /fr B1 0 + 1|1 /fr 7» so dass Weber, Algebra. I. -^q
242 Sechster Abschnitt. §. 75. A0) 8[Fo(x)] = 0, 8\Ft(x)] = 0,...S[F.-,(x)] = 0. Setzen wir nach C) A1) F(t, x) = /^- - - so geht die rechte Seite von (8) aus F(t, x) hervor durch die Ersetzung von V durch %. Nehmen wir von vornherein y in der Form A2) y — tn-2F0 (x) + *„_3 Fx (x) -| (- t0 Fn-2 (x) an, so ist die Gleichung A3) . 8(y) = 0 identisch befriedigt. Welchen Nutzen diese Form der Substitution gewährt, werden die nächsten Betrachtungen zeigen. §• 75. Invarianten-Eigenschaft der Tschirnhausen- Transformation. Es ist jetzt der Einfluss zu untersuchen, den eine lineare Transformation, der wir die Function f(x) unterwerfen, auf die Tschirnhausen-Transformation hat. Wir machen in f(x) die lineare Substitution wodurch wir erhalten so dass 95 (|) eine ganze rationale Function n ten Grades und 9(|) = 0 die durch A) transformirte Gleichung f(x) = 0 ist. Wir leiten nun eine Function 0 (r, |) ganz in derselben Weise aus 95 (!) ab, wie wir im vorigen Paragraphen F(t, x) aus f(x) abgeleitet haben, nämlich worin t ebenso wie t eine Variable ist und die Functionen <&0 (!), <&j (!) . . . <&„_2(!), ebenso aus ! und den Coefficienten
§. 75. Invarianten-Eigenschaft. 243 von (jp (|) gebildet sind, wie die entsprechenden Functionen Fo (x), F-l (x) . . . Fn-2 (x) aus x und den Coefficienten von f(x). Wenn wir nun andererseits in F(t, x) gleichzeitig mit der Substitution A) die Substitution ausführen, so erhalten wir E) Cy*+ *)"/(*) = vto. F) (yl + *)(y* + *)(*-*) = r(r-|), und, indem wir von E) die Ableitung, am einfachsten durch Differentiation mittelst der Formel ät__ . r dx ~~ (yx -\- §y bilden, G) r (y x + df-1 \f (*) = (y v + d) I 9> (t) - y q> (r). Aus E), F) und G) folgt = ^ („ + v und durch Subtraction beider Formeln r \ ) t — | n also (8) oder, ausführlicher geschrieben (9) «—" ©o + *"-8 ® "Wir setzen nun, indem wir in F(t, x) die Potenzen ik durch beliebige Variable % ersetzen und ebenso in <&(t, |) th durch th, so dass die Substitutionen der Tschirnhausen-Transformation A1) y = Y(t, x), y=H(T, |) lauten [§. 74, A2)], 16*
244 Sechster Abschnitt. §. 75. Die Gleichung (9), die in Bezug auf % identisch ist, bleibt aber auch richtig, wenn nach Ausführung der angedeuteten Potenzirung rechts zh durch rft ersetzt wird, und sie lehrt also, dass zwischen den Functionen Y(t, x), H(r, §) die Relation besteht A2) H(r, |) = r Y(t, x), wenn wir die t von den % in folgender Weise abhängen lassen: Man setze ^«-2 = («r -j- jS)«-^ und ersetze nach Ausführung der Potenzen th durch vh. Es sei nun s eine beliebige Veränderliche, und wir multi- pliciren, ehe wir die Potenzirungen in A3) ausführen, diese Gleichungen der Reihe nach mit dann bekommen wir links eine ganze rationale Function von s vom (n — 2)ten Grade A4) T(e) = tn_2 — (n- 2) *„_8 e und die rechte Seite ergiebt nach dem binomischen Satze [(« + ß) — Hr* + <J)]M-2 = [*(« - v*) + (ß- was, wenn wir setzen, in übergeht. "Wenn wir hierin die Potenz (r — £)re~2 nach dem bino- binomischen Satze ausführen, und dann rh durch tk ersetzen, so erhalten wir eine Umformung der Function T (s). "Wir setzen also und erhalten die identische Umformung
§. 76. Der Hermite'sche Satz. 245 A6) (y t + *)-« T worin der Zusammenhang zwischen den Coefficienten £ und r durch die symbolischen Gleichungen A3) ausgedrückt, also der- derselbe ist, wie in den Functionen Y und H. Es ist also hiernach r"-2®(£) die Umformung der Function {yt, -f- dI»-2 T(,s) durch dieselbe lineare Sub- Substitution, durch die (y% -\- $)nf(ß) in <p(£) übergeht. Bezeichnen wir die Coefficienten dieser umgeformten Func- Function, also die Grossen rn~ 2vk mit tf, so ergiebt die Gleichung A2), die in Bezug auf % linear ist, A7) S(t', g) = t—i T(t, x). Aus Y(t, x) gehen nun n Functionen hervor, wenn man für x die n "Wurzeln von f(x) setzt. Jede homogene rationale symmetrische Function dieser n Functionen ist rational durch die Coefficienten von f{x) ausdrückbar, und wenn wir also eine solche Function mit K(t, a) bezeichnen, so ergiebt die Gleichung A7), wenn wir die Coefficienten von q> (§) mit a' bezeichnen, A8) K(f,a') = r*<n-»K(t,a% wenn v den Grad der symmetrischen Function bedeutet. Damit ist der schöne Satz von Hermite bewiesen: Die Coefficienten in der durch die Tschirnhausen- Transformation y = Y(t, x) umgeformten Gleichung f(x) = 0 und alle symme- symmetrischen Functionen der n Werthe y sind simultane Invarianten der beiden Functionen §• 76. Ausführungen über den Hermite'schen Satz. Durch die Betrachtungen des letzten Paragraphen hat sich ergeben, dass, wenn wir A) y = tn-iFo(x) -f- tn_sF,(x) \-t0Fn_2(x) setzen, die symmetrischen Functionen der n Werthe yu y2 . . . yn, die man aus y erhält, wenn man für x die n Wurzeln von
246 Sechster Abschnitt. §. 76. f(x) = 0 setzt, simultane Invarianten von zwei Formen wten und (n — 2)ten Grades, f(g), T{z) sind. Eine solche ganze rationale und homogene symmetrische Function vtea Grades P (Mi, y* • ¦ ¦ y») ist wegen A) offenbar eine homogene Function vten Grades der Variablen t. Sie ist ebenso eine homogene Function vten Grades in den a, da der Ausdruck A), wie er die a explicite enthält, linear ist, und da die symmetrischen Functionen der x nur von den Verhältnissen at: a0, a2: «0, . . . an: a0 abhängen. Bei dem Ausdruck von P durch die a könnte aber möglicherweise eine Potenz von a0 im Nenner bleiben, und wir haben noch nachzu- nachzuweisen, dass dies nicht eintritt. Setzen wir und bestimmen die Potenz a* so, dass K(t, a) eine ganze Func- Function der a ist, aber für a0 = 0 nicht mehr verschwindet, so wird folgen, dass % = 0 sein muss, wenn wir nachweisen, dass für a0 = 0 die sämmtlichen y endliche Werthe behalten. Wenn wir a0 = 0 werden lassen, während die übrigen a ungeändert bleiben, so wird eine der Wurzeln x, wie wir im §. 44 gesehen haben, unendlich wachsen. Dass aber das zugehörige y gleichwohl endlich bleibt, ergiebt sich aus der in Bezug auf t identischen Gleichung §. 74, A1) B) rZ~ - \f® = ^Foix) + t»sF1(x)+~-+Fn-2(x), aus der zu ersehen ist, dass, wenn a0 = 0 und x unendlich wird, die Functionen F0(x), F^x) .. . Fn-a(x) gleich den Coefficienten von /'(*), also gleich n — 1 1 0, — Ox..., --«.-! werden. Es bleiben also auch die y endlich, und P (yt, y2 . . . yn) ist gleich einer ganzen rationalen Invariante vom Grade v sowohl in den t als in den a. Wenn wir also die Gleichung für y in der Form annehmen: C) r + Piir-* + p*r~'-\ h-?» = o> so ist P» eine solche Invariante vten Grades.
§. 76. Transformation der oubisohen Gleichung. 247 Eine Invariante vom Grade n (n — 1) ist auch die Discri- minante d der Gleichung C), oder das Quadrat des Differenzen- productes D) n = (y, — y2) {y, — yt) ¦ ¦ • (lf> — y») • • • Um über die Bildung dieser Grosse näheren Aufschluss zu bekommen, erinnern wir uns, dass wir y erhalten, wenn wir in t — x n P durch tic ersetzen. Wir erhalten also y^ — y2 aus der Formel E) * - y, = & - *) wenn wir dieselbe Vertauschung machen. Der Quotient /@ (* — Xi) (t — Xh) ist eine ganze rationale Function von t vom Grade n — 2. Er- Ersetzen wir darin V durch th, so möge er in tith übergehen; wir haben dann F) yi — yh — (%i — xh)tijk. Wenn wir also G) a«-^& = t1,2t1,B.-.t1,n t%,Z • • • t%n tn—l,n setzen, so ist & eine homogene ganze Function vom Grade x/2 n (ti — 1) in Bezug auf die t, und sie ist ausserdem als sym- symmetrische Function der x rational durch die Coefficienten a dar- darstellbar. Aus F) folgt aber, wenn D, wie im §. 50, C) die Discri- minante von fix) bedeutet, (8) J z= D ®\ woraus zu schliessen ist, dass & eine Invariante ist, die den Nenner a0 nicht mehr enthält, z/ ist in den Coefficienten a vom Grade n (n — 1), während D nach §. 50 vom Grade 2 n — 2 ist; daraus folgt, dass & vom Grade ]/s (n — 1) (n — 2) in den Coefficienten a ist. & ist eine sogenannte zerlegbare Form 1/2 n (n — l)ten Grades in den Variablen t; denn sie lässt sich nach G) in lauter
248 Sechster Abschnitt. §. 77. lineare Factoren zerlegen, die freilich nicht rational in den a sind. Wir haben schon im §. 58 darauf hingewiesen, dass bei der Tschirnhausen-Transformation auch x rational durch y ausdrückbar ist; und dasselbe gilt also auch für jede rationale Function von x. Betrachten wir irgend eine solche Function cp (x), die auch noch die Coefficienten a und t enthalten kann, aber immer für beide Arten von Variablen ganz und homogen vorausgesetzt sei, so können wir setzen (9) <p (x) = Co + C\ y -f- C, yi -\ + O.-i yn~\ worin die Co, Q,... Cn—i rational in a und in t ausdrückbar sind. Stellen wir die Gleichung (9) für x = «x, x% . . . xn, y = yu y2, . . . yn auf, so erhalten wir für die Bestimmung der C ein System linearer Gleichungen, dessen Determinante A0) also gleich &]/D ist. Der Zähler des Ausdruckes für Cr geht aus der Determinante A0) hervor, indem man die Elemente der (v -f- l)ten Colonne durch q>(x^), cp(x2) . . . 'cp(x„) ersetzt, und folglich hat der Zähler, wenn man Alles durch die xt ausdrückt, den Factor VD (weil er verschwindet, wenn zwei Xi einander gleich werden). Wir können also setzen 1, 1, 1, 2/i, 2/2, 2/«, yl- yl- yl. ¦ • y\ ¦ ¦yl ¦ -r ~i —i —i worin Qv eine ganze rationale Function der t und der a ist, die höchstens noch eine Potenz von a0 im Nenner enthalten kann. Wir bekommen dann A1) 0<p(x)=Qo+ Qiy+ Q2y* ^ f- Qn-ir-1- Die Coefficienten Qv sind aber keine Invarianten und ihre Berechnung ist in den meisten Fällen schwierig. §• 77. Transformation der cubischen Gleichung. Der Hermite'sche Satz (§. 75) reicht für die cubische Glei- Gleichung aus, die Transformation ohne weitere Rechnung auszuführen
§. 77. Cubisehe Gleichung. 249 Wir haben dazu, wenn wir homogene Variable gL, zs2 an- anwenden, simultane Invarianten der cubischen Form A) /fa, ga) = a0g? -f ax g*ga -\- a2 g: e* -f a3 4 und der Linearform B) T= — toe1 + t1ea zu bilden. Wenn wir aber die lineare Substitution auf T anwenden, so ergiebt sich — «0^-1-^*2 = — f0 z\ + fj /2, wenn 1 = 14«- *ir, *i = — *o 0 + *i Ö, oder ^o = r*; + <H'o. Diese Substitution geht aus C) hervor, wenn man glt ga, g'1, g"a durch rt„ rt0, Hv t'o ersetzt. Wenn nun I(a, tu t0) eine simultane Invariante von / und T ist, homogen und vom vten Grade in t0, ^ und vom Gewicht l, also l(a\fv fo) = ril(a, <x, U so folgt durch diese Vertauschung J(a', z\, 0'2) = r*-*I(a, ^, *), d. h. es ist J(a, ^x, ^2) eine Covariante von /. Man erhält also alle simultanen Invarianten von f und Taus den Covarianten von/, wenn man darin glt s^ durch tx, t0 ersetzt. Die Covarianten von / haben wir aber in §. 68, 69 voll- vollständig kennen gelernt. Danach ist es leicht, die cubische Gleichung zu bilden, die sich aus der Substitution §. 74, A2) E) y = t für y ergiebt. Schreiben wir die Gleichung in der Form 2/3 + P22/ + P8= 0, so sind P2, P8 Covarianten von /, und zwar P2 von der zweiten, P3 von der dritten Ordnung, sowohl in t als in a.
250 Sechster Abschnitt. §. 77. Da nun P2 und P3 Covarianten der cubischen Form sind, so können sie sich nach §. 68 und 69 von den beiden dort defi- nirten Functionen H(tut0), Qfat,,) nur um constante, d. h. numerische Factoren unterscheiden. Diese constanten Factoren lassen sich durch irgend eine specielle Annahme bestimmen. Wir können z. B. annehmen *! = 1, t0 = 0, a0 = 1, % = 0, dann wird y ¦= x, also P2 = a2, X3 = 0S3. Andererseits ergiebt sich aber nach den im §. 68 gegebenen Formeln B), C), G) für diese besondere Annahme #(l,.0) = 3a2, 0A,0) = 27 a,, woraus man allgemein schliesst P2 = I H (tu «,), P3 = ^ Q ft, U so dass wir für y die cubische Gleichung erhalten F) y* + \ s&> *o)y + ^ oft, A>) = 0. Die Discriminante d dieser cubischen Gleichung ist also mit Anwendung der Relation §. 68, A2) G) 8 Q2 " (8) wenn D die Discriminante der gegebenen cubischen Gleichung ist, in Uebereinstimmung mit den allgemeinen Resultaten des vorigen Paragraphen. Wollen wir hierauf die Auflösung der cubischen Gleichung gründen, so müssen wir zunächst nach den Vorschriften des vorigen Paragraphen x rational durch y darstellen. Wir setzen (9) ao/ft, t0) x = Qo -\- Ql y + Q2 y\ Die Berechnung der Coefficienten Q ist leicht auszuführen, wenn man diese Gleichung für x1} xs, a;3, und entsprechend yu Vi, V% aufstellt.
§. 77. Cubische Gleichung. 251 Wir wollen über den Gang der Rechnung, die nur die Dar- Darstellung symmetrischer Functionen der Wurzeln einer cubischen Gleichung durch die Coefficienten nach den Vorschriften des vierten Abschnittes (§. 48, 49) erfordert, einige Andeutungen machen. Nimmt man zunächst die Summe der drei Gleichungen (9), so erhält man nach F) 3 Qo = | H&, t0) Q, — ax/&, *0), so dass also nur noch Q1 und Q^ berechnet zu werden brauchen; diese findet man, wenn man die für x = x1 gebildete Gleichung (9) mit 2/2 — 2/s = «o (%% — Xt) (*i — *o «i) und mit multiplicirt, und die drei durch cyklische Vertauschung der In- dices 1, 2, 3 gebildeten analogen Gleichungen addirt. Man hat dann nur Gebrauch zu machen von den Formeln - x.) = und findet so Setzen wir zur Vereinfachung tx = t, t0 = 1, gehen also zu den inhomogenen Ausdrücken über, so ergiebt sich A0) Ca0x + ad/(«) = -|fi(*) + yf (*) - 3y», während die Gleichung für y lautet A1) tJr\^ wenn wir S(t), Q(t) für H(t, 1), Q(t, 1) setzen. Um nun die cubische Gleichung zu lösen, bestimmen wir t aus der quadratischen Gleichung Hit) = 0.
252 Sechster Abschnitt. §. 77. Wir wollen für den Augenblick zur Abkürzung A2) q = ]/— 3D setzen; dann folgt aus G) A3) Q = 3 Qf(t), und aus A1) und der Ausdruck A0) ergiebt A5) C a0 x + at) /(«) = y/':(«) — 3 ^. Um die Uebereinstimmung dieses Resultats mit der Car- danisehen Formel herzuleiten, gehen wir auf den §.68 zurück, und setzen in den dortigen Formeln x = t, y = 1. Wegen A3) wird, nach §. 68, A1), A3) n — o, und folglich 2Äot-\- Ä! = — q, £ = — hQ, ferner nach §. 68, A0) /(*) = f8, /'(*) = 3 £2f, worin |' = hA0 nach §. 68, A3) die Ableitung von | nach t ist, Danach folgt aus A4) y und aus A5) Baox + a, = — oder nach §. 68, A4) A6) 3 a0 x -+- ax = worin nach §. 68, A5) Nehmen wir a0 = 1, ax = 0 an, so erhalten wir aus A6) die Cardanische Formel (§. 38)
§. 78. Allgemeine Ausführung der Transformation. 253 §. 78. Allgemeine Ausführung der Transformation. In der allgemeinen Durchführung der Tschirnhausen-Trans- Tschirnhausen-Transformation in der Hermite'schen Form können wir noch einen bedeutenden Schritt weiter gehen. Wir betrachten zunächst die allgemeine Substitution §. 74, E) A) y = U-l /o + tn-2 /i + t»-t /„ H V «b/.-l, aus der wir die speciellere Form §. 74 A2) erhalten, wenn wir die Variablen t an die eine lineare Bedingung B) S(y) = naotn-i -f- (» — 1)M„_2 -\ (- an-itü — 0 binden, was aber fürs Erste noch nicht geschehen soll. Durch die Functionen /0, /i, f2 . . . /„_i lassen sich nach §. 74, D) alle Potenzen von x und also auch alle rationalen Functionen von x linear und homogen darstellen. Wenn wir diese Darstellung für die verschiedenen Potenzen Ton y finden können, so lässt sich durch Elimination der f{ die Gleichung wten Grades für y bilden. Denselben Zweck erreichen wir aber noch einfacher, wenn wir die » Producte yfs linear durch die / darstellen. Denn wenn wir die Gleichungen haben C) yf. = E0,sf0 + £i,s/i + E2,sf2 -] 1- En-liSfn-i s = 0, 1, 2 ...» — 1, so erhalten wir durch Elimination von /0, /x . . . fn_1 aus dem System C) Eo, 0 y-i E\, o, i?2, 0 • • . En—1, 0 Eo>l5 -Ei,! — y, E2,i ... En-itl D) E = = 0, E0,n—li Eitn — i, E2,n—1 • • • En — i,n — l — V also eine Gleichung wten Grades für y, die die gesuchte trans- formirte Gleichung ist. Alles ist daher zurückgeführt auf die Bestimmung der Coefficienten Er>s, die, wie aus A) hervorgeht, jedenfalls lineare Functionen der Variablen t sind. Insbesondere-ist E) J&o, 0 == a0 ^n—1) E\t o = <Z<>tn — 2> • • • En — 1,0 = dota. Um die übrigen E zu berechnen, bemerken wir, dass nach der Definition §. 74, D) zwischen den Functionen / die folgenden Relationen bestehen:
254 Sechster Abschnitt. §. 78. xfo = /i — «i S/i = /« — «2 F) . . . . ¦ #/» — 2 /» —1 «» — 1 %Jn — 1 == *»i Ton denen die letzte eine Folge der Gleichung f(x) = 0 ist. Wenn wir nun die Reihe der Variablen t0, tx . .. tn-\ fort- fortsetzen, indem wir die neuen Variablen t„, tn + 1, tn + 2 . . . durch folgende Gleichungen definiren a0tn -f- a-L tn—i -f- a2tn-2 -{-••• -\- ant0 = 0, G) *o^» + l ~~\~ al tn -\~ a2^n — i -f- ••'-)- *n^l = 0, a0 4+2 + «i*»+i + »2*» + • • • + anh = 0, so erhalten wir, wenn wir die Gleichungen F) der Reihe nach mit t„—i, £„_ 2 . . . t0 multipliciren und addiren, (8) xy = tn/, + tn-!/H h <i /.-i, und wenn wir nun F) ebenso mit tm tn—-y . . . tx multipliciren, nach (8) afly = tn+1f0 + tnfx-\ 1- «,/._!. So ergiebt sich das folgende System y = tn-i /o + tn-2 /i + • • • + t0 fn-! xy = tn /o + *»-i fi~\ h h fn-i (9) und wenn wir diese Gleichungen wieder mit as, a«_i • ¦ • multipliciren und addiren, so folgt der gesuchte Ausdruck yfs = Eo,efo + El,*fl + • * • + -E"»-l,s/»-D worin nach G) = *s + l^n — 2 * " * — Clnts—1 s —2 "P %4 ttt A0) jE"s-1)S = «o*» + -Ss, s ==: *0^n —1 -j~ Es + itS= a0t„—2 -f- — i,g=
§. 79. Die Bizoutiante. 255 Hierzu ist noch zu bemerken, dass die überzählig eingeführten Variabein tm tn+1 ... in der zweiten Form von Eo,„ E1<s... Es^1>s bereits wieder eliminirt sind, und dass die Variable tn-\ nur in jE1,,, 5 vorkommt. §• 79. ¦ Die Bezoutiante. Die Gleichung D) des vorigen Paragraphen wird, entwickelt, die Gestalt haben yn _|_ pir-! _J_ P2yn-2 _| f- P, = 0, oder wenn wir £„_! so bestimmen, dass S(y) = 0 wird, (i) sr + Psy-M \-p» = o; darin ist dann — 2Pa = 8(y») eine Function zweiten Grades in Bezug auf die t und in Bezug auf die a. Diese Function ist für viele Anwendungen besonders wichtig und hat von Sylvester den Namen Bezoutiante der Function f(x) erhalten, zu Ehren des französischen Mathe- Mathematikers Bezout, der schon im vorigen Jahrhundert die ersten richtigen Ausführungen über Elimination gegeben hat1). Nach den Formeln des letzten Paragraphen lässt sich diese Function verhältnissmässig einfach berechnen. Wir führeu zu- zunächst neben den Variablen i„_j, £„_2 . . . t0 noch ein zweites System davon unabhängiger Variabein rn_1; r„_2 . . . t0 ein und setzen /2\ y — *»-i/o + t»-afi +¦•••+ tofn-i > z =. r„-i/0 + ^»-2/1 ~\ h *o/»-i- Statt nun 8(y2) zu bilden, berechnen wir zunächst S(y#), woraus dann S(t/2) hervorgeht, wenn man die x gleich den t setzt. Wenn man die Formel C) des vorigen Paragraphen C) yfs = Eo,sfo + E^f, j h En-^fn-, mit rn_s_j multiplicirt und dann in Bezug auf s von 0 bis n — 1 summirt, so findet man D) y*=fo 2 JKo,.r«-.-i 0,n — 1 s s l £ El,sTn — s-l -\~ ' ' ' ~H /»—1 "^ -E"n-l,s^»-s-l- 0,» —1 0,» — 1 J) Sylvester, On a theory of the syzygetic relations of two rational integral fonctions etc. Phil, transactions vol. 143 A853).
256 Sechster Abschnitt. §. 79. Nun ist nach §. 74, F) Sfo = na0, ä/j = (n — 1) al5 . . . Sfn-i = a„_j, so dass man erhält o , 0,» —1 s -\- (n—l) dx 2 jE'liSrn_s_1 o,» —i . 0,»—1 Hierin ist nun der Coefficient von r„_i na0E0,0 + (» — 1) «i-Ei.o + •••'+ ¦also nach C) Da nun S(^) mit dem Gliede waor„_i anfängt, so wird in der Differenz E) 8(jfg) - \ 8(y) S(g) kein Glied vorkommen, das mit r„_j multiplicirt ist. Da dieser Ausdruck aber ausserdem in Bezug auf t und r symmetrisch ist, so enthält er auch nicht £»_i, uud wir körinen bei seiner Bildung einfach tn—-y und t„—1 = 0 annehmen. Wir setzen nun S(y) = naotn-! + <p(t), worin F) <p(f) = (»— 1H^^-2 + (w — 2)a2tf„_3 -| (- an_i*o. Dann wird G) I 1,»—1 1,»—1 + a„_! Z1 jE„_i,s r„_s_j — — (p (t) <p (r), l,n—1 ** wobei jedoch zu bemerken ist, dass £„_i = 0 anzunehmen, also zu setzen ist, während die übrigen E durch die Formeln A0) des vorigen Paragraphen bestimmt sind.
§. 79. Die Bezoutiante. 257 Der Ausdruck auf der rechten Seite von G) ist eine bi- lineare Function der t und r; er möge entwickelt die Form haben 0,n— 2 0,M —2 mit der Bedingung Bn,k = Bk,h- Die Bezoutiante ergiebt sich dann, wenn man t = t setzt, also (8) B = 2 B^ktjtfa, 0,n— 2 worin die Coefficienten J9Ä>S quadratische Functionen der a sind; und aus G) folgt (9) Sine) - \ S(y) 8(e) = 2? J?»,» ferh A0) 5(y») = \ [8(y)f + 5. Nach der Formel (8), §. 74 ist V—\ 8C/) = tn-sFo + k_8J?\ -| f- IV und wenn wir beides multipliciren, yz - ~ [yS@) + ,8C,)] + ^ 5(y) 8(*) h,k 0,» —2 Summiren wir diese Formel über alle Wurzeln #, d. h. nehmen wir die mit S bezeichnete Summe, so folgt 8(ffg) — i SCj) 8@) = 2; und die Vergleichung mit (9) lehrt: Wir bezeichnen mit d die Determinante der Function B, setzen also ^=^± -Bo, 0^1,1 ¦ • • -B»— 2,» —2- Nach dem Multiplicationssatze der Determinanten und mit Rücksicht auf die Formeln [§. 74, A0)]: SF0 = 0, SJ\ = 0, . . . S'FM_ä = 0 Weber, Algebra. I. jy
258 Sechster Abschnitt. §.79. ist aber, wenn wir 1, -F„Oi)> J\(*i) • • • Fn_2(x1) 0 = 1, F0(xn), F, ( setzen, nach A1) A2) 0>2 = Beachtet man nun die Ausdrücke (9) in §. 74 für die Func- tionen Fo, Fx . . . Fn_2, so ergiebt sich leicht nach dem Satze, dass man in einer Determinante eine mit einem beliebigen Factor multiplicirte Colonne zu einer anderen Colonne addiren kann (§. 25, VII), für 0 der Ausdruck 1, x.2, xl 1, Hier- Hierdessen Quadrat nach §. 50 die Discriminante von f(x) ist. nach haben wir also nach A2) den wichtigen Satz: Die Determinante der Bezoutiante von fix) ist der »te Theil der Discriminante von f(x). Die Berechnung der Bezoutiante hat nach unseren Formeln gar keine Schwierigkeit mehr und gestaltet sich ziemlich einfach. Für n = 3 erhält man das schon aus der Formel F) des §. 77 zu schliessende Resultat . B = — jH (tu t0). Für die Berechnung der Bezoutiante der biquadratischen Form wollen wir zur Veranschaulichung des Vorhergehenden das Formelsystem vollständig aufführen, indem wir die Durch- Durchführung der wenig längeren Rechnung für die Form fünften Grades dem Leser überlassen. Es ist für die Form vierten Grades nach G) und §. 78, A0) f(x) — a0 xi -j- ax x* -f- a2 «2 -&2,1 == ö0 ^2 ~P "] ^1 -^3,1 —~ Ö^O ^1 H^ ^1 ^0 a% x -f- a4 2a2
§• 79. Die Bezoutiante. 259 -^0,2 -E"l,2 -^2,2 -E"?„2 -E"o,3 #1,3 -^2,3 -^3,3 = — % t.2 — % £j = % £j % #o = % £2 ~f~ a2 h = !¦ %^2 + % ^1 "= % &2 = — %«! = %A) = % 4 ~f" CB ^] + % t,) + %^0 4«0 tx 3 % ti 2%rx %rx 4%r0 3% r0 2%r0 %r0. Man hat diese Ausdrücke mit den rechts daneben gesetzten Factoren zu multipliciren und zu addiren, dann noch — i 9 (*) <P @ 2 % <! -j- % <0) C % t2 ~\- 2 % rx -}- % r0) hinzuzufügen und die Coefficienten von rÄ^ aufzusuchen. So eEgiebt sich: J92,2 = — j(8o0a2 — 3%2), 5o,i = —-^ l _ .9 Ti J- — ^c A4) i?i;i = — 4 a0 «4 — 2 % «3+%,2> 2?i,2 = ^0,0=^ — -j (8 % «4 — 3 %2), J30,2 = — -j A6 % «4 — % %j). Auf dieselbe Weise kann man bei einer Form fünften Grades verfahren, und findet für die Coefficienten der Bezoutiante fol- folgende Ausdrücke: — 10% c% = 6a| — 5 B3j3 = 5J?o,i = 5 2?o,2 = 5 j?o,3 = X B O -£>1,2 5 #1,3 = 5BM = 3% a 2 a.2 a 2%a 3%a 4 15%% 4 — 20 % a3 4 — 25 % % 3 — 10 Qj\ &$ — Zv Ct>Q Ü 3 — 20 % % 2 — 15%%. 17*
260 Sechster Abschnitt. §. 80. §• 80. Transformation der Gleichung fünften Grades. Diese Entwickelungen sollen nun angewandt werden, um die Transformation der Gleichung fünften Grades, wie wir sie im §. 60 skizzirt haben, durchzuführen. Es lässt sich auf unendlich viele Arten ein Werthsystem *o> *i> ^2) h so bestimmen, dass die Bezoutiante B verschwindet; im Allgemeinen ist dazu die Auflösung einer quadratischen Gleichung erforderlich. Wir können z. B. t2 — 0, tz = 0 setzen und das Verhältniss t0: tt aus der quadratischen Gleichung Bo,ot;- + 2 £0,1*0*1 + £1,1^ = 0 bestimmen. Diese Werthe von t enthalten dann die Quadrat- Quadratwurzel . Statt dessen kann man aber auch andere Bestimmungen treffen und bekommt andere und andere Quadratwurzeln. In der Aus- Auswahl dieser Quadratwurzel liegt etwas Willkürliches und Un- Unbestimmtes. Wir greifen unter diesen verschiedenen Bestimmungsweisen eine heraus und transformiren damit die gegebene Gleichung fünften Grades in eine Hauptgleichung, d. h. in eine solche, in der die dritte und vierte Potenz der Unbekannten nicht vor- vorkommt, oder wir nehmen an, nach F. Klein's Vorgang, die zu transformirende Gleichung sei von Haus aus eine Haupt- gleichung A) f(x) = aox» + «3x* ~\- aAx -\- «5 = 0. Wir wollen aber noch ausdrücklich hervorheben, dass nach §. 76, (8) durch diese vorläufige Tschirnhausen - Transformation die Discriminante der gegebenen Gleichung nur um einen Factor ®2 geändert wird, worin ® rational von den angewandten t, also auch von der zu ihrer Bestimmung benutzten Quadratwurzel abhängt. Unter der Voraussetzung A) werden nun die Coefficienten der Bezoutiante nach den Formeln des vorigen Paragraphen folgende:
§. SO. Hauptgleichung fünften Grades. 261 5 i?o,o = 4a| — 10 «3 «5, 5J90,i = Sa3a4 5 J91;i = 6 a|, 5 J3o,2 = 0 B) 5J92,2 = — 20a0a4, öB0,s = — 25ao«r, 5J93,3 = 0, 5J51B = — 25a0a3 5J9i>s = — 20a0a4, 5J92,3 = — 15 aoa3. Wenn man hieraus die Determinante berechnet, so erhält man ohne Schwierigkeit nach §. 79, A2) für die Discriminante der Hauptgleichung fünften Grades C) D = a08 E*a<}a£ -f- 28a0o? + 225Oaoa33a4a^ — 1600 a0 «s a|a8 -f- 108a35a6 — 27a34a|). Da nun hier J9S,3 = 0 ist, so haben wir ein Werthsystem der t, wofür die Bezoutiante verschwindet, nämlich t0 = 0, tx = 0, i2 = 0. Wir nehmen nun unsere Tschirnhausen - Substitution in fol- folgender Form [§. 74, A2)] D) y = tzF0 + t2 («ä J\ +ßlF2 + «0 i^3), und wollen über die «0, «l5 k.2 so verfügen, dass die Gleichung fünften Grades für y unabhängig von tz, t2 zu einer Haupt- Hauptgleichung wird, dass also S (j/2) identisch für alle t2, ts ver- verschwindet. Da S (Ff) = J53K hier verschwindet, so geschieht dieser Forderung nach §. 79, A1) Genüge, wenn wir «0, ax, «2 so bestimmen, dass E) «(fJ?M + alJB1|i + «lAa -[- 2 cs0 «i -Bo,i + 2 «0 «2 J90!2 + 2 «! «2 J?i,2 = 0, F) a0 JB0,b -\- «i J5i,3 + «2 -22,3 = 0. Diese Gleichungen führen durch Elimination von einer der drei Grossen « auf eine quadratische Gleichung für das Ver- hältniss der beiden anderen. An sich ist es nicht nothwendig, irgend einen besonderen Fall auszuschliessen, auch nicht den, dass JB0,s, 2?i,8, J?2,3 alle drei verschwinden; man hätte dann nur für die « irgend eine Lösung der Gleichung E) zu nehmen. Um aber nicht weitläufig zu sein, wollen wir annehmen, dass 2?o,3 von Null verschieden sei, weil die hierdurch aus- ausgeschlossenen Fälle, in denen eine Wurzel der gegebenen Glei- Gleichung Null oder unendlich wird, hier eigentlich kein Interesse bieten, weil sie auf eine Gleichung niedrigeren Grades zurück- zurückkommen. Die Behandlung bleibt übrigens ganz dieselbe, wenn
262 Sechster Abschnitt. §• 80. (8) wir annehmen, dass eine andere von den drei Grossen B0,s,Bi.$-, 2?2,s Ton Null verschieden ist. Um nun die Gleichungen E), F) in symmetrischer Weise zu behandeln und namentlich zu erkennen, welche Quadratwurzel zu ihrer Lösung erfordert wird, verfahren wir so. Wir setzen zur Abkürzung #0 = «0-^0,0 ~\~ al#0,l ~\~ «2 #0,2 G) J5j = «0J9lj0 + «i#i,i + «2 #1,2 B2 = «0J92i0 -\- KyB^l -\~ #2#2,2- Dann können wir die Gleichungen E) und F) so darstellen: cco#o + «i#i +«j#2 =0 «0 #0,3 + «1#1,3 + «2#2,3 = 0. Wir multipliciren die zweite mit einem unbestimmten Factor «., und addiren sie zur ersten, wodurch wir erhalten eine Gleichung, die erfüllt ist, wenn wir setzen Bo + «3 J90,3 = 0 #2 ~j~ a3#2,3 = ÖOCj. Aus diesen drei Gleichungen, in Verbindung mit der Gleichung F), haben wir die Unbekannten «0, csx, cs2, «3, ö zu bestimmen. Wir setzen die Gleichungen zunächst ausführlich hierher: «0#0,0 + «l#0,l + «2 #0,2 . +«3 #0,3 = 0 ' «0J92,0 + «j(_B2,l + ö) + «2 #2,2 • + C-3#2,8 = 0 a0 #8,0 ~|- Kl#8,l -f- ai#3,2 ¦ = 0) und wenn wir hieraus «0, ux, a2, «3 elimiuiren, so ergiebt sich eine quadratische Gleichung für 6, nach deren Lösung man die Verhältnisse «0: ax : «2: «8 aus linearen Gleichungen bestimmen kann. Die quadratische Gleichung für tf aber lautet in Deter- Determinantenform #0,0) #0,li #0,2) #1,0) #1,1) #1,2 #2,0) #2,1 + 6) #2,2) #3,0) #8,1) -#3,2) #0,3 #2,3 = o.
.§. 81. Normalform der Gleichung fünften Grades. 263 Da sich die linke Seite durch Vertauschung von 6 mit — 6 nicht ändert, so ist es eine reine quadratische Gleichung und sie giebt mit Rücksicht auf §. 79, A2) Biz <P - \D = 0, wenn D die Discriminante der gegebenen Gleichung ist. Wir bekommen also nach B) A2) 5aoa5ö = worin das Vorzeichen beliebig ist. §. 81. Normalform der Gleichung fünften Grades. Wie schon früher bemerkt, ist das hauptsächlichste Ziel dieser Betrachtungen, eine Normalform der Gleichung fünften Grades herzustellen, die nur von einem unbestimmten Coeffi- cienten, einem Parameter, abhängt. Eine solche Normalform ist die Bring-Jerrard'sche Form. Um diese zu erhalten, haben wir nach D) des vorigen Paragraphen A) y = tiF0 + ta («,JFi -\-UlFt + a0Fs) zu setzen, so dass identisch S(y) = O, S(y») = 0 wird, und dann ist das Verhältniss ts : t2 aus der cubischen Gleichung zu bilden. Diese cubische Gleichung lässt sich wirklich bilden, wenn auch ihr Ausdruck lang wird. Die hierzu nöthigen Formeln sind von Cayley berechnet1). Es ist das Ergebniss einer merkwürdigen Untersuchung von Gordan, dass man eine andere, die Brioschi'sche Normalform ohne neue Irrationalität erhalten kann, und wir wollen zum Beschluss dieser Betrachtungen über die Tschirnhausen - Trans- Transformation dies Resultat noch ableiten2). Wir halten an den Voraussetzungen des vorigen Paragraphen fest und setzen für den Augenblick zur Abkürzung *) Cayley, on Tschirnhausen's Transformation, Phil. Trans. 1861, Mathematical Papers, Tom. IV, Nr. 275. 2) Gordan, Mathematische Annalen, Bd. 28, 1886.
264 Sechster Abschnitt. §. 81. B) u = F0, v worin c^, «j, «2 die im vorigen Paragraphen bestimmten Werthe haben sollen. ¦ Nach derjFormel §. 79, D) lassen sich die drei Functionen M2, U V, V2 linear und homogen durch fo, flt f2, fz, fi darstellen, und weil C) S(u2) = 0, S(uv) = 0, S(v2) = 0 ist, so werden diese Ausdrücke auch in Fo, F1} Ft, 1% linear und homogen (§. 74). Die Rechnung ist nach den Formeln der §§. 78, 79 leicht auszuführen, soll aber hier nicht weiter verfolgt werden, da es uns nur auf die Darlegung des Grundgedankens ankommt. Wir wollen nur bemerken, dass die Coefficienten in den Ausdrücken für m2, uv, v2 linear in den Coefficienten der ursprünglichen Gleichung fünften Grades und quadratisch in den «0, «x, «2 sind. Wenn wir nun aus diesen Ausdrücken mit Hülfe von B) die Functionen Fo, Fx, Ft, Fz eliminiren, so erhalten wir eine Relation von der Form D) pu2 -\- 2quv -\- rv2 = au + bv, worin die p, q, r, a, b von den Coefficienten a< und cti rational abhängen und jedenfalls nicht alle zugleich verschwinden. Setzen wir für den Augenblick pu2 -j- 2quv -\- rv2 = <p(u,v), so ist nach §. 63 4 <p («', v') <p («, v) — [w' <p' (u) + v' <p' (v)f das Quadrat einer linearen Function von «, v, so dass dadurch <p (u, v) in die Summe von zwei Quadraten zerlegt wird. Wählen wir u' = b, v' = — a, so folgt <p F, — a) <p (u, v) = [b (pu -j- qv) — a (qu -j- rv)]2 + (pr — g»)(au-\- oder wenn man zur Abkürzung pb2 — 2qab -\- ra2 = m, bp — aq = a', E) bq — ar = V, q2 — pr = c setzt, F) m(j>u2-\- 2quv -\-rv2) = (a'u -j- b'vJ — c(au-\-
§. 81. Normalform der Gleichung fünften Grades. 265 und nach D) kann diese Gleichung auch so dargestellt werden: G) m (au -+- bv) = (a'u -f b'vJ — c (au -f bvJ. Man setze nun (8) y = —u ~T_, v, und bilde die Gleichung fünften Grades, deren Wurzeln die fünf Werthe von y sind: darin lassen sich die Coefficienten c auf folgende Weise näher bestimmen. Aus (8) leiten wir ab y i 1/7 = a'u + b'v -\- Vc (au-\- bv) ' au -j- bv und daraus nach G) y 4- Vc = a'u -\- b'v — Vc (au -\- bv) r= = a'u -j- b'v — Vc (au -\- bv). y + Vc Daraus folgt aber nach C) Wenn wir also aus (9) die Gleichung ableiten, deren Wurzeln die Werthe 1 = y + Vc sind, also _ setzen, so muss eine Gleichung für § entstehen, in der die Coeffi- Coefficienten von t-* und §3 verschwinden, und zwar welches Zeichen wir auch der Quadratwurzel Vc geben. Dadurch erhält man vier Gleichungen zwischen den Coefficienten cv der Gleichung (9). Die Gleichung für § wird nämlich: (l - g WN + *! (l - $ Vöy + ^ (l - § V^K + c,|» A _ | WJ + c& (l - | Vt) + c51» = 0. Setzt man hierin die Coefficienten von §* und |3 gleich 0, so folgt:
266 Sechster Abschnitt. §. 81. 5 Vc4 - 4d Vcs + 3c2 Vc2 — 2c3 Vc" + c4 = 0,. — 10 Vc3 + 6Ci Vc— 3c2 Vc" + c3 =0, und diese Gleichungen zerfallen wegen des doppelten Zeichens von Vc in die vier 5 c3 + 3 c2 e -f- Ci = 0, 4Clc + 2c3 =0, 10 c + 3 e2 =0, 6 ex c -j- c-i =0. Aus der zweiten und vierten dieser Gleichungen folgt Ci = 0, es = 0, und dann aus der dritten und ersten c3 = — y c, c4 = 5 c2, so dass also die Gleichung für y die Gestalt erhält A0) i/a _^C2/3 + Diese Gleichung hängt noch von den beiden Parametern c5 und c ab; man kann sie auf eine Gleichung mit einem Para- Parameter reduciren durch die Substitution wodurch sie die einfache und elegante Form erhält A2) 0° — 10^3 + 45^ + y = 0. Dies ist die Brioschi'sche Normalform. Die Substitu- Substitution A1) leidet aber an dem Uebelstande, dass sie noch eine Quadratwurzel enthält, während in den Formeln (8) und A0) nur die zwei im vorigen Paragraphen besprochenen Quadrat- Quadratwurzeln vorkommen. Man kann aber auch nach einer Bemerkung von Klein auf rationalem Wege aus A0) zu einer Normalform kommen, die nur einen Parameter enthält. Setzt man z. B. so erhält man aus A0) die Gleichung A4) 0^ -\- 150* — lOy02 -f 3y2 = 0.
§. 81. Normalform der Gleichung fünften Grades. 267 Es ist bei dieser Transformation stillschweigend die Voraus- Voraussetzung gemacht, dass die in E) mit m und c bezeichneten Grossen nicht Null seien. Ist m = 0, so ist in der Formel D) pu2 -\- 2quv -\- rv1* durch au -\- bv theilbar, es muss dann also wenigstens für einige der Wurzeln die Gleichung au -(- bv = 0, d. h. eine Gleichung von nicht höherem als dem vierten Grade bestehen. Ist c = 0, also pu2 -\- 2 quv -\- rv% ein Quadrat einer linearen Function, so ergiebt sich aus G) und C), dass, wenn y = a'u -\- b'v gesetzt wird, S(y) = O, S(y*) = O, 8(y*) = 0 ist, dass also die Bring-Jerrard'sche Form in rationaler Weise herstellbar ist. Wir können schliesslich die Resultate dieser Betrachtungen dahin zusammenfassen: Die Hauptgleichung fünften Grades lässt sich durch eine Transformation, die als einzige Irratio- Irrationalität die Quadratwurzel aus der Discriminante enthält, auf eine Normalform mit einem Parameter transformiren.
ZWEITES BUCH. DIE WURZELN.
Siebenter Abschnitt. Realität der Wurzeln. §. 82. Allgemeines über Realität von Gleichungswurzeln und über die Discriminante. In diesem Abschnitt werden wir uns mit der Frage beschäf- beschäftigen, wie viele Wurzeln einer algebraischen Gleichung reell sind. Die Coefficienten der Gleichung werden dabei als reelle Zahlen vorausgesetzt. Wir wollen solche Gleichungen kurz reelle Gleichungen nennen und beginnen mit einigen allgemeinen Betrachtungen. Die reelle Gleichung nten Grades /(*) = <> hat, wie wir im dritten Abschnitt gesehen haben, n Wurzeln, die entweder reell oder imaginär, d. h. von der Form § -(- ir\ sind, mit reellen §, r\. Die Zahl von n Wurzeln ergiebt sich aber nur dann allgemein, wenn wir unter Umständen eine Wurzel mehrfach zählen, nämlich (m-j-l)fach, wenn mitf(x) zugleich die m ersten Derivirten von f(x) verschwinden. Da nun ein complexer Aus- Ausdruck von der Form X -j- iY nur dann gleich Null ist, wenn die beiden reellen Bestandtheile X und T einzeln verschwinden, wenn also, mit X -j- i T zugleich X — iY verschwindet, und da ferner bei reellen Coefficienten, wenn /(§ -j- irf) = X-\-iY ist, sich/(§ — irj) = X — iY ergiebt, so folgt aus/(§-f irj) = 0, dass zugleich /(§ — itj) = 0 sein muss, dass also zu jeder imaginären Wurzel § -j- irj eine zweite davon verschiedene imaginäre | — iy, d. li. die conjugirt imaginäre Wurzel gehört. Da mit den Derivirten /'(§ -j- irj), /"(§ -\~ irf) . . . zu- zugleich die conjugirten Grossen /' (§ — irf), /" (§ — i rj) . . . ver-
272 Siebenter Abschnitt. §. 82. schwinden, so folgt, dass conjugirt imaginäre Wurzeln denselben Grad der Vielfachheit haben. Daraus folgt, dass die imaginären Wurzelu immer in gerader Zahl vorkommen, und dass eine Gleichung ungeraden Grades immer mindestens eine reelle Wurzel haben muss. Unser nächstes Ziel wird das sein, die Zahl der reellen Wurzeln, ohne die Gleichung aufzulösen, direct aus den Werthen gewisser rationaler Functionen der Coefficienten der Gleichung zu bestimmen. Eine sebr wichtige Rolle spielt hierbei die Discriminante, auf deren Bedeutung für unsere Frage wir zunächst eingehen müssen. Wir haben in §. 50 die Discriminante erklärt als das Product aus den Quadraten der sämmtlichen Wurzeldifferenzen (*! — x2y, noch multiplicirt mit a|n~2, wenn a0 der Coefficient der höchsten Potenz der Unbekannten in der gegebenen Gleichung ist, und wir haben dort gezeigt, wie die Discriminante als rationale Function der Coefficienten berechnet werden kann. Der Factor a20"- ist immer positiv und könnte hier ohne wesentliche Be- Beschränkung der Allgemeinheit auch gleich 1 vorausgesetzt werden. Wir wollen, wie schon früher, für die Discriminante das Zeichen D gebrauchen. Die Discriminante verschwindet dann und nur dann, wenn unter den Wurzeln zwei gleiche vorkommen. Nehmen wir an, dass f(x) durch Absonderung des grössten gemeinschaftlichen Theilers von f(x) und /' (#), was durch ratio- rationale Rechnung geschieht, von mehrfachen Factoren befreit sei, so wird also D nicht verschwinden. Sind xx und x2 reell, so ist (x-, — x2J positiv. Ist xx reell und x2 imaginär, so giebt es eine zu ar2 conjugirte Wurzel x'%, und das Product (»! — x2) ix,, — x'a) ist als Product zweier conjugirt imaginärer Grossen positiv, also auch sein Quadrat. Sind xx und x2 beide imagiuär, aber nicht conjugirt, so ist das Product (Xi fl;2) (Xi — X'st) und sein Quadrat positiv.
§. 83. Wurzeln der cubischen Gleichung. 273 Sind aber endlich x1 und x% conjugirt imaginär, so ist ihre Diiferenz rein imaginär und deren Quadrat negativ. Es kommen also in dem Product, durch das wir die Discri- minante erklärt haben, genau so viel negative Factoren vor, als es Paare conjugirt imaginärer Wurzeln giebt, und wir schliessen daraus auf den wichtigen Fundamentalsatz: Ist f(x) — 0 eine reelle Gleichung ohne mehrfache Wurzeln, so ist die Discriminante positiv oder negativ, je nachdem die Anzahl der Paare conjugirt imaginärer Wurzeln gerade oder ungerade ist. Der Fall, wo nur reelle Wurzeln vorhanden sind, gehört zu denen, wo die Discriminante positiv ist. Für die Fälle der quadratischen und cubischen Gleichungen, in denen nur ein Paar imaginärer Wurzeln auftreten kann, ist durch diesen Hauptsatz bereits die Unterscheidung der ver- verschiedenen Fälle, die in Bezug auf die Wurzelrealität möglich sind, die Determination, vollendet. §. 83. Discussion der quadratischen und cubischen Gleichung. Für die quadratische Gleichung a0 x% -(- aj x -\- a2 = 0 haben wir (§. 50) D = a? — 4 a0 a2 > 0 reelle Wurzeln, < 0 imaginäre Wurzeln. Für die cubische Gleichung a0 x3 -|~ % x% -j- a2 x -f- a3 = 0 ist T> = al a22 -j- 18 a0 a} a^a% — 4 a0 a23 — 4 af a% — 27 a02 a32, D > 0 drei reelle Wurzeln, D < 0 eine reelle, zwei imaginäre Wurzeln. Auch der Fall D = 0 giebt hier zu keinen weiteren Unter- Unterscheidungen Anlass; denn in diesem Falle sind die beiden Wurzeln der quadratischen Gleichung einander gleich und reell, von den drei Wurzeln der cubischen Gleichung zwei einander gleich und alle drei reell; denn eine imaginäre Wurzel kann hier Weber, Algebra. I. 13
274 Siebenter Abschnitt. §. 83. nicht doppelt vorkommen, weil sonst auch die conjugirte doppelt vorkommen würde, und ebenso wenig kann die einzelne Wurzel imaginär sein, weil sonst eine zweite vorhanden sein müsste. Es kann sich bei der cubischen Gleichung nur noch darum handeln, die Bedingung dafür aufzusuchen, dass alle drei Wurzeln einander gleich sind. In diesem Falle muss die linke Seite der cubischen Gleichung ein vollständiger Cubus sein, also a0 x* -(- Oj x* -j- a2x -j- a3 = a0 (# — wK- Die Vergleichung beider Seiten dieser in Bezug auf x identischen Gleichung ergiebt «! = — 3 a0 a, a2 = 3 a0 «2, a3 = — a0 «3, woraus man durch Elimination von a erhält A, a* — 3a0a2 = 0, ^ ax a2 — 9 aQ a3 = 0. Daraus ergiebt sich als Folge (indem man die erste dieser Glei- Gleichungen mit a2l die zweite mit ax multiplicirt und subtrahirt) al — 3 % a3 = 0; und wenn diese Bedingungen erfüllt sind, so folgt daraus um- umgekehrt d. h. die Gleichheit aller drei Wurzeln. Bei der cubischen Gleichung können wir ausser über die Realität auch noch über die Vor- Vorzeichen der Wurzeln vollständig entscheiden. Bezeichnen wir nämlich mit oc, ß, y die drei Wurzeln, so ist B) a1= — («+/3+y), «2 = «ß+«r+ßr> % = — Kßy* Ist nun D < 0, also nur eine Wurzel, etwa «, reell, so ist ßy positiv und a wird negativ oder positiv sein, je nachdem c% positiv oder negativ ist. Ist aber J) positiv, also alle drei Wurzeln reell, so ist, wenn «, ß, y positiv sind, nach B) C) % < 0, a2 > 0, a3 < 0; diese Bedingungen sind nothwendig dafür, dass alle drei Wurzeln positiv sind. Sie sind aber auch hinreichend; denn wenn eine
§. 83. Wurzeln der cubischen Gleichung. 275 oder drei Wurzeln negativ sind, so ist a3 > 0. Sind aber zwei Wurzeln, etwa ß, y, negativ, so ist entweder «! ;> 0 oder a > — (ß -j- y). In letzterem Falle aber folgt a2 < ßy - (ß + rJ = - ß2 - ßy - y\ also a3 negativ. Ist endlich eine Wurzel gleich 0, so muss nothwendig a% verschwinden. Indem man x durch — x ersetzt, schliesst man, dass für drei negative Wurzeln die nothwendige und hinreichende Bedingung die ist D) «! > 0, a2 > 0, a3 > 0. Wir erhalten daher unter Voraussetzung einer positiven Discriminante folgende Tabelle: ßj ÖS2 - + + + - + «3 — + x 3 !¦ 0 wo in der letzten Columne die Zahl der positiven Wurzeln angegeben ist. Wir können das Eesultat dieser Betrachtung so aussprechen: Bei positiver Discriminante ist die Anzahl der posi- positiven Wurzeln der cubischen Gleichung gleich der An- Anzahl der Zeichenwechsel in der Reihe 1, «i, a2, «3, wenn wir unter einem Zeichenwechsel die Aufeinanderfolge einer positiven und einer negativen oder einer negativen und einer positiven Grosse verstehen. Wenn eine der beiden Grossen au a2 verschwindet, so haben wir, da dann nicht alle Wurzeln von gleichem Zeichen sein können, eine oder zwei positive Wurzeln. 18*
276 Siebenter Abschnitt. §. 84. Wenn a3 = 0 ist, so reducirt sich die Discriminante auf ai(af — 4a2), und wenn diese positiv ist, so hat die cubische Gleichung eine verschwindende und noch zwei andere reelle Wurzeln. Diese sind positiv, wenn % < 0, a2 > 0, negativ, wenn «i > 0, a% > 0, und es ist eine von ihnen positiv und eine negativ, wenn = 0, a2 < 0 ist. §• 84. Discussion der biquadratischen Gleichung. Bei den Gleichungen vierten und fünften Grades existiren entweder keine oder zwei oder vier imaginäre Wurzeln. Ist die Discriminante negativ, so hat man zwei imaginäre Wurzeln. Bei positiver Discriminante können entweder vier oder keine ima- imaginären Wurzeln vorhanden sein. Diese beiden Fälle zu unter- unterscheiden, wird weiterhin unsere Aufgabe sein. Wir wenden uns aber zunächst zu einer elementaren Betrachtung der biquadra- biquadratischen Gleichung, die wir der Einfachheit halber in der ver- verkürzten Form A) x*-\- a'^-f bx-\- c = 0 annehmen wollen, von der wir leicht zur allgemeinen Form zurückkehren können. Bezeichnen wir die Wurzeln mit a, ß, y, d und setzen, wie in §. 52 a — ß = v -\- w, y — d = v — «?, B) « — y = w -[- m, d — ß = iv — u, a — ö = u -\- v, ß — y — u — v, so sind m2, v2, w2 die Wurzeln der cubischen Resolvente C) 2/3 +2«2/2-f («2 — 4cJ/— &2 = 0, und die Discriminante D dieser cubischen Gleichung, die durch D) 27D = 4(a2+ i2c)s — B«s — 72ae+ 27 &2J bestimmt ist, ist zugleich die Discriminante der biquadratischen
§. 84. Wurzeln der biquadratischen Gleichung. 277 Gleichung A), und die Vorzeichen der Grossen u, v, w sind durch die Bedingung E) u v iv = — b beschränkt [§. 40, C)]. Wenn die Discriminante negativ ist, so hat die Gleichung C) ebenso wie A) zwei conjugirt imaginäre Wurzeln. Ist D positiv und alle vier Wurzeln «, ß, y, 8 reell, so werden auch u, v, w reell und also ihre Quadrate, d. h. die Wurzeln von C), positiv. Sind alle vier Wurzeln imaginär, etwa a mit ß und y mit 8 conjugirt, so folgt aus B), dass v und w rein imaginär, u reell ist; also hat in diesem Falle die Gleichung C) eine.positive und zwei negative Wurzeln. In beiden Fällen kann aber auch, wenn b verschwindet, eine der Grossen u, v, w gleich Null sein. Mit Rücksicht auf die Ergebnisse des letzten Paragraphen über die cubische Gleichung kommen wir also zu folgendem Resultat: Die nothwendige und hinreichende Bedingung für die Existenz von vier verschiedenen reellen Wurzeln ist F) JD > 0, a < 0, a2 — 4e> 0. In allen anderen Fällen, wo D positiv ist, hat die Gleichung vier imaginäre Wurzeln. Wir können auch für D = 0, also im Falle der Gleichheit zweier Wurzeln, die Discussion vollständig durchführen. Nehmen wir y = ö an, so folgt aus B), da wir die An- Annahme u-^-ß-\-y-\-8 = 0 gemacht haben, 2v — 2w = k — ß 2u = u-\- ß — 2y = 2(u-{- ß) und daraus nach C) - 4a = 2(a + /3)s-]-(«_ ßf 16(«** - 4C) = (« - ßy [8(« + ßy + (« - ßn Um zunächst den Fall zu erledigen, dass auch a = ß ist, so erhalten wir aus G) dafür die Bedingung a2 — 4 c = 0, und die erste Gleichung G) zeigt, dass a negativ ist, wenn a und y reell, dagegen positiv, wenn a und y conjugirt (und dann wegen a -\- y = 0 rein imaginär) sind. Daraus folgt:
278 Siebenter Abschnitt. §. 84. Die biquadratische Gleichung hat zwei Paare gleicher, reeller Wurzeln, wenn (8) D = 0, a < 0, a2 — 4c = 0 und zwei Paare gleicher imaginärer Wurzeln, wenn (9) D — 0, a > 0, a2 _ 4 c _ 0. Ist aber a von ß verschieden, so muss y reell sein und G) zeigt, dass, wenn a und ß reell sind, a negativ und at2 — 4e positiv ist, dass dagegen, wenn a und ß conjugirt imaginär sind, entweder a positiv oder a1 — 4c negativ sein muss, da in die- diesem Falle (« — ßy negativ ist, und wenn 2(« + ßJ+(«—ß)- positiv ist, jedenfalls auch 8(w-)- /3J-{-(a— /3J positiv sein muss. Wir können also F) dahin ergänzen, dass wir sagen: Die nothwendige und hinreichende Bedingung für die Existenz von vier reellen Wurzeln, von denen auch zwei (aber nicht mehr) einander gleich sein können, ist A0) D ^ 0, a < 0, «2 — 4 c> 0. Die nothwendige und hinreichende Bedingung für drei gleiche Wurzeln, die nothwendig alle reell sind, ist nach B) es muss also die cubische Resolvente C) drei gleiche Wurzeln haben, und dafür sind nach §. 83 A) die nothwendigen und hin- hinreichenden Bedingungen o.+ 12C = 0 K ' 2«3 — 8ac-\- 9&2 = 0. Nach §. 52 A5), A6) sind die beiden Invarianten A und B der biquadratischen Gleichung A = a* -\- 12c, JB = 2«3 — 72ae -)- 27R Also können wir die Gleichungen A1) auch so schreiben: A = 0, J3-f-4aJ. = 0, so dass A1) gleichbedeutend ist mit A = 0, B = 0. Durch Elimination von c kann man aus A1) auch noch die Gleichung ableiten: A2) 8 «s _j_ 27 &2 = o. Endlich ist noch die Bedingung für die Gleichheit aller vier Wurzeln a = 0, 6 = 0, c — 0.
§. 84. Dis er iminantenf lache. 279 Man kann diese Verhältnisse sehr anschaulich machen durch eine geometrische Deutung, und wenn auch geometrische Be- Betrachtungen nicht eigentlich in unserem Plane liegen, so wollen wir doch nicht unterlassen, den Leser darauf gelegentlich hin- hinzuweisen. Deutet man a, b, c als rechtwinklige Coordinaten im Räume, so ist jeder Raumpunkt als Träger einer gewissen biquadratischen Gleichung von der Form A), f(x) = 0, zu betrachten; alle Gleichungen, die eine bestimmte Zahl x zur Wurzel haben, werden durch Punkte einer Ebene [f(x) = 0] repräsentirt. Die Gleichung D = 0 ist die Gleichung einer krummen Oberfläche (fünften Grades), der Discriminantenfläche, die von den Schnittlinien der Ebenen f(x) = 0, /' (x) = 0 erzeugt wird, und also eine abwickelbare Fläche ist. Sie ist die Einhüllende aller Ebenen f(x) = 0. Die Fläche hat eine aus zwei Zweigen bestehende Rückkehr- Rückkehrkante, die durch die Gleichungen A1), A2) dargestellt ist, und eine Doppellinie, die durch die Gleichungen 6 = 0, a2 — 4 e = 0 bestimmt ist und also die Gestalt einer Parabel hat. Auf der Seite der negativen a durchsetzt sich in dieser Parabel die Fig. 5. in Fläche selbst. Auf der Seite der positiven a setzt sich die Parabel als isolirte Linie fort. Die Discriminanten- Discriminantenfläche theilt den gan- ganzen Raum in drei Fächer, von denen zwei nur längs der Doppel- Doppelparabel zusammen- zusammenhängen, und diese Fächer enthalten die Punkte, denen keine, zwei und vier reelle Wurzeln entsprechen. Nennen wir für den Augenblick diese drei Fächer [0], [2], [4], so grenzt [0] an [4] nur längs der Doppelparabel, während [0] sowohl als [4] längs der Flächentheile an [2] grenzen. Wir wollen mit [0, 2] und [2, 4] die Grenzflächen von [0], [2] und von [2], [4] bezeichnen.
280 Siebenter Abschnitt. §. 84. Der isolirte Theil der Parabel setzt sich in das Innere von [0] fort. Die Rückkehrkanten liegen auf dem Theil der Fläche, der [4] von [2] scheidet Im Coordinatenanfang stossen die drei Raumtheile und ihre Grenzflächen und Grenzlinien zusammen. Die Punkte der Flächentheile [0, 2] stellen Gleichungen mit zwei gleichen und zwei imaginären Wurzeln dar, die Punkte von [2, 4] Gleichungen mit zwei gleichen und zwei davon verschiedenen reellen Wurzeln. Auf der Doppelparabel finden zweimal zwei gleiche Wurzeln statt, und zwar auf dem Theil, in dem [0] an [4] grenzt, reelle, in dem isolirten Theil imaginäre. Die Punkte der Rückkehrkanten repräsentiren Gleichungen mit drei gleichen Wurzeln und der Coordinanten - Anfangspunkt die Gleichung mit vier gleichen Wurzeln. Auf die Discriminantenfläche und ihre Bedeutung für die Discussion der biquadratischen Gleichung hat zuerst Kronecker hingewiesen. Ein Modell der Fläche ist von Kerschensteiner construirt*). Der analytische Ausdruck für die Bedingungen der Realität der Wurzeln lässt sich in eine Gestalt bringen, in der nur die Covarianten der biquadratischen Form vorkommen2). Den Ausgangspunkt dazu bilden die Ausdrücke für die Functionen ipt, ip2, il>a, die §. 72, F) gegeben sind. Wenn wir in jenen Ausdrücken a mit ß vertauschen, so gehen ipx, il>2, i>% in ^li —^31 —^2 über, und wenn wir gleichzeitig a mit ß und y mit d vertauschen, i^, if>2, ip3 in ^15 — ip2, — ij>3. Daraus ergiebt sich Folgendes: Setzt man für die Variable x einen beliebigen reellen Werth und sind die Wurzeln «, ß, y, d der biquadratischen Form alle reell, so sind auch if^, fa, ij>3 reell. Sind «, ß conjugirt imaginär, y, d reell, so ist die Ver- !) Kronecker, Monatsbericht der Berliner Akademie vom 14. Februar 1878. Eine Beschreibung des Modells findet sich in dem von Dyck heraus- herausgegebenen Katalog mathematischer Modelle, München 1892, dem die Fig. 5 auf voriger Seite entnommen ist. 2) Clebsch, „Theorie der binären Formeu", §. 47. Faä di Bruno, „Theorie der binären Formen", deutsch von Walter (Leipzig 1881), §. 20, woselbst sich ein wesentlicher Zusatz von Nöther findet.
§. 85. Bezoutiante und Wurzelrealität. 281 tauschung von a und ß gleichbedeutend mit der Vertauschung von i mit —i. Es sind also in diesem Falle ^ reell, ^2, —^3 conjugirt imaginär. Sind endlich «, ß und y, d zwei Paare conjugirt imaginärer Wurzeln, so werden « mit ß und y mit d vertauscht, wenn i in — i übergeht; also sind in diesem Falle ti reell, ^2> ^3 rein imaginär. Sind vier Wurzeln reell, so werden ipf, ip-g, i/>| reell und positiv. Sind zwei Wurzeln reell, so ist ipf- reell und positiv, ^|, ipg sind conjugirt imaginär. Sind vier Wurzeln imaginär, so ist ij>f positiv, ^»|, ip£ sind reell und negativ. Nun haben wir im §. 72, G) die cubische Gleichung auf- aufgestellt, deren Wurzeln ipf, il>£, ipg sind, und haben auch ihre Discriminante gebildet. Im vorigen Paragraphen haben wir ein Kennzeichen für die Anzahl der positiven Wurzeln einer cubischen Gleichung kennen gelernt, woraus sich folgendes Eesultat ergiebt: Ist D < 0, so hat die biquadratische Gleichung zwei reelle und zwei imaginäre Wurzeln. Ist D > 0, so müssen, wenn vier reelle Wurzeln vorhanden sein sollen, in der Reihe 1, H, H* - WAf, — T2 drei Zeichenwechsel vorkommen, d. h. es muss H<0, I?-WAf>0 sein. Bei den drei anderen noch möglichen Zeichencombinationen sind alle vier Wurzeln imaginär. Hierbei aber kann für x ein beliebiger reeller Werth gesetzt werden. §. 85. Die Bezoutiante und ihre Bedeutung für die Wurzelrealität. Für die Untersuchung der Realität der Wurzeln einer be- beliebigen reellen Gleichung in allgemeineren Fällen kann die Function mit Nutzen angewandt werden, die wir im §. 79 als Bezoutiante der Gleichung bezeichnet haben.
282 Siebenter Abschnitt. §. 85. Ist A) f{x) = ot» -\- a^-1 + a2a^-2 -| 1- a„ = 0 irgend eine reelle Gleichung «ten Grades, so war die Bezoutiante folgendermaassen definirt: Man setze B) y = tn^f, (x) -\~ tn-2ft (x)-{ h «o/.-i («), worin die t0, tt, . . ., i^—x unbestimmte Variable bedeuten und fo(x) = 1, fx(x) = x -f ay, f2(x) — x* -\- axx + o2r. . . Es ist dann [§. 79, A0)] C) ^ wo B eine quadratische Form der n — 1 Variablen t0, tu..., f„_2 ist mit Coefficienten, die rational aus den Coefficienten «j zu- zusammengesetzt sind. Diese Function B haben wir als Bezoutiante definirt und für die Fälle n — 4 und n = 5 wirklich gebildet. Nun sind in der Summe auf der linken Seite von C) D) . y! + yt + yl-\ h yl, die 2/1, y2, ..., y„ lineare Functionen der Variablen t0, tu ..., #»_!, und wir haben also in der Formel C) eine Transformation der quadratischen Form E) \ [S(y)f + B = 0 (t0, tx,..., tn-i) auf eine Summe Ton n Quadraten. Wir machen fürs erste keinerlei beschränkende Voraus- Voraussetzungen über Gleichheit oder Verschiedenheit der Wurzeln Ton /(a;)und müssen nun zunächst untersuchen, inwieweit die linearen Functionen yv y%, . . ., y„ von einander unabhängig sind. In dieser Beziehung gilt der Satz: Sind Xy, x$, . . ., xy von einander verschiedene Wur- Wurzeln der Gleichung A), so sind yt, y2, . . ., yv linear unab- unabhängig. .Denn angenommen, es existire zwischen yu y2, . . ., yv eine in Bezug auf die t identische lineare Relation «i 2/i + «2 2/2 + • • • + «v yv = 0, deren Coefficienten a von den t unabhängig und nicht alle gleich Null sind, so würde diese in die folgenden Gleichungen zer- zerfallen:
§. 85. Bezoutiante nnd Wurzelrealität. 283 «1 /o «1 fl «2 /o «2 /l «v/0 (»,) = 0, «v/i (O = o, «2 f„-l(x3) + • 1- «v/„-l(»,) = 0. Da nun v ^ n ist, so muss die Determinante der v ersten von diesen Gleichungen verschwinden, also oder = 0, 1, X2 -f %, «I + «1 «2 + «2 • • • = 0. /y __L ff fy* | /y /y | i-t *A/y ^*li *^V '—— \Aj\ <JUy —j— l*o • • i Diese Determinante lässt sich aber durch wiederholte An- Anwendung des Satzes von der Addition der Colonnen §. 25, (VII) auf die Form bringen: I/v» /v* ^ /y*V — X •— / /y /y i / /y> /y \ / /v> /y \ 5 15 11 * * *) ^ j V 1 ^"'^ ^2/ VI ^"'^ ""'$/ • * * \ 1 wy I f /y /y \ f /y /y> i 1 1, 1 (^-r—1 Xv)i und kann also nicht verschwinden, wenn, wie vorausgesetzt war, die xx, x<}, . . ., xr verschieden sind. Wenn wir daher in der Summe D) alle unter einander gleichen Glieder zusammenfassen, so bleiben so viele Qua- Quadrate linear unabhängiger Functionen übrig, als die Gleichung A) verschiedene Wurzeln hat. Wenn nun xx eine reelle Wurzel von A) ist, so ist yl ein positives Quadrat in der Summe D). Sind aber xx und x2 con- jugirt imaginär, so zerfallen auch yx und y2 in zwei conjugirt imaginäre Bestandtheile 2/i = «* + vii Vi—u — vi, wo u und v lineare reelle Functionen von den t sind. Demnach wird Es ist also durch D) die durch E) definirte Function &(t) in eine Summe von Quadraten zerlegt, deren Anzahl gleich der
284 Siebenter Abschnitt. §. 86. Zahl der verschiedenen Wurzeln \onf(x) = 0 ist, und unter denen so viele negative sind, als unter diesen von einander ver- verschiedenen Wurzeln Paare imaginärer Wurzeln vorkommen. Diese Anzahlen bleiben aber nach dem Trägheitsgesetz der quadratischen Formen (§. 64) bei jeder anderen linearen reellen Transformation der quadratischen Form in eine Summe von Quadraten dieselben. Nun ist S(y) eine reelle lineare Function der t, und B enthält die Variable tn—i nicht mehr; hiernach ergiebt sich aus der Formel E) der Satz: I. Wenn die Bezoutiante B durch reelle lineare Transformation in eine Summe von % positiven und v negativen Quadraten, die nicht auf eine kleinere Zahl reducirt werden können, zerlegt ist, so ist % -\- v -\- 1 die Zahl der verschiedenen Wurzeln von f{x) = 0; und v ist die Anzahl der darunter enthaltenen Paare conjugirt imaginärer Wurzeln, % — v -j- 1 die der reellen. Ist die Determinante von B, also auch die Discriminante von f{x) (§. 79) von Null verschieden, so ist % -j- v = n — 1 und v ist kleiner oder höchstens gleich | n. Die Bezoutiante ist also eine quadratische Form von einer besonderen Natur, die sich eben darin ausspricht, dass unter den Quadraten, in die sie sich zerlegen lässt, höchstens | n nega- negative vorkommen können. §. 86. Die Trägheit der Formen zweiten Grades. Durch den Satz des vorigen Paragraphen sind wir auf die Untersuchung der homogenen Functionen zweiten Grades mit reellen Coefficienten hingewiesen. Ueber diese Functionen haben wir in §. 64 unter dem Namen des Trägheitsgesetzes einen Satz kennen gelernt, der für das Folgende die Grundlage bildet. Der Satz besteht darin, dass, wie man auch eine quadratische Form von m Veränderlichen in eine Summe von positiven und negativen Quadraten von linear unabhängigen linearen Functionen transformiren mag, was auf unendlich viele verschiedene Arten möglich ist, die Anzahl der positiven und ebenso die der negativen Quadrate immer dieselbe ist.
§. 86. Trägheit der Formen zweiten Grades. 285 Bezeichnen wir mit % die Anzahl der positiven und mit v die Anzahl der negativen Quadrate, so ist % -\- v höchstens gleich m. Wenn wir den Unterschied m — % — v mit q bezeichnen, so kann, wenn wir die allgemeine quadratische Form von m Variablen als Summe von m Quadraten darstellen, q als die An- Anzahl der Quadrate mit verschwindenden Coefficienten bezeichnet werden. Die drei Zahlen je, v, q, von denen keine negativ sein kann und deren Summe gleich der Anzahl der Variablen ist, A) % -f v -f q — m, sind also für eine bestimmte quadratische Form unveränderlich. Wir werden sie die charakteristischen Zahlen der quadra- quadratischen Form nennen1). Wir haben nach Mitteln zu suchen, um aus den Coefficienten der quadratischen Forin die Zahlen je, v, q zu ermitteln. Wenden wir diese Mittel auf die Bezoutiante an, so erhalten wir Kenn- Kennzeichen, um aus den Coefficienten einer Gleichung auf die Anzahl ihrer reellen Wurzeln zu schliessen. Es sei also jetzt, wie in §. 62 B) 9(i, ) 1, m . eine quadratische Form von m Veränderungen mit reellen Coefficienten o,-)ft. Die Determinante C) R = Z ± «1,1, «2,2, • • -, ÖW,m zeigt durch ihr Verschwinden an, dass y durch lineare Trans- Transformation in eine Function von weniger als m Variablen trans- formirt werden kann, dass also q grösser als Null ist. Die Determinante R ist eine symmetrische Determinante. Unter ihren Unterdeterminanten verschiedener Ordnung kommen gewisse vor, die wieder symmetrische Determinanten sind, nämlich die, die man aus R erhält, wenn man Zeilen und Colonnen, die sich in Diagonalgliedern schneiden, ausstreicht, die also, wenn *) Nach Frobenius heisst n -f- v der Kang, n — v die Signatur der quadratischen Form („Ueber das Trägheitsgesetz der quadratischen Formen"; Sitzungsberichte der Berliner Akademie 1894).
286 Siebenter Abschnitt. §.86. «, ß, y . . . irgend welche unter den Indices 1, 2,. . ., m bedeuten, durch zu bezeichnen sind. Diese wollen wir die Haupt-Unterdeter- Haupt-Unterdeterminanten von R nennen. Wir wollen die Anzahl der Haupt-Unterdeterminanten be- bestimmen. Die Anzahl der j* -reihigen Haupt-Unterdeterminanten ist gleich der Anzahl der Arten, wie man aus der Reihe der Indices 1, 2, 3, . . ., m Gruppen von j* verschiedenen auswählen kann, also gleich der Anzahl der Combinationen von m Elementen zu je ;*, und diese Zahl ist gleich dem Binomialcoefficienten B^K Die Anzahl aller Haupt-Unter determinanten ist also, wenn wir die Determinante R selbst und ausserdem noch die Einheit als eine nullreihige Determinante mitzählen, i i ™ i m(m — 1) 1.2 = 2»'. Es ist aber meist nur ein kleiner Theil von diesen wirklich zu berücksichtigen. Die Indices 1, 2, 3,...,m lassen sich auf II (m) = 1 .2 .8...m verschiedene Arten anordnen; wenn wir mit irgend einer dieser Anordnungen die Determinante bilden <h, «2,1, so lässt sich eine Reihe von Haupt-Unter determinanten daraus ableiten, wie es durch die Striche angedeutet ist, d. h. so, dass man jede vorhergehende aus der nachfolgenden erhält, indem man die letzte Zeile und Colonne weglässt; es ist also :== -"• Ein solches System soll, wenn es in absteigender Reihe
§. 87. Verschwindende Determinante. 287 geordnet ist, eine Kette von Haupt-Unterdeterminanten heissen. Solcher Ketten lassen sich II(m) verschiedene bilden, in denen allen das erste Glied B, das letzte Glied 1 ist. §. 87. Quadratische Formen mit verschwindender Determinante. Wenn die in C), §. 86 definirte Determinante B der quadra- quadratischen Form cp (xu x2, . ¦ ., xm) verschwindet, so lässt sich, wie wir schon im §. 62 gesehen haben, q> durch weniger als m von ein- einander unabhängige lineare Functionen von x ausdrücken. Wenn wir mit m—Q die kleinste Zahl von Variablen bezeichnen, durch die sich cp ausdrücken lässt, so hat q dieselbe Bedeutung, wie im vorigen Paragraphen. Wenn sich nun unter den Haupt-Unterdeterminanten von R eine Ä-reihige findet, die von Null verschieden ist, etwa Bfr — -S1 i «i,l «2,2) • • •; «7t,7tj so ist, wenn wir xk+1 = 0, Xk+z = 0, . . ., xm = 0 setzen, cp fa, x2, . . ., xb 0, 0, . . ., 0) eine quadratische Form von k Variablen xt, x2, ¦ ¦ ., xk, deren Determinante B^ von Null verschieden ist, die sich sonach nicht durch weniger als Je Variable ausdrücken lässt. Um so weniger kann also bei unbeschränkt veränderlichen %v z2, . . ., xm die Function cp von weniger als h Variablen abhängen und es folgt A) Q^m — h. Wir nehmen nun an, die Form cp (xu x2, . . ., xm) lasse sich durch Je von einander unabhängige lineare Formen von x aus- ausdrücken, die wir mit gl = ßf] xx + $> x, H h ® ^ + &+i ^+H h ß™ x™ = ßf X, + ßf X, -\ h ßf ^ + ßSll «fc+H h ß% 00m B) 02 glc = ßf> Xl+ßfx^ h ß™ **+^Äi «*+H V ß™ bezeichnen wollen.
288 Siebenter Abschnitt. §. 87. Da i?!,^,...,^ von einander linear unabhängig sein sollen, so muss unter den aus der Matrix ff-) ff) ff) oB) «B) aB) Pl i P2 j • • ., Pm M M oQc) Pl j /-»2 1 • • •) Pm zu bildenden Jc-reinigen Determinanten wenigstens eine von Null verschieden sein. Denn wären sie alle gleich Null, so liessen sich die Unbekannten Aj, &2, . . ., h^, die nicht alle verschwinden sollen, aus den Gleichungen Kßf + hßf ^ 1- Mf = 0, s = 1, 2, 3, . . ., m bestimmen, und die su £2, ...,£* würden einer Gleichung genügen, also nicht unabhängig sein (§. 27). Wir können aber, ohne die Allgemeinheit zu beschränken, annehmen, dass die Determinante *i Pi P2 • • •¦ Pjt von Null verschieden sei, und dann können wir die Gleichungen B) in Bezug auf die Variablen xu xa, ...,%% auflösen. Diesen Auflösungen geben wir die Form x = y -\- «A) x -4~ ¦ • ¦ -4- am x /-gx ^2 = 2/2+ «ft + 1% + 1 -\- ¦ • • -\- Cim Xm x-k = 2/ä + «fc + i xt + i -| h d$%m, worin die ys lineare homogene Verbindungen der ss sind, die aus den Gleichungen o(l) I o(l) _j_ _ I o(l) bestimmt werden, während die « neue Coefficienten sind, die in einer leicht zu übersehenden Weise aus den ß abgeleitet werden, auf deren Bildung es uns hier nicht weiter ankommt. Nun lässt sich nach der Voraussetzung die Function cp(a^,x2, ..., xm) durch gx,#ä, ..., gk, also auch durch yx,y2, ..., y*
§. 87. Verschwindende Determinante. 289 allein ausdrücken. Bezeichnen wir diesen Ausdruck mit ®(Vu Vi, • ¦ •) 2/jt), so haben wir [durch Vermittelung von C)] die Identität D) cp(Xi, xt, . . ., Xtc, xk + 1 . . . xm) = ®(yu y2, . . ., yk), und wenn wir darin Xjc + 1, x-k+z, . . ., xm = 0 setzen, E) 0(xi_, x^ . . .,xlt) = (p («!, x2, . . ., xh, 0, 0, . . ., 0), wodurch, da es auf die Bezeichnung der .Variablen nicht an- ankommt, <5 vollständig bestimmt ist; wir können daher setzen 2/2, • • -, 2/ä) = 9 B/15 yii ¦ • •) y-xr, o, o,..., o) 0 entsteht also aus cp dadurch, dass man die m — h letzten Variablen (bei der hier gewählten Anordnung) gleich Null setzt: r,s G) #(«!, . . .,Xk) = 2 ar>sXrXs. Die Determinante von ^ ist eine der Haupt-Unterdeter- Haupt-Unterdeterminanten von R, und zwar erhält man sie, indem man in B die m — Je letzten Zeilen und Colonnen wegstreicht. Nehmen wir an, dass cp sich nicht durch noch weniger als lc Variable ausdrücken lässt, dass also Je = m — q sei, so kann die Determinante dieser Function 0 nicht verschwinden. Hieraus und aus dem zuvor Bewiesenen ergiebt sich nun der Satz: II. Wenn alle Haupt-Unterdeterminanten von B von mehr als Je Reihen verschwinden, während unter den Haupt-Unterdeterminanten von Je Reihen wenigstens eine von Null verschieden ist, so ist q = m — Je. Denn aus G) folgt, dass, wenn q = m — Je ist, wenigstens eine fe-reihige Haupt-Unterdeterminante von Null verschieden sein muss, und aus A), dass, wenn auch noch eine Haupt-Unter- Haupt-Unterdeterminante von mehr als Je Reihen von Null verschieden ist, q < m — Je ist. Wenn also q = m — Je ist, so kann keine Unterdeterminante von mehr als Je Reihen von Null verschieden sein. Sind 3t, v, q die charakteristischen Zahlen der Form <p, so sind 7t, v die Anzahlen der positiven und negativen Quadrate, in die sich die durch G) bestimmte Form 9 zerlegen lässt, und Weber, Algebra. I. jg
290 Siebenter Abschnitt. §.88. die Bestimmung der Zahlen 3t, v braucht also nur noch für letztere Fuhction, deren Determinante von Null verschieden ist, durchgeführt zu werden. ' §.88.- Quadratische Formen mit nicht verschwindender Determinante. Bei der Untersuchung der Formen <p (%, x2, . . ., xm) mit nicht verschwindender Determinante machen wir von einem Deter- Determinantensatz Gebrauch, den wir im §. 31 bewiesen haben, und an den wir hier erinnern wollen. Ist A eine Determinante von m Reihen, und sind Af) ihre ersten, Affi ihre zweiten Unterdeterminanten, so ist A) - A^Af-AfA^^AA^. . Ist A eine von Null verschiedene symmetrische Deter- Determinante, so ist A(x = A(P und wir können die Formel A) so schreiben: B) A? Af — Af = AA\X Darin kann i jeden der Indices 2, 3, . . ., m bedeuten. Wenn A*P = 0 und A\\li = 0 ist, so folgt hieraus, dass auch A® = 0 sein muss, und daraus schliessen wir, dass nicht zugleich verschwinden können, da sonst auch JB) jC) A(m) -fl-1 ) -o-l ! • • •¦> -o-l 1 also auch, gegen die Voraussetzung, A verschwinden würde (§.25). Wenden wir dies auf die jetzt von Null verschieden an- angenommene Determinante i? = Rm unserer Function q> an, so folgt, dass zwar die erste Haupt-Unterdeterminante -Bm_1? dann aber nicht alle zweiten Haupt-Unter determinanten -ßm_2 ver- verschwinden können. Dieselbe Schlussweise lässt sich anwenden, wenn wir R durch ein nicht verschwindendes i?m_l5 i?TO_2 • • . ersetzen, und wir gelangen also zu folgendem wichtigen Satz: III. Man kann, wenn B von Null verschieden ist, die Indices 1, 2, . . ., m so anordnen, dass in der Kette der Haupt-Unterdeterminanten C) Rm, Rm—i) • • •; Hit Hn
§. 89. Anzahl der positiven und negativen Quadrate. 291 nicht zwei auf einander folgende Glieder ver- verschwinden. Die Determinantenrelation B) ergiebt, wenn man Ä = Sk+i, (h= 1, 2, .. ., m — 1) setzt, eine Gleichung zwischen drei auf einander folgenden Gliedern der Kette C), die wir so schreiben können: D) RkSk — T-k = Ric-iRit+n worin 8% und T^ gewisse Unterdeterminanten von M, also ganze rationale Functionen der Coefficienten a^ sind. Näher bezeichnet, sind i4, St, T% erste Unterdeterminanten von -Rfc+i, und zwar ist Eine dem Satz C) entsprechende Anordnung der Indices wollen wir für die Folge als gewählt voraussetzen. Dann ist, wenn i4 verschwindet, i4—i und i4+i von Null verschieden und D) zeigt, dass sie entgegengesetzte Vorzeichen haben, also: IV. Wenn ein inneres Glied einer Kette von Haupt- Unterdeterminanten verschwindet, so haben die beiden angrenzenden Glieder entgegengesetzte Vorzeichen. §. 89. Anzahl der positiven und negativen Quadrate. Um die Anzahl der positiven und negativen Quadrate einer Form mit nicht verschwindender Determinante zu bestimmen, nehmen wir zunächst an, dass in der Kette der Haupt-Unter- Haupt-Unterdeterminanten -"mi -"m—1? R>m—2) • • •¦, -R\i -^o :== 1 kein Glied verschwinde. Wir können dann den Coefficienten X so bestimmen, dass die Determinante der Form A) t = y (»i, «2, xs, . . ., xm) — Xx2m verschwindet. Die Determinante ist nämlich 19*
292 . Siebenter Abschnitt. §. 89. und sie verschwindet, wenn gesetzt wird. Die Function ip lässt sich dann durch m — 1 Variable y ausdrücken, und man erhält nach der Formel F), §. 87 1? Oi, a;2, . . ., xm) — i\> (yv y2, . . ., fm_x, 0), oder nach A) B) (p (xu »ä, . . ., xm) = -j~- x2m -f (p (y1: y2, . . ., 2/OT_i, 0), und die Untersuchung der Function (p von m Variablen ist dadurch auf die Untersuchung von qpx (y) = cp (y^ y3, . . ., «/m_i, 0) von m — 1 Variablen zurückgeführt, deren Determinante gleich i?m_1? also von Null verschieden ist. Je nachdem Rm : .Bm_i positiv oder negativ ist, wird die Function (p(x) ein positives oder ein negatives Quadrat mehr haben als cpL (y). Durch Anwendung des gleichen Verfahrens auf cpx (y) und die folgenden Functionen ergiebt sich der Satz: Die Anzahl der positiven und negativen Glieder der Reihe i?m_x' Hm—i1 ' Ro stimmt überein mit der Anzahl der positiven und negativen Quadrate, in die sich die Function (p (x) zerlegen lässt. Wir wollen diesem Satze noch einen etwas anderen Ausdruck geben, schicken aber folgende Erklärung voraus. Wenn eine Reihe von Null verschiedener reeller Zahlen in bestimmter Anordnung vorliegt, so können die Vorzeichen dieser Grossen in mannigfaltiger Weise wechseln; folgen zwei Grossen von gleichem Zeichen auf einander, so findet eine Zeichenfolge (Permanenz) statt, folgt aber auf eine Grosse eine andere von entgegengesetztem Zeichen, so haben wir einen Zeichenwechsel (Variation). Betrachten wir nun von diesem Gesichtspunkte die Reihe der Grossen -£lm, ±im — 1, _tim — 2l • • •, -"lj -f^O) so findet beim Uebergange von i4 zu i4—i eine Zeichenfolge oder ein Zeichenwechsel statt, je nachdem der Quotient R^ : i?j:_i positiv oder negativ ist.
§. 89. Zeichenfolgen und Zeichenwechsel. 293 Wir können also auch den folgenden Satz aussprechen: V. Ist jt die Anzahl der positiven, v die der nega- negativen Quadrate von cp, so ist n gleich der'Anzahl der Zeichenfolgen, v gleich der Anzahl der Zeichenwechsel in der Kette D) Rm Rm—i, üm—2, • • •) -ßii -ßo- Diese Fassung des Satzes hat den Vorzug, dass sie sich auf den Fall übertragen lässt, dass in der Reihe D) einzelne innere Glieder verschwinden, wenn nur nicht zwei auf einander folgende Glieder Null sind (was nach §. 88, III. immer angenommen werden kann). Wenn nämlich Rk = 0, 14-1, 14+i von Null verschieden sind, so haben nach §. 88, Satz IV. 14-i und 14+ i verschiedene Vorzeichen. In der Reihe -"fc+i} 14) 14—i findet also ein Zeichenwechsel und eine Zeichenfolge statt, gleichviel ob wir das verschwindende Bk durch eine positive oder eine negative Grosse ersetzen. Wenn wir nun die Kette D) J^mi J^m — 1) • • ") -"ii -) in der einzelne Glieder verschwinden, durch eine andere ersetzen, E) JR'm, R'm—i, ¦ . ., R'i, -ßo, in der kein Glied verschwindet, und in der den nicht verschwin- verschwindenden Gliedern der Reihe D) Glieder von demselben Vorzeichen entsprechen, so haben die Reihen D) und E) gleich viele Zeichen- wechsel, welches Zeichen auch die den verschwindenden H ent- entsprechenden B' haben mögen. Es sei nun i>{x) eine zweite beliebige quadratische Form der Variablen x, mit der wir die Form F) q>' = cp + s 4> bilden, worin s ein noch unbestimmter Coefficient ist. Wir werden nun sogleich zeigen, dass wir s so wählen können, dass cp' und cp dieselbe Zahl von positiven und negativen Quadraten haben, dass aber in der' Kette der Haupt-Unterdeterininanten 14 der Form cp' keine verschwindenden Glieder vorkommen, und dass endlich einem nicht verschwindenden 14 ein 14 von dem- demselben Vorzeichen entspricht. Dann können die Zahlen it, v für cp und für cp' sowohl aus der Reihe D), als auch aus der Reihe E) ermittelt werden, und die Anzahl der Zeichen-
294 Siebenter Abschnitt. §• 89. Wechsel, die in beiden gleich ist, giebt die Anzahl v der nega- negativen Quadrate. Um nun den Nachweis zu führen, dass der Coefficient s in der angegebenen Weise bestimmt werden kann, nehmen wir an, es sei q> irgendwie in eine Summe von Quadraten verwandelt G) cp = Ajy\ -f- A2y% -)-••• -\- KiVm, und ^, in den Variablen yx, y2, . . ., ym dargestellt, habe den Ausdruck Die Zahlen «, v für die Function cp' werden dann aus der Kette der Haupt-Unterdeterininanten von (9) -\- £02,2 £02,») Sßm, £ 0«i,l5 £0m,2 . . • Aj nach dem Satze V. bestimmt. Nun kann man aber s so klein annehmen, dass diese Haupt- Unterdeterminanten dem Zeichen nach übereinstimmen mit Aj^ A3 . . . ATO, Aj A2 A3 . . . ATO_1, . . ., Aj, A2, A15 1, und dann ist die Anzahl der positiven und negativen Quadrate von cp' gleich der Anzahl der positiven und negativen unter den Coefficienten A, von denen keiner verschwindet, d. h. die Zahlen it und v sind für cp und cp' dieselben. Sind nun die Coefficienten von ty, in den ursprünglichen Variablen ausgedrückt, J,-jto also so ist eine der Haupt-Unterdeterminanten von cp' und ist also eine ganze rationale Function fcten Grades von e, worin die Jf15 Jlf2, . . ., Jf^ rational von den aiilc, hilc abhängen. Insbesondere ist und man kann die iitlc immer so annehmen, dass Mje von Null verschieden ist. Nach §. 34 kann man also s so annehmen, dass,
§. 89. Zeichenfolgen und Zeichenwechsel. 295 wenn Ry von Null verschieden ist, R'k dasselbe Zeichen hat, wie ü?fa und wenn Ry, verschwindet, R'y nicht verschwindet. Wir können das hierdurch Bewiesene mit den Ergebnissen des §. 87 in eine allgemeine Regel zur Bestimmung der Anzahl der negativen Quadrate, auch für den Fall verschwindender Determinante, zusammenfassen. VI. Um die charakteristischen Zahlen «, v, q der Function cp(x) zu bestimmen, ordne man die Variablen a^, a%, . . ., xm so an, dass in der Kette der Haupt-Unterdeterminanten A0) Rm, Rm—1, • • ; Hi, R6 eine möglichst kleine Anzahl von Anfangs- Anfangsgliedern verschwindet, und dass von den folgen- folgenden Gliedern nicht zwei neben einander stehende verschwinden; q ist dann die Anzahl der ver- verschwindenden Anfangsglieder, v die Anzahl der Zeichenwechsel und % = m — v — q x). Zu bemerken ist noch, dass man die Anzahl der Zeichen- Zeichenwechsel in der Reihe A0) auch von rechts nach links abzählen kann, d. h. dass man dieselbe Anzahl von Zeichenwechseln findet, wenn man die Reihe in umgekehrter Ordnung schreibt. Bezeichnen wir mit «, v, q die charakteristischen Zahlen der Form cp und bilden die Form <p' = <p -\- sty, so können wir i\> so bestimmen, dass die Determinante von <p' nicht identisch für jedes £ verschwindet. Dann sind n', v', 0 die charakteristischen Zahlen von q>' und A1) X> -\-v' = 7t + V -{- Q. Es ist dann in G) ATO = 0, nm—i = 0, . . ., A,m — q+i = 0, Am_?, AOT_?_!, . . ., Ax von Null verschieden, i 1) Hierüber ist zu vergleichen Gundelfinger's Zusatz zur dritten Auflage von Hesse's analytischer Geometrie des Raumes. Frobenius, „Ueber das Trägheitsgesetz der quadratischen Formen". Sitzungsberichte der Berliner Akademie 1894. Frobenius giebt ein Verfahren an, um die Signatur, also die Differenz n — v, in gewissen Fällen auch dann aus der Kette G) zu bestimmen, wenn darin beliebige Glieder verschwinden, so dass ein vorheriges Ordnen der Indices entweder ganz vermieden oder wenigstens eingeschränkt wird.
296 Siebenter Abschnitt. §. 90. In der Kette der Haupt-Unterdeterminanten von (9) stimmen dann bei hinlänglich kleinem e die m — q Endglieder im Vor- Vorzeichen überein mit 1, A1? Ai A2, . . ., Ax A2 . . . ATO_£,, und die Anzahl der in dieser Kette vorkommenden Zeichenfolgen ist daher mindestens gleich der Anzahl der positiven X und die Anzahl der Zeichenwechsel mindestens gleich der Anzahl der negativen L Es ergiebt sich hieraus A2) «' ^> », t/ JS v. Nennen, wir eine Form q>, deren charakteristische Zahlen it = m, v = 0, p = 0 sind, die also als Summe von n positiven Quadraten von einander unabhängiger linearer Functionen dar- darstellbar ist, eine positive Form, so gilt der Satz, dass für eine positive Form keine der Haupt-Unterdeterminanten verschwinden kann. Denn eine positive Form kann für kein reelles Werth- system der Variablen xu x2, . . ., xm verschwinden, ausser wenn diese Variablen alle gleich Null sind. Wenn aber nun die Haupt-Unterdeterminante i?s = 0 ist, so ist die Function von Ti Variablen cp (xu x2, . . ., xk, 0, . . ., 0), deren Determinante eben Bk ist, durch weniger als n lineare Functionen der xv x2, . . ., #*, etwa yv yt, .. ., y^—i, darstellbar, und die Function <p verschwindet daher, wenn «/i = 0,..., «/fc-! = 0, xt+1 = 0, . . ., xm — 0, ist. Dies ist ein System linearer Gleichungen, das durch nicht verschwindende x befriedigt werden kann. Daraus ergiebt sich VII. Die nothwendige und hinreichende Bedingung für eine positive Form ist die, dass die Glieder der Kette G) alle positiv sind. Den entsprechenden Satz für eine negative Form erhält man, wenn man VII. auf die Form — cp anwendet. Positive und nega- negative Formen werden auch unter dem Namen der definiten Formen zusammengefasst. §. 90. Anwendung auf die Bezoutiante. Die genaue Discussion der Trägheit der quadratischen Formen hatte für uns den Zweck, die Anzahl der reellen und
§. 90. Anwendung auf die Bezoutiante. 297 imaginären Wurzeln einer algebraischen Gleichung durch Ab- Abzählung der positiven und negativen Quadrate der Bezoutiante zu bestimmen. Ist n der Grad der Gleichung, so ist ihre Bezoutiante eine quadratische Form von n — 1 Veränderlichen, und im §. 79 haben wir sie für n = 3, 4, 5 vollständig gebildet, und die Wege kennen gelernt, wie man auch in anderen Fällen zu ihrer Berechnung gelangen kann. Wir haben schon früher bemerkt, dass die Bezoutiante nicht eine allgemeine quadratische Form ist, sondern dass sie die be- besondere Eigenthümlichkeit hat, dass die Anzahl v ihrer negativen Quadrate niemals grösser als \n werden kann. Diese Eigen- Eigenthümlichkeit muss in gewissen Ungleichheitsbedingungen zwischen den Coefficienten ihren Ausdruck finden, die aber zur Zeit noch nicht bekannt sind. Nur in dem Falle n = 3 können wir den algebraischen Charakter dieser Beschränkung vollständig angeben. Für die cubische Gleichung f(x) = a0 x* -\- % x2 -(- % x -\- a3 = 0 ist die Bezoutiante nach §. 79, A3) nichts Anderes, als die Hesse'sche Covariante (§. 68) -1 H&, *,) = — ! D, n + A *i *o + A *<?)• Es besteht aber, wenn D die Discriminante, also SD = <LA0A2 — AI ist, die Relation 4#3_j_ Q2 _^_ 27Dß = 0, mithin, wenn wir darin £0 = .0 setzen, A) 4^03 + <z0ä + 27Z>a0ä = 0, wenn q0 = 27a02a3 — 9a0<% <h + 2a>i ist. Diese Relation zeigt, dass Aa und D nicht zugleich positiv sein können, und dass also die Form — H nicht in zwei negative Quadrate zerlegbar ist. , Wir wollen den allgemeinen Satz des vorigen Paragraphen noch auf die biquadratische Gleichung anwenden, die wir der Einfachheit halber in der Form B) x± + ax2 + ^x + c = 0 annehmen. Um die Coefficienten der Bezoutiante zu bilden, haben wir in den Formeln §. 79, A4) «0> (hl «25 «3) «4 durch
298 Siebenter Abschnitt. §. 90. 1, 0, o, b, c zu ersetzen. Wir erhalten so £22 —_ 2a, £M = a2 — 4c, JB0,o = — |(8ac ~ 3&2)' Bo>1 = \ab, JB2,o = — 4 c, _BM = — 3 b. . Wir ordnen die Determinante so an: — 2 a, — 3 b, —4c — 3 5, a2 — 4 c, \ab — 4c, fa&, —i(8ac —3&2 und erhalten die Kette der Haupt-Unterdeterminanten C) -D, — 2as + 8ac — 9&V — 2a," 1) wenn J> die Discriminante bedeutet, die nach §. 53, A3) bestimmt ist durch D) 27 D = 4 (a2 + 12 c)s — B «3 _ 72 a c -f 27 &2J. Das Kennzeichen dafür, dass alle vier Wurzeln reell sind, ist hiernach E) B > 0, — 2 a» + 8 a c — 9 b2 > 0, — 2 a > 0. Dies Kennzeichen ist scheinbar verschieden und jedenfalls weniger einfach, als das in §. 84 aufgestellte F) D > 0, a < 0, a2 — 4e> 0. Wir wollen aber nun noch nachweisen, dass beides genau dasselbe besagt. Zunächst ist sofort zu übersehen, dass F) erfüllt sein muss, wenn E) erfüllt ist, denn — 2 a (a2 — 4 c) — 9 62 kann nicht positiv sein, wenn a und a2 — 4c negativ sind; um aber umgekehrt einzusehen, dass aus F) die Bedingungen E) folgen, müssen wir den Werth von D in Betracht ziehen. Wir setzen zur Abkürzung G) « = — 2a, |3 = — 6as-|-24ac — 27J2, j> = 3a2 — 12c, so dass die Bedingungen E) a > 0, |3 > 0, D > 0, die Bedingungen F) a>0, r>0, .D>0 lauten; dann ist nachzuweisen, dass, wenn «, <y und J> positiv sind, auch ß positiv sein muss. Hierzu drücken wir D in D) nach G) durch «, ß, <y aus und erhalten 27 D — 4(«2 — y)8 — [2«(«2 — y) — ß]K
§. 90. Biquadratische Gleichung. 299 Wenn D positiv ist, so muss hiernach gewiss «2 — y positiv sein. Setzen wir also u? — y = <S2, so ist «2 > d2, also, wenn d positiv genommen wird, «> d und 27 D = 4<S« — Bad* — |3J. Hiernach kann D bei negativem |3 nicht positiv sein; denn ist ß negativ, so ist 2«<S2 — |3> 2«<S2> 2^3, also 4 de — B a <S* — |3J negativ. Es ist hiermit direct nachgewiesen, dass die Kriterien E) und F) genau dasselbe besagen. Nach der im §. 84 gegebenen geometrischen Interpretation bedeutet ß = 0 eine Fläche dritter Ordnung, die durch die Parabel b = 0, y = 0 hindurchgeht, und die, soweit negative Werthe von a in Betracht kommen, ganz in dem Raumtheil ver- verläuft, in dem D negativ ist. Um für die Gleichung fünften Grades ein Beispiel vor Augen zu haben, betrachten wir die Gleichung x'" -\- x* + a = 0. Wir haben also in unseren allgemeinen Ausdrücken §. 79 oder auch §. 80, B), C) zu setzen a0, au a2, a3, a4, a-0 = 1, 0, 0, 1, 0, o, und wir erhalten für die Determinante der Bezoutiante — 2 a, 0, 0, —5a 0, f, — 5 a, 0 0, — 5 a, 0,-3 — 5 a, 0,-3, 0 und für die Discriminante D = 108 a + 3125 aK Eine Kette von Haupt-Unterdeterminanten ist 13' 108 (8) 12), 50 a\ -^—, -2 a, 1. Die Discriminante ist negativ, wenn (9) ¦ 0 <-a<]/} 3125'
300 Siebenter Abschnitt. 90. sonst positiv, besonders also für alle positiven a positiv. Man sieht, dass bei positiver Discriminante in (8) immer zwei Zeichenwechsel, bei negativer Discriminante, wo auch a negativ ist, ein Zeichenwechsel stattfindet. Unsere Gleichung hat also, so lange a in dem Intervall (9) liegt, zwei imaginäre Wurzeln, wenn es ausserhalb dieses Inter- valles liegt, vier imaginäre Wurzeln, niemals vier reelle Wurzeln. Ein rein numerisches Beispiel bietet die der complexen Multiplication der elliptischen Functionen entnommene Gleichung x$ _ xz _ 2 a;2 — 2 x — 1 = 0. Für die Determinante der Bezoutiante erhalten wir aus §. 79: — 4 5 ' — 3 5 ' 4 ~5' 5, — 3 5 ' 4 5' 33 T' 8, 4 51 33 5' 46 1P 6, i 6 und die Kette der Haupt-Unterdeterminanten 472 94 , — 4 T' "' 1, 1, so dass die Discriminante unserer Gleichung 472 ist. Die Gleichung hat also zwei Paar imaginäre und eine reelle Wurzel. Das zweite Glied dieser Kette 94 : 5 braucht man, wenn man die Discriminante kennt, nicht zu berechnen, ja es genügt schon die Kenntniss des negativen Vorzeichens im vorletzten Gliede, um die vorstehende Entscheidung über die Realität der Wurzeln zu treffen.
Achter Abschnitt. Der Sturm'sche Lehrsatz. §• 91, Das Sturm'sche Problem. Die im vorigen Abschnitt behandelte Frage nach der Anzahl der reellen Wurzeln einer Gleichung ist ein specieller Fall eines allgemeineren Problems, das den Gegenstand dieses Abschnittes ausmachen soll, und das die Grundlage ist für alle Methoden der genäherten numerischen Berechnung von Gleichungswurzeln. Es handelt sich um die Frage: wie viele reelle Wurzeln einer reellen numerischen Gleichung liegen zwischen zwei gegebenen reellen Zahlwerthen a und b? Ist dies entschieden, so handelt es sich weiter darum, die Grenzen a, b so weit einzuengen, dass nur noch eine Wurzel der gegebenen Gleichung zwischen ihnen liegt, und sie endlich einander so weit zu nähern, dass jede von ihnen als ein ge- genäherter Werth dieser Wurzel betrachtet werden kann. Nehmen wir a = — oo, b = -\- oo, oder doch a negativ, b positiv so gross an, dass jenseits dieser Grenzen keine Wurzeln mehr liegen können, so fällt diese Aufgabe mit der im vorigen Abschnitt behandelten, die Anzahl aller reellen Wurzeln zu be- bestimmen, zusammen. Wir wollen zunächst zeigen, wie sich das allgemeine Problem auf das specielle zurückführen lässt, wie also unsere jetzt auf- aufgeworfene Frage, im Princip wenigstens, durch die Betrachtungen des vorigen Abschnittes beantwortet ist. Es möge sich zunächst
302 Achter Abschnitt. §. 92. darum handeln, die Anzahl der positiven Wurzeln einer Gleichung f(x) = 0 zu ermitteln. Setzen wir x = y2, so wird jedem reellen Werth von y ein positiver Werth von x ent- entsprechen, und umgekehrt entsprechen jedem positiven Werth von x zwei reelle, entgegengesetzte Werthe von y. Die Anzahl der positiven Wurzeln von f(x) ¦= 0 ist also halb so gross, als die Anzahl der reellen Wurzeln von f(y2) = 0. Setzen wir ferner x — a y = T^x-^ so wird, während x von a bis b geht, y durch positive Werthe von Null bis Unendlich gehen, und wenn wir durch diese Sub- Substitution f(x) in F(y) transformiren, so wird f(x) = 0 ebenso viele Wurzeln zwischen a und b haben, als F(y) = 0 positive Wurzeln hat, mithin halb so viel als F(s2) = 0 reelle Wurzeln hat. Unsere Aufgabe ist also dadurch in der That auf die Ermittelung der Anzahl der reellen Wurzeln einer gewissen anderen Gleichung zurückgeführt, deren Grad doppelt so gross ist, als der Grad der gegebenen Gleichung. Diese Zurück- Zurückfuhrung des Problems giebt aber seine Lösung nicht in der einfachsten Form, und wir müssen nach einer einfacheren Be- Beantwortung der Frage suchen. §. 92. Die Sturm'schen Ketten. Zu einer Lösung des Problems, das wir uns im vorigen Paragraphen gestellt haben, führt uns folgende Betrachtung. Es seien « und ß irgend zwei reelle Zahlen und « < ß. Es sei ferner fix) eine gegebene ganze rationale Function von x, von der ermittelt werden soll, wie viele ihrer Wurzeln in dem Intervall z/ « < x < ß liegen. Wir nehmen an, dass «, ß nicht selbst zu den Wurzeln von f(x) = 0 gehören, dass also /(«) und f(ß) von Null ver- verschieden sind. Ausserdem wollen wir noch fürs erste annehmen, dass f(x), wenigstens in dem Intervall z/, keine mehrfache Wurzel habe, dass also für keinen Werth des Intervalls f(x) und f (x) zugleich verschwinden sollen.
§. 92. Die Sturm'schen Ketten. " 303 Wir nehmen an, dass wir auf irgend eine Weise eine Reihe von m -\- 1 stetigen Functionen herstellen können (i) . ./(*),-/i(*), h D ...,/«(*), ' («) denen folgende Eigenschaften zukommen: 1. Von den Functionen/,, sollen im Intervall /l nicht zwei auf einander folgende zugleich verschwinden. 2. Die letzte von ihnen, fm(x), soll im Intervall J überhaupt nicht verschwinden, also ein unver- unveränderliches Zeichen behalten. 3. Wenn ein mittleres Glied, etwa/„(a;), für irgend ein x im Intervall <d verschwindet, so sollen für dieses x die beiden angrenzenden Functionen fv-i(x) und fv+1(x) entgegengesetztes Vorzeichen haben. 4. Wenn/(V) im Intervall z/ verschwindet, so soll /i (x) für diesen Werth von x dasselbe Vorzeichen haben wie f'(x). Eine solche Functionenreihe($) wollen wir eine Sturm'sche Kette nennen. Wie man sie bilden kann, werden wir später sehen; zunächst sollen aus der Definition Folgerungen gezogen werden. Für jeden Werth von x, für den keine der Functionen von (ß) verschwindet, hat jede dieser Functionen ein bestimmtes Vorzeichen. Wir zählen einen Zeichenwechsel, so oft beim Durchlaufen der Kette von links nach rechts auf ein positives Glied ein negatives oder auf ein negatives Glied ein positives folgt. Die Anzahl der so gezählten Zeichenwechsel (Variationen) für einen bestimmten Werth von x wollen wir mit V(x) be- bezeichnen. Wenn ein mittleres Glied /„ (x) verschwindet, so haben wir nach 3. beim Uebergang von /,,_] (x) zu fv+1 (x) einen Zeichen- Zeichenwechsel zu zählen. Sind «, ß zwei Werthe, für die keine der Functionen /„ ver- verschwindet, und lassen wir nun x stetig wachsen von « bis ß, so wird eine Aenderung in der Zahl der Zeichenwechsel nur dann eintreten können, wenn eine der Functionen von (R) ihr Zeichen wechselt, also durch den Werth Null hindurchgeht (wegen der vorausgesetzten Stetigkeit). Ist dies aber eine mittlere Function, so ändert sich die Zahl der Zeichenwechsel nicht (nach 3). Denn in /»—n /v) fv + i
304 Achter Abschnitt. §. 93. findet vor und nach dem Durchgange von /„ durch Null immer ein Zeichenwechsel statt, weil fv + i und /v_i entgegengesetzte Zeichen haben. Wenn aber f(x) durch Null geht, so geht beim Durchgange wegen 4. ein Zeichenwechsel verloren. Denn geht/(a;) von nega- negativen zu positiven Werthen, so ist (vergl. §. 35) f(x) und mithin fi(x) positiv und die Vorzeichen ändern sich so: + + und wenn f{x) von positiven zu negativen Werthen übergeht, so ist/'(#) und fx (x) negativ, also die Zeichen so: /D/iW ¦ + - i mithin ist in beiden Fällen ein Zeichenwechsel verloren gegangen. Da nun fm (x) nach 2. sein Zeichen nicht wechselt, so folgt, dass V (k) — V(ß) gleich der Anzahl der zwischen « und ß gelegenen Wurzeln von f(x) = 0 ist, oder: Die Anzahl der Wurzeln von f(x) = 0 zwischen « und ß ist gleich dem Ueberschuss der Anzahl der Zeichenwechsel der Kette für x = a über die Anzahl der Zeichenwechsel für x = ß. Wenn für x = « oder x = ß eine oder einige der mittleren Functionen von ($) verschwinden sollten, so ist es wegen 3. gleich- gleichgültig , ob wir diesen verschwindenden Werth durch einen posi- positiven oder einen negativen ersetzen. §. 93. Erstes Beispiel: Kugelfunctionen. Ehe wir nun zu den allgemeinen Methoden übergehen, nach denen Sturm'sche Ketten zu bilden sind, wollen wir einige Beispiele betrachten, in denen sich durch besondere Umstände solche Ketten darbieten. Wir betrachten zunächst die sogenannten Kugel func- functionen, die in der mathematischen Physik und Mechanik viel- vielfach gebraucht werden.
§. 93. Kugelfunctionen. 305 Unter Kugelfunctionen versteht man ein System ganzer rationaler Functionen von steigendem Grade, das folgendermaassen definirt ist: Po(*)=l P1 (x) = x P8(s) =§(**-!) P,(«) = |(«8-f x) D . . 1 . 3 . . . Bn — 1) / w(w — 1) „ jrn{X) — 1.2...W V 2Bn —1) WQ - 1) (n - 2) (n - 3) _ \ ~r 2 . 4 B n — 1) B n — 3) ' " '/ so dass P„(a;) eine ganze rationale Function wten Grades ist, und, je nachdem n gerade oder ungerade ist, nur die geraden oder- nur die ungeraden Potenzen enthält. Durch Anwendung des Zeichens IJ(n) kann man den allgemeinen Ausdruck für die Kugelfunctionen auch so darstellen: worin die Summe in Bezug auf [i von p = 0 an so weit zu er- erstrecken ist, als n — 2 p nicht negativ wird. Zwischen diesen Functionen bestehen die folgenden Rela- Relationen, die sich nach Einsetzen des Ausdruckes A) durch ein- einfache Vergleichung der Coefficienten gleicher Potenzen von x verificiren lassen, B) nPn{x) — Bn - l)x Pn-x(%) + (n — 1) P»_a(«) = 0 P^x) -xP0(x) = 0 C) A — x*) P'n(z) + nxPn(x) - nP„_!(*) = 0. Aus der letzten Gleichung folgt für sj = il ±P»(±1) = P—i(±l), also D) P»(l)=l, P„(-l) = (-l)». Aus B) und C) folgt nun, dass die Functionen Pn, von einem beliebigen m an abwärts geordnet, E) Pmi Pm — lt Pm—% • • • Po in dem Intervall von — 1 bis -|— 1 die Eigenschaften einer Sturm'schen Kette haben. Denn wenn P„ und Pn—\ für irgend Weber, Algebra. I. 20
306 Achter Abschnitt. §. 93. ein x zugleich verschwänden, so müsste nach B) auch P„_2, folglich P„_8 etc. bis Po verschwinden, was unmöglich ist, da Po = 1 ist. Hiernach ist §. 92, 1. erfüllt, und weil Po = 1 ist, so ist auch die Bedingung §. 92, 2. für jedes beliebige Intervall befriedigt. Ist P»_i = 0, so ist nach B) P„ und P„-2 von entgegen- entgegengesetztem Vorzeichen, wie die Bedingung §. 92, 3. fordert. Aus C) folgt, dass niemals P„(x) und P'n(%) zugleich ver- verschwinden, da sonst auch Pn—1(x) verschwinden müsste, und endlich ergiebt sich aus C), dass, wenn Pn(x) verschwindet und — 1 < x < 1 ist, Fn(x) und P„_i(.¦*:) dasselbe Vorzeichen haben. Setzen wir nun in E) für x die Werthe — 1, -\~ 1 ein, so folgt aus D), dass für x = — 1 in E) lauter Zeichenwechsel stattfinden, für x = -\- 1 gar kein Zeichen Wechsel; und daraus folgt: D^e Gleichung Pm(x) = 0 hat m reelle Wurzeln zwischen x = — 1* und x = -f- 1, und da Pm vom «wten Grade ist, so sind dies alle Wurzeln. . Wir können aber einen noch etwas weiter gehenden Schluss ziehen. Nehmen wir ein Intervall /l = («, ß), in dem zwei und nicht mehr Wurzeln f, tj von Pm = 0 enthalten sind, so gehen beim Uebergang von « zu ß in der Kette E) zwei Zeichenwechsel verloren. Wir nehmen « so nahe an f, ß so nahe an ij, dass Pm_i(«) mit Pm_i(f) und Pm_j (ß) mit ?m-1(ri) von gleichem Vorzeichen ist. Wenn Pm beim Durchgang durch f vom Nega- Negativen zum Positiven geht, so geht es beim Durchgang durch rj vom Positiven zum Negativen; es ist also Pm(l) und folglich Pm_i(|) und Pm_i(«) positiv, P'm{r[) und folglich Pm_1(i)) und Pm-i(ß) negativ, und das Umgekehrte findet statt, wennPTO beim Durchgang durch f vom Positiven zum Negativen geht. Man sieht also daraus, dass beim Uebergang von a zu ß in -t*m} -^ m — 1 ein Zeichenwechsel verloren geht, also muss bei dem gleichen Uebergang, und folglich auch bei dem Uebergang von f zu r\ in der Kette ¦*m — h -£»» — 2 • • • -M> gleichfalls ein Zeichenwechsel verloren gehen; daraus schliessen wir auf den Satz:
§. 94. Die Säculargleichung. 307 Zwischen zwei auf einander folgenden Wurzeln von Pm = 0 liegt eine und nur eine Wurzel von Pm-l = 0. §• 94. Zweites Beispiel. Als zweites Beispiel betrachten wir eine Gleichung, die wir der Kürze wegen die Säcular-Gleichung nennen wollen, weil die Untersuchung der säcularen Störungen der Planeten zuerst auf sie geführt hat1). Sie ist auch sonst wohl unter diesem Namen bekannt, kommt aber auch in vielen anderen Unter- Untersuchungen vor, z. B. bei der Bestimmung der Hauptaxen einer Fläche zweiten Grades, in der Theorie der kleinen Schwingungen; ihre allgemeine analytische Bedeutung liegt darin, dass sie eine besondere, die sogenannte orthogonale Transformation einer qua- quadratischen Form in eine Summe von Quadraten liefert. Wir wollen hier die Gleichung nehmen, wie sie vorliegt, ohne Be- Beziehung auf irgend eine Anwendung, und wollen sie nach unseren allgemeinen Sätzen discutiren. Es sei a^fc, wenn i und k die Reihe der Indices 1, 2, 3 ... n durchlaufen, irgend ein System reeller Grossen und A) «<,» = «M vorausgesetzt. Wir betrachten die symmetrische Determinante X B) Ln(x) = die eine ganze rationale Function wten Grades von x ist, in der xn den Coefficienten (— 1)" hat. Die Gleichung L„(x) = 0 soll der Gegenstand unserer Betrachtung sein. Wir bilden die mit abwechselnden Zeichen genommene Kette der Haupt-Unterdeterminanten C) Ln(x), -£„_!<», Ln-a(x) ...,(- lf-'L^x), (- 1)", !) Laplace, Histoire de l'Aoademie des Sciences 1772. Von neueren Werken kann man darüber vergleichen Dziobek, Theorie der Planeten- bewegung, Leipzig 1888. 20*
308 Achter Abschnitt. §. 94. und wollen nun nachweisen, dass, wenn wir die Voraussetzung hinzufügen, dass von den Grossen C) keine zwei auf einander folgende zugleich verschwinden, wir eine Sturm'sehe Kette vor uns haben. Es ist dies eine einfache Folgerung aus der Formel, die wir schon im §. 88 zu einem ähnlichen Zwecke benutzt haben, und die wir so darstellen können: D) worin Sk und Tk ganze rationale Functionen von x sind. Wir haben nur zu zeigen, dass die Forderungen §. 92, 1. bis 4. befriedigt sind. Davon ist aber 1. in die Voraussetzung auf- aufgenommen, 2. ist erfüllt, da das letzte Element gleich + 1 ist. Aus der Formel D) folgt, dass, wenn Lh = 0 ist, Lk—i und Z^+i entgegengesetzte Zeichen haben, dass also die Bedingung 3. erfüllt ist. Es bleibt nur noch die Bedingung 4. übrig. Wenden wir aber die Formel D) auf k = n — 1 an, so lautet sie dLn dL» ( dLn 55^ Oan,n 0 an — l, n — 1 und daraus folgt, dass, wenn Ln := 0 ist, gleiche Zeichen haben; und ebenso kann man schliessen, dass alle Haupt-Unterdeterminanten von Ln dasselbe Zeichen haben. Nun ist aber die Derivirte von Ln (vergl. §. 25) und hat also für einen Werth x, für den Ln{x) verschwindet, das entgegengesetzte Zeichen, wie Ln—i, was eben die Forde- Forderung 4. verlangt. Daraus folgt der Satz: I. Sind «, ß zwei reelle Werthe, k < ß, so ist die Anzahl der zwischen « und ß gelegenen Wurzeln von Ln(x) gleich dem Ueberschuss der Anzahl der Zeichenwechsel der Kette C) für x = « über die Anzahl der Zeichenwechsel für x = ß.
§. 94. Die Säculargleichung. 309 Die höchste Potenz von x, die in Lk(x) vorkommt, ist, wie schon oben bemerkt, (- 1)*^, und wenn der absolute Werth von x hinlänglich gross ist, so wird das Vorzeichen dieses Gliedes über das Vorzeichen von Lk (x) entscheiden. Nehmen wir also für « einen genügend grossen negativen, für ß einen genügend grossen positiven Werth, so finden in C) für x = « lauter Zeichen Wechsel, für x = ß lauter Zeichenfolgen statt. Es werden also n Wurzeln zwischen « und ß liegen, und daraus folgt der Satz: II. Die Gleichung Ln(x) = 0 hat lauter reelle' Wurzeln. Diese beiden Sätze sind aber nur von beschränkter Anwend- Anwendbarkeit, so lange wir uns nicht von der Voraussetzung frei machen können, dass in der Kette der Z% nicht zwei auf ein- einander folgende Glieder zugleich verschwinden sollen. Von dieser Beschränkung können wir den Satz aber durch folgende einfache Ueberlegung befreien. Nehmen wir an, für irgend einen Werth von x verschwinde Lj„ aber nicht L%—i] wir können dann die Grossen aÄ + 1)f, die in Lk nicht vorkommen, so bestimmen, dass Lfc+i für diesen Werth von x nicht verschwindet; denn es kann L^ + i nicht identisch für alle a»+i,< verschwinden, weil es das Glied enthält [§. 26, A2)]. Hiernach können wir, wenn in der Kette E) Lm —£»_i, £»_a • • • ± A) +1 einige auf einander folgende Glieder für irgend einen Werth von x verschwinden, durch Abänderung der a^ eine andere Reihe F) L'n, —-£4-i, £»—2 • • • i L'u +1 ableiten, in der keine zwei auf einander folgenden Glieder für irgend einen Werth x (des Intervalles « . . . ß) verschwinden. Zugleich können die aj,», von denen die L' abhängen, so angenommen werden, dass sie sich von den a^ um weniger als eine beliebig gegebene Grosse co unterscheiden. Wenn nun die Zahlen «, ß so angenommen sind, dass in der Reihe E) kein Glied für x = « oder x = ß verschwindet, so können wir ra so klein annehmen, dass für x = « und x = ß
310 Achter Abschnitt. §. 94. entsprechende Glieder von E) und F) dasselbe Vorzeichen haben. Durch unseren Satz ist aber die Anzahl der Wurzeln von L'n = 0 zwischen a und ß durch die Zeichen der Reihe F) bestimmt. Nun lässt sich andererseits wieder o so klein annehmen, dass die Wurzeln von L'n = 0 von denen von Ln = 0 beliebig wenig unterschieden sind (§. 44). Es kann zwar eine Doppelwurzel von Ln = 0 in zwei ein- einfache Wurzeln von L'm = 0 übergehen; aber da L'„ = 0 keine imaginären Wurzeln hat, so sind diese reell; und dasselbe findet statt, wenn L„ = 0 mehrfache Wurzeln hat. Hiernach behalten die Sätze I. II. ihre Gültigkeit, wenn die Voraussetzung aufgegeben wird, dass in der Kette der Lk keine auf einander folgenden Glieder ver- verschwinden; nur müssen die mehrfachen Wurzeln dabei nach ihrer Vielfachheit gezählt werden. Hieraus können wir eine merkwürdige Beziehung der Säcular- gleichung zu dem Trägheitsgesetz der quadratischen Formen herleiten, die in der Geometrie, bei der Bestimmung der Haupt- axen einer Fläche zweiten Grades wohl bekannt ist. Wir betrachten neben der Function Ln(x) die quadratische Form G) <p (xx, X2, . . ., Xn) = 2Oi,n0Ci%n\ dann ist Ln(s) für ein beliebiges £ die Determinante der Form (8) 9'=9—6(«? + «! \-xl). Die Gleichung Ln{x) = 0 möge P positive, N negative und B verschwindende Wurzeln haben. Wir nehmen £ positiv an, aber so klein, dass alle positiven Wurzeln von L grösser als £ sind, und ausserdem so, dass kein Glied der Reihe C) für x = £ verschwindet. Dann ist (9) Ln(s), Ln^(B),..., L^s^l eine Kette von Hauptunterdeterminanten für die Function <jp', und wenn wir also mit %\ v', 0 die charakteristischen Zahlen von q>\ bezeichnen, so ist %' (nach §. 89, V.) gleich der Anzahl der Zeichenfolgen, v' gleich der Anzahl der Zeichenwechsel in der Kette (9). Wenn wir aber das Theorem I. anwenden, indem wir « = £ setzen, und ß grösser als alle Wurzeln von Ln (x) annehmen, so dass in der Kette C) für x = ß nur noch Zeichenfolgen vor-
§. 95. Die Sturm'chen Functionen. 311 kommen, so giebt uns die Anzahl der Zeichenwechsel in C) für x = £, die mit der Anzahl der Zeichenfolgen in (9) überein- übereinstimmt, die Zahl P der positiven Wurzeln von Ln (x) = 0. Dem- Demnach ist, weil ausserdem noch 3t'-\-v' = P-^-N-\-B = n ist, A0) jr' = P, v' = N-{-B. Wir nehmen nun die Functionen q> und <jp' in folgender Weise in ihre positiven und negativen Quadrate zerlegt an: A1) <p = y» + j/H \-y*-g* — e2 0*. A2) 9'=9-«(«? + asH \-xl) = r» + rn 1- y% -zi-zi zi Wenn nun % -\- v' < n ist, so können wir die x1, x2,..., xm zum Theil wenigstens von Null verschieden, so bestimmen, dass Vi = 0, y, = 0, . . ., yn = 0, Z, = 0, Z2 = 0, . . ., Zt> = 0. Dann aber ergiebt die erste Darstellung A2) mit Hülfe von A1) einen negativen, die zweite einen positiven (oder verschwin- verschwindenden) Werth von <p', so dass die Annahme % -\- v' < n un- unstatthaft ist. Es ist also % -\- v' ^ n = %' -\- v', also nach A0) Andererseits folgt aber aus §. 86 A2) P^rc, was nur mit einander verträglich ist, wenn A3) % = P ist. Ebenso können wir nun auch beweisen, indem wir statt eines positiven ein negatives s zu Hülfe nehmen, dass v = N und folglich q = B sein muss. Wir sprechen dies noch als einen Satz aus: III. Die charakteristischen Zahlen sr, v, q der quadra- quadratischen Form y sind gleich den Anzahlen der positiven, negativen und verschwindenden Wur- Wurzeln der zugehörigen Säculargleichung. §. 95. Die Sturm'schen Functionen. Nach diesen besonderen Beispielen wenden wir uns zur Be- Betrachtung des Verfahrens, durch das man in allen Fällen eine
312 Achter Abschnitt. §. 95. Sturm'sche Kette erhält1). Die Bildungsweise dieser Functionen ist principiell ausserordentlich einfach, wenn auch in der prak- praktischen Ausführung meist nicht durchführbar. Wir beschränken uns hier auf die Betrachtung von Glei- Gleichungen ohne mehrfache Wurzeln, oder wir nehmen an, dass vor der Anwendung des darzulegenden Verfahrens f(x) von jedem gemeinschaftlichen Factor mit seiner Derivirten /' (x) befreit sei. Wenn wir dann A) /i (*)=/'(*) annehmen, so ist sicher die Bedingung §. 92, 4. befriedigt. Nun verfahren wir so, als ob es sich um die Aufsuchung des grössten gemeinschaftlichen Theilers von f(x) und fx (x) handle, indem wir dabei jedesmal das Vorzeichen des Restes umkehren; wir bilden also durch Division die Gleichungen B) /i = #2/2 —/s fm—2 == im—lfm—2 fmi worin die g15 q2, . . ., #m_i und ebenso die /15 /2, ...,/», ganze rationale Functionen von x sind; die Grade der Functionen /,/i,/a, • • ;fm nehmen ab und man kann daher die Operation so weit fortsetzen, dass fm constant ist, oder wenigstens in dem betrachteten Intervall nicht mehr verschwindet. Dass fm nicht Null werden kann, ist eine Folge der Voraussetzung, dass / und fx ohne gemeinsamen Theiler sind.. Dass man dann in der Reihe C) /,/1,/a,...,/«- wirklich eine Sturm'sche Kette hat, ergiebt sich unmittelbar, wenn man die Kriterien §.92, 1. bis 4. durchgeht. Denn wenn zwei auf einander folgende der Functionen C) zugleich ver- verschwinden, so verschwinden nach B) auch alle nachfolgenden; dies ist aber unmöglich, weil fm von Null verschieden ist. Ist aber /„ (x) = 0, so folgt aus B) womit alle die Forderungen des §. 92 befriedigt sind. x) Stürm, Mem. sur la resolution des equations numeriques. Mem. de l'academie de Paris. Sav. etrang. VI, 1835. Auszug in Bull, de Ferussac XI, 1829.
§. 96. Hermite's Lösung des Sturm'sehen Problems. 313 Es ist, wie sich von selbst versteht, gestattet, die Functionen der Reihe C) mit positiven, z. B. constanten Factoren zu multi- pliciren, ohne dass sie aufhören, eine Sturm'sehe Kette zu bilden. Für n = 2 können wir demnach als die Sturm'sehen Functionen folgende nehmen: f(x) = x* -j- ax -j- i f1(x)=2x-\- a §. 96. Hermite's Lösung des Sturm'schen Problems. Ein anderer "Weg zur Lösung des Sturm'schen Problems, der zu einfacheren Resultaten führt, wenigstens was die Durch- Durchführung der Rechnung im Einzelnen betrifft, ist von Hermite eingeschlagen, der an das Trägheitsgesetz der quadratischen Formen und die Tschirnhausen-Transformation anknüpft1). Es sei A) fix) = aoxn -|- axxn~x -| • -j- an_xx + an = 0 die vorgelegte Gleichung und («) %u x2, . . ., xn ihre Wurzeln, die wir von einander verschieden annehmen. Wir benutzen wie in §. 74 die Functionen C) /0 (x), /x (x), f2 (x), . . ., /„_! (x), und setzen wie dort, indem wir unter t0, tt, . . ., tn—t unabhängige Variable verstehen, D) y = t„-!/0 (x) + tf„_2 fi(x)~\ h *i /»-a<#> + *o/n-i(«)• Es mögen yu y2, . . ., y„ die Werthe sein, die y für x = xu x2, . . ., xn annimmt. Ist nun « ein beliebiger reeller Werth, so setzen wir E) Ha = (xx — a)yl -\- (x2 — «)y$ -) \-(x„ — a)yl Dies ist eine quadratische Form der n Variablen t, und wir wollen zunächst die Zahl ihrer negativen und positiven Glieder bestimmen. Ist X\ eine reelle Wurzel, also auch y1 reell, so ist x) Hermite, Remarques sur le theoreme de M. Sturm. Comptes rendus der Pariser Akademie, T. 36 A853).
314 Achter Abschnitt. §. 97. das Glied (xi — <x)yl positiv oder negativ, je nachdem x1 grösser oder kleiner als « ist. Bilden aber xx, x2 ein imaginäres Paar, so sind auch yt, y2 conjugirt imaginär, und (x1 — a)yl + (x2 — a)y$ zerlegt sich in ein positives und negatives Quadrat. Dies ergiebt sich wie im §. 85, wenn man yx\' xx — « = u -\- iv, y2]/^2 — a = u — iv setzt. Daraus folgt, dass die Anzahl Na der negativen Quadrate in Ha gleich ist der Anzahl der imaginären Paare, vermehrt um die Anzahl der reellen Wurzeln, die kleiner als « sind. Nehmen wir also eine zweite reelle Zahl ß > «, bilden die Function Hp und bezeichnen mit Np die Anzahl ihrer negativen Quadrate, so ist die Differenz IVß — ±ya gleich der Anzahl der reellen Wurzeln zwischen « und ß. Man erhält also ein Mittel zur Bestimmung dieser Zahl, d. h. zur Lösung des Sturm'schen Problems, wenn man die Coefficienten der Function Ha als Functionen der Coefficienten von/(#) und von « darstellt, und dann die Zahl Na untersucht. §• 97. Bestimmung der Hermite'schen Form H. Zur Bestimmung der Hermite'schen Form H können wir die Mittel anwenden, die wir im sechsten Abschnitt kennen gelernt haben. Wir haben im §. 79 die Formel abgeleitet: A) yfs = EOtSfo + Ehsfx ~\ 1- £„_!,,/„_!. Mit Benutzung der Relationen [§. 78, F)] xj0 =/i — %, xjj = f2 — a2, ¦ • ., xfn^i = — am folgt hieraus ^2) xyf» = -Eo,»/i + -Ei,s/2 + • • • + ¦#«-2,s/«-i Wir bestimmen also noch eine Functionenreihe _E_i,s durch die Gleichung C) a^E—^s -]- aiEOtS -\- a2 E1>s -(-¦** ~\~ an^n—i,s = 0, und erhalten dann aus A) und B)
§. 97. Bestimmung der Hermite'schen Form U. 315 (x — a)yfs = (E_hs — aEo,.)fo Die Function .ELi,» lässt sich aber durch die Relation [§• 78, G)] «0 Ws + «i^m + s —1 -(-••• + ßnk = 0 ganz in der gleichen Weise ausdrücken, wie die übrigen E, so dass wir folgendes System von Formeln erhalten [§. 78, A0)]: JE—itS = aotn + s -j- ax tn + s—i -\- • • • -j- astn = ßs + i^j—1 • • " 0>nts Eo,s == (h^n + s — 1 -j- öi^n + s —2 ~T " ' ' "T" 0>stn — l , s — 2 ~p öi^n + s —3 ~)~ * * * "T" ttstn — 2 = E) Es—itS = ai)tn -)- a-itn—i -j- • • • -j- astn—s = ös ^. i IM — s — j • • • ß„ -Es,« = «o4-l ~|- öj^„_2 ~H " • " "f" O'stn — s — 1 Es + i,s =z do^n — 2 ~~T~ O'itn — S ~\~ ' ' ' ~\~ ®stn — s — 2 Führen wir ein zweites System von Variablen x ein und setzen 0 = T„_i/0 -|- Tn_2/i -(-*•• + *o /n-l) so ergiebt sich aus D) mit Benutzung der Formeln [§. 74, F)] F) S[(sc — <z)y0] = nao 2 C 0, n—1 (w— o,»—i \ „! („2,s nl,s)nsl 0,«—1 und dies geht geradezu in die Function H über, wenn wir t = t setzen. Nehmen wir als Beispiel den Fall n = 3, so ergiebt sich E—it 0 = (h ^2 Ö2 ^1 <*3 ^01 -, 0 == ö0 4i -E—1, 1 = *ä ^2 Ö3 hl EOt i = — rt2 ^1 «'3 ^0> -E-l, 2 — % ^2) -E», 2 = <*s <x,
316 Achter Abschnitt. §.98. -£i2, 0 == *0 *0> '1 "ll 2, 1 **0 *1 ~T~ ^*1 t'Oi und hieraus kann man die Coefficienten der Form H nach F) leicht berechnen: .02,2 = — «o (#i ~~h 3 a0 «) xii, i = — 3 öq Ö3 — ü>i ü>2 — 2 (ßj — öq ö2) w XIo, 0 ^—^ ^2 ^3 ~|~ (¦" ^1 ^3 ^2) ^ -Hi, 0 = — 2 «[ a3 -f- C «o % — % «2)« £T2,1 = — 2 a0 (a2 + «i«) ¦Ho, 2 = — «0 C «3 + «2 «)• §.98. Die Determinante der Hermite'schen Form. Für die Frage nach der Anzahl der negativen Quadrate der Form H ist die Kenntniss ihrer Determinante von Wichtigkeit. Diese Determinante lässt sich allgemein auf folgende^ Art be- berechnen. Setzen wir i 7c H = 2J 2 Hit je tit-k, 0, n—1 so sind die Coefficienten i?iOc, deren Determinante gebildet werden soll, durch die Formel §. 97, F) gegeben. Es ist H^j, der Coeffi- cient von titje in jener Formel, also H^je = S(X — <*) fn-i-t fn-je-t. Die Determinante aus diesen n2 Grossen lässt sich aber nach dem Multiplicationssatz in die Form setzen: X (xn — «) /0 (xn), (x„ — «) /x (xn), . . ., (a;w — «) /„_! /o («0, /1 («1), • • ., /n-i («1 /o 00, /l (*n), • • •, fn-1 («n) oder auch, da «o («1 — «) (a?2 — «)••• O» — «) = (— !)M /(«) ist, in die Form
§.98. Die Determinante der Hermite'schen Form, /o (Ph), /i (Ph), ¦ ¦ -, /n-i («i 317 /o {%n)i J\ (%n)i • • •> /» —1 (#n) Die hier noch vorkommende Determinante der fh Product der beiden folgenden: t) ist das a0, 0, a15 «ei ., 0 •, 0 O"n — li an—i 1, $21 Das Quadrat dieses Productes ist aber, wenn D die Discri- minante der Function f(x) bedeutet (§. 50), gleich a$ D, so dass sich für A ergiebt A) ^ = (-l)»Oo/(«)Ä Da nach der Voraussetzung D nicht verschwinden soll, so wird <d also nur dann verschwinden, wenn für « eine der Wur- Wurzeln von f{x) = 0 gesetzt wird, und dies soll auch aus- ausgeschlossen sein. Bezeichnen wir eine. Kette von Haupt - Unterdeterminanten von z/, mit der niedrigsten angefangen, mit -^1 («), -^2 («), • • •, 4„ («) = ^, so ist nach §. 89, V. die Anzahl der Zeichenwechsel in B) 1, ^(«), 4<*), ¦¦-, ^»(«) gleich der Anzahl JV« der negativen Quadrate in H, und wenn wir also die entsprechende Zahl Np in abzählen, so ist Np — Na die Anzahl der zwischen « und ß gelegenen Wurzeln von f(x). , Für die cubische Gleichung ergeben sich die Ausdrücke aus dem Schluss des vorigen Paragraphen. Wir bilden die Kette 1 1 / \ 1 W I TT TT 7T2 \ A **0) ~Z~ -, 2j ~ I -,2 -,1 -,2 h —-^) &Q (Aiq \ . J Ct/Q die offenbar dieselbe J.nzahl von Zeichenwechseln hat wie B), und erhalten so die Functionen a0, — 3a0« — «!> «j2 — 3 a0 a2) -|- « B al -\- 9 a02 a3 — 7«
318 Achter Abschnitt. §. 99. Nehmen wir zur Probe «= — oo, ß = -\- <n, so. erhalten wir, wenn noch a0 = 1 gesetzt wird, die Zeichenbestimmung 1, +1, K-3a2), 0, 1, — 1, (af - 3 a,), - D. Man muss bei der Abzahlung beachten, dass, wennD positiv ist, a\ — 3 a2 nicht negativ sein kann [§. 52, (8)]. §• 99. Formulirung der Aufgabe durch Hurwitz. Anlässlich einer besonderen Frage, auf die wir weiter noch zurückkommen, hat Hurwitz eine Darstellung des Sturm'schen Problems gegeben, die zu besonders einfachen Resultaten führt1)- Es sei A) f(g) = *»„*• + «h *»~H h o» eine ganze Function wten Grades der Variablen g. Es sei ferner 3>(>) eine zweite ganze Function von beliebigem Grade. Wir suchen nach §.16 die Entwickelung des Bruches <b(z):f{z) nach fallenden Potenzen, und bezeichnen den Theil dieser Entwicke- Entwickelung, der negative Potenzen von g enthält, mit B) Co^-i + c^-2-^ = 27 <**-*-i. o,... Es sei nun weiter C) 0(g) = to + t10-\ h tm-l^'1 eine ganze Function von einstweilen noch beliebigem Grade (m — 1), deren Coefficienten t0, tx, . . ., tm-x unabhängige Va- Variablen sind. Wir bilden die Entwickelung nach fallenden Po- Potenzen von z für den Bruch 0, m—l wofür wir nach B) mit Benutzung der Regeln des §.16 erhalten oder, nach absteigenden Potenzen von z geordnet, D) S e-1-1 2' d+i Mathematische Annalen, Bd. 46.
§. 99. Formulirung der Aufgabe durch Hurwitz. 319 Bezeichnen wir den Rest der Division von & @) durch f(z) mit ®! (z) und setzen ®i (*) = <i + *i H h 4-i«—*, so sind die ^, t\, . . ., 4-i lineare homogene Functionen der Variablen t0, t^ . . ., tm-i- Es geben aber nach §. 16 die beiden Brüche 9(g)@(g)' <P(*)Si(g)' {) /(*) /(*) bei der Entwickelung nach fallenden Potenzen von 0 dieselben Glieder mit negativen Exponenten, und daraus folgt, dass die in der Entwickelung D) auftretenden quadratischen Formen der m Variablen ti «•,& Tx = 2 cx + i + ictitjc auch als quadratische Formen der n Variablen i\ ausgedrückt werden können. Sind also itx, v?., Qx die charakteristischen Zah- Zahlen vonT;t, so ist qx mindestens = m —n. Von nun an wollen wir m = n setzen, also unter ©{0) eine Function (n — l)ten Grades verstehen. Wir betrachten hauptsächlich die Function To, die wir auch kurz mit T bezeichnen, also die quadratische Form i ic F) T = Z d+ttitk, 1,M —1 und bezeichnen ihre charakteristischen Zahlen mit it. v, q. Dann ergiebt sich aus dem soeben Bewiesenen zunächst: 1. Wenn /(#) und O@) nicht relativ prim sind, so ist q > 0, also T keine definite Form. Denn wenn wir den grössten gemeinschaftlichen Theiler von / und O herausheben, so entstehen aus E) Brüche von derselben Gestalt, in denen 0 dasselbe geblieben ist, während sich der Grad des Nenners erniedrigt hat. Ist n' dieser erniedrigte Grad, so ist m — n' und folglich auch q positiv. Wir können ferner noch beweisen: 2. Wenn f{0) und f@) einen gemeinschaftlichen Theiler haben, so ist T keine definite Form. Denn wenn f(ß) und f @) einen gemeinsamen Theiler haben, so lässt sich eine reelle Function Q @) (vom ersten oder zweiten Grad) so bestimmen, dass ist. Dann ist Qft @) von niedrigerem als ntem Grade, und wir können die Coefficienten t0, t^ . . . 4—1 so bestimmen, dass & = Qfi (e)
320 Achter Abschnitt. §. 99. wird. Dann ist aber ® (eJ durch f{z) theilbar, und O(g) ®(sJ : ist eine ganze Function. Es kommen dann also in der Ent- wickelung nach fallenden Potenzen keine negativen Potenzen mehr vor, und es wird Dicht nur T, sondern alle Functionen Ti gleich Null. Es giebt also von Null verschiedene Werthe der Variablen tt, für die T verschwindet, was bei definiten Formen nicht mög- möglich ist. Wenn wir annehmen, dass die Function f(s) keine mehr- mehrfachen Factoren hat, so können wir, wenn die Wurzeln von f{z) bekannt sind, die Functionen T% leicht in eine Summe von Qua- Quadraten zerlegen. Es ist nämlich dann, wenn das Summenzeichen S sich auf die Wurzeln X X^ X%i . . ., Xn von f(z) erstreckt, und Gr{z) eine ganze Function bedeutet, nach §.15 und wenn wir hierin 1 : (s — x) nach §.16 nach fallenden Po- Potenzen von s entwickeln, so ergiebt sich (8) Tx _ 6 T ^ Tx _ 6 f(x) Die Functioiien & (Xj) = to-\-t1X1 -\- ¦ ¦ ¦ ~\- tn-i ® (%i) = t0 + ttx2 -\~ ¦ ¦ • 4- tn-x deren Determinante gleich dem Differenzenproduct der X{ und folglich von Null verschieden ist, sind von einander linear unab- unabhängige, lineare Functionen der ti und durch (8) ist also T% in eine Summe von n Quadraten zerlegt. Setzen wir A0) so ergiebt sich (für l = 0) A1) T = y- -t- wf -4- • • • -4- y„. Unter der Voraussetzung reeller Coefficienten von / und <P lassen sich nun die für die Trägheit der Function T charakteri- charakteristischen Zahlen sr, v, q bestimmen.
§. 99. Formulirung der Aufgabe durch Hurwitz. 321 « Zunächst ist ersichtlich, dass y? aus der Summe A1) dann, und nur dann, wegfällt, wenn <& (xi) = 0 ist, also wenn Xi eine gemeinschaftliche Wurzel von / und O ist. Es ist also q gleich dem Grade des grössten gemeinschaftlichen Theilers von / und O, und gleich Null, wenn / und <& relativ prim sind. Ist Xi, x2 ein imaginäres Paar, und <t>(%i) von Null ver- verschieden, so ist Vi = P + Q* 2/2 = P — Qi und folglich Dieses Paar giebt also einen Beitrag von einer Einheit zu jr sowohl als zu v. Für ein reelles x ist aber y2 positiv oder negativ, je nach- nachdem <& (x) und /' (x) gleiche oder verschiedene Zeichen haben. Hieraus ergiebt sich folgende Bestimmung für die charak- charakteristischen Zahlen jr, v, g der Form T. q ist gleich der Anzahl der verschwindenden <&(x). ¦it ist gleich der Anzahl der imaginären Paare mit nicht verschwindenden <&(x), vermehrt um die Anzahl der A2) reellen Wurzeln mit positivem O(x)f'(x). v ist gleich der Anzahl der imaginären Paare mit nicht verschwindenden <&(#), vermehrt um die Anzahl der reellen Wurzeln mit negativem <b(x)f'(x). Wir machen hiervon einige besondere Anwendungen. Der Fall, dass T eine definite Form ist, dass also q und v = 0 oder q und % = 0 sind, kann nur dann eintreten, wenn 0 und / relativ prim sind, wenn f(x) nur von einander ver- verschiedene reelle Wurzeln hat, und wenn ausserdem G>(x)f(x) für alle Wurzeln von fix) dasselbe Zeichen hat. Sind « und ß zwei der Grosse nach auf einander folgende von diesen Wurzeln, so haben /' («) und /' (ß) entgegengesetzte Vorzeichen. Es müssen daher auch <J>(a) und &(ß) entgegengesetzte Vorzeichen haben. Es muss also zwischen « und ß eine ungerade Zahl von Wurzeln von O(x) — 0 liegen. Unter diesen Voraussetzungen ist auch umgekehrt T eine definite Form, die im Zeichen mit O(x)f'(x) übereinstimmt. O kann also, wenn T eine definite Form sein soll, nicht von niedrigerem Grade sein als n — 1. Ist O auch nicht von höherem Grade, so muss zwischen je zwei Wurzeln von f(x) eine und nur eine Wurzel von O(x) liegen, oder wie wir Weber, Algebra. I. 21
322 Achter Abschnitt. §. 99. uns auch ausdrücken können, die Wurzeln von f{x) sind durch die Wurzeln von O(x) von einander getrennt. Die Form T wird speciell eine positive sein, wenn wir ausser- dem noch annehmen, dass c0 positiv ist, und dies wird dann ein- eintreten, wenn die Coefficienten der höchsten Potenzen von 0 in f(z) und O(s) dasselbe Zeichen haben. Da wir nun in §.89 VII. die nothwendige und hinreichende Bedingung für eine positive Form aufgestellt haben, so können wir jetzt folgenden Satz aus- aussprechen, wenn wir oi Ci, ...... cv C2, »i Cv = Cv setzen. 3. Die nothwendige und hinreichende Bedingung dafür, dass die Gleichung wten Grades f(x) = 0 nur von einander verschiedene reelle Wurzeln hat, die durch die Wurzeln der Gleichung (n — l)ten Grades O(x) = 0 von einander getrennt sind, ist, wenn die Coefficienten der höchsten Potenzen von / und O von einerlei Zeichen sind, die, dass die Determinanten Cr r* r1 (~* alle positiv sind. Wenn wir <&(#) =/'(#) setzen, so ist <&(#) : f @) = 1, also immer positiv. Zugleich gehen in diesem Falle die c0, cl5 c2, . . ., (nach §. 16) in die Potenzsummen s0, sx s2, . . ., über. Setzen wir dann V) Sv + i, . . ., S3v so ist (wenn a0 = 1 angenommen wird) Dn—X die Discriminante von / und es folgt der Satz 4. Die nothwendige und hinreichende Bedingung dafür, dass die Gleichung wten Grades / (x) = 0 nur reelle von einander verschiedene Wurzeln hat, besteht darin, dass -Do, -Dl5 .D2, . . ., Dn—i positiv sind.
§. 100. Charakteristikentheorie. 323 Nimmt man 3> (x) = (x — a) /' (x) an, worin a eine belie- beliebige reelle Zahl ist, die nicht zu den Wurzeln von f{x) gehört, so ist, wenn f(x) nur einfache Wurzeln hat, q = 0, und, mag nun f(x) imaginäre Wurzeln haben oder nicht, es ist % — v die Anzahl der reellen Wurzeln, die grösser als a sind, vermindert um die Anzahl der unter a liegenden Wurzeln. Die Differenz % — v nimmt also jedesmal um zwei Einheiten ab, wenn a wachsend durch eine Wurzel von f(x) hindurchgeht. Dies ist in Uebereinstimmung mit §. 96. §. 100. Grundzüge der Charakteristikentheorie1). Die Sturm'schen Sätze werden in ausserordentlicher Weise durch die Charakteristikentheorie von Kronecker verallgemei- verallgemeinert, die dasselbe Ziel wie der Sturm'sehe Satz für Gleichungs- Gleichungssysteme mit beliebig vielen Veränderlichen verfolgt. Wir be- beschränken uns hier auf die Betrachtung des einfachsten Falles, den wir zur Einschliessung der complexen Wurzeln einer Glei- Gleichung anwenden wollen; auch bedienen wir uns hier unein- uneingeschränkt der geometrischen Anschauung und der Bezeichnungs- Bezeichnungsweise der Differentialrechnung. Wir betrachten zunächst zwei reelle Functionen cp (x, y), ip (x, y), und deuten die reellen Variablen x, y als rechtwinklige Coordinaten in einer Ebene. Die Gleichungen A) cp (x, y) = 0, ip (x, y) = 0 stellen dann zwei Curven dar, die wir kurz die Curve cp und die Curve ip nennen. Wir nehmen zunächst an, diese Curven seien geschlossen und erstrecken sich nicht ins Unendliche. Wir nehmen ausserdem an, cp sei im Inneren der Curve cp negativ, im Aeusseren positiv; ebenso ip im Inneren von ty negativ, im Aeusseren positiv. Bezeichnen wir, wie die Fig. 6 (a. f. S.) zeigt, den Winkel, den die Normale n in irgend einem Punkte von cp, in der Richtung, in der cp wächst, also nach aussen gezogen, mit der Richtung der positiven x-Axe bildet, mit &, so ist, wenn cp'(x) und g>'(y) die partiellen Ableitungen von q> sind, und die Quadratwurzel positiv genommen ist, J) Kronecker, Monatsberichte der Berliner Akademie, März u. August 1869, Februar 1873, Februar 1878. 21*
324 cos 9- = Achter Abschnitt. y'O) §. 100. sin Ziehen wir die Tangente t so, dass sie zu der eben bezeich- bezeichneten Normale n so liegt, wie die positive y-Axe zur positiven #-Axe und bezeichnen den Winkel, den sie mit der positiven x-Axe bildet, mit |, so ist COS | = sin | = Bezeichnen wir den Fortschritt auf q> in der Richtung t als den positiven und sind dx, dy die Projectionen dieses Fort- Fortschrittes, so sind dx und dy proportional und im Zeichen über- übereinstimmend mit — <p'(y), <p'(#)) und wenn 3> eine beliebige andere Function ist, so ist d& = &{x)dx -+- ®'(y)dy im Vorzeichen übereinstimmend mit der Functionaldeter- minante B) [<p, «P] = cp' (x) 9' {y) - cp' (y) & (x). Bei der üblichen Annahme über die Coordinatenrichtung ist die positive Fortschrittsrichtung die, bei der das Innere der Fig. 6. Fläche zur Linken liegt. Wenn nun die positive Fortschritts- Fortschrittsrichtung auf cp an einem der Durch- Durchschnittspunkte der Curven <p, ty in das Innere von ij> hinein- hineinführt, so ist d tji, also auch die Functionaldeterminante [cp, ip] nega- negativ, und im entgegengesetzten Falle positiv (Fig. 7). Wir nennen einen Schnittpunkt von cp und ip einen Austrittspunkt A(cp, ip) oder einen Eintrittspunkt E(cp, ij>), je nachdem die positive Fortschrittsrichtung von <p aus dem Inneren von ip ins Aeussere oder vom Aeusseren ins Innere führt, und haben also den Satz: an einem A(cp,ip) ist [cp, ^] > 0
§. 101. Charakteristik eines Systems von drei Functionen. 325 Die Anzahl der A(cp,ip) ist ebenso gross, wie die der E(cp, ij>); und wenn wir cp mit i\> vertauschen, so gehen die A(cp,ip), E(cp,ij>) in E(tp, cp) und A(ip, cp) über. Die zwei Functionen cp, ip bestimmen in eindeutiger Weise einen Flächenraum, der dadurch charakterisirt ist, dass in ihm das Product cp-tp negativ ist. Wir wollen ihn den Binnenraum (cp, tj)) oder (tj), cp) nennen. In unserer Fig. 7 ist es die schraf- firte Fläche. §. 101. Charakteristik eines Systems von drei Functionen. Wir nehmen nun zu den beiden Functionen q>, i\> eine dritte f(x, y) hinzu. Die durch die Gleichung / = 0 dargestellte Curve, oder die Curve / soll gleichfalls im Endlichen geschlossen sein, und wir wollen ausserdem noch annehmen, dass sie durch keinen der Schnittpunkte von cp und tj) hindurchgeht. Wir geben diesen drei Functionen eine bestimmte cyklische Reihenfolge /, <P, *, so dass auf tp wieder / folgen soll, und verbinden mit dieser Reihenfolge eine bestimmte, etwa die positive Fortschrittsrichtung auf jeder der drei Curven. Wir wollen festsetzen, dass mit der umgekehrten Reihenfolge auf jeder der drei Curven die entgegengesetzte, also die negative, Fortschrittsrichtung verbunden sei. Fig. 8. Wir durchlaufen nun, bei der- ersten Reihenfolge, die Curve / in positivem Sinne, und achten auf die Schnittpunkte von / und cp. Ein solcher soll ein Austrittspunkt A (f; y>,ip) genannt werden, wenn die positive Richtung von / aus dem Inneren des Binnenraumes (cp, ij>) in das Aeussere, und ein Eintrittspunkt E(f; cp, tj)), wenn er aus dem Aeusseren in das Innere führt. In der Fig. 8 sind die Punkte a die Austrittspunkte, der Punkt e ein Eintrittspunkt.
326 Achter Abschnitt. §. 101. Die Gesammtanzahl der Ein - und Austrittspunkte stimmt überein mit der Anzahl der Schnittpunkte von / und cp, und ist also, da beide Curven geschlossen sind, eine gerade Zahl. Ist a die Anzahl der Punkte A(f; cp, tp), e die Anzahl der Punkte E(f; cp, il>), so ist also auch e — a eine gerade Zahl und i(e — a) — Jc eine ganze Zahl, die nach Kronecker die Charakteristik des Functionensystems /, g>, ip heisst. (Im Falle der Fig. 8 ist sie gleich — 1.) Wenn wir die Functionen /, cp, ip cyklisch vertauschen, so erhalten wir drei Bestimmungen für die Charakteristik, und wenn wir die Reihenfolge umkehren und dabei nach der getroffenen "Vereinbarung auch die positiven Eichtungen durch die negativen ersetzen, drei weitere. Diese Bestimmungen sind, wenn wir jetzt die Symbole A (f; <p, ip), E(f; cp, ip) zugleich als Bezeichnung für die Anzahlen der betreffenden Punkte brauchen,. 1. ±[E(f;cp,ip)-A(f;cp,ip)l 2. K^(9>;*,/)-^(g>; *,/)], •3. f [#(*;/, <p) - AA>; f, g>)], 4. l[E(f;ip,y)-A(f;ip,cp)l 5. ![E(iP;cp,f)-A(iP;cp,f)l 6. H^(9>;/.*)-^(9>;/»*)]> und es gilt nun der fundamentale Satz, dass diese sechs Bestimmungen dieselbe Zahl ergeben. Um ihn zu beweisen, durchlaufen wir die Curve / in posi- positivem Sinne, und achten auf die sämmtlichen Schnittpunkte mit cp und ip. Der Weg längs der Curve / wird dabei ebenso oft in den Binnenraum (cp,ip) eintreten müssen, wie er aus ihm heraus- heraustritt, weil er wieder in seinen Ausgangspunkt zurückkehren muss. Die Curve / tritt aber ein in den Punkten E (f; % ip) und A(f; ip, q>) und tritt aus in den Punkten A(f; <p, i\>) und E(f; ip, q>). Also ist E(f; <p, *) + A(f; n,, cp) = A(f; cp, *) -f E(f; *, g>), wodurch die Uebereinstimmung von 1. und 4. nachgewiesen ist. Wenn wir nun zweitens die Curve cp in negativem Sinne durchlaufen, und auf ihre Schnittpunkte mit / achten, so ergiebt sich, dass jeder Punkt E(f; cp, ip) zugleich ein Punkt E(cp;f,tp), und jeder Punkt A(f; g>, ip) ein Punkt A(q>; /, ip) ist. Denn in der Fig. 9, worin der Punkt a irgend einen der Schnitt-
§. 102. Charakteristik-Beziehung zu den Schnittpunkten. 327 punkte von / und cp darstellt, ist dieser Punkt ein E(f; cp, ip) und zugleich ein E(cp; f, ip), wenn ip in a positiv ist, und ein A(f; cp, ip) und zugleich ein A(cp;f, ip), wenn ip in a, negativ ist. Fig. 9. Daraus folgt die Üebereinstimmung von 1. mit 6. Es folgt ferner durch nochmalige Anwendung des ersten Schlusses die Üebereinstimmung von 6. mit 2. und dann durch Anwendung des zweiten Schlusses die von 2. mit 5. und endlich des ersten die von 5. mit 3., also die Uebereinstim- ^ mung aller sechs Ausdrücke. Man ist daher berechtigt, die so bestimmte Zahl schlechtweg als die Charakteristik des Functionensystems (/, cp, ip) zu bezeichnen. §. 102. Beziehung der Charakteristik zu den Schnittpunkten. Man hat nun zu beachten, dass die Bezeichnung der Schnitt- Schnittpunkte zweier Curven als Ein- und Austrittsstellen in §. 100 wesentlich verschieden ist von der in §. 101. Dort kam nur die Beziehung der Punkte zu den beiden sich schneidenden Curven in Betracht, während in §. 101 noch die Beziehung zu einer Fig. 10. dritten Curve in Frage kam; dies ist in den gewählten Bezeichnungen E (cp, rp), A(cp,i\>) und E(J; cp,ip), A(f; cp, ip) voll- ständig ausgedrückt. Nun müssen wir aber genauer untersuchen, wie sich die beiden Bezeichnungsweisen zu einander verhalten. Wir wählen der Deutlichkeit halber eine etwas einfachere Figur als oben, die zugleich alle möglichen Verhältnisse veranschaulicht (Fig. 10). In einem Punkte E(cp, ip) tritt die cp- Curve in die Fläche der Curve ip ein, d. h. es geht ip von positiven zu negativen Werthen. Ist dann zugleich / positiv, so ist dieser Punkt ein E(cp; ip,f), wie der Punkt 1 in unserer Figur, ist aber/ negativ, so ist es ein A(cp; ip,f), wie der Punkt 3. So haben wir: t
328 Achter Abschnitt. §. 102. Ein Punkt E (cp, ip) ist ein E(cp; il>,f), wenn/> 0, (Punkt 1 der Fig. 10) A(cp; ip,f), wenn / < 0, (Punkt 3 der Fig. 10). Ein Punkt A(cp, ty) ist ein E(cp; ip,f), wenn / < 0, (Punkt 2 der Fig. 10) A{cp; i\>,f), wenn/> 0, (Punkt 4 der Fig. 10). Nun ist in den Punkten E(<p, ip) die Functionaldeterminante [cp, if\ negativ, in A(cp, ty) positiv (§. 100), und wir können also das Bewiesene so zusammenfassen: Es ist E(cp; i>,f) die Anzahl der Schnittpunkte von cp, ip, in denen [cp, ^] / < 0, A(cp; tj), /) die Anzahl der Schnittpunkte von cp, i\>, in denen [cp, tj)] f > 0; also ist die Charakteristik gleich dem halben Ueberschuss der ersten Zahl über die zweite. Diesem Satz können wir folgenden Ausdruck geben, wobei er von Grössenverhältnissen gänzlich unabhängig erscheint und nur von den Lagenverhältnissen der Curven und ihrer Schnitt- Schnittpunkte abhängt. Unterscheiden wir die Schnittpunkte von cp, tj), je nachdem sie Austrittspunkte A(cp, tj)) oder Eintrittspunkte E(cp, tp) sind, durch das Zeichen a und s, ebenso, je nachdem sie äussere oder innere Punkte zu der Curve / sind, durch a und s, geben dann den Punkten a, s und s, a den Charakter -\- 1, den Punkten «, « und s, s den Charakter — l1), so ist die Charakte- Charakteristik des Functionensystems (f, cp, -ty) gleich der halben Summe der Charaktere der sämmtlichen Schnittpunkte von cp, ip. Die Sätze und Begriffsbestimmungen, die wir hier gegeben haben, bleiben unverändert bestehen, auch wenn die betrachteten Curven aus mehreren in sich geschlossenen Zügen bestehen; auch können Doppelpunkte bei den Curven vorhanden sein; es muss nur von jeder Fortschrittsrichtung auf einer der Curven x) Kronecker versteht unter Charakter eines Punktes etwas Anderes. Nach seiner Definition (Monatsbericht der Berliner Akademie, 4. März 1869) ist nämlich der Charakter eines Schnittpunktes von q> und \p die Charak- Charakteristik eines Curvensystems, das mau aus /, g>, xp erhält, wenn man / durch eine Curve ersetzt, die nur diesen einen Schnittpunkt von tp, ip um- schliesst.
§. 103. Eingrenzung der complexen Wurzeln. 329 völlig bestimmt sein, ob sie als positiv oder als negativ zu be- betrachten ist, d. h. es muss jedes Stück einer Curve / oder q> oder ip Flächehtheile von einander trennen, in denen die Func- tionen / oder q> oder ip entgegengesetzte Vorzeichen haben. Auszuschliessen sind nur die Fälle, in denen eine der Curven durch einen Doppelpunkt der anderen hindurchgeht, oder in denen die Curven einander berühren, oder in denen die drei Curven/, g>, ip durch einen Punkt gehen; denn in diesen Fällen würde die Bestimmung eines Punktes als Eintrittspunkt oder Austrittspunkt zweifelhaft werden. Erstrecken sich die Curven ins Unendliche, so muss man sie, um unsere Sätze anwendbar zu machen, durch willkürlich hinzugefügte Curvenstücke abschliessen, wie wir im nächsten Paragraphen sehen werden. §. 103. Anwendung der Charakteristiken auf die Eingrenzung der complexen Wurzeln einer Gleichung. Es sei jetzt g = x -\- yi eine complexe Veränderliche und A) F{e) = g> («, y) + » * (x, y) eine ganze rationale Function von g mit reellen oder complexen Coefficienten, und darin y (x, y), ip (x, y) reelle Functionen der reellen Veränderlichen x, y. Wir setzen voraus, dass F(g) und F' (s) nicht zugleich verschwinden. F(ß) verschwindet nur in den Schnittpunkten der beiden Curven tp und ip. Die Ableitung von A) ergiebt F(*) = <p'(x) + iip'(x) = - i<p'(y) + ip'(y), also B) g>'(*) = *'(y). g>'(y) = — *'(*), und folglich C) [<p, V] = tp' (x) H,' (y) — <p> 0/) V (x) = <p'(xy + <p'(yy = i,'(x)* + 1>'(y)>. Hieraus folgt, dass die Functionaldeterminante [q>, ip] nie- niemals negativ wird und nur da verschwindet, wo q>' (x) und q>' (y), also auch ip'(x) und ip' (y) zugleich verschwinden.
330 Achter Abschnitt. §. 103. Dies tritt aber nie in einem Schnittpunkte von cp und ip ein, da sonst hier F (z) und F' (g) zugleich verschwinden würden. Die positive Fortschrittsrichtung ist in jedem Theil der Curve cp oder ip völlig bestimmt durch das Vorzeichen der Function in den angrenzenden Flächentheilen; auch etwaige Doppelpunkte, in denen (p, cp'(x) und cp'' (y) zugleich verschwinden, machen dabei keine Ausnahme. Da die Functionaldeterminaiite \cp, ip] in allen Schnittpunkten der Curven cp, ip positiv ist, so sind alle diese Punkte Austritts- punkte A(q>, ip), und daraus folgt, dass die Curven cp und ip nicht geschlossen sein können, sondern sich ins Unendliche erstrecken müssen, da sonst auf eine Austrittsstelle nothwendig eine Ein- Eintrittsstelle folgen müsste. Im Uebrigen bestimmen auch hier die Curven g>, ip einen Binnenraum, in dem das Product cp ip negativ ist. Wir fügen nun zu den beiden Functionen cp, ip eine dritte Function/ hinzu, die, gleich Null gesetzt, eine geschlossene Curve darstellt, und bestimmen die Charakteristik des Func- tionensystems ganz in der früheren Weise, indem wir längs der Curve / fortschreiten (l)Jc = l[E(f;cp,ip)]-A(f; cp,ip)]=±[E(f;ip,cp)-A(f;ip,<p)]. So ist z. B. in der Fig. 11 die Charakteristik Je = 2. Fig. 11. Fig. 12. Um unsere Sätze anwenden zu können, müssen wir die Curven. cp, ip irgendwie durch willkürlich hergestellte "Verbindungen, die aber alle ausserhalb / verlaufen sollen, zu geschlossenen machen. Die Charakteristik dieses Systems ist dann gleichfalls durch A)
§. 104. Bestimmung der Charakteristik. 331 bestimmt. Als Beispiel ergänzen wir die Fig. 11 durch Fig. 12, in der diese abschliessenden Verbindungen gezeichnet sind. Die so hinzugefügten Schnittpunkte können theils Austrittspunkte A(cp, ip), theils Eintrittspunkte E(cp, tj)) sein. Wir wollen ihre Anzahlen mit A'(<p, t\>), E'(<p, t\>) bezeichnen, während A (q>, i\>) die Zahl der ursprünglich vor- vorhandenen Schnittpunkte bedeutet. Immer muss jetzt B) A (<p, *) + A' (cp, n,) = E' (tp, *) sein. Wir theilen die Punkte A (cp, tp) in zwei Gruppen Aa (q>, tj)) Ae (g>, ij)), von denen die ersten ausserhalb, die anderen innerhalb von / liegen sollen. Dann haben wir folgende Charaktere der Schnittpunkte Aa (% 1p) — 1, -4« (<P, *) + 1,. A' (<p, i,) — l, W (cp, *) + 1. Der doppelte Werth der Charakteristik ist dann, wenn wir der Einfachheit halber die Bezeichnung (<p, ip) weglassen (§. 101) C) - Aa±A£ — A' + E' = 2k; dazu die Gleichung B) addirt, ergiebt D) k = As, d. h. die Charakteristik ist gleich der Anzahl der im Inneren von / gelegenen Schnittpunkte von g>, i>. Damit haben wir also ein Mittel gefunden, um die Anzahl der Wurzeln der Gleichung F(g) = 0, deren geometrische Bilder im Inneren einer beliebig gegebenen Curve liegen, aus der Charakteristik zu bestimmen. Die will- willkürlich hinzugefügten äusseren Verbindungen spielen hierbei gar keine Rolle mehr und können vollständig unterdrückt werden. §. 104. Bestimmung der Charakteristik. Um den im Vorigen bewiesenen Satz anwendbar zu machen, müssen wir noch zeigen, wie wir die Charakteristiken wirklich
332 Achter Abschnitt. 104. bestimmen können. Denken wir uns zu diesem Zweck die Curve/ so in Theilstrecken getheilt, dass in einer von ihnen nur ein - Schnittpunkt mit der Curve <p oder ein Schnittpunkt mit der Curve ip liegt, und bezeichnen wir mit a (Fig. 13) den Anfang, mit b das Ende einer solchen Strecke, mit | den in ihr liegenden Schnittpunkt von / mit <p, so wird der Punkt | ein Punkt E(f; <p, ip) sein, wenn das Product q> ip in a positiv ist, und ein Punkt A(f; q>, ip), wenn <p ip in a negativ ist; und damit ist die Fig. i4. Möglichkeit gegeben, +i aus den Vorzeichen der Functionen cp, ip in den Theilpunkten der Strecken die Cha- Charakteristik vollständig zu bestimmen. Wie wir aber die Curve / in solche Theilstrecken eintheilen, das lehrt uns der Sturm'sehe Lehrsatz. Wir denken uns zu diesem Zweck x und y als Functionen einer Variablen t dargestellt, die längs der Curve / alle reellen Werthe von — oo bis -\- oo (oder auch nur die Werthe eines end- endlichen Intervalles) durchläuft. Dadurch gehen tp und ip auch in Functionen der Variablen t über und man hat die Lage ihrer Wurzeln nach dem Sturm'sehen Lehrsatz zu unter- untersuchen. Ist z. B. wie in Fig. 14 die Curve / ein Kreis mit der Gleichung (x — aJ -|- (y — ßJ = q% so können wir setzen: 1 — t2 2t x — k = y-ß = und t durchläuft einfach alle Werthe von — oo bis -+- oo, während der Punkt x, y sich über den ganzen Kreis in positivem Sinne bewegt. q> und ip gehen, mit einer geeigneten Potenz von \-\-P multiplicirt, in ganze rationale Functionen von t über, die die Anwendung des Sturm'sehen Satzes gestatten.
§. 105. Fundamentalsatz der Algebra. 333 §. 105. Gauss' erster Beweis des Fundamentalsatzes der Algebra. Gauss hat für den Hauptsatz der Algebra, dass eine Glei- Gleichung nteu Grades n Wurzeln hat, drei verschiedene Beweise gegeben. Der erste von diesen, der sich in seiner Doctordisser- tation findet, und den er später noch weiter ausgeführt und anders dargestellt hat, beruht, wenn auch in anderer Einkleidung, auf dem Gedanken, der dem Charakteristikenbegriff zu Grunde liegt1). Danach gestaltet sich dieser Beweis in seinen Grund- Grundzügen folgendermaassen. Es sei g = x -\- yi und A) F{z) = <p(x,y) + iil>{x,y) eine ganze rationale Function von 0 vom wten Grade mit reellen oder complexen Coefficienten, in der gn den Coefficienten 1 hat, also B) F(ß) = sn + t*!*»-1 + a2 s»-2 -| \- an. Wir setzen wieder voraus, dass F(s) und F'@) keinen ge- gemeinsamen Theiler haben, und der Beweis, dass F(s) für n Werthe von.0 verschwindet, beruht nun darauf, dass, wenn wir für / einen Kreis von hinlänglich grossem Radius wählen, die Charakteristik des Functionensystems f, cp, ty direct bestimmt werden kann und sich gleich n findet. Dann folgt nach §. 103, dass in dem so gewählten Kreise n Punkte g liegen, in denen F(g) verschwindet. Wir bedienen uns der Polarcoordinaten, und setzen, da %, «2, a3, . . ., an auch complex sein können, worin j)l7 p2, ... j>„, JR positiv sind und die Winkel qu g2, ... q^ %¦ in irgend einem Intervall vom Umfang 2 % gewählt werden können. !) Gauss, Demonstratio nova theorematis omnem functionena alge- braicana rationalem integram unius variabilis in factores reales primi vel secundi gradus resolvi posse A799). Beiträge zur Theorie der algebraischen Gleichungen A849). Kronecker, Monatsberichte der Berliner Akademie, 21. Februar 1878.
334 Achter Abschnitt. §. 105. Hierdurch wird cp (x, y) = Bn < (8) +...+i>„cosgn ij/ (x, y) = B" sin n & -j- p1 Bn sin [(n — + • • • + J>» sin qn, und wir bilden auch noch die nach # genommenen Ableitungen -f qn_ = nBn cos n %¦ -\- (n — cos [(» — 9w 3(ü Wir theilen jetzt die Kreisperipherie mit dem Radius B in 4 n Theile ein von der Winkelgrösse 4»' indem wir bei # = — » anfangen. Die Theilpunkte sind also — <o, <o, 3 <o, 5 », . . . (8 n — 3)», und die Intervalle mögen der Reihe nach mit 1, 2, 3, ... in bezeichnet sein, so dass das mit v bezeichnete Segment die Grenzen B v r— 3) co und Bv — l)co hat. Die Fig. 15 zeigt diese Eintheilung für n = 3. In den Intervallen 1, 3, 5 ... (in — 1) ist cos n #, absolut genom- genommen, grösser als 1:1/2, und abwechselnd von positivem und negativem Vorzeichen. In den Intervallen 2, 4, 6 in _ ist sin n & absolut grösser als 1 : ]/2 und gleichfalls abwechselnd von positivem und nega- negativem Vorzeichen. Man kann ahevB so gross annehmen, dass in den Intervallen 1, 3, 5 ... D n — 1) das Vorzeichen von <p und -y-w mit dem Jlw 13u> 15 @ 2lu>
§. 106. Der Satz von Hurwitz. 335 von cos n #, und in den Intervallen 2, 4, 6 ... 4 n das Vorzeichen von i> und —=-£ mjt dem von sin n & übereinstimmt. Da also cp in den Intervallen 2, 4, 6 ... 4w sein Zeichen ändert, so muss es in jedem dieser Intervalle durch Null gehen, und da die Abgeleitete -~ ihr Zeichen nicht ändert, so kann a v es nur einmal in jedem durch Null gehen. Ebenso ist zu schliessen, dass 4> in jedem der Intervalle 1, 3, 5 ... 4 n — 1 einmal und nur einmal durch Null geht. Wir haben also eine Eintheilung der Kreisperipherie, wie sie im vorigen Paragraphen zur Bestimmung der Charakteristik verlangt wurde, und da in den Theilpunkten », 5», 9ra...D» — 3)» das Product cp ip positiv ist, so kommen auf der Kreisperipherie keine Punkte A(f; cp, ip) vor und die Anzahl der Punkte E(f; cp, i>) ist 2»; die Anzahl der Wurzeln von F(s) ist also gleich n, was zu beweisen war. Ebenso führt das entgegengesetzte Umkreisen von / niemals auf einen Punkt A (/; cp, ij>) und die Anzahl der Punkte E(f; 4>, cp) ist ebenfalls 2n. IT H IT Die Punkte % =¦ — und # = — der Kreisperipherie liegen in den Intervallen n -j- 1 und Bn -\- 1, haben also bei geradem n einen ungeraden und bei ungeradem n einen geraden Index. Es liegt also in diesen Intervallen bei geradem n je ein Schnitt- Schnittpunkt von -ty und kein Schnittpunkt von cp und bei ungeradem n je ein Schnittpunkt von cp und kein Schnittpunkt von ip. Es folgt hieraus: Theilt man den Kreis / durch die y-Axe in zwei Halbkreise, so liegen auf jedem dieser Halbkreise n Punkte E(J; cp, ip) bei geradem n, n Punkte JE(f; ij), cp) bei ungeradem n. Diese Bemerkung giebt uns ein Mittel, um über die Ver- theilung der Wurzeln auf die beiden Halbkreisflächen aus dem Verhalten der Functionen cp, ij/ auf der y-Axe Schlüsse zu ziehen. §. 106. Der Satz von Hurwitz. In der schon früher (§. 99) erwähnten Abhandlung hat Hurwitz die Bedingungen dafür aufgestellt, dass eine reelle Gleichung nur Wurzeln mit negativem reellem Theil habe.
336 Achter Abschnitt. §. 106. Behalten wir der Symmetrie wegen den Coefficienten a„ bei, den wir gleich 1 annehmen können, und den wir als positiv voraussetzen wollen, so sei die gegebene Gleichung A) F(e) = <*>#> + a,«—H h«»^0- Die a0, %, . . ., an sollen jetzt reelle Zahlen sein. Setzen wir für s einen rein imaginären Werth y i, so wird s in folgender Weise zerlegt. Wir setzen: B) F1 {y) = aoy« — a^y»-* -f aiy"~i F^^^a^r-1 — azyn~B + a-oV"-6 > und dann ist C) F(yi) = i*(F1—iF<l). Wir haben also nach der Bezeichnung des vorigen Para- Paragraphen cp @, y) = ± F„ i> @, y) = + Fi bei geradem n ( ) cp(O, y) = + F%, i> @, y) = rp Ft bei ungeradem n. Wenn nun alle Wurzeln von F negative reelle Theile haben sollen, so darf zunächst F± und F2 für kein reelles y zugleich ver- verschwinden, weil sonst F eine reine imaginäre Wurzel hätte. Es müssen ferner alle Wurzelpunkte in dem Halbkreis liegen, der in unserer Fig. 15 durch die Punkte 4, 7,10 bezeichnet ist. Wenn wir also die Begrenzung dieser Halbkreisfläche als /-Curve betrachten, so müssen auf ihr 2 n Punkte F(f; cp,ij)) und 2 n Punkte E(f;ij/,tp) liegen. Folglich müssen nach dem Schlusssatze des letzten Para- Paragraphen auf dem geradlinigen Durchmesser n Punkte E(f; cp, ip) bei geradem n n Punkte E(f; $, ij)) bei ungeradem n liegen. Daraus aber ergiebt sich nach D) für beide Fälle, dass auf dem Durchmesser n Wurzeln von Fx = 0 liegen müssen, und dass in diesen Punkten F\ (y) F% (y) positiv sein muss, damit es Punkte E(f; cp, ip) oder E(f; ip, cp) sind. Da n solche Punkte vorhanden sein müssen und Fx nur vom «ten Grade ist, so kann F[(y) hier nicht zugleich mit F-y{y) verschwinden. Es treten also hier die Voraussetzungen des Satzes §. 99, 3. in Kraft, wenn wir an Stelle der dort vorkommenden Functionen / und E hier Ft und F% setzen. Um ihn anwenden zu können, müssen noch die Determinanten Cv und also zunächst die Coef- Coefficienten c„ der Entwickelung des Bruches Ft: Fx nach fallenden Potenzen von y berechnet werden.
§. 106. Der Satz von Hurwitz. 337 Hier hängt aber die Function yF2:F1 nur von y* ab, und folglich kann die Entwickelung nach fallenden Potenzen von y auch nur die geraden Potenzen enthalten, d. h. es sind c2, c3, c5, . . . = 0. Dann aber zerfällt die biquadratische Form T [§. 99, F)] in die beiden Formen von denen die erste nur die Variablen t0, t$, t^ . . ., die andere nur die Variablen tu t3, t$, . . . enthält. Für unseren Fall muss also jede dieser Formen definit, und zwar positiv sein. Wir setzen jetzt für ein gerades n Ea) und E") 0 für C" <-o, c2, . Ci, Ct, . Cn — 2i Cn, ' ein ungerades Co, Cj, . C2, C4, . ( '» — 1, Cn +1, ¦ ; Cn-l ' •, Cn . ., C2„_4 n • ¦ ; Cn — i • • ; Cn+1 • • -1 C2n_2 C" = pn c2, Ci, Cn, Ci, Ci, Cn- Cl, -. %, ¦ . Cn + 2, ¦ Ci, ¦ . cs, . . li Cjj + i, • ;Cn ¦ ; Cn+2 • ; Cin — ¦ ; Cn-i • ; Cn + 1 ..., C2«_ und erhalten nach §. 89, VII. den Satz: 1. Damit die Gleichung F(s) = 0 nur Wurzeln mit negativem, reellem Theil besitze, ist nothwendig und hinreichend, dass die Determinanten C, 0" nebst allen ihren Hauptunterdeterminanten po- positiv seien. Selbstverständlich genügt es (nach §. 89) festzustellen, dass eine Kette von Hauptunterdeterminanten von C\ C" positiv ist. Zur Berechnung der Coefficienten c0, c2, c4, . . . ergiebt sich aber folgendes einfache Verfahren. Man bilde das Product In diesem Product können keine negativen Potenzen von y vorkommen, und die Coefficienten der positiven Potenzen müssen mit den Coefficienten der entsprechenden Potenzen in yF2 (y) übereinstimmen. Daraus ergeben sich nach B) die folgenden Gleichungen zur successiven Berechnung von c0, c2, c4, . . . Weber, Algebra. I. 22
338 Achter Abschnitt. §. 106. F) Oi = O,q Cq — ÖS3 = OSq C% — Qjf -— C(/q Cß \C2 — Hurwitz hat diesen Bedingungen noch eine andere Gestalt gegeben, die formell einfacher ist, obwohl sie die Berechnung höherer Determinanten erfordert. Wir wollen hier, um die Uebersicht nicht durch allzu grosse Formeln zu erschweren, die Rechnung nur in einem Beispiel durch- durchführen, aus dem aber der Gang im Allgemeinen vollkommen zu ersehen ist. Wir setzen die zweite Hauptunterdeterminante c0 c± — e| C in die Form 1, 0, 0, 0 0, Co, c2, Ci 0, 1, 0, 0 0, 0, Co, c2 und niultipliciren sie in der letzten Gestalt mit «o, 0, 0, 0 : «21 ft0l 0, 0 aM — a.2, a0, 0 — ÖSg, ÖS4, fl.2, ÖSq Dadurch ergiebt sich nach F) a0, 0, 0, 0 ¦ $2, o±) öEq, 0 1, o, o, o, o, 1, o, o, o, C2) 0 0 Ci Ci — Oi,, — fto, O, = «0 , 0 a-0, a3 und die zuletzt angegebene Determinante muss daher positiv sein. Ebenso behandle man die Hauptunterdeterminanten von C", indem man z. B. 1, 0, 0, 0 0,' 1, 0,' 0 0, Co, C-2, Ci setzt, wofür man den Ausdruck erhält:
§. 106. Der Satz von Hurwitz. 339 »!, ao> 0, 0 as, a2, au a0 «5, ai, »3> O"t a7, a6, a-0, a4 was also ebenfalls positiv sein muss. Hieraus ergiebt sich der Hurwitz'sche Satz: 2. Die nothwendige und hinreichende Bedingung dafür, dass die Gleichung F = 0 nur Wurzeln mit negativem, reellem Theil habe, besteht darin, dass ausser a0 die n ersten Glieder der Kette der Hauptunterdeterminanten Au A2, . . ., A„ der Determinante «!, a0, 0, 0, 0, 0 ... a3, a2, au a0, 0, 0 ... a5, a4, %, a2, »!, a0 . . . a7, a6, a5, a4, %, a2. . . positiv sein müssen. Dieser Satz ist zunächst nur unter der Voraussetzung abge- abgeleitet, dass F(s) keine mehrfachen Wurzeln hat, oder dass die Discriminante dieser Function nicht verschwindet. Wir können uns aber von dieser Beschränkung leicht nachträglich frei machen. Wenn zunächst die in 2. vorkommenden Determinanten sämmtlich positiv sind, so ist die quadratische Form T eine positive, und dann können nach (§. 99, 1.) Fi und F2 keine gemeinschaftliche Wurzel haben. Es kann also F keine rein imaginäre Wurzel haben. Es kann aber F dann auch keine Wurzel mit positivem, reellem Theil haben, denn sonst könnte man die Coefficienten von / so wenig ändern, dass die Determinanten 2. positiv bleiben, dass Wurzeln mit positivem, reellem Bestandtheil bleiben, und dass die veränderte Function F keine mehrfachen Wurzeln mehr hat. Dann erhält man aber einen Widerspruch mit dem Satze 2. Ebenso kann man umgekehrt schliessen, dass, wenn F(s) nur Wurzeln mit negativ imaginärem Theil hat, keine der Deter- Determinanten 2. negativ sein kann. Es bleibt also nur noch nachzuweisen, dass unter dieser Voraussetzung über die Wurzeln von F keine der Determinanten 2. 22*
340 Achter Abschnitt. §. 106. verschwinden kann. Nehmen wir, um dies zu beweisen, an, es sei etwa «!, a0, 0, 0 «3, «2l «15 «0 «51 «41 «31 «2 «71 «6, «5, «4 die erste verschwindende unter diesen Unterdeterminanten. Es hat hierin w, den Coefticienten der nach Voraussetzung negativ ist. Wenn wir also F in F' = F -j- s0 verwandeln, so können wir die Coefficienten von O so bestimmen, dass bei hinlänglich kleinem positivem oder nega- negativem £ die Function F' keine gleichen Wurzeln mehr hat, und dass die reellen Theile dieser Wurzeln negativ bleiben. Durch die Substitution F' für F möge At in A\ übergehen. Ordnen wir Ai nach Potenzen von g, so verschwindet der Coefficient der ersten Potenz von £ nicht identisch, und folglich können wir das Zeichen von £ noch so bestimmen, dass Ai nega- negativ wird. So ergiebt sich auch hier ein Widerspruch gegen den Satz 2.
Neunter Abschnitt. Abschätzung der Wurzeln. §. 107. Das Budan-Fourier'sche Theorem. Die Functionen der Sturm'sehen Ketten lösen zwar voll- vollständig und ausnahmslos das Problem der Bestimmung der Anzahl der Wurzeln einer Gleichung zwischen gegebenen Grenzen; aber ihre wirkliche Berechnung ist meist schwierig und oft unaus- unausführbar. Man kennt eine Reihe von Sätzen zur Abschätzung der Zahl der Wurzeln zwischen gegebenen Grenzen, die viel ein- einfachere Regeln liefern, aber freilich auch die Frage nicht voll- vollständig beantworten, sondern nur eine Maximalzahl geben, worüber die Anzahl der Wurzeln nicht hinausgehen kann. Diese Regeln sind oft für die Anwendung sehr nützlich und ausreichend, und sie dürfen daher hier nicht fehlen. Wir betrachten zunächst ein Verfahren, das von Budan herrührt, dann aber von Fourier benutzt und erweitert wurde1). Betrachten wir an Stelle einer Sturm'sehen Kette die Reihe der Ableitungen einer reellen Function f(x) vom wten Grade A) f(x),f'(x),f"(x), ..,/«(x), worin also /(n) (x) eine Constante ist, die wir von Null verschieden und positiv voraussetzen. Sie ist, von einem positiven Zahlen- factor abgesehen, der Coefficient von xn in f(x). !) Budan, Nouvelle methode pour la resolution des equations nume- riques A803 der Pariser Akademie vorgelegt). Fourier, Analyse des equations determinees. Paris 1831. Ueber das Geschichtliche dieser Frage vergleiche man Lagrange, Traite de la resolution des equations, Note VIII (Werke, Bd. 8).
342 Neunter Abschnitt. §. 107. Es seien wieder a und ß > cc zwei reelle Zahlen, die das Intervall (u,ß) bestimmen, in dem die Anzahl der reellen Wurzeln von f(x) gezählt werden sollen. Wir wollen zunächst annehmen, dass in dem Intervall (a, ß) nicht zwei Glieder der Reihe A) zugleich verschwinden, und dass für x = et, x = ß kein Glied der Reihe verschwindet. Lassen wir nun x von a bis ß stetig wachsen, so kann in der Vorzeichenfolge der Reihe A) nur dann eine Aenderung eintreten, wenn eine der Functionen durch Null geht. Wenn f^ipe) für x = § durch Null geht, so geht/A>) (#), je nachdem f<y+i)(x) positiv oder negativ ist, von negativen zu positiven oder von positiven zu negativen Werthen über, und es geht also zwischen /W und f<v+1') beim Durchgang durch § ein Zeichen- Zeichenwechsel verloren. Dies gilt auch, wenn /<"> die Function f{x) selbst ist. Wenn aber fw eine der Derivirten ist, so geht ihr eine Function f(-v~1'> voran, und da f(y~1) nach Voraussetzung für x = % nicht Null ist, und /W beim Durchgang durch % sein Zeichen wechselt, so findet zwischen /(r—^ und /M beim Durch- Durchgang durch | entweder ein Verlust oder ein Gewinn von einem Zeichenwechsel statt. Wenn also ein inneres Glied der Reihe A) durch Null geht, so bleibt die Anzahl der Zeichenwechsel unge- ändert, oder es gehen zwei Zeichenwechsel verloren. Geht aber f(x) selbst durch Null, so geht ein Zeichenwechsel verloren. Daraus folgt das Theorem: I. Die Anzahl der zwischen a und ß gelegenen Wurzeln von /(«) ist höchstens so gross, wie die Zahl der zwischen a und ß verlorenen Zeichen- Zeichenwechsel, und wenn sie kleiner ist, so ist der Unterschied eine gerade Zahl. Mit Benutzung einer Formel können wir auch sagen: Ist V(x) die Anzahl der Zeichenwechsel (Variationen), die die Reihe A) für irgend einen Werth x darbietet, so ist die Anzahl der zwischen « und ß gelegenen Wurzeln von f(x) B) F(a)_F@)_2Ä, worin h eine nicht negative ganze Zahl ist. Der Beweis des Satzes I. bedarf noch einer Ergänzung für den Fall, dass in der Reihe A) mehrere auf einander folgende «Glieder zugleich verschwinden.
§. 107. Das Budan-Fourier'sehe Theorem. 343 Es mögen also für einen Werth f von x zwischen « und ß in der Reihe C) /«(*), /<'+»(aO, • • , /"+"-»(*), alle Glieder, mit Ausnahme des letzten, verschwinden, und das letzte /(»+/*) (x) möge etwa einen positiven Werth haben. Wir grenzen um f zwei Intervalle 8X, d2 ab, so dass alle Werthe von x im Intervall 8t kleiner, im Intervall d2 grösser als | sind, und nehmen diese Intervalle so klein, dass die Func- tionen C) ausser in f darin nicht verschwinden, also auch/c+M)(a;) positiv bleibt. Da nun, wenn/c+^a;) positiv ist, /(»+/*—*>(x) mit x zugleich wächst, so ist /(» + /*-» (#) in dj negativ, in d2 positiv. Daraus folgt, dass /(»+/* ~^(x) in d1 abnimmt, in d2 wächst, also in beiden Intervallen positiv ist, und so schliessen wir weiter auf die Vorzeichenfolge in der Reihe C): D) /W (x), /C+1) (x), /(» + « (X), . . ., /(-+,«-« (x), /»+/«(*) ^,(-1)« -(-l)" (-iy ... - + *., + + + + + d. h. in der Reihe C) werden beim Durchgang durch f aus lauter Zeichenwechseln Zeichenfolgen, und es gehen in der Reihe C) (i Zeichenwechsel verloren. Ist/("+¦")(!) negativ, so sind alle Zeichen in D) die ent- entgegengesetzten, und der Schluss bleibt sonst derselbe. Wenn nun v = 0, d. h. f^(x) die ursprüngliche Function f(x) selbst ist, die dann in f eine (ft*^p"l) fache Wurzel hat, so findet also beim Durchgang durch f auch in der Reihe A) ein Verlust von ft Zeichenwechseln statt. Ist aber v > 0 und die dem /w (x) vorangehende Function ßv~1)(x) von Null verschieden, so haben wir folgende Zeichen: 1. (i gerade: a) Z«"-« (*),/«(*), b) /«—»(*),/<">(*) 8» + + + a» + + - +
344 Neunter Abschnitt. '§. 107. 2. (i ungerade: ' Es geht also bei geradem (t zwischen /(r~1) und /<r> kein Zeichenwechsel verloren, bei ungeradem (i geht ein Zeichenwechsel verloren oder es wird einer gewonnen. Es ist also der Yerlust an Zeichenwechseln beim Durchgang durch f in der Reihe E) /(^-1),/(r>,/(r + 1>, ..,/<*-"> bei geradem (i gleich (t, bei ungeradem (i gleich (t + 1, also immer eine gerade Zahl und nie negativ. Wir können diesen Ergebnissen einen übersichtlichen ana- analytischen Ausdruck geben, der ihre Bedeutung besser erkennen lässt. Wir bezeichnen mit V(x) wie früher die Anzahl der Zeichen- Zeichenwechsel in der Reihe A) für einen bestimmten Werth von x, jedoch mit der näheren Bestimmung, dass, -wenn für einen Werth von x einige der Glieder der Reihen verschwinden, diese bei Abzählung der Zeichenwechsel einfach übergangen werden. Wir können dann V(x) als eine Fünction von x auffassen, die sich aber nur um ganze Zahlen ändern kann, also unstetig ist für die Werthe von x, für welche einige Glieder der Reihe A) ver- verschwinden. Wir wollen dann mit V(x — 0) und V(x -j- 0) die Werthe der Fünction V(x) unmittelbar vor und unmittelbar nach einer solchen Stelle bezeichnen. Dann zeigt die Betrachtung von E), dass in allen Fällen F) F(f + 0) = F(f) ist, und dass, wenn f eine (t-fache Wurzel von fix) ist, G) r(f-0) = F(f) + p + 2Ä, worin h eine nicht negative ganze Zahl ist. Daraus ergiebt sich also, wenn wir zunächst daran festhalten, dass für x = « und x = ß keine der Functionen A) ver- verschwindet, dass F(«) — V(ß) sich von der Summe aller Zahlen (t, d. h. von der Anzahl der im Intervall («, ß) gelegenen Wurzeln, jede nach dem Grade ihrer Vielfachheit gerechnet, um eine gerade, nicht negative Zahl unterscheidet, und damit ist also das Theorem I. von seiner Beschränkung befreit.
§. 108. Die Newton'sche Regel. 345 Wir können aber auch noch die Voraussetzung aufgeben, dass für et, und ß keine der Functionen A) verschwindet, wenn « und ß nicht unter den Wurzeln von f(x) vorkommen. Denn dann ist unser Theorem anwendbar auf zwei Werthe, von denen der erste etwas grösser als «, der andere etwas kleiner als ß ist, und die dieselben Wurzeln einschliessen, wie « und ß; d. h. es ist, wenn wir mit j die Anzahl dieser Wurzeln bezeichnen und da F(« + 0) = F(«), V(ß — 0) = V(ß) + 2 Ä', so folgt was wieder der Ausdruck unseres Theorems ist. Wenn aber « oder ß selbst zu den Wurzeln von f(x) gehört, dann ist unser Theorem nur dann richtig, wenn diese Grenz- werthe nicht mit zum Intervall gezählt werden. Das Budan-Fourier'sche Theorem giebt zwar nicht, wie der Sturm'sche Satz, eine vollständig sichere Entscheidung über die Zahl der Wurzeln in einem Intervall, es kann aber doch in manchen Fällen den Sturm'schen Satz ersetzen; denn hat man das Intervall («, ß) so weit eingeschränkt, dass kein oder nur ein Zeichenwechsel von a bis ß verloren geht, so folgt mit Sicherheit, dass im ersten Falle keine, im zweiten eine und nur eine Wurzel im Intervall liegt. Die Abgrenzung der Wurzeln kann also durch die Budan'sche Reihe nur dann vollständig gegeben werden, wenn nicht beim Durchgang durch einen Werth f gleichzeitig mehrere Zeichen- Zeichenwechsel verloren gehen. Dies Verhalten kann, wie klein auch das Intervall («, ß) gewählt sein mag, nicht mit Sicherheit erkannt werden, und man wird also, wenn nach einer angemessenen Ein- Einengung des Intervalles die Abgrenzung nicht gelungen ist, doch zu einem anderen Verfahren, in letzter Instanz zum Sturm'- Sturm'schen Satze greifen müssen. §. 108. Die Newton'sche Regel. Eine Ergänzung der vorstehenden Regel, die eine weitere Annäherung an die genaue Festsetzung der Grenzen der Wurzeln
346 Neunter Abschnitt. §. 108. gestattet, giebt die jetzt zu besprechende, von Newton her- herrührende, aber erst von Sylvester bewiesene Vorschrift1). Es sei wieder A) f(x) = a^xn -\- axxn~x -\ • -(- an^x + an = 0 die zu untersuchende Gleichung. Wir setzen, indem wir mit n(m) wie immer das Product 1. 2. 3 . . . m und mit/(r> (#) die vte Derivirte bezeichnen, C) Fv{x)=ß{x)—fv+1(x) fv-i(x), mit dem Zusatz, dass D) F„=F=l, Fn=fn, also, worauf es wesentlich ankommt, positiv sein sollen. Für die Abgeleiteten der Functionen /„, F* erhalten wir aus B) und C) E) /,(*) = (» —«0/, + 1, F) f,F,(x) = (n — v — l) (F*fv+1 + F,+ify-i). Da es auf die positiven Zahlenfactoren nicht ankommt, so können wir die Budan'sche Reihe durch die Reihe der Func- Functionen /1 /li JZi • • •> Jn ersetzen. Die New ton'sehe Regel macht nun von der Doppelreihe Gebrauch: *• ' F ~F ~F F -T, M%i J?2, . . ., -TM. Wenn wir zwei auf einander folgende Glieder dieser Doppel- Doppelreihe, wie für einen Werth von x betrachten, für den keine der vier Func- Functionen verschwindet, so sind in Bezug auf die Zeichenfolge die nachstehenden Fälle möglich: *) Newton, Arithmetiea universalis. Sylvester, Transactions of the R. Irish Academy, t. 24 A871). Phil. Mag., 4. ser., t. 81. Vergl. auch Petersen, Theorie der algebr. Gleichungen. Kopenhagen 1878.
§. 108. Die Newton'sche Regel. 347 a) ~*~ Jr, Jr~Jr, ~" ~, , P P, b) +-' i+' +-' -+'FF' c) +i — i +~' -+'pF' d) ++' i-' ++' --'FP- Dies Verhalten bezeichnen wir mit folgenden Ausdrücken und Symbolen: a) Folge-Folge (Permanenz-Permanenz) P p, b) Wechsel-Wechsel (Variation-Variation) VV. c) Folge-Wechsel (Permanenz-Variation) P F, d) Wechsel-Folge (Variation-Permanenz) V P. Die zwei Sätze, die wir beweisen wollen, lauten: II. Die Anzahl der zwischen « und ß gelegenen Wurzeln von fix) ist entweder genau so gross oder um eine gerade Zahl kleiner, als die Zahl der beim Uebergang von « zu ß in der Doppelreihe G) verlorenen Wechsel-Folgen. III. Die Anzahl der zwischen « und ß gelegenen Wurzeln von fix) ist entweder genau so gross oder um eine gerade Zahl kleiner, als die Zahl der beim Uebergang von « zu ß in der Doppelreihe G) gewonnenen Folge-Folgen. Von diesen beiden Sätzen, die nicht immer dieselbe obere Grenze für die Zahl der Wurzeln geben, wird man den anwenden, der die niedrigste Grenze giebt. Wir machen beim Beweis dieses Satzes die folgenden Vor- Voraussetzungen, von denen wir uns zum Theil später wieder befreien werden: 1. fix) hat keine doppelten oder mehrfachen Wurzeln. 2. Von den Functionen fv(x) verschwinden nicht zwei be- benachbarte für denselben Werth von x.
348 Neunter Abschnitt. 108. 3. Auch von den Functionen Fv{x) verschwinden nicht zwei benachbarte für denselben "Werth von x. 4. Eine Folge von 2. ist [nach Formel C)], dass nicht fv (%) und Fr (x) für denselben Werth von x verschwinden. 5. Für x = a und x = ß selbst soll keine der Functionen fv, Fr verschwinden. Der Beweis der Sätze II. und III. ist nun folgender: Lassen wir x, stetig wachsend, von « bis ß gehen, so kann eine Aenderung in der Zeichenfolge nur dann eintreten, wenn eine der Functionen fv .oder JF„ durch Null hindurchgeht, und es kommt nur darauf an, den Effect zu untersuchen, den ein solcher Durchgang durch Null in den verschiedenen Fällen hervorruft. Nehmen wir zunächst an, es gehe eine der mittleren Functionen /, etwa fv, durch Null, wobei also 0 < v < n. Je nachdem fv+1 positiv oder negativ ist, wird /„ wachsen oder abnehmen. Es wird also im ersten Falle /„ (x — 0) negativ, fv (x -\- 0) positiv sein, und im zweiten Falle umgekehrt; ausserdem folgt aus C), dass, wenn fv = 0 ist, Fv-% und JPr+1 positiv sind, und JF„ das entgegengesetzte Vorzeichen von fv—ifv+i hat. "Wir stellen die hiernach bleibenden Möglichkeiten tabellarisch zusammen, lassen aber in der Aufzählung solche Fälle weg, die durch gleichzeitige Vorzeichenänderung der drei Functionen /»—i,/r,/»+i aus den aufgeführten entstehen, da diese offenbar keine verschiedenen Resultate ergeben. Es bleiben uns hiernach nur zwei Fälle: f(x- /(* + F 0) 0) v — + + + 1, ~ + + + — + 1 In diesen Fällen ist also PP, VP VP, PP noch ein PP verloren x - 0 VV, VV x + o pv, pv Es wird also weder ein VP oder gewonnen. Wenn aber f(x) selbst durch Null geht, so haben wir, wenn wir fx ix) positiv voraussetzen, was mit .Rücksicht auf die vorher gemachte Bemerkung genügt,
§. 108. Die Newton'sche Regel. 349 F 0) 0) 0 + + 1 t + Es geht also hier ein VP in ein PP über, d. h. es wird ein VP verloren, ein PP gewonnen. Wenn endlich Fr durch Null geht, wo natürlich 0 < v < n sein muss, so ist das Verhalten folgendes: Wenn F„ = 0 ist, so müssen nothwendig /»_! und fv+1 gleiche Vorzeichen haben, da sonst JP„ aus zwei positiven Gliedern bestehen würde, und nicht verschwinden könnte. Es ist ferner F'v(x) nach F) vom selben Vorzeichen wie das Product/„_!/,, JF„+1, und also hat Fv(x — 0) das entgegengesetzte, Fv(x -\- 0) das gleiche Vorzeichen, wie das Product. Auch hier können wir in der Aufzählung die Fälle weglassen, die aus den aufgeführten durch gleichzeitige Zeichenänderung in allen drei Functionen fr_1, fv, fv+1 oder Fv-t, F„ Fv+1 ent- entstehen, und es bleiben also folgende Fälle: f F(x — 0) f F(x — Ö) V 1, V, V -\- 1 + - + + + + V 1, V, V -)- 1 + + + Die Zeichenwechsel sind in diesen vier Fällen: X X — 0 + o pv, pp, PV pp pp, PV, PV pp VP, vv, VP vv vv, VP, VP vv Im ersten F&lle werden zwei PP gewonnen, im zweiten und vierten Falle tritt- keine Aenderung ein, im dritten Falle gehen zwei VP verloren.
350 Neunter Abschnitt. §. 109. Damit aber sind die Sätze II. III. bewiesen. Die Voraussetzungen 2., 3., dass von den Functionen fv und Fv nicht zwei benachbarte für dasselbe x verschwinden sollen, können wir aufgeben. Denn wenn wir an der ersten Voraus- Voraussetzung festhalten, dass keine mehrfachen Wurzeln vorhanden sind, so können wir den Coefficienten av so kleine Aenderungen. ertheilen, dass erstens die Voraussetzungen 2., 3. befriedigt sind, und zweitens die zwischen « und ß gelegenen Wurzeln sich so wenig ändern, dass keine von ihnen aus dem Intervall heraus- heraustritt. Da die Wurzeln nur einzeln vorkommen, so können dabei reelle Wurzeln nicht in imaginäre übergehen. Ob der Satz bei richtiger Zählung der mehrfachen Wurzeln auch noch im Falle mehrfacher Wurzeln gültig bleibt, mag dahin gestellt bleiben. §. 109. Der Cartesische Lehrsatz. Der Cartesische Lehrsatz, der auch nach Harriot1) benannt wird, giebt eine Regel zur Abschätzung der Zahl der positiven Wurzeln. Wir können ihn einfach als speciellen Fall des Budan'schen Theorems betrachten, indem wir « = 0 und ß = oo oder wenigstens so gross annehmen, dass die Functionen A) f(x),f(x),f"(x),..,ß»>(x) für x > ß alle dasselbe Zeichen haben. Dies Zeichen stimmt überein mit dem Zeichen des Coefficienten der höchsten Potenz von x in f(x) und kann positiv angenommen werden. Ist f(x) = aoxn -\- fflja^-1 -(- a2a;"-2 -)-...-)- an-Xx -\- o», so erhalten die Functionen A), von positiven Zahlenfactoren abgesehen, für x = 0 die Werthe B) G5M, an—i, an—2, • . ., o&o) und daraus ergiebt sieh also das Theorem: IV. Die Anzahl der positiven Wurzeln der Gleichung f(x) = 0 ist gleich oder um eine gerade Zahl 1) Harriot, Artis analyticae praxis ad aequationes algebraicas resol- vendas 1631. Gauss' Werke, Bd. III, S. 67. Lagrange, 1. c.
§. 109. Der Cartesisehe Lehrsatz. 351 kleiner, als die Anzahl der Zeichenwechsel in der Reihe der Coefficienten von/(«), wobei etwa ver- verschwindende Coefficienten einfach zu übergehen sind und die Wurzel x = 0, wenn sie vorhanden ist, nicht mitzählt. Um auch die Anzahl der negativen Wurzeln abzuschätzen, kann man entweder das Budan-Fourier'sche Theorem auf das Intervall (— oo, 0) anwenden, oder man ersetzt x durch —x, d. h. man ändert die Vorzeichen von d, a3, a-3, . . . und wendet dann das Theorem IV. an. In ähnlicher Weise wollen wir das Newton'sche Kriterium des §. 108 specialisiren. Wir bemerken dazu, dass und folglich X n(n) [v(n — v) ai—, — (y -f- 1) (n — v + 1) an-v-ian-v+1] wird, dass ferner die Reihe der/»(#) für x=-\-co nur Zeichen- Zeichenfolgen, für x = — oo nur Zeichen Wechsel darbietet. Wenn wir also C) Ay — v(n — v)a? — (v -(- 1) (n — v -(- l)ar_ia»+i, Ao = l, A* = \ setzen, so dass Ay, von einem positiven Factor abgesehen, mit JF„_„(O) übereinstimmt, so folgt, dass für x — 0 die Doppel- Doppelreihe G), §. 108, in umgekehrter Ordnung geschrieben, den Vor- Vorzeichen nach übereinstimmt mit G50) %) a2i • • •¦> ®n Ao, Ai, A2i . . ., An. Beim Uebergang zu x = -\- oo sind in der Reihe /(«), ft (x), ...,/„ (x) alle Zeichen Wechsel und beim Uebergang zu x = — oo alle Zeichenfolgen verloren gegangen, also in der Doppelreihe der /,, Fv für x = -(- oo alle VP, für x = — oo alle PP. Danach können wir nach §. 108, II. III. folgende beiden Theoreme aussprechen:
352 Neunter Abschnitt. .§. 109. V. Die Zahl der positiven Wurzeln von/(#) ist so gross oder um eine gerade Zahl kleiner, als die Zahl der Wechsel-Folgen in der Doppelreihe D)_ VI. Die Zahl der negativen Wurzeln von f(x) ist so gross oder um eine gerade Zahl kleiner, als die Zahl der Folge-Folgen in der Doppelreihe D). Die Summe der Anzahlen der VP und der PP ist aber gleich der Anzahl der Zeichenfolgen in der einfachen Reihe E) Ao, At, A2, . . ., An, und wir erhalten also noch aus V. und VL: VII. Die Anzahl aller reeller Wurzeln von f(x) ist so gross oder um eine gerade Zahl kleiner, als die Zahl der Zeichenfolgen in der Reihe E). Die Gesammtanzahl der Zeichenwechsel und Zeichenfolgen in der Reihe E) ist so gross, wie die Zahl aller reellen und imaginären Wurzeln zusammengenommen, nämlich n. Denn der Fall, dass in der Reihe E) einige Glieder verschwinden, ist hier auszunehmen. Da überdies das erste und letzte Glied der Reihe E) dasselbe Vorzeichen haben, so ist die Anzahl der Zeichenwechsel in dieser Reihe eine gerade Zahl. Wir können also zu VII., ohne damit etwas Neues zu sagen, noch das Theorem hinzufügen: VIII. Die Anzahl der imaginären Wurzeln von f(x) ist mindestens gleich der Anzahl der Zeichen- Zeichenwechsel in der Reihe E). In der Fassung der beiden letzten Sätze ist es gleichgültig, ob einige der Coefficienten al5 a2, ..., an verschwinden, wenn nur keines der Av Null ist. Bei der cubischen Gleichung a0 x3 -\- G&x x2 -\- a2 x -(- a8 = 0 ist .4 = 2 (a2 — 3 a0 a2) A2 = 2 0! — 3 ax Og), und in der Reihe 1, Ax, A2, 1 kommen also zwei Zeichenwechsel vor, wenn von den beiden Grossen Ax, A2 eine oder auch beide negativ sind, und in diesen Fällen hat also die Gleichung zwei imaginäre Wurzeln.
§. 110. Das Jacobi'sehe Kriterium. 353 Sind aber At und A2 positiv, so ist die Entscheidung aus diesem Satze allein nicht zu treffen; es ist dann nöthig, noch die Grosse B = 9 a0 a3 — ax a2 in Betracht zu ziehen, und das Zeichen von ZD = AxAs — B* zu untersuchen (§. 68). Im Falle der biquadratischen Gleichungen hat man die drei Ausdrücke zu betrachten: = 3af — 8a0a2, Sind die Zeichen der Reihe nach 1 , so hat man vier imaginäre Wurzeln. Sind die Zeichen alle drei positiv, so können vier oder zwei oder keine imaginäre Wurzeln vorhanden sein; in allen anderen Fällen hat man zwei oder vier imaginäre Wurzeln. §. 110. Das Jacobi'sehe Kriterium. Um die Anzahl der Wurzeln abzuschätzen, die zwischen zwei Grenzen cc, ß liegen, hat Jacobi eiu Kriterium aus dem Cartesischen Lehrsatz abgeleitet. Wenn nämlich A) f(x) = 0 die vorgelegte Gleichung nten Grades ist, von der entschieden werden soll, wie viele Wurzeln sie zwischen den beiden Grenzen «, ß hat, so setzt Jacobi1) x — et et -4- ßy und bildet nun die Gleichung C) (i + y*f(j^rf) = 9C/) = hr + hr-1 H \-K worin die b0, b^ . . ., bn ganze homogene Functionen nUn Grades von cc und ß und lineare Functionen der Coefficienten von f(x) ]) Observatiunoulae ad theoriam aequatiouum algebraiearum perti- nentes. Crelle's Journal, Bd. 13. Gesammelte Werke, Bd. III. Weber, Algebra. I. 23
354 Neunter Abschnitt. §. 111. sind. Wenn nun x von a bis ß wächst, so geht y, gleichfalls wachsend, von 0 bis co. So viele Wurzeln also fix) zwischen a und ß hat, genau so viele positive Wurzeln hat cp (y). Es folgt also aus dem Cartesischen Satz: IX. Die Anzahl der Wurzeln von/(a;) zwischen k und ß ist so gross oder um eine gerade Zahl kleiner, wie die Anzahl der Zeichenwechsel in der Reihe bw &n h, ¦ • -i bu. Während also bei dem Budan'sehen Theorem die Vorzeichen- Vorzeichenwechsel in zwei Werthreihen abzuzählen und zu vergleichen sind, verlangt das Jacobi'sche Kriterium nur die Abzählung der Vorzeichenwechsel in einer Werthreihe. Auf dieselbe Weise lässt sich auch die Newton'sehe Regel umgestalten, wenn man die Grossen Br = v(n — v) b} — (y -\- 1) (n — v -\- 1) bv—ibr + i in Betracht zieht, und man erhält so den Satz: X. Die Anzahl der Wurzeln von/(a;) zwischen k und ß ist so gross oder um, eine gerade Zahl kleiner, wie die Zahl der Wechsel-Folgen in der Doppel- Doppelreihe §. 111. Kleins geometrische Vergleichung der verschiedenen Kriterien. Um die Tragweite der verschiedenen Kriterien unter ein- einander zu vergleichen, hat Klein eine geometrische Interpretation angewandt, die wir jetzt besprechen wollen. Wenn man nicht mit Räumen von mehr Dimensionen operiren und damit die geometrische Anschauung verlieren will, muss man sich hierbei auf die ersten Fälle beschränken, und wir beginnen also mit den quadratischen Gleichungen A) a;*'_|_ ax + b = 0. Sehen wir a und b als rechtwinklige Coordinaten in einer Ebene an, so ist jeder Punkt dieser Ebene das Bild einer und
§. 111. Geometrische Interpretation. 355 nur einer quadratischen Gleichung, und umgekehrt hat jede quadratische Gleichung mit reellen Coefficienten einen Punkt der Ebene zum Bilde. Die Gleichung B) a2 — 46 = 0 stellt eine Parabel dar, auf der die Bilder der Gleichungen mit gleichen Wurzeln -liegen. Die inneren Punkte, d. h. die in der Höhlung der Parabel liegenden, stellen die Gleichungen mit ima- imaginären Wurzeln, die äusseren Punkte die Gleichungen mit reellen Wurzeln dar. Wir bilden nun nach §. 95 die Sturm'sehe Kette C) x* -j- a x + 6, 2x + a, a* — 4 6, und untersuchen die Zeichenwechsel. Ist x constant und a, 6 variabel, so ist x2-\-ax-{-b = 0 die Gleichung der Parabeltangente in dem Punkte a = — 2x, b = x2, und zwar ist x2 -f- a x -\- b positiv in dem Theil der Ebene, der zugleich die Parabel enthält. Durch diese Tangente und durch die Parabel wird die Ebene in vier Felder getheilt, in denen in der Reihe C), wie in der Fig. 16 (a. f. S.) angedeutet ist, 0, 1, 2 Zeichen Wechsel vor- vorkommen. Wenn man also x = et und x = ß setzt, so erhält man zwei solche Tangenten und eine Eintheilung der Ebene in vier Felder, worin die repräsentirenden Punkte für solche Gleichungen liegen, die zwischen es und ß keine, eine oder zwei Wurzeln haben. In der Fig. 17 sind diese vier Felder durch die betreffenden Ziffern gekennzeichnet. Es ist der Unterschied zwischen solchen Punkten, von denen aus keine, eine oder zwei Tangenten an die Parabel gezogen werden können, die ihren Berührungspunkt zwischen a und ß haben. Die Fig. 17 also giebt die genaue und vollständige Unterscheidung der verschiedenen Fälle. Vergleichen wir nun hiermit den Budan'sehen Satz, so haben wir die drei Functionen /(#),/' (x),f"(x), also D) x*-{-ax-{-b, 2x -f a, 1 in Bezug auf die Zeichenwechsel zu untersuchen. 23*
356 Neunter Abschnitt. §• Hl. Die beiden geraden Linien x* -f- ax + 6 = 0, 2x -\- a = 0 theilen die Ebene in drei Felder, in denen die Reihe D) die in der Fig. 18 angedeuteten Zeichenwechsel bietet. Fig. 16. Fig. 17. Nehmen wir wieder zwei Werthe x = « und x = ß, so ergeben sich sechs Felder, in denen der Verlust an Zeichen- Fig. 18. Fig. 19. wechseln in der Fig. 19 angegeben ist. In den mit 0 und 1 bezeichneten Feldern giebt also der Verlust an Zeichenwechseln •die richtige Anzahl von Wurzeln. In dem Felde 2 dagegen ist die Entscheidung zwischen zwei und keiner Wurzel nicht getroffen.
§. 111. Geometrische Interpretation. 357 Nehmen wir nun das Jacobi'sche Kriterium (§. 110). Danach müssen wir, um die Anzahl der zwischen a und ß gelegenen Wurzeln abzuschätzen, die Gleichung A) erst trans- formiren auf (« + ßyy + a(« + ßy) A + y) + 6A + y)» = 0, oder (ß' + «0 + 6) y* + [2 «/J + a (a + £) + 2 6] y + («2 + «« + &) = 0, und es ist nun die Anzahl der Zeichenwechsel in den drei Functionen 60 = j8» + O|8 + 6 &! = 2cc/3 + a(cc -f /3) -f 2& &2 = cc2 -)- acc -(- b abzuzählen. Der erste und der dritte dieser Ausdrücke stellen, gleich Null gesetzt, die beiden vorhin betrachteten Parabel- Parabeltangenten dar. Der mittlere, 2 a ß -\- a (a -\- ß) -\- 2 b, ver- verschwindet für a = — 2 cc, b = ofi und für a = — 2/3, b = /32 stellt also die Verbindungslinie der beiden Punkte a, ß dar, und zwar so, dass er auf die Seite, die den Schnittpunkt der beiden Fig 20. Tangenten enthält, negativ wird [in diesem Schnittpunkte seihst ist er gleich — (ß — ccJ]. Wir erhalten hier fünf Felder mit keinem, einem oder zwei Zeichen wechseln, wie die Fig. 20 angiebt. Man sieht aus dieser und der vorigen Figur, dass der Raum der Unentschiedenheit bei Anwendung des Jacohi'schen Kriteriums ein Theil von dem ist, der sich für das Budan-Fourier'sche Theorem ergiebt, und dass also ersteres in diesem Falle vor letzterem den Vorzug ver- verdient, entgegen einer Bemerkung von Jacohi, der dem Budan- Fourier'schen Kriterium vor dem seinigen den Vorzug giebt. Ob dies auch bei Gleichungen höheren Grades noch richtig ist, bleibt freilich noch zu untersuchen1). Um das Newton'sche Kriterium in der Form §. 110, X. auf quadratische Gleichungen anzuwenden, hat man noch Bo, JBi, B2 J) Vgl. F. Klein, Geometrisches zur Abzahlung der reellen Wurzeln einer algebraischen Gleichung in Dyck's Katalog mathematischer Modelle (München 1892).
358 Neunter Abschnitt. §. 112. zu bilden, von denen aber Bo, _B2 immer positiv sind, und daher durch 1 ersetzt werden können. Für Bt ergiebt sich aber (a2 — ib) (cc — ßy und man hat also die Anzahl der Wechsel- Folgen in der Doppelreihe b0, bu &2 1, B» 1 abzuzählen, was in diesem Falle die genaue Anzahl der Wurzeln ergiebt. §. 112. Bestimmung einer oberen Grenze für die Wurzeln. Wir haben schon im dritten Abschnitt von dem Satze Ge- Gebrauch gemacht, dass man immer eine positive Zahl finden kann, die grösser ist als die absoluten Werthe sämmtlicher Wurzeln einer gegebenen Gleichung. Es kommt aber jetzt darauf an, eine möglichst einfache und zugleich möglichst genaue Bestim- Bestimmung einer solchen oberen Grenze zu geben. Wir betrachten zunächst nur die reellen Wurzeln, und suchen also eine positive Zahl, die grösser ist als die grösste positive Wurzel einer gegebenen Gleichung f(x) = 0. Eine solche Bestimmung giebt uns das Budan'sche Theorem. Nehmen wir den Coefficienten der höchsten Potenz von x in f{x) gleich 1 (oder wenigstens positiv) an, so kann man die positive Zahl et immer so gross annehmen, dass A) /(«),/»,/», •••,/«<» alle positiv werden. Dann geht in der Eeihe der Functionen f(x),f'(x),f"(x), ...,/<»>(*) zwischen x = ot, und x = co kein Zeichenwechsel mehr verloren, und es kann also auch nach dem Theorem I. (§. 107) keine Wurzel von f{x) zwischen ot, und co liegen. Will man aus dem gleichen Satze für die negativen Wurzeln eine untere Grenze haben, so nehme man die positive Zahl ß so an, dass B) (_ 1)" /(_ ß), (- 1)—i /' (- ß), . . , /W (- ß) alle positiv werden, dann hat die Gleichung f(x) = 0 sicher keine negative Wurzel unter — ß. Diese Bestimmung der Grenzen rührt schon von Newton her.
§. 112. Obere Grenze der Wurzeln. 359 Eine andere Bestimmung einer oberen Grenze, die für die Eechnung einfacher ist, hat Laguerre angegeben1). • Er benutzt statt der Ableitungen f(x), f'(x), f "(%)¦, • • • die Functionen f0 (x), fx (x), /2 (%), . . ., fn-i (%), die wir schon mehr- mehrfach, besonders in der Tschirnhausen-Transformation, gebraucht haben. Wir haben diese Functionen im §. 4 definirt durch fo(x) =1 /i 0») = x + ax A (x) = x2 -+- «! x + a2 a.2 x«~s -) /(«) = /n («) = ^ + «1 a;n + «2 ^n~2 -| und für sie die Eecursionsformel aufgestellt: /r (ä) — Zfv-i C0) = «». Man hat nun, wie schon an der angeführten Stelle ge- gezeigt ist, C) f{x) = (« — «) [«-*/, («) + a-»^ («) H h/U («)] +/(«). Der Anblick dieser Formel zeigt, dass, wenn et eine Zahl ist, die die Functionen D) /o («), /i («), /, («), • • , fn-l («), /(«) positiv macht, kein positives x grösser als a existiren kann, was f(x) zu Null macht, da dann auf der rechten Seite von C) lauter positive Glieder stehen. Wenn also ein positives a so bestimmt ist, dass die Func- Functionen D) alle positiv sind, so ist dies eine obere Grenze für die positiven Wurzeln von f(x). Ebenso erhält man eine untere Grenze —ß für die negativen Wurzeln, wenn man die positive Grosse ß so bestimmt, dass E) /, (- ß), -/i (- ß), A (- /*),••• (- !)n /(- ß) alle positiv werden. Diese Bestimmung der Grenzen ist zwar in der Eechnung einfacher zu handhaben, giebt aber doch unter Umständen minder genaue Grenzen als die Newton'sehe Bestimmung. J) Laguerre, Nouvelles Annalesd.math., 2.ser., t.XIX, 1880. Journal de math., 3. ser., t. IX, 1883.
360 Neunter Abschnitt. §. 113. Wenn man nämlich C) fortgesetzt nach x differentiirt und dann x = a setzt, so erhält man unter der Voraussetzung, dass die Grossen D) alle positiv sind, für die Derivirten /' (x), f" (x), .. . Ausdrücke, die für x = a aus lauter positiven Gliedern bestehen. Wenn also die Ausdrücke D) positiv sind, so sind nothwendiger Weise auch die Derivirten A) alle positiv, während das Um- Umgekehrte nicht nothwendig der Fall ist. Um eine obere Grenze für den absoluten Werth der ima- imaginären Wurzeln, der auch für den Fall complexer Coefficienten noch gültig ist, zu finden, betrachten wir die Function worin die Coefficienten a15 a2, . . ., a„ reell oder imaginär sind. Wir bezeichnen den absoluten Werth einer complexen Grosse a wie früher durch |a| und haben dann, wenn wir annehmen, der absolute Werth von x sei grösser als 1, < I <h | + I «2 | H \- | «n | = «• X ' ' Xn~^ Nehmen wir also x so an, dass sein absoluter Werth grösser ist als jede der beiden Zahlen 1 und cc, so kann der Ausdruck nicht verschwinden, da der absolute Werth von x grösser ist, als der absolute Werth der Summe aller übrigen Glieder der rechten Seite. Wenn wir also, je nachdem a grösser oder kleiner als 1 ist, einen Kreis mit dem Eadius et oder 1 um den Nullpunkt als Mittelpunkt legen, so liegen ausserhalb dieses Kreises gewiss keine Wurzeln von f(x) mehr. §. 113. Abschätzung der imaginären Wurzeln. Wir haben im §. 103 gesehen, wie wir aus der Charakteristik eines gewissen Curvensystems die genaue Anzahl der complexen Wurzeln einer Gleichung bestimmen können, die im Inneren einer geschlossenen Curve liegen. Auch dies Kennzeichen lässt
§. 114. Theorem von Kolle. 361 sich vereinfachen, wenn man nicht mehr die genaue Anzahl der Wurzeln, sondern nur eine obere Grenze für diese Zahl finden will, was in vielen Fällen auch zur genauen Bestimmung aus- ausreicht. Es sei also, wie in §. 103 A) F(z) = cp (x, y) + *> (x, y) eine reelle oder complexe Function des complexen Arguments z .= x -\- yi; darin seien cp und i> reelle Functionen von x und?/, und es werde nun eine geschlossene Curve / gezeichnet. Wir haben dann den Satz: XL Wenn die Curve / durch die Curve cp in 2m Segmente getheilt wird, in denen cp abwechselnd positiv und negativ ist, so ist die Zahl der inner- innerhalb / liegenden Wurzeln von F(z) höchstens gleich m; und dasselbe gilt auch, wenn/ durch i> in 2m solcher Segmente getheilt wird. Der Satz ist eine unmittelbare Folge des Charakteristiken - satzes §. 103; denn danach ist und wenn nun die Curve / von der cp -Curve in 2» Punkten geschnitten wird, so ist also h = m — A (f: qp, -ijj). Darin ist aber nach dem erwähnten Satze h gleich der Anzahl der im Inneren von / liegenden Wurzeln von F, und A (f; cp, ifr) ist eine jedenfalls nicht negative Zahl. Ganz ebenso kann man mit der Formel verfahren. §. 114. Das Theorem von Rolle. Wenn die Gleichung f(x) = 0 zwei reelle Wurzeln a und ß hat, von denen die erste eine a-fache, die zweite eine 6-fache ist, so können wir
362 Neunter Abschnitt. §. 114. setzen. Ist nun a < ß, und liegt zwischen a und ß keine Wurzel von f(x) = 0, so wird/(x) und fx (x) in diesem ganzen Inter- Intervall ein unverändertes Vorzeichen haben. Bilden wir von A) die Ableitung, so ergiebt sich (x-K) (X-ß)f(x) B) W) = a{x - ß) + b(x - «) + (x - «) {x - |8L^- Die rechte Seite dieses Ausdruckes wird für x = cc negativ, nämlich a(cc — /3), und für a; = ß positiv, nämlich b(ß — cc), und muss also, während x von ot, bis /3 geht, einmal, oder allge- allgemeiner eine ungerade Anzahl von Malen durch Null gehen. Auf der linken Seite von B) haben (x — cc) {x — ß) und fix) ein unverändertes Vorzeichen, und also muss f'(x) eine ungerade Anzahl von Malen durch Null gehen. Daraus folgt das Rolle'sche Theorem: XII. Sind et und ß zwei auf einander folgende Wurzeln von f (x) = 0, so liegen zwischen k uttd ß (ohne die Grenzen mitzurechnen) Wurzeln von f'(x) = 0 in ungerader Anzahl, also mindestens eine. Wichtige Folgerungen ergeben sich hieraus für den Fall, dass die Gleichung f(x) = 0 nur reelle Wurzeln hat. Sind diese, der Grosse nach geordnet, cc, ß, y,..., und ist cc eine a-fache, ß eine &-fache, y eine c-fache etc. Wurzel, so hat f (x) = 0 in cc eine (a — l)-fache, in ß eine (b — l)-fache, in y eine (c — l)-fache Wurzel und zwischen cc und /3, zwischen ß und y u. s. f. je mindestens eine reelle Wurzel. Die Gesammtzahl dieser Wurzeln ist aber a —(— & —(— c —(-- • - - — 1 = n — 1, und da f'(x) vom (n — l)ten Grade ist, so wird diese Minimalzahl auch nicht überschritten. Daraus folgt der Satz: XIII. Hat/(a;) = 0 nur reelle Wurzeln, so hat auch f'(x)z=0 nur reelle Wurzeln, und von diesen sind die, die nicht mit mehrfachen Wurzeln von f (x) zusammenfallen, einfache Wurzeln, die von den Wurzeln von fix) getrennt werden.
§. 114. Theorem von Kolle. 363 Wenn wir dies Theorem wiederholt anwenden, so können wir es folgen denn aas sen verallgemeinern: XIV. Hat f (x) nur reelle Wurzeln, so haben auch f'(x), f"(x), f'"(x) . . . nur reelle Wurzeln. Hat eine dieser Functionen/M(a?) eine a-fache Wurzel «, und ist a > 1, so ist « eine (a-j-r)-fache Wurzel ¦vonf(x). Diese Sätze werden wesentlich verallgemeinert, wenn man eine lineare Transformation darauf anwendet*). Dies wird leichter ausgeführt, wenn man die homogene Schreibweise anwendet, also unter fix, y) eine ganze homogene Function «ten Grades versteht. Bildet man für einen beliebigen Werth £ : q die Polaren dieser Function (§. 66): C) nzf" (y,y,y)} so bleiben diese Functionen ungeändert, wenn man f, vj und x, y gleichzeitig durch eine lineare Transformation umformt, und für / und seine Ableitungen die entsprechenden transformirten Func- Functionen setzt. In Bezug auf die Realität der Wurzeln wird durch eine reelle lineare Transformation nichts geändert. Nun lässt sich aber, wenn f, vj reell sind, die reelle lineare Substitution so be- bestimmen, dass die transformirten Werthe f = 1, ij' = 0 werden, und dadurch gehen, wenn man noch y = 1 setzt, die Polaren in die Derivirten der Function f(x) nach x über (abgesehen von Zahlenfactoren). Daraus folgt, dass in den Sätzen XIIL, XIV. die Deri- Derivirten/'^),/"^) ... durch die Polaren Pi(x,f), P2(a;,|) ... für ein beliebiges, reelles |, v\ ersetzt werden können. Wir machen hiervon die Anwendung auf die Gleichung, die man erhält, wenn man die (n — 2)te Polare gleich Null setzt: x) Laguerre, Nouvelles Annales de mathematiques, 2. Ser., Vol. 19, 1880.
364 Neunter Abschuitt. §. 115. i, i) + 2 x yf (i, v) + rr {% n) = o. Hat /(#,y) = 0, wie wir voraussetzen, nur reelle Wurzeln^ so muss auch die quadratische Gleichung D) reelle Wurzeln haben, d. h. es muss die Hesse'sche Determinante E) /"(!,£)/" A?, i?)-/"(^J für alle reellen f, v\ negativ sein. Sie kann nur dann ver- verschwinden, wenn D) zwei gleiche Wurzeln hat, und dies ist nach XIV. nur dann möglich, wenn f(x,y) die nte Potenz einer linearen Function ist. In diesem Falle verschwindet die Determinante E) identisch. Wenn wir also von diesem Falle absehen, so folgt, dass für eine Gleichung mit nur reellen Wurzeln die Gleichung, die man durch Nullsetzen der Hesse'schen Determinante erhält, nur imaginäre Wurzeln hat. Wollen wir zur inhomogenen Darstellung zurückkehren, so können wir mit Benutzung des Etrler'sehen Satzes */(*) + yf'(y) =»/(*) F) xf" (x, x) + yf" (x, y) = (n- 1)/ (x) *f (y, *) + yf" (y, ?) = (»- i)/' (y) setzen, und damit /' (y), f" (x, y), f" (y, y) eliminiren. Man erhält so, wenn man y = 1 setzt, f(!t) =nf{x)-xf{x) G) f'(x,y)= (n-l)f(x)-xf"(x) f'(y,y) = n(n- \)f{x) - 2(» - \)xf(x) + ^/"D' also wenn (8) (n - 1) H(x, y) = /" (x, x) f" (y, y) - /" (x, y)* gesetzt wird: (9) H(x, y) = H(x) = nf(x)f" (x) - (n — 1)/' (x)\ H(x) ist in Bezug auf x höchstens vom Grade 2 n — 4. §. 115. Die Sätze von Laguerre für Gleichungen mit nur reellen Wurzeln. Von den zuletzt abgeleiteten Sätzen hat Laguerre eine Anwendung auf Gleichungen mit nur reellen Wurzeln gemacht, die wir noch keimen lernen wollen.
§. 115. Sätze von Laguerre. 365 Es sei f(x) = 0 eine Gleichung wten Grades mit n reellen Wurzeln «, «l5 «2 . . ., die wir von einander verschieden vor- voraussetzen. Ist x eine veränderliche Grosse, so haben wir die schon mehrfach angewandte Formel [§. 14, A1)]: ( ' \x — cc)~ f{x) ' worin sich das Summenzeichen S auf die verschiedenen Wurzeln «, «i, «2) • • • bezieht. Wenn wir hiervon nochmals die Ableitung nach x bilden, so folgt K) (x — «J /(a;)« und wenn wir auf der rechten Seite die Function H [§. 114, (9)] einführen, C) S X _f(xY-H(x) Wendet man auf diese Formel eine lineare Transformation an, bei der dem Werth x = co ein beliebiger anderer reeller Werth der neuen Veränderlichen entspricht, so erhält man eine allgemeinere Formel, die wir zunächst ableiten wollen. Wir führen homogene Variable ein, indem wir x durch x : y und « durch « : /3 ersetzen. Dadurch wird C) nun wenden wir eine beliebige lineare Transformation an: x = aa/ + &«/', « = aa' -\- bß', () y=cx' + dy\ ß = ca!+dß', oder aufgelöst: rx1 = dx — by, F) ry' = — cx -\- ay, r = ad — bc. xß — ycc = r(x'ß' — y' k'). Wenn durch diese Transformation f(x,y) = <p(x',y') wird, so wird rf'(x) = dcp'(x')-ccp'(y'), und wegen der Covarianteneigenschaft der Function H (§. 65)
366 Neunter Abschnitt. §. 115. wenn H' ebenso aus cp abgeleitet ist, wie H aus /. Hiernach folgt aus D): G) S In dieser Formel können, da dies nur Sache der Bezeich- Bezeichnung ist, bei x', y', «', ß', H' die Accente weggelassen und / an Stelle von (p gesetzt werden. Es bleiben die beiden willkürlichen Grossen c und d darin. Setzen wir der eleganteren Bezeichnung wegen noch c = —17, d = |, so erhalten wir also: 3 —i?«V__[g/(aQ \xß-ya)- nf{x,yy und in dieser Form bleibt sowohl die rechte als die linke Seite vollkommen ungeändert, wenn wir auf die Variablenpaare x, y; 1,1?; «, ß gleichzeitig eine beliebige lineare Transformation anwenden. Die Formel (8) ist eine identische; sie gilt für jede Func- tion f(x,y) und für alle Werthe der Variabelen x, y-, f, vj. Jetzt aber machen wir die Voraussetzung, dass fix, y) nur reelle Wurzeln habe, dass also die «, ß reell seien, und wir setzen auch |, vi und x, y als reell voraus. Beide Seiten der Gleichung (8) sind dann wesentlich positiv. Wir bezeichnen ihren gemeinsamen Werth durch P, und bestimmen nun eine Grosse X : Y durch die quadratische Gleichung Xy - Yx oder (9) 9 =.(Xy — Yxy P — (Xn — Ff)» = 0. Diese Gleichung hat zwei reelle Wurzeln, die man aus Xri — 71 = ±]/P (Xy — Yx) erhält. Ueber die Lage der Wurzeln dieser Gleichung können wir aber Folgendes aussagen: Setzen wir X = x, Y = y, so wird 9 negativ. Setzen wir aber X = «, Y= ß, wenn a : ß irgend eine der Wurzeln von / = 0 ist, so ist ,_ . _/f/»-fl«Y \Xy - Yx)
§. 115. Sätze von Laguerre. 367 also gleich einem Gliede der Summe und daher kleiner als P. Daraus folgt, dass <& für X : Y = « : ß positiv ist. Wenn wir nun die Werthe der sämmtlichen «: ß und x : y, der Grosse nach cyklisch geordnet, etwa auf einem Kreise an- anordnen, und den Werth X: Y durch einen variablen Punkt dieses Kreises darstellen, und die betreffenden Punkte mit «, x, X bezeichnen, so geht <& durch Null, wenn X von x aus nach vor- vorwärts oder nach rückwärts bis zu den nächst gelegenen Punkten, die wir mit «j und «2 bezeichnen wollen, geht. Sind also Xu X2 die Wurzeln der Gleichung (9), so haben wir folgende Anordnung auf dem Kreise A0) . «!, Xx, x, X2, «2, und (Xj, X3) stellt ein Intervall dar, in dem zwar der beliebig gewählte Punkt x, aber kein Wurzelpunkt der Gleichung/== 0 liegt. Xt und X2 sind also den beiden nächst gelegenen Wurzeln «l5 «2 näher als der Ausgangs- werth x. Dies gilt, welche Lage auch der zweite willkürliche Punkt | haben mag. Es werden davon zwar die Punkte Xx, X2 abhängig sein; immer aber werden sie in dem Intervall («,, x) und (x, a2) liegen. Es entsteht nun die Frage: wie ist der Punkt £ zu wählen, damit Xj möglichst nahe an «x oder X2 möglichst nahe an «2 liege, oder vielmehr, da es auf die Kenntniss von £ selbst nicht ankommt, welches ist der möglichst nahe bei «: gelegene Punkt Xi und der möglichst nahe bei «2 gelegene Punkt X2? Denken wir uns den Punkt X gegeben, so ist (9) eine quadratische Gleichung für den Punkt f; zu jeder Lage von X gehören also zwei Lagen von f. Aber nur solche Werthe von Xj oder X2 sind in A0) zulässig, für die diese quadratische Gleichung reelle Wurzeln ergiebt. Also nur solche Werthe von Xj und X2 können vorkommen, bei denen die Discriminante von (9) in Bezug auf £ positiv ist, und wir erhalten die Grenz- Grenzlagen von Xj und X2, wenn wir die Discriminante von (9) gleich Null setzen. Die Coefficienten von |2, 2fij, i?2 in (9) sind aber
368 Neunter Abschnitt. §. 115. ?ä {Xy - Yxf - und die Discriminante erhält man, wenn man von dem Quadrat des mittleren das Product der beiden äusseren abzieht, nämlich, mit Benutzung der Relation xf (x) -\- yfr(y) = »/: K» - VE(Xy ~ Yx)* + [Xf(x) und man erhält also die Grenzwerthe von X : Y aus der Gleichung A1) [Xf (x) + Yf (j,)]» + (» - 1) (Xy - Yx? H = 0, die in Bezug auf X : Y quadratisch ist. Hier steht H der Kürze wegen für H(x, y). Da H negativ ist, hat diese Gleichung zwei reelle Wurzeln, die man aus A2) Xf (x) + Yf (y) = ± (Xy - Yx) V(l - n) H findet. Diese Formel umfasst mehrere besondere Resultate, die man erhält, wenn man die homogene Form verlässt. Nehmen wir zunächst y = 0, also x : y unendlich und setzen Y = 1, so ergeben sich zwei Werthe Xl5 X3, zwischen denen die Gesammtheit aller Wurzeln von f(x) enthalten ist. Setzen wir f(x,y) = a^x» -\- aicr-iy -\- a2xn~2y^ -] , so wird A3) H = [2na0 a.2 — (n — l) und man erhält diese beiden Werthe aus A4) «o, X — — ax + ]/(n — lJ«^ — 2n(n — Lässt man x : y unbestimmt, kehrt aber zur inhomogenen Form zurück, indem man y = 1, Y = 1 setzt und die Formeln G) und (9) des §. 114 anwendet, so erhält man aus A2) A5) x — X = nf{x) K f(x)±]/{n~\ff(xy-n(n-l)f(x)f"{xy und diese Werthe haben folgende Bedeutung:
§. 115. Sätze von Laguerre. 369 Liegt x zwischen zwei Wurzeln «j, «2 von f(x), so liegt von den beiden durch A5) dargestellten Werthen von X der eine näher an au der andere näher an «3, aber beide noch innerhalb des Intervalles («x, «2). Ist aber x grösser als die grösste, oder kleiner als die kleinste Wurzel von f(x), so liegen die sämmtlichen Wurzeln zwischen den beiden Werthen von X, während x ausserhalb liegt, oder es liegt x zwischen den beiden Werthen von X, und alle Wurzeln von f(x) ausserhalb. Liegt x nahe an einer Wurzel, so giebt einer der beiden Werthe von X einen noch genaueren Werth dieser Wurzel. Wir nehmen als Beispiel (mit Laguerre) die Kugelfunc- tionen, von denen wir schon früher (§. 93) nachgewiesen haben, dass sie nur reelle Wurzeln haben, die alle zwischen — 1 und -\- 1 liegen. Die Function v . . 1.3...Bw —1) / n(n— 1) „ . \ p-(*> = i,2...» r-2B»-i)x + -) hat die Eigenschaft, dass 2) n { } ~ 8 ist. Man beweist dies leicht durch vollständige Induction, indem man in den ersten Fällen n = 2, 3 ... die Formeln direct nachweist, und dann aus der ßecursionsformel A - x*)Fn(x) + nxPn(x) — nP^x) = 0 durch zweimalige Ableitung die Richtigkeit für den Index n nach- nachweist, falls.sie für den Index n — 1 vorausgesetzt wird. Wenn wir dann in A5) x — 1 setzen, so erhalten wir einen Werth von X, der kleiner als 1, aber noch grösser als die grösste Wurzel von P„ ist, nämlich 2 X= 1 - n Für n = 7 z. B. ergiebt sich X = 0,94967 . . . Weber, Algebra. I. 24
370 Neunter Abschnitt. §. 115. Der genauere Werth der grössten Wurzel ist nach der Berechnung von Gauss (Gauss' Werke, Bd. IIIj S. 195): 0,94911 . . .; X zeigt also erst in der vierten Decimale den Ueberschuss über den Werth dieser Wurzel. Ebenso wie durch Xu X.2 ein Intervall bestimmt ist, in dem gar keine Wurzel der Gleichung liegt, so kann man auch ein Intervall bestimmen, in dem gewiss Wurzeln liegen. Auch hierbei geht man am besten von der homogenen Form aus und benutzt die lineare Transformation. Sei also wie vorher f(x,y) eine Form n^11 Grades mit lauter reellen Wurzeln; und seien ferner x : y, | mj, £' : vf drei reelle Werthe, von denen zwei willkürlich sind, und von denen der dritte durch die Eelation [1/ (*) + nf (s/)] [IT (*) + n'f von den beiden anderen abhängt. Die Gleichung A6) bleibt ungeändert, wenn wir die drei Grössenpaare x, y; |, ij; f, vf gleichzeitig derselben linearen Transformation unterwerfen. Daher können alle Schlüsse, die wir aus einer speciellen Form dieser Gleichung ziehen, verallgemeinert werden. Die lineare Substitution lässt sich so bestimmen, dass für die neuen Variablen y = 0, | = 0 wird; dann ergiebt A6) für £', vj' die Gleichung oder also, wenn man a0 = 1, rf = 1 annimmt, Es ist aber, wenn wir, wie oben, mit « die Würzein von / bezeichnen, a* — 2 a2 = 8(cc% ax = — S («); also wird Dafür lässt sich auch setzen: iSf[«(«-|')] = O, und daraus ergiebt sich, da alle « reell sein sollen, dass die
§. 115. Sätze von Laguerre. 371 Producte «(« — f) weder alle positiv noch alle negativ sein können, oder mit anderen Worten, es muss ein Theil der Wurzeln zwischen 0 und f', ein anderer Theil ausserhalb dieses Intervalles liegen. Daraus folgt nun durch Anwendung der linearen Trans- Transformation allgemein, dass auf dem Kreise, der die Punkte «, x, |, |' trägt, wenn f, f durch A6) verknüpft sind, in jedem der beiden Theile, in die der Kreis durch f und f getheilt wird, wenigstens eine der Wurzeln « liegt. Der Punkt x und einer der Punkte f, f sind willkürlich; der dritte Punkt ist durch A6) bestimmt. 24*
Zehnter Abschnitt. Genäherte Berechnung der Wurzeln. §. 116. Interpolation. Regula falsi. Mit der Abgrenzung der Intervalle, in denen nur je eine Wurzel einer algebraischen Gleichung liegt, ist die Möglichkeit gegeben, die reellen Wurzeln mit beliebiger Genauigkeit nume- numerisch zu berechnen, indem man das Intervall mehr und mehr einengt, z. B. fortgesetzt halbirt. Theilt man ein Intervall von der Grosse 1 fortgesetzt in zehn Theile, so liefert jeder neue Schritt eine weitere Decimalstelle. Wenn einmal erst eine Wurzel von allen übrigen abgesondert ist, so hat man bei der weiteren Einengung des Intervalles immer nur das Vorzeichen der Function f(x) selbst zu berücksichtigen. Die dazu nöthigen Rechnungen können sehr erleichtert werden durch die Anwendung der Interpolationsformel, die wir im ersten Abschnitt kennen gelernt haben. Wir haben nämlich in §. 10, G) eine Formel hergeleitet, nach der man eine Function wten Grades, die wir jetzt mit cp(!f) be- bezeichnen wollen, bestimmen kann, wenn n -\- 1 auf einander folgende Werthe cp @), cp A), . . ., cp (n) gegeben sind. Diese Formel ist, wenn A) ¦*' ~ 1 .2. 4 . .. v 4 = 9A + 1)-9A), B) 4"-» = gesetzt wird 4 =4+i — 4
§. 116. Eegula falsi. ' 373 C) <p (£) = <p @) + JoB? + ^Bf -f h 4—"^ Der Werth der Formel liegt darin, dass die Reihe der Differenzen z/0, zT0, Zl'ö . . . in vielen Fällen so rasch abnehmende Zahlenwerthe bietet, dass man sich mit einigen der ersten Glieder der Reihe C) begnügen kann. Ist nun f(x) die zu untersuchende Functioa und («, ß) das Intervall, in dem eine der gesuchten Wurzeln liegt, so setzen wir, indem wir unter m irgend eine geeignete ganze Zahl ver- verstehen, * ß — a i * t- S = ^~> * = « + ** und wenn wir also setzen, und die Formel C) auf qp(|) =f(x) anwenden, D) f{x) =/(,) +^ (x - «) + § (X ~ K) ^-"- Man könnte ebensogut auch von dem anderen Endpunkt ß des Intervalles ausgehen, und müsste dann in C) x = ß-d£ setzen. Man würde dann erhalten 4. =/(*-*)-/(*) Wenn man die Gleichung y =/(*) als Gleichung einer Curve in einem rechtwinkligen Coordinaten- system x, y deutet, so lassen sich die Verhältnisse geometrisch veranschaulichen. Wenn man z. B. die Gleichung D) auf das Intervall von « bis (« -\- 8) anwendet und sich mit der Berücksichtigung der ersten Differenz begnügt, so heisst das in der Sprache der Geometrie, dass man den zwischen den beiden Curvenpunkten «, /(«) und a -\- 8, /(« -j~ 8) verlaufenden Gurvenbogen durch die Sehne ersetzt. Berücksichtigt man auch die zweite Differenz, so wird
374 Zehnter Abschnitt. §. 116. der durch die drei auf einander folgenden Punkte mit den Abscissen «, a -\- 8, a -j- 2 8 gehende Curvenbogen durch den Bogen einer Parabel ersetzt, die durch dieselben Punkte geht und deren Axe der Ordinatenaxe parallel ist; und diese Parabel wird sich der Curve noch enger anschliessen als die Sehne. Je kleiner das Intervall 8 ist, um so weniger werden die höheren Differenzen von Einüuss sein. Wie weit man also bei der Annäherung zu gehen hat, das hängt nicht nur von der Genauigkeit ab , mit der man f(x) zu kennen wünscht, sondern wesentlich auch von der Dichtigkeit der Werthe «, « -)- 8, « -)- 2 8 . . ., für die die Function bekannt ist. Auf diesen Sätzen beruht die Einrichtung unserer Tabellen- Tabellenwerke, besonders der Logarithmentafeln. Es handelt sich dabei freilich nicht um ganze rationale Functionen; allein bei den stetigen Functionen überhaupt gelten hier dieselben Gesetze. Man findet in den Tafeln daher auch neben den Werthen /(«), /(« -f 8), /(« -\- 28) . . . die Werthe der ersten oder der beiden ersten Differenzen angegeben. Bei den gebräuchlichen siebenstelligen Tafeln genügt die erste Differenz. In der zehn- stelligen Tafel „Thesaurus logarithmorum" von Vega sind auch die zweiten Differenzen angegeben und müssen bei ganz scharfen Rechnungen berücksichtigt werden. Unsere Interpolationsformeln lassen sich mit Nutzen an- anwenden, um die Wurzeln der Gleichungen-zu berechnen, oder, genauer ausgedrückt, die auf anderem Wege gefundenen Nähe- rungswerthe zu verbessern. Wir können die Aufgabe so formuliren, dass zu einem gegebenen, zwischen /(«) und /(« -\- 8) gelegenen Werth von f(x) der zugehörige Werth von x gefunden werden soll. Wir betrachten x = « als einen ersten Näherungswertli. Setzen wir nun /(*)-/(«) = 4 so ist, wenn die Function f(x) zwischen x = « und x = a -\-8 nur wächst oder nur abnimmt, z/ ein gegebener Werth von dem- demselben Zeichen wie z/„ =f(a -\- 8) — /(«) und absolut kleiner als z/„. Setzen wir noch x — « = w, so giebt die Formel D) Bleiben wir zunächst bei der ersten Differenz stehen, so ergiebt sich als erste Correction
§. 116. Eegula falsi. 375 G) und wenn wir nun = d 4- + «*' setzen, so fQlgt aus F), wenn man im zweiten Gliede u' weglässt, also als zweite Correction: Die erste Correction G) erhält man dadurch, dass man den zwischen « und « -j- 8 verlaufenden Curvenbogen durch die Sehne ersetzt, wie oben, die zweite Correction (8) dadurch, dass man den Bogen zwischen «, « -j- S, « -f- 2 8 durch eine Parabel ersetzt, die durch dieselben Punkte geht, die aber jetzt ihre Axe mit der x-Kxe parallel hat. Nehmen wir als Beispiel die Gleichung f(x) — xs — 2x — 2 = 0, die zwischen 1,7 und 1,8 eine reelle Wurzel hat. Man berechnet x = 1,7, f(x) = — 0,487, zla — 0,719, Ja = 0,108 1.8, = -f 0,232, = 0,827, 1.9, = 1,059. Da f(x) = 0 sein soll, so ist J = 0,487 zu setzen und die erste Correction zu os = 1,7 ist nach G) u = 0,06773, die zweite Correction ergiebt nach (8) u' = 0,00164, also « + u + u' = 1,76937. Der auf andere Weise berechnete genauere Werth ist 1,76929... Wir haben also ein in den ersten drei Decimalen genaues Re- Resultat. Wir haben aber hier kein anderes Mittel, um die Genauig- Genauigkeit von vornherein zu schätzen, als die Abnahme der Differenzen J, /J\ J". . Ist J' so klein, dass es ausserhalb der Grenzen
376 Zehnter Abschnitt. §. 117 der beabsichtigten Genauigkeit fällt, so giebt die Berücksichtigung der ersten Differenz ein genaues Resultat. Die hier aus einander gesetzte Vorschrift zur Wurzelberechnung wird die Regula falsi genannt. Die einfachste, für die erste Annäherung geeignete Form dieser Vorschrift ist die: Liegt zwischen « und ß eine Wurzel« der Gleichung f(x) = 0 und ist f(a) = — a, f(ß) = b, so ist (9) x = ^L±±t ein genäherter Werth von x. Dies ist nur eine andere Schreib- Schreibweise für die Formel G). Die Newton'sche Näherungsmethode. Eine Methode, die zur genäherten Berechnung der WTurzeln einer Gleichung meist besser ist als die Interpolation, rührt von Newton her und wurde von Fourier ausgebildet und genauer untersucht. Die Methode besteht einfach in Folgendem. Es sei A /(*) = 0 die aufzulösende Gleichung und es sei ein Werth x = « ge- gefunden, den man als eine gewisse Annäherung an eine Wurzel betrachten kann. Wir setzen in A) x = a -\- h, und erhalten /(« + h) =/(«) + hf («) + ^i /"(«) + ... Wenn man nun h aus der Gleichung bestimmt /(«) + */'(«) = 0, was voraussetzt, dass /' («) von Null verschieden ist, so wird und wird also, wenn h eine kleine Zahl ist, da nur das Quadrat und höhere Potenzen von h vorkommen, einen kleinen Werth haben. Es wird also unter den geeigneten Voraussetzungen
§. 117. Newton'sehe Näherungsmethode. 377 als eine bessere Annäherung an den wahren Werth der Wurzel zu betrachten sein. Ersetzt man dann « durch «', so wird man in eine noch bessere Näherung erhalten u. s. f. Es bleiben hier aber noch folgende beiden Fragen zu beant- beantworten : 1. Unter welchen Voraussetzungen ist «' wirklich ein besserer Werth als «? 2. Wie kann man den Grad von Genauigkeit schätzen, den man so erreicht? Diese Fragen hat Fourier beantwortet; er macht aber dabei folgende Voraussetzung: Es ist eine Wurzel von /(») in einem Intervall («, ß) eingeschlossen, das keine zweite Wurzel enthält. In dem Intervall («, ß) istf'(x) von Null verschieden und/"(#) auch von Null verschieden. Was die letztere Voraussetzung betrifft, dass /" (x) im Inter- Intervall von Null verschieden ist, so ist sie nur gemacht, um ein- einfacher auszudrückende Bedingungen für die Anwendung der Methode zu erhalten. An sich ist ihre Brauchbarkeit bei genügen- genügender Einengung des Intervalles davon nicht abhängig. Wenn aber f(x) und /"(.«) keinen gemeinsamen Theiler haben, also nicht zugleich verschwinden, so kann man die Fourier'sehe Voraus- Voraussetzung durch Einengung des Intervalles immer erfüllen, und wenn f(x) xmdf'(x) einen gemeinsamen Theiler haben, so kann man diesen zuvor absondern und dann auf die einzelnen Factoren von f(x) die Näherungsmethoden anwenden. Am einfachsten übersieht man die Verhältnisse in der Geo- Geometrie, wenn man y =f(x) als Gleichung einer ebenen Curve in einem rechtwinkligen Coordinatensystem deutet. Die Gleichung C) y = /(«) + (* -«)/(«) ist die Gleichung der Curventangente in dem Punkte «, /(«) und die Newton'sehe Näherungsmethode kommt also darauf hinaus, dass man die Curve in dem Interwall («, ß) in erster Annäherung durch die Tangente in einem der Endpunkte ersetzt, anstatt wie bei der Interpolationsmethode durch ihre Sehne.
378 Zehnter Abschnitt. §¦ 117. Wenn der zweite Differentialquotient in dem Intervall («, ß) verschwindet, also die Curve einen Wendepunkt hat, so kann der Fall eintreten, dass beide Endtangenten aus dem Intervall hin- hinausführen; dann ist die Newton'sche Methode also nicht an- anwendbar (Fig. 21). Es kann aber auch, wenn das Intervall («, ß) schon genügend eingeengt ist, der andere Fall eintreten, dass Fig. 22. Fig. 21. beide Tangenten nach inneren Punkten des Intervalles führen (Fig. 22). Indessen wird in diesen Fällen immer die Regula falsi eine bessere Annäherung geben. Wir wollen aber jetzt annehmen, dass /' (x) und /" (x) in dem Intervall («, ß) nicht verschwinden. Dann ändert die Curve den Sinn ihrer Krümmung nicht, und dann hat gewiss immer Fig. 23. Fig. 24. eine der beiden Endtangenten ihren Schnittpunkt mit der «-Axe im Inneren des Intervalles.. Dies trifft sicher zu, wenn die Tangente in dem Endpunkte des Intervalles genommen wird, in dem f(x) und f"{x) dasselbe Vorzeichen haben. Die beiden Fig. 23 und 24 veranschaulichen das Verhältniss bei positivem /' (x) und positivem und negativem /" (x). Es ist also im ersten Falle ß', im zweiten «' ein besserer Annäherungswerth, als ß und «.
§• 117. Newton'sehe Näherungsmethode. 379 Will man gleichzeitig die andere Grenze verschieben, um ein neues engeres Intervall zu bekommen, so kann man nach Fourier von dem anderen Endpunkte, also iin Falle der Fig. 23, in a die zu i ß' parallele gerade Linie ziehen, und erhält den Punkt «' als unteren Grenzpunkt des neuen Intervalles. Es ist dann im ersten Falle * = --$5- ' = >-%! im zweiten Falle und («', ß') ist ein engeres Intervall, in dem die gesuchte Wurzel liegt. Fig. 25. Es ist kaum nöthig, die beiden anderen Fälle, in denen fix) im Inter- Intervall negativ ist, noch besonders zu betrachten. Man kann aber auch, um zwei neue Grenzen zu erhalten, mit noch besserem Erfolge die Newton'sehe Methode mit der Interpolationsmethode verbinden, wie die Fig. 25 zeigt. Man erhält dann als die beiden neuen Grenzen: „, _ u /(")(/» ~ «) _ «f(ß) ~ ßf(«) cc -— co — lißl f'iß) ß' = ß- Wir fassen die Resultate in folgendem Satze zusammen: Ist ein Intervall («, ß) abgegrenzt, in dem/(a?) einmal, /'(%) und /"(%) gar nicht ihr Zeichen wechseln, und ist ß der Endpunkt des Inter- Intervalles, in dem f(ß) und f"(ß) dasselbe Vorzeichen haben, gleichviel, ob ß kleiner oder grösser als « ist, so erhält man ein engeres Intervall («', ß') von denselben Eigenschaften, wenn man setzt. /iß) - riß)
380 Zehnter Abschnitt. §. 117. Um diese Resultate der geometrischen Anschauung ana- analytisch zu beweisen, nehmen wir an, es sei im Intervall f'(x) und /" (x) positiv, also « < ß, und /(«)<0, f(ß)>0. Wir beschränken uns auf die Betrachtung dieses einen Falles, da die drei anderen genau in derselben Weise zu be- behandeln sind. Wir bilden die Function und deren erste Derivirte Der Zähler dieses Ausdruckes *(x) = -(ß- x)f{x) +/(/J) -f{x) verschwindet für x = ß, und seine Derivirte ist V(x) = -(ß-x)f'{x), also im Intervall negativ. Daraus folgt, dass tyix) im Intervall mit wachsendem x abnimmt und daher, weil es für den grössten Werth x = ß verschwindet, positiv bleibt. Folglich ist auch qp' ix) positiv und cp ix) wächst im Intervall mit wachsendem x beständig. Wir haben demnach « < x < ß. Setzen wir nun so wird und nach E) folgt, dass diese Differenz positiv ist, also u < «' < ß' < ß. Setzt man dann in E) x = a' und * = ß' und beachtet, dass ß ,j -(ß- *)f(ß) ß ß,
§. 117. Newton'sehe Näherungsmethode. 381 so ergiebt sich /(«')<0, /(/?') >0. Es ist also die gesuchte Wurzel zwischen et! und ß' enthalten, und das Intervall (et1, ß') ist kleiner als (et, ß). Setzen wir in diesen Ausdrücken «', ß' an Stelle von et,, ß, so erhalten wir ein neues, noch engeres Intervall u. s. f. Was die Convergenz dieses Verfahrens betrifft, so können wir uns darüber folgendermaassen vergewissern. Wir setzen nach F): A\ ß' — K' — * fr- a\ —/08) </("> ~ fW + (ff - »)/'(fl){ V) ß-a~ *^W - (ß_ K)f(ß) {f(ß) _f{a}] Zähler und Nenner sind hier durch (ß — «K theilbar, und wenn wir den gemeinsamen Factor (ß —- et)'2 wegheben und f, rj für et, ß setzen, so erhalten wir einen Ausdruck von der Form worin i\I und i>2 ganze rationale Functionen der beiden Variablen |, rj sind. Ist x die im Intervall («, /3) gelegene Wurzel, so werden die beiden Functionen r\)x und 4>2 nach unseren Voraussetzungen über f(x) nicht gleich Null, wenn (8) « < | < #, a; < m 5 /S. Die Function <5 (|, ^) ist für | = «, ^ = ß, aber auch für jedes andere Werthpaar in dem Intervall («, /S), wofür /(|) negativ,/(ij) positiv ist, kleiner als 1, da jedes solche Intervall (|, rf) an Stelle von («, ß) genommen werden könnte. Da nun <&(f, ¦»?) eine stetige Function der beiden Veränder- Veränderlichen |, rj ist, so lange diese in dem Bereich (8) bleiben, so muss in diesem Bereich die Function 3>(f, r[) einen Maximum- werth haben, und dieser muss kleiner als 1 sein, weil <&(£, rj) auch noch in den Grenzfällen j- = %, rj = % kleiner als 1 bleibt. Es lässt sich also ein positiver echter Bruch & angeben, so dass * (I, n) < ® ist, so lange |, rj dem Bereich (8) angehören. Dann folgt aus G) ß' — «' < (ß — os) &. Ebenso folgt, wenn wir auf dieselbe Weise von dem Intervall («', ß') zu einem engeren Intervall («", ß") fortschreiten,
382 Zehnter Abschnitt. §. 117. ß" — «" < (ß' — «') 8', worin ®' dieselbe Bedeutung für «', /3' hat, wie & für «, ß. Da aber «', ß' dem Bereich (8) angehören, so ist ©' nicht grösser als & und statt &' kann anch & gesetzt werden. Es folgt also: ß« _ «" <(£_«) @2; und so schliessen wir weiter ß(y) _ «W <(ß — a)®\ Die Intervalle nehmen also mindestens so stark ab, wie die Glieder einer fallenden geometrischen Progression. Als Beispiel mag die Gleichung dienen: x* — 2 #2 — 2 = 0, die eine Wurzel zwischen « = 2,25 und ß — 2,36 hat. Man erhält ausv den Formeln D) für ß' = 2,35931 . . ., «' = 2,359298 . . ., so dass ein in der vierten Decimale genauer Werth der Wurzel 2,3593 ist. Für diesen Werth selbst ist, wie eine genauere Rechnung ergiebt, f(x) noch negativ, so dass er für a' genommen werden kann. Der nächste Schritt der Annäherung ergiebt 2,359304. Auf demselben Princip, das der Newton'schen Auüösungs- methode zu Grunde liegt, beruhen auch die Methoden von W. G. Horner und Joseph Horner, die wir hier nur erwähnen können. Bei beiden ist das Ziel eine zweckmässige Anordnung der Rechnung, und, besonders in der ersten, ein dem dekadischen Zahlensystem angepasster Algorithmus, nach Analogie der Divisionsregeln der niederen Arithmetik. Ein schnelles und sicheres Rechnen nach diesen Methoden erfordert viel Uebung1). l) W. Gr. Horner, A new method of solving numerical equations of all Orders, by continuous approximation. Communicated by Davies Gilbert. Philosophical Transactions 1819. Joseph Horner, Approximation to the roots of algebraic equations in a series of aliquot parts. Quarterly Journal of Mathematies, Vol. III, 1860.
§. 118. Bernoulli'sehe Näherungsmethode. 383 Die Näherungsmethode von Daniel Bernoulli und verwandte Methoden. Die Methode zur genäherten Auflösung einer Gleichung, die von Daniel Bernoulli herrührt1), beruht darauf, dass, wenn man eine Reihe reeller Grossen hat, die Potenzen der grössten unter ihnen um so mehr die gleich hohen Potenzen der übrigen überwiegen werden, je höher die Potenzen sind. Sind a, ß, y . . . beliebige reelle oder complexe Grossen, so jedoch, dass der absolute Werth von a grösser ist, als der absolute Werth aller übrigen, dass also die absoluten Werthe der Brüche ß:u,y:a... echte Brüche sind, so ist V ) „m —1 _U Rm—l I „,m— 1 I und je grösser m wird, um so mehr wird sich dieser Ausdruck wie die zweite Darstellung zeigt, der Grenze oc nähern. Sind a, ß, y . . . die Wurzeln einer algebraischen Gleichung, so ist die linke Seite von A) der Quotient der wten und (m — l)ten Potenzsumme, und wir erhalten also den Satz: Der Quotient der mtea und (m — l)ten Potenz- Potenzsumme nähert sich mit wachsendem m der absolut grössten unter den Wurzeln. Nimmt man m negativ an, und setzt a absolut kleiner als ß, y . . . voraus, so folgt auf die gleiche Weise: Der Quotient der — wten und — (m -j- l)*?n Potenzsumme nähert sich mit wachsendem m der absolut kleinsten unter den Wurzeln. Da man die Potenzsummen als symmetrische Functionen durch die Coefficienten berechnen kann, so braucht man nur ein hinlänglich grosses m zu nehmen, um einen angenäherten Werth der absolut grössten und absolut kleinsten Wurzel zu erhalten. D. Bernoulli, Commentationes Petropolitanae. Bd. III.
384 Zehnter Abschnitt. §. 118. Wenn aber unter den Wurzeln der Gleichung solche vor- vorkommen, die denselben absoluten Werth haben, und dieser der grösste oder der kleinste ist, so ist diese Methode nicht anwend- anwendbar, also z. B. nicht auf reelle Gleichungen, bei denen ein Paar imaginärer Wurzeln vorkommt, das die reellen an absolutem Werth übertrifft. Wenn aber die grösste Wurzel zwar einzeln vorkommt, aber die nächstfolgende nicht viel übertrifft, so wird das Verfahren nur langsam einige Genauigkeit geben. Jacobi hat die Bernoulli'sche Methode nach einer Rich- Richtung ergänzt1). Nehmen wir an, es seien unter den Wurzeln xlt x2, . ¦ ., xn solche, deren absolute Werthe grösser sind, als die absoluten Werthe der folgenden xk+1, xk+2, . . ., x„ und setzen B) Pm + 1 = so werden, wenn wir C) (x — Xi) (x — x2)... (x — xk) = x* -f- AiX^~x -\- • • • -|- Ak setzen, die Coefficienten Au A2, . . ., Ak den Gleichungen genügen t-fc—a A2-f~- t-fc-i A2-\-- Wenn man den Gleichungen D) noch die Gleichung x* + A^-1 + A«*-2 H \- Ah = 0 zugesellt und die Ax, A2, . . ., Ak eliminirt, so ergiebt sich die Gleichung fcten Grades ¦ x*, x*-*, ... 1 Pm + hi Pm + k—1) ' ' - Pm. Pm+k + li Pm + lci ' * • Pm + 1 + 2k—li Pm + k — 1 Observatiunculae etc. Werke, Bd. 3, S. 280.
§. 118. Bernoulli'sche Näherungsmethode. 385 deren Wurzeln xu x2, -...,#& sind. Die Grossen pm, pm+i, . . ., können aber mit um so grösserer Genauigkeit durch, die ent- entsprechenden Potenzsutnmen aller Wurzeln ersetzt werden, je grösser m ist. So bekommt man z. B. für Je = 2: a _j_ PmPm + S — Pm+lPm + 2 , pli + 2 —Pm+lPm+3 __ q Pm + 1 — PmPm+2 Pm + 1 — PmPm + 2 ' ~ ' eine Gleichung, die man anwenden kann, wenn bei einer reellen Gleichung ein Paar conjugirter Wurzeln den absolut grössten Werth haben. Wenn man die Bernoulli'sche Methode auf die Summe der negativen Potenzen anwendet, so erhält man, wie schon bemerkt, eine Annäherung an die absolut kleinste Wurzel. Man kann aber, durch Verlegung des Anfangspunktes, jede Wurzel' zur absolut kleinsten machen, wozu freilich die Kenntniss eines bis zu einem gewissen Grade genäherten Werthes nöthig ist. Eine Formel, die für alle Fälle ausreicht, hat Fr. Meyer gegeben !). Es seien c^, a2, us, . . ., a„ die Wurzeln der Gleichung f(x) = 0, die reell oder imaginär sein können. Man suche einen Punkt p in der «-Ebene, so dass sich um p als Mittelpunkt ein Kreis beschreiben lässt, der nur einen der Punkte aua2, . . ., ccn enthält, etwa den Punkt al5 dass also die absoluten Werthe von E) i> — «i p — «i p — «t p — a2 ' p — a3 ' ' ' '' p — un echte Brüche sind. Solche Punkte existiren immer; sie müssen nöthigenfalls nach der Sturm'sclien Methode gefunden werden. Wählt man ausserdem noch eine beliebige Function cp (x), die mit f(x) keinen gemeinsamen Theiler hat, z. B. q>{x) = 1, und bildet die symmetrischen Functionen «i f («i) _j_ «2 9 0*2) 1 1 «tt 9 («») _ (p — <*i)m "*" (p — «,)»  *" (p — «.)" * (p — «)m "•" ' (p — axy * (p — so nähern sich diese mit wachsendem w der Grenze «i, und zwar um so schneller, je kleiner die absoluten Werthe der Brüche E) bereits sind. !) Mathematische Annalen, Bd. 33. Weber, Algebra. I. 25
386 Zehnter Abschnitt. §. 119. Die Richtigkeit hiervon zeigt sich sofort, wenn man die Formel F) in der Weise schreibt:. ^ |- Wir wollen schliesslich noch auf die neueren Untersuchungen von Fr. Cohn hinweisen, in denen diese Methoden der näherungs- näherungsweisen Lösung algebraischer Gleichungen weiter ausgebildet und auch nach der functionentheoretischen Seite hin untersucht sind !). §. 119. Die Näherungsmethode von Gräffe. Auf einem ähnlichen Gedanken, wie die Bernoulli'sche Näherung, beruht auch ein Verfahren, das von Gräffe an- angegeben und von Encke weiter ausgebildet ist2), und das sich besonders zu einer praktischen Durchführung der numerischen Rechnungen eignet. Sind, wie oben, a, ß,y ... die Wurzeln einer Gleichung und ist a die absolut grösste unter ihnen, so dass keine der anderen der Wurzel a an absolutem Werth gleichkommt, so hat A) y«m + ßm -f- y mit unbegrenzt wachsendem m den Werth a zur Grenze; es ist sogar die Convergenz gegen a noch besser, als bei dem im vorigen Paragraphen betrachteten Quotienten Mm _|_ ßm, _J_ ym _|_ . . . um-l _J_ ^m-i _|_ ym-1 _J_ . . .' wie man erkennt, wenn man nach dem verallgemeinerten binomi- binomischen Lehrsatz: J) Fr. Cohn, Ueber die in recurrirender Weise gebildeten Grossen und ihren Zusammenhang mit den algebraischen Gleichungen. Mathe- Mathematische Annalen, Bd. 44 A894). 2) Gräffe, Die Auflösung der höheren numerischeu" Gleichungen, als Beantwortung einer von der Berliner Akadamie gestellten Preisfrage, Zürich 1837. Encke: Crelle's Journal, Bd. 22 A841).
§. 119. Gräffe'sche Näherungsmethode. 387 j setzt. Die absolut kleinste unter den Wurzeln erhält man nach demselben Princip als Grenzwerth von B) + + + m ' ßm- ytn > und wenn p ein beliebiger Werth ist, so erhält man die dem Werth p am nächsten liegende Wurzel als Grenzwerth von C) p L (u — p)m (ß — p)m Wenn man die Gleichung f(x) durch die Substitution _ 1 __ 1 transformirt, so gehen die Ausdrücke B), C) aus dem Ausdruck A) hervor, auf den wir uns daher jetzt beschränken wollen. Wendet man die Formel A) auf eine reelle Gleichung an, so ist am -\- ßm -\- ym -(-... eine reelle Zahl; und wenn die absolut grösste Wurzel oc reell ist, so ist auch die mie Wurzel reell zu nehmen. Ist aber m eine gerade Zahl, so muss man, um über das Vorzeichen zu entscheiden, noch wissen, ob « positiv oder negativ ist. Nöthigenfalls wird darüber durch Einsetzen des gefundenen Näherungswerthes in die gegebene Gleichung entschieden. Ebenso wird man, wenn man die Formel A) auf eine ima- imaginäre Gleichung anwendet, entscheiden müssen, welche der ver- verschiedenen wten Wurzeln die richtige Annäherung giebt. Die Ausdrücke sm = «» -\- ßm -f- y» -f . . . lassen sich besonders einfach dann berechnen, wenn man für m die auf einander folgenden Potenzen von 2, also m = 2, 4,8,16... setzt, und liefern dann sehr gute Resultate. Es ist s2 der negative Coefficient der (w — l)ten Potenz der Unbekannten in der Gleichung, deren Wurzeln die Quadrate der 25*
388 Zehnter Abschnitt §. 119. Wurzeln von f(x) sind. Diese Gleichung wird aber leicht auf folgende Weise gebildet. Man fasse in fix) die Glieder mit geraden und mit ungeraden Potenzen von «zusammen und setze demnach f{x)= <p(x*)-\-xil>(x*). Es ist dann fx («) = y (xy — xip (xy = o die Gleichung, deren Wurzeln die Quadrate der Wurzeln von fix) sind. Behandelt man ft(x) ebenso, so erhält man eine Gleichung, deren Wurzeln die vierten Potenzen der Wurzeln von f{x) sind u. s. f. Die Ausführung dieser Rechnung ist sehr einfach und führt oft nach wenigen Schritten zu einer guten Näherung. Wir betrachten einige Beispiele. Zunächst nehmen wir die Gleichung D) . «3 — 2x — 2 = 0, die eine reelle positive und zwei imaginäre Wurzeln hat. Die reelle Wurzel ist grösser als 1,7, und da das Product aller drei Wurzeln gleich 2 und A,7K > 2 ist, so ist der absolute Werth der beiden imaginären Wurzeln kleiner als die reelle Wurzel. Also ist die reelle Wurzel die absolut grösste und die Gräffe'- sche Näherungsmethode muss auf sie führen. Man bekommt nun die Gleichungen, deren Wurzeln die zweite, vierte, achte... Potenz der Gleichung D) sind: xs — 4x2 -\- £x — 4 = 0 x?' — 8x* — lßx — 16 = 0 xz — 96 «2 — 162 = 0 und x = ^96 = 1,7692 . . . ist bereits ein in den vier ersten Decimalen genauer Werth. Der nächste Schritt würde kein anderes Resultat ergeben (weil die erste Potenz der Unbekannten in der letzten Gleichung fehlt); aber der darauf folgende ergiebt den in der sechsten Decimale genauen Werth 32 x = V85032960 = 1,769293 . . . Wir wollen noch ein zweites Beispiel- einer Gleichung fünften Grades betrachten, das Gelegenheit bietet, mehrere der Sätze des vorigen Paragraphen anzuwenden. Das Beispiel ist, wie die
§. 119. Grräffe'sehe Näherungsmethode. 389 früheren, der Theorie der complexen Multiplication der ellipti- elliptischen Functionen entnommen. Es ist die Gleichung fünften Grades E) «5 _ #3 _ 2 ä>a. — 2x — 1 = 0. Wir leiten daraus die Gleichung ab, deren Wurzeln die Quadrate der Wurzeln von E) sind, indem wir in {x= — x* — 2x)<* — Bx* -\- l)^ = 0 x2 durch x ersetzen. Dies giebt F) x* — 2x* — 3«s _ i = o, und wenn wir dasselbe Verfahren zunächst noch zweimal anwenden, so erhalten wir die Gleichungen, deren Wurzeln die vierten und achten Potenzen der Wurzeln von E) sind: G) x= — 10a* + 9«s _ 4^2 _ x = o, (8) x= — 82** + x* — 36«2 — 8x— 1 = 0. Die letzte dieser Gleichungen eignet sich zur Discussion. Sie hat nach dem Cartesischen Lehrsatz (§. 109) wenigstens eine positive Wurzel; und da die linke Seite von (8) für x = 1 negativ ist (= — 125), während sie für ein unendlich wachsen- wachsendes x positiv wird, so hat (8) eine reelle Wurzel, die grösser als 1 ist. Wenn wir für die Gleichung (8) die in dem Newton'sehen Kriterium (§. 109) vorkommenden Functionen 1, 4 al — 10 a0 a2, 6 af — 12 ax as 6a|— 12a2at, 4a| — 10% a5, 1 bilden, so erhalten wir die Vorzeichen + + - + - + und (8) hat also nach §. 109, Lehrsatz VIII. vier imaginäre Wurzeln. Die positive Wurzel ist jedenfalls grösser als 1, da die linke Seite von (8) für x = 0 und x = 1 negativ ist. Um nun zu entscheiden, welche der Wurzeln den grössten absoluten Werth hat, wollen wir in (8) x = 1 : z setzen, und dann nach §. 103, 104 untersuchen, wie viele Wurzeln im Inneren des Einheitskreises in der 5-Ebehe liegen. Setzen wir also in £5 -)_ 8 0i + 36 £3 _ zi -|_ 82 s — 1 g = cos fr -f- «sin ¦fr, so erhalten wir den reellen und imaginären Theil:
390 • Zehnter Abschnitt. §. 119. cp = cos 5 fr -\- 8 cos 4 fr -j- 36 cos 3 fr — cos 2 -9- -|- 82 cos fr — 1 ip = sinö-ö1 + 8 sin4'9i -f 36 ainZfr — sin2# -|- 82 sin«-. Es lässt sich nun zeigen, dass i\> positiv ist, wenn 0 < fr < n und folglich negativ, wenn 0 > fr > — jt, dass also der Einheits- Einheitskreis in zwei Segmente getheilt ist, in denen i/> entgegengesetzte Vorzeichen hat. Daraus folgt nach §. 113, XL, dass im Inneren des Kreises nur eine Wurzel liegen kann, und dies ist die reelle Wurzel, während die imaginären Wurzeln ausserhalb liegen. Es folgt dann daraus für die Gleichung (8), dass die reelle Wurzel den grössten absoluten Werth hat, und dass also dieser durch die Gräffe'sche Methode gefunden wird. Um nun diese Eigenschaft der Function i/> nachzuweisen, setzen wir 2coS'9i = §, und wenden die goniometrischen For- Formeln an: sin5# = sin#(£4 — 3 & + 1) sin 4-fr = sin fr (§3 — 2 §) sin 3 & = sin fr (§a — 1) sin 2 fr = sin fr §. Dadurch erhalten wir 1> = sin#[£* + |»(8| + 33) + D7 - 17$], woraus man. sofort sieht, dass der Factor von sin fr positiv bleibt so lange § zwischen — 2 und -|-2 liegt. Die Gleichung (8) giebt nun selbst schon einen ziemlich guten Näherungswerth für die reelle Wurzel x = f 82 = 1,73471. Ein genauerer Werth, den man erhält, wenn man noch zwei Schritte weiter geht, ist 1,73469, der in der fünften Decimale noch richtig ist. Eine Einschliessung der gesuchten Wurzel in zwei Grenzen giebt diese Methode nicht. Das Kennzeichen, ob ein genügender Grad von Genauigkeit erreicht ist, besteht darin, dass, wenn su, Sp zwei auf einander folgende, zur Berechnung benutzte Potenz- Potenzsummen der Wurzeln sind, diese sich mit genügender Genauigkeit verhalten, wie die ftte zur (i'tea Potenz einer Grosse, oder dass annähernd ftlogv — (i'logsu = 0 ist. Man muss aber diese Prüfung bei mehreren auf einander
§.120. Cubische Gleichungen. 391 folgenden Gliedern vornehmen, da in besonderen Fällen diese Relation scheinbar erfüllt sein kann und bei der späteren Rech- Rechnung wieder aufhört. §; 120. Trigonometrische Auflösung cubischer Gleichungen. Wir besprechen nun noch einige auf Gleichungen von speciellen Formen anwendbare Methoden der numerischen Auf- Auflösung. Das Ziel dieser Methoden ist, die allgemein verbreiteten Tafeln der trigonometrischen Functionen und der Logarithmen für die Auflösung von Gleichungen nutzbar zu machen. Wir wenden uns zunächst zur Betrachtung der cubischen Gleichungen, die wir immer in der reducirten Form A) «s + ax -\-b = 0 annehmen, worin a und b reelle Zahlen sind. Da die Ver- Vertauschung von x mit — x gleichbedeutend ist mit der Ver- Vertauschung von b mit —b, so können wir uns auf die Annahme beschränken, dass b negativ sei, und es bleiben dann noch drei verschiedene Fälle zu betrachten. Wir setzen b = — g und, je nachdem a positiv oder negativ ist, a = ^z e. Dann haben wir a) xs -f- ex — g = 0 b) x* — ex — g = 0, J < 17 c) x* — ex — g = 0, 27 > T ' Die Grenzfälle, dass eine der Grossen e, g, 4e3 — 27g'} ver- verschwindet, schliessen wir aus. Um die Cardanische Formel anzuwenden (§. 38), setzen wir wo das obere Zeichen im Falle a), das untere in den Fällen b) und c) gilt. In den Fällen a) und b) ist nur eine Wurzel reell, in dem Falle c) (dem Casus irreducibilis) sind alle drei Wurzeln reell. Die Cardanische Formel giebt * = yi + v* + 'V f -
392 Zehnter Abschnitt. §. 120. Wir verfahren" nun so in, den drei Fällen: a) Wir führen einen Winkel -91 ein, den wir zwischen 0° und 90° wählen können, durch die Gleichung: also *= V-rlV*»tg* + ;^5+ Ucotgtf- * VA »\ -^ — y tg -;, und wenn wir noch einen Winkel cp aus E) tg — = tg qp3 bestimmen, so ergiebt sich F) Die Winkel ¦81, 9 und zuletzt « findet man aus den logarith- logarithmisch trigonometrischen Tafeln nach den Formeln D), E), F). Um die imaginären Wurzeln zu erhalten, ersetzt man tgcjp durch q tg (p, wenn p eine imaginäre dritte Einheitswurzel bedeutet. b) Im zweiten Falle bestimmen wir den Winkel &, gleich- gleichfalls im ersten Quadranten, aus 2 V 27 sin«- cotg® x = \/ — (8) (9) "-"fl sin~T, c) Im letzten Falle endlich, wo drei reelle Wurzeln vor- vorhanden sind, setzen wir
§. 121. Trinomische Gleichungen. 393 x = l/-|- (j^cos fr -j- i sin fr -{- ]fcos# — i sin fr), oder nach dem Moivre'schen Satze: A1) x = 2 Vir cos i- *• Nimmt man ¦£>• wieder im ersten Quadranten, so erhält man für die beiden anderen gleichfalls reellen Wurzeln x-{-& Afe x — fr OS- -2)/ycos^—• Alle diese Formeln sind für die logarithmische Rechnung eingerichtet. §. 121. Die Gauss'sche Methode der Auflösung trinomischer Gleichungen. Gauss hat eine Methode angegeben, um die Wurzeln einer Gleichung, die nur drei Glieder enthält, in einfacher Weise numerisch aufzulösen. Solche Gleichungen kommen häufig vor und umfassen als Specialfälle alle quadratischen und die redu- cirten cubischen Gleichungen. Es wird zunächst von einer solchen Gleichung, deren all- allgemeine Form A) xm+n -j- ax™ -\- b = 0 ist, nur die positive Wurzel, wenn sie existirt, gesucht. Die etwaige negative ergiebt sich, wenn man x durch —x ersetzt. Nach den Vorzeichen von a, b hat man drei Fälle zu unter- unterscheiden, da, wenn beide Vorzeichen positiv sind, keine positive Wurzel vorhanden ist. Wir betrachten also, indem wir mit e und g positive Zahlen bezeichnen, die drei Fälle: a) xm+n + exm — g = 0, b) xm + n — exm — g = 0, c) a^ + n — exm -\- g = 0.
394 Zehnter Abschnitt. §. 121. n den beiden ersten Fällen haben wir nach dem Cartesi- schen Lehrsatz je eine positive Wurzel, im dritten können zwei oder keine positive Wurzel vorhanden sein. Wir setzen nun mit Gauss und suchen die drei Gleichungen a), b), c) durch passende Sub- Substitutionen auf die Form: sin2 © -f- cos2 © = 1 zurückzuführen. Wir setzen: „ xm + n . ^ e%m ^ i- sin@2m = sin ©2, = cos ©2, l = 9 9 sin ©2m B) b) gx-™-» = sm@*, ex~» = cos©2, * = c) — = sin ®\ y—— = cos ©2, l — sin©2mcos©2«. } e e Die letzte Gleichung ergiebt die Unterscheidung der beiden Fälle, in denen die Gleichung c) zwei oder keine positive Wurzel hat. Man erhält nämlich für das Maximum von sin@2mcos@2K nach den Regeln der Differentialrechnung mmnn (m 4- w)m+K' das für tg©2 = m : n erreicht wird. Wenn also l unter dieser Grenze liegt, so haben wir in c) zwei reelle Wurzeln, sonst keine. In den Formeln B) ist l eine gegebene Grosse, und man hat nun aus den Tafeln den Winkel © zu suchen, der diesen Gleichungen genügt. Wenn man. noch gar keine Kenntniss über die ungefähre Lage dieses Winkels hat, so ist es zweckmässig, für die erste Annäherung eine etwa von Grad zu Grad fort- fortschreitende, auf zwei Decimalen abgekürzte Tafel zu benutzen, um den so gefundenen Werth mit Hülfe genauerer Tafeln zu verbessern. Gauss benutzt nicht die trigonometrischen Tafeln, sondern die von ihm zuerst eingeführten Additions- und Subtractions- Logarithmen. Wir wollen dies an einem der Fälle in der Kürze
§. 121. Trinomisohe Gleichungen. 395 zeigen. Die Einzelheiten für die praktische Anwendung der Methode sind in der Gauss'schen Abhandlung zu suchen1). Die Tafeln der Additions- und Subtractions-Logarithmen, wie sie zuerst von Gauss eingeführt und berechnet sind, und wie sie sich jetzt auch in den gebräuchlichen Tabellenwerken finden, geben zu drei Zahlen, die grösser als 1 sind: a, b = 1 -| , c = 1 -f- a, et die Brigg'schen Logarithmen: A, B, C. Ist © ein Winkel im ersten Octanten, so kann man setzen: C)- a — cotg ©2, b = —l—, c = -^-~, 0 < © < 45°, v J s ' cos @2' sin @2' ' und wenn © im zweiten Octanten liegt: D) a = tg ©2, b — —^ c = —17^, 45« < © < 9Oo. v J ö ' sin @2' cos ©2 Wir wollen dies auf den Fall b) anwenden; dabei ist zu unterscheiden, ob l kleiner oder grösser als 2m ist, weil davon abhängt, ob © im ersten oder zweiten Octanten liegt. Es sind also wieder zwei Fälle zu unterscheiden: «) l < 2m, fom j^m foni -}- n an am+n cn ' E) xm+n — gc, xn = eb, od = — • ß) A>2» a + b = ac = —;—, bn » = gb, xn = ec, xm = —• ß O) Im Falle «) würde man also F) log l = m B — n Ä setzen und danach aus der Tafel die zusammengehörigen Werthe von A und B aufsuchen. Hat man diese gefunden, so ergiebt sich G) mlogx = A -\- logg — löge. 1) Beiträge zur Theorie der algebraischen Gleichungen, zweite Ab- Abtheilung A849). Gauss Werke, Bd. III, S. 85.
396 Zehnter Abschnitt. §. 121. Um den Gebrauch dieser Formeln an einem Beispiel zu erläutern, wollen wir die Gleichung betrachten: *s — 2 x — 2 = 0, also e = g = 2, m = 1, n = 2, A = | setzen. Die Formel F) giebt also (8) : 2Ä — B = 0,3010300 und G) (9) log x = A. Um den ersten Näherungswerth von A zu finden, benutzt man einen kleinen Auszug aus der Tafel: A = 0, B = 0,301 A = 0,1, B — 0,254 A — 0,% JB = 0,212 A = 0,3, I? = 0,176 Es ergiebt sich daraus: 0,2 0,3 2A — B 0,188 0,424 Fehler — 0,113 ,123 Man kann hierauf die Interpolationsmethode anwenden, um einen genaueren Werth von A zu erhalten, indem man den Gesammtfehler von 0,236 nach Verhältniss der Theilfehler auf beide Werthe von A vertheilt, also 0,1 A = 0,2 setzt. 0,236 0,113 = 0,247 . . . Mit Hülfe einer siebenstelligen Tafel von Zach erhält man nun: A 0,247 0,248 B 0,1948581 0,1944969 2A — B 0,2991419 0,3015031 Fehler — 0,0018881 + 0,0004731 und durch abermalige Anwendung der Interpolation A = 0,2477996 oder x = 1,769292. Eine etwas andere Anordnung der Rechnung ist den neuer- neuerdings erschienenen „Tafeln zur Berechnung der reellen Wurzeln sämmtlicher trinomischer Gleichungen'? von Gundelfingen (Leipzig 1896) zu Grunde gelegt.
§. 122. Imaginäre Wurzeln. 397 Dort wird z. B. die Gleichung b) in die Form gesetzt 9 9 Ist dann n 9 9 so folgt A0) 1 -f 10A = 10-8 und A1) logx= = also A2) A i B = lose : loggr. J m -\- n m -\- n Die Tafeln von Gundelfingen enthalten nun ausser den zusammengehörigen Werthen von A, B noch die Werthe von A — (iB für ein echtgebrochenes ft von (i = 0,05, (i = 0,1, (i = 0,15, . . ., so dass man, wenn man die rechte Seite von A2) berechnet hat, aus der Tafel direct genäherte Werthe von A, B findet, die dann nach A1) genäherte Werthe von logz ergeben. Die Methode von Gauss ist auch auf Gleichungen mit mehr als zwei Gliedern ausgedehnt wordenJ). §. 122. Berechnung der imaginären Wurzeln einer trinomischen Gleichung. Gauss hat auch für die Berechnung der imaginären Wurzeln einer trinomischen Gleichung ein Verfahren angegeben, das wir hier noch kurz besprechen wollen. Wir machen die Annahme reeller Coefficienten, obwohl die Methode auch auf den allge- allgemeinen Fall anwendbar ist. Wir wollen die Gleichung in die Form setzen: A) xm + u — ex™ — g= 0, brauchen uns aber hier nicht auf positive Werthe von e und g zu beschränken. !) A. Wiener, Sohlömiloh's Zeitschrift, Bd. 31. R. Mehmke, ebenda, Bd. 36.
398 Zehnter Abschnitt. §. 122. Wir setzen x , und erhalten, indem wir den imaginären Theil in A) für sich Null setzen, solcher Gleichungen erhalten wir aber noch zwei, wenn wir A) mit x~m und mit x~m~n mültipliciren. Dies giebt C) ^ + m_— <7sinmO- v J e sinn fr ' und von diesen drei Gleichungen folgt jede aus den beiden anderen. Wenn man r aus zwei von ihnen eliminirt, so ergiebt sich, wenn, wie oben gesetzt wird, ,., . sin n &* sin m O1™ ^ - *¦ ' sin(n->rm)&n+m' Man kann, da man von den beiden conjugirten Wurzeln nur die eine zu berechnen braucht, & auf den ersten Quadranten beschränken, muss aber dann unter Umständen auch r negativ annehmen. Wie man nun aus der Formel E) mittelst der trigono- trigonometrischen Tafeln den Winkel & und dann aus einer der drei Formeln B), C), D) den zugehörigen Werth von r berechnet, das wollen, wir nun an dem vorhin betrachteten Beispiel a;» — Ix — 2 = 0 noch nachweisen. Hier wird die Gleichung E) , . 1sin 2 O12 sin %¦ W  ~~ sin oder G) 3 log sin 3 & — 2 log sin 2 & — log sin & = 0,3010300, woraus zunächst ersichtlich ist, dass der Winkel & in dem Inter- Intervall von 0 bis 60° liegt. Man findet zunächst nach wenigen Versuchen, dass & zwischen 33° und 34° liegt, und wenn man dann für diese beiden Werthe die Differenz (8) 3 log sin 3 & — 2 log sin 2 & — log sin & — 0,3010300
§. 122. Imaginäre Wurzeln. 399 berechnet, so erhält man zunächst auf drei Decimalen , 0,026, — 0,013, und hieraus ergiebt sich durch Interpolation der genauere Werth & = 33» 40'. Hierauf berechnet man die Differenz (8) mit etwas grösserer Genauigkeit, etwa auf fünf Stellen für einige Winkel in der Nähe der Werthe 30° 40', von Minute zu Minute fortschreitend, und findet aus der Vorzeichenänderung, dass & zwischen 33° 41' und 33» 42' liegt. Wenn man nun für diese beiden Werthe die Rechnung auf sieben Stellen durchführt, so ergiebt sich wieder durch Inter- Interpolation der genauere Werth & = 33» 4i' 20,6". Aus den Formeln C) oder D) sieht man, dass hier r negativ ist, und man erhält r sehr einfach aus einer dieser Gleichungen. Man findet die Brigg'sehen Logarithmen: log(— r) = 0,0266148 log cos & = 9,9201547 — 10 log sin«- = 9,7440468 — 10. Also sind die beiden imaginären Wurzeln: — 0,88464G ± 0,589740 *.
Elfter Abschnitt. Kettenbrücke. §• 123. Verwandlung rationaler Brüche in Kettenbrüche. Wenn man eine natürliche Zahl m durch eine andere n nach den gewöhnlichen Regeln dividirt, so erhält man einen Quotienten und einen Rest, der positiv und kleiner als der Divisor n ist. Bedeutet a den Quotienten und r den Rest, so ist A) m — an -j- r. Alle Zahlen m, m', m", ..., die denselben Rest geben, heissen restgleich oder congruent nach dem Modul n, und man drückt dies nach Gauss durch das Zeichen aus: B) m = m' (mod. n). Eine solche Formel wird eine Congruenz genannt. Wenn wir also das System der Zahlen r = 0, 1, 2, . . ., n — 1 betrachten, so ist jede beliebige (positive oder negative) ganze Zahl m einer und nur einer von diesen Zahlen nach dem Modul n congruent. Dieselbe Eigenschaft hat aber auch jedes System von Zahlen S = fM0, IMi, OT2, . . ., OT„_i, die so ausgewählt sind, dass unter ihren Resten alle Zahlen r (und jede nur einmal) vorkommt. Es ist dann jede beliebige Zahl m einer und nur einer der Zahlen s nach dem Modul n
§. 123. Volles Restsystem. 401 congruent. Ein solches Zahlensystem wollen wir ein volles Restsystem für den Modul n nennen. Ein solches volles ßestsystem bilden z. B. bei ungeradem n die Zahlen _ ' ' ' ' Die Zahlen r heissen die kleinsten (oder kleinsten posi- positiven) Reste, die Zahlen g die absolut kleinsten Reste. Durchläuft s ein volles Restsystem für den Modul n, und hat a mit n keinen Theiler gemein, so durchläuft auch as ein volles Restsystem für denselben Modul. Denn wären unter den Zahlen as zwei verschiedene, as1 und a%, die denselben Rest geben, so müsste ihre Differenz a (sx — s2) durch n theilbar sein, und da a mit n keinen Theiler gemein hat, so müsste Si —• s3 durch n theilbar sein, was nicht möglich ist, wenn sx, s2 zwei verschiedene Zahlen eines vollen Restsystems sind. Um nun die in A) angedeutete Division fortzusetzen, wollen wir m, n, r durch m, w^, m2 bezeichnen, und dann wieder den Quotienten und den Rest der Division von inx durch m.2 mit al5 w% u. s. f. Setzen wir ausserdem noch a0 für a, so ergiebt sich eine Reihe von Gleichungen: m = a0 m1 -\- m% »»i = Oj m.2 -\- m% C) »«2 = «2 m% -f- m4 mv—\ = av-imv -f- »*r + 1, die sich so lange fortsetzen lässt, als keiner der Reste ver- verschwindet, d. h. so lange, als keine der Divisionen aufgeht. Weil aber m1 > m% > ms > • • • ist, so muss, da es nur eine endliche Anzahl von positiven Zahlen giebt, die kleiner als m1 sind, nach einer endlichen Anzahl von Theilungen die Division aufgehen. Wenn mv durch mv + i theilbar ist, so ist w»+i der grösste gemeinschaftliche Theiler von m und mv Denn mr + i ist dann nach den Gleichungen C) Theiler aller vorausgehenden m^, und umgekehrt ist jeder gemeinsame Theiler zweier benachbarter ma auch Theiler aller folgenden, also auch von mv + i- x Weber, Algebra. I. 26
402 Elfter Abschnitt. §. 123. Wenn daher m und m^ ausser 1 keinen gemeinsamen Theiler haben (wenn sie also theilerfremd oder relativ prim sind), so muss ffl»^i = 1 sein, und wir können die Gleichungen C) so darstellen: J m1 ' OTj m, . m-i mv-i , 1 —l- = ax -\ -, • • •, = a„_i -\ Dies giebt die Entwickelung des Bruches m: m^ oder m : n in einen Kettenbruch. Wir erhalten successive ,.. m .Im .1 E) — = a0 -\ , — = a0 -\ v J n ' m n n ' m, n ,1 — Oj -\ ' m w% und endlich F) f (h ¦ l 1 m, wofür wir, des bequemeren Druckes wegen, auch m / mx\ m / m.2\ n ~~ \ °' mj' n ~~~ V °' ^ mj m , . — = (Ct>a, di, d-2, . . ., ffli>_i, mv) setzen. Hierzu ist noch Folgendes zu bemerken: Jeder positive rationale Bruch lässt sich in die Form m : n setzen, so dass m und n relativ prim sind, und daher können wir jeden solchen Bruch in einen Kettenbruch von der Form F) oder G) ent- entwickeln. Auch für negative rationale Brüche gilt dies, wenn wir für die Zahl a0 auch negative Werthe zulassen. Die au a2,..., av_i, mr sind aber auch dann positive ganze Zahlen. Diese Zahlen sind vollkommen und unzweideutig bestimmt. Nur in einer Beziehung steht uns noch eine Willkür offen. Es ist nämlich nach der bis jetzt getroffenen Bestimmung der letzte der Theilnenner mv grösser als 1, da wir angenommen
§. 124. Irrationale Zahlen. 403 haben, dass mv + i der erste unter den Resten sein sollte, der gleich 1 ist. Demnach könneu wir, wenn av eine positive ganze Zahl ist, entweder mv = av, oder mv = a, -\- y setzen und erhalten daher die zwei Darstellungen durch Ketten- Kettenbrüche : m . — = («0, «1, «2, • • •) Ov) = («o, «li «2> • • •) «») !)• I. Es lässt sich also jeder rationale Bruch in einen Ketteribruch entwickeln, der nach Belieben eine gerade oder eine ungerade Anzahl von Theil- nennern hat. Die in den Formeln E) vorkommenden Zahlen • »j m2 ms j»2' w%' m^ ' ' '' nennen wir die Schlusszahlen des Kettenbruöhes, die Zahlen a0, «!, «2i • • • sollen die Theilnenner heissen (obwohl «0 nicht eigentlich als Nenner auftritt). Ersetzen wir m durch eine nach dem Modul n congruente Zahl m\ so unterscheiden sich die beiden Brüche m : n und m' : n nur um eine ganze Zahl; die Kettenbruchentwickelungen unterscheiden sich also nur in ihren ersten Gliedern a0. §. 124. Kettenbruchentwickelung irrationaler Zahlen. Wenn x eine reelle irrationale Zahl ist, so wird es immer eine und nur eine ganze Zahl a0 geben, so dass x zwischen a0 und a0 -f- 1 liegt. a0 ist positiv, wenn x grösser als 1 ist, Null, wenn x ein positiver echter Bruch ist, und negativ, wenn x negativ ist. Setzen wir also X\ so ist x1 ein positiver unechter Bruch, also wenn «x die zunächst unter xx gelegene ganze Zahl ist, % positiv. Wir setzen 26*
404 Elfter Abschnitt. §. 125. Xy = Oi + —, 2 + so dass %, #2, ...,#« positive unechte Brüche, %, «2, . . ., an—i ganze positive Zahlen sind. Nach der Bezeichnung des vorigen Paragraphen ist also x gleich dem Kettenbruch («0) <*1) Ö2? • • •¦> a«—li *»»)• Diese Kettenbruchentwickelung lässt sich aber, wenn x irrational ist, unbegrenzt fortsetzen, d. h. wir können n beliebig gross annehmen. Es entsteht der folgende aus dem vorangehenden dadurch, dass man xn = an -f- — • if-M + l setzt. Auch hier nennen wir die ganzen Zahlen «0, %, a^ ..., an—i die Theilnenner, xn die Schlusszahl. Die Kettenbruchentwickelung der rationalen Zahlen ist als Specialfall darin enthalten. §. 125. Die Näherungsbrüche. Wenn wir einen Kettenbruch A) X = (Oo, %, «2, • . ., «„-i, Xn), worin wir xn als eine variable Grosse ansehen können, in einen gewöhnlichen Bruch verwandeln, so erhalten wir im Zähler und im Nenner einen linearen Ausdruck in xn. Es wird also x — ) v -X- n ' «*« -f- V»—i worin Pre, Qn, P„_!, Qn—\ ganze rationale Functionen der «0) «i) <hi • ¦ •, an—i sind. Dass dies richtig ist, ergiebt sich für die ersten Werthe n = 1, 2, . . . durch unmittelbare Rechnung:
§. 125. Näherungsbrüche. 405 § x1 _ («0 «1 + Wenn wir die Formel B) für n schon als bewiesen voraus- voraussetzen, so erhalten wir, wenn wir xn = an setzen: (£»«»+ Qn-OUBn + l + Qn Das ist aber die Formel, die sich aus B) durch Vertauschung von n mit n -\- 1 ergiebt, wenn wir das folgende Bildungsgesetz für die P„, Qn annehmen: P „ T> _J_ T> K ' Qn + 1 = ««£« + Qn-l- Diese Formeln bestimmen vollständig die P„, Qn für n = 2, 3, 4, . . ., wenn wir noch die Bestimmung hinzufügen: P. = l, Px = «o, W <2o = 0, & = 1. Die Brüche n Pi ^ öo' öi' Q% '' ' von denen der erste mit dem Nenner Null nur formell, der Ueber- einstimmung wegen, eingeführt ist, heissen die Näherungs- Näherungsbrüche des Kettenbruches A), P„ der Zähler und Qn der Nenner des wten Näherungsbruches. Das Bildungsgesetz C) zeigt, dass, wenn die a ganze Zahlen sind, auch P„ und Qn ganze Zahlen sind. Sind die Theilnenner von % an positiv, so sind die Nenner Qu Q2, Qs, . . . alle positiv und wachsen mit n, und zwar, da es ganze Zahlen sind, ins Unendliche. Nur in dem besonderen Falle, wo % = 1 ist, ist $j = Q2 = 1 und das Wachsen beginnt erst von QB an, und wir können also den Satz formuliren: II. Sind Qn-i, Qn die Nenner von zwei auf einander folgenden Näherungsbrüchen, so ist 0 <; Qn-i <S Qn, Qn= » für » = 00, wo die Gleichheit mit der unteren Grenze 0 nur
406 Elfter Abschnitt. §. 125. bei n = 1, mit der oberen Grenze Q„ nur bei n = 2 vorkommen kann. Es ist also, wenn n > 2 immer 0 < Qn-x < Qn- Die Pl5 P2, P8, . . . sind, wenn a0 positiv ist, gleichfalls alle positiv, wenn «o negativ ist, so sind sie alle negativ, mit etwaiger Ausnahme von P2 = «0 «x -)- 1, was gleich Null sein kann. Die Qn sind von «0 ganz unabhängig. In welcher Weise die P« von «0 abhängen, können wir auf folgende Art erkennen. Nehmen wir die Zahlenreihe %, «2, «8, «4, ... als gegeben an und betrachten die Recursionsformel E) Tn+i = anTn + Tn-u so ist dadurch Tn vollständig für alle n bestimmt, wenn To und Tj gegeben sind. Nehmen wir zwei specielle Fälle Q„ und B„, die durch die Bedingungen Bo — 1, Et — 0 F) Go = 0, & = 1 bestimmt sind, so erhält man die allgemeine Lösung der Glei- Gleichung E) in der Form G) Tn= T0Bn-{- TiQn und hierin ist also auch (8) P« = Bn + «0 & enthalten. Wenn wir zwei Lösungen von E) betrachten, Tn und S„, also: ^ 5 ( ^ so folgt durch Elimination von an Tn + lSn — ^«^„+1 = — (TnSn—l Tn — i Sn), oder wenn wir ^nSn + l — SnTn + i = <4n setzen, (9) 4n= — -dn-X = 4n-t = ¦¦¦ = (— 1)»Z/O. Für Tn = Bn und Sn = Qn ist aber Jo = 1, [nach F)], also nach (9) Bn Qn + l — QnBn + i = (—1)», oder, indem man n in n — 1 verwandelt und das Zeichen beider- beiderseits umkehrt: A0) Bn Qn-i - Qn Bn-i = C- 1)".
§. 126. Unbestimmte Gleichungen. 407 Wendet man dies auf zwei Functionen Tn, Sn an, die durch Tn =T0Rn+ Tj. Qn, S„ = So i?„ + S, Qn definirt sind, so folgt Tn 8n-t - Sn Tn_x = (-1)« (To S, - Tx So), also im Besonderen A1) P» Qn-X - QnPn-l = (~ 1)». Diese Formel, von der wir noch mannigfache Anwendung machen werden, zeigt, dass die Zahlen PM, Qn ohne gemeinsamen Theiler sind, dass also die Näherungsbrüche Pre: Qn nicht durch Heben reducirt werden können. Ist der Kettenbruch ein endlicher, ist also die Schlusszahl xn—i = an—x eine ganze Zahl, so setzen wir die Bildung der Näherungsbrüche nicht weiter fort als bis zu Pn Pn—lCtn—1 ~f" P«—2 Qn Qn-1 Un-1 + Qn-2 ' und die Formel B) zeigt, dass dann der letzte Näherungsbruch mit dem Werthe des Kettenbruches übereinstimmt. §• 126. Lösung unbestimmter Gleichungen mit zwei Unbekannten. Die zuletzt gefundenen Formeln führen zur Lösung einer Aufgabe, die in vielen Anwendungen vorkommt: Es seien a, ß zwei gegebene ganze Zahlen ohne gemeinsamen Theiler, es sollen zwei andere ganze Zahlen gefunden werden, die der Bedingung genügen: A) ay - ßx = 1. Diese Aufgabe hat, wenn sie überhaupt lösbar ist, unendlich viele Lösungen, die alle aus einer von ihnen abgeleitet werden können. Ist nämlich x0, y0 eine Lösung, also B) ay0 — ßx0 — 1, so folgt durch Subtraction von A) und B) K {y — j/o) = ß (% — «o), woraus zu schliessen ist, da et, mit ß keinen gemeinsamen Theiler
408 Elfter Abschnitt. §. 126. hat, dass x — Xo durch a theilbar ist; setzen wir demnach, indem wir mit h eine willkürliche ganze Zahl bezeichnen, x = x0 -\- h a, so folgt und in dieser Form sind alle Lösungen von A) enthalten. Wir brauchen also nur noch eine Lösung von A) zu suchen, die wir immer auf folgende Weise erhalten. Wir setzen ß als positiv voraus, was die Allgemeinheit nicht wesentlich beschränkt, da wir eventuell x m —x verwandeln können, und entwickeln nach §. 123 die rationale Zahl et, : ß in einen Kettenbruch: a ¦ , N -j = (Oo, «i, «2) • • -l «»-1> Hiervon bilden wir die Näherungsbrüche £_0 £_l M Pn—l Pn Vo* &' &' ¦"' G—i' Qn so dass ü — Eil ß Qn' Da aber a, ß sowohl als Pre, Qn ohne gemeinsamen Theiler sind, und da ß und Q„ positiv sind, so folgt U = Pn, ß = Qn. Da nun ferner nach §. 125 Pn Qn-\ — Q»Pn-l = (- 1)" ist, so folgt, dass C) x = (-iyPn-u y = (-l)"G—i ganze Zahlen sind, die der Gleichung A) genügen, womit also die Aufgabe vollständig gelöst ist. Die Rechnung ist bei massig grossen Zahlen ziemlich einfach. Setzen wir z. B. a = 24335, ß = 3588, so erhalten wir zunächst nach §. 123 den Kettenbruch: = F, 1, 3, 1, 1, 2, 6, 2, 1, 1, 4), und die Näherungsbrüche J_6^7_273461156^997^ 2150 3147 0' T' T' 4' 5' 9' 23' 147' 317' 464' 5297 24335 781 ' 3588 '
§. 126. Unbestimmte Gleichungen. 409 und da hier n = 11, also ungerade ist, so hat man zu setzen: x — — 5297, y = — 781. Dies sind die absolut kleinsten Werthe von x, y, die der Gleichung A) genügen. Die kleinste positive Lösung erhält man daraus, wenn man w und ß dazu addirt, also x = 19038, y = 2807. Hierauf wird auch die Lösung der allgemeineren Gleichung D) ay — ßx = y in ganzen Zahlen x, y zurückgeführt. Zunächst ist klar, dass, wenn D) überhaupt lösbar sein soll, jeder gemeinsame Theiler von et, und ß auch Theiler von y sein muss. Ein solcher gemeinsamer Theiler wird dann durch Division weggeschafft. Wir nehmen also auch hier an, dass et, und ß keinen gemeinsamen Theiler haben. Dann folgt ebenso wie oben, dass alle Lösungen von D) aus einer von ihnen, a;0, y0, erhalten werden in der Form x = x(i -{-ha, y = yo-{-hß, worin h eine unbestimmte ganze Zahl ist. Setzt man dann in D) % = r I, y = v% und theilt durch y, so geht D) über in «ij — j8g = 1, also in eine Gleichung von der Form A). Die Lösung wird zu einer völlig bestimmten, wenn noch eine Bedingung gegeben ist, aus der h bestimmt werden kann, z. B. die, dass y zwischen 0 und ß liegen soll, mit Einschluss der einen der beiden Grenzen. Wir wollen dies in folgendem Lehrsatze zusammenfassen: III. Die unbestimmte Gleichung et,y — ßx = y hat, wenn a, ß, y ganze Zahlen und et, und ß ohne gemeinsamen Theiler sind, immer eine ganz- ganzzahlige Lösung x, y und nur eine, wenn noch die Bedingung o ^ y < ß, oder 0 < V ^ ß hinzukommt.
410 Elfter Abschnitt. §. 126. Nach dem oben Bemerkten giebt es aber auch immer Lösungen der Gleichung D), wenn y durch den grössten gemein- gemeinschaftlichen Theiler von « und ß theilbar ist. Insbesondere können wir den Satz aussprechen: Der. grösste gemein- gemeinschaftliche Theiler 8 zweier Zahlen «, ß lässt sich in der Form ccx — ßy — 8 darstellen, worin x, y ganze Zahlen sind. Das Theorem III. lässt sich in folgender Weise verallge- verallgemeinern : IV. Sind «!, a2, w8, . . . gegebene ganze Zahlen in beliebiger Anzahl, ohne einen allen gemeinsamen Theiler, m eine beliebig gegebene Zahl, so lassen sich immer die ganzen Zahlen x1, x2, xB, ... so bestimmen, dass E) m = «! xx -f- «2 x2 -j- «3 xs -j- • • • wird. Besteht die rechte Seite von E) nur aus zwei Gliedern, so fällt dieser Satz mit dem Theorem III. zusammen. Nehmen wir also die Möglichkeit, eine Formel E) zu befriedigen, als bewiesen an, wenn die rechte Seite aus weniger Gliedern besteht, so können wir, wenn 8 der grösste gemeinschaftliche Theiler von «2, «3, ... ist, da 8 relativ prim zu c^ sein muss, die beiden Gleichungen: 8 = aiyi-\- asys-\ • m = c^ Xi -{- 8 x durch ganzzahlige x, a^, y2, ys, ... befriedigen. Dann ist aber die Gleichung E) durch xt, x2 = xy^ xs=xys... befriedigt. Das durch den Satz III. gelöste Problem wird in der Zahlen- Zahlentheorie auch so ausgedrückt: V. Sind a, ß, y gegebene Zahlen, so soll eine Zahl y gefunden werden, die der Congruenz ocy = y (mod ß) genügt. Diese Aufgabe hat immer eine Lösung, wenn y durch den grössten gemeinschaftlichen Theiler von a und ß theilbar ist.
§. 127. Convergenz der Näherungsbrüche. 411 Das letzte Theorem führte zur Lösung der folgenden Aufgabe: VI. Es ist eine Keihe positiver ganzer Zahlen jWj, w%, ms, . . . gegeben, deren keine zwei einen gemeinsamen Theiler haben. Es ist eine ganze Zahl z zu bestimmen, die bei der Theilung durch w%, «w2, ms, . . . gegebene Reste rx, r2, r3, . . . g i e b t. Diese Aufgabe ist immer lösbar, und eine Lösung wird auf folgende Weise gefunden: Wir wollen mit m = mi W/i ms . . . das Product der Zahlen mxm%m% . . . bezeichnen und m = «i«! = m-2 «2 = ms o% . . . setzen, so dass nach unserer Voraussetzung «j = »%»% . . . relativ prim zu ml5 ebenso a2 zu w2 u. s. f. ist. Dann bestimmen wir nach V. die Zahlen xu x2, xs, . . . aus den Congruenzen «! Xx = rx (mod »%), a% x2 = r3 (mod m2), as xB = rB (mod jw8), ... und erhalten, da a2, «3, ... durch mx u. s. f. theilbar sind, die gesuchte Zahl in der Form X = Kx Xx -\- 0i2 X2 -\- ds Xs -\- • • • Hierzu kaun noch ein beliebiges Vielfaches von m gefügt werden. Die in diesem Paragraphen betrachteten Gleichungen ge- gehören zu den sogenannten Diophantischen Gleichungen, worunter man im Allgemeinen Gleichungen versteht, die eine grössere Zahl von Unbekannten enthalten, als nach den Regeln der Algebra daraus bestimmt werden können, worin aber die Unbekannten noch durch die weitere Forderung beschränkt sind, dass es ganze Zahlen sein sollen. Convergenz der Näherungsbrüche. Wir nehmen jetzt an, dass die Reihe der Zahlen ax, a2, a3, ... eine unbegrenzte sei, und bilden die Differenz zweier auf einander folgender Näherungsbrüche:
412 Elfter Abschnitt. §. 127. A) P» P»-i_ (—1)" Qn Qn—i QnQn — 1 Diese Differenz hat also bei geradem n das positive, bei ungeradem n das negative Zeichen und nimmt, dem absoluten Werthe nach, mit unendlich wachsendem n unbegrenzt ab. Bilden wir noch aus A): P' p ( 1 \n ( 1 \n +1 ,,.,) _n -T«-2 _ l lJ _j_ V l) W 'Qn Qn-Z QnQn-1 ^~ Qn-lQn-% (-1)" / J_ _ _J\ Qn-1 \Qn Qn-J' so folgt, da Qn—2 < Qn ist, dass diese Differenz bei geradem n negativ, bei ungeradem n positiv ist. Hieraus folgt, dass die Reihe der Näherungsbrüche mit geradem Index V T> V V2 Yi Vß eine abnehmende, die Reihe der Näherungsbrüche mit unge- ungeradem Index V V V Vl V^ ^j5 eine zunehmende ist. Nun ist nach §. 125 • x=PnXn-\-Pn-X " Qn%n-\- Qn-\ also und da Qn, Qn-n %n positiv sind, so sind alle Zahlen der Reihe C) grösser als x, alle Zahlen der Reihe D) kleiner als x. Der Unterschied E) sinkt mit unendlich wachsendem n unter jede Grenze und ist, da zn>a„, also Qnx„-{- Qn-i> Qn+i ist, dem absoluten Werth nach kleiner als 1 F) TTTt ' V» Vn + i und um so mehr kleiner als 1 : Qn. Die Zahlen der Reihe C) nähern sich also abnehmend, die der Reihe D) zunehmend der Grenze x. Der Ausdruck F) giebt ein Maass für den Fehler, den man begeht, wenn man x durch den Näherungsbruch P„ : Qn ersetzt.
§. 128. Aequivalente Zahlen. 413 Die Näherungsbrüche sind also angenäherte Ausdrücke von Irrationalzahlen durch rationale Brüche. Dass diese Näherungsbrüche bei gleichem Grade der An- Annäherung an die Irrationalzahl x die möglichst einfachen sind, das wird durch folgenden Satz ausgedrückt: VII. Es lässt sich zwischen den zwei rationalen Brüchen Pn Pn — 1 kein anderer rationaler Bruch einschieben, dessen Nenner kleiner als Qn oder auch nur gleich Q„ ist. Angenommen, es liege der rationale Bruch M: N zwischen den Näherungsbrüchen Pn : Qn und Pn~i ¦ Qn-i- Dann ist die Differenz Pn -P« —1 ~Qn ~ Qn-1 absolut grösser und vom selben Vorzeichen wie M Pn^ N Qn-X ' also Multiplicirt man beiderseits mit NQn-i, so folgt nach A) uud da rechts eine positive ganze Zahl steht, die also mindestens gleich ] ist, so folgt N> Qn- §. 128. Aequivalente Zahlen. Die Kettenbrüche führen uns auf die Betrachtung einer besonderen Art von linearen Substitutionen, die in der Algebra und Zahlentheorie überhaupt eine grosse Bedeutung haben, und die wir etwas näher betrachten wollen.
414 Elfter Abschnitt. §. 128. Sind x und y zwei Zahlen oder auch veränderliche Grossen, die in der Abhängigkeit von einander stehen /IN KX ~f~ ß A> • y = t^R' worin «, ß, y, tf ganze Zahlen sind, die der Bedingung B) ad — ßy = s = ±l genügen, so nennen wir x und y mit einander äquivalent'1). Wir nennen sie eigentlich oder uneigentlich äquivalent, je nachdem £ = -\- 1 oder £ = — 1 ist. Diese Beziehung ist eine gegenseitige, denn aus A) folgt C) x = 8y~l ¦ — yy + « Wenn zwei Grossen mit einer dritten äquivalent sind, so sind sie auch mit einander äquivalent. Denn ist D) x = —.—-j—~, v ' y' e -f- d" so folgt aus A) " + ß" wenn a" = a«' + /Jy',- ß" = Kß' { ' y" = y«' + 8y\ d" = y ß' + d d', G) a» fl" _ j3» r" _ („ § _ ^ y) (y ö' _ /}' r'), oder (8) s" = s e'. Die Substitution E) heisst aus A) und D) zusammen- zusammengesetzt. Es macht sich das Bedürfniss nach einer abgekürzten Be- Bezeichnung dieser Substitutionen geltend. Da es häufig nicht auf die Variablen, sondern nur auf die Substitutionszahlen a, ß, y, 8 ankommt, so bezeichnet man die ganze Substitution A).durch die Substitutionszahlen oder auch nur durch einen einfachen Buchstaben -1) Vgl. Dedekind, Schreiben an Herrn Borchardt über die Theorie der elliptischen Modulfunctionen. Oelle's Journal, Bd. 83 A877).
§. 128. Äequivalente Zahlen. 415 und schreibt dann, wenn es nöthig ist, die Gleichung A) so: Die Zusammensetzung zweier Substitutionen bezeichnet man durch Nebeneinandersetzen der Zeichen, wobei aber auf die Reihenfolge zu achten ist, also «,ß\(<ß'\_("",ß"\ )W)\) oder A1) SS' = S". Die Formeln F) enthalten die Vorschrift, nach der eine zusammengesetzte Substitution zu bilden ist. Man kann sie aus der Multiplicationsregel der Determinanten ableiten, muss aber beachten, dass im ersten Factor nach Zeilen, im zweiten nach Colonnen summirt werden muss, wie eben die Formeln F) zeigen. Ebenso wie man zwei Substitutionen zusammensetzt, kann man auch die Zusammensetzung von mehreren bilden: S Si S% Ss . . . Bei der Bildung der zusammengesetzten .Substitution dürfen, im Allgemeinen wenigstens, die Componenten nicht vertauscht werden; wohl aber kann man nach Belieben zwei benachbarte zu einer zusammenfassen, dann wieder zwei u. s. f., d. h. es gilt zwar nicht das commutative, wohl aber das associative Gesetz. Dies folgt unmittelbar daraus, dass, wenn x durch xx, xx durch x2, x2 durch xs ausgedrückt ist, der Ausdruck von x durch x6 entweder dadurch gefunden werden kann, dass man zuerst Xi in x durch x2 und dann x2 durch xz ausdrückt, oder dass man zuerst xx durch xs ausdrückt und dies in dem Ausdruck von x durch xx einsetzt. Nach (8) ist eine zusammengesetzte Aequivalenz eine eigent- eigentliche oder uneigentliche, je nachdem sich unter den Compo- Componenten eine gerade oder eine ungerade Zahl von uneigentlichen findet. ¦ Wenn man die beiden Substitutionen *)
416 Elfter Abschnitt. §. 128. zusammensetzt, so erhält man, gleichviel welche von beiden man an die erste Stelle setzt, <»> C: Diese Substitution ist nach A) gleichbedeutend mit y = x; sie ändert nichts und wird die identische Substitution genannt und wohl auch kurz durch 1 bezeichnet. Demnach nennt man die beiden Substitutionen A2) zu einander reciprok und bezeichnet sie mit S, S~\ oder man setzt \—sy, saj Durch die Zusammensetzung mit der identischen Substitution A3) bleibt jede andere Substitution ungeändert. Wir leiten hieraus sehr einfach den Beweis des Satzes ab: VIII. Alle rationalen Zahlen sind unter einander äquivalent, und zwar sowohl eigentlich als uneigentlich. Sind nämlich m : n und ml : n' zwei rationale Brüche und m und n sowohl als ml und n' ohne gemeinsamen Theiler, so können wir, wenn s, s' nach Belieben ±1 sind, die Zahlen (t, v und jt', v' nach §. 126 so bestimmen, dass mv — wjt = a, m!V — w'ft' = s' wird, dass also M - ( ^ \y, eine lineare Substitution, und __/a,ß \ w, v'J zwei lineare Substitutionen äind. Es ist dann auch MM'~l = woraus folgt: m = am' -\- ßn', n = ym' -f- 8n', also m n n ml
§. 129. Aequivalente Zahlen. 417 was zu beweisen war. Die Aequivalenz ist eine eigentliche oder eine uneigentliche, je nachdem e = e' oder b = — e' ist. Jede Zahl ist mit ihrer entgegengesetzten und mit ihrer reciproken uneigentlich äquivalent, denn es ist §. 129. Entwickelung äquivalenter Zahlen in Kettenbrüche. Wenn von zwei äquivalenten Zahlen die eine irrational ist, so ist es die andere auch, und wenn die eine' reell ist, so ist es auch die andere. Wir machen diese beiden Annahmen, setzen also in A) y==c^L±l ad_^r==£ v J y y x -f- d ^" x als irrational und reell voraus, und wollen nun untersuchen, wie sich aus der Kettenbruchentwickelung von x die Ketten- bruchentwickelung von y herleiten lässt. Es sei also x in einen Kettenbruch mit der Schlusszahl xn entwickelt: B) x = (a0, «!, a.2, . . ., a„_i, xn\ worin wir n vorläufig unbestimmt lassen. Durch die Näherungsbrüche ausgedrückt, wird Wenn wir dies in A) substituiren, so folgt worin nach §. 128, A0) und F), G) Rn = a Pn + ß Qm Rn^ = « PM_! + ß Qn-X {b) stt = rPn + d Qn, 8n-i = r P«-i + * Qn-i F) Rn 8n-l — Sn Rn-t = (— 1)" B. Setzt man Sn in die Form Weber, Algebra. I. 27
418 Elfter Abschnitt. §.129. so ergiebt sich, da sich P„ : Qn dem Werthe x bis auf jeden beliebigen Grad annähert und Q„ positiv ist, dass, wenn n gross genug gewählt ist, S„ im Vorzeichen mit (yx + *) übereinstimmt. Da x irrational ist, so ist diese Grosse von Null verschieden, und wir wollen sie als positiv voraussetzen. Wäre sie negativ, so hätten wir, um sie positiv zu machen, nur die Vorzeichen der vier Zahlen «, ß, y, 8 gleichzeitig zu ändern, wo- wodurch A) ungeändert bleibt. Es wird also 8n für hinlänglich grosse n positiv sein. Nun folgt aber aus E) mit Rücksicht auf §. 125, C): S« + l = 0>n Sn -f- So—i, ¦woraus man schliefst, dass, wenn n so gross ist, dass Sn—z und die folgenden 8 positiv sind, S„ mit n zugleich wächst, also: G) S„ > 8H-i> 0. Wir entwickeln nun den rationalen Bruch Bn : Sn in einen endlichen Kettenbruch (8) ^ = F„ h, 6„ . . , &«_!), und bezeichnen den vorletzten Näherungsbruch mit R' : S', so dass wir die Relation haben: (9) BnS'- SnR' = (-l)»\ Nach dem Satze I. in §. 123 können wir aber m nach Belieben gerade oder ungerade voraussetzen, und wir wollen so darüber verfügen, dass (— 1)>» = (— 1)» « wird. Ausserdem ist, wie wir aus §. 125, II. wissen, A0) Sn ^ S' ^ 0, worin aber das Gleichheitszeichen in der unteren Grenze nur für m = 1 und in der oberen Grenze nur für m = 2 und \ = 1, also überhaupt nur, wenn S„ = 1 ist, vorkommen kann, und dies kann man nach G) vermeiden, wenn man n gross genug annimmt. Da aber nach §. 126, III. durch die Bedingungen (9), A0) die Zahlen 8', B' völlig bestimmt sind, und Sn-i, jß„—i nach F), G) denselben Bedingungen genügen, so folgt S' = ön —1', JR' =r JBM_!.
§. 130. Quadratische Irrationalzahlen. 419 Hieraus ergiebt sich nun weiter, dass der Kettenbruch mit der Schlusszahl xn A1) F0, lu b2, . . ., bm-u xn) den ¦ Werth hat also mit ?/ übereinstimmt. Wenn man nun x„ weiter in einen Kettenbruch entwickelt xn = (am ccn^.i, cin + ib) • • •)' so erhält man aus B) und A1): x = (a0, al5 a2, . . ., an—i» *«) a« + i> ö« + 2> • • •) oder in Worten ausgesprochen den Satz: IX. Die Kettenbruchentwickelungen zweier äqui- äquivalenter Zahlen stimmen von einem gewissen Theilnenner an mit einander überein. Wir können noch hinzufügen, dass, wenn die Aequivalenz eine eigentliche ist (s = -j- 1), die Zahl der den überein- übereinstimmenden vorangehenden Theilnenner in beiden gerade, oder in beiden ungerade ist, und dass, wenn die Aequivalenz un- uneigentlich ist, diese Zahl in der einen gerade, in der anderen ungerade ist. Dass der Satz auch umgekehrt gilt, ist leicht einzusehen. Denn wenn zwei Kettenbrüche von einem gewissen Theilnenner an übereinstimmen, so können sie so geschrieben werden, dass sie dieselbe Schlusszahl haben. Nun ist der Werth eines Ketten- Kettenbruches aber immer äquivalent mit jeder seiner Schlusszahlen [§. 125, B)]; also sind auch zwei Kettenbrüche mit gleicher Schlusszahl unter einander äquivalent. §. 130. Quadratische Irrationalzahlen. Einfache und schöne Gesetze ergeben sich, wenn man die Kettenbruchentwickelung auf die Bestimmung der Wurzeln einer quadratischen Gleichung anwendet. Die Wurzel einer ganz- ganzzahligen quadratischen Gleichung hat die Form A) a = x + yVd, 27*
420 Elfter Abschuitt. §. 130. worin x, y, d ganze oder gebrochene rationale Zahlen sind. Wir können aber, ohne die Allgemeinheit zu beschränken, d als ganze Zahl und ohne quadratischen Theiler voraussetzen; denn wenn d einen Nenner hat, so können wir mit diesem Nenner erweitern und können die Wurzel aus dem quadratischen Nenner und aus einem etwaigen quadratischen Theiler des Zählers zu y rechnen; wir nehmen dann weiter an, dass d nicht gleich 1 ist, da sonst to rational wäre; d kann positiv oder negativ sein, und davon hängt es ab, ob to reell oder imaginär ist. Wir wollen das Vorzeichen der Quadratwurzel Vd eindeutig bestimmen, was etwa dadurch geschehen kann, dass man bei positiven d auch Vd, und wenn d negativ ist, — * Vd positiv an- annimmt oder, anders ausgedrückt, dass man Vd positiv reell oder positiv imaginär annimmt. Aendern wir das Vorzeichen der Wurzel, so erhalten wir B) to' = x — y Vd, was die zu to conjugirte Zahl genannt wird. Sie entsteht auch aus to durch Aenderung des Vorzeichens von y. Das Pro- duct der beiden Zahlen to, to' to to' = ,-r2 — y%d heisst die Norm von to (oder auch von to'). Die Norm eines Productes zweier quadratischer Irrationalzahlen ist gleitfh dem Product der Normen. Die Norm einer imaginären Zahl to ist immer positiv. Bei reellen quadratischen Irrationalzahlen kann die Norm positiv oder negativ sein. Die Zahlen to und to' sind die Wurzeln einer Gleichung mit rationalen Coefficienten: C) to2 — 2xa -\- («2 — yzd) = 0. Um sie in eine ganzzahlige Gleichung zu verwandeln, setzen wir D) X2 — yzd = — —, 2x = —, c c worin- a, b, c ganze Zahlen ohne gemeinsamen Theiler sind, und erhalten aus C) E) c to2 = a -f- b to, also eine ganzzahlige primitive Gleichung.
§. 130. Quadratische Irrationalzahlen. 421 Die Zahlen a, b, c sind durch D) nur bis auf ein gemein- gemeinsames Vorzeichen bestimmt. Die Discriminante von C) ist F) D = &a + 4ac = 4ca«M und soll auch die Discriminante der Irrationalzahl co heissen. D ist also eine ganze Zahl, die im Vorzeichen mit d übereinstimmt und die durch d theilbar ist; denn ist p ein Prim- theiler von d, der also in d nach Voraussetzung nur einmal auf- aufgeht, so kann p nicht im Nenner von 2cy aufgehen und muss also nach F) in D aufgehen. Also ist auch 2cy eine ganze Zahl und der Quotient D : d ist eine Quadratzahl. Um die Vorzeichen von a, b, c zu bestimmen, wollen wir festsetzen, dass die ganze von Null verschiedene Zahl 2cy positiv sein soll, dass also c und y im Vorzeichen überein- übereinstimmen. Wenn wir nun setzen, also VD ebenso wie Vd positiv reell oder positiv imaginär annehmen, so ergiebt sich nach D) und F) oder, was dasselbe ist . 2a , —2a <8> Es ist daher nicht nur das Zahlensystem a,b,c durch <a eindeutig bestimmt, sondern auch umgekehrt co durch o, b, c. Setzen wir, um diese Zugehörigkeit auszudrücken (9) to = {a, b,c}, so ist die conjugirte Zahl to' zu bezeichnen durch A0) co' = { — a, — b, — c}- Da eine gerade Quadratzahl durch 4 theilbar ist, eine ungerade, durch 4 getheilt, den Eest 1 lässt, so ergiebt sich aus F), dass A1) Z> = 0 oder = 1 (mod 4) sein muss. Wir wollen noch untersuchen, wie sich die Zahlen a, b, c, D ändern, wenn wir von a zu einer äquivalenten Zahl oo1 über- übergehen. Es sei also
422 . Elfter Abschnitt. §. 130. * yto -j- d Setzen wir _ _ co = x -\-yVd, co1 = xx + yx]/'d, so folgt, wenn man in A2) den Nenner rational macht, 2 yd'x + 82' und wenn m1 der quadratischen Gleichung A5) Cj ojj2 = % -(- 6j ojj genügt, nach A2) und E): 6L_ — 2aay + 6foig + ßy) -\- 2cß8 i 4- cß2 ferner nach D) und A3): syc = (—ay2 -\- byd -\ Wir setzen hiernach — £«! = — a«2 -(- baß -\- cß2, A6) a6i = — 2aay + &(«* + /3r) -f- 2c/3d, a Ci = — ay2 _)_ byd -f cd2, und folglich A7) 2/c — ^d, so dass ylei positiv ist. Aus A6) ergiebt sich durch Auflösung sa = ax d* -f 6, ß d — e1 ß2, A8) Bl = 2a1y8 -\-bx(a8 -[- ßy) — 2c1aß, — sc = a1y2-\-b1Ky — cx a2, woraus zu schliessen ist, dass die durch A8) bestimmten Zahlen «!, bt, d keinen gemeinsamen Theiler haben. Ferner ergiebt sich noch durch einfache Rechnung, oder auch nach dem Multipli- cationssatze der Determinanten A9) b2 -f iac = bl + ia1c1 = D. Aus A7) und A8) schliessen wir, dass die Zahlen a^, bu cx dieselbe Bedeutung für a1 haben, wie a, b, c für to, und dass daher
§. 181. Reducirte Zahlen. 423 B0) <Ol ^ zu setzen ist. Durch A9) ist dann der Satz bewiesen: Aequivalente Irrationalzahlen haben nicht nur dieselbe Irrationalität, sondern auch dieselbe Dis- criminante. §• 131. Reducirte Zahlen mit negativer Discriminante. Die bisherigen Betrachtungen sind gleichmässig auf die beiden Fälle der reellen und imaginären quadratischen Irrationalzahlen, also auf positive und negative Discriminanten anwendbar. Jetzt Fig. 26. aber müssen beide Fälle von ein- einander getrennt werden, und wir beginnen mit den negativen Dis- Discriminanten. Es handelt sich also um imaginäre Zahlen: A) ca =x-\-y V d = !¦-\-irj, worin § und rj reell sind; es ge- genügt, von den beiden conjugirten Zahlen g-f-*)j, § — ir\ die eine zu betrachten. Wir nehmen also rj positiv aii und setzen folgende Definition fest: Eine complexe Zahl ca = § -f- irj heisst bei positivem rj reducirt, wenn Betrachtet man f, rj als rechtwinklige Coordinaten in einer Ebene, so wird jede Zahl ca durch einen Punkt dieser Ebene veranschaulicht, und die Lage der Punkte, die den reducirten Zahlen entsprechen, wird durch das in d§r Fig. 26 schraffirte Feld (mit Einschluss der Grenzen), das wir das Grundfeld nennen, veranschaulicht. Aus den Bedingungen B) folgt dann noch, was auch in der Figur leicht zu bestätigen ist, C) n*^h c Geht man nun von einer Zahl co zu einer äquivalenten Zahl cat über, so ergiebt die Formel A2) des vorigen Paragraphen
424 Elfter Abschnitt. §. 131. und diese Formel zeigt, dass % dasselbe oder das entgegen- entgegengesetzte Zeichen wie rj hat, je nachdem £ = -\- 1 oder = — 1 ist, also je nachdem die Aequivalenz eine eigentliche oder eine uneigentliche ist. Beschränken wir uns also auf Zahlen mit positiv imaginärem Bestandtheile, so kommt nur die eigentliche Aequivalenz in Betracht, und wir beweisen jetzt den Fundamentalsatz: 1. Jede imaginäre quadratische Irrationalzahl x -f- y]/d mit positiv imaginärem Bestandtheil ist mit einer reducirten Zahl äquivalent. Verstehen wir unter a die dem § nächstgelegene ganze Zahl, so wird a> — a der ersten der Bedingungen B) genügen, dass nämlich — f ^ § — a^l isk Wenn nun E) r2 = (§ — aJ -f- i?a = (ra — «) (co' — a) grösser oder gleich 1 ist, so ist a> — a, was mit a> äquivalent ist, bereits reducirt; anderenfalls setzen wir, indem wir eine Ketten- bruchentwickelung anwenden, F) m = * - i-, so dass auch o>i = §i + ifji mit o äquivalent ist. Die Zahl <ax behandeln wir nun wieder ebenso wie co, indem wir, wenn a>1 — «j noch nicht reducirt ist, G) ah = «! — — setzen u. s. f. Betrachten wir die Reihe der nach Analogie von E) gebildeten Grossen rl = (|t - «,)« + nl r* = fa — a& + v>, . . ., so konimt es also jetzt nur darauf an, nachzuweisen, dass wir nach einer endlichen^ Zahl von Schritten dieser Art zu einem r% kommen, das gleich oder grösser als 1 ist. Nach F) ist aber r» = (m — «) K — «) = , „ und danach ergiebt die Vergleichung der imaginären Theile auf beiden Seiten von F):
§. 131. Reducirte Zahlen. 425 Ebenso folgt die Reihe der Gleichungen (8) r\ = r2^, r^ = r?r}2, rjs = r|ij8, . . . Nun ist aber irj — yVd, und also nach der Formel F), §. 130 und weil hier y positiv ist, so ist c eine positive ganze Zahl. Weil aber äquivalente Zahlen dieselbe Discriminante haben, so folgt ebenso: _ V . V3 worin c, cl5 e2, . . . eine Reihe positiver ganzer Zahlen ist. Danach erhält man aus (8): (9) d = rH, c2 = r/Cj, c3 = r?c2, . . . So lange aber die Zahlen r2, rf, . . ., r% kleiner als 1 sind, folgt hieraus A0) c > d > c2 . . . > c, + i, und weil es nur eine endliche Anzahl positiver Zahlen geben kann, die kleiner als c sind, so muss diese Reihe abbrechen, womit unser Satz 1. bewiesen ist. Die reducirten Zahlen, deren Bilder an der Begrenzung des Grundfeldes liegen, sind paarweise äquivalent, nämlich a) ea = — \ -f- irj und <o1 = (o-{-l—±-\-irj (a und a' in der Figur), b) o) = — | + in und coY = — — — | -)- irj, wenn ]¦* -\- rj* = 1 ist (b und V in der Figur). Es gilt aber ferner der Satz: 2. Von den Fällen a), b) abgesehen, sind keine zwei reducirte Zahlen äquivalent. Nehmen wir nämlich zwei nicht identische reducirte Zahlen an, A1) ß> = I + n i, ß>i = §i + Vi h und setzen voraus, was die Allgemeinheit nicht beeinträchtigt, A2) Vi ^ V, so folgt aus der Formel D): r\ also wegen A2): A4)
426 Elfter Abschnitt, §. 131. also auch, nach C): A5) i^r2^2^fr2; also sind zwei Möglichkeiten: «) y = 0, ß) r = ±l. Im Falle a) ist «d = 1, also a = d = ± 1, aus A3) er- giebt sich ^ = ¦>?, ferner aus D): Dies ist aber nur dann mit den Bedingungen B) verträglich, wenn entweder gt = g, ß = 0, und also <»i mit oj identisch ist, oder wenn ß = + 1 und §, = — % = + | ist, also in dem Falle a). Im Falle ß) ist nach A4) (g ± dJ <| 1, und also entweder: d = 0, /3y = — 1 und £2 -f- ??2 = 1, ^ == ^, ferner nach D) §! :=: ± « — £, also, da fi = | ausgeschlossen ist, ^ = -r- §, « = 0, das ist der Ausnahmefall b), oder: d = + 1, also (g + lJ -f- j?2 ^ 1, und folglich nach C) (| ± lJ ^ \. Weil aber (| ± 1) nach B) dem absoluten Werth nach mindestens gleich \ sein muss, so folgt hieraus g = q= |, j?2 = f; mithin nach A3) ^2 = i?2 = f, und nach B) gxa = -j, g, = + |, was sowohl unter dem Fall a) als unter dem Fall b) enthalten ist. Hiermit ist also der Satz 2. bewiesen. Dem fügen wir nun noch als dritten Satz hinzu: . Zu einer gegebenen negativen Discriminante D giebt es nur eine endliche Anzahl reducirter Irrationalzahlen. Aus der Darstellung der Irrationalzahlen §. 130, G): b t b f--D und aus der Ungleichung C) ^2 ^> f folgt oder -D 3 ' , ... also giebt es, wenn D gegeben ist, nur eine endliche Zahl von Werthen der positiven ganzen Zahl c. Ferner folgt aus 2 =3 » ^S 2 ' — c <L b <, c.
§. 132. Reducirte Zahlen. 427 Also giebt es zu jedem Werth von c nur eine endliche Zahl von Werthen für b, w. z. b. w. Vereinigt man alle unter einander äquivalenten Zahlen zu einer Zahlclasse, so haben wir dann also nach 1. bewiesen: 4 Die Anzahl der Classen von imaginären qua- quadratischen Irrationalzahlen einer gegebenen Discriminante ist endlich. §. 132. Reducirte Zahlen mit positiver Discriminante. Wir haben nun eine ähnliche Untersuchung durchzuführen für ein positives d, also für reelle quadratische Irrational- Irrationalzahlen. Eine solche Zahl co = x -f- y Vd soll reducirt heissen, wenn sie folgenden Bedingungen genügt: co ist positiv und grösser als 1, und die mit co conjugirte Zahl co' ist negativ und dem absoluten Werthe nach kleiner als 1, oder in Zeichen: A) 0 < y Vd — x < 1 < y Vd + x. Deutet man in einer Ebene x, y als rechtwinklige Coor- dinaten, so dass die Punkte der Ebene die Bilder der Zahlen co werden, so liegen also die Bilder der reducirten Zahlen in dem Theile der Ebene, der in der Fig. 27, die der Annahme d = 2 entspricht, schraffirt ist. Wir nehmen hier eigentliche und uneigentliche Aequivalenz zu- zusammen und beweisen zunächst die Sätze: 1. Jede Zahl ca ist mit einer reducirten Zahl äquivalent. Man sieht dies leicht ein, wenn man co in einen Kettenbruch entwickelt und bis zur Schlusszahl co„ geht: B) oo = (a0, «!, «2, . . ., «„_,, con).
428 Elfter Abschnitt. §. 132. Dann ist co mit con äquivalent, und con ist, sobald n grösser als 0 ist, positiv und grösser als 1. Da con mit co äquivalent ist, so handelt es sich nur noch um den Nachweis, dass, wenn n hinlänglich gross ist, die zu con conjugirte Zahl co'n negativ und absolut kleiner als 1 ist. Dies aber ersieht man aus nach- nachstehenden Formeln: Aus B) folgt, wenn P„ : Qn die Näherungs- Näherungsbrüche sind, _ Pncon -f Pn_x oder durch Auflösung (*\ n — ^n-i m - Pn-i _ Qn-1 (— 1)" {) n~~ Qnco-Pn - Qn Q«{Q«co-Pn) Verwandeln wir in dieser Gleichung Vd in — Vd, so geht gleichzeitig co in co', con in co'n über und wir erhalten aus C) n /¦¦.' t> n /¦» ' / V» — l"» — -fn—l Vit—1 V»—1 <?»<»' — Pn ~~ QV , P„ ' m--Qn E) 1 V» V«-i (—D* Wenn nun n hinlänglich gross angenommen wird, so unter- unterscheiden sich / °» / "n — l CO -y-, OJ ^ Vn V»—i beliebig wenig von der nicht verschwindenden Differenz co' — co = —2yVd, wonach D) zeigt, dass co'n negativ ist. Aus E) aber folgt, dass co'n -\- 1 positiv ist, da Q„ — Qn—i als positive ganze Zahl mindestens gleich 1 ist, und 1 für ein hinlänglich grosses n beliebig klein wird; und dadurch ist der Beweis des Satzes 1. geführt. Da die conjugirte Zahl von der conjugirten co' die ursprüng- ursprüngliche Zahl co ist, so folgt aus der Definition der reducirten Zahlen, dass co und — 1 : co' gleichzeitig reducirt sind.
§. 133. Reelle quadratische Irrationalzahlen. 429 2. Ist ca reducirt und für ein ganzzahliges a F) ca = a + —, so ist ca1 dann und nur dann reducirt, wenn « die grösste in ca enthaltene ganze Zahl ist, wenn also G) k < co < a -f- 1- Ist die Bedingung G) erfüllt, so ist cax positiv und grösser als 1, und <8) < = 1^ ist, da ca' negativ ist, ein negativer echter Bruch; also ist cal reducirt. Dagegen kann cal nicht reducirt sein, wenn a > ca ist, da dann oj] negativ ist, oder wenn « -j- 1 < ca ist, da dann car kleiner als 1 ist. Setzt man (8) in die Form (9) - h = <* + -V» so ist, da — 1 : ca' und ¦— 1 : ca't zugleich mit ca und caL redu- reducirt sind, a die grösste in — l: «»i enthaltene ganze Zahl, und ca' ist nach (9) durch ca't, also auch ca durch caY völlig bestimmt. Hieraus folgt: 3. Entwickelt man eine reducirte Zahl ca in einen Kettenbruch, so sind alle Schlusszahlen can wieder reducirte Zahlen, und durch eine dieser Schluss- Schlusszahlen can ist sowohl die folgende can+1 als die vorangehende <»„_! vollkommen bestimmt. §. 133. Entwickelung reeller quadratischer Irrationalzahlen in Kettenbrüche. 4. Für eine gegebene Discriminante giebt es nur eine endliche Anzahl reducirter Zahlen. Die Richtigkeit dieses Satzes sieht man leicht ein, wenn man nach §. 130 die Irrationalzahl ca in die Form setzt:
43a Elfter Abschnitt. §. 133. ... b 4-VD —2a Die conjugirte Zahl ist B) co' = ~ 1 ' 2 c Soll a> reducirt sein, so ist C) Q< D2~b Es muss also, da VD positiv ist, c positiv sein und D) 0 < VD — b < 2 c < VD -|- b. Eine zweite Form dieser Bedingungen erhalten wir aus der zweiten Darstellung E) 0 < VD — b < 2 a < VD + b. Es sind also a, b, c positiv und b kleiner als als VD. Bedeutet X die grösste in YD enthaltene ganze Zahl, also k < YD < k + 1, so hat b einen der Werthe 1, 2, 3, . . ., k, jedoch mit der Be- Beschränkung, dass bei geradem D nur die geraden,, bei ungeradem D nur die ungeraden unter diesen Zahlen für b zu nehmen sind. Es ist dann a und c so zu bestimmen, dass F) —^— = ac, und dass k — b + 1 ^ A-j-6 und a muss zwischen denselben Grenzen liegen. Nur einer von diesen beiden Grenzwerthen ist eine ganze Zahl, der andere kann für die untere Grenze durch die nächst grössere, für die obere Grenze durch die nächst kleinere ganze Zahl ersetzt werden. Es ist also für b nur eine endliche Zahl von Werthen zulässig; dann ist (D — ö2) : 4 nur auf eine endliche Anzahl von Arten in zwei Factoren zerlegbar, und von diesen Zerlegungen sind nur die beizubehalten, in denen beide Factoren der Bedingung G) genügen. Ausserdem sind noch solche Combinationen wegzu- wegzulassen, in denen a, b, c einen gemeinsamen Theiler bekommen. Darin liegt das Mittel, um für ein gegebenes D alle reducirten Zahlen wirklich zu bestimmen, und dann ist nach §. 130, (9)
§. 133. Reelle quadratische Irrationalzahlen. 431 weil y und c hiei* positiv sind. Aus §. 132, 3. und §. 133, 4. er- gieht sich nun der folgende wichtige Satz: 5. Die Kettenbruchentwickelung einer reducirten Zahl co ist periodisch, d. h. wenn co in einen Kettenbruch (9) co = («0, %, a2, . . .) entwickelt wird, so kehren immer nach einer bestimmten Anzahl von Theilnennern dieselben Theilnenner in derselben Reihenfolge wieder, also, wenn die Periode aus v Gliedern besteht, so ist «ir—l = «2V—1 = «3V — 1 • • •, und es genügt also, den ganzen Kettenbruch durch die Periode zu bezeichnen, etwa so: A0) m = [«0, «j, . . ., «r_j]. Dieser Satz ist offenbar gleichbedeutend damit, dass die Schlusszahl cov des Kettenbruches (9) mit co selbst identisch ist, und darin liegt auch der Beweis der Behauptung. Denn die Schlusszahlen cov gehören als äquivalente Zahlen alle zur selben Discriminante, und daher ist nach 4. die Zahl aller möglichen Schlusszahlen nur eine endliche. In der Reihe der Schlusszahlen co, o}1? oj2 . . . muss daher einmal eine schon dagewesene zum zweitenmal auftreten. Ist cor die erste, die zum zweitenmal auf- auftritt, so muss co„ = co sein, da sonst nach §. 132, 3. auch gj„_i zum zweitenmal auftreten würde. Es lassen sich also die sämmtlichen, zu einer Discriminante gehörigen reducirten Zahlen in Perioden anordnen: A1) co, cou o2, . . ., «„_!, so dass, wenn «0, «!, «2> . . ., «„_! die grössten darin enthaltenen ganzen Zahlen sind, m = [a0, «!, . . ., a„_i] <°1 — [«1) «25 • • •» «f-15 «o]
432 Elfter Abschnitt, §. 133. ist, womit die Kettenhruchentwickelung für jede von diesen Zahlen gegeben ist. Ist durch eine Periode das ganze System der zur Discri- minante D gehörigen reducirten Zahlen noch nicht erschöpft, so bildet man eine zweite Periode u. s. f. Da durch eine Zahl co sowohl die in der Periode vorhergehende, wie die nachfolgende völlig bestimmt ist, so enthalten zwei verschiedene Perioden nie- niemals eine gemeinschaftliche Zahl. Von diesen Perioden gilt nun der Satz: 6. Reducirte Zahlen aus derselben Periode sind äquivalent, aus verschiedenen Perioden sind nicht äquivalent. Der erste Theil der Behauptung ist von vornherein klar, da reducirte Zahlen derselben Periode Schlusszahlen von einander sind; der zweite Theil ist durch den Satz §. 129, IX. bewiesen, dass äquivalente Zahlen, bei hinlänglich weit fortgesetzter Ketten- bruchentwickelung, schliesslich dieselben Schlusszahlen bekommen. Sind also beide Kettenbrüche periodisch, so müssen sie derselben Periode angehören. Hat man für eine gegebene Discriminante D nach den am Anfang des Paragraphen gegebenen Vorschriften das vollständige System der reducirten Zahlen entwickelt, so ist es leicht, diese Zahlen in Perioden zu ordnen und die Theilnenner a des Ketten- Kettenbruches zu finden. Es sei nämlich eine von diesen Zahlen, die ihr in der Periode unmittelbar folgende Zahl, so dass A4) co = a -| , co1 = co — a ist, wenn a die grösste in co enthaltene ganze Zahl bedeutet. Nach A2) und A4) ist dann 2c co. \-b — 2ca und die Vergleichung mit A3) giebt A5) ax = e, bi = 2 ca — b.-
§. 133. Periodische Kettenbrüche. 433 Wenn umgekehrt zwei der zu D gehörigen reducirten Zahlen {a, b, c), {«!, &j, Ci], in der durch A5) dargestellten Beziehung stehen, worin « irgend eine ganze Zahl ist, so folgt die zweite der ersten in der Periode unmittelbar nach. Denn aus A5) folgt A4), und daher muss « nach 2. die grösste. in co enthaltene Zahl sein. Die Zahl c^ ist also aus co durch die Bedingungen A5) vollständig und eindeutig bestimmt. 7. Man ordnet also die Zahlen {a, b, c), von einer beliebigen unter ihnen ausgehend, von links nach rechts in der Weise, dass die letzte Zahl c der vorangehenden zugleich die erste Zahl ax der folgenden wird, und dass die Summe der beiden mittleren Zahlen b -)- bx durch 2 c theilbar ist. Diese Anordnung ist nur auf eine Art möglich, und der Quotient b -f- b^ :2c ist die Zahl «, die als Theilnenner im Kettenbruch auftritt. Betrachten wir nun irgend eine primitive ganzzahlige qua- quadratische Gleichung A6) i + Bß+Cßs = 0, in der A, B, C ganze Zahlen ohne gemeinsamen Theiler sind, die der Bedingung B* — AAC = D genügen, so sind die beiden Wurzeln £1, £1' dieser Gleichung quadratische, zur Discriminante D gehörige Irrationalzahlen, und wenn wir sie in Kettenbrüche entwickeln, so werden wir nach §. 132 endlich auf Schlusszahlen co1, ra2 kommen, die zu den reducirten gehören, und die also in den oben besprochenen Perioden enthalten sein müssen. Es ist noch festzustellen, ob diese Schlusszahlen Oj, ra2 in derselben oder in verschiedenen Perioden enthalten sind. Nach 6. sind sie dann und nur dann in derselben Periode enthalten, wenn £1 und £1' mit einander äquivalent sind. Nennen wir solche quadratische Irrationalzahlen, die mit ihren conju- girten äquivalent sind, zweiseitige Zahlen1), so können wir also sagen, dass die Kettenbruchentwickelung der Wurzeln der 2) „Zweiseitig" brauchen wir Dach Dedekind's Vorschlag statt des Gauss'schen anceps oder des sonst üblichen ambig: Dirichlet-Dede- kind, Vorlesungen über Zahlentheorie. 4. Auflage, 1894, S. 139. "Weber, Algebra. I. 28
434 Elfter Abschnitt. §. 133. Gleichung A6) zu einer oder zu zwei verschiedenen Perioden führt, je nachdem die Wurzeln zweiseitig sind oder nicht. Welcher von beiden Fällen eintritt, kann man an der Periode selbst erkennen. Wenn nämlich ra eine reducirte Zahl ist, und ra' conjugirt zu ra, so ist auch — 1 : ra' reducirt (§. 132); und wenn &i äqui- äquivalent ist mit ra, so ist £1' äquivalent mit ra', also auch mit — 1: ra'. Ist ra = {a, i, c}, so ist nach A2): Nach §. 132, (9) schliesst sich also — 1 :ra' ebenso an — l:ra, an, wie col an ra. Ist daher die Periode von ra ra, Oj, ra2, . . ., ra„_i, so ist die Periode von — 1 : ra': — 1 — 1 — 1 — 1 ra'v—i' c»_a rai ' ra' Ist die Periode der Kettenbruchentwickelung von ra A7) [«0, «!, . . ., «„_!], so ist sie für — 1 : ra': A8) [«v-l, «v_2, . . ., «„], also die umgekehrte. Ist nun ra mit ra', also auch mit — 1: ra' äquivalent, so müssen nach 6. diese beiden Perioden mit einander übereinstimmen, wenn man bei einem geeigneten Gliede beginnt, oder die Periode von ra muss umkehrbar sein. Das besagt: Es müssen sich in der Kettenbruchentwickelung für ra zwei Elemente so auswählen lassen, dass die Entwickelung gleich lautet, wenn man sie von der einen dieser Zahlen nach links oder von der anderen nach rechts fortschreitend liest. In Zeichen: es muss für irgend ein passend bestimmtes Je und für » = 0, 1, 2, . . ., v — 1 a{ = ak_i sein. Wenn die Periode umkehrbar ist, so ist auch umgekehrt (nach 6.) ra mit — 1 : ra', also auch mit ra' äquivalent. Daraus also das Resultat: 8. Zweiseitige Zahlen haben in ihrer Kettenbruch- Kettenbruchentwickelung eine umkehrbare Periode und um-
§. 134. Beispiele. 435 gekehrt sind Zahlen, die in der Kettenbruch- entwickelung eine umkehrbare Periode haben, zweiseitig. Schliesslicli wollen wir noch bemerken, dass durch die Eigen- Eigenschaft, in einen periodischen Kettenbruch entwickelbar zu sein, die reellen quadratischen Irrationalzahlen von allen anderen Zahlen unterschieden sind. Denn ist a eine in einen Ketten- Kettenbruch entwickelte Zahl, und sind con, com zwei Schlusszahlen dieses Kettenbruches, so ist Pn Mn H~ -fit — 1 Pm&m ~\~ Pm—1 ~~ Qn&n + Qn-1 ~ Qm^m + Qm-1 ' Wenn nun der Kettenbruch periodisch ist, gleichviel, ob die Periodicität gleich von Anfang beginnt oder erst im Verlaufe der Entwicklung, so ist, für zwei verschiedene Werthe von n und m, con = ram, und man erhält also durch Elimination von an eine quadratische Gleichung für ra, die man in die Form setzen kann: Pu — ra Qn, PM_i — coQn-i Pm — C Qm, -Pm-1 — « Qm-1 ~ §• 134. Beispiele. Wir wollen einige Beispiele für die Bestimmung der redu- cirten Zahlen und Perioden hier durchführen, um die Anwendung der Methode zu zeigen; die Beispiele lassen sich natürlich ganz nach Belieben vermehren. 1. D — 29. Wir bestimmen zunächst nach §. 133 die sämmtlichen zu D gehörigen reducirten Zahlen. Die grösste in VD enthaltene ganze Zahl X ist hier = 5; also kann b nur die Werthe haben: l = 1, 3, 5, woraus p6' ac = =7,6,1. Die Grenzen, in denen a und c liegen müssen, sind nach §. 133, G) für die drei Werthe von b: 3, 3; 2, 4; 1, 5. Man erhält also nur die einzige reducirte Zahl: {1, 5, 1}. 28*
436 Elfter Abschnitt. §. 134. Die Periode besteht aus einem einzigen Gliede, und der Kettenbruch für co ist: 5+V29 .... , m = —- = E, 5, 5 . . .)• 2. D = 116 = 4. 29. Hier ist X = 10 und h hat einen der Werthe l = 2, 4, 6, 8, 10, also ac = 28, 25, 20, 13, 4; die Grenzen für a und c sind 5, 6; 4, 7; 3, 8; 2, 9; 1, 10, also, da die Fälle, in denen a, i, c den gemeinschaftlichen Factor 2 haben, noch wegzulassen sind, ergeben sich die reducirten Zahlen: {5, 4, 5}, {4, 6, 5j, {5, 6, 4}, {1, 10, 4}, {4, 10, 1}, die sich so in eine Periode ordnen, wobei das erste Glied am Ende noch einmal zugesetzt ist: {4,10,1}, {1,10,4}, {4,6,5}, {5,4,5}, {5,6,4}, {4,10,1}, und für co ergiebt sich die Kettenbruchperiode: 5 -f- V29 = [10, 2, 1, 1, 2]. 3. D = 76 = 4. 19, k = 8, 6=2, 4, 6, 8, ac — 18, 15, 10, 3. Grenzen für a und c: 4, 5; 3, 6; 2, 7; 1, 8; also sind die reducirten Zahlen: {3, 4, 5}, {5, 4, 3}, {2, 6, 5}, {5, 6, 2}, {1, 8, 3), {3, 8, 1}. gijj Wir erhalten eine Periode: {3, 8, 1}, {1, 8, 3}, {3, 4, 5}, {5, 6, 2}, {2, 6, 5}, {5, 4, 3}, {3, 8, 1}, und die Periode des Kettenbruches für 4 -f- Vl9 wird [8, 2, 1, 3, 1, 2]. 4. D = 37, X = 6, b = 1, 3, 5, ac = 9, 7, 3; Grenzen für a, c: 3, 3; 2, 4; 1, 5;
§. 134. Beispiele. 437 reducirte Zahlen: {3, 1, 3}, {1, 5, 3}, {3, 5, 1}; Periode: {3, 5, 1}, {1, 5, 3}, {3, 1, 3}, {3, 5, 1}; Kettenbruch: 5 +V37 2 = t ' ' J* In allen diesen Fällen sind die Perioden umkehrbar. 5. D = 148 = 4. 37, l = 12, 6 = ' 2, 4, 6, 8, 10, 12, ac = 36, 33, 28, 21, 12, 1; Grenzen für a, c: 6, 7; 5, 8; 4, 9; 3, 10; 2, 11; 1, 12; reducirte Zahlen: {4, 6, 7}, {7, 6, 4}, {3, 8, 7}, {7, 8, 3} {3, 10, 4}, {4, 10, 3}, {1, 12, 1}. Hier erhalten wir drei Perioden von 1, 3 und 3 Gliedern: {1, 12, 1}, {1, 12, 1}, {3, 10, 4}, {4, 6, 7}, {7, 8, 3}, {3, 10, 4}, {4, 10, 3}, {3, 8, 7}, {7, 6, 4}, {4, 10, 3} und die Kettenbruchperioden [12], [2, 1, 3], [3, 1, 2]; von diesen ist die erste umkehrbar, die anderen beiden gehen durch ümkehrung in einander über. 6. D = 136 = 4. 34, X — 11, b = 2, 4, 6, 8, 10, ac — 33, 30, 25, 18, 9; Grenzen für a, c: 5, 6; 4, 7; 3, 8; 2, 9; 1, 10; reducirte Zahlen: {5, 4, 6}, {6, 4, 5}, {5, 6, 5}, {2, 8, 9}, {9, 8, 2} {3,8,6}, {6,8,3}, {1,10,9}, {9,10,1}, {3,10,3}; Perioden: {5, 4, 6}, {6, 8, 3}, {3, 10, 3J, {3, 8, 6}, {6, 4, 5}, {5, 6, 5}, {5, 4, 6}; {9, 10, 1}, {1, 10, 9}, {9, 8, 2}, {2, 8, 9}, {9, 10, 1}; Kettenbruchperioden: [1, 3, 3, 1, 1, 1], [10, 1, 4, 1]. Wir haben also hier zwei verschiedene Perioden, die beide umkehrbar sind.
438 Elfter Abschnitt. §. 135. §. 135. Die Pell'sche Gleichung. Ist co eine zu der positiven Discriminante D gehörige redu- cirte Zahl, so erhält man durch die Kettenbruchentwickelung: co und es ist con = co immer dann, wenn n ein Vielfaches von der Gliederzahl v der Periode ist. Dann aber folgt aus A): B) Qn ra* = (Pn - Qn_,) co + Pn_,. Es genüge nun co der quadratischen Gleichung §. 130, E): C) cco* = a + bco, D = b* + 4ac, und aus dieser muss, da a, b, c ohne gemeinsamen Theiler sind, die Gleichung B) durch Multiplication mit einer ganzen Zahl folgen. Bezeichnen wir diese ganze Zahl mit w, so ist also D) Q„ = UC, P„-i = ttff, P„ Qn-l = Ul. Setzen wir noch E) ' Pn-^Qn-1 = t, ;. so folgt: ^ t -f- üb F) t-^ Nach §. 125, A1) ist PnQn-l— und daraus: G) P — Die Gleichung G) heisst die Pell'sche Gleichung. Die Aufgabe ist die, für ein gegebenes D alle ihre ganzzahligen Lösungen t, u zu finden. Da, wenn t, u der Gleichung genügen, auch ±t, +u ihr genügen, so können wir uns auf die Ermitte- Ermittelung ihrer positiven Lösungen beschränken. Die Formeln D), E) geben uns eine unendliche Zahl solcher Lösungen; wir haben nur für n ein beliebiges Vielfaches der Periodenzahl v zu wählen, für u den grössten gemeinschaftlichen Theiler von Qn, PM_i, Pn — Qn—i, oder auch einfach die Zahl Qn : c zu setzen, und t aus E) oder auch, nachdem u bestimmt ist, direct aus G) zu ermitteln.
§. 135. Die Pell'sche Gleichung. 439 Ist v ungerade, und n ein ungerades Vielfaches von v, so ist (8) P — B w2 = — 4, ist aber v gerade, oder n ein gerades Vielfaches von v, so ist (9) #> —D»* = 4. Die Gleichung (9) hat die selbstverständliche Lösung t = ± 2,' m = 0; in allen anderen Lösungen von (8) oder (9) sind t und u von Null verschieden und wir betrachten hier nur die positiven Lösungen. Wir wollen nun nachweisen, dass man aus einer beliebigen Gleichung von der.Form C) durch die Formeln D), E) alle Lösungen von (8) und (9) erhält. Nehmen wir also an, es sei t, u irgend eine positive Lösung der Gleichung (8) oder (9), und a = \a, b, c) eine zur Discri- minante D gehörige reducirte irrationale Zahl. "Wir bestimmen durch die Gleichungen F) P„, Qm Pn—i, Qn—i, die offenbar ganze Zahlen werden, da t und üb entweder beide gerade oder beide ungerade sind. Aus der Gleichung C), der co genügt, ergiebt sich dann B), woraus wieder auf Qn C + Qn-1 zu schliessen ist; und aus (8) oder (9) ergiebt sich A1) PnQn-l — QnPn-X = + 1, worin, wie auch in den folgenden Formeln, das obere oder das untere Zeichen gilt, je nachdem t, u die Gleichung (8) oder (9) befriedigt. Nun folgt aber aus F) 0-0 _ 91 und weil {a, b, c\ eine reducirte Zahl ist, so ist 2c -f- b > VT) [§. 133, D)], also _ n n ^ uVD — t _ u*D — P _ ±2 O-«-^ 2 -2( da aber u und t positive ganze Zahlen sind und B > 1, so ist uVD -\- t > 2, also Qn — Qn-i > 0 für das obere und > — 1 für das untere Zeichen. Weil nun Qn — Qn-i eine ganze Zahl sein muss, so ist sie hiernach gleich oder grösser als Null, und wir haben Qn-l ä Q„ wo das Gleichheitszeichen nur im Falle des unteren Zeichens, also im Falle der Gleichung (9) möglich ist.
440 Elfter Abschnitt. §. 135. Ferner ist (da nach §. 133, D) l < V~D ist) also ^M_! Null oder positiv, und Null kann nur im Falle des oberen Zeichens, also im Falle der Gleichung (8) auftreten. Daraus schliessen wir A2) 0 ^ £„_! ^ Qn, wo das Gleichheitszeichen in der unteren Grenze nur im Falle der Gleichung (8), also der oberen Zeichen, in der oberen Grenze nur im Falle der Gleichung (9), also der unteren Zeichen vor- vorkommen kann. Wir entwickeln nun den rationalen Bruch PM : Qn in einen endlichen Kettenbruch 7f = («0) «1, «2) • • •) «K-l)> indem wir n nach §. 123, I. so annehmen, dass (- l)M = =F l wird. Bedeutet dann P' : Q' den vorletzten Näherungsbruch, so ist PnQ'-QnP'=+h und es ist nach §. 125, II.: 0 ^ Q' ^ Qn, wo das Gleichheitszeichen in der unteren Grenze nur für n = 1, also im Falle der oberen Zeichen, in der oberen Grenze nur für n = 2, also der unteren Zeichen vorkommen kann, ebenso wie in A2). Daraus folgt nach §. 126, III.: Q' = &_,, P' = ?„_,, und es ist also nach A0) («0, «!, «2, . . ., «„_!, ra) = ra, d. h. [«0, «!, «2, . . ., «„_]] ist eine Periode des Kettenbruches für ra, aus der nach den Formeln D), E) die Lösung t,-u von G) hergeleitet wird. Damit ist bewiesen, dass wir auf -diese Weise alle Lösungen der Gleichung G) finden. Hieraus lassen sich noch einige wichtige Folgerungen ziehen. Sind t, u und tu «j zwei Lösungen der Gleichung (8) oder (9), wobei nicht ausgeschlossen ist, dass fdr die eine die Gleichung
§. 135. Die Pell'sche Gleichung. 441 (8), für die andere die Gleichung (9) gilt, so folgt in allen Fällen A3) P — t?^D («2 — O — 8. Nehmen wir nun u>u1 an, so ist m2 — u? — (u — Wj) (u-f-«i) 55 2, und da D = 0 oder = 1 (mod 4) und kein Quadrat ist (§. 130), so ist D mindestens =¦ 5. Nach A3) ist daher auch t > tu und wir schliessen, dass, wenn u wächst, auch t wachsen muss, dass also, wenn u einen möglichst kleinen positiven Werth hat, auch t möglichst klein ist. Man kann also von einer kleinsten positiven Lösung reden, die wir mit T, U bezeichnen wollen. Man erhält sie, wenn man in den Formeln D), E) n möglichst klein, also gleich der Gliederzahl v der Periode setzt. Ist daher v gerade, so ist nur die Gleichung (9), nicht die Gleichung (8) lösbar; ist aber v ungerade, so ist sowohl (8) als (9) lösbar. Da dies nur von der Discriminante D, nicht von der besonderen Zahl co abhängen kann, so folgt: 9. dass bei einer Discrimininante die verschiedenen Perioden entweder alle eine gerade oder alle eine ungerade Gliederzahl enthalten. Ist D gerade, also durch 4 theilbar, so muss auch t gerade sein, und die Gleichung G) lässt sich Glied für Glied durch 4 theilen. Ist D ungerade, so sind auch t, u entweder beide gerade oder beide ungerade; sind sie beide ungerade, so sind ihre Qua- Quadrate, wie alle ungeraden Quadratzahlen, nach dem Modul 8 mit 1 congruent, also muss D = 5 (mod 8) sein. Aber es ist nicht immer möglich, wenn D = 5 (mod 8) ist, die Gleichung G) durch ungerade Zahlen zu lösen i). Ist D = 1 (mod 8), so müssen t, u gerade sein. Die Beispiele des §. 134 geben, auf diese Weise behandelt, die folgenden kleinsten positiven Lösungen der Pell'sehen Gleichung, wobei der Factor 4, wo es möglich ist, weggehoben ist. . 52 — 29.12 = _ 4 702 _ 29.132 = — 1 1702 — 19.392= i 62 — 37.12 = — 1 35* — 34.62 _ i. *) Vergl. Ca'yley, Note zur l'equation x2— Dy2= + i, X» = 5 (mod 8), Crelle's Journal, Bd. 53. Mathematical papers, Vol. IV. Tafeln für die Lösungen der Pell'sehen Gleichung in der Form y2 =: ox2 -j- 1 hat Degen berechnet (Canon Pellianus, Havniae 1817). Auch in Legendre's Zahlentheorie (deutsch von Maser) findet sich eine solche Tafel.
442 Elfter Abschnitt. §. 136. §. 136. Ableitung aller Lösungen der PelPschen Gleichung aus der kleinsten positiven. Ist t, u irgend eine Lösung der Pell'sehen Gleichung, so ist der Ausdruck P — Du* 4 der den Werth + 1 hat. die Norm der beiden conjugirten Zahlen i± »t/B t-rfB (§ 130> "Wir wollen sie die zu VI) gehörigen Einheiten nennen. Darunter sind auch die Zahlen + 1 enthalten (für u — 0). Sind also (tt, %), (t2, w2) irgend zwei (positive oder negative) Lösungen der Pell'sehen Gleichung p — Dui = ± 4, so haben die beiden Zahlen &i — 2' ®* ~2 die Norm + 1, und das Gleiche gilt also auch von ihrem Product Darin ist h = und t$ und ms sind, wie man sofort sieht, ganze Zahlen. Denn wenn D gerade ist, so sind tu t2 gerade, und wenn D ungerade ist, so sind tu Ui entweder beide gerade oder beide ungerade, und ebenso t2, m2. Es ist also ®3 gleichfalls eine zu V.D gehörige Einheit, und es folgt, dass das Product zweier (und folglich auch mehrerer) Einheiten wieder eine Ein- Einheit ist. Ist & eine beliebige irrationale Einheit, so ist +®—1 die zu ® conjugirte Einheit. Es gehören unter den von ^ 1 ver- verschiedenen Einheiten immer vier zusammen, . + ®, ± ®~\ unter denen eine positiv und grösser als 1 ist. Diese, entspricht
§. 136. Die Pell'sche Gleichung. 443 den positiven Werthen von t, u; eine zweite ist positiv und kleiner als 1 und die beiden anderen sind negativ. Ist T, U die kleinste positive Lösung der.Pell'schen Gleichung, so ist 0 __ t + üVT> die kleinste unecht gebrochene zu ~\/~D gehörige positive Einheit, und wir können nachweisen, dass in der Form + ®n, worin n eine ganze Zahl bedeutet, alle zu ~\/~D gehörigen Einheiten ent- enthalten sind. Es genügt dazu, zu zeigen, dass der Ausdruck @* für ein positives n alle Einheiten, die grösser als 1 sind, liefert. Dies ist aber sehr einfach; denn ist ®j irgend eine von diesen Einheiten, so wird sie zwischen zwei auf einander folgenden Potenzen von & liegen, da diese Potenzen mit dem Exponenten ins Unendliche wachsen; also &n <i ®! < &n + \ mithin 1 <; @i &-n < &. Da aber &1 &~n gleichfalls eine Einheit ist, so ist, wenn nicht das Gleichheitszeichen gilt, &x ®~n grösser als 1 und kleiner als 0, was gegen die Voraussetzung ist, dass & die kleinste unecht gebrochene Einheit sei; es muss also ®, = 0n sein, was zu beweisen war. Anmerkung, die Gauss'sche Theorie der quadratischen Formen betreffend1). Wir fügen, um die Verbindung unserer Betrachtungen mit der sonst bekannten Gauss'sehen Theorie der quadratischen Formen herzustellen, einige Bemerkungen bei, die in unserem Zusammenhange nicht gerade erforderlich sind, und die daher auch übergangen werden können. Aus jeder quadratischen Irrationalzahl co = {a, b, c) können wir eine bestimmte primitive quadratische Form (nach der Gau ss'sehen Bezeichnung) !) Vergl. Disq. ar. art. 183 ff., Dirichlet-Dedekind, Vorlesungen über Zahlentheorie. Vierte Auflage. §. 62, §. 72 ff.
444 Elfter Abschnitt. §. 136. 9 = (Ä, B, C) = (— a, f 6, c) oder = (— 2 a, b, 2c) (je nachdem b gerade oder ungerade ist) ableiten, deren Deter- Determinante = D : 4 oder = D ist. Aus der conjugirten Zahl co' = {— a, —5, — c} erhalten wir dann die Form — 9, deren Coefficienten denen von 9 entgegengesetzt sind. Die Zahlen co und co' sind die Wurzeln der Form 9 = 0 oder — 9 = 0. Ebenso sind — co und — co' die Wurzeln der zu 9 entgegengesetzten Form 9' = (A. — JB, C). Bei Gauss werden nun nur solche Formen derselben Deter- Determinante in eine Classe vereinigt, die eigentlich äquivalent sind, und es ist noch die Beziehung der Gauss'schen Classenzahl zu der Zahl der Classen der co oder zu der Anzahl der zu einer bestimmten Discriminante gehörigen Kettenbruchperioden fest- festzustellen. Dazu führen folgende Sätze: 1. Die beiden Formen 9 und —9 sind dann und nur dann uneigentlich äquivalent, wenn die Glei- Gleichung P — Du2 = — 4 in ganzen Zahlen lös- lösbar ist. Diesen Satz wollen wir aus der Theorie der quadratischen Formen hier voraussetzen. Er kann entweder aus der Betrach- Betrachtung der Perioden der reducirten Formen oder auch ohne diese Theorie auf demselben Wege bewiesen werden, wie man die Transformation einer quadratischen Form in sich selbst auf die Lösung der Pell'schen Gleichung zurückführt. 2. Wenn co mit co' eigentlich äquivalent ist, so ist 9 mit —9 eigentlich äquivalent. Dies zeigen die Formeln §. 130 A5), wenn man darin al = — a, bx = — b', Cj = — c, s = 1 setzt. Ebenso ergiebt sich aus diesen Formeln: 3. Wenn ra mit co' uneigentlich äquivalent ist, so ist 9 mit sich selbst uneigentlich, also 9 mit 9' eigent- eigentlich äquivalent. Die beiden letzten Sätze gelten, wie man aus denselben Formeln erkennt, auch umgekehrt. Wir fassen jetzt die vier Formen # = 9, — 9, 9', — 9' und die vier Zahlen ii, = 03, — co, co', — a>'
§. 137. Berechnung Von Gleichungswurzeln. 445 zu je einem Complex <& und £1 zusammen, die einander eindeutig zugeordnet sind. Ersetzen wir co durch eine äquivalente Zahl cou so erhalten wir einen Complex Slx und diesem entsprechend einen Complex <&!, dessen Formen sich den Formen 3> so zuordnen lassen, dass je zwei entsprechende eigentlich äquivalent sind. Wir unterscheiden nun die beiden Fälle a. Wenn P — Z)u2 = — 4 lösbar ist, also die Anzahl der Periodenglieder des Kettenbruches für a ungerade, so ist 9 mit — <p uneigentlich, also mit — 9' eigentlich äquivalent und 3> repräsentirt zwei Gauss'sche Classen, oder, wenn 9 mit sich selbst uneigentlich äquivalent ist, eine Anceps-Classe. Ebenso repräsentirt £1 zwei Classen von Zahlen co, oder, wenn co und co' äquivalent sind, nur eine. Hier ist aber co mit sich selbst uneigentlich äquivalent, folglich ist, wenn co mit co' überhaupt äquivalent ist, auch uneigentliche Aequivalenz vorhanden, und dann gehört also (nach 3.) 9 in eine Anceps - Classe. In dem Falle a. ist also die Gauss'sche Classenzahl gleich der Anzahl der Classen der Zahlen co. b. Wenn P — Du* = — 4 lösbar, also die Anzahl der Periodenglieder gerade ist, repräsentirt 3> vier oder zwei Gauss'sche Classen, letzteres, wenn entweder 9 mit —9 oder 9 mit cp' eigentlich äquivalent, wenn also co mit co' überhaupt äquivalent ist. In dem Falle b. ist also die Anzahl der Gauss'schen Classen doppelt so gross als die Anzahl der Classen der co. §. 137. Genäherte Berechnung der reellen Wurzeln einer numerischen Gleichung durch Kettenbrüche. Auf die Theorie der Kettenbrüche gründet, sich ein von Lagrange herrührendes Verfahren, um die reellen Wurzeln einer numerischen Gleichung mit beliebiger Annäherung zu be- berechnen, das sich jetzt mit wenig Worten aus einander setzen lässt. Es sei f(x). = 0 eine reelle Gleichung, die wenigstens eine reelle Wurzel hat. Nach einer der verschiedenen Methoden des VIII. und IX. Abschnittes können wir dann immer eine ganze Zahl a0 finden, so dass zwischen a0 und a0 -\-1 eine oder mehrere
446 Elfter Abschnitt. §. 137. der Wurzeln von f(x) liegen. Transformiren wir also f(x) durch die Substitution . 1 x = «o + —• xx in fL (ajj), so wird f± (xx) eine oder mehrere Wurzeln haben, die grösser als 1 sind. Wir bestimmen also eine positive ganze Zahl au so dass zwischen ax und ax -\- 1 eine oder mehrere der Wurzeln von/1(a;1) liegen, und transformiren fx {xx) durch die Substitution % = «!+ — x2 in f% (x2). Die Gleichung /2 = 0 hat dann wieder mindestens eine Wurzel, die grösser als 1 ist, und die also zwischen den beiden positiven ganzen Zahlen a2 und a2 -|- 1 liegt, u. s. f. Schliesslich wird man auf diese Weise dazu kommen, eine einzige Wurzel zu isoliren, und man erhält in der Keine der Näherungs- Näherungsbrüche (a0), (»o, «0, (a0, «1, a.2), (a0, <h, «2> «s) • • • eine Eeihe rationaler Zahlen, die abwechselnd über und unter einer der Wurzeln x liegen und sich dieser Wurzel unbegrenzt annähern. Ist man so bis zu dem Näherungsbruch ^ F* (a0, »!, a2, . . ., av-i) — -jr- V" • vorgedrungen, so unterscheidet sich dieser von dem wahren Werth von x um weniger als 1 : Q$. Die Grosse des Nenners giebt also unmittelbar ein Maass für die bereits erreichte Genauigkeit. In den gewöhnlichen Fällen wird man die Zahlen a0, o,, a2... einfach dadurch erhalten, dass man auf die Zeichenwechsel der Functionen /, /l5 /2 . . . achtet. Um dies Verfahren an einem Beispiel zu erproben, nehmen wir die cubische Gleichung, die wir schon früher betrachtet haben: xz — 2 x — 2 = 0. Sie hat eine Wurzel zwischen 1 und 2, also haben wir a0 = 1 zu setzen. Man erhält, wenn man die oben angegebene Transformation wirklich ausführt, die folgende Kette von Gleichungen: x3 — 2 x — 2 = 0, ao = l 3 a?3 — a?2 — 3 x — 1 = 0, ax = 1
§. 138. Kationale Wurzeln. 447 - 8 x — 3 = 0, a2 = 3 — 22«2 — 14« — 2 = 0, «3 = 2 46«s _ 6«2 — 32« — 9 = 0, at= 1 «3 — 94«2 — 132« — 46 = 0, a5 = 95 3561 «s — 9083 *2 — 191« — 1 = 0, ae = 2, also v — A 1 3 9 1 QI 9 ^ <ßj —— l ¦*¦} •*• j *Jj -^j -1-5 £7v} j£i • . * 1 und die Näherungsbrüche: J_ 2_ _7_ 16 23 2201 4425 1 ' 1 ' 4 ' 9 ' 13' 1244' 2501 Wenn wir die beiden letzten Brüche in Decimalbrüche ver- verwandeln, so erhalten wir für « die beiden Grenzen: * 1,7692926; 1,76929228, und der Fehler in der letzteren etwas zu kleinen Zahl ist kleiner als 0,00000016. Dass man hier nach wenig Schritten ein gutes Resultat erhält, beruht auf dem Umstände, dass hier ziemlich früh ein grösserer Theilnenner 95 auftritt. In den meisten Fällen be- bekommt man für die Theilnenner kleine Zahlen; dann wachsen die Nenner der Näherungsbrüche langsam, und man erhält nur mühselig ein Resultat von grösserer Genauigkeit. Die Auffindung grösserer Theilnenner, z. B. 95, wird durch die Bemerkung erleichtert, dass, wenn eine Wurzel einer Gleichung einen grossen Werth hat, der negative Coefficient der zweithöchsten Potenz der Unbekannten eine, wenn auch nur rohe Annäherung an diese Wurzel giebt, wie z. B. in der vorletzten der obigen Gleichungen 94 an 95. §. 138. * Rationale Wurzeln ganzzahliger Gleichungen. Reducible Gleichungen. Wir schliessen diesen Abschnitt mit einer Betrachtung über ganzzahlige Gleichungen, die, wenn sie auch nicht unmittelbar mit der Theorie der Kettenbrüche in Beziehung steht, doch hier am passendsten eine Stelle findet.
448 Elfter Abschnitt. • §. 138. Wenn man es mit Gleichungen zu thun hat, deren Coeffi- cienten rationale Zahlen sind, so wird man zunächst nach etwaigen rationalen Wurzeln suchen. Wenn die Gleichung f(x) = aoxn -j- ctix»-1 -j- a2xn~2 + • • • + an-\X -\- an = 0 rationale Coefficienten hat, so können wir immer annehmen, dass diese Coefficienten ganze Zahlen sind; man hat nur nöthig, um den Fall gebrochener Coefficienten darauf zurückzuführen, die ganze Gleichung mit einem gemeinschaftlichen Vielfachen aller Nenner zu multipliciren. Wir können aber auch noch weiter annehmen, dass a0 = 1 sei; denn setzen wir in dem Product a^~1f(x) a0 x = %i, so wird die Gleichung x\ + os, x\~x + »o «2«i~2 -\ 1- a™-1 an = 0. Wir wollen also jetzt annehmen, dass in der Gleichung A) xn + ^x»-1 -\- aixn-i + • • • + an-xx -\- a.n = 0 die Coefficienten %, a2, . . ., an ganze Zahlen sind. Eine ratio- rationale Wurzel von (l)'kann nicht eine gebrochene Zahl sein; denn nehmen wir an, es werde A) befriedigt durch den Bruch wo p und g ganze Zahlen ohne gemeinsamen Theiler sind, und g positiv und grösser als 1 ist, so folgt durch Multiplication mit q"-1 + «F" + 2 -\ 1- anqn-1 = 0. Es müsste also pn : q eine ganze Zahl sein, was unmöglich ist. Wenn nun die Gleichung A) dadurch befriedigt werden kann, dass man für x eine ganze Zahl setzt, so muss diese ganze Zahl, wie die Gleichung A) zeigt, nothwendig ein Theiler von an sein, und man hat also nur die verschiedenen Divisoren von a„, mit positivem und negativem Zeichen behaftet, versuchsweise in die Gleichung einzusetzen. Auf die Frage nach rationalen Wurzeln einer ganzzahligen Gleichung kommt auch die allgemeine Frage zurück, ob eine ganze rationale Function f(x) = xn + os, x»-1 + os2 x»-2 -\ 1- an-i x + osn, deren Coefficienten osl7 os2, . . ., an ganze Zahlen sind, durch eine rationale Function von niedrigerem Grade v:
§. 138. Reducible Gleichungen. 449 (p(x) =r xr + alxv~1 -f- mit rationalen Coefficienten «j, «2, . . ., «r theilbar sein kann. Wenn f(x) durch <jp(a?) theilbar ist, so ist der Quotient i>(x) wieder eine ganze rationale Function mit rationalen Coefficienten vom Grade n — v: i>(x) = Xn~* + ß-LX*"*-1 -| \- ßn-v-iX + ßn-v, und da f(x) auch durch i>(x) theilbar ist, so können wir bei der Entscheidung unserer Frage v < \n annehmen. Ausserdem folgt aus §. 2, dass die Coefficienten « und ß von <p und tj> ganze Zahlen sein müssen. Um nun über die Möglichkeit einer solchen Theilung zu entscheiden, nehme man die Function <jp (x) mit unbestimmten Coefficienten «, und dividire f{%) durch <jp (x) (nach §. 3). Es ergiebt sich dann ein Rest vom Grade v — 1, und wenn man dessen Coefficienten, die sämmtlich rationale Functionen der m sind, gleich Null setzt, so erhält man v Gleichungen, denen diese Coefficienten genügen müssen. Man kann durch Elimination (§.55) eine Gleichung herstellen, die nur noch eine dieser Unbekannten enthält, und die dann eine ganzzahlige Wurzel haben muss. Es wird aber oft zweckmässiger sein, diese Elimination nicht wirk- wirklich auszuführen, sondern direct zu versuchen, dem System der v Gleichungen durch ganzzahlige Werthe der « zu genügen. Die Auswahl der zu erprobenden Zahlen kann durch manchen Kunst- Kunstgriff, der auf zahlentheoretischen Sätzen beruht, sehr eingeschränkt werden. Wir wollen beispielsweise eine Gleichung zehnten Grades aus der Theorie der elliptischen Functionen entnehmen, wo solche Aufgaben sehr häufig in der Weise vorkommen, dass die Zerlegbarkeit in Factoren bestimmten Grades theoretisch fest- feststeht, und wo es sich dann darum handelt, diese Factoren zu finden1). Eine solche Gleichung ist #10 _ 36 #8 + 528«« — 3897«* -(- 14354 «2 — 21025 = 0. Wir fragen, ob die linke Seite in zwei Factoren fünften Grades zerlegbar ist. Wenn der eine der beiden Factoren l) Vergl. des Verfassers Werk: „Elliptische Functionen und algebraische Zahlen", Braunschweig 1891. Das hier behandelte Beispiel aus der Theorie der Transformation 47sterlGrades ist aus der Abhandlung genommen: „Ein Beitrag zur Transformationstheorie der elliptischen Functionen etc." von H. Weber A893). Mathematische Annalen, Bd. 43. Weber, Algebra. I. 29
450: ' Elfter Abschnitt. §. 138.: ß%3 -\-yxi -f- d# +'£ ist, so ist der andere, da.in der gegebenen Gleichung keine ungeraden Potenzen vorkommen, a;5 — a& -\- ßx% — y^2 _^_ ## — s, und es muss also sein: X™ — 36 a:* + 528 jr6 — 3897 a* + 14354a;2 — 21025 Setzt man entsprechende Coefficienten einander gleich, so folgt: 1. •«« — 2/3 = 36, ; 2. /S*-f- 2d — 2ocy = 528, 3. y2_)_2«£ — 2ßS — 3897, 4. ö«-— 2y« = 14354, 5. £2 = 21025, und es sind nun ganzzahlige Werthe von «, ß, y, d, s zu suchen, die diesen fünf Gleichungen genügen. Zunächst erhält man aus 5.: £ = 1/21025 = 145 = 5 .29, und' man kann £ positiv annehmen, weil das von x unabhängige Glied jedenfalls in einem der beiden Factoren .positiv ist. Die Gleichung 4. ergiebt, wenn man rechts den Rest nach dem Modul 145 nimmt, D) d2 = — 1 (mod 145), und diese Congruenz hat die vier Lösungen 8 = ± 12, ±17 (mod 145). Da 8 nach 4. ausserdem gerade sein muss, so könnte d folgende Werthe haben: 8 = ± 12, ± 128, ± 162. Weiter wird man vorläufig nicht gehen, da grosse Zahlwerthe für 8 von vornherein unwahrscheinlich sind. Diesen Werthen von d entsprechend erhält man aus 4. für y: y = — 49, 7, 41. Wenden wir noch den Modul 5 an, so folgt: yi = l, — 1, .1 (mod 5) und aus 3.: ß=±l, ±2, ±1 (mod 5) und aus 1.: «* = 1 ± 2, ¦ 1 + 1, 1 ± 2 (mod 5).
§. 138. Reducible Gleichungen. 451 Daraus ergiebt sich, da nur 0, 1 und 4, nicht 2 und 3 nach dem Modul 5 mit einem Quadrat congruent sein können, dass in 8 die Zeichen so genommen werden müssen: 8 = — 12, -)- 128, — 162 «= ± 2, 0, ±2 (mod 5). Die Gleichung 2. zeigt noch, dass der mittlere Fall auszu- schliessen ist, da die rechte Seite nicht durch 5. theilbar ist. Dass auch 8 = — 12 ausgeschlossen werden muss, ergiebt sich aus der Gleichung 2., die für 8 = —12, y = — 49 die Congruenz ß2 = 6 (mod 7) zur Folge hat, die aber nicht lösbar ist. Es bleibt also nur noch übrig: d = — 162, y = 41. Aus 3. folgt für ß die Congruenz: 17 ß == 93 (mod 145) oder ß = — 1 (mod 5), 2 ß = — 1 (mod 29), also • ß = 14 (mod 145). Nimmt man /3 = 14 an, so folgt « = — 8, und alle Glei- Gleichungen 1. bis 5. sind befriedigt. Es hat sich also damit die Zerlegung ergeben, die nachträglich leicht zu verificiren ist: #10 _ 36 #8 _J_ 528 x6 — 3897«* + 14354 x2 — 21025 = («5 _ 8x* + 14a;s _|_ 41^2 _ \Q2x -\- 145) (a>5 +8ä*+14a>3 — 41a:2 —162 a: — 145). 29*
Zwölfter Abschnitt. Theorie der Einheitswurzeln. §• 139. Die Einheitswurzeln. Unter einer Einheitswurzel versteht man allgemein eine reelle oder imaginäre Zahl von der Beschaffenheit, dass irgend eine ihrer Potenzen mit einem ganzzahligen Exponenten gleich 1 ist. . Diese Einheitswurzeln haben wir schon im §. 36 kennen gelernt und durch trigonometrische und Exponentialfunctionen dargestellt. Wir haben ferner specielle Fälle, z. B. im §. 38 die dritten Einheitswurzeln, benutzt, die dort ohne trigonometrische Functionen ausgedrückt wurden. In allen tiefer gehenden Untersuchungen über algebraische Gleichungen ist nun eine genauere Kenntniss der Einheitswurzeln und ihrer Eigenschaften unerlässlich. Wir werden uns daher in diesem Abschnitt mit dem elementaren Theil der algebraischen Theorie der Einheitswurzeln eingehender beschäftigen, ohne von ihrer Darstellung durch trigonometrische Functionen Gebrauch zu machen. Wegen der geometrischen Anwendung auf die Con- struction der regulären Vielecke, auf die wir schon im §. 36 hingewiesen haben, wird die Theorie der Einheitswurzeln auch die Kreistheilungstheorie genannt. Sie ist im Wesentlichen eine Schöpfung von Gauss1). Wenn die wte Potenz einer Zahl *• gleich 1 ist, wenn also die Gleichung l) Gauss, Disq. ar. Sectio VII.
§.139. Einheitswurzeln. 453 für ein ganzes positives n befriedigt ist, so heisst r eine wte Einheitswurzel oder eine Einheitswurzel vom Grade n. Es sind also alle wten Einheitswurzeln, und nur diese, Wurzeln der Gleichung nten Grades B) fix) — xn — 1 = 0. Es ist C) f(x) = nxn-1, und folglich hat/(«) mit/'(a:) keinen Theiler gemein; also hat f(x) keine mehrfachen Wurzeln, und es giebt n und nicht mehr von einander verschiedene nte Einheitswurzeln. Ist r eine nte Einheitswurzel, so ist es auch jede ganze Potenz von r, denn aus rn = 1 folgt rÄn = 1, wenn Je eine be- beliebige positive oder negative ganze Zahl ist (auch Je = 0 nicht ausgeschlossen); also ist auch rÄ eine nte Einheitswurzel. Da es aber nur n Einheitswurzeln vom Grade n giebt, so sind die Potenzen rÄ nicht alle von einander verschieden. Hierüber gilt nun Folgendes: Wenn sich zwei Zahlen k, h' um ein Vielfaches von n unter- unterscheiden, wenn also D) V = Je (mod n) ist, so ist auch E) r* == rv. Denn ist h' = h -J- h n, so ist woraus, da r» = 1 ist, die Gleichung E) folgt. Es sind also in der Reihe der Zahlen F) 1, r, r\ r\ . . ., r»-1 gewiss alle von einander verschiedenen rÄ enthalten; aber es müssen nicht umgekehrt die Grossen F) alle von einander ver- verschieden sein. Nehmen wir an, es seien Je und Je' = Je -J- jt zwei Zahlen der Reihe 0, 1, 2 ... n — 1, und r* = so folgt, dass r'* = 1 sein muss. Es kann also in der Reihe F) kein früher dagewesenes Glied wiederkehren, ehe das erste Glied
454 Zwölfter Abschnitt. §. 139. 1 zum zweiten Male vorkommt, und wenn (i die kleinste posi- positive Zahl ist, für die ru = 1 ist, so sind die Zahlen: G) 1, r, r», . . ., r"-1 alle von einander verschieden. Es muss dann jt ein Theiler von n sein. Denn durch Division lassen sich die ganzen Zahlen h, (i' so bestimmen, dass n = h[i -f- ft'; 0 <I (i' < (i- Dann ist aber auch, wie aus hervorgeht, r'4' = 1, d. h. da jt die kleinste positive Zahl sein soll, für die ru = 1 ist, (i' — 0, und folglich n durch (i theilbar. Es ist also r zugleich (ite Einheitswurzel, aber nicht Einheitswurzel von noch niedrigerem Grade. Man nennt die Zahl r eine primitive wte Einheits- wurzel, wenn sie nicht zugleich Einheitswurzel eines niedrigeren Grades ist. Aus dieser Definition folgt, dass die Zahlen der Reihe F), wenn r eine primitive nte Einheitswurzel ist, alle von einander verschieden sind, und dass sämmtliche «ten Einheitswurzeln darunter enthalten sind, dass sie aber nur einen Theil der wten Einheitswurzeln ausmachen, wenn r eine imprimitive nte Einheits- Einheitswurzel ist. Jede Einheitswurzel, deren Grad ein von n verschiedener Theiler von n ist, ist zugleich imprimitive wte Einheitswurzel. Ist r zugleich wte und wte Einheitswurzel, so ist es auch [ite Einheitswurzel, wenn (i der grösste gemein- gemeinschaftliche Theiler von n und m ist. Denn nach §. 126 kann man die ganzen Zahlen x, y so be- bestimmen, dass mx ~\- ny = (i wird, und folglich ist Dem entspricht der andere Satz: Sind ru r2 . . . Einheitswurzeln der Grade %, n2 . . ., so sind sie alle zugleich Einheitswurzeln des Grades w, wenn m irgend ein gemeinschaftliches Vielfaches von »%, w2 • • • bedeutet.
§. 140. Primitive w*« Einheitswurzeln. '..;"¦¦ §• 140. "'' . > Primitive Einheitswurzeln. Dass primitive Einheitswurzeln für jeden Grad n existiren, haben wir im vorigen Paragraphen noch nicht bewiesen. Wir müssen dies zunächst nachholen und werden dabei auch die genaue Zahl der primitiven Einheitswurzeln feststellen. Sei der Grad n in zwei Factoren a, b zerlegt, die zu ein- einander relativ prim sind, also n = ab, und sei a eine ate, ß eine bte Einheitswurzel. Dann ist das Product A) r = aß eine wte Einheitswurzel. Sind «', ß' zwei andere ate und 6te Ein- Einheitswurzeln, so ist r' = <x'ß' auch eine »te Einheitswurzel, und es ist zu zeigen, dass ¦ r' von r verschieden ist, wenn nicht gleich- gleichzeitig « = <x' und ß = ß' ist. Da nämlich a, b relativ prim sind, so kann man nach §. 126 die ganzen Zahlen x, y so bestimmen, dass B) ace-\-"by = 1 ist; und dann folgt aus A) • a =>*!', ß = raic. Demnach ist et, und ß durch r vollständig bestimmt, und wenn a' ß' auch gleich r sein soll, so muss a = <x', ß = ß' sein. Lässt man also in A) cc alle aten, ß alle bten Einheitswurzeln durchlaufen, so erhält r genau ab = n verschiedene Werthe, und es folgt: I. dass in der Form aß alle wten Einheitswurz'eln darstellbar sind, und weiter: II. dass r dann und nur dann eine primitive nte Einheitswurzel ist, wenn a eine primitive ate und ß eine primitive bte Einheitswurzel ist. Denn erstens sei ft der kleinste positive Exponent, für den r" = 1 ist; dann ist auch cc"' /?¦" = 1 und daraus folgt nach B), wenn man beiderseits zur Potenz by und ax erhebt, v? = 1, ßf = 1.
456 Zwölfter Abschnitt. §. 140. Wenn nun [i < n ist, so kann es nicht zugleich durch a und durch b theilbar sein, und also können auch a und b nicht beide die kleinsten positiven Exponenten der Potenzen von a und ß sein, die gleich 1 werden, d. h. also, wenn r nicht primitive #e Einheitswurzel ist, so sind auch a und ß nicht zugleich primitive ate und bte Einheitswurzeln, oder wenn cc und ß primi- primitive ate und 6te Einheitswurzeln sind, so ist ihr Product r primi- primitive nte Einheitswurzel. Auf der anderen Seite ist klar, dass, wenn a oder ß Einheitswurzel von niedrigerem Grade als a oder b ist, auch r Einheitswurzel von niedrigerem als dem nien Grade sein wird. Zerfällt n in mehrere Factoren a, b, c . . ., von denen je zwei zu einander relativ prim sind, und sind <x, ß, y . . . Einheits- Einheitswurzeln der Grade a, b, c . . ., und setzt man C) r = aßy ,. ., so schliesst man durch mehrmalige Anwendung der vorigen Sätze, dass in C) alle wten Einheits würz ein, und jede nur einmal, ent- enthalten sind, und ferner, dass r dann und nur dann primitive wte Einheitswurzel ist, wenn «, ß, y . . . primitive Einheitswurzeln der Grade a, b, c . . . sind. Bezeichnen wir jetzt die Anzahl der primitiven ntetL Einheits- Einheitswurzeln durch g?(w), so folgt aus dem hier Bewiesenen D) <p(n) = <p(a)<p{b)<p{c) .. ., wenn n = abc . . ., und a, b, c . . . Zahlen sind, die, je zwei und zwei, zu einander relativ prim sind. Nun kann man jede Zahl n auf eine und nur auf eine Weise in ein Product von Primzahlpotenzen zerlegen n = p"p?ip*2 . . ., worin jp, pu jp2 . . . verschiedene Primzahlen und ic, »1? n2 ... positive Exponenten sind, so dass aus der Formel D) folgt: E) <p O) = <p O*) <p Ofi) y (p**) und dass es also nur noch darauf ankommt, zu entscheiden, ob und wie viele primitive Einheitswurzeln des Grades pn existiren. Diese Frage ist aber sehr einfach zu entscheiden. Wenn nämlich q eine Einheitswurzel vom Grade jp* ist, so ist der niedrigste Grad, zu dem q als Einheitswurzel gehört, ein Theiler von p", also eine Potenz von p, und wenn er also nicht gleich
§. 140. Primitive rate Einheitswurzeln. 457 pn ist, ein Theiler von p*—1, d. h. jede nicht primitive Einheits- Einheitswurzel vom Grade p" ist zugleich Einheitswurzel vom Grade pa~1. Da es aber p" Einheitswurzeln vom Grade p" und nur pn—i Einheitswurzeln vom Grade p7t~1 giebt, so müssen primitive Einheitswurzeln des Grades pn vorhanden sein. Daraus erhält man nach E) die Anzahl aller primitiven wten Einheits- Einheitswurzeln F) 9(n) = worin das Productzeichen H sich auf alle von einander ver- verschiedenen in n aufgehenden Primzahlen bezieht. Nur für den Fall n = 1 passt die Formel F) nicht mehr; in diesem Falle ist cp A) = 1 zu setzen. Die Zahl cp (n) ist also niemals gleich Null. Da es hiernach für jeden Grad n wenigstens eine primi- primitive Einheitswurzel r giebt, so lassen sich alle wten Einheitswurzeln durch die Potenzen von r darstellen: \') xi 'i ' i ' i • • •> ' Ist rÄ irgend eine Potenz von r, so wird dann und nur dann rtm __ i semj wenn ]zm durch n theilbar ist. Ist also n = n'n" und n' der grösste gemeinsame Theiler von Tt und n, so muss m durch n" theilbar sein, und n" ist der Exponent der niedrigsten Potenz von rÄ, die gleich 1 wird, d. h. rk ist eine primitive n"te Einheitswurzel. Es folgt hieraus der Satz: III. Ist r primitive nte Einheitswurzel, so ist rÄ dann und nur dann primitive nte Einheitswurzel, wenn h relativ prim zu n ist. Nehmen wir k aus der Reihe der Zahlen 1, 2, 3 ... n, so ergiebt sich der Satz der Zahlentheorie, dass cp(n) gleich der Anzahl der Zahlen ist, die nicht grösser als n und rela- relativ prim zu n sind. Dies ist die ursprüngliche Definition des in der Zahlentheorie allgemein gebrauchten Zeichens cp(n). Ist h relativ prim zu n, so kann man eine ganze Zahl x so bestimmen, dass Jcx = 1 (mod ri) wird. Sind dann r, rx zwei nte Einheitswurzeln, so kann nur dann rÄ = r\ sein, wenn r = r1 ist, wie sich durch Erheben zur Potenz x ergiebt. Daraus folgt nach III.:
458 Zwölfter Abschjiitt. , . §. 141. IV. Ist h relativ prim zu »und durchläuft r die Reihe der primitiven nten Einheitswurzeln, so durchläuft rÄ dieselbe Zahlenreihe, wenixauch in anderer Ordnung. Endlich führen wir noch den Satz an: V. Ist n eine Primzahl, so ist jede wte Einheits- wurzel mit Ausnahme von 1 primitive w*6 Einheits- Einheitswurzel. §. 141. Gleichungen für die primitiven Einheitswurzeln nien Grades. Alle ntetL Einheitswurzeln sind, wie wir gesehen haben, Wurzeln einer Gleichung /„ (x) = 0, wenn A) fn{x) = S" — 1 ist; wenn wir die Function fn(x) von allen Factoren befreien, die sie mit anderen Functionen derselben Form/ni(a;) gemein hat, was durch rationale Operationen geschieht (§. 6), so erhalten,wir eine Gleichung Xn.= 0, der die primitiven ntetL Einheitswurzeln und nur diese genügen, und Xn hat die Form B) Xn — xv -f.«! x"-1 -\-• •¦ ¦-\- ar. Der Grad v ist gleich <p (n) und die Coefficienten at, a2> ¦• ¦¦, <h sind rationale Zahlen. Beim Aufsuchen der gemeinschaftlichen Factoren von fn und fni können wir uns für % auf die Theiler von n beschränken. Wie man die Function Xn einfach bilden kann, werden wir gleich , noch näher sehen. Wir beweisen aber zunächst einen allgemeinen . Satz über diese Functionen. Die wten Einheitswurzeln umfassen alle primitiven jttei1 Ein- Einheitswurzeln, worin (i irgend ein Theiler von n ist, n selbst und 1 eingeschlossen, da als primitive erste Einheitswurzel eben die . Einheit 1 selbst zu betrachten ist. Lassen wir also (i alle Divi- Divisoren von n durchlaufen und beachten, dass zwei verschiedene Xu niemals einen gemeinschaftlichen Theiler haben, und dass sowohl /„(#) als Xju keine mehrfachen Factoren enthalten, so folgt: C) fn{x) =
§. 141. Einheitswurzeln. 459 worin sich das Productzeichen II auf alle Theiler jt von n bezieht. Daraus erhalten wir nebenbei einen Beweis des zahlen- zahlentheoretischen Satzes: D) n wenn wir den Grad der Functionen auf der rechten und der linken Seite von C) einander gleich setzen. Andererseits schliessen wir nach dem Gauss'sehen Theorem (§. 2), dass die Coefficienten der sämmtlichen X^ ganze Zahlen sind. Denn kämen darunter auch gebrochene Zahlen vor, so könnte das Product nicht lauter ganzzahlige Coefficienten ent- enthalten, wie es doch nach C) und A) sein muss. Alle Functionen /„ (x) haben den Theiler x — 1, und wenn wir die Theilung ausführen, so ergiebt sich E) ^Lill. = z»-l _J_ xn-2 I UO-1.! w x — j i i ii. Hieraus schliessen wir, dass, wenn r irgend eine primitive oder nicht primitive nte Einheitswurzel ist, mit alleiniger Aus- Ausnahme von r = 1, immer F) 1 -j- r + r2 -| (- r»-1 = 0, während für r = 1 die Summe auf der linken Seite von F) offenbar den Werth n hat. Wenn n eine Primzahl ist, so giebt es ausser 1 keine im- imprimitiven wtei1 Einheitswurzeln, und daher ist, wenn n eine Prim- Primzahl ist, was wir dadurch andeuten wollen, dass wir p dafür setzen, G) Xp = x*>-1 + XP-* -] 1- # + 1. Ebenso einfach lässt sich Xn bilden, wenn n eine Prim- Primzahlpotenz ist, also n = pn, oder, wenn wir zur Abkürzung p"—1 =.p' setzen: n = p' p. Die wten Einheitswurzeln bestehen in diesem Falle aus den primitiven wten Einheitswurzeln und aus den ^'ten Einheitswurzeln, und es ist also (8) Xn = ^7—f =
460 Zwölfter Abschnitt. §. 141. Ist p' > 1, also % > 1, so fehlt in dieser Gleichung das Glied mit der (v — l)ten Potenz der Unbekannten, dessen Coeffi- cient der negativen Summe der Wurzeln gleich ist. Wir haben also den Satz: VI. Die Summe aller primitiven nten Einheitswurzeln ist, wenn n eine höhere Potenz einer Primzahl ist, immer gleich Null. Zur allgemeinen Bildung von X„ wollen wir ein recurrentes Verfahren anwenden; wir nehmen Xn als schon gebildet an, bezeichnen mit p eine in n nicht aufgehende Primzahl, mit p' wie oben die {% — l)te Potenz von p, und bilden nun Xnp>m worin natürlich p' auch gleich 1 sein kann. Bezeichnen wir mit r die primitiven ntetL Einheitswurzeln, mit a jede Einheitswurzel des Grades pp', und mit a! jede Ein- Einheitswurzel des Grades jp', so erhält man die sämmtlichen primi- primitiven Einheitswurzeln des Grades npp', wenn man von den sämmtlichen ra die ra' wegnimmt (§. 140, II.). Die ra sind aber die Wurzeln der Gleichung: weil die Grossen (r a)vp' .== r**1, von der Reihenfolge abgesehen, mit den r selbst übereinstimmen (§. 140, IV.). Ebenso sind die ra' die Wurzeln der Gleichung X„«) = 0, und daraus ergiebt sich m x (x)-Xn(xPpr) Hiervon macht auch der Werth n = 1 keine Ausnahme, wenn wir unter Xx die Function x — 1 verstehen. Danach können wir Xn in allen Fällen verhältnissmässig einfach bilden. Wir betrachten einige besondere Fälle. Nehmen wir an, es enthalte n nur zwei von einander ver- verschiedene Primzahlen p, q und sei also n=pp'qq', dann ergiebt die Formel (8) und (9): (X» — XP! — \) B — l) («2 — l)
§. 141. Einheitswurzeln. 461 eine Formel, die sich leicht durch vollständige Induction folgender- maassen verallgemeinern lässt. Bezeichnet man mit ^ alle Zahlen, die aus n entstehen, wenn man n durch eine gerade Zahl verschiedener Primtheiler von n dividirt (n selbst eingeschlossen), mit jt2 die Zahlen, die aus n entstehen, wenn man n durch eine ungerade Zahl solcher Primtheiler dividirt, so ist Der Beweis ergiebt sich aus (9) für npp', wenn man an- annimmt, die Richtigkeit sei für n schon bewiesen. Bedeutet r jede der primitiven ntetL Einheitswurzeln, so sind bei ungeradem n die —r die primitiven 2wten Einheitswurzeln (§. 140, L, II.). Demnach ist bei ungeradem n A1) X,n(x)=Xn(-x). Ist n eine Potenz von 2, so ist nach (8): • A2) Xn = -n J-=3l+]. Setzen wir in der Formel (8) x = 1, so erhält X„ den Werth p, wenn n eine Potenz von p ist. Dagegen ergiebt die Formel (9), wenn n > 1 ist, für X„M- den Werth 1 (für n = 1 würde auf der rechten Seite Zähler und Nenner = 0). Wir erhalten also den Satz: VII. Die Function Xn erhält für x = 1 den Werth p, wenn n eine Potenz der Primzahl p ist, und den Werth 1, wenn n mehr als eine Primzahl als Theiler hat. Ist p eine in n aufgehende Primzahl und n = pn\ so ist A3) =-; ~ = a^'ü*-1) + a^(p-» _| 1- «-' + 1, und diese Function verschwindet, wenn x- gleich irgend einer primitiven wtel1 Einheitswurzel « gesetzt wird. Sie ist daher durch Xn theilbar, und es muss also eine ganze Function Yn von x geben, die nach §. 2 ganzzahlige Coefncienten hat, so dass A4) xn'<J>-» + a^'ö>-2> -| + x«' + 1 = Xn Yn
462: Zwölfter Abschnitt. §. 142. wird. Ist nun <x' irgend eine n'te Einheitswurzel, also cc'n' = 1, so folgt aus A4) A5) Xn(a')Tn(a')=p, also eine Zerlegung der Primzahl p in zwei Factoren, die ganze Functionen einer Einheitswurzel von beliebigem Grade n' sind. §• 142. Die Discriminante der Kreistheilungsgleichung. Die Einheitswurzeln vom Grade n lassen sich in transcen- denter Form darstellen durch ,,. — 2 3rfc . . . 2 3T& A) r = e n = cos \- % sm Diese Einheitswurzel ist primitiv oder nicht, primitiv, je nachdem h theilerfremd zu n ist oder nicht. Die einfachste unter den primitiven erhält man für Je = 1, nämlich 2«t Ojj 2j[ B) ra = e n = cos 1- * sin — = a + b i. Der Winkel 2 sr : n ist der wte Theil der ganzen Kreisperi- Kreisperipherie. Die verschiedenen Theilpunkte, die man erhält, wenn man Fig. 28. diesen W7inkel von einem beliebigen Anfangs- Anfangspunkte an auf der Peripherie aufträgt, be- bestimmen das dem Kreise eingeschriebene reguläre w-Eck. Die Theilpunkte lassen sich construiren, wenn man r und damit a und b (oder auch nur eine dieser beiden Grossen) kennt. Insbesondere ergiebt sich für die Seite s des regulären w-Eckes, wenn der Radius c des umgeschriebenen Kreises gleich 1 angenommen wird, n Die übrigen Grossen r stehen in derselben Beziehung zu den anderen Theilpunkten. Wegen dieser geometrischen Bedeutung nennen wir die Gleichung X„ = 0, deren Wurzeln die Grossen A) sind, die Kreistheilungsgleichung. Wir bestimmen jetzt die Discriminante der Kreistheilungs- Kreistheilungsgleichung Xn = 0, beschränken uns aber auf den Fall, dass » eine ungerade Primzahl ist.
§. 142. Discriminante der Kreistheilungsgleichung. 463 Es ist dann C) Xn = a;—1 + »»-» + • • • + x -f 1, und da nur die eine imprimitive iite Einheitswurzel 1 existirt, so ist D) fn(x) = s- — 1 = (s - 1) Xn, also E) fn(x) = fix»-* = X. + (*—!) ^n- Ist nun D die Discriminante von X». so ist nach §. 50, E) F) D-= (— 1) 2 worin sich das Productzeicheu II auf alle Wurzeln r der Gleichung X« = 0 erstreckt, und worin, da n ungerade ist, n(n — 1) n — l gesetzt werden konnte. Es ist aber nach E) /7 I <W vH—'1 — ~— (np __ 1 *\ X f<J*l III /(< / ¦ 1 / ^^ X I -ti-rt \* _/ 7 und da das Product aller r gleich 1 ist (weil es gleich dem von x unabhängigen Grliede in X„ ist), und da also II(r — 1) = Xn(l) = n, (§. 141) so folgt aus F) und G) (8) D = (—1)~*~ n»-\ Die Wurzeln von Xn sind, wenn r eine von ihnen ist, alle in der Form enthalten v y2 <r% und wenn wir also das Differenzenproduct (9) P = (r — r2) (r — rs) . . . (r — einführen, so ist (§. 50) D = P\ Es ist also auch nach (8) n—3 A0) P = n~
464 Zwölfter Abschnitt. §. 142. wodurch P, abgesehen vom Vorzeichen, bestimmt ist. Es ist P reell, wenn n = 1, und imaginär, wenn n = — 1 (mod 4) ist, also reell für n = 5, 13, 17, 29, 37, . . ., imaginär für n = 3, 7, 11, 19, 23, 31, ... Das Vorzeichen, das wir in A0) der Wurzel zu geben haben, hängt davon ab, welches r wir in dem Ausdruck (9) gewählt haben. Wählen wir ein bestimmtes r, z. B. r — r0, so können wir das Vorzeichen in A0) noch bestimmen. Um dies auszuführen, theilen wir die binomischen Factoren von P, r* — ***, v < ft, deren Anzahl \{n — 1) (n — 2) beträgt, in zwei Classen. Die Differenzen der einen Classe bilden das Product / n—l n + l\ A1) Q — (r — r«-1) (r2 — r"~2) . . . \r 2 — r 2 ), das also alle die Factoren enthält, in denen ft -\- v = n ist. Die übrigen Factoren lassen sich in Paaren von folgender Form zusammenfassen A2) B = (rv — ru) (r»-M — r»—"). Die Anzahl der Factoren in Q ist \{n — 1), und also ist die Anzahl der Paare B 1 /(n — 1) (n — 2) _ n— 1\ _ (n — 1) (w— 3) 7 \ 2 ~2 ) ~ 4 und diese Zahl ist immer gerade, da einer der beiden Factoren n — 1, n — 3 durch 4 theilbar ist. Nun ist, wenn 27tilc r = e " ist, B = — 2 + f-* + f-M = — 2 (l — cos d. h. B ist immer negativ. Folglich ist das Product aller B eine positive Grosse. Es ist ferner A3) <) = B*J sin __ sin— sin i1 nn , und das Vorzeichen hiervon ist von h abhängig. Nehmen wir aber 7; = 1, also r = r0, so sind alle die Winkel 2 % 4 % (n — 1) % n ' n ' ' n
§. 142. Discriminante der Kreistheilungsgleichung. 465 zwischen Null und % gelegen und die Sinus alle positiv. Wir schliessen hieraus nach A0), dass in diesem Falle «—1 »— 3 _ A4) P = i~n~Vn ist, und Vn positiv zu nehmen ist. Das Vorzeichen des Productes der B hängt von der Wahl von r nicht ab, sondern nur von der Beschaffenheit von n. Es ist daher von Interesse, das Product Q, dessen Vorzeichen von der Wahl von r abhängt, für sich zu bestimmen. Wir erhalten es auf folgende Weise: Multipliciren wir den Ausdruck A1) mit und sodann mit n — l nß — l T—"^ . T—2 ¦ ¥—'^ Y 2 ^^ T ^ so erhalten wir tfi—i r e q _ (r2 _ i) (ri — i) . . . (r»-i _ r 8 Q = A — r»-a) A — r»-*) . . . A — r). Da nun die Exponenten 2, 4,..., n— 1, vi—2, n — 4,..., 1 zusammen alle Zahlen 1, 2, . . ., n — 1 umfassen, so ergiebt sich durch Multiplication dieser beiden Ausdrücke: Q ()( ) {f, also n — l _ A5) Q = ± i~ Vn. Die Vergleichung mit A3) ergiebt A6) 2 2 sin sm • • • sm = Das Vorzeichen in dieser Formel hängt, wie in A5), noch von h ab; es ist aber das positive, wenn h = 1 ist. Im Uebrigen wollen wir über dies Vorzeichen, das weiterhin noch genauer untersucht werden wird, noch einen wichtigen Satz ableiten. Nach der Definition A1) ist Q eine ganze rationale Function von r, die, wenn man sie nach Potenzen von r ordnet, ganze rationale Zahlencoefficienten erhält. Setzen wir also r = **, Weber, Algebra. I. g()
466 Zwölfter Abschnitt. §. 143. sö wird ' - ' ' worin F das Zeichen für eine rationale Function ist, deren Coefficienten von h nicht abhängig sind. Setzen wir nun für Je der Reihe nach die Werthe h = 1, 2, . . . n — 1, so stellt r\ alle Wurzeln der Kreistheilungsgleichung Xn = 0 dar, und die Summe iQ = F(r0) + F(r> )+;•• + 2^-*) ist eine symmetrische Function der Wurzeln dieser Gleichung; sie lässt sich also rational durch die Coefficienten der Gleichung, d.h. durch rationale Zahlen ausdrücken und ist mithin selbst eine rationale Zahl. Andererseits ist aber nach der Formel A5) lö = A»~ä~ Vn, wenn h eine ganze Zahl bedeutet, nämlich die Anzahl der Fälle, in denen in A5) das positive Zeichen zu nehmen ist, vermindert um die Anzahl der Fälle, in denen das negative Zeichen gilt. Beides ist aber nur dann mit einander verträglich, wenn h = 0 ist; und damit ist der folgende Satz bewiesen: 1. Durchläuft h die Reihe der Zahlen 1,2,3,...,»—1, so gilt in" der Formel A6) ebenso oft das positive wie das negative Zeichen. Es braucht kaum besonders erwähnt zu werden, dass man für lc auch ein anderes volles Restsystem von n, mit Ausschluss der durch n theilbaren Zahl, nehmen kann. §. 143. Primitive Congruenzwurzeln. Parallel mit der Theorie der Einheitswurzeln geht eine Theorie der sogenannten binomischen Congruenzen, ohne die in der Theorie der Kreistheilungsgleichungen weitere Schritte nicht gemacht werden können, deren Grundzüge passend hier ein-' geschoben werden, wo sich die Analogie mit der Theorie der" Einheitswurzeln deutlich zeigt.
§. 143. Primitive CongruenzwurzeJn. 467 Es sei also jetzt n eine Primzahl und A) f(x) =-«o %m + % x™-1 H 1- a»-i« + »» eine ganze Function von x, deren Coefficienten a ganze Zahlen sind, und a0 nicht durch n theilbar. Setzen wir für x eine solche ganze Zahl «, dass /(«) durch » theilbar wird, so sagen wir (nach Analogie der Gleichungen), « sei eine Wurzel der Con- Congruenz mten Grades: B) f(x) = 0 (mod n). Wird « um ein Vielfaches von n vermehrt, so bleibt es Wurzel der Congruenz B). Solche nach dem Modul n con- gruente Wurzeln gelten nicht als verschieden. Unter dieser Voraussetzung können wir den Satz aussprechen: 1. Eine Congruenz wten Grades für einen Primzahl- Primzahlmodul kann nicht mehr als m verschiedene Wurzeln haben. Der Satz ist richtig für »»=1, denn dieCongruenz a0x-{-a=0 (mod n) hat nur eine Wurzel, nämlich, wenn a'o so bestimmt wird, dass a0 a'o = 1 (mod m) ist, w = — a a'o (mod n). Wir nehmen unseren Satz also jetzt als bewiesen an für den Grad m — 1 und leiten seine Richtigkeit für den Grad m daraus her. Nach §. 4 können wir, wenn zunächst « beliebig ist, setzen /q\ J W J \ 1 / r„\ worin fi (x) eine ganze Function vom (m — l)ten Grade ist, die, wenn a eine ganze Zahl ist, ganzzahlige Coefficienten bat. Wenn also /(«) = 0 ist, so folgt aus C) D) • f(x) = (x — «)/! (x) (mod n). Jede Wurzel ß der Congruenz B) muss also der Bedingung (ß — «) /j (ß) = 0 (mod n) genügen. Also ist entweder ß — w oder /i (ß) durch n theilbar. Nun giebt es nach Voraussetzung höchstens m — 1 Werthe ß, für die fx (ß) durch n theilbar wird; giebt es also noch eine mte Wurzel von D), so muss diese gleich « sein. Wenn also eine Congruenz von der Form f(x) = 0 (moin) mehr Wurzeln hat, als ihr Grad beträgt, so schliessen wir, dass die Congruenz identisch ist, d. h. dass alle Coefficienten von f(x) durch n theilbar sein müssen. 30*
468 Zwölfter Abschnitt. §. 143. Dieser Satz ist, wie man sieht, ganz analog dem alge- algebraischen Satze, dass eine Gleichung nicht mehr Wurzeln haben kann, als ihr Grad angiebt. Es lässt sich aber nicht der andere Satz übertragen, dass jede Gleichung auch wirklich so viele Wurzeln hat. Eine Congruenz mten Grades kann weniger, selbst gar keine Wurzeln haben. Um so bemerkenswerther ist eine besondere Congruenz, bei der die Zahl der Wurzeln immer dem Grade gleichkommt, auf Grund eines Lehrsatzes, der der Fermat'sche Lehrsatz genannt wird, und den wir hier so formuliren. 2. Die Congruenzen E) x™ — x = 0, X"-1 — 1=0 (mod n) haben, wenn n eine Primzahl ist, so viele Wurzeln als ihr Grad beträgt, nämlich n und n— 1. Beide Behauptungen sind nicht wesentlich verschieden, denn die erste der Congruenzen E) hat alle Wurzeln der zweiten und ausserdem die Wurzel 0, die der zweiten nicht genügt. Ebenso hat die zweite alle Wurzeln der ersten, mit Ausnahme der Wurzel 0. Da es nun für den Modul n überhaupt nur n verschiedene Zahlen giebt, so ist also zu beweisen, dass für jede ganze Zahl a die Congruenz besteht F) an = a (mod n). Diese Congruenz ist richtig für u = 0 und a = 1. Wir beweisen sie also wieder durch vollständige Induction, indem wir aus der als richtig vorausgesetzten Congruenz F) die Richtig- Richtigkeit von G) (« + 1)" = « + 1 (mod n) ableiten. Dies ist aber aus dem binomischen Satz zu schliessen, wenn man beachtet, dass alle Binomialcoefficienten, mit Aus- Ausnahme des ersten und des letzten, die gleich 1 sind, nämlich n(n — 1) n(n — 1) (n — 2) W' Hl ' 1.2.3 ' ' * - durch n theilbare ganze Zahlen sind (§. 12). Demnach ist (« -f !)" = «" +1 (mod n% also folgt die Formel G) aus der Formel F). Die Differenz x(x — 1) (x — 2) . . . (x — n -\- 1) — xn ~\- x
§• 143. Primitive Congruenzwurzeln. 469 ist eine Function, höchstens vom n — 1*™ Grade. Sie ist aber für n Werthe von x, nämlich für x = 0, 1, 2, . . ., n — 1 con- gruent mit Null, und daher haben wir identisch x(x — 1) (x — 2) . . . (x — n + 1) = x» — x (mod n). Daraus ergiebt sich der Wilson'sche Lehrsatz: 1 . 2 . 3 . . . (w — 1) = — 1 (mod n), wenn man die Coefficienten der ersten Potenz von x beiderseits vergleicht. Wir beschränken uns jetzt auf die zweite der Congruenzen E) (8) xn~x = 1 (mod n) und beweisen zunächst den Satz: 3. Ist a ein Theiler von n — 1, so hat die Congruenz (9) xa = 1 (mod n) genau a verschiedene Wurzeln. Denn es ist, wenn n — I=a5 ist, xn-l _ l __ (& _ l) (paCi-l) _J_ ^(S-2) _j 1_ ^ _|_ ^ und da jede Wurzel der linken Seite Wurzel entweder des einen oder des anderen Factors auf der rechten Seite sein muss, so folgt, dass, wenn xa — 1=0 weniger als a Wurzeln hätte, der zweite Factor mehr Wurzeln haben müsste, als sein Grad angiebt entgegen dem Satz 1. Ist « eine durch n nicht theilbare Zahl, und a die kleinste positive Zahl, für die ua = 1 (mod n) wird, ist ferner h irgend eine positive ganze Zahl, für die ah = 1 (mod n) ist, so ist a nothwendig ein Theiler von h, insbesondere also a ein Theiler von n — 1. Denn setzen wir h — qa -)- a\ worin q eine ganze Zahl und a! < a ist, so ist auch «°' = 1; also muss al = 0 sein, weil a die kleinste positive Zahl sein sollte, wofür diese Congruenz befriedigt ist. Eine Wurzel w der Congruenz (9) von der Eigenschaft, dass keine niedrigere als die ate Potenz der Einheit congruent wird, heisst eine primitive Wurzel dieser Congruenz, oder primi- primitive ate Congruenzwurzel der Primzahl w, und eine primitive Wurzel g der Congruenz (8) nennen wii- auch kurz eine primitive Wurzel der Primzahl n.
470 . Zwölfter Abschnitt. §. 143. Wir wollen beweisen, dass für jede Primzahl n primitive .Wurzeln existiren und ihre Anzahl bestimmen, und gehen dabei denselben Weg, wie bei den Einheitswurzeln. Es seien a und b zwei Theiler von n — 1, die unter sich relativ prim sind, und « eine ate, ß eine bte primitive Congruenz- Congruenzwurzel von n. Setzen wir ab ¦= c, so ist y = aß eine primi- primitive c^ Congruenzwurzel, und umgekehrt lässtsich auch jede primitive cte Congruenzwurzel in der Form aß darstellen. Denn es ist erstens: (aßy = cießc=l (mod n), und zweitens: wenn (aß)h = ahßh = 1 (mod n) ist, so ist auch ahhßhh = 1, also cchh = 1, also hb durch a theilbar, also auch h durch a theilbar, und ebenso schliesst man, dass h durch b, also auch durch ab = c theilbar sein muss, d. h. aß ist primitive cte Congruenzwurzel. Ist umgekehrt y eine primitive cte Congruenzwurzel, so bestimmen wir die positiven ganzen Zahlen x, y so, dass A0) ' ay -\- bx = 1 (mod e) wird, indem wir zunächst x aus bx = 1 (mod a), und dann y aus y = (mod b) bestimmen. Dann ist y relativ prim Ctf zu b, und x relativ prim zu a. Hiernach ist y = yhxyax — aß (modn), und yhx = k ist primitive aie Congruenzwurzel, ya" = ß primi- primitive 6te Congruenzwurzel (weil «Ä = ybxh nur dann =1 sein kann, wenn In, durch a theilbar ist). Es ist noch zu zeigen, dass die Producte cxß alle von ein- einander verschieden sind, d. h. dass die Congruenz A1) cxß eee a'ß' (mod »), wenn «, w'; ß, ß' primitive ate und bte Congruenzwurzeln sind, nur befriedigt werden kann, wenn <x==k', ß = ß' (mod n) ist. Dies folgt aber nach A0), wenn man A1) in die Potenz b x = 1 (mod a) erhebt, woraus sich « = »' ergiebt, und dann auch ß = ß'. Bezeichnen wir also die Anzahl der primitiven aten Con- Congruenzwurzeln mit q>(a), so folgt aus dem Bewiesenen A2) <p(c) = (p(a)cp(b).
§. 148. Primitive Congruenzwurzeln. 471 Es bleibt noch übrig, wenn p eine Primzahl und ppx eine in n — 1 aufgehende Potenz von p ist, <p (ppi) zu bestimmen. Ist « eine nicht primitive Congruenzwurzel vom Grade p", und p7'^1 = pi, so ist, wenn eth die niedrigste nach dem Modul n mit 1 congruente Potenz von et, ist, h ein Theiler von ppu d. h. eine Potenz von j); da h aber kleiner als pp^ sein soll, so ist es auch ein Theiler von p^, und folglich <&?>¦ = 1 (mod ri), also: eine nicht primitive Gongruenzwurzel des Grades pj>j ist zugleich eine Congruenzwurzel des Grades px. Umgekehrt ist jede Congruenzwurzel des Grades p1. zugleich eine imprimitive Congruenzwurzel des Grades ppi. Da nun die beiden Con- gruenzen i»' = 1, x^ = 1 so viele Wurzeln haben, als ihr Grad beträgt, so bleiben pp1 —pt primitive Congruenzwurzeln der ersten übrig, und es ist also A3) 9(fft)=J»i(l>-l> Die Function cp(a) hat also dieselbe Bedeutung, wie im §.140, und es ist damit zugleich die Anzahl der primitiven Wurzeln der Primzahl n gleich <p (n — 1) gefunden. Wir sprechen also noch den Satz aus: 4. Eine Primzahl n hat <p(n — 1) primitive Wurzeln. Damit ist die Existenz von primitiven Wurzeln für jede Primzahl nachgewiesen und zugleich ihre Anzahl bestimmt. Zur Auffindung der primitiven Wurzeln haben wir freilich keine andere allgemeine Methode als das Probiren, was durch einige Kunstgriffe etwas abgekürzt werden kann. Ist g eine primitive Wurzel der Primzahl n, so sind die Reste der Potenzen A4) . l,g,g*,g>,.:^g»-*. alle von einander verschieden, da, wenn g™ = gm+i* wäre, #"= 1 sein müsste, was nicht möglich ist, so lange ft positiv und kleiner als n — 1 ist. Es muss also unter den Resten der Reihe A4), unter denen der Rest 0 nicht vorkommt, jede der Zahlen A5) 1, 2, 3, . . , n - 1 und jede nur einmal enthalten sein, oder mit anderen Worten: 5. Ist a eine durch n nicht theilbare Zahl, so giebt es eine und nur eine Zahl w aus der Reihe d,er Zahlen 0, 1, 2, . . ., n — 2, durch die die Con- gruenz A6) ga = a (mod ri)
472 Zwölfter Abschnitt. §. 143. befriedigt wird. Dieselbe Congruenz wird aber auch befriedigt, wenn als Exponent eine mit cc nach dem Modul n — 1 congruente Zahl gesetzt wird, und man findet in jedem vollen Restsystem nur eine solche Zahl «. Der Exponent et, heisst der Index von a in Bezug auf die Basis g, und es wird geschrieben A7) . « = inda (mod n — 1). Man hat also für jede durch n nicht theilbare Zahl A8) #inda = a (mod n). Aus den beiden Formeln A9) gmia + mdb = a ^ gmin&a = „m (m0(J n) ergiebt sich der Satz: 6. Der Index eines Productes ist gleich der Summe der Indices der Factoren; der Index der mten Potenz von a ist gleich dem mfachen des Index von a. Diese Sätze sind ganz analog den entsprechenden Sätzen, die sich auf die Rechnung mit Logarithmen beziehen, und die Analogie lässt sich noch weiter verfolgen. So wird z. B. der Uebergang von einer Basis g zu einer anderen Basis g' durch die Formel g g m g' B0) inda = mag' inäa (mod n — 1) vermittelt. Wir wollen noch den leicht zu beweisenden Satz anführen, dass unter den durch n nicht theilbaren Zahlen a die und nur die primitive Wurzeln sind, deren Indices relativ prim zu n — 1 sind. Für praktische Rechnungen bedient man sich zweckmässig sogenannter Indextabellen, die den Logarithmentafeln entsprechen. Man nennt in der Congruenz A7) « den Index und a den Numerus, und stellt am besten zwei Tabellen auf, von denen die eine zu jedem Index den Numerus, die andere zu jedem Numerus den Index giebt, wo die zweite durch Umstellung aus der ersten gewonnen wird. Dabei ist zu beachten, dass für die Indices der Modul n — 1, für die Numeri der Modul n in Betracht kommt und congruente Zahlen als gleichwerthig gelten. So erhält man z. B. für n = 13 und die Basis 2
§. 143. Primitive Congruenzwurzeln. 473 1 N N I 0 1 1 0 1 2 2 1 2 4 3 4 3 8 4 2 4 3 5 9 5 6 6 5 6 12 7 11 7 11 8 3 8 9 9 8 9 5 10 10 10 10 11 7 11 7 12 6 Im Canon Arithmeticus von Jacobi A839) sind für alle Primzahlen im ersten Tausend Indextabellen zusammengestellt. In kleinerem Umfange nach Berechnungen von Ostrogradsky in der „Theorie der Congruenzen" von Tschebyscheff (deutsch von Schapira, Berlin 1889). Es ist noch zu bemerken, dass der Index von 1 immer gleich 0 ist, und dass der Index von — 1 (oder von n — 1) immer gleich n 1 -—-— ist. Denn da (— lJ den Index 0 oder n — 1 hat, so muss — 1, da es nicht den Index 0 hat, und das Doppelte seines Index gleich 0 oder n — 1 ist, den Index —-— haben; in Formeln: « i B1) ind 1 = 0, ind(— 1) = —-— (mod n — 1). Ist n eine Primzahl, und m nicht durch n — 1 theilbar, so giebt es immer wenigstens eine durch n nicht theilbare Zahl &, so dass hm nicht mit 1 congruent ist. Denn ist m' der Rest von m nach dem Modul ri — 1, so ist hm = hm' (mod ri), und die Congruenz x™' = 1 hat weniger als n — 1 Wurzeln. Folglich giebt es eine durch n untheilbare Zahl Je, die nicht Wurzel dieser Congruenz ist. Nun durchläuft aber Jcx zugleich mit x ein volles Restsystem nach dem Modul n (§. 123), und wir haben daher 2xm = S(kx)m (mod ri), oder (hm — 1) Zx™ ^ 0 (mod ri). Daraus er giebt sich für jeden durch n — 1 nicht theilbaren Exponenten m B2) Sxm ^ 0 (mod ri), \m nicht ^0 (mod n—1)], wenn x ein volles Restsystem für den Modul n durchläuft. Ist aber m durch n — 1 theilbar, so ist xm für jedes durch n untheilbare x mit 1 congruent, und wir. erhalten direct B3) Zx™ = — 1 (mod ri), [m = 0 (mod n — 1)].
474 Zwölfter Abschnitt. §. 144. Diese Sätze lassen sich auch dadurch beweisen, dass man x durch eine Potenz einer Primitivwurzel g darstellt, und zeigen eine weitere Analogie der Potenzreste mit den Einheitswurzeln. §• Multiplication und Theilung der trigonometrischen Functionen. Wir haben schon auf den Zusammenhang hingewiesen, der zwischen der Theorie der Einheitswurzeln und der geometrischen Aufgabe der Theilung der Kreisperipherie besteht. Die Ver- Verallgemeinerung dieser Aufgabe führt auf die Theilung eines beliebigen Winkels. Auch diese Aufgabe führt auf algebraische Gleichungen, von denen wir die für die Dreitheilung schon früher für die allgemeine Auflösung der Gubischen Gleichungen benutzt haben (§. 120). Wir beginnen jetzt mit' der Aufstellung der allgemeinen Formeln. : Nach dem, Moivre'sehen Satze (§. 36) ist, wenn n eine beliebige positive ganze Zahl und qp ein beliebiger Winkel ist, A) ' cos n qp -\- i sin n qp = (cos qp —|— * sin q>)n, und wenn wir auf der rechten Seite den binomischen Satz an- anwenden, so folgt durch Trennung des Reellen vom Imaginären cos nep = cos qp" — B<g> cos"—2 qp sin2 qp + BW cos"-* qp sin* qp — B) . -T i V V —:—^- = n cos"-1 qp — _B(") cos"—3 qp sin« m smqp ^ 3 -r -r + -BEn) cos"-5 qp sin* cp — • • •, worin _B$,n) wie früher die Binominalcoefficienten sind, und die Summen auf der rechten Seite so weit fortzusetzen sind, als keine negativen Exponenten von cos qp vorkommen. Da nun sin2 qp = 1 — cos2 qp ist, so lassen sich diese beiden Ausdrücke rational durch cosqp darstellen; wir setzen C) 2 cosqp = x, und führen die Bezeichnung ein D) 2 cos n qp = An (x), S1°^ y = Bn (x), sin cp
§. 144. Trigonometrische Functionen. 475 worin also A„(x) und B„(x) ganze Functionen von x sind, A„(x) vom Grade n, Bn(x) vom Grade n— 1. Wir wollen das allgemeine Gesetz dieser Functionen ermitteln. Wir stellen sie für die ersten Werthe n = 1, 2, 3,... auf, und leiten dann eine Recursionsformel zur Berechnung der höheren Functionen ab. Man findet A (x) = x, Bx (x) = 1 E) A, (x) = «2 — 2, _B2 (x) = x A3 (x) = x* — 3 x, B3 (x) = x* — 1. Nun ist aber nach bekannten Formeln cos (»4" 1) 9 ~\~ cos (n — 1) 9 = 2 cos cp cos n q> sin (n -\- 1) tp -\- sin (n — 1) q> = 2 cos (p sin n <jp, woraus für An und Bn die Recursionsformeln folgen: , An + i(x) = Z An (X) An-i (X), { ) B(x) = xBH(x) — Bn-l(x) Daraus kann man An, B„ für jedes beliebige n berechnen, wenn diese Functionen für n = 1 und n = 2 bekannt sind. So findet man At (x) == xi — 4«2 -f 2 A6(x) = x"a — 5 x% -\- 5 a; J^ (*) = «e — 6 x* -j- 9 «2 — 2 _B4O) = a;3_ 2« ^5 (x) — x* — 3 «2 + 1 B6 (x) = «5 _ 4 £3 _(_ 3 ^ und so kann man fortfahren. Man kommt durch Induction zu folgendem allgemeinen Gesetz: G) A*(x) = 2{-iy^B<:-<>x*-*% O^v^^, (8) Bn (x) = 2 (- 1)' Ä—'-1' aj—»'-S 0 ^ v ^ ^=^, wo die Summen mit v = 0 beginnen, und so lange fortzusetzen sind, als die Exponenten von x nicht negativ werden. Da sich diese Formeln in den ersten Fällen als richtig erweisen, so ist, um sie allgemein zu beweisen, nur noch der Nachweis nöthig, dass sie die Formeln F) verificiren. Bilden wir zu diesem Zweck
476 .Zwölfter Abschnitt. §-144- und setzen v — 1 an Stelle von v, so folgt V zu 1 (9) .An-1(x) = -Z(- £ Wenn wir i?^ = 0 annehmen, können wir auch hierin v von 0 an wachsen lassen. Die Werthe, die v in der Formel G) annimmt, unterscheiden sich dann von denen in der Formel (9) nur wenn n ungerade ist, weil dann der Werth v = (n -\~ 1) : 2 in (9), aber nicht in G) vorkommt. Wir können aber diesen Werth in G) zufügen, wenn wir einen Bin omialcoefficienten -BST+i, in dem der untere Index den oberen übertrifft, gleich 0 annehmen. Dann er- giebt sich A0) xÄn(x) — A-i(«) Nun ist aber, wie sich aus §. 7 (9) ergiebt, „ B<?~v) + (n — 1) Sfrl? n+1 w—,+« = : r- J5r , w — v n — v -|- 1 auch in den beiden Grenzfällen v = 0, j; = (» -|- 1):2, und somit stimmt also A0) mit dem überein, was sich aus der rechten Seite von G) durch Vertauschung von n mit n -\- 1 ergiebt. Noch einfacher ergiebt die Formel (8) xBn(x) - -B.-xC») = i (- l)'aj—»' (Ä—'-" + Sti'-"), und da ist, so ist damit auch (8) allgemein bewiesen. Der Uebersicht halber setzen wir die Formeln etwas aus- ausführlicher her: A1) -An (x) = xn — nxn~2 . n(n—3) n(n — 4)(w —5) _ . .
§. 144. Theilung des Winkels. 477 A2) Bn (x) = x»-1 — (n — 2) x"~s i (n-3)(n-A) (n-4)(n-5)(n-6) Nehmen wir coswqp und sinwqp als gegeben an, so dient die Gleichung nten Grades A3) An (x) — 2 cos n qp = 0 zur Bestimmung der Unbekannten x = 2 cos qp. Die Bedeutung der n Wurzeln dieser Gleichung ergiebt sich daraus, dass der Cosinus sich nicht ändert, wenn der Winkel um ein Vielfaches von 2 % wächst. Demnach genügt der Gleichung A3) jeder Werth A4) :r = 2co wenn v eine beliebige ganze positive oder negative Zahl bedeutet. Man erhält aber alle von einander verschiedenen Werthe von A4), wenn man v ein volles Restsystem in Bezug auf n durch- durchlaufen lässt, also z. B. v = 0, 1, 2, . . ., n — 1 setzt, und man sieht auch leicht, dass diese n Werthe alle von einander ver- verschieden sind, wenn man von dem besonderen Falle absieht, dass qp ein Vielfaches von %:n ist. Denn zwei Cosinus sind nur dann einander gleich, wenn die Summe oder die Differenz der Winkel ein Vielfaches von 2sr ist. Die Gleichung A5) sin n q> = sin qp Bn (x) bestimmt, wenn Bn (x) nicht gleich Null ist, sin qp eindeutig durch x. Suchen wir in der Gleichung A3) das von x unabhängige Glied, so ergiebt sich mit Benutzung von F) für ein gerades n n 2 (— 1)^ — 2coswqp, und für ein ungerades n — 2 cos n qp, und wenn man dies dem positiven oder negativen Product der Wurzeln gleichsetzt, so erhält man für ein gerades n A6) 2"-1 Ilcos(q) -| -J = (— l)ä — cosntp, und für ein ungerades n
478 Zwölfter Abschnitt. §.. 144. A7) 2»-1 n cos(q> -f =-^\ = cosw<p, und diese Formeln gelten, da rechts und links stetige Functionen von qp stehen, auch noch für den zunächst ausgeschlossenen Fall, wo qp ein Vielfaches von % : n ist. Hierin können wir unter dem Productzeichen vm fürv setzen, wenn -m irgend eine zu n theilerfremde Zahl ist, weil dann vm zugleich mit v ein volles Bestsystem nach dem Modul n durch- durchläuft. Sondern wir den Werth v = 0 ab, und lassen dann v sowohl die positiven als die negativen Zahlen durchlaufen, die absolut kleiner als n : 2 sind, so erhalten wir aus A7) die für jedes ungerade n gültige Formel ,1O. _„ , -L f . 1vm%\ / 2vm%\ coswqp A8) 2"-1 II cos ( qp H ) cos ( qp ) = -¦ K ' „_! V~ n ) V n ) cosqp Setzen wir hierin qp = 0 und ziehen die Quadratwurzel, so ergiebt sich A9) 2-^h cos^^ = ±l, n—i n worin einstweilen das Vorzeichen noch unbestimmt bleibt. Wenn wir aber in A8) qp in %: 2 übergehen lassen, so erhält die rechte Seite, die sich unter der unbestimmten Form 0 : 0 darstellt, den Grenzwerth (—1) 2 n, und wir erhalten wieder die Formel, die wir im §. 142 für eine Primzahl n abgeleitet haben, allgemein für jedes ungerade n n~1 v 2vm% . -,/— B0) 22 n sin—;— = ± V», «-1 11 2 und für m = 1 ist das positive Zeichen zu nehmen. Die Function _B„, die in Bezug auf x vom (n — l)ten Grade ist, verschwindet nach D), wenn wqp, aber nicht qp ein Vielfaches von % ist, also für B1) # = 2 cos—, worin h eine ganze, nicht durch n theilbare Zahl ist. Nehmen wir zunächst n gerade an, so erhalten wir alle in B1) enthaltenen verschiedenen Werthe, wenn wir für m eine beliebige zu » theilerfremde Zahl setzen und
§. 144. Theilüng des Winkels. 479. B2) h = m, 2 m, 3 m, . . ., (n — 1) m annehmen; denn es ist nur dann cos — = cos , n n wenn entweder h -\- h' oder h — h' ein Vielfaches von 2 n ist, was nicht eintreten kann, wenn h und h' beide aus der Reihe B2) genommen sind. Unter den Werthen B1) ist einer, nämlich der dem Werth h = nm : 2 entsprechende, gleich Null und die übrigen sind paar- paarweise entgegengesetzt. Hiernach ergiebt sich für ein gerades n B3) Bn(x) = x h (& — x x n / Wenn n ungerade ist, so ist B„(x) nur von x2 abhängig; also sind je zwei der Werthe B1) entgegengesetzt gleich (für h und h -|- n). Wenn man, indem man wieder m zu n relativ prim voraussetzt, h = 2m, im, 6m, . . ., {n — l)w» annimmt, so erhält man in B1) weder zwei gleiche, noch zwei entgegengesetzte Wertbe, und es ergeben sich alle von einander verschiedenen Werthe von x\ Es wird also für ein ungerades n B4) Bn(x)= n_iV .... n J ly 2 Setzen wir in dieser Formel 2vm7t w. • „ n „2vmjc , . o x = 2 cos qp, x2 = 4 A — sm2 <p), cos2 =1 — sm2 so können wir sie so darstellen: v } smqp v > ,^LlV n P woraus wieder für 95 = 0 die Formel B0) folgt. Da cos n q> bei ungeradem n verschwindet, wenn , . 2vm7t cos qp = ¦+- sm ist, so haben wir damit für diesen Fall auch die Factoren- zerlegung der Function A„(x) gefunden. Es ist für ungerades n
480 Zwölfter Abschnitt. §. 145. B6) An(x) = X A (x* — ri7C\ »-1V" n ) h 2 Die Grossen .._, . „ 2 vm% B7) « = sin2 sind also die Wurzeln einer algebraischen Gleichung vom Grade (n — 1) : 2 <X>n(x) = 0, und wir erhalten die Function <bn(x), wenn wir an Stelle der Variablen x*- in der Function An(x) : x eine neue Variable 4« setzen und durch 2"-1 dividiren. Es wird daher [Formel A1)] B8) <X>n(x) = II(x- «) "~x n "~3 |^ w (n — 3) 1 "~5 — * 2 "T^2 "" 1.2 16^ 2 ' und für B5) können wir schreiben B9) ^^ = (— lfir1 2»-1 JT §. 145. Vorzeichenbestimmung. Quadratische Reste. Wir haben im vorigen Paragraphen zwei Formeln abgeleitet, in denen noch Vorzeichen zu bestimmen waren, nämlich A) 2 2 TZ cos = ± 1, B) 2 V TT sin ^1^ = 4- worin w» relativ prim zu der ungeraden Zahl n ist, und v die Reihe der Zahlen •durchläuft. Wir wollen das Zeichen v für die Zahlen dieser Reihe hier festhalten. Jede beliebige ganze Zahl giebt bei der Theilung durch n als Rest eine der Zahlen v öder 0 oder n — v. Statt n — v können wir, wenn wir auch negative Reste zulassen, —v wählen, und wenn wir also von den durch n theilbaren Zahlen absehen,
§. 145. Quadratische Reste. ' 481 so bleibt eine der Zahlen +v als Rest. Wir nennen diese den absolut kleinsten Rest (zum Unterschied von dem kleinsten Rest im gewöhnlichen Sinne, der aus den Zahlen 1, 2, ..., n — 1 genommen ist). Es sei nun also m eine zu n theilerfremde Zahl; wir be- betrachten die Reihe der Zahlen (mv) m, 2m, 3m, . . ., ~~ m, und bilden zu jeder den absolut kleinsten Rest q: (q) ±t>i, ±v2, ±v3, ¦ ¦ ¦, ±vi(; 2 unter diesen Zahlen q kommen nicht zwei gleiche und auch nicht zwei entgegengesetzte vor; denn wenn die Summe oder die Differenz zweier Zahlen (p), also q ~\- q' oder q — q' gleich Null wäre, so müsste für zwei verschiedene Zahlen v, v' aus (v ) m (v i v') durch n theilbar sein, also müsste auch v + v' durch n theilbar sein, was unmöglich ist, da jede der Zahlen v, v' kleiner als n : 2 ist. Die Gesammtheit der Zahlen (q) stimmt also, vom Vorzeichen und von der Reihenfolge abgesehen, mit der Gesammtheit der Zahlen (v) überein. In den Formeln A) und B) können wir aber, wegen der Periodicität von Sinus und Cosinus, vm durch q ersetzen, und da cos(—qp) = cos<jp ist, so können wir in der Formel A) mv auch durch v ersetzen, d. h. das Vorzeichen ist von m nicht abhängig. Um es zu bestimmen, berücksichtigen wir, dass der Cosinus eines Winkels im ersten Quadranten positiv, im zweiten Quadranten negativ ist, dass also das Vorzeichen in A) positiv oder negativ ist, je nachdem von den Winkeln 2vtc n «ine gerade oder eine ungerade Anzahl im zweiten Quadranten liegt, oder je nachdem eine gerade oder eine ungerade Anzahl von Zahlen v zwischen — und — liegt. Wir bezeichnen, wenn x irgend eine nicht ganze Zahl ist, mit E(x) die grösste ganze Zahl, die kleiner als x ist, so dass x zwischen E(x) und E(x) -\- 1 liegt. Die Anzahl der ganzen Weber, Algebra. I. 32
482 ' Zwölfter Abschnitt. §-145. Zahlen, die zwischen zwei Zahlen x und y liegt, ist dann gleich — E{x), und wir haben also zu untersuchen, ob eine gerade oder eine ungerade Zahl ist. Wir müssen vier Fälle unterscheiden, wie sich aus der folgenden Zusammenstellung ergiebt, worin h eine nicht negative ganze Zahl bedeutet: Es ist also in A) das positive Zeichen zu nehmen, wenn n von der Form 8 h -\- 1 oder 8 7c —(— 7, das negative, wenn n von der Form 8A -j- 3 oder 8 ~k -\- 5 ist. In den ersten Fällen ist jj2. 1 ' ¦ • —-— eine gerade, in den beiden letzten eine ungerade Zahl, o . und demnach erhalten wir die genaue Formel A): C) 2T- 71 cos ^^ = ('- l)— • In der Formel B) hängt das Vorzeichen von m ab; es ist positiv oder negativ, je nachdem unter den Zahlen (q) eine gerade oder eine ungerade Anzahl negativer vorkommt. Wir setzen nun, um die Abhängigkeit des Vorzeichens von m und n in der Bezeichnung auszudrücken, für B) D) 2 2 II sm = (-- \ V», ' 2 worin ist. Das Symbol (— J ist von einer anderen Seite her und in speciellerer Fassung von Legrendre in die Zahlentheorie ein- eingeführt und von Jacobi verallgemeinert worden. Wir wollen
§. 145. Quadratische Reste. 483 es das Legendre'sche Symbol nennen. Seine Bedeutung für die Zahlentheorie wird sich gleich ergeben; zunächst haben wir den Satz: 1. Es ist (—) gleich -j-1 oder gleich —1, je nach- \n / dem die Anzahl der negativen unter den absolut kleinsten Resten von mv eine gerade oder eine ungerade ist. Für m = 1 gilt, wie wir schon gesehen haben, das positive Zeichen in der Formel B);. also haben wir, wie auch die Formel D) direct zeigt, Verwandeln wir m in —m, so ändert sich in allen Factoren des Productes auf der linken Seite von D) das Vorzeichen; da ^, j die Anzahl der Factoren —-— beträgt, so ergiebt sich 3. und für m = 1 Setzen wir 2 m für m und benutzen die Formel . ivftiit „ . Ivmit Ivmit sm = 2 sm cos , n n n so folgt aus C) und für m = 1 Aendert man »w um ein Vielfaches von w, so bleiben alle Factoren des Productes D) ungeändert, und daraus folgt: 7. Es ist wenn m = m' (mod w). Wir setzen jetzt nicht nur n, sondern auch m als ungerade und positiv voraus und wenden die Formel B9) des §. 144 an, in der wir n durch m ersetzen: 31*
484 Zwölfter Abschnitt. .§. 145. E) worin ß die sämmtlichen Wurzeln der Gleichung Q>m(x) = 0 durchläuft, die den Ausdruck /,.\ o • » 2 II 71 F) ß = sin2 —— v J m haben. Ist nun m' eine zu n theilerfremde Zahl, so durchläuft . . " . 2vmr7C G) k = sin2 die sämmtlichen Wurzeln der Gleichung #„ (x) = 0, und wenn wir in E) setzen und das Product in Bezug auf alle v nehmen, so folgt: * . 2vmm'7t Sm n (m — i) (n — i) (m—i) (n-l) a ß (9) ?-^1— = (— 1) 1 2 a JTJT (« — ß). JTsin w Die rechte Seite dieser Formel ist aber von m' ganz unab- unabhängig. Der Werth der linken Seite ist also derselbe, als ob m' = 1 wäre, und wenn man für die Producte die Werthe aus D) setzt, so folgt /m m'\ fm'\ /m\ /1 \ ( I • ( ) z= ( — 1 • ( I \ n ) \n / \nj '\nj oder Hier war zunächst vorausgesetzt, dass m und m' positiv und ungerade seien. Nach 3. und 5. aber bleibt 8. auch noch richtig, wenn m oder m' negativ oder gerade ist, wenn nur m und m' relativ prim zu n sind. Nehmen wir wieder in ungerade und positiv an, so folgt jetzt aus D) und (9) fm\ , (m-i)(n-i) (ot-1)(«-1) « ß Wenn wir hierin m mit n vertauschen, so ändert in dem Doppelproduct auf der rechten Seite jeder Factor sein Vorzeichen; alles Andere bleibt ungeändert. Die Anzahl dieser Factoren ist aber
§. 145. Quadratische Reste. 485 n — 1 m — 1 2 2 und daraus folgt 9. (a) = (- .f^v^ (*\ \nj v ' \m) oder (—) ist gleich (—), wenn von den beiden ungeraden Zahlen m, n wenigstens eine von der Form 4 fc -f- 1 ist, und ( —) ist entgegen- gesetzt zu (—-), wenn beide Zahlen von der Form 4fc -f- 3 sind. Dieser berühmte Satz ist unter dem Namen des Iieciproci- tätsgesetzes bekannt. Der hier gegebene Beweis rührt von Eisenstein her. Man kann mit seiner Hülfe und nach 5. und 6. den Werth des Symbols (—) sehr schnell ermitteln, indem man \n / so verfährt, als ob es sich um die Bestimmung des grössten gemeinschaftlichen Theilers von m und n handelte. Aus 8. und 9. ergiebt sich noch ein letzter Satz, der gilt, wenn n und n' zwei positive ungerade zu m theilerfremde Zahlen sind: () ( \n'J \nn' Seine Richtigkeit ergiebt sich, wenn m ungerade und positiv ist auf Grund der Congruenz A1) (» - 1) (n' - 1) = (nn' — 1) — (n — 1) — (ri — 1) = 0 (mod 4), wenn man auf beide Seiten von 10. die Formel 9. und dann 8. anwendet, und wenn m gerade oder negativ ist, aus 4. und 6. Nach diesen Sätzen kann man (—) auf ein Product von Werthen (—) zurückführen, worin w, q Primzahlen sind. Die Berechnung von (— j geschieht aber leichter nach 9. ohne diese Zerlegung. Wir wollen nun noch eine andere Bedeutung des Symbols (— j kennen lernen, für den Fall, dass jp eine ungerade Prim-
486 Zwölfter Abschnitt. §. 145. zahl ist, durch die ursprünglich das Symbol von Legendre ein- eingeführt ist. "Wenn wir alle durch p nicht theilbaren ganzen Zahlen x ins Quadrat erheben, und die Reste der Division durch p auf- suchen, so erhalten wir im Ganzen nur *—^— verschiedene Reste, denn erstens geben die Quadrate congruenter Zahlen die- dieselben Reste, und zweitens geben die Quadrate entgegengesetzter Zahlen auch dieselben Reste. Wir bekommen also gewiss alle n \ Reste, wenn wir die ±—-— Zahlen v (v) 1, 2, S, • • -, *^± ins Quadrat erheben. Auf der anderen Seite ergeben auch die Quadrate dieser Zahlen v lauter verschiedene Reste; denn es kann, wenn v und v' verschiedene von ihnen sind, niemals va __ v'2 — (v — i/) (V _|_ i/) durch p theilbar sein, weil sowohl v — v' als v -f- v' kleiner als p ist. Von den Zahlen (s) 1, 2, 3, . . ., p - 1 kommt also die Hälfte unter den Resten von x% vor, die Hälfte nicht. Die ersteren Zahlen und alle mit ihnen nach p con- gruenten heissen die quadratischen Reste von p, die anderen die quadratischen Nichtreste von p. Wenn nun m quadratischer Rest ist, so ist die Congruenz A2) a;2 = m (mod p) möglich, und aus 7. und 8. folgt (?)=(!*)=(§)"=+¦¦ Es ist also (— J :=: -\~ 1, wenn m quadratischer Rest von p ist. Es ist aber in §. 142, 1. der Satz ausgesprochen, dass, wenn — ) ebenso oft das positive wie das negative Zeichen hat, und daraus ersieht man, dass das negative Zeichen gilt, wenn m quadratischer Nichtrest ist, es folgt also:
§. 145. Quadratische Reste. , 487 11. Ist p eine ungerade Primzahl, und m durch p nicht theilbar, so ist (— ) = 4-1 oder = — 1, je nachdem m quadratischer Rest oder qua- quadratischer Nichtrest von p ist. Darin sind alle Hauptsätze über die quadratischen Reste enthalten, z. B. nach 8. der Satz: 12. Das Product zweier quadratischer Reste oder zweier Nichtreste ist ein Rest; das Product aus einem Rest und einem Nichtrest ist ein Nicht- Nichtrest. Nach dem Fermat'schen Satze (§. 143) ist für jede durch p nicht theilbare Zahl m mP-1 — 1 = \m 2 — l)\m 2 4- \) = 0 (mod m). Es muss also einer der beiden Factoren p — i p—i m 2 — 1, m 2 4- 1 durch p theilbar sein, und es kann auch nur einer von ihnen sein, weil sonst auch ihre Differenz, die gleich 2 ist, durch p theilbar sein müsste. Wenn nun die Congruenz A2) möglich ist, so ist p — i m 2 = xp — 1 = 1 (modjp), woraus folgt, dass alle quadratischen Reste, deren Anzahl \{p — 1) ist, Wurzeln der Congruenz x 2 =1 (modjp) sind. Da aber diese Congruenz nach §. 143 nicht mehr als | (» — 1) Wurzeln haben kann, so sind die quadratischen Nicht- Nichtreste Wurzeln der Congruenz p — i x 2 = — 1 (mod p), und hieraus folgt der für jede durch p nicht theilbare Zahl m gültige Satz von Euler p i {<wi\ A3) m 2 =(j)(moäp), oder in Worten:
488 Zwölfter Abschnitt. §. 145. 13. Die durch p nicht theilbare Zahl m ist quadrati- quadratischer Rest oder Nichtrest von p, je nachdem p—i . p—i m 2 — 1 oder m 2 -\- 1 durch p theilbar ist. Wir können noch hinzufügen, dass die quadratischen ßeste in jedem Indexsysteme gerade Indices haben, die Nichtreste ungerade. Hieraus lassen sich noch einige weitere bemerkenswerthe Folgerungen ziehen. Wir bezeichnen mit a die quadratischen Reste, mit b die Nichtreste der ungeraden Primzahl j), so dass die Anzahl der a und der & je \{p — 1) beträgt. Mit II(a) und II(p) bezeichnen wir die Producte der sämmtlichen a und der sämmtlichen b. Die a und b zusammen enthalten alle Zahlen 1, 2, . . ., p — 1, und es ist daher nach dem Wilson'- schen Satze (§. 143) A4) n(a) n(b) = — 1 (mod p). Ist &0 ein fester Nichtrest, so durchläuft boa nach 12. die sämmtlichen Nichtreste &, wenn a die sämmtlichen Reste durch- durchläuft und daraus ergiebt sich nach 13. A5) n(b) = 60~ n(a) = — JI(o) (mod p). Ferner ist, da jedes a dem Quadrate einer der Zahlen 1, 2, . . ., ±(p — 1) congruent ist A6) U(O). = (l, 2, 3, • • ., t^J (mod p). Die in dem Wilson'schen Satze vorkommenden Zahlen 1, 2, . . ., p — 1 kann man aber auch durch die Zahlen ±1» ±2, . . ., ±|(p — 1) ersetzen, und daraus ergiebt sich n 1\ 2 p +1 2, • • -, L^) = (_ j)— (mod p)t und es folgen also aus A5) und A6) die Formeln p+i p—i A7) Il(a) = (-1) * ,, n(b) = (- 1) 2 (modi>).
DEITTES BUCH. ALGEBRAISCHE GROSSEN.
Dreizehnter Abschnitt. Die Galois'sche Theorie. §. 146. Der Körperbegriff. Ein System von Zahlen wird ein Zahl kör per genannt, wenn es so in sich vollendet und abgeschlossen ist, dass die vier fundamentalen Rechenoperationen (die vier Species), die Addi- Addition, die Subtraction, die Multiplication und die Divi- Division, ausgeführt mit irgend welchen Zahlen des Systems, aus- ausgenommen die Division durch Null, immer auf Zahlen führen, die demselben System angehören. Dieser Begriff, der eine Eintheilung der Zahlenarten nach einem natürlichen Gesichtspunkte giebt, ist von Dedekind eingeführt (Dirichlet-Dedekind, Vorlesungen über Zahlentheorie, 2. Aufl. 1871, §. 159). Er ist für die Algebra von der grössten Bedeutung, und es ist nicht gleichgültig, dafür einen bezeichnenden und ausdrucksvollen Namen zu haben. Das Wort Zahlkörper ist von Dedekind nach zahlreichen Ana- Analogien gebildet, in denen das Wort Körper (corpus, corps) in ähn- ähnlicher Weise eine Vereinigung von zusammengehörigen Dingen, der eine gewisse Vollständigkeit zukommt, bedeutet. Der Begriff des Zahlkörpers kann erweitert und auf alle Grossen übertragen werden, mit denen nach den Regeln der vier Species gerechnet werden kann, insbesondere also auf rationale Functionen irgend welcher Veränderlichen. Wir nennen also einen Functionenkörper ein System von Functionen von einer oder mehreren Veränderlichen von der Beschaffenheit, dass in diesem System die Rechnungen mit den vier Species unbegrenzt ausgeführt werden können und immer
492 Dreizehnter Abschnitt. §. 146. auf eine bestimmte Function desselben Systems führen (immer mit Ausnahme der Division durch Null). Die Veränderlichen können ganz von einander unabhängig sein; es ist aber auch der Fall nicht ausgeschlossen, dass gewisse Beziehungen zwischen ihnen festgesetzt sind, die beim Rechnen zu berücksichtigen sind. Eine Function eines Functionenkörpers gilt nur dann als Null, wenn sie identisch, d. h. für alle in Betracht kommenden Werthe der Veränderlichen versehwindet. Da wir vorläufig unsere Betrachtungen nicht einschränken wollen, so werden wir jetzt von Körpern schlechtweg sprechen, und die Objecte, mit denen die Rechnungen auszuführen sind, die sowohl Zahlen als Functionen sein können, als Grossen oder auch als die Elemente des Körpers bezeichnen1). Ein Körper ist dann also ein System von Grossen von der Vollständigkeit, dass in ihm die Grossen addirt, subtrahirt, multi- plicirt und dividirt werden können. Wenn alle Grossen eines Körpers in einem zweiten Körper enthalten sind, so heisst der erste Körper ein Theiler des zweiten. Ist ein Körper & ein Theiler eines Körpers &', so werden wir auch sagen, Sl' ist ein Körper über ß. Streng genommen, bildet die einzige Zahl „Null" für sich einen Körper. Diesen wollen wir aber der Kürze wegen ein- für allemal ausnehmen. Dann ist das nächstliegende Beispiel eines Körpers der In- Inbegriff aller rationalen Zahlen. Dieser Körper ist ein Theiler von jedem anderen Körper; denn jeder Körper enthält wenigstens eine von Null verschiedene Grosse k>, also auch den Quotienten e> : k> = 1, d. h. die Zahl 1, also auch, da alle ganzen Zahlen durch Addition und Subtraction von Einern entstehen, alle ganzen Zahlen; und aus den ganzen Zahlen kann man wieder durch Division alle Brüche ableiten. Andere Beispiele von Zahlkörpern sind: der Inbegriff aller complexen Zahlen von der Form x ~\- yi-, worin i = v — 1, x und y alle rationalen Zahlen bedeuten; ferner der Inbegriff aller (rationalen und irrationalen) reellen Zahlen, oder der In- Inbegriff aller überhaupt existirenden complexen Zahlen x -\- y i. x) Vergl. des Verfassers Abhandlung: „Die allgemeinen Grundlagen der Galois'schen Gleichungstheorie". Mathematische Annalen, Bd. 43.
§. 147. Adjunotion. 493 Als Beispiel eines Functionenkörpers mag der Inbegriff aller ganzen und gebrochenen rationalen Functionen einer Veränder- Veränderlichen (mit Einschluss der Constanten) dienen, wobei man die constanten Coefficienten auf einen beliebigen Zahlkörper, etwa auf den der rationalen Zahlen beschränken oder auch ganz un- unbeschränkt annehmen kann. Wir wollen hier nicht weiter die Beispiele häufen, da die genaue Untersuchung von Körpern besonderer Art eine der Hauptaufgaben unserer späteren Ausführungen sein wird. §• 147. Adj unction. Wenn einem Körper irgend welcher Grossen, den wir mit £1 bezeichnen wollen, irgend eine Grosse « hinzugefügt wird, die nicht in ihm enthalten ist, so entsteht ein neues Grössensystem £1, «, das aber kein Körper sein wird; um daraus einen Körper abzu- abzuleiten, muss man alle Grossen hinzufügen, die sich durch die Verbindung von « mit den Grossen von £1 mittelst der Grund- Grundrechnungsarten ableiten lassen. So erhält man einen erweiterten Körper £l\ der zugleich a und £1 enthält, und der durch « und Si völlig bestimmt ist. Wir wollen ihn den Körper £1, a nennen. Dies Hinzufügen einer neuen Grosse « zu einem Körper &l heisst Adjungiren, und man sagt, der Körper £1' entsteht aus £1 durch Adj unction von «. Zu £1' kann man wieder eine Grosse «' adjungiren, und erhält einen dritten Körper £1", der dann £1, « und «' ent- enthält u. s. f. Man kann aber auch gleichzeitig zwei oder mehrere Zahlen zu £1 adjungiren, und erhält so denselben Körper £1", wenn man gleichzeitig « und a! dem £1 adjungirt. Man kann auch einem Körper einen zweiten Körper adjungiren und erhält so einen Körper, der zugleich die Zahlen der beiden Körper enthält. In dem obigen Beispiel würde man durch Adjunction des Körpers £1, «' zu dem Körper £1' = £1, « wieder denselben Körper £1" erhalten. Adjungirt man einem Körper einen seiner Theile, so entsteht kein neuer Körper. So erhält man z. B., wenn man zum Körper der rationalen
494 Dreizehnter Abschnitt. §. 148. Zahlen, der mit 3t bezeichnet sein mag, die Zahl i == V—1 adjungirt, den Körper der complexen Zahlen x-\- yi, mit ratio- rationalen %, y, den wir 3 nennen wollen. Durch Adjunction einer Variablen u zum Körper 3t erhält man den Körper, der aus allen ganzen und gebrochenen rationalen Functionen von u mit ratio- rationalen Coefficienten besteht, durch Adjunction von u und i zu 3t den Körper der rationalen Functionen von u, deren Coefficienten Zahlen in 3S sind u. s. f. Es sei schliesslich noch bemerkt, dass ein Körper von Grossen vielfach auch, nach Kronecker's Vorgang, ein Ratio- Rationalitätsbereich genannt wird. Es ist bisweilen nützlich, den Ausdruck Rationalitätsbereich für einen Körper dann zu brauchen, wenn damit ausgedrückt werden soll, dass bei einer bestimmten Aufgabe die Grossen dieses Körpers als bekannt oder rational betrachtet werden sollen. §. 148. Functionen in einem Körper. Wir haben oft Veranlassung, ganze Functionen einer Ver- Veränderlichen x A) f(x) = a0 xm + «j xm—1 + • • • + ow-i* + am zu betrachten, deren Coefficienten einem bestimmten Körper £1 angehören, und die wir in £1 enthaltene Functionen, oder kurz Functionen in £1 nennen wollen. Sie sind nicht zu ver- verwechseln rtiit Functionen, die etwa dem Körper £1 angehören, wenn £1 ein Functionenkörper ist. Im dritten Abschnitt haben wir gesehen, dass, wenn die Coefficienten a0, au . . ., am bestimmte Zahlenwerthe haben, in Wurzeln «x, «2, . . ., «m von f(x) existiren, die gleichfalls be- bestimmte Zahlenwerthe haben, unter denen aber mehrere einander gleiche vorkommen, wenn die Discriminante d (a) derFunction(l) verschwindet. Sind die Coefficienten a von f(x) unabhängige Variable, so giebt es für jedes bestimmte Werthsystem der a ein bestimmtes Werthsystem der «, und die « ändern sich stetig mit den a (§. 44). So lange wir also die Veränderung der a auf ein hinlänglich enges Gebiet beschränken, in dem solche Werthe nicht vorkommen, für welche die Discriminante A (a) verschwindet, so
§. 148. Funotiönen in einem Körper. 495 sind die m Grossen « als Functionen der a vollständig bestimmt und von einander unterschieden, wenn der Werth einer jeden von ihnen für irgend ein bestimmtes Werthsystem der a gegeben ist. Sind die a nicht unabhängige Veränderliche, sondern selbst wieder Functionen von anderen Veränderlichen, so bleibt alles dies gültig, so lange nur die Aenderungen der a nach der Stetigkeit erfolgen. Wir können also hiernach in allen diesen Fällen von den m Wurzeln einer Gleichung mten Grades sprechen, die als Zahlen oder als algebraische Functionen ihrer Coefficienten aufzu- aufzufassen sind. Wenn nun £1 ein beliebiger Körper, und fix) eine Function in £1 ist, so sind zwei Fälle möglich. Die Function f(x) ist entweder zerlegbar oder nicht zerlegbar in Factoren niedrigeren Grades, deren Coefficienten dem Körper £1 angehören. Im ersten Falle heisst die Function f{x) redu- cibel, im zweiten irreducibel in £1. Man spricht bisweilen auch, wenn der Körper £1 als bekannt und feststehend betrachtet werden kann, wenn es z. B. der Körper der rationalen Zahlen ist, schlechtweg von reduciblen oder irreducibeln Functionen, ohne die Bezeichnung „im Körper £1" ausdrücklich hinzuzufügen. Dass aber an sich die genaue Präcisirung des Körpers, auf den sich die Reducibilität bezieht, oder der als Rationalitätsbereich betrachtet wird, sehr wesentlich ist, ergiebt sich aus folgenden Bemerkungen. Eine lineare Function ist selbstverständlich in jedem Körper irreducibel. Multiplicirt man mehrere Functionen der Form A) mit einander, so entsteht eine Function derselben Form, die aber dann natürlich reducibel ist, da sie wieder in die Factoren zer- zerlegt werden kann, aus denen sie entstanden ist. Eine Function fix), die in £1 irreducibel ist, kann in einem erweiterten Körper £1', der aus £1 durch irgend eine Adjunction entsteht, reducibel werden; so wird jede Function f(x) reducibel in dem Körper £1', der aus £1 durch Adjunction einer Wurzel « von f(x) = 0 entsteht; denn es kann von f(x) ein linearer Factor x — « abgesondert werden. In dem Körper, der aus allen Zahlen besteht, ist jede Function mit Zahlencoefficienten reducibel. I. Eine irreducible Function fix)' kann mit einer anderen Function F(x), deren Coefficienten
496 Dreizehnter Abschnitt. §. 148. demselben Körper £1 angehören, keinen gemein- gemeinsamen Theiler haben, wenn nicht F(x) durch f(x) theilbar ist. Dieser Satz, der uns in der Folge noch sehr wichtige Dienste leisten wird, ist fast selbstverständlich; denn der grösste gemein- gemeinschaftliche Theiler zweier Functionen F(x) und f(x) lässt sich durch rationale Rechnung finden, und ist daher auch in £1 ent- enthalten. Da nun aber/(#) keinen in £1 enthaltenen Theiler hat als sich selbst oder eine Constante (d. h. eine in £1 enthaltene Grosse), so muss also dieser grösste gemeinschaftliche Theiler entweder eine Constante oder f(x) selbst sein. Es folgt aus diesem Satze, dass eine irreducible Function niemals mehrfache Factoren haben kann; denn sie müsste sonst mit ihrer Ableitung f'(x) einen gemeinsamen Theiler haben; also müsste fix) durch f(x) theilbar sein, was unmöglich ist, da der Grad von f'(x) niedriger ist als der von f(x). Wir können dem Satze I. auch den folgenden Ausdruck geben: II. Ist f(x) irreducibel, und verschwindet F(x) für eine Wurzel von f(x) = 0, so verschwindet es auch für alle anderen Wurzeln von f(x) = 0. Insbesondere können wir daraus schliessen: III. Ist F(x) von niedrigerem Grade, als die irre- irreducible Function f(x), und verschwindet F(x) für eine Wurzel von f(x), so muss F(x) identisch verschwinden, d. h. alle Coefficienten von F(x) müssen Null sein. Auch ganze rationale Functionen von mehreren Variablen, fix, y, s, . . .), deren Coefficienten dem Körper £1 angehören, heissen Functionen in £1. Auch diese werden als reducible und irreducible Functionen bezeichnet, je nachdem sie zer- zerlegbar oder nicht zerlegbar sind in mehrere Factoren, die selbst Functionen in £1 sind, und wenigstens einige der Variablen x, y, z, . . . wirklich enthalten. Hier ist aber auf einen Unterschied aufmerksam zu machen. Unter den Functionen von mehr als einer unabhängigen Veränderlichen giebt es solche, die überhaupt nicht in Factoren niedrigeren Grades; die rational von den Veränderlichen ab- abhängen, zerlegbar sind, die also in dem aus allen Zahlen be-
§. 149. Algebraische Körper. 497 stehenden Körper irreducibel sind, und wieder andere, die zwar zerlegbar sind, aber nur in solche Factoren, deren Coefficienten nicht in il enthalten sind, und endlich drittens Functionen, die in mehrere Functionen in il zerlegbar sind; nur die letztere Art werden wir reducibel in il nennen, während die der zweiten Art als zerlegbare} die der ersten Art als unzerlegbare Functionen bezeichnet werden. Ist z. B. il der Körper der rationalen Zahlen, so ist x2 — «/2 = (x — y) (x ~f- y) reducibel in Sl. Die Function x — 2«/2 ist zwar in die Factoren x -j- yV%, x — yV% zerlegbar, aber diese Factoren sind nicht Functionen in il. Die Function x% -j- «/2 -\- 1 endlich ist über- überhaupt nicht zerlegbar. Eine in einem Körper il irreducible, aber zerlegbare Function wird in einem erweiterten Körper reducibel. Die fundamentalen Sätze über irreducible Functionen haben wir in §. 20 kennen gelernt. Bei jenen Ausführungen war zwar zunächst, dem dortigen Standpunkte entsprechend, der Körper aller Zahlen als Rationalitätsbereich vorausgesetzt, in dem der Unterschied zwischen unzerlegbaren und irreduciblen Functionen wegfällt. * Benutzt ist aber immer nur die Reducibilität oder Irreducibilität einer Function, und die besondere Natur des Kör- Körpers il kommt nicht in Betracht. So ist also darin der Beweis des Satzes enthalten: IV. Eine reducible Function in il kann nur auf eine Art in irreducible Factoren zerlegt werden, wenn man rationale Functionen, die sich nur durch einen constanten Factor unterscheiden, als nicht verschieden betrachtet. §. 149. Algebraische Körper. Ist H ein beliebiger Körper, und F(x) eine Function in il, so heisst die Gleichung A) F{x) = 0 eine Gleichung in il. Diese Gleichung heisst reducibel oder irreducibel, je nachdem die Function F(x) reducibel oder irre- irreducibel ist. Durch Adjunction einer Wurzel « einer solchen Gleichung zu il entsteht (wenn « nicht selbst schon zu il gehört) Weber, Algebra. I. 32
498 Dreizehnter Abschnitt. §. 149. ein neuer Körper £1', den wir einen algebraischen Körper „über" £1 oder auch, wenn Zweifel über die Bedeutung aus- ausgeschlossen sind, kurz, einen algebraischen Körper nennen wollen. Wir brauchen für einen solchen Körper das Zeichen Sind ß, y, . . , Wurzeln von anderen Gleichungen in £1 oder auch andere Wurzeln derselben Gleichung, so erhalten wir durch gleichzeitige Adjunction von «, ß, y, . . . gleichfalls algebraische Körper über £1, die wir mit . ß(«, ß,y,-. •)] bezeichnen. Wir werden gleich sehen, dass diese Erweiterung des Begriffes algebraischer Körper nur eine scheinbare ist, und bleiben also zunächst bei der Adjunction einer Grosse «, also bei der Betrachtung von £l(a) stehen. Die Gleichung A), deren Wurzel « ist, kann reducibel sein. Unter den irreducibeln Factoren von F(x) ist aber wenigstens einer, der für x = « verschwindet, den wir mit f(x) bezeichnen wollen; diese Function f(x) ist, wenn wir den Coefficienten der höchsten Potenz von x gleich 1 annehmen, völlig bestimmt, weil nach dem vorigen Paragraphen x = « nicht die Wurzel von zwei verschiedenen irreducibeln Gleichungen sein kann. Die Gleichung f(x) = 0 hat also die Form B) xn -\- cixX"-1 + a2xn~2 -j- -. • • + an-xx -\- an == 0, worin «j, a2, . . ., an Grossen in £1 sind. Ist n der Grad dieser Gleichung, so nennen wir n auch den Grad des Körpers £l(a). Alle Grossen & des Körpers £l(a) lassen sich ableiten durch Addition, Subtraction, Multiplicatioh und Division aus « und aus Zahlen in £1; sie lassen sich also darstellen als rationale Func- tionen von « mit Coefficienten in £1, oder in der Form worin %(x) und ip(x) Functionen in £1 sind. Da aber ip(a) von Null verschieden sein muss, so ist ty(x) nicht durch f(x) theilbar, und da f(x) irreducibel angenommen ist, so ist il>(x) relativ prim zu fix). Danach können wir nach §. 6, Satz II. die Functionen Q (x), (p (x) in £1, und zwar cp (x) höchstens vom Grade n — 1, so bestimmen, dass D) Q (x) f(x) + (jp (x) i>(x) =
§. 150. Mehrfache Adjunotion. 499 wird, und wenn wir also hierin x = « setzen, so dass /(«) = 0 wird, so folgt Bezeichnen wir die Coefficienten von <p (x), die, wie wir ge- gesehen haben, Grossen in £1 sind, mit c0, cu . . ., c„—n so kann also jede Grosse 0 in £i(a) in der Form dargestellt werden: ® = c0 -\- d cc -j- c2«2 -f- ••--{- c»-!«»-1. Diese Darstellung ist nur auf eine Art möglich; denn ist gleichzeitig F) ® = ei + d« -f- C2«2 4 h 4-i«»-1, so verschwindet die Function (n — l)ten Grades für a; = «. Das ist aber nach dem Satze III. des vorigen Para- Paragraphen nur möglich, wenn Co = Co, Ci = Ci, . . ., £«_i = Cm_j ist. Wenn wir den Körper £1 als den gegebenen, seine Grossen als rational, den Körper Sl(a) als den daraus abgeleiteten betrachten, so bezeichnen wir eine rationale Function in £1 auch kurz als eine rationale Function, und können demnach auch sagen: Der Körper £l(a) besteht aus allen rationalen Functionen von «. §. 150. Gleichzeitige Adjunction mehrerer algebraischer Grossen. Es soll jetzt zunächst nachgewiesen werden, dass man die gleichzeitige Adjunction mehrerer algebraischen Grossen durch die Adjunction einer einzigen ersetzen kann, mit anderen Worten, dass jeder Körper ß(«, ß, y, . . .) angesehen werden kann als ein Körper £l(a). Es seien also «, ß, y, . . . algebraische Grossen in beliebiger Anzahl und A) Ä(x) = 0, ß(x) = 0, C(x) = 0,... Gleichungen in £1, deren Wurzeln # = «, x = ß-, x = y, . . . sind. Keine dieser Gleichungen soll eine mehrfache Wurzel 32*
500 Dreizehnter Abschnitt. §. 150. haben, eine Voraussetzung, durch die die Allgemeinheit nicht beschränkt wird. Dagegen ist nicht ausgeschlossen, dass unter diesen Gleichungen dieselbe mehrmals .vorkommt, wenn etwa «, ß verschiedene Wurzeln einer Gleichung sind. Wir haben im vorigen Paragraphen gesehen, dass sich jede Grosse eines Körpers S2(a) als ganze rationale Function in Sl von « darstellen lässt. Setzen wir in diesem Satze an Stelle des Körpers £2 den Körper ß(/3, y, . . .), so folgt, dass jede Zahl in £1(m, ß, y, . . .) als ganze rationale Function von « mit Coefficienten aus fi(j3, y, . . .) dargestellt werden kann; und wenn wir dieselbe Schlussweise in Beziehung auf die Coefficienten wiederholen, so ergiebt sich: Jede Grosse des Körpers Sl(a, ß, y, . . .) kann als ganze rationale Function in £1 von «, ß, y, . . . dar- dargestellt werden. Wir bilden eine lineare Function der «, ß, y, . . . f = «« -f yß + ey -j , und beachten, dass jede der Gleichungen A) nicht nur eine, sondern mehrere Wurzeln hat, deren Zahl gleich dem Grade der Gleichung ist. Ist also «', ß', y', . . . irgend eine von a, ß, y, . . . verschiedene Cpmbination von je einer Wurzel von jeder der Gleichungen A), so setzen wir: g = x«! + yß' + zy' + -.., und bilden auf die gleiche Weise f", f", . . . Die Anzahl der so gebildeten Grossen f ist, wenn a der Grad von A(x), b der Grad von B(x), c der Grad von C(x) ist u. s. f., m = aic ... Die Differenzen f — f, f — f", f' — f", . . . sind lineare Functionen von x, y, e, . . . und keine von ihnen ist identisch Null, da wir angenommen haben, dass keine der Gleichungen A) gleiche Wurzeln habe. Wir können also nach dem in §. 43 bewiesenen Satze für x, y, s, . . . solche rationale Zahlen setzen, dass keine von diesen Differenzen verschwindet, dass also die m Werthe f, f, f", . . . alle von einander verschieden sind. . Nun ist jede rationale Function, die in Bezug auf die Wurzeln jeder der Gleichungen A) symmetrisch ist, rational durch die Coefficienten dieser Gleichungen ausdrückbar, d. h. es ist eine Zahl in £1. Dazu gehören auch die Coefficienten der Function wten Grades von t:
§. 151. Primitive und imprimitive Körper. 501 B) F(t) = (t — |) (t — |0 (t - |") • • ., und F(t) = 0 ist also eine Gleichung in £1, die keine gleichen Wurzeln hat, und deren eine Wurzel § ist. Ist ferner © eine Grosse in £1 («, ß, y, . . .), also eine ganze rationale Function von «, ß, y, . . ., und bezeichnen wir mit ©', ©", ... die Grossen, die aus dieser rationalen Function hervorgehen, wenn die Variablen durch «', ß', y', ... oder «", /3", y" . . . u. s. f. ersetzt werden, so ist © ©' ©" + + + als symmetrische Function der « und der ß, . . . eine ganze rationale Function (m — l)ten Grades von t in Sl, und wenn man t = f setzt, so folgt und © ist also in £1 (f) enthalten. Da umgekehrt auch jede Grosse in ß(f) zugleich in £l{a, ß, y, . . .) enthalten ist, so sind beide Körper identisch, d. h. es ist Damit ist aber unsere Behauptung erwiesen. §. 151. Primitive und imprimitive Körper. Nach dem zuletzt bewiesenen Satze beschränken wir uns jetzt auf die Betrachtung algebraischer Körper £l(a), worin « die Wurzel einer Gleichung in £1 ist. Die Gleichung möge, von mehrfachen Factoren befreit, mit A) Fix) = 0 bezeichnet und vom Grade m sein. Ihre Wurzeln seien B) «, «!, «2, ¦ • -, «m-1- Es kann Fix) in £1 reducibel sein; dann wird es einen und nur einen irreducibeln Factor fix) von Fix) geben, so dass « eine Wurzel der Gleichung C) fix) = 0 ist. Der Grad von /(#) sei n und die Wurzeln von C), die alle unter den Wurzeln B) enthalten sind, seien D) «, «!, «2, . . ., «M_!.
502 Dreizehnter Abschnitt. §. 151. Der Grad des Körpers £2(<x) ist dann nach der in §. 149 gemachten Festsetzung gleichfalls n. Jede der Grossen D) giebt zu einem algebraischen Körper Anlass, und so entstehen die Körper E) &(«), ß(Wl), .., Ä(«n-a), die wir die mit £i(a) conjugirten Körper nennen. Es kann sein, dass diese Körper alle oder theilweise identisch sind, sie können aber auch alle von einander verschieden sein, wovon später Näheres. Nach §. 149 erhalten wir jede Grosse © in ß(«), wenn wir in einer ganzen rationalen Function % (f) in £1, höchstens vom Grade (n — 1), für die Variable t die Zahl « setzen. Setzen wir für t in % (t) die verschiedenen Grossen D), so erhalten wir n Grossen, eine aus jedem der conjugirten Körper F) © = % («), ©! = % («i), • • -, ®»-i = IM und diese heissen die mit © conjugirten Grossen. Jede symmetrische Function dieser Grossen ist zugleich eine symmetrische Function der Wurzeln der Gleichung C), und mithin in £1 enthalten. Unter diesen symmetrischen Functionen wollen wir zwei, die häufig vorkommen, durch besondere Namen und Bezeichnungen hervorheben; es ist die Summe G) 8@) = © + ©! + ©2 ~\ h ®»-I. die wir die Spur von © nennen, und das Product (8) N@) = 0 010a...0n-1, das die Norm von © heisst. Conjugirte Zahlen haben hiernach dieselben Spuren und Normen. Das Product (9) (t —#)(«-#a)-••(*¦—®»-i) = *(9 ist eine ganze rationale Function »ten Grades von i in fl und ihre Wurzeln sind © und die mit © conjugirten Grossen. Daraus ergiebt sich der Satz: 1. Jede Grosse in £l(a) ist Wurzel einer Gleichung nteu Grades in £1, deren übrige Wurzeln die mit © conjugirten Grossen sind. Die Berechnung der Function <&(£) aus f(x) ist nichts Anderes, als die von einem anderen Gesichtspunkte im vierten
§. 151. Primitive und imprimitive Körper. r Qtf6 und sechsten Abschnitt betrachtete Tschirnhausen-Trans- Tschirnhausen-Transformation. Wir haben nun die Function <$(£) auf ihre Irreducibilität zu untersuchen. Wenn die Function <J>(t) reducibel ist, so hat sie einen irre- ducibeln Factor y> (t), in dem wir den Coefficienten der höchsten Potenz von t gleich 1 annehmen können, und jeder solche Factor verschwindet wenigstens für einen der Werthe &, 0U . . ., ®TC_i. Es sei also d. h. die Gleichungen tp [% (x)~\ = 0 und f(x) = 0 haben eine gemeinsame Wurzel. Da aber f(x) irreducibel vorausgesetzt ist, so muss tp [% {xj\ nach dem Theorem II., §. 148 für alle Wurzeln os, %, os2, . . ., a,n—\ von f(x) = 0 verschwinden, d. h. es ist 9(8) = 0, 9(80=0, 9(80 = 0, ... tp (®n-i) = 0. Wenn also die mit @ conjugirten Werthe alle von einander verschieden sind, so ist (p(t) mit &(£) identisch, d. h. <&(f) ist irreducibel. Sind aber unter den mit @ conjugirten Werthen nur nx von einander verschiedene vorhanden, etwa @, @l5 ®2,..., ®ni-i, so ist A0) cp (t) = (t — &) (t — ®,) . . . (t — 0^-0, und jeder andere irreducibele Factor von <&(£) ist, da er wenig- wenigstens für einen der conjugirten Werthe &, und folglich für alle verschwinden muss, mit q>(t) identisch. Es ist also &(£) eine Potenz von tp (f), etwa A1) und A2) Daraus ergiebt sich also der Satz: 2. Die Function <&(t) ist entweder irreducibel oder sie ist eine Potenz einer irreducibeln Function. Die n mit einer Zahl in ß(«) conju- conjugirten Zahlen sind entweder alle von einander verschieden, oder sie zerfallen in % Systeme von je w2 unter einander gleichen Zahlen. Im ersten Falle ist <J>(t) irreducibel, im zweiten die n2te Potenz einer irreducibeln Function wxten Grades in Sl.
504 Dreizehnter Abschnitt. §. 151. Eine Grosse 0 in ¦£(«), die von. allen ihren conjugirten Zahlen verschieden ist, und die also einer irreducibeln Gleichung wten Grades genügt, heisst eine primitive Grosse des Körpers. Nach dem Satze §. 43, 1. lassen sich unendlich viele solche primitive Grossen bestimmen, sogar so, dass die Coeffi- cienten von @ = % (a) rationale Zahlen sind. Man braucht nur über die Coefficienten von % so zu verfügen, dass unter den con- conjugirten Grossen %{a) keine gleichen vorkommen. 3. Jede Grosse ra des Körpers £l(oc) kann rational durch eine beliebige primitive Grosse ® des Körpers ausgedrückt werden. Denn sind ca, ajj, ca2, . . ., caM_i die zu m conjugirten Zahlen, ebenso ®, @t, ®2, . . ., ®„_i die zu & conjugirten und *(*) = (* - ®) (t — ®i) • • • (* - ®—0i so ist eine ganze rationale Function n — lten Grades von t, deren Coefficienten Zahlen in Sl sind, und daraus ergiebt sich, wenn man t = & setzt, worin <P'(@) von Null verschieden ist. Es ist hiernach der Körper Sl(@) mit dem Körper £l(a) identisch. 4. Ist & nicht primitiv, so kann nicht jede Grosse in £l(oc) rational durch & ausgedrückt werden. Der Körper £l(&) ist ein Theiler des Körpers £l(a) und der Grad von Sl(@) ist ein Theiler des Grades von £l(cc). Denn jede Zahl des Körpers £l(@) genügt einer Gleichung in £1 vom Grade w15 wenn % ein Theiler von n und kleiner als n ist. Also kann eine primitive Grosse des Körpers Sl(cc), die einer irreducibeln Gleichung wten Grades genügt, nicht in £l(@) enthalten sein. Der Körper £l(oc) heisst primitiv, wenn er ausser den Grossen in Sl keine imprimitiven Grossen ent- enthält, imprimitiv, wenn er noch andere imprimitive Grossen enthält.
§. 152. Normalkörper. 505 Aus dieser Definition ergiebt sich zunächst, dass ein Körper dessen Grad eine Primzahl ist, nothwendig primitiv ist; denn eine imprimitive Grosse ® in fl («) genügt einer Gleichung, deren Grad ein von n verschiedener Theiler des Grades n von Sl(a>) ist. Wenn dieser Theiler gleich 1 ist, so ist ® in ß ent- enthalten. Wir wollen jetzt noch einige der wichtigsten Eigenschaften der imprimitiven Körper kennen lernen. Hat Sl(cc) einen von Sl verschiedenen Theiler Sl', der seiner- seinerseits Sl als Theiler enthält (ist also Sl' ein Körper über Sl), und ist ß eine Grosse, die dem Körper Sl', aber nicht Sl angehört, so ist der Körper Sl (ß) ein algebraischer Körper über Sl und zugleich ein Theiler von Sl' und von Sl («). und nach dem, was wir vorhin bewiesen haben, ist der Grad nx des Körpers Sl (ß) ein Theiler von n. Ist nun durch Sl (ß) der Körper Sl' nicht erschöpft, so nehmen wir eine Grosse y in Sl', aber nicht in Sl(ß); dann ist der Körper Sl(ß, y) ein Theiler von Sl' und von Sl(a) und hat seinerseits Sl(ß) zum Theiler. Der Grad von Sl(ß, y) ist also grösser als der von Sl(ß) und kleiner als der von Sl(a). Ist damit Sl' noch nicht erschöpft, so fahren wir so.fort, müssen aber endlich zum Abschluss kommen, da die Grade der Körper Sl (ß), Sl (ß, y), . . . immer wachsen und doch kleiner als n bleiben. Daraus folgt: 5. Jeder Theiler von Sl(cc), der den Körper Sl ent- enthält, ist ein algebraischer Körper Sl(ß) über Sl. Der Grad von Sl(ß) ist ein Theiler des Gradjes von Sl(oc), und wenn beide Körper den gleichen Grad haben, so sind sie identisch. Wir können daher unsere Definition auch so fassen: 6. Ein algebraischer Körper über Sl ist primitiv, wenn er aussei- Sl und sich selbst keinen Kör- Körper über Sl zum Theiler hat. §• 152. Normalkörper. G"alois'sche Resolvente. Ist Sl(cc) ein algebraischer Körper, so sind die conjugirten Körper Ä()
506 Dreizehnter Abschnitt. §. 152. alle von gleichem Grade, und wenn also einer von ihnen im anderen enthalten ist, so sind beide identisch. Ein Körper, der mit allen seinen conjugirten Körpern iden- identisch ist, heisst ein Normalkörper. In den Normalkörpern herrschen viel einfachere Gesetze, und der grosse Fortschritt, den die Algebra Galois verdankt, beruht im Wesentlichen darauf, dass beliebige Körper auf Normalkörper zurückgeführt werden. Die Normalkörper heissen daher auch Galois'sche Körper. Wenn ein Körper fiten Grades &(ß) die Eigenschaft hat, dass die zu q conjugirten Zahlen pl5 p2> • • ¦¦, Qp-i alle in &(p) enthalten sind, so ist SI(q) ein Normalkörper; denn dann sind die Körper &(Qi), ü(p2)i • • •> ¦&(&»—1) auch alle in £1(q) ent- enthalten und also alle mit £1(q) identisch. Wir wollen eine Gleichung eine Normalgleichung oder auch eine Galois'sche Gleichung nennen, wenn sie irreducibel ist, und die Eigenschaft hat, dass alle ihre Wurzeln rational (in £1) durch eine von ihnen ausgedrückt werden können. Dann ist ein primitives Ele- Element eines Normalkörpers ftten Grades Wurzel einer Normal- Normalgleichung ftten Grades. Aber es gilt auch das Umgekehrte, dass nämlich, wenn p eine Wurzel einer Normalgleichung ist, ü(p) ein Normalkörper gleichen Grades ist. Denn ist g0 die Wurzel der Normalgleichung, durch die alle anderen rational ausgedrückt sind, so ist sicher SI(q0) ein Normalkörper. Mit diesem ist aber &(ß) conjugirt und also identisch. Es folgt daraus noch, dass bei einer Normalgleichung jede Wurzel nicht nur durch eine bestimmte unter ihnen, sondern durch jede beliebige rational ausdrückbar ist. Man kann nun auf folgendem Wege beliebige algebraische Körper auf Normalkörper zurückführen. Es sei A) F(x) = 0 eine beliebige reducible oder irreducible Gleichung in Sl vom wten Grade, von der wir nur voraussetzen wollen, dass sie keine mehrfachen Wurzeln habe. Ihre Wurzeln seien B) a, «i, . . ., «m_L Man erhält daraus m algebraische Körper C) ß(«), £«>, ..., Sl(«._,), und man kann offenbar die Function F(x) so wählen, dass unter den Körpern C) irgend welche gegebene algebraische Körper
§. 152. Normalkörper. 507 über Sl vorkommen. Wir nennen den aus allen Grossen B), d. h. aus allen Wurzeln der Gleichung A) abgeleiteten Körper über Sl D) N = Si (cc, «!,..., am_i) den Galois'schen Körper der Gleichung F(x) = 0. Ist F(x) irreducibel, so sind die Körper C) die mit £l(cc) conjugirten Körper. In diesem Falle soll der Körper N die Norm eines jeden der Körper £l(cc), Slfoij), . . ., Sl(um^i) heissen. Ist H (cc) ein Normalkörper, so ist er mit seiner Norm iden- identisch. Im allgemeinen Falle ist nachzuweisen, dass jV ein Normalkörper ist. Wir wählen ein primitives Element q des Körpers N (nach §. 150, 151) und können dann den Körper N auch durch SI(q) bezeichnen. Ist ft der Grad von N, so genügt p einer irreducibeln Gleichung fiten Grades E) g(t) = o, von der zu zeigen ist, dass es eine Normalgleichung ist. Zu diesem Zweck bemerken wir zunächst, dass die eine Wurzel p dieser Gleichung eine rationale Function der a, «1} . . ., am_x ist, weil sie in N enthalten war. Setzen wir, um dies anzudeuten, Q = Q («, «i, • • ., «m-l), und bilden nun alle verschiedenen Anordnungen der Ziffern 0, 1, 2, . . ., m — 1, deren Anzahl H(m) beträgt: F) @, 1, 2, . . ., i» - 1), @', 1', 2', . . ., (m - 1)'), @", 1", 2", . . , (m - 1)"), . . , worin die Ziffern mit einem, zwei etc. Accenten dieselben sind, wie die ohne Accent, nur in anderer Reihenfolge, und bilden hieraus die Function en G) Q = Q («0, «i, . . ., am_!), p' = q (a0,, «!-, . . ., a(m_iy), p" = p («0"i «1") • • •, «(m —l)")j • • •) unbekümmert darum, ob darunter etwa unter einander gleiche vorkommen oder nicht. Wenn wir in allen den Anordnungen F) ein und dieselbe Vertauschung vornehmen, z. B. 0 mit 1, so ändert sich die Gesammtheit -dieser Anordnungen nicht, sondern nur ihre Reihen- Reihenfolge wird eine andere. Denn erstens kann durch eine solche Vertauschung nichts Anderes entstehen, als Anordnungen der
508 Dreizehnter Abschnitt. §. 153. Ziffern, und zweitens können nicht zwei verschiedene Anordnungen durch eine und dieselbe Vertauschung in dieselbe Anordnung übergehen. Es werden also auch durch jede solche Vertauschung die Functionen G) nur unter einander permutirt werden. Bilden wir also das Product für eine Veränderliche t, so bleiben seine Coefficienten, die gewiss Functionen von cc, au . . ., am_j sind, ungeändert, wenn diese Grossen irgendwie permutirt werden (§. 21); d. h. es sind symmetrische Functionen der Wurzeln der Function F(x), und also ist G(t) eine Function von t in Sl. Alle Wurzeln von G(f) sind Grossen in N, da sie durch die a rational ausgedrückt sind. Nun haben G(t) und g(t) eine Wurzel gemein. Da aber g(t) irreducibel ist, so muss G(t) durch g(t) theilbar sein; also sind auch alle Wurzeln von g(t) in N enthalten, d. h. N ist ein Normalkörper, w. z. b. w. Jede Gleichung g(t) — 0 heisst eine Galois'sche Resol- Resolvente der Gleichung F(x) = 0, und eine Galois'sche Resol- Resolvente ist also durch folgende Bestimmung definirt: Eine Gleichung ~'g(t) = 0 ist eine Galois'- Galois'sche Resolvente einer gegebenen Gleichung F(x) = 0 in Sl, wenn 1) g(t) irreducibel ist, wenn 2) alle Wurzeln von F(x) rational durch eine Wurzel p von g(t) ausdrückbar sind, und 3) eine Wurzel von g (t) rational durch die Wurzeln von F(x) ausdrückbar ist. Denn nach 2) ist JV^ in &(q) enthalten, und nach 3) ist einer der mit SI(q) conjugirten Körper, &(pi), in N enthalten. Die Grade von N und £1(q) können also nicht verschieden sein und folglich ist N — Sl (p). Jede Galois'sche. Resolvente ist eine Nor- Normalgleichung, und eine Normalgleichung ist ihre eigene Galois'sche Resolvente. §. 153. Die Substitutionen eines Normalkörpers. Es sei jetzt SI(q) ein Normalkörper ftten Grades und p eine seiner primitiven Zahlen, ferner
§. 153. Substitutionen eines Normalkörpers. 509 A) g(t) = 0 die irreducible Gleichung ftten Grades, deren eine Wurzel t = p ist. Die zu p conjugirten Elemente seien B) p, Qi, p2, . . ., Qft-1- Da nach der Definition des Normalkörpers die Grossen B) alle in &(p) enthalten sind, so können wir 0x0), &$(£),..., ©p—ify) als ganze rationale Functionen in Si, höchstens vom Grade ja — 1, so bestimmen, dass C) Ql = ®l(Q), p2 = &2 (p), • • •, Qfl-l = %-l(Q) wird. Ist ca eine beliebige Grosse in £1 (p), so kann man die mit ca conjugirten Grossen so darstellen: D) a> = cp(o), O3i = <p (pj), . . ., 03«-! = g)(p,(_i), worin q> (t) eine rationale Function in Sl ist. Da nun g(f) irreducibel ist, so gilt der Satz §. 148, II., den wir jetzt so aussprechen: 1. Wenn eine rationale Function &(f) in Sl eine Wurzel mit g(t) gemeinsam hat, so verschwin- verschwinden alle conjugirten Grossen Wenn in einer der Functionen ®u(q), durch die nach C) die Wurzeln von A) ausgedrückt sind, p durch eine andere Wurzel pft ersetzt wird, so entsteht daraus wieder eine der Wurzeln; denn ist so ist nach 1. auch 9 [©*(?*)] = °> und die Reihe der Grossen E) Qh, ®i(pft), ®2(Pä), -.., ®^-i (Qh) stimmt, von der Anordnung abgesehen, mit der Reihe F) Q, ®!(p), ®2(p), . ... ®„-i(q) überein. Dies wird erwiesen sein, w.enn wir zeigen, dass in E) keine zwei gleichen Werthe vorkommen. Bezeichnen wir der Uebereinstimmung halber mit @0 (q) oder @ (p) die Wurzel q selbst, so folgt aus der Gleichheit zweier der Grossen E) G) ®i(Qh)=®,(QH) nach dem Satze 1. (8) 0t(Q) = e^g),
510 Dreizehnter Abschnitt. §. 153. was aber, wenn i von Je verschieden ist, nicht möglich ist. Also sind zugleich mit den Grossen F) auch die Grossen E) unter einander verschieden. Wir können dies als Satz zusammenfassen: 2. Vertauscht man p mit pft, so geht zugleich jede mit p conjugirte Grosse in eine bestimmte andere über, und niemals zwei verschiedene in dieselbe. Wenn wir in allen Functionen von p statt p eine andere Wurzel pa setzen, so führen wir eine Substitution aus. Wir bezeichnen diese Substitution mit '<*<» = O> Qa), a = 0, 1, 2, . . ., ft — 1, wobei unter <J0 oder <J die sogenannte identische Substitution (#, p) verstanden wird, die darin besteht, dass p durch sich selbst ersetzt wird, also alle Zahlen in ü(p) ungeändert bleiben. Wenn wir in einer beliebigen der Wurzeln C) (fh = &h(o) die Substitution da ausführen, so geht pft in eine andere Wurzel pjt über, die bestimmt ist durch (9) p* = @h (Qa) = ®U ®a (p) = ®fc <» Es ist also Qic dieselbe Function von ga, wie pft von p. Eine beliebige Grosse co = cp (p) des Körpers Sl (p) geht durch die Substitution 6a in <aa = tp (pa) über. Drücken wir ra durch pft, und coa durch p* aus: so sieht man, dass ra in coa übergeht durch die Substitution A0) «a=(Qh,Qld = [Q*,@h@a(Q)], und dies ist nur ein anderer Ausdruck für die Substitution (p, pa). Hierin ist p^ eine beliebige Wurzel von g(t) und das zu- zugehörige pfc ist nach (9) durch 6a bestimmt. Man kann aber bei gegebenem 6a auch pjt beliebig annehmen, und das zugehörige p& bestimmen, indem man in %(pa) den Index h die Werthe 0, 1, 2, . . ., ft — 1 durchlaufen lässt, wobei jede Wurzel p* ein- einmal zum Vorschein kommt. Also: 3. Jede Substitution <Ja kann in der Form (pft, p^) dargestellt werden, worin entweder q% oder pjj eine beliebig gegebene der (i Wurzeln p ist, während die andere durch 6a völlig bestimmt ist.
§. 154. Zusammensetzung von Substitutionen. 5H Die Anzahl aller von einander verschiedenen Substitutionen 6a ist also, die identische Substitution mit gerechnet, gleich dem Grade des Körpers £&(q), den wir oben schon mit ft bezeichnet haben. Jede dieser Substitutionen führt die Gesammtheit der Grossen des Körpers &(p) in sich selbst über, so dass jede in eine bestimmte andere übergeht, und niemals zwei verschiedene Grossen in die gleiche [Formel G), (8)]. Wir nennen daher die 6a die Substitutionen des Kör- Körpers &((>)• Wenn ra = <p (p) im Körper £1 (p) ungeändert bleibt, wenn p durch Qa ersetzt wird, wenn also ist, so sagen wir, co erlaubt oder gestattet die Substitution (p, Qa) oder 6a. Die Grossen ra, die ausser der identischen Substitution keine Substitution 6a gestatten, sind die primitiven Elemente des Kör- Körpers &(p). 4. Eine Grosse, die alle Substitutionen 6a gestattet, ist nothwendig ein Element von Sl. Denn eine solche Grosse ist mit allen ihren conjugirten Grossen identisch, und genügt also nach §. 151 einer Gleichung ersten Grades in £1. §. 154. Zusammensetzung der Substitutionen. Wenn wir in irgend einer Function von p die Wurzel p zuerst durch pa und dann pa durch Qb ersetzen, so ist der Erfolg derselbe, als ob wir gleich von vornherein p mit Qh vertauscht hätten. Setzen wir also A) <J = (p, Qa), <J' = (Qa, Q»), ö" = (p, Qh), so ist es für das Ergebniss gleichgültig, ob wir in allen Zahlen des Körpers £1(q) zuerst die Substitution <J und dann die Substi- Substitution <J' ausführen, oder ob wir für einmal die Substitution <J" machen. 1. Wir nennen daher <J" aus <J und <J' componirt oder zusammengesetzt, und bezeichnen diese Beziehung durch die symbolische Gleichung B) 66' = 6".
512 Dreizehnter Abschnitt. §. 154. Da wir nach dem Satz 3. des vorigen Paragraphen in der Bezeichnung einer Substitution (gh, q*) das erste oder das zweite Element beliebig wählen können, so lassen sich pa, pj so aus- auswählen, dass <J, ö' zwei beliebig gegebene unter den (i Substi- Substitutionen des Körpers Si (p) sind; <J" ist aber dadurch völlig bestimmt. Ebenso ist aber auch, wenn 6 und <J" gegeben sind, tf' eindeutig bestimmt. Denn wählen wir p beliebig, so ist po durch <J völlig bestimmt und p6 durch ß", womit auch <J' = (pa, pj) gegeben ist. Ist endlich <J' und 6" gegeben, so ist <J eindeutig bestimmt, da zunächst p6 durch 6" und dann p« durch <J' be- bestimmt ist. Wir haben daher: 2. Von den durch die symbolische Gleichung <?<?' = <?" verbundenen drei Substitutionen des Körpers ß(p) können irgend zwei beliebig gegeben sein, während die dritte dadurch eindeutig be- bestimmt ist. Wir haben die Composition der Substitutionen symbolisch durch das Zeichen der Multiplication ausgedrückt. Es ist hier aber wohl auf die Reihenfolge der Factoren oder Componenten zu achten, weil <J <J' von <J' <J verschieden sein kann, d. h. bei der die Composition ausdrückenden symbolischen Multiplication gilt nicht das commutative Gesetz der gewöhnlichen Multiplication; wohl aber gilt das associative Gesetz, das sich in folgendem Satz ausspricht: 3. Sind <J, <J', <J" irgend drei der ft Substitutionen des Körpers <ß(p), so ist C) (<Jö')ö" = tf(tf'ö"). Der Beweis ist sehr einfach; denn nach dem Satze 3., §. 153 können wir pa, pj, pe so bestimmen, dass D) <J = (p, Qa), <J' = (pa, Qh), <J" = (&, pc), und dann ist tftf' = (p, Qb), F 6') 6" = (p, Qi)(Qi, Qc) = (q, pc), <J'<J" = (pa, pc), <J(<J'0") r= (p, pa)(pa, pc) = (p, pc). Wir bezeichnen daher kurz die aus den drei Substitutionen <J, ö', <J" zusammengesetzte Substitution mit tftf'tf", und können überhaupt aus beliebig vielen Componenten eine bestimmte Substitution tftfW" . . .
§. 155. Permutationsgruppen. 513 dadurch zusammensetzen, dass wir nach einander immer zwei benachbarte unter den Componenten zu einer Substitution ver- vereinigen, bis das ganze symbolische Product sich auf eine ein- einzige Substitution zusammengezogen hat. Denn wir können nach §. 153, 3. setzen ö = (?, Qa), ö' = (?o, Qb), ö" = (?6, ?c), ö'" = (?c, ?«), und erhalten immer was offenbar auf eine beliebige Anzahl von Componenten aus- ausgedehnt werden kann. Auf Grund der Eigenschaften 1., 2., 3. nennen wir die Ge- sammtheit der (i Substitutionen des Normalkörpers H(q) eine Gruppe, und zwar eine endliche Gruppe vom Grade [i. Sie heisst auch die Gruppe der Substitutionen des Körpers ) Mit der allgemeinen Theorie der Gruppen werden wir uns in späteren Abschnitten eingehend beschäftigen. §. 155. Permutationsgruppen. Im §. 152 haben wir gesehen, wie man zu einer beliebigen Gleichung in il vom Grade m A) F(x) = 0, von der nur vorausgesetzt wird, dass sie keine gleichen Wurzeln hat, einen Normalkörper Sl (p) bestimmen kann, dem alle Wurzeln von A) angehören. Wenn also die Wurzeln von A) mit B) «, «!, «2, . . ., am_! bezeichnet werden, so. ist C) U = X(Q), <*!=%! 0), • • ., «m_! = Xm-l(Q), und die % sind rationale Functionen in Sl. Setzen wir aber für q eine mit q conjugirte Grosse qu führen wir also eine Substitution ö = (q, q-,) aus, so geht jede Wurzel et, in eine bestimmte andere über, und niemals zwei ver- verschiedene in dieselbe; denn wenn ist, so ist nach §. 153, 1.: Weber, Algebra. I. 33
514 Dreizehnter Abschnitt. §. 155. d. h. x(Qi) ist aucn eine Wurzel der Gleichung A). Dass aber nicht zwei verschiedene Grossen des Körpers Q(q) durch eine Substitution ö in die gleiche Grosse übergehen können, haben wir im §. 153 schon allgemein gezeigt. 1. Eine Substitution 6 ruft also unter den Wurzeln <x eine gewisse Permutation hervor, indem jeder der Indices 0, 1, 2, . . ., m — 1 durch einen be- bestimmten anderen ersetzt wird. Dies führt uns also darauf, die Permutationen von m Ziffern 0, 1, 2, . . ., m — 1 und ihre Eigenschaften im Allgemeinen genauer zu studiren. Geht die Ziffer 0 in a0, 1 in al5 2 in a2 u- s- £» m — 1 in am_i über, so muss D) «o, Ox, a2) • • •> «m-i irgend eine andere Anordnung der Ziffern 0, 1, 2, . . ., m—1 sein. Den Uebergang von der einen zu der anderen Anordnung be- bezeichnen wir durch ein Symbol, wie /0, 1, 2, . . ., m — 1\ E) *« = ('''' und nennen diesen Uebergang eine Permutation. Die Anzahl aller möglichen Permutationen von m Ele- Elementen ist FL(m) = 1.2.3...«», worunter auch die identische Permutation /O, 1, 2, . . ., m - 1\ Vo, 1, 2, . . , m - 1/ die jedes Element an seiner Stelle lässt, mitgezählt ist. Das Symbol E) ändert seine Bedeutung nicht, wenn man die einzelnen Paare 0, 1, 2, . . ., m — 1 Oo, <*i, «2, . . ., am—i anders anordnet. Ist also &0i ^11 hi • • •) &m-l irgend eine Anordnung der Ziffern 0, 1, 2, . . ., m— 1, so können wir für E) auch setzen:
§. 155. Permutationen. . 515 F) *„ = (K 6l' ^ • • •' 6—1 \ was mit E) völlig gleichbedeutend ist. Hieraus lässt sich der sehr wichtige Begriff der Zusammen- Zusammensetzung von Permutationen ableiten. Ersetzen wir einen Index a durch einen Index b, dann b durch c, so ist der Erfolg derselbe, als wenn sogleich ä durch c ersetzt wird. Wenn wir also zwei Permutationen nach einander ausführen, so ist das Ergebniss eine bestimmte Permutation, die wir in folgender Weise darstellen können. Sind /0, 1, . . ., m - 1\ /0, 1, . . ., m — 1\ \a0, %, . . ., äW-i / V>o> t>ii ¦ ¦ •) o»-i / irgend zwei Permutationen, so können wir nach F) die zweite auch so schreiben: % = *0' ßl' ' ' ¦' a'm-1 \ bam bai, . . ., bam_1/ und wenn wir also beide nach einander ausführen, zuerst aa, sodann »6, so entsteht eine dritte Permutation, die wir aus na und %i zusammengesetzt (componirt) nennen, und die wir als symbolisches Product von %a und %j, darstellen: ».», Es ist bei dieser Zusammensetzung meist nicht die Ver- Vertauschung gestattet, da %a%i im Allgemeinen nicht mit %-baa. übereinstimmt. Aber es gilt das associative Princip, was sich in der symbolischen Gleichung (8) (%a 31s) %c = 3Ta fab ^c) = ^a ^i ^c ausspricht. Davon überzeugt man sich durch folgende einfache Ueberlegung. Wird irgend ein Index p durch %a in q, dieser durch %i in r, und r durch jte in s verwandelt, so geht p durch %a%-b in r, und q durch nhnc in s über; mithin wirdjp sowohl durch (%a%^)%<. als durch %a(ni%^) in s verwandelt. Nichts anderes aber besagt die Formel (8). Zu jeder Permution %a giebt es eine bestimmte entgegen- entgegengesetzte (inverse) Permutation, die darin besteht, dass die durch %a hervorgerufene Veränderung wieder rückgängig gemacht wird, die also, mit %a zusammengesetzt, die identische Permutation 33*
516 - Dreizehnter Abschnitt. §. 155. hervorbringt. Wir bezeichnen diese Permutation mit n~1 und wir haben, wenn %a den Ausdruck E) hat, Denn nach der Vorschrift der Zusammensetzung in G) ist „ %^ _ /0, 1, ...,»— 1 *»*« ~Vo, i,...,m- Ebenso ist aber auch a \a0, «!, . . ., am-.J was wieder die identische Permutätion ist. Es ist also die zu %—x entgegengesetzte Permutation wieder die ursprüng- ursprüngliche Permutation %a. Ist Ttattb == #ci so i^ denn es ist srjsrjjr-'sr die identische Permutation. Bezeichnen wir die identische Permutation mit 3r0, so ist also A0) %a%7X = %7~1%a == ^05 und 3r0 ist sich selbst entgegengesetzt (wodurch nicht aus- ausgeschlossen ist, dass es noch andere sich selbst entgegengesetzte Permutationen giebt). Durch die Composition mit der identischen Permutation wird keine andere Permutation geändert, also 2. Ist %c aus %a und %i zusammengesetzt, also so ist nicht nur %c aus %a lind :%, sondern auch %a aus %i und %e, und ^6 aus %a und n;,, völlig und eindeutig bestimmt. Denn es folgt aus A2) \ / Ott 3. Ein aus der Gesammtheit aller J2(m) Permu- Permutationen von m Elementen herausgegriffenes System Q = %, % , % , 3T . . ., das so in sich abgeschlossen und vollendet ist, dass je zwei und folglich auch beliebig viele Permutationen von Q durch Zusammensetzung
§. 156. Galois'sche Gruppe. 517 immer wieder eine Permutation desselben Systems ergeben, heisst eine Permutationsgruppe. Unter dem Grad einer Permutationsgruppe verstehen wir die Anzahl der Permutationen, die sie ent- enthält. Die Gesammtheit aller II(in) Permutationen bildet eine solche Gruppe. Ebenso ist die einzige identische Permutation eine Gruppe für sich. Was zwischen diesen beiden extremen Fällen von Gruppen noch liegen kann, das wird uns in den folgenden Abschnitten beschäftigen. Als einfaches Beispiel möge hier nur noch die Gruppe der cyklischen Permutationen, kurz die cyklische Gruppe, angeführt werden, die man erhält, wenn man in irgend einer Anordnung von Ziffern A, 2, 3, . . ., w) jede Ziffer durch die folgende und die letzte durch die erste ersetzt, und wenn man diese Permutation so oft wiederholt, bis man zu der ursprüng- ursprünglichen Anordnung zurückkommt. Der Grad der cyklischen Gruppe ist gleich der Anzahl der Ziffern; z. B. bei den drei Ziffern: /l, 2, 3\ /l, 2, 3\ /l, 2, 3\ V2, 3, 1/ \3, 1, 2/ \1, 2, 3/ Es giebt besondere Gruppen, die uns später noch mehr beschäftigen werden, die nur aus solchen Permutationen bestehen, bei deren Zusammensetzung ausser den oben erwähnten auch noch das commutative Gesetz gilt, bei denen also immer %x%% = %%%!_ ist, und in Folge dessen die Analogie mit der Multi- plication eine viel vollständigere ist. Solche Gruppen, zu denen die cyklischen Gruppen gehören, heissen commutative oder Abel'sehe Gruppen. Wenn die sämmtlichen Elemente einer Permutationsgruppe Qx in einer Gruppe Q enthalten sind, so heisst Qx ein Theiler von Q, und Q durch Qx theilbar. §. 156. Galois'sche Gruppe. Wenn wir in den Wurzeln cc, a,^ a2, ...,«„,_! einer Gleichung F(x) = 0, wie sie durch §. 155, C) als Grossen des Normal- körpers £1 (q) vom ftten Grade ausgedrückt sind, eine der (i Substi-
518 Dreizehnter Abschnitt. §. 156. tutionen 6 des Normalkörpers ausfuhren, so vollzieht sich unter diesen Wurzeln eine gewisse Permutation, wie schon oben gezeigt ist. Es entspricht also jeder Substitution ö eine gewisse Permu- Permutation % der m Ziffern 0, 1, 2, . . ., m — 1. Zwei verschiedene Substitutionen öft, öfc führen auch zu zwei verschiedenen Permutationen ith, 3% Denn nach §. 152 ist q eine rationale Function von «, ccu ..., «TO_1, die wir durch q = 0 («, «!, . . ., am_i) bezeichnen wollen. Wenn wir hierin «s = X>(Q) setzen, so folgt A) ? = *[*(?), Zi (?).•• Z»-i(?)], und nach §. 153, 1. ist also für jeden Index fc B) Qk = Q\x(jtt), Xi(Qk) ¦ • ¦ Zm-ifoi)]. Wenn nun die Substitutionen 6h, 6h dieselbe Permutation unter den a hervorrufen, so ist für jeden Index s = 0, 1,..., m — 1 Xs(Qh) = Xs(Qk), und daraus folgt nach B), dass auch 6h = 6* sein muss. Wird durch die Substitution 6h die Permutation %h unter den Wurzeln von F(x) = 0 hervorgerufen, so sagen wir, dass die Permutation %% der Substitution 6h entspricht. Jeder Substitution entspricht eine bestimmte Permutation, und die Anzahl dieser Permutationen ist also, die identische Permutation mitgerechnet, die der identischen Substitution ent- entspricht, gleich [i. Wenn den Substitutionen 6h und öjt die Permutationen %h und jrfc entsprechen, so entspricht der zusammengesetzten Substitution öfcöfc die zusammengesetzte Permutation %h%u- Denn die Permu- Permutationen sind das Ergebniss der entsprechenden Substitutionen auf gewisse Grossen des Körpers &(q), und dabei ist es gleich- gleichgültig, ob wir zwei Substitutionen nach einander oder mit einem Male die aus beiden zusammengesetzte Substitution ausführen (nach §. 154). Wir haben also den Satz: I. Es entsprechen den jt Substitutionen des Kör- Körpers £1 (q) C) ¦ Ö, Ö!, ö2, . . ., 6fl_1, [i Permutationen von m Ziffern D) 3t, 3t!, 3T2, . . ., 3t,»_i
§. 156. Galois'sche Gruppe. 519 in der Weise, dass der aus zwei Substitutionen zusammengesetzten Substitution die aus den ent- entsprechenden Permutationen zusammengesetzte Permutation entspricht Daraus folgt aber, dass die Permutationen D) eine Gruppe bilden. Wir bezeichnen diese Gruppe mit P und nennen sie die Galois'sche Gruppe der Gleichung F(x) = 0, oder auch die Galois'sche Gruppe eines jeden der Körper &(«), Diese Gruppe steht zu der Gruppe der Substitutionen des Körpers &(q) in der durch den Satz I. ausgedrückten Beziehung, weshalb die beiden Gruppen isomorph genannt werden. Um die charakteristischen Eigenschaften der Galois'sehen Gruppe zu. finden, haben wir nur die Sätze §. 153, 1. bis 4. etwas anders auszudrücken. Wir sagen von einer Function der m Wurzeln, die bei irgend einer Permutation ungeändert bleibt, sie gestatte diese Permutation, und erhalten so: xa) Jede rationale Gleichung in £1, die zwischen den m Wurzeln von F(x) besteht, bleibt richtig, wenn die Wurzeln irgend einer Permutation der Galois'schen Gruppe unterworfen werden. b) Jede rationale Function in Si von den m Wurzeln von F(x), die sämmtliche Permutationen der Galois'schen Gruppe gestattet, ist eine Zahl in £1. Denn drücken wir die Wurzeln von F(x) als rationale Func- tionen von q aus, so geht eine Function der Wurzeln u in eine Function 9(9) über. Hat man zuvor eine Permutation der Ga- Galois'schen Gruppe ausgeführt, so erhält man eine der conjugirten Zahlen <p (Qa), die aus (p (q) durch eine Substitution 6a = (9, Qa) entsteht. Ist nun q> (q) = 0, so sind nach dem Satz §. 153, 1. auch alle conjugirten q> (ga) = 0, womit a) bewiesen ist; und sind die conjugirten Grossen 9 (Qa) alle einander gleich, so ist ihr gemeinsamer Werth nach §. 153, 4. in Sl enthalten, wodurch b) bewiesen ist. Zu a), b) kommt noch als Drittes: c) Wenn irgend eine Permutation % der Wurzeln von F(x) auf alle rationalen Gleichungen in il, die zwischen den Wurzeln bestehen, anwendbar ist, so gehört % der Galois'schen Gruppe an, und
520 Dreizehnter Abschnitt. §. 156. die Galois'sche Gruppe kann daher auch erklärt werden als der Inbegriff aller Permutationen, die auf sämmtliche rationale Gleichungen zwi- zwischen den Wurzeln anwendbar sind. Denn nach §. 43 kann man q als rationale (z. B. lineare) Function der m Grossen «, ax, «2, . . ., «m_i so annehmen, dass alle II(m) Werthe, die man durch die U (m) Permutationen der et, daraus erhält, von einander verschieden sind. Ist dann g(t) = 0 die Galois'sche Resolvente von F(x) = 0, deren Wurzel dieses q ist, so ist 9(9) = 0. Hierauf können wir, wenn q durch die Wurzeln et, aus- ausgedrückt ist, nach Voraussetzung die Permutation % anwenden und erhalten also, wenn dadurch q in Qa übergeht, g(Qa) = 0; d. h. Qa ist auch eine Wurzel der Eesolvente, und die Permutation % entspricht also einer Substitution (p, Qa) des Körpers &{q), d. h. % gehört zur Galois'sehen Gruppe. Daraus schliessen wir noch auf folgenden wichtigen Satz: d) Ist P eine Gruppe von Permutationen der mWur- zeln «, der die Eigenschaften a) und b) zukommen, so ist P die Galois'sche Gruppe der Gleichung F(x) = 0. Denn zunächst gehört nach c) jede Permutation von P der Galois'sehen Gruppe an, und P ist also gewiss ein Theiler von dieser. Wenn aber P nur v Permutationen umfasst, so mögen diese mit E) »x, 3T2, . . ., Ttv bezeichnet sein. Wenden wir diese Permutationen auf q an, so möge sich ergeben: F) qu p2, . . ., qv. Wenden wir eine der Permutationen E), etwa itk, auf eine der Grossen F), etwa auf Qt an, so ist der Erfolg derselbe, als ob %i%it auf q angewandt worden sei; das Ergebniss dieser Per- Permutation soll Qi sein. Nun liegt aber in der Voraussetzung, dass P eine Gruppe sei, dass auch die componirte Permutation jtiJtk zu P gehört, dass also & unter den Grossen F) enthalten sei. Zugleich ist g'i nach §. 153, 2. von Q'h verschieden, sobald p» von Qh verschieden ist. Daraus folgt, dass die Grossen
§. 156. Galois'sche Gruppe. 521 G) q'v 9'2, . . ., q'v mit den Grossen F), von der Ordnung abgesehen, übereinstimmen. Das Product gf(t) = (t — Ql) (t — Q2)...(t- Qt) bleibt also durch die Permutationen der Gruppe P ungeändert, und ist folglich, da wir die Eigenschaft b) von P voraussetzen, eine rationale Function von t in Sl. Zugleich ist g'(t) ein Theiler von g(t) und muss daher, da g(i) irreducibel ist, mit g{t) über- übereinstimmen, also ist v nicht kleiner als der Grad der Galois'- sehen Gruppe und P ist mit der Galois'sehen Gruppe identisch. Wählen wir, wie oben, die Grosse q als rationale Function der a so, dass die II(m) durch die Permutationen der u sich ergebenden Grossen 9, 9', 9" ¦•' alle von einander verschieden sind, so ist G(t) = (t-Q) (t-Q') (t-Q")... eine Function in iß. Nun ist jede von den Grossen q, q', q" . . . eine primitive Grosse des Normalkörpers N = Sl(<x, mu ..., am_i), und jede von ihnen ist also die Wurzel einer Galois'sehen Eesolvente (iten Grades. Je (i von diesen Grossen sind die Wur- Wurzeln von einer solchen Gleichung. Es muss also G(t), was keine gleichen Wurzeln hat, in lauter irreducible Factoren (iten Grades zerfallen, und daraus ergiebt sich noch, dass (i ein Theiler von II(m) ist. Zugleich ist ft der Grad der Galois'schen Gruppe von F(x). Hat der Grad der Galois'schen Eesolvente einer Gleichung mten Gra(Jes den grössten Werth J7(m), so sagen wir, mit einem von Kronecker herrührenden Ausdruck, die Gleichung hat keinen Affe ct. Sie hat einen um so höheren Affect, je niedriger der Grad (i der Galois'schen Eesolvente ist. Den Quotienten J7(m):(t, der immer eine ganze Zahl, höchstens gleich n(m) und mindestens gleich 1 sein muss, wollen wir den Grad des Affe et es nennen, der also bei einer Gleichung ohne Affect den Werth 1 hat. Wenn der Affect den möglichst hohen Grad II(m) hat, dann sind die Wurzeln der Gleichung selbst im Eationalitäts- bereich Sl enthalten, die Gleichling also gelöst. Wenn durch Adjunction einer algebraischen Grosse zu £1 die Galois'sche Eesolvente reducibel wird, so entsteht eine neue Eesolvente niedrigeren Grades, und der Grad des Affects der
522 Dreizehnter Abschnitt. §. 156. Gleichung F(x) = 0 vergrössert sich. Man nähert sich also dadurch der Lösung der Gleichung. Die Galois'sehe Auffassung der Aufgabe, eine Gleichung F(x) = 0 zu lösen, besteht darin, dass durch auf einander folgende Adjunction von algebraischen Grossen möglichst einfacher Art die Gruppe allmählich verkleinert, oder der Affect erhöht werden soll, bis er seinen höchsten Grad erreicht hat. Die allgemeine Gleichung mten Grades hat in dem Körper £1, der aus den rationalen Func- tionen der Coefficenten al5 a2, . . ., am besteht, keinen Affect. Denn die als unabhängige Variable betrachteten Coefficienten «!, a2, ¦ . ., am können auch dargestellt werden als die symme- symmetrischen Grundfunctionen der Wurzeln «, a1( a2, . . ., aOT_i. Ist dann g(t) ein rational durch die a ausgedrückter, irreducibler Factor von G(t), der für t ¦= q verschwindet, so erhält man, wenn man a* und q durch die et, darstellt, in g(g) = O eine identische Gleichung. In dieser können aber die a beliebig per- mutirt werden, wodurch sich die a nicht ändern, während q in jede der Wurzeln g, q', q" . . . von G(t) übergehen kann. Es verschwindet also g (t) für alle Wurzeln von O (t) und muss folglich mit G(t) übereinstimmen1). x) fivariste Galois ist im Jahre 1832, kaum 20jährig, im Duell ge- gefallen. Die erste Andeutung über die Theorie, die heute seinen Namen trägt, findet sich in einer 1830 im „Bulletin des sciences mathem." von Ferussac erschienenen Abhandlung „Analyse d'un memoire sur la resolu- tion algebrique des equations". Ausführlichere Mittheilungen enthält der berühmte, am Yorabend seines Todes geschriebene Brief an Auguste Chevalier, der in der „Kevue encyclopedique" vom September 1832 veröffentlicht ist. Erst im Jahre 1846 hat Liouville die sämmtlichen schon veröffentlichten Arbeiten von Galois nebst einigen Untersuchungen aus dem Nachlass, darunter die wichtigste: „Mem. sur les conditions de resolubilite des equations par radicaux" in Bd. XI seines Journals ab- abdrucken lassen. Eine deutsche Ausgabe von Maser ist 1889 erschienen (BerlinJ bei Springer). Interessante biographische Mittheilungen finden sich in der „Revue encyclopedique" vom September 1832, die Liouville nicht mit abgedruckt hat und die auch in der deutschen Ausgabe fehlen. Eine ausführliche Biographie von M. P. Dupuy findet sich in den „Annales de l'ecole normale superieure". Ton weiteren Schriften, die zum Verständ- niss oder zur Weiterbildung der Galois'schen Theorie beigetragen haben, seien noch erwähnt: J. A. Serret („Cours d'algebre superieure", II. Aus- Ausgabe, 1854, IT. 1879); Betti („Annali di scienze fisiche e matematiche") A853); C. Jordan, „Traite des substitutions" A870). E. Netto, „Sub- stitutiönentheorie" (Leipzig 1882).
§. 157. Transitive und intransitive Gruppen. 523 §. 157. Transitive und intransitive Gruppen. Aus der Galois'sehen Gruppe P können wir ein sehr ein- einfaches Kennzeichen dafür herleiten, ob die Gleichung F(x) = 0 reducibel oder irreducibel ist. Nehmen wir an, es sei F (x) vom Grade m reducibel und f(x) ein Factor von F(x) in £1 vom Grade n, und n sei kleiner als m. Es mögen die Wurzeln von f(x) A) es, «j, «a, . . ., «M_i sein, die übrigen Wurzeln von F(x) B) On, «n + i, . . ., «m_i. Ist es' irgend eine der Grossen A), es" eine der Grossen B), so kann in der Gruppe P keine Permutation vorkommen, durch die es' in es" übergeführt wird; denn nach Voraussetzung ist /O') = o, und wenn nun in P eine Permutation vorkäme, durch die es' durch es" ersetzt würde, so müsste wegen der Eigenschaft §.156, a) auch / (es") — 0 sein, was unserer Annahme widerspricht. Es werden also durch die Permutationen von P die Wurzeln A) vonf(x) nur unter einander permutirt. Wenn umgekehrt die Gruppe P die Eigenschaft hat, dass ihre Permutationen einen Theil der m Wurzeln a wie das System A) nur unter einander vertauschen, so gestattet das Product (x — es) (x — esj) . . . (sc — es„_i) =f(x) alle Permutationen von P, und ist also nach §. 156, b) in £1 ent- enthalten; d. h. F(x) ist reducibel. Man nennt eine Permutationsgruppe transitiv, wenn sie wenigstens eine Permutation enthält, die ein beliebiges Element in ein beliebiges anderes überführt; im entgegengesetzten Falle, wenn also die Elemente so in zwei oder mehr Partien zerlegt werden können, dass durch keine Permutation der Gruppe ein Element der einen Partie in ein Element der anderen übergeht, heisst die Gruppe intransitiv. Demnach können wir das Be- Bewiesene in dem Satze zusammenfassen: 1. Die Gleichung F(x) = 0 ist reducibel oder irre- irreducibel, je nachdem die Galois'sche Gruppe in- intransitiv oder transitiv ist.
524 Dreizehnter Abschnitt. §. 158. Wenn ein Theil der Elemente so zusammenhängt, dass durch Permutationen aus P jedes Element dieses Theiles in jedes andere übergehent kann, so nennen wir die Elemente dieses Theiles transitiv verbunden. Die verschiedenen transitiv ver- verbundenen Systeme, die durch alle Permutationen von P nur unter einander permutirt werden, heissen die Systeme der Intransitivität. §. 158. Primitive und imprimitive Gruppen. Es sei jetzt f(x) = 0 eine irreducible Gleichung nten Grades, also ihre Galois'sche Gruppe P transitiv. Die "Wurzeln von f(x) seien A) «, «i, «2, • • ••> «n-l- Wenn der Körper £l(a) imprimitiv ist (§. 151), und © = %(«) ein imprimitives Element, dessen conjugirte Werthe in s Systeme von je r unter einander gleichen zerfallen, so dass n = r s und i1 > 1, s < « ist, so lassen sich die Werthe A) in s Reihen von je r Elementen zerlegen, die wir mit A = «,«!,.. ., ar_x /¦2-\ B = ß, ßl, ¦ ¦ ., ßr-X bezeichnen wollen, so dass 0 =z(a) die conjugirten Werthe von 0 sind. Nach §. 151 ist dann (t —0)(t—01)...(t- e._0 = tp(t) eine irreducible Function in Si, vom Grade s in Bezug auf t, deren Wurzeln die Werthe C) sind. Es ergiebt sich nun aus C), dass die Gruppe P so beschaffen sein muss, dass alle ihre Permutationen die Elemente der ein- einzelnen Reihen A, B, . . . S nur unter einander vertauschen und ausserdem die ganzen Reihen A, B, . . . S mit einander ver-
§. 158. Primitive und imprimitive Gruppen. 525 tauschen, so dass niemals an Stelle von zwei Elementen derselben Reihe zwei Elemente verschiedener Reihen treten. Denn wenn etwa durch eine Permutation n von P, « und e^ in ß und ö übergeführt würden, so würde folgen, da man die Permutation % [nach a), §. 156] in der Gleichung %(a) = %(a1) ausführen darf, dass auch % (ß) = % (ö) sein müsste, was der Annahme wider- widerspricht, dass die Werthe C) von einander verschieden sind. Permutationsgruppen P, die diese Eigenschaft haben, dass näm- nämlich die permutirten Elemente sich so in Reihen A, B, ... S von gleich vielen Elementen zerlegen lassen, dass durch keine Permutation von P zwei Elemente derselben Reihe in Elemente verschiedener Reihen übergehen, heissen imprimitiv. Die ein- einzelnen Reihen A, B . . . S heissen die Systeme der Im- primitivität. Permutationsgruppen, bei denen eine solche Zerlegung der Elemente nicht möglich ist, heissen primitive Gruppen. Es kann sehr wohl vorkommen, dass eine Gruppe in mehr- mehrfacher Art imprimitiv ist, dass sie ganz verschiedene Systeme der Imprimitivität besitzt. So ist z. ß. die Gruppe der cyklischen Permutationen von sechs Elementen A, 2, 3, 4, 5, 6) in doppelter Weise imprimitiv und hat die Systeme der Imprimitivität A = 1, 3, 5, B = 2, 4, 6 und A = 1, 4, B=2,5, C = 3, 6. Nachdem also der Begriff der primitiven und imprimitiven Gruppen festgestellt ist, können wir dem oben Bewiesenen den Ausdruck geben: 1. Ein imprimitiver Körper hat eine imprimitive Gruppe. Es ergiebt sich aus der Imprimitivität der Gruppe für die imprimitiven Körper ein wichtiges Resultat. Wir wollen mit 1> (x, «!,..., av-i) eine rationale symmetrische Function der r Veränderlichen x, Xi, . . ., äv_i bezeichnen und setzen ra = ip («, «!, . . ., a,._i) D) «1 = * 05, ßi, • ¦ ; ßr-l) ras_i = $ (ö, öj, . . ., 6r-i);
526 Dreizehnter Abschnitt. §. 158. dann ist zu beweisen, dass ra rational durch & ausgedrückt werden kann, d. h. im Körper £1 (©) enthalten ist. Es ist nämlich eine ganze rationale Function von t, deren Coefficienten rationale Functionen der «, «!,..., a„—1 sind, die ungeändert bleiben, wenn irgend eine Permutation der Gruppe P vorgenommen wird, weil durch diese Permutationen die m entweder ungeändert bleiben, oder in derselben Weise wie die ® mit einander permu- tirt werden. Nach §. 156, b) sind diese Coefficienten also in £1 enthalten. Setzen wir dann in E) für das unbestimmte t den Werth ® ein, so folgt, da cp' (©) von Null verschieden ist, Wenden wir dies an auf die Coefficienten des Productes G) (w — «) (w — «,)...(« — a,._i) = <jP (u, ©), wo u eine Variable bedeutet, so ergiebt sich, dass diese Function rten Grades, deren Wurzeln die «, «j, . . ., «r_! sind, rational durch ® ausgedrückt werden kann. Es ist also die Grosse a, die ursprünglich Wurzel einer Gleichung wteI1 Grades in £1 ist, zugleich Wurzel einer Gleichung rten (Grades, deren Coefficienten rational von der Wurzel einer Gleichung sten Grades abhängen. Eine Gleichung f(x) — 0, deren Wurzel a diese Eigenschaft hat, nennt man eine imprimitive Gleichung. Wir können das Bewiesene auch so ausdrücken: 2. Der imprimitive Körper £1(k) vom nten Grade geht durch Adjunction des Körpers sten Grades £1' = £l{®) zu £1 in einen Körper £1'(a) vom rten Grade über. Wir wollen noch untersuchen, ob die Imprimitivität der Gruppe ein ausreichendes Kennzeichen für die Imprimitivität des Körpers ist, ob man also in einem Körper £l{a) mit imprimitiver Gruppe immer imprimitive Elemente finden kann. Sei also jetzt f (x) = 0 eine irreducible Gleichung wten Grades mit imprimitiver Gruppe, und seien A) die Wurzeln dieser Gleichung, die so in die Reihen B) zerlegt sind, dass die
§. 158. Imprimitive Körper. 527 Elemente dieser Reihen durch die Permutationen der Gruppe nicht von einander getrennt werden. Wir wählen irgend eine symmetrische Function ty (x, a^,..., «V-i) so, dass die Werthe y =ip(a, «j, . . ., «r_i) (g) Vx = * (/5, ßl, • • -, ßr-l) ya-! = ^ (Ö, <*!, . . ., Ör-1) alle von einander verschieden sind. Um die Möglichkeit hiervon einzusehen, können wir z. B. 4, («, 29 = (* -/*)(*- setzen, und dann lässt sich (nach §. 43, 1.) für t ein solcher rationaler Werth finden, dass diese Grossen alle von einander verschieden ausfallen. Diese Werthe können also für die y in (8) genommen werden. Wenn wir nun unter u eine unabhängige Variable ver- verstehen und A0) 9»(«) = (« —y) (« — Vi)" • («—y.-i) setzen, so ist g> (m), da seine Coefficienten durch die Permutationen der Gruppe ungeändert bleiben, eine Function in iß, deren Wur- Wurzeln die Grossen y sind. Sie ist überdies irreducibel, denn aus der vorausgesetzten Transitivität der Gruppe folgt, dass, wenn eine rationale Function von y für einen der Werthe (8) verschwindet, sie auch für alle anderen verschwinden muss. Ist m irgend eine symmetrische Function der «,«!,..., «,._i, so schliessen wir aus der Betrachtung des Ausdruckes der eine ganze rationale Function von m in ß ist, ganz wie oben, indem wir u = y setzen, dass m rational durch y dargestellt werden kann, und demnach kann auch die Function A1) Tp(t,Ä) = ip(t,y), deren Wurzeln die Grossen «, «x, ,..,«,._! sind, rational durch y ausgedrückt werden. Auch die Gleichung ip (t, Ä) = 0 ist irrreducibel in
528 Dreizehnter Abschnitt. §. 158. dem Körper &(y); denn ist il>l (t,y) ein rationaler Theiler von ip (t, y), und ist i>i («, y) = 0, so können wir wegen der Transitivität der Gruppe auf diese Gleichung eine Permutation anwenden, durch die « in eine beliebige Grosse der Reihe A übergeht, wodurch y ungeändert bleibt; es ist also jede Wurzel von ty (t,y) zugleich Wurzel von rpi (t, y) und also sind beide Functionen identisch. Es ist also die Gleichung nten Grades / (x) = 0 imprimitiv in dem oben festgesetzten Sinne, d. h. eine Wurzel a dieser Gleichung kann betrachtet werden als Wurzel einer Gleichung rten Grades, deren Coefficienten von der Wurzel y einer Glei- Gleichung sten Grades abhängen. Um zu beweisen, dass dann auch der Körper £1 («) (in dem Sinne des §. 151) imprimitiv ist, haben wir noch nachzuweisen, dass es in Sl («) Grossen giebt, die einer irreducibeln Gleichung sten Grades genügen. Wir werden nachweisen, dass y selbst eine solche Grosse ist, dass also y rational durch a allein darstellbar ist. Dies ist aber sehr einfach zu schliessen. Nach A1) ist A2) i, («, y) = 0, während ^(a,2/i), ..., ^(a,i/s_i) von Null verschieden sind. Denn wäre etwa tp (a, yi) = 0, so wäre a eine Wurzel der Gleichung y*™ Grades i\> (t, y^) = 0, deren Wurzeln ja die von « verschie- verschiedenen Grossen ß, ßu . . ., ßr-\ sind. Es haben also die beiden Gleichungen A3) ip («, w) — 0, <p (u) = 0 eine und nur eine gemeinsame Wurzel u = y. Der grösste gemeinschaftliche Theiler dieser beiden Functionen ist daher in Bezug auf u linear, und er giebt y rational durch die Coeffi- Coefficienten von cp(u) und i\>(a,u), also rational durch «. Damit ist die Umkehrung von 1. bewiesen: 3. Ein primitiver Körper hat eine primitive Gruppe.
Vierzehnter Abschnitt. Anwendung der Permutationsgruppen auf Gleichungen. §. 159. Wirkung der Permutationsgruppen auf Functionen von unabhängigen Veränderlichen. Für ein tieferes Eindringen in die Algebra ist nach den Ergebnissen des vorigen Abschnittes ein genaueres Studium der Permutationsgruppen erforderlich. "Wir stellen zunächst einige allgemeine Sätze darüber auf, die für das Folgende die Grund- Grundlage bilden!). Es sei A) «i, u2, . . ., um ein System von einander unabhängiger Zeichen (Veränderliche) und B) ip («i, w2, . . ., um) eine ganze rationale Function von ihnen mit Coefficienten aus einem beliebigen Körper. Als gleich sind zwei solche Functionen ip nur dann zu betrachten, wenn in den nach Potenzen und Producten der u geordneten Ausdrücken entsprechende Glieder die gleichen Coeffi- Coefficienten haben. *) Für die Theorie der Permutationen sind besonders hervorzuheben: Cauchy, „Journal de l'Ecole polytechn. X. cah. A815)" (mehrere Abhand- Abhandlungen). C. Jordan, „Traite des substitutions et des equations alge- briques", Paris 1870. Netto, „Substitutionentheorie und ihre Anwendung auf die Algebra." Leipzig 1882. Weber, Algebra. I. 34
530 Vierzehnter Abschnitt. §. 159. Wenn wir die Indices der Variablen w, oder was damit gleichbedeutend ist, die u selbst einer Permutation % unterwerfen, so kann die Function tp sich ändern oder sie kann ungeändert bleiben. Bleibt sie ungeändert, so sagen wir, sie gestatte die Permutation %. Gestattet sie alle II(m) überhaupt möglichen Permutationen, so ist sie symmetrisch und kann durch die sym- symmetrischen Grundfunctionen ausgedrückt werden (§. 48). Der andere extreme Fall ist der, dass die Function für alle TL(m) Anordnungen lauter verschiedene Werthe annimmt. Im All- Allgemeinen werden gewisse Permutationen die Function ip unge- ungeändert lassen, andere werden sie ändern. Wir stellen nun den Satz auf: 1. Der Inbegriff aller der Permutationen der uu wä,..., Mm, die eine ganze Function ^(u^ %>••¦, ««) ungeändert lassen, ist eine Gruppe von Per- Permutationen. Um ihn zu beweisen, nehmen wir an, es sei % eine der Per- Permutationen, die tp ungeändert lässt, was wir durch i> = 4>7t ausdrücken. Da nun die u unabhängige Variable sind, so muss diese identische Gleichung richtig bleiben, wenn die Variablen irgend einer Permutation %' unterworfen werden. Wenn aber %' auf ip„ angewandt wird, so ist das Ergebniss dasselbe, als wenn die zusammengesetzte Permutation %%' auf ip angewandt wird. Es folgt also: und wenn nun ip = ip„, ist, so folgt: d. h. wenn die Function ip durch die Permutationen % und %' ungeändert bleibt, so bleibt sie auch durch %%' ungeändert, wodurch nach der Definition der Gruppe der Satz, den wir aus- ausgesprochen haben, bewiesen ist. Wir haben darin ein Mittel, um Permutationsgruppen zu bilden, indem wir irgend eine Function von m Variablen nehmen, und alle Permutationen aufsuchen, die eine solche Function un- ungeändert lassen. Dass man auf diese Weise alle Permutations- Permutationsgruppen bilden kann, wird sich nachher ergeben.
§. 159. Permutationen. 531 2. Ist P = n, 7t', 7t", id", . . . eine Gruppe von Permutationen von m Ele- Elementen und % eine beliebige unter ihnen, so stimmt das System Pj = »»!, 7t'it^ «"ätj, mf'iCi, . . ., von der Reihenfolge abgesehen, vollständig mit P überein. Denn die in Px enthaltenen Permutationen, deren Anzahl ebenso gross ist, wie die der Permutationen P, sind wegen der Gruppeneigenschaft von P (§. 155, 3.) jedenfalls alle unter den Permutationen von P enthalten. Ausserdem sind die Permu- Permutationen von P1 (nach §. 155, 2.) alle von einander verschieden, und also ist P mit Pj, von der Reihenfolge abgesehen, identisch. Ebenso kann man auch zeigen, dass P. =^= Jl± 7t, Tt-^ 7t , Tt-y 7t , Tty 7t , . . . mit P identisch ist. Hieraus ergeben sich die folgenden Sätze: 3. Jede Permutationsgruppe enthält die identische Permutation. Denn unter den Permutationen von P, müss auch % selbst vorkommen und wenn 7t0 nx = 7t1 ist, so ist (nach §. 155, 2.) jr0 die identische Permutation. 4. Eine Permutationsgruppe P enthält zu jeder Permutation auch die entgegengesetzte. Denn in Pj muss nach 3. die identische Permutation vor- vorkommen. Ist aber »% die identische Permutation, so ist 3t = 7t~^. Hierin kann % jede Permutation aus P sein. "Wenn an Stelle der Variablen «j, w2, . . ., um bestimmte Grossen e^, «j, . . ., am, seien es Zahlenwerthe oder Grossen irgend eines Körpers, gesetzt werden, so verliert der Satz 1. seine allgemeine Gültigkeit. Nehmen wir z. B. m = 3 und setzen zwischen den drei Grossen ax, w2 > «s die Relation 2 a3 = «: -|- «2 fest, indem wir sie sonst nicht weiter beschränken, so bleibt die Function «2 — «3 umgeändert nur durch die iden- identische Permutation und durch die Permutation i, 2, 3\ l, 3, 1/ 34*
532 Vierzehnter Abschnitt. §. 159. Diese beiden Permutationen aber bilden keine Gruppe, weil die "Wiederholung der letzteren /l, 2, 3\ \3, 1, V nicht darunter vorkommt. Für diese Functionen gilt nun der folgende Satz: 5. Ist P eine Permutationsgruppe von m Ziffern, und sind alt «2, . . ., «m beliebige von einander verschiedene Grossen, so giebt es rationale Func- Functionen der «, sogar mit rationalen Coefficienten, die sich nicht ändern, wenn auf die Indices von a eine Permutation der Gruppe P angewandt wird, und die sich ändern, wenn eine nicht zu P gehörige Permutation angewandt wird. Um ihn zu beweisen, nehmen wir eine Function Q = 0(Ul, «2, . . ., Um), wie wir sie schon im §. 156 betrachtet haben, die II (m) ver- verschiedene Werthe erhält, wenn die a auf alle mögliche Arten vertauscht werden. Bezeichnen wir die Werthe, die q durch Anwendung der Permutationen einer Gruppe erhält, mit A) Q, ,pi, • ..., Qii-i, so werden nach dem Satze 2. diese Grossen nur unter einander vertauscht, wenn auf alle zugleich eine Permutation % aus der Gruppe P ausgeübt wird. Denn die Anwendung der Permutation %x auf die sämmtlichen Functionen A) hat denselben Erfolg, wie die Anwendung der in Pt enthaltenen Permutationen auf q. Nach 2. ist aber Py mit. P, von der Reihenfolge abgesehen, identisch. Bedeutet also t eine Variable, so bleibt die Function B) i, = (t - q) (t - 9l) . . . (* - Pm_0 ungeändert, wenn irgend eine Permutation aus P angewandt wird. Wenn nun durch eine nicht in P enthaltene Permutation die Grossen A) in C) p', q'v ¦ ¦ ., Q'p-i übergehen, so kommt wenigstens q' sicher nicht unter den Grossen A) vor, und folglich ist
§. 160. Transpositionen und Cyklen. 533 mit ip nicht identisch. Man kann daher dem t einen solchen rationalen Werth geben, dass tp von allen nach Art von ip^ ge- gebildeten Functionen verschieden ist. Selbstverständlich gelten diese Betrachtungen auch, wenn an Stelle der cc unabhängige Variable treten. Eine Function, die alle Permutionen einer Gruppe P ge- gestattet, während sie sich bei allen nicht zu P gehörigen Permu- Permutationen ändert, heisst eine zur Gruppe P gehörige Function. Zu der Gruppe Po, die alle Permutationen von m Ziffern umfasst, gehören die symmetrischen Functionen. Man nennt diese Gruppe daher auch die symmetrische Gruppe. Eine Function q, die zu der aus der einzigen identischen Permutation bestehenden Gruppe gehört, kann zu einer ein- eindeutigen Bezeichnungsweise der Permutationen dienen; denn es giebt nur eine Permutation je', durch die q in p' übergeht. Wir können also für diese Permutation das Symbol * = (9, Q') benutzen, so dass durch 0, q), 0, q'), 0, q") . . . alle Permutationen der m Ziffern eindeutig bezeichnet sind. §. 160. Zerlegung von Permutationen in Transpositionen und in Cyklen. Wir haben schon im zweiten Abschnitt bei Gelegenheit der Determinanten die Zusammensetzung beliebiger Permutationen aus einer Reihe von Transpositionen, d. h. Vertauschung nur zweier Ziffern, erwähnt. Solche Transpositionen bezeichnen wir durch Nebeneinanderstellen der betreffenden Ziffern, z. B. durch A, 2) die Vertauschung der Ziffern 1 und 2. Eine Transposition, zweimal wiederholt, führt zur Identität, so dass jede Transposition sich selbst entgegengesetzt ist. Ist nun a = /l, 2, ...,m\ \au a3, . . ., amj eine beliebige Permutation von m Ziffern, so ist x(m, am) = äj
534 Vierzehnter Abschnitt. §. 160. eine Permutation, die m — 1 ungeändert lässt, die also durch /l, 2, . . ., m - 1\ VA, &2, • • •, 6m-l / dargestellt werden kann und also eine Permutation von höchstens m — 1 Ziffern ist. Da nun auch % = %x (m, am) ist, so folgt hieraus durch vollständige Induction 1. dass man jede Permutation (und zwar auf un- unendlich viele verschiedene Arten) in Transposi- Transpositionen zerlegen kann. Und daraus folgt weiter: 2. Wenn eine Permutationsgruppe von m Ziffern alle Transpositionen mit einer festen Ziffer, z.B.: A, 2), A, 3), . . ., A, m) enthält, so ist sie mit der symmetrischen Gruppe identisch. Denn eine solche Gruppe enthält, wie man aus der Zu- Zusammensetzung B, 3) = A, 2) A, 3) A, 2) erkennt, auch alle anderen Transpositionen, und nach 1. lassen sich daraus alle Permutationen der symmetrischen Gruppe zu- zusammensetzen. Eine Permutation % heisst cyklisch, wenn sich die Ziffern so in eine Reihe ordnen lassen, dass durch n jede Ziffer in die folgende und die letzte wieder in die erste übergeht, also z. B. /l, 2, . . ., m — 1, m\ \2, 3, . . ., m1 r solche cyklische Permutationen bezeichnet man einfacher, indem man die Ziffern des Cyklus neben einander setzt, durch A, 2, 3, .. ., m). Dabei ist es gleichgültig, mit welcher Ziffer man anfängt; man könnte also auch B, 3, . . ., m, 1) dafür setzen. Es gilt nun der folgende Satz: 3. Jede Permutation % lässt sich, und zwar nur auf eine Weise, in eine Reihe von cyklischen Permutationen zerlegen, so dass keine zwei dieser Cyklen eine Ziffer gemeinschaftlich haben.
§. 160. Transpositionen und Cyklen. 535 Ist nämlich A) » so fange man mit einer beliebigen Ziffer, etwa mit 1 au, und setze die Reihe B) 1, «! = 5, «j = c . . . so lange fort, bis man auf eine Ziffer zum zweiten Male stösst. Die zuerst wiederkehrende Ziffer muss 1 sein, da zu jeder Ziffer die in der Reihe B) vorangehende durch A) eindeutig bestimmt ist. Dann bilden die Ziffern C) A, 6, c . . .) einen ersten Cyklus. Sind dadurch noch nicht alle m Ziffern von A) erschöpft, so greift man aus den übrigen eine heraus und verfährt ebenso, bis alle m Ziffern von A) in den Cyklen untergebracht sind. Da in jedem solchen Cyklus zu jeder Ziffer, die vorangehende sowohl als die nachfolgende, durch A) völlig bestimmt ist, so sind auch die Cyklen selbst eindeutig bestimmt. Bei der Bezeichnung von % durch die Cyklen können aber nicht nur die verschiedenen Cyklen beliebig angeordnet, sondern man kann auch in jedem Cyklus mit einer beliebigen seiner Ziffern anfangen. Eine Ziffer, die nicht geändert wird, bildet für sich einen eingliedrigen Cyklus. Wir wählen ein ganz beliebiges Beispiel, wodurch das Ver- Verfahren sofort klar wird: l, 2, 3, 4, 5, 6, 7, 8\ ) = <*' 3' 5' 7' 6) ^' 2) 4' 5) A' 2' 3' 6, 7, 8\ 6, 7, 1, 4, 5, 8, 2) = <*' 3' 7' 8' 2' 6' 5' /l, 2, 3, 4, 5, 6, 7, 8\ U 1, 3, 5, 7, 8, 6, i) - <8 l, 2, 3, 4, 5, 6, 7, 8\ , b 3, 6, 5, 8, 1, 4, ?J = (8 Das Nebeneinandersetzen der Cyklen ist mit einer Compo- sition in dem bisherigen Sinne gleichbedeutend, nur ist zu be- bemerken, dass Permutationen, die gar keine gemeinschaftliche Ziffer enthalten, bei der Composition immer vertauscht werden können. Eingliedrige Cyklen, die nichts ändern, werden in der Be- Bezeichnung auch oft weggelassen.
536 Vierzehnter Abschnitt. §. 160. Da im Allgemeinen, wenn % und % irgend zwei Permutationen von m Ziffern sind, % % von % % verschieden ist, so ist auch von % verschieden. Ist % in seine Cyklen zerlegt, so kann man %' nach dem folgenden Satze sehr einfach aus x ableiten. 4. Man erhält die Permutation %~x%% dadurch, dass man in den Cyklen von % die Permutation % ausführt. Um diese Regel zu beweisen, sei, in Cyklen zerlegt x = («, ß, y . . .) («', ß\ y' ...)... und es sei % _ /«, ß, r, V y„,. . ., cc'„, ß'„, y'„, . . J Durch 7t—1 geht cc„ in cc über, durch x geht cc in ß über und durch % wird ß in ß„ übergeführt. Durch ai-'xjs geht also Kn in CÄ über. Da dieselbe Betrachtung auf ß„, ya,.. . . u. s. f. anwendbar ist, so folgt: n~lxn = (a„, ß„, ym . . .) (u'a, ß'„, y'„, ...).. ., und dies ist der Inhalt des Satzes 4. Aus der gleichzeitigen Betrachtung der Zerlegung der Per- Permutationen in Cyklen und in Transpositionen ergiebt sich ein Beweis für die Eintheilung der Permutationen in zwei Classen, die wir schon im zweiten Abschnitt bei den Determinanten kennen gelernt haben. Bedeutet t eine Transposition und % eine beliebige Permu- Permutation , so ist in der zusammengesetzten Permutation t % die Anzahl der Cyklen um eins grösser oder um eins kleiner als in %. Die beiden Ziffern, die durch tr mit einander vertauscht werden, können entweder in demselben Cyklus von % vorkommen oder in zwei verschiedenen Cyklen. Nehmen wir an, es sei ein in % vorkommender Cyklus y = A, 2, .. . a, a ~\- 1 . . . b) und es enthalte t zwei Ziffern, die in y vorkommen, etwa t = A, a), dann ist ¦*y = (l, a+1, ...5) B, 3, . . . a), d. h. y wird durch Zusammensetzung mit t in zwei Cyklen zerlegt, während die übrigen Cyklen durch t nicht berührt werden.
§. 160. Permutationen erster und zweiter Art. 537 Wenn aber die beiden Ziffern von t in zwei verschiedenen Cyklen von % vorkommen, so mögen diese beiden Cyklen y = A, 2, 3 . . . a), y' = A', 2', 3' ... a>) sein und t = A, 1'). Es ist dann *y/ = (l, 2', 3'...o',l',2, d...a), d. h. die beiden Cyklen y, y' werden durch r zu einem einzigen Cyklus vereinigt, während wieder die übrigen Gyklen ungeändert bleiben. Wenn wir also eine Permutation % von m Ziffern, die aus v Cyklen besteht (wobei die eingliedrigen Cyklen mitgezählt werden), durch ft Transpositionen dargestellt haben, so kann sie durch Zusammensetzung mit diesen ft Transpositionen in umgekehrter Reihenfolge in die identische Perinutation verwandelt werden, die aus m eingliedrigen Cyklen besteht. Es sind daher im Ganzen m — v Cyklen gewonnen, und da jeder Transposition ein gewonnener oder ein verlorener Cyklus entspricht, so muss ft = m — v (mod. 2) sein, d. h. (i ist eine gerade oder eine ungerade Zahl, je nachdem m — v gerade oder ungerade ist. Die letzte Zahl ist aber nur von der Permutation %, nicht von der Art der Zerlegung in Transpositionen abhängig. Wir haben damit den Satz: 5. Die Permutationen von m Ziffern zerfallen in zwei Arten, von denen die erste in eine gerade, die zweite in eine ungerade Anzahl von Trans- Transpositionen zerlegbar ist. Jede dieser beiden Arten umfasst gleich viel Permutationen, nämlich \ II (m); denn durch Hinzufügung einer festen Transposi- Transposition geht jede Permutation der ersten Art in eine der zweiten Art über und umgekehrt. Die Zusammensetzung zweier Permutationen von gleicher Art giebt stets eine Permutation der ersten Art, während eine Permutation erster und zweiter Art, zusammengesetzt, eine Permu- Permutation zweiter Art ergeben, wie aus der Zerlegung in Transposi- Transpositionen sofort zu ersehen ist. Daraus folgt: 6. Die Permutationen der ersten Art bilden eine Gruppe. Nennen wir eine Function von m Veränderlichen %, u2, ¦ ¦ .,um oder auch von m von einander verschiedenen Grossen uL, «2, • •., «m,
538 Vierzehnter Abschnitt. §. 160. die ihr Zeichen ändert, wenn zwei der Variablen mit einander vertauscht werden, wie z. B. das Product aller Differenzen: (% — u2) (% — %) . . . (Ui — um) (u2 — u%) . . . (u2 — um) eine alternirende Function, so wird durch die Permu- Permutationen der ersten Art eine solche Function nicht verändert, während sie durch eine Permutation der zweiten Art geändert, nämlich in den entgegengesetzten Werth verwandelt wird. Die alternirenden Functionen gehören also zu der Gruppe der Permutationen der ersten Art. Wie wir früher die Gruppe, zu der die symmetrischen Func- Functionen gehören, symmetrische Gruppe genannt haben, so nennen wir die Gruppe der Permutationen der ersten Art, zu der die alternirenden Functionen gehören, alternirende Gruppe. Die Gruppe, die aus der einzigen identischen Permutation be- besteht, nennen wir die identische Gruppe oder auch die Einheitsgruppe. Eine cyklische Permutation von n Gliedern lässt sich in n — 1 Transpositionen zerlegen, wie man aus der Zusammen- Zusammensetzung A, 2, 3 ... n) = A, 2) A, 3) ... A, n) erkennt, und daraus folgt, dass eine cyklische Permutation zur ersten oder zur zweiten Art gehört, je nachdem die Anzahl der Ziffern eine ungerade oder eine gerade ist. Wie man jede Permutation aus Transpositionen zusammen- zusammensetzen kann, ebenso kann man jede Permutation der ersten Art aus dreigliedrigen Cyklen zusammensetzen. Es genügt, wenn dies für jedes Paar von Transpositionen bewiesen ist, da jede Permutation der ersten Art sich aus solchen Paaren componiren lässt. Es ist aber A, 2) A, 3) = A, 2, 3) A, 4) B, 3) = A, 2, 3) A, 2, 4), woraus die Richtigkeit der Behauptung zu ersehen ist, da die beiden Transpositionen eines Paares entweder eine oder keine Ziffer gemein haben. Also: 7. Alle Permutationen der ersten Art lassen sich (auf unendlich viele Weisen) in cyklische Per- Permutationen von drei Elementen zerlegen.
§. 160. Alternirende Gruppe. 539 Aus 7. folgt weiter 8. Eine Permutationsgruppe von m Ziffern, die alle dreigliedrigen cyklischen Permutationen mit zwei festen Ziffern enthält, muss die ganze alternirende Gruppe enthalten. Denn aus den Cyklen A, 2, 3), A, 2, 4), . . ., A, 2, m) lassen sich alle dreigliedrigen Cyklen und also nach 7. alle Permu- tationen der ersten Art componiren, wie man aus den Zusammen- Zusammensetzungen B, 1, 3) = A, 2, 3) A, 2, 3), A, 3, 4) = A, 2, 3) B, 1, 4) B, 1, 3), B, 4, 5) = B, 1, 4) A, 2, 5) A, 2, 4) C, 4, 5) = B, 1, 3) C, 4, 5) A, 2, 3) ersieht. 9. Ist m grösser als 4, so ist eine Permutations- Permutationsgruppe von m Ziffern, die alle aus je zwei Transpositionen ohne gemeinsame Ziffer zu- zusammengesetzten Permutationen A,2) C,4) ent- enthält, durch die alternirende Gruppe theilbar. Denn es ist A, 2, 3) = A, 2) D, 5) D, 5) A, 3) und man kann also, wenn ausser den vier Ziffern 1, 2, 3, 4 noch eine fünfte, 5, vorhanden ist, alle dreigliedrigen Cyklen aus Trans- Transpositionspaaren von der Form A, 2) D, 5) zusammensetzen. Ist dagegen m = 4, so bilden die vier Permutationen 1; A,2) C, 4); A, 3) B, 4); A, 4) B, 3) eine Gruppe, die kleiner ist als die alternirende Gruppe, in der ausserdem noch die acht dreigliedrigen Cyklen vorkommen. Hieran schliessen wir die Beweise von zwei weiteren wich- wichtigen Sätzen, die sich auf transitive Permutationsgruppen be- beziehen : 10. Wenn eine transitive Permutationsgruppe von m Ziffern eine einzelne Transposition enthält, so ist sie entweder die symmetrische Gruppe oder sie ist imprimitiv. Die vorgelegte Gruppe sei P, die m Ziffern, die durch sie permutirt werden, 1, 2, . . ., m, und es komme darin die Trans- Transposition A, 2) vor. Sie möge überhaupt die Transpositionen
540 Vierzehnter Abschnitt. §. 160. A, 2), A, 3), A, 4), . . ., A, (t), aber keine andere Transposition mit der Ziffer 1 enthalten. Ist nun (t = m, so ist P nach 2. die symmetrische Grnppe. Ist aber (t < m, so enthält P nach demselben Satze alle Permu- Permutationen der Ziffern M= 1, 2, . .., (t. Daraus folgt, dass P keine Transposition von einer der Ziffern 1, 2, 3, . . ., (t mit einer anderen Ziffer, etwa mit f* —[— 1, enthalten kann. Denn wenn B. ft + 1) in P vorkommt, so kommt auch (l,(t + l) = A,2) A,A+1) A,2) darin vor, gegen die Voraus- Voraussetzung. Wenn nun P transitiv ist, so giebt es darin eine Permu- Permutation jz, durch die die Ziffer 1 in eine nicht in dem System M enthaltene Ziffer, etwa in (t + 1, übergeht, und dann kann durch % keine der Ziffern von M in eine Ziffer von M übergehen; denn wenn z. B. 2 in r übergeht, so ist *-i(l, 2)* = Q* + l,r) und ((t + 1, r) kann, wenn r zu M gehört, wie wir gesehen haben, nicht in P vorkommen. Durch jede Permutation von P werden also die Ziffern des Systems M entweder nur unter sich ver- vertauscht, oder sie werden in die Ziffern eines ganz davon ver- verschiedenen Systems M' übergeführt, und in P kommen auch alle Permutationen der Ziffern M' vor. Wenn mit M und M' noch nicht alle Ziffern erschöpft sind, so giebt es eine Permutation in P, durch die M in ein drittes System M" übergeführt wird, was wieder mit M und mit M' keine Ziffer gemein haben kann. Denn sind k, ß zwei Elemente von M (die auch identisch sein könnten), die durch % und %' in dasselbe sowohl in W als in M" enthaltene Element y übergehen, so wird ß durch die Permutation 3Z0 = n'x—1 in cc übergehen. Folglich kann jt0 die Ziffern von M nur unter sich permutiren, und da %' = jcojc ist, so ist M' mit M" identisch. Es zerfällt also die Gesammtheit der Ziffern 1, 2, . . ., in in Systeme M, M\ M" . . . von je (t Ziffern, die durch P impri- imprimitiv permutirt werden, d. h. die Gruppe P ist imprimitiv. Wenn m eine Primzahl ist, so giebt es keine imprimitiven Permutationsgruppen; also ist in diesem Falle eine transitive Gruppe, die eine Transposition enthält, nur die symmetrische Gruppe.
§. 160. Permutationsgruppen. 541 Ganz auf dieselbe Weise schliessen wir aus dem Satze 8: 11. Wenn eine transitive Permutationsgruppe von m Ziffern einen dreigliedrigen Cyklus enthält, so enthält sie die ganze alternirende Gruppe, oder sie ist imprimitiv. Denn enthält die Gruppe P die dreigliedrigen Cyklen A, 2, 3), A, 2, 4), ... A, 2, p), aber keinen anderen mit den Ziffern 1, 2, so enthält sie nach 8. die ganze alternirende Gruppe der Ziffern M = 1, 2, 3, .. ., m. Ist nun ft < m, so kann in P kein dreigliedriger Cyklus vor- vorkommen, der eine oder zwei der Ziffern von M mit anderen Ziffern verbindet. Denn enthält P eine Permutation A, r, s) von der Art, dass von den Ziffern r, s wenigstens eine nicht in M vor- vorkommt, so wähle man k, ß aus M so, dass keines von ihnen mit 1, r, s übereinstimmt, und man findet dann aus der Zusammen- Zusammensetzung (nach 4.) A, ß, «) A, r, s) A, «, ß) = («, r, s), dass alle («, r, s), und mithin nach 7. die ganze alternirende Gruppe der Ziffern 1, 2, 3, . . .,>, r,s in P enthalten ist, was der Voraussetzung widerspricht. Es zer- zerfallen also die m Ziffern von P, wie vorhin, in mehrere Systeme M, M', M" . . . der Imprimitivität. Wir können noch hinzufügen, 12. dass, wenn der Fall der Imprimitivität ein- eintritt, die GruppeP im Falle 10. die ganze sym- symmetrische Gruppe, im Falle 11. die ganz^e alter- alternirende Gruppe für jedes einzelne System der Imprimitivität enthält. Die wiederholte Zusammensetzung einer und derselben Per- Permutation mit sich selbst bezeichnet man wie Potenzen. Wenn also % irgend eine Permutation ist, so muss unter den auf ein- einander folgenden Potenzen 3Z°, 3Z1, 3t2, 3Z3, . . ., worin %" = 1 die identische Permutation bedeutet, nothwendig dieselbe Permutation wiederkehren. Aus %p = itß+e folgt aber %" = 1. Ist e der kleinste positive Exponent, für den %e = 1 wird, so sind die Permutationen D) 1, st, %\ . .,, »•-*
542 Vierzehnter Abschnitt. §. 161. alle von einander verschieden, während sie sich bei der Fort- Fortsetzung ne, ne + 1,..., 7tie-\ ... in derselben Reihenfolge periodisch wiederholen. Die Reihe D) heisst die Periode der Permu- Permutation nt, und e wird der Grad von % genannt. Die Periode von % bildet eine Gruppe, da durch Zusammensetzung zweier ihrer Elemente ein Element derselben Periode entsteht. Ist % eine cyklische Permutation * = A, 2, 3, . . ., n), so ist bei geradem n x* == A, 3, . . ., n — 1) B, 4, . . ., n), und bei ungeradem n %* = A, 3, .... w, 2, 4, . . ., n — 1), und der Grad von n ist in beiden Fällen gleich n. Ist n in mehrere Cyklen zerlegt, so ist der Grad von % gleich dem kleinsten gemeinschaftlichen Vielfachen der Glieder- Gliederzahl der einzelnen Cyklen, z. B. % = A, 2) C, 4, 5), *« = A) B) C, 5, 4), "»» = A, 2) C) D) E), fr = A) B) C, 4, 5), »* = A,^2) C,]5, 4), »« = 1. Wenn w in irgend einer Permutationsgruppe P vorkommt, so enthält P die ganze Periode von %. §¦ 161. Divisoren der Gruppen. Nebengruppen und conjugirte Gruppen. Wir haben im §. 159 gesehen, dass eine Function von m unabhängigen Veränderlichen immer eine Permutationsgruppe von m Ziffern bestimmt, dass aber dies nicht immer zutrifft, wenn an Stelle der unabhängigen Veränderlichen bestimmte Grossen gesetzt werden. Durch die Galois'sche Theorie wird aber dieser Unterschied ausgeglichen, oder wenigstens auf seinen Kern zurückgeführt. Es sei jetzt F(x) = 0 irgend eine Glei- Gleichung jwten Grades in einem gegebenen Körper £1 mit den von einander verschiedenen Wurzeln «j, «2, . . ., am. Den Normalkörper Si, (Q) = Si, (¦«!, «2, . . ., Um) wollen wir mit N bezeichnen.
§. 161. Nebengruppen. 543 Unter der Galois'schen Gruppe P des Körpers N oder der Gleichung F(x) = 0 können wir (nach §. 156) entweder die Gruppe der Substitutionen des Körpers N oder auch die damit isomorphe Permutationsgruppe der Indices der et verstehen. Es sei p der Grad von P und wir wollen die Operationen von P (seien es nun Substitutionen von N oder Permutationen der et) mit A) P = ff, ff[, ffa, . . ., ffp_! bezeichnen. Wenn das System Q der in P enthaltenen Permutationen B) X, *1, X.2, • . ., 3C«_l für sich eine Gruppe ausmacht, wenn also je zwei der Elemente von Q, mit einander componirt, wieder ein Element aus Q er- ergeben, so heisst die Gruppe Q ein Theiler oder Divisor von P1). Wir leiten zunächst einen wichtigen allgemeinen Satz über die Theiler einer Gruppe her. Wenn der Grad q des Theilers kleiner ist als der Grad p von P, so nehmen wir ein nicht in Q enthaltenes Element %x in P und bilden das System C) Qxx = x%x, xxxx, . . ., 3cä_iffj, das wir als symbolisches Product Q%x darstellen. Die Elemente von C) sind sowohl unter einander als von den Elementen von Q verschieden, denn aus xx ffi = x3 %x würde xx = xa, und aus % = %x %j würde % = x-~x % folgen, was nicht möglich ist, wenn ff: nicht zu Q gehört. Die Elemente von Qxx bilden keine Gruppe, denn sonst müsste xx %x x2%x = x3 %x oder %x = x—1 x% ti—1 sein, was wieder erfordern würde, dass %x in Q enthalten ist. Wir nennen das System Qnx eine Nebengruppe zu Q (innerhalb P). Die Nebengruppe bleibt in ihrer Gesammtheit ungeändert, wenn %x durch irgend ein Element x%x von Qn-^ ersetzt wird, weil Q% mit Q identisch ist. Nennen wir überhaupt jedes System Qit eine Nebengruppe, so dass Q selbst darunter mitgerechnet ist, so können wir zeigen, dass zwei Nebengruppen entweder ganz identisch sind, oder kein gemeinsames Element enthalten. Denn sind Qitx, Qtc2 zwei Nebengruppen, und ist xl%1 = x.27t2, worin xx, x2 zwei Elemente aus Q sind, so folgt, wenn x = x^1x1 gesetzt wird, Auch Untergruppe genannt.
544 Vierzehnter Abschnitt. §. 161. it^ = %jix. Da aber % zu Q gehört, und folglich Q% = Q ist, so folgt: Q7t.2 = Q%Ttx = QjTj. Ist durch B) und C) die Gruppe P noch nicht völlig er- erschöpft, so können wir eine weitere Nebengruppe Qtc2 bilden uud können in der Bildung der Nebengruppen so lange fort- fortfahren, bis P in lauter Nebengruppen zerlegt ist. Da jede dieser Nebengruppen q Elemente enthält, so folgt der wichtige Funda- Fundamentalsatz von Cauchy: 1. Der Grad eines Theilers einer Gruppe P ist ein Theiler des Grades von P. Als specieller Fall ist darin enthalten, dass der Grad eines Elementes der Gruppe (§.160) immer ein Theiler des Grades der Gruppe ist. Die Zerlegung von P in seine Nebengruppen können wir (nach Galois) sehr bezeichnend durch die symbolische Gleichung ausdrücken: D) p= Q+ 0% + 0^^ \-Q«j-i, wenn E) i>=i2 ist. Den Quotienten j nennen wir den Index des Theilers Q. Diese Zahl drückt keine Eigenthümlichkeit der Gruppe Q an sich aus, sondern nur eine Beziehung von Q zu P. Da, wie wir oben schon gesehen haben, zwei Nebengruppen zu Q entweder ganz identisch sind, oder kein gemeinschaftliches Element enthalten, so können wir noch den Satz aussprechen: 2. Ist % eine beliebige Permutation aus P, so ist das System der Nebengruppen Q%, Qnx%, Qn%%, . . ., Q%j-x7i von dem System Q, Q%x, Qtc.2, . . ., Qtcj-x nur durch die Anordnung unterschieden. Wir dehnen die Bezeichnung Nebengruppen auch auf Systeme von der Form % Q aus, und können P auch in solche Systeme zerlegen. Es folgt speciell aus der Zerlegung D) die zweite P = Q + arj-i Q+jc^-Q-\ %j±x Q. Denn wenn %x nicht in Q vorkommt, so kommt auch %-x nicht darin vor, und wir erhalten eine erste Nebengruppe %—J Q.
§. 161. Nebengruppen. 545 Wenn dann ti% nicht in Q7t1 vorkommt, so kommt auch %—x nicht in 7t—1 Q vor; denn aus 7t—1 ¦= 7t—1 % würde 3r2 = x~'lxl folgen u. s. f. Wir geben hier der Zerlegung D) den Vorzug wegen der Bedeutung, die sie, wie wir sogleich sehen werden, für das algebraische Problem hat. Wir nennen eine Grosse -ip des Körpers N zu der Gruppe Q gehörig (wenn nöthig mit dem Zusatz „innerhalb P"), wenn -ip sich nicht ändert, falls eine der Operationen von Q darauf angewandt wird, dagegen sich ändert, wenn irgend eine andere Operation aus P angewandt wird. Wie man sieht, ist dieser Begriff der Zugehörigkeit gegen den im §.159 festgesetzten etwas erweitert, insofern die Permutationen, die ausserhalb P liegen, hier gar nicht in Betracht kommen. Für den Fall, dass P die symmetrische Gruppe ist, fallen aber beide Begriffsbestimmungen zusammen. Bei dieser Definition der Zugehörigkeit gelten nun die fol- folgenden Sätze allgemein. 3. Zu jedem Theiler Q von P gehören Grossen in N, und jede Grosse in N gehört zu einem be- bestimmten Theiler Q von P. Der erste Theil des Satzes ist bereits im §. 159, 5. bewiesen. Denn wenn eine Function der Grossen a innerhalb der symme- symmetrischen Gruppe zu einer Gruppe Q gehört, so gehört sie auch innerhalb jeder anderen Gruppe P, von der Q ein Theiler ist, zu Q. Der zweite Theil aber folgt aus den Grundeigenschaften der Galois'sehen Gruppe. Um dies einzusehen, wollen wir folgende Bezeichnung ein- einführen. Wird auf eine Function tp des Körpers N irgend eine Permutation 7t der Gruppe P ausgeübt, so möge -ip in tp j 7t übergehen; wird auf ip | % eine Permutation %' ausgeübt, so ist der Erfolg derselbe, als ob auf -ip die zusammengesetzte Permu- Permutation 7t 7t' ausgeübt wäre, d. h. es ist F) (ip | 7t) | %' = tp | 7t 7t'. Bleibt nun tp ungeändert durch die Permutation x, so ist 1p — tp | je, und hierin kann nach §. 156$ a) jede Permutation % aus der Gruppe P angewandt werden. Dadurch ergiebt sich 1p j 7t = Tp | %7t. Weber, Algebra. I. 35
546 Vierzehnter Abschnitt. §. 161. Wenn daher -ip | % auch gleich ip ist, so ist auch ip \ % % = ip, d. h. die Permutationen, die ty ungeändert lassen, bilden eine Gruppe, w, z. b. w. Ist tp eine zur Gruppe Q gehörige Function in N, ist also G) i,\% = i,\%1 = -.. = ii,\ xa-i — n>, und it-y irgend eine nicht zu Q gehörige Permutation von P, so können wir jc± auf die Gleichungen G) anwenden und erhalten und tp-L ist von tp verscbieden. Wenn umgekehrt für irgend ein it • (8) tp-, = tp 1 it = ^> | x%l ist, so muss 7t unter der Reihe der Substitutionen (9) Q%1 =xjeu %x %u . . ., 5cä_i3ri enthalten sein; denn durch Anwendung von %—1 auf (8) folgt, dass %%1 n—x in Q enthalten, etwa gleich % sein muss; daraus aber folgt Tt = X—1 X 7tt, was in der That in (9) enthalten ist. Wir können demnach folgenden Satz aussprechen: 4. Eine zu Q gehörige Function tp geht durch alle Permutationen einer Nebengruppe Q%, und durch keine andere Operation aus P in eine bestimmte von tp verschiedene Grosse -ipx über. Demnach entsprechen den j Nebengruppen ebenso viele Functionen ip, nämlich A0) 1>, *!, *j, . . ., ti-1, und aus dem Theorem 2. ergiebt sich der Satz: 5. Die Grossen A0) erleiden eine Permutation, wenn auf alle gleichzeitig eine und dieselbe Operation it aus P angewandt wird. Denn wir können die Grossen A0) so darstellen ip\x, tp \ xtc^ tp | xn2, . . ., tp | x:*}_!, und wenn also % darauf angewandt wird, 1p \XJC, 1p | JCJCjJT, 1p | X7C27C, . . ., ty | XJCj — iTt, worin x und % beliebige Permutationen aus Q und P sind. In jeder der beiden Reihen
§. 161. Conjugirte Gruppen. 547 X, %7tu X7t, X7t17t, XJC27t, . . ., X7tj_17t kommt aber aus jeder der Nebengruppen D) eine und nur eine Permutation vor. Die Functionen A0), die, wie wir gesehen haben, alle von einander verschieden sind, heissen conjugirte Functionen. Wir können nach dem Vorhergehenden leicht die Gruppen bilden, zu denen die einzelnen Functionen A0) gehören. Es ist z. B. ipt = ip | 3Tj, und wenn nun % eine Permutation aus P ist, durch die fa ungeändert bleibt, so muss sein. Auf diese Gleichung können wir aber die in P enthaltene Permutation Tt\~x anwenden, wodurch sich ty | 7t17t 7t—1 = X[> ergiebt, d. h. es muss Tt-^TtTt—1 zu Q gehören. Setzen wir es gleich x, so folgt A1) % = n—x%%x. Wenn umgekehrt % diese Form hat, so ist und tl>1 gestattet also diese Permutation. Demnach können wir die Gruppe, zu der i^ gehört, durch das Symbol darstellen, was in der That eine Gruppe ist, wie aus der Zu- Zusammensetzung A2) 7t—1 XTt-y n—1 v.^ jt± = 7t—1 % % %x zu ersehen ist. Die Gruppen, zu denen die conjugirten Functionen A0) gehören, nämlich A3) Q, x-iQx!, n-^Q^, . . ., Ttr-^QTtj-!, nennen wir conjugirte Theiler von P oder kurz conjugirte Gruppen1). Wenn die Elemente zweier Gruppen Q = x, x1,xi, ... Q' = x', x\, »4 . . . J) Auch der Name „gleichberechtigte Untergruppe" ist dafür im Gebrauch. 35*
548 Vierzehnter Abschnitt. §. 162. in der Weise eindeutig auf einander bezogen werden können, dass, wenn x, x' und xu x[ zwei Paare entsprechender Elemente sind, auch die Zusammensetzungen xxx und x'x[ entsprechende Elemente sind, so heissen die beiden Gruppen isomorph. Die in A2) ausgedrückte Regel der Zusammensetzung in der Gruppe %~1Qn1 zeigt also, dass alle conjugirten Gruppen mit einander isomorph sind. Wenn tc eine beliebige Permutation aus P, also von der Form x%r ist, so ist die Gruppe 7t~1Q7t immer unter den conju- conjugirten GruppenA3) enthalten, nämlich = n~1x~1 Qx%r =it—1Qicr. Die Ableitung von %—x Qit aus Q heisst auch eine Trans- Transformation der Gruppe Q durch % und %~x Q% eine aus Q transformirte Gruppe. §. 162. Reduction der Galois'schen Resolvente durch Ad- junction. Normaltheiler einer Gruppe. Wir haben nun die allmähliche Reduction der Gruppe einer gegebenen Gleichung zu betrachten, die durch die Adjunction von gewissen algebraischen Grossen eintreten kann. Es sei, wie im vorigen Paragraphen, P die Galois'sche Gruppe vom Grade f>, und Q einer ihrer Theiler vom Grade q und vom Index j, ferner ty eine zu Q gehörige Function der Wurzeln, und A) *, 1I>1, 1I>2, ¦ ¦ -, tj-l seien die conjugirten Grossen. Wir stellen den folgenden Satz an die Spitze. 1. Die conjugirten Grossen A) sind die Wurzeln einer irreducibeln Gleichung vom Grade j in £i. Denn bedeutet t eine Veränderliche, so bleibt B) cp (t) = (t — iP)(t-ti).--(t — ty-i) (nach §. 161, 5.) ungeändert, wenn eine Permutation aus P ange- angewandt wird; also sind die Coefficienten der Function (p(t), deren Wurzeln die Grossen A) sind, in £1 enthalten [§. 156, b)]. Um die Irreducibilität von cp(t) nachzuweisen, nehmen wir- an, es sei <&(t) irgend eine Function in £1, die für t — -ip ver- verschwindet, also 3> (ip) = 0. Da auf diese Gleichung alle Permu-
§. 162. Reduction der Galois'schen Gruppe. 549 tationen von P angewandt werden dürfen, so folgt, dass auch 0(ti), ^(^2M • • -i ^(^i—1) Null sein müssen, dass also <&(t) durch 9 (t) theilbar sein muss. Darin aber ist die Irreducibilität enthalten. Hieran schliesst sich der Satz von Lagrange1): 2. Jede Grosse des Körpers N, die die Permu- Permutationen der Gruppe Q gestattet, ist in dem Körper £l(ip) enthalten, wenn -fy eine zu Q ge- gehörige Function ist. Eine die Permutationen von Q gestattende Function o geht durch die Permutationen einer Nebengruppe Qnx in ein und dieselbe Function über. Es entsprechen also den conjugirten Werthen C) ., 1j>, tl) *2, • • • tj-1 die Werthe D) a>, o-t, »2, . . ., ©,-_!, die jedoch nicht nothwendig alle von einander verschieden sind. Wendet man auf die Grössenreihen C), D) eine der Permu- Permutationen von P an, so tritt eine gewisse Permutation ein, und zwar in beiden Reihen die gleiche, da, wenn z. B. tl>l in tp2 über- übergeht, auch (»j in a>2 übergehen muss (§. 161, 5.). Betrachten wir nun die Summe die eine ganze Function (j — l)ten Grades von t ist, so finden wir, dass sie durch alle Permutationen P ungeändert bleibt und folglich in £1 enthalten ist. Setzt man dann t = ip und be- beachtet, dass <jp (t) keine gleichen Wurzeln hat, so folgt Es ist also es rational durch ¦$ ausgedrückt, und dies ist der Inhalt des Satzes 2. 3. Wenn wir eine zu Q gehörige Function ip dem Körper £1 adjungiren, so reducirt sich die Gruppe des Körpers N auf Q. !) Lagrange, Reflexions sur la resolution algebrique des equations. Memoires de l'Academie de BerliB, annees 1770, 1771. Oeuvres de Lagrange. Tome III. Der Satz ist von Lagrange allerdings nur in einer specielleren Fassung gegeben. Die allgemeine Formulirang rührt von Galois her.
550 Vierzehnter Abschnitt. §. 162. Denn bezeichnen wir den Körper £l(ij>) mit &', so gestattet erstens jede Gleichung in £1' zwischen den Wurzeln der Grund- Grundgleichung «, «!, . . ., am_i die Permutationen von Q, weil Q in P enthalten ist, und weil ty durch Q ungeändert bleibt; und zwei- zweitens ist jede Function, die durch Q ungeändert bleibt, nach dem Lagrange'sehen Satze in Sl' enthalten. Dies sind aber [nach §. 156, a), b)] die charakteristischen Merkmale der Galois'schen Gruppe im Körper SU. Um also die Galois'sche Gruppe vom Grade p auf den Grad q zu reduciren, muss eine Wurzel einer Hülfsgieichung jten Grades in Sl adjungirt werden. Den Satz 3. können wir auch so ausdrücken: Der Normalkörper N = £i(K,K1,...,um—i) ist ein Körper f>ten Grades über £1 und qten Grades über Sl' = <ß(^). Der Erniedrigung der Gruppe durch Adjunction von tp ent- entspricht, wie schon aus den allgemeinen Grundsätzen hervorgeht, eine Zerfällung der Galois'schen Resolvente. Nehmen wir an, es sei (wie im §. 152) g(t) = 0 die Galois'sche Resolvente und q eine ihrer Wurzeln, und durch die Permutationen von Q gehe q über in F) 0, Q1} 02, . . . 03_j, so dass, wenn xh irgend eine Permutation aus Q ist, nach der im §. 161 gebrauchten Bezeichnung 0Ä = p | xh ist. Wendet man auf diese Grossen eine Permutation der Gruppe Q an, so werden sie nur unter einander permutirt, und ihre sym- symmetrischen Functionen, und folglich auch die Function der Va- Variablen ( G) g(t, *) = (*— q) (t—9l)...(t- (fa_i) sind in <ß(^) enthalten. Zugleich ist g(t, ip) ein Theüer von g (f). Wendet man auf q die Substitutionen der Nebengruppe 7ti Q an, so geht 0 in (8) 0o,», 01,<> • • •, Qq-l,i über, worin 0 9 und zwei der Reihen (8) sind entweder identisch, oder sie ent- enthalten kein gemeinschaftliches Element. Denn ist 0Äjf = 0r>s, so ist ¦jtt %h = %s %r und ars ist folglich in der Nebengruppe %i Q enthalten. Aber auch die Grossen (8) vertauschen sich nur unter einander, wenn man darauf eine Substitution von Q anwendet (weil, wenn % eine Permutation in Q ist, %t Qx = %{ Q). Demnach ist auch (9) gt(t, *) = (*— 0o,O (* — 0i,O ...(* — 03_!,i)
§. 162. Reduction der Galois'schen Resolvente. 551 in £l(ip) enthalten und es wird g(t) durch Adjunction von ip in j Factoren zerlegt: A0) g (t) = g0 (t, i>) g± (t, *)... gj-i (t, t). Man kann die Zerlegung aber noch in einer anderen Weise ausführen, wobei man jedoch Factoren erhält, die nicht alle in sondern in den conjugirten Körpern &l(ip), "ß(^j), • • enthalten sind. Setzen wir nämlich so gehen die Grossen F) durch Anwendung der Permutation %i in A1) 00, i, Ql,i, ¦ ¦ •) Qq-l,i über, und die Gesammtheit dieser Grossen bleibt ungeändert durch die Permutationen der Gruppe itr-1 Q jc{. Ist nun wie früher P = <3 + <M + <3% H h Q«j-x, so geht il> durch »,• in ^ über, und aus G) ergiebt sich A2) g(t, i>i) = (t — Q'0,i) (t - <,{,{) ...(*- Qt^d. Dies ist gleichfalls ein Theiler von g(t), und weil zwei von den Grossen - Reihen A1) entweder identisch sind, oder kein gemeinschaftliches Element haben, so haben je zwei der Func- tionen g (t, tt) keinen gemeinsamen Theiler. Daraus ergiebt sich die Zerlegung A3) g(t) = g(t, i,) g(t, fy) . . . g(t, t,_0, die im Allgemeinen von der Zerlegung A0) verschieden ist. Uebereinstimmung findet nur dann statt, wenn man zu jeder Permutation % aus P eine zugehörige %' so finden kann, dass n Q = Q %' ist. Sind Q und Q' zwei verschiedene Theiler der Gruppe P, so werden Q und Q' gewisse Permutationen gemein haben, unter denen sich immer die identische Permutation findet. Es ist möglich, dass dies die einzige gemeinsame Permutation von Q und Q' ist, und dann heissen diese beiden Gruppen theilerfremd. Es können aber noch mehr gemeinsame Elemente vorhanden sein. Den Inbegriff R aller gemeinsamen Permutationen von Q und Q' nennen wir den grössten gemeinschaftlichen Theiler, oder auch den Durchschnitt von Q und Q'1). *) Der kürzere Ausdruck „Durchschnitt" statt „gemeinschaftlicher Theiler" ist von Study vorgeschlagen.
552 Vierzehnter Abschnitt. §. 162. Dies R ist immer eine Gruppe, denn wenn nx und n2 beide sowohl in Q als in Q' vorkommen, so muss auch %% in Q und in Q\ also auch in R vorkommen. Der Begriff ist sofort übertragbar auf mehrere Gruppen Q, Q\ Q" . . . Ist tp eine zu Q und -ip' eine zu Q' gehörige Function, so können wir die rationalen Zahlen x, x' (nach §. 43, 1.) so be- bestimmen, dass <ö = x-ip -f- x'il>' eine zu R gehörige Function wird. Denn jedenfalls gestattet a> die Permutationen von R, da ty und tp' sie gestatten. Ist dann % eine nicht in R enthaltene Permutation aus P, so ist sicher nicht zugleich ip = tp \ % und i}>' = ip \ n; also können wir x, x' so bestimmen, dass auch nicht co — m | n wird. Wenn wir also gleichzeitig -ip und -ip', und folg- liab a> adjungiren, so reducirt sich die Gruppe des Körpers N nach 3. auf R. Ebenso können wir bei mehr als zwei Gruppen Q schliessen, und erhalten den Satz: 4. Sind Q, Q\ Q" . . . Theiler von P, R ihr Durch- Durchschnitt, ^,^',^" ... Functionen, die zu Q, Q', Q"... gehören, so reducirt sich die Gruppe des Kör- Körpers N durch gleichzeitige Adjunction von $, $', i>" ¦ • ¦ auf R. Wenn wir nicht bloss eine Wurzel tp der Hülfsgieichung cp(t) = O adjungiren, sondern alle mit tp conjugirten Grossen ty, t^j, tpz, . . ., tyj—\, wenn wir also aus £1 den Körper 0 ableiten, so ist nach diesem Satze der Erfolg der, dass die Gruppe von N in £1" der grösste gemeinschaftliche Theiler R aller mit Q conjugirten Gruppen wird, so dass (nach §. 161) R der grösste gemeinschaftliche Theiler aller Gruppen %—J Q % ist, wenn tc die Permutationen von P durchläuft. Von besonderem Interesse ist nun der Fall, dass alle conjugirten Gruppen ji—1Qtc mit einander identisch sind. In diesem Falle ist nach dem Theorem 2. jede der con- conjugirten Grossen ip, ip±, t^2, . . ., ty—i in £i(tp) enthalten, die Körper £l(ip), Si^), ..., <ß(#y_i) und £l(tp, ipu . . ., %_!) sind identisch, und £1 (ip) ist ein Normalkörper über Si. In diesem Falle sind die Zerlegungen A0) und A3) mit einander identisch. Wir nennen daher einen Theiler Q der Gruppe P, der
§. 163. Gruppe der Resolventen. 553 diese Eigenschaft hat,* einen Normaltheiler (oder normalen Theiler) 1). Ist aber Q ein Normaltheiler, so ist die Adjunction einer einzigen Wurzel t\> der Hülfsgieichung gleichbedeutend mit der gleichzeitigen Adjunction aller dieser Wurzeln. 5. Ist Q selbst nicht normal, so ist der grösste gemeinschaftliche Theiler B aller conjugirten Theiler %—YQ% gewiss normal. Denn ist eine Permutation % in B, also in allen Gruppen 71~1Qti enthalten, so gilt das Gleiche auch von jedem % — 1%ji, d. h. %—1B% ist Theiler von B, und folglich, da es von gleichem Grade ist, = B. Eine Gruppe, die ausser sich selbst und der identischen Gruppe keinen Normaltheiler hat, heisst eine einfache Gruppe. Der Durchschnitt aller mit einer einfachen Gruppe conjugirten Gruppen ist entweder die Gruppe selbst oder die identische Gruppe, je nachdem diese einfache Gruppe Normaltheiler von P ist oder nicht. Ist Q ein Normaltheiler von P, und B ein Normaltheiler von Q, so ist zwar B ein Theiler von P, aber keineswegs immer normal; Dagegen ist, wenn B ein Normaltheiler von ¦ P ist, B auch Normaltheiler von jedem Theiler Q von P, von dem B Theiler ist. §. 163. Die Gruppe der Resolventen. Die Hülfsgieichung <p (t) = 0, von der die Bestimmung der Function ty abhängt, geht in die Galois'sche Resolvente über, wenn der Theiler Q, zu dem ip gehört, die identische Gruppe ist. Denn dann kann nach dem Satze von Lagrange (§.162, 2.) jede Function des Körpers N, also auch die Wurzeln et selbst rational durch i\> ausgedrückt werden, und N ist mit £1 (tl>) identisch. Wir wollen diese Gleichungen g? (i) = 0 daher in einem all- allgemeineren Sinne Resolventen nennen. Es sind aber hier zwei Fälle zu unterscheiden. J) Galois spricht, von der eigentlichen Zerlegung (decomposition propre) einer Gruppe; daher der Ausdruck „eigentliche Theiler". der auch im Gebrauch ist; neuere Schriftsteller bezeichnen die Normaltheiler als „ausgezeichnete oder invariante Untergruppen".
554 Vierzehnter Abschnitt. §. 163. 1. Wenn die conjugirten Gjpippen jr~a Qit theilerfremd sind, so ist die gleichzeitige Adjunction sämmtlicher Wurzeln der Resolvente <p(i) = 0 (nach Satz 4., §. 162) gleichbedeutend mit der Adjunction einer zur Einheitsgruppe gehörigen Function, und die Lösung der gegebenen Gleichung ist auf die vollständige Lösung der Resolvente zurückgeführt. Es ist und eine Galois'sche Resolvente der Gleichung q>(t) = 0 ist zugleich eine Galois'sche Resolvente der ursprünglichen Gleichung. In diesem Falle nennen wir cp(t) = O eine Totalresolvente der gegebenen Gleichung. 2. Haben die conjugirten Gruppen ji~% Q % einen von der Einheitsgruppe verschiedenen Theiler B, vom Grade r, der dann ein Normaltheiler von P ist, so ist* die gleichzeitige Adjunction von sämmtlichen zu ty conjugirten Functionen gleichbedeutend mit der Adjunction einer zu B gehörigen Grosse. Die Galois'sche Resolvente der gegebenen Gleichung ist durch diese Adjunction noch nicht vollständig gelöst, sondern sie ist nur in Factoren vom Grade r zerlegt. In diesem Falle heisst q>(ß) = 0 eine Partialresolvente. Ist P eine einfache Gruppe, so existiren nur Total- resolventen, während, wenn P Normaltheiler hat, zu jedem solchen Normaltheiler eine Partialresolvente gefunden werden kann. Derselbe Unterschied tritt auch hervor, wenn wir die Galois'sche Gruppe der Resolvente <p(t) untersuchen. Diese Gruppe besteht aus allen Vertauschnngen, die in der Reihe der Grossen A) *, #1, *2, • • •, *j-l durch Anwendung der sämmtlichen Operationen % von P hervor- hervorgerufen werden; denn jede Gleichung in £1 zwischen den Grossen A) bleibt richtig, wenn eine dieser Permutationen vorgenommen wird, da man die Operationen % auf jede Gleichung zwischen den «, also auch zwischen den i/>, anwenden kann; und wenn eine Func- Function in £1 der Grossen A) alle diese Permutationen gestattet, so gestattet sie auch alle Permutationen % und ist also gleich einer Grosse in £1. Es ist nun .der Grad dieser Gruppe zu bestimmen. Unter den Operationen von P werden die und nur die unter den
§. 164. Adjunction beliebiger Irrationalitäten. 555 Grossen A) keine Veränderung hervorrufen, die gleichzeitig in den Gruppen x—x Qit aller dieser Functionen, also auch in ihrem grössten gemeinsamen Theiler B vorkommen. Die Operationen von JR mögen mit 6 bezeichnet sein. Sind dann % und %' zwei Operationen, die unter den Grossen A) dieselbe Permutation hervorrufen, so wird %' %~x die ursprüngliche Anordnung der ty wieder herstellen, also gleich einer der Grossen tf sein, oder %' = 6%. Wir haben daher das Ergebniss: Die Permutationen der Nebengruppe B% und nur diese rufen unter den Grossen A) eine und dieselbe Permutation hervor. Der Grad der Galois'sehen Gruppe der Resolvente <p (t) = 0 ist also gleich der Anzahl dieser Nebengruppen, d. h. gleich dem Quotienten p : r oder dem Index des Theilers B von P. Ist B die identische Gruppe, also r = 1, und folglich q> (t) = 0 eine Totalresolvente, so ist der Grad ihrer Gruppe ebenso hoch, wie der Grad der Gruppe der ursprünglichen Gleichung, und beide Gruppen sind überdies isomorph. In Bezug auf die Gruppe ist also nichts gewonnen. Die gegebene Gleichung ist mit der Re- Resolvente, so verschieden auch ihre Grade sein mögen, äquivalent. Ist auf der anderen Seite Q ein Normaltheiler, also B mit Q identisch, so ist q> (t) = 0 eine Partialresolvente und der Grad ihrer Gruppe ist gleich dem Index j des Theilers Q von P. Nach der Adjunction einer Wurzel dieser Resolvente reducirt sich die Gruppe der ursprünglichen Gleichung auf Q, also auf den Grad q. Es ist also eine Spaltung der Gruppe erfolgt. Wenn man Resolventen bilden will von möglichst niedrigem Grade, so hat man Theiler der Gruppe P aufzusuchen von mög- möglichst kleinem Index, also von möglichst hohem Grade. Will man aber eine Reduction der Gruppe herbeiführen, so hat man einen Normaltheiler von P aufzusuchen. §. 164. Reduction der Galois'schen Gruppe durch Adjunction beliebiger Irrationalitäten. Die Aufgabe der Lösung einer algebraischen Gleichung wird nach der Galois'schen Auffassung durch eine andere ersetzt,
556 Vierzehnter Abschnitt. §. 164. nämlich durch Adjunction von algebraischen Grossen möglichst einfacher Natur eine Zerfällung der Galois'sehen Kesolvente, also eine Erniedrigung des Grades der Gruppe herbeizuführen. Wir stellen jetzt die Frage so. In dem ursprünglichen Körper £1 ist die Galois'sche Resolvente gif) irreducibel. Der Körper £1 soll zu einem anderen Körper £1' so erweitert werden, dass g(t) reducibel wird. £1' soll dabei ein algebraischer Körper über £1 sein, und es muss also nach §. 150 eine algebraische Grosse s geben, so dass £1' = £l(s) wird. Die Grosse s wird Wurzel einer gewissen irreducibeln Gleichung in £1 sein, die wir mit A) Z(«) = 0 bezeichnen wollen. Nehmen wir an, in dem Körper £l(s) sondere sich von g(t) der irreducible Factor B) 9i® = 9x(t,e) ab, der die Wurzel t = q hat. Den Grad von gt (t, e) wollen wir mit q bezeichnen und die Wurzeln mit C) q, p!, Qt, . . ., p2_i, so dass D) 9l (t, «) = (*- Q) (t - Ql) . . . (t - (.9_0. Zunächst ist nun nachzuweisen, dass die in der Gruppe P enthaltenen Substitutionen (q, q), (q, ¦ pi), (q, Qz) . . . (Q, p2-i) eine Gruppe Q bilden. Um dies zu zeigen, setzen wir wie früher (§. 153) und bedenken, dass dann die Gleichung eine Wurzel, nämlich t = p, mit gt(t), gemein hat, und mithin, da gt (t) in £1 (s) irreducibel ist, durch gx (t) theilbar ist. Daraus folgt, dass, wenn p! und p2 irgend zwei der Wurzeln C) sind, auch &t (q2) = Qs unter diesen Wurzeln enthalten ist. Es ist aber die Substitution (p, p3) aus (q, q%) und (p, p2) zusammengesetzt, und damit ist die Gruppeneigenschaft von Q nachgewiesen. Wir bezeichnen den Index von Q mit j und setzen E) P=H-
•§. 164. AdjunctioH beliebiger Irrationalitäten. 557 DasProduct D) gestattet nun die Substitutionen der Gruppe Q, und wenn also ¦ty wie oben eine zu dieser Gruppe gehörige Func- Function in N bedeutet, so lässt sich nach §. 162, 2. die Function g1 (t, s) rational durch -ty ausdrücken, d.h. g1(t, s) ist eine Function von t im Körper jtea Grades Sl(ty), und soll demnach durch g(t, ty) bezeichnet werden. Die Grosse -ty ist eine der Wurzeln einer irreducibeln Glei- Gleichung vom Grade j <6) cp («) = 0, deren übrige Wurzeln ty, -ty2, ..., ty—i sind, und nach §. 162, A3) ist g(t) in die Factoren zerlegbar G) g(t) = g(t, ty) g(t, ty). .. g(t, %_0. Nun ist und aus G) folgt, dass diese Gleichung nicht bestehen bleibt, wenn auf der linken Seite für ¦ty eine der anderen Wurzeln von F) gesetzt wird. Denn sonst müsste g(t, ty) mit einem der übrigen Factoren auf der rechten Seite von G) identisch sein. Man kann also für t einen solchen rationalen Werth setzen, dass die Gleichung (8) g(t, u) - gi(t, s) = 0 nur die eine Wurzel u = i\> mit der Gleichung F) gemein hat. Der grösste gemeinschaftliche Theiler von F) und (8) ist dann in Bezug auf m linear, und wenn man darin u =.i\> setzt, so ergiebt sich, dass ty rational durch s ausdrückbar ist. Der Körper ß (ty) ist also sicher ein Theiler des Körpers ß (s). Der Grad des Körpers ß(s), d. h. der Grad der Hülfsgieichung 1 (e) = 0, ist daher ein Vielfaches von j und niemals niedriger als j. Wenn der Grad der Hülfsgieichung gleich j ist, was z. B. dann immer eintritt, wenn der Grad von % eine Primzahl ist, so ist £l(s) mit £l(ty) identisch, d. h. s ist auch rational durch ¦ty ausdrückbar. In diesem Falle sind die conjugirten Werthe a, a1: . . ., £,_! die sämmtlichen Wurzeln von % = 0, und man erhält sie, wenn man in dem rationalen Ausdruck von s durch ¦ty die Function ty durch jede der conjugirten Functionen ¦ty, -ty±,..., ¦tyj—x ersetzt. Es kann also e selbst für ¦ty genommen werden, und man findet eine Zerlegung g (t) = g (t, s) g (t, e{) ...g (t, £,-_!>
558 Vierzehnter Abschnitt. §. 165. Die Grossen s, a15 £2> • • •> %—1 gehören sämmtlich dem Körper ß(p) an. Diese Resultate sind von grosser Wichtigkeit und verdienen besonders hervorgehoben zu werden. Nach Kronecker heissen, wenn F(x) = 0 die gegebene Gleichung ist, und N der zugehörige Galois'sche Körper, die Grossen von N die der Gleichung F(x) = 0 natürlichen Irrationalitäten. Wir haben dann den Satz: Jede mögliche Reduction der Galois'schen Gruppe wird herbeigeführt durch Adjunction einer natürlichen Irrationalität. Ist j der Index der r§ducirten Gruppe in Bezug auf die ur- ursprüngliche, so kann die Reduction nicht ein- eintreten durch Adjunction eines Körpers von niedrigerem als dem jtea Grade. Der Grad kann aber gleich j sein, und dann ist die adjungirte Irrationalität eine natürliche. Ist der Grad des adjungirten Körpers grösser als j, so ist er ein Vielfaches von j. §. 165. Imprimitive Gruppen. Wir machen von unseren allgemeinen Sätzen Anwendung auf Gruppen von besonderer Natur. Zunächst nehmen wir die imprimitiven Gruppen. Wir haben im §. 158 gesehen, dass, wenn f(x) ¦== 0 eine irreducibele Gleichung nten Grades mit im- imprimitiver Gruppe ist, sich n so in zwei Factoren r, s zerlegen lässt, dass die Wurzeln in s Reihen von je r Gliedern zerfallen: A = cc, «15 . . ., «,._!, A) -B = ß-> ßl, • • •) ßr- li 8 = ö, <jx, . . ., ör_1? und dass durch die Permutationen der Gruppe P die Grossen der einzelnen Reihen nicht von einander getrennt, sondern nur unter einander permutirt werden, während andererseits die Reihen wieder unter sich permutirt werden.
§. 165. Imprimitive Gruppen. 559 Unter den Permutationen der Galois'schen Gruppe P von f(x) wird es nun gewisse geben, deren Inbegriff wir mit Q bezeichnen, die die einzelnen Keinen A, B, . . ., S an ihrer Stelle lassen, und nur die Indices in jeder Reihe permutiren. Diese Permutationen bilden für sich eine Gruppe, da durch die Zu- Zusammensetzung von zweien unter ihnen die Reihen A, B, . . ., 8 nicht vertauscht werden können. Diese Gruppe Q ist ein Norm al- altheiler von P. Denn ist % eine Permutation von Q, und % eine aus P, so gehört die zusammengesetzte Permutation jc~1xji wieder zu Q, weil die Permutation unter den A, B, . . ., 8, die durch jc~1 hervorgerufen ist, durch % nicht geändert und durch jr wieder rückgängig gemacht wird. Die Gruppe Q ist intransitiv, und durch Adjunction einer zu Q gehörigen Function i\> wird nicht nur die Galois'sche Resolvente reducibel, sondern die Function f(x) selbst zerfällt in s Factoren vom rten Grade, B) f{X) = fa (X, *) /,, (X, i>)...fa (X, *). Die Wurzeln von fa (x, i\>) = 0 sind die Grossen «, und die Galois'sche Gruppe dieser Gleichung besteht aus allen Permu- Permutationen, die durch Q unter den a hervorgerufen werden. Denn das Product fa = (x — k) (x — «0 i . . (x — av_x) gestattet die [Permutationen von Q, und kann daher rational durch i\> ausgedrückt werden. In j eder in £1 {ty) rationalen Gleichung zwischen den Grossen A können die a so permutirt werden, wie es die Gruppe Q verlangt, und wenn eine Function der oc diese Permutationen gestattet, so ist sie in &(il>) enthalten. Die Grosse ijj ist, wenn j der Index des Theilers Q von P ist, Wurzel einer Partialresolvente j^n Grades %{u) = 0, die eine Normalgleichung und also ihre eigene Galois'sche Resolvente ist (§. 162). Bezeichnen wir ihre Wurzeln mit C) *, *i, ^2, • • o fy-u so besteht die Galois'sche Gruppe dieser Resolvente aus den Substitutionen D) (</>, </>),. w, <M, «>, *2)... (</>, ^), die durch die Permutationen der Nebengruppen E) Q, Qxu Qn2,.. ., Qjij-! hervorgerufen werden. Jede dieser Nebengruppen bringt eine gewisse Permutation unter den Reihen A, B, . . ., S hervor, und
560 Vierzehnter Abschnitt. §. 165. zwar sind diese Permutationen alle von einander verschieden; denn wenn etwa durch nx und n2 dieselbe Permutation unter den Reihen hervorgerufen wird, so gehört j^^F1 zu Qi nn& Q^v Qjt2 sind nicht verschiedene Nebengruppen. Die Permutations- Permutationsgruppe der Partialresolvente % (w) = 0 ist also mit der Gruppe der Permutationen, die durch P unter den Reihen A, B, . . ., S hervorgerufen werden, isomorph. Verstehen wir unter Qa den Inbegriff der Permutationen von P, durch die die Reihe A nicht verschoben wird, so ist Qa gewiss eine Gruppe. Ist Tip eine Permutation, durch die die Reihe A in die Reihe B übergeht, die nach der Voraussetzung der Transitivität in P existiren muss, so ist Qanp eine Neben- Nebengruppe zu Qa, durch die A in B übergeht. jiJ 1 Qa%p = Qp ist eine zu Qa conjugirte Gruppe, und zwar die, durch deren Permu- Permutation die Reihe B nicht verschoben wird. Auf diese Weise erhalten wir die conjugirten Gruppen Qa, Qp, ¦ ¦ ., Qa, •deren grösster gemeinschaftlicher Theiler die vorhin betrachtete Gruppe Q vom Index j ist. Eine zu Qa gehörige Function ya ist die Wurzel einer Glei- Gleichung vom steu Grade in ß, <p (y) — 0, und die übrigen Wurzeln yp, . . ., ya gehen aus ya hervor durch Anwendung der Permu- Permutationen der Nebengruppen QaJtp, . . ., Qtt%a. Die vorhin gefun- gefundene Gleichung %{u) =0 vom Grade j ist die Galois'sche Resolvente der Gleichung <p (y) = 0. Wir haben oben bemerkt, dass die Gruppe der Gleichung % (w) = 0 vom Grade j isomorph ist mit der Gruppe der Permutationen, die durch P unter den Systemen der A, B, ..., S hervorgerufen werden. Da aber wegen der Transitivität von P auch diese Systeme transitiv in einander übergehen, und da den Vertauschungen der A, B, . . ., S die Vertauschnngen der ya, yp, . . ., ya entsprechen, so ist <p (y) in £1 irreducibel. Die gleichzeitige Adjunction sämmtlicher Wurzeln von <p (y) hat denselben Erfolg wie die Adjunction der Function ty, näm- nämlich den, die Gruppe der Gleichung f(x) = 0 von P auf Q zu reduciren. Durch Adjunction von ytt sondert sich von f(x) ein rationaler Factor f(x, ya) ab, dessen Wurzeln die Grossen der Reihe A sind, und durch Adjunction der übrigen y erhält man die Zerlegung <6) f{x) = f{x, ya) f{x, y?) ... fix, ya),
§. 165. Imprimitive Gruppen. 561 und diese Functionen f{x, ya), f(x, yfi, . . ., f(x, ya) stimmen überein mit den Factoren in B), fa (x, $), fp (x, ty), . . .,fa (x, ty). Zu bemerken ist hierbei noch, dass f(x, ya) im Körper £1 (ya) irreducibel ist. Denn wegen der vorausgesetzten Irreducibilität von f{x) giebt es in P Permutationen, durch die et in jedes cti übergeführt wird, und diese Permutationen gehören zu Qa. Wenn also eine rationale Function <p (x, ya) für x = et verschwindet, so muss jedes <p(a.i,ya) gleich Null sein, d. h. cp(x,ya) muss durch f(x, ya) theilbar sein. Es folgt aber hieraus nicht, dass f(x, ya) = fa(x, tl>) auch im Körper ß(i/>) irreducibel ist. Dies sind dieselben Sätze, wie im §. 158. Es ist dort noch gezeigt, dass man für ya eine Function von a allein nehmen kann, worauf wir nicht nochmals eingehen wollen. Von Interesse ist es aber, den Zusammenhang der Galois'- schen Gruppen der einzelnen Factoren f(x, ya), f(x, y^),..., f(x, ya) zu verfolgen. Wir haben schon oben gesehen, dass man die Gruppe des Factors/(a;, ya) im Körper S&ty) erhält, wenn man alle Permutationen der cc aufsucht, die durch Q hervorgerufen werden. Wir wollen diese Gruppe mit Pa bezeichnen, und ebenso für die anderen Factoren die Zeichen Pß, . . . , Pff gebrauchen. Wir greifen aus P irgend s — 1 Permutationen jiß, . . ., jia von der Art heraus, dass durch itp die Reihe A in JB etc., durch na die Reihe A in S übergeht, und wir wollen nun der Einfach- Einfachheit halber, was offenbar noch vollkommen freistellt, die Bezeich- Bezeichnung der ß, . . ., ö so gewählt annehmen, dass itp, . . ., na fol- folgende Vertauschungen hervorrufen: «„, «!, • • ., «,—A /«oi Ki-> • ¦ •» «r \ßo, ßu . . ., ßr-J' ' ' ' \Ö0, Öl, • • -, «r Es sei nun % irgend ein Element von Q, das unter den cc die Vertauschung bewirkt, dann ist ebenfalls in Q enthalten, und es wird durch %p unter den ß die Vertauschung /on fßo, ßl, ¦ • o ßr-l\ W ~ \K, ßa, ¦ ¦ -, ßar_/ also unter den Indices der ß genau dieselbe Permutation her- hervorgerufen, wie durch % unter den Indices von a. Nehmen wir Weber, Algebra. I. 36
562 Vierzehnter Abschnitt. §. 165. (ß) und ein zugehöriges xp als gegeben an, so ergiebt jißXßitf1 wieder x, so dass also die durch Q hervorgerufenen Permu- Permutationen der ß genau übereinstimmen mit denen, die unter den oc hervorgerufen werden; und dasselbe gilt für die übrigen Reihen. Damit ist aber der folgende Satz bewiesen: 1. Bei einer irreducibeln imprimitiven Gleichnng können in den einzelnen Reihen die Wurzeln so bezeichnet werden, dass die Theilgleichungen fix, ya) = 0, f(x, y?) = 0, . . .fix, ya) — 0 im Körper ß($) alle dieselbe Gruppe bekommen. Will man die Bezeichnung der Wurzeln nicht in der an- angegebenen Weise wählen, so werden die Gruppen wenigstens isomorph. Wir stellen noch die Frage, die gewissermaassen dnrch die Umkehrung dieses Satzes beantwortet wird: Wann hat eine transitive Gruppe einen intransitiven Normaltheiler? Ist P eine transitive Permutationsgruppe, und Q ein intran- intransitiver Normaltheiler von P, so möge A = «. «1, • • •» «r-l eines der Systeme sein, deren Elemente durch Q nur unter ein- einander vertauscht werden, so jedoch, dass die Elemente von A durch Q transitiv verbunden sind, d. h. dass durch Permutationen aus Q jedes oc in jedes andere <x übergehen kann. Wenn nun durch ein Element % aus P die Grossen A in S = ß, ßi, . . ., ßr-l übergehen, so müssen diese Elemente entweder alle mit den oc übereinstimmen, oder alle von den oc verschieden sein; denn durch die Gruppe %~~ 1Qit, die nach Voraussetzung mit Q iden- identisch ist, werden die ß nur unter einander vertauscht, und zwar ebenso wie die m, also transitiv. Wenn also in B nur ein Theil der « vorkäme, so würden gegen die Voraussetzung durch Q diese a mit anderen nicht in A vorkommenden Grossen ver- vertauscht werden. Sind durch die A nicht alle Elemente erschöpft, auf die sich die Permutationen von P erstrecken, so giebt es, da P transitiv ist, eine Permutation %, durch die A in ein ganz davon verschiedenes System JB übergeführt wird. Ist x eine Permu- Permutation aus Q, so wird durch die gleichfalls zu Q gehörige Per- Permutation %~~xx% dieselbe Vertauschung unter den Indices der ß
§. 165. Imprimitive Gruppen. 563 hervorgerufen, wie durch x unter den Indices der «. Daraus folgt, dass durch Q auch die ß nur unter einander permutirt werden. Wenn mit A und B die Elemente noch nicht erschöpft sind, so kann man in derselben Weise ein drittes System C bilden, das durch %' aus A und durch %~ 1n' aus B entsteht, und das weder mit A noch mit B ein Element gemein hat. So fährt man fort, bis alle Elemente erschöpft sind, und kommt zu folgendem Satze: 2. Eine transitive Gruppe hat nur, wenn sie im- imprimitiv ist, einen von der identischen Gruppe verschiedenen intransitiven Normaltheiler. Die Systeme der Intransitivität des Normaltheilers sind Systeme der Imprimitivität der gegebenen Gruppe. In Bezug auf die Gleichungen können wir mit Kücksicht auf 1. den Satz 2. auch so aussprechen: 3. Eine irreducible Gleichung /(*)= 0 zerfällt, wenn sie durch Adjunction aller Wurzeln einer Kesolvente reducibel wird, in mehrere irredu- irreducible Factoren von gleichem Grade und von gleicher Gruppe. Wenn also eine irreducible primitive Gleichung durch Ad- Adjunction der Wurzeln einer Kesolvente reducirt wird, so zerfällt sie in lineare Factoren, d. h. sie ist vollständig gelöst. Dieser Fall tritt immer ein, wenn der Grad der Gleichung f(x) = 0 eine Primzahl ist, weil eine solche Gleichung nicht imprimitiv sein kann. 36*
Fünfzehnter Abschnitt. Oyklische Gleichungen. §. 166. Cubische Gleichungen. Wir wollen von dem jetzt gewonnenen Standpunkte aus zu- zunächst die Auflösung der Gleichungen dritten und vierten Grades betrachten. Die Gruppe der Permutationen von drei Ziffern besteht aus sechs Elementen, nämlich aus der identischen Permutation 1, aus zwei dreigliedrigen Cyklen und drei Transpositionen: m 1 @, 1, 2) @, 2, 1) w A, 2) B, 0) @, 1). Die drei ersten 1, @, 1, 2) @, 2, 1) bilden die alternirende Gruppe, sie besteht aus den Potenzen der cyklischen Permutation it = @, 1, 2): B) xo = 1, 3t, 3t", und ist also eine cyklische Gruppe. Es seien nun a, a1, «2 die drei Wurzeln der cubischen Gleichung: C) fix) = x* — ax* -\- hx — c = 0. Legen wir den Körper ß zu Grunde, der aus allen rationalen Functionen der unabhängigen Veränderlichen a, b, c besteht, so ist A) die Gruppe dieser Gleichung; wenn wir aber D) Vl) = (« — «j) (« — os2) («! — os2)
§. 166. Cubische Gleichungen. 565 adjungiren, worin E) B = a*b* -\- 18abc — iaH — 4fr* — 27c2 die Discriminante der Gleichung C) ist, so reducirt sich die Gruppe auf B). In dem Körper ß', der durch diese Adjunction aus ß ent- entsteht, kann jede Wurzel rational durch jede andere ausgedrückt werden, denn es ist aj -)- «3 = a — k also 2W « « + 2 «2 = a — cc — jj und hierin können die Vertauschungen jc, sz2 ausgeführt werden. Die cubische Gleichung ist also nach Adjunction von YD ihre eigene Galois'sche Resolvente. Alles dies bleibt gültig, wenn der Rationalitätsbereich irgend ein specieller Körper ß ist, in dem a, b, c und VT) enthalten sind, wenn nicht f(x) selbst in ß reducibel ist, also eine ratio- rationale Wurzel hat. Denn ausser sich selbst und der cyklischen Gruppe B) hat die Gruppe A) nur noch intransitive Theiler, nämlich die Einheitsgruppe und drei Gruppen vom Typus 1,A,2). Wollen wir die cubische Gleichung nun auflösen, d. h. auf eine reine cubische Gleichung zurückführen, so müssen wir eine Function v der Wurzeln suchen, die zwar nicht selbst, deren Cubus aber die cyklische Permutation n gestattet. Eine solche Function kann aber nur existiren, wenn die dritten Einheits- Einheitswurzeln, oder, was dasselbe ist, V—3, dem Körper ß adjungirt wird; denn v muss durch Anwendung von % eine dritte Einheits- wurzel als Factor erhalten. Durch diese Adjunction kann eine Reduction der Gruppe nicht eintreten, weil die Gruppe B) ausser der Einheitsgruppe keinen Theiler hat und die Reduction auf die Einheitsgruppe nicht durch eine quadratische, sondern nur durch eine cubische Gleichung geschehen kann (§. 164). Wir setzen also £— 2 ' — 2
566 Fünfzehnter Abschnitt. §. 167. und . . v = a t-{- £0«! -J- £2os2 ^ ' v' = a -\-£2a,x -j- £os2; dann ist der Erfolg von n der, dass v in s2v, v' in sv' über- übergeht, während v3, v'3 und vv' ungeändert bleiben, also in dem Körper ii' enthalten sind. Es hat keine Schwierigkeit, diese Grossen zu berechnen. Setzen wir zur Abkürzung A = K2^ -\- O5j2O!2 -j- OS^OS, so ist a- A' = Yd, und für v3 erhält man 1K — «3 _|_ aZ _j_ a9 _j_ 6 0! 05! 0S2 -\- 3 £ A -\- 3 £2 A', also und ebenso Es ist aber auch A0) W' = OS2 -\- O5j2 -|- O!22 «05! OSOS2 OSx 0S2 = a2 — 3&, und aus (8), (9), A0) erhält man in Uebereinstimmung mit einer früheren Formel [§. 52, (8)] 27D = 4(«2 _ 36K — Ba3 — 9ab + 27cJ. Fügt man zu G) noch die Gleichung a = 0! -f~ 0«! -{- O62, so findet man in Uebereinstimmung mit der Cardanischen Formel: 3a=a-\-v-\-v' 3 osj = a -(- £2v -|- £v' 3os2= a -j- ev-f- £2^'. §. 167. Permutationsgruppen von vier Elementen. Ein gutes Beispiel für die Galois'sche Theorie bieten die Gleichungen vierten Grades, wo die Verhältnisse so einfach
§. 167. Permutationsgruppen von vier Elementen. 567 liegen, dass sich Alles leicht übersehen lässt, und doch die wich- wichtigsten Erscheinungen der Gruppenbildung zu Tage treten. Aus vier Ziffern, 0, 1, 2, 3, lassen sich 24 Permutationen bilden, und so hoch ist also der Grad der Galois'schen Gruppe der allgemeinen Gleichung vierten Grades im Körper der rationalen Functionen der Coefficienten (vgl. den Schluss von §. 156). Wir stellen diese Permutationen durch ihre Cyklen in folgender Weise dar, wobei 1 die identische Permutation bedeutet: A) P = 1, @, 1), @, 2), @, 3), A, 2), A, 3), B, 3) @,1) B, 3), @,2) A,3), @,3) A,2) @, 1, 2), @, 1, 3), @, 2, 3), A, 2, 3) @, 2, 1), @, 3, 1), @, 3, 2), A, 3, 2) @, 1, 2, 3), @, 1, 3, 2), @, 2, 3, 1) @, 2, 1, 3), @, 3, 1, 2), @, 3, 2, 1). Wir haben also in P ausser der identischen Permutation sechs Transpositionen, acht dreigliedrige, sechs viergliedrige Cyklen und drei Permutationen von der Form @, 1) B, 3), die wir Transpositionspaare nennen wollen. In P ist die alternirende Gruppe vom Grade 12 als Normal- theiler enthalten. Diese Gruppe kann keine einzelne Transposi- Transposition und keine viergliedrige cyklische Permutation enthalten, und es bleiben also folgende übrig: B) Q=l, @,1)B, 3), @,2)A,3), @,-3) A, 2) @, 1, 2), @, 1, 3), @, 2, 3), A, 2, 3) @, 2, 1), @, 3, 1), @, 3, 2), A, 3, 2). Wir wollen nun alle vorhandenen Tlieiler der Gruppe P aufsuchen. Dabei lassen wir die intransitiven Qruppen beiseite, die alle entweder aus drei oder aus sechs Permutationen von nur drei Elementen, oder aus den Permutationen von zwei Paaren von zwei Elementen bestehen. Wir suchen also nur die transi- transitiven Theiler von P auf. Ausserdem beschränken wir uns bei einem System conjugirter Theiler auf einen Repräsentanten, aus dem die anderen ja durch Ziffemvertauschung hergeleitet werden können (§. 160, 4.). Eine wesentliche Vereinfachung wird durch folgende beiden Sätze herbeigeführt: 1. Wenn eine transitive Permutationsgruppe von vier Ziffern einen dreigliedrigen Cyklus enthält,
568 Fünfzehnter Abschnitt. §. 176. so ist sie die symmetrische oder die alternirende Gruppe, und 2. wenn sie zwei Transpositionen mit einem gemein- gemeinsamen Element enthält, so ist sie die symme- symmetrische Gruppe. Wenn nämlich in einer Gruppe des Cyklus @, 1, 2) vor- vorkommt, und die Gruppe ausserdem transitiv ist, so enthält sie eine Permutation st, durch die 0 in 3 übergeführt wird. In dem dreigliedrigen Cyklus 3r~1@, 1, 2)n kommt also gewiss die Ziffer 3 vor; er ist also etwa @, 1, 3), und demnach haben wir in der Gruppe @, 1, 2), @, 1, 2J = @, 2, 1) @, 1, 3), @, 1, 3J = @, 3, 1) @,1, 2) @,3, 1) =A,2,3) A, 2, 3J = A, 3, 2) @, 3, l)@, 1, 2) = @, 3, 2) @, 3, 2J = @, 2, 3), d. h. alle überhaupt vorhandenen dreigliedrigen Cyklen. Dem- Demnach kommen alle Permutationen der, alternirenden Gruppe in der fraglichen Gruppe vor (§. 160), und sie ist also entweder damit erschöpft, oder sie enthält noch eine Permutation der zweiten Art und ist dann die symmetrische Gruppe. Enthält aber eine transitive Gruppe die beiden Transposi- Transpositionen @, 1), @, 2), so enthält sie auch @, 1) @, 2) = @, 1, 2), und damit die ganze alternirende Gruppe, und da sie auch eine Transposition enthält, so ist es die symmetrische Gruppe. Wenn also nun eine von P und Q verschiedene Gruppe zunächst eine Transposition @, 1) enthält, so muss sie, wenn sie transitiv ist, auch B, 3) enthalten, und demnach die ganze in- intransitive Gruppe vierten Grades: C) 1, @,1), B,3), @,1) B, 3). Soll also die Gruppe transitiv sein, so müssen noch weitere Permutationen dazu kommen. Diese können nach 1. und 2. nur unter den viergliedrigen Cyklen oder unter den Transpositionspaaren gesucht werden. Ein viergliedriger Cyklus aber, in dem 0 und 1 cyklisch an einander stossen, kann nicht vorkommen, weil er, mit @, 1) combinirt, einen dreigliedrigen Cyklus geben würde, wie: @,1, 2, 3) @,1) = A,2, 3).
§. 167. Permutationsgruppen von vier Elementen. 569 Ebenso können nicht 2 und 3 cyklisch an einander stossen, und es bleiben also nur folgende übrig: D) @, 2, 1, 3), @, 3, 1, 2), @, 3) A, 2), @, 2) A, 3). Wenn aber von diesen Permutationen eine zu C) hinzu- hinzutritt, so müssen auch alle anderen aufgenommen werden, denn es ist @, 1) @, 2, 1, 3) = @, 3) A, 2) B, 3) @, 2, 1, 3) = @, 2) A, 3) @, 1) B, 3) @, 2, 1, 3) = @, 3, 1, 2), und man kann also durch Vermittelung der Transpositionen @,1) und B, 3) jede der Permutationen D) aus jeder anderen her- herleiten. Aus der Voraussetzung also, dass überhaupt in einem von P und Q verschiedenen transitiven Theiler von P eine Trans- Transposition vorkommt, folgt, dass dies die Gruppe achten Grades E) Px = 1, @, 1), B, 3), @, 2)A, 3), @, 1)B, 3), @, 3)A, 2) @, 2, 1, 3), @, 3, 1, 2) oder wenigstens eine damit conjugirte sein muss. Dass Pj wirklich eine Gruppe ist, erkennt man leicht, wenn man je zwei seiner Permutationen zusammensetzt. Es giebt drei verschiedene mit Px conjugirte Gruppen, die man erhält, wenn man statt von @, 1), B, 3) von den Trans- Transpositionen @, 2), A, 3) oder @, 3), A, 2) ausgeht. Der Durch- Durchschnitt dieser drei Gruppen ist ein Normaltheiler von P und zugleich von Q, nämlich F) & = 1, @,2) A,3), @,1) B, 3), @,3) A,2). Wenn eine transitive, von P und Q verschiedene Gruppe keine Transposition enthält, so enthält sie entweder keinen vier- gliedrigen Cyklus, und ist dann mit F) identisch, oder sie ent- enthält einen viergliedrigen Cyklus und enthält dann auch die ganze cyklische Gruppe, wie G) P3 = 1, @, 1, 2, 3), @, 2) A, 3), @, 3, 2, 1). Enthält eine solche Gruppe noch einen zweiten viergliedrigen Cyklus, etwa @, 1, 3, 2), so ist sie wegen @, 1, 2, 3) @, 1, 3, 2) = @, 3, 1) die symmetrische Gruppe. Enthält sie aber ausser P2 noch eine der Permutationen von F), etwa @, 1) B, 3), so ist wegen @, 1, 2, 3) @, 1) B, 3) = A, 3) Pj in ihr enthalten.
570 Fünfzehnter Abschnitt. §. 168. Aus P2 gehen ebenfalls drei conjugirte Gruppen -hervor, die aber ausser 1 keinen gemeinschaftlichen Theiler haben. Es giebt also ausser P, Q, Px, Qlt P2 und den mit Px und P2 conjugirten Theilern von P keine transitiven Permutationsgruppen von vier Elementen. Unter den intransitiven Gruppen verdient noch die Gruppe C): P3 = 1, @, 1), B, 3), @, 1) B, 3), hervorgehoben zu werden, die gleichfalls zu einem System von drei conjugirten Gruppen Anlass giebt. Ausserdem giebt es von intransitiven Gruppen nur noch die Permutationsgruppen von nur zwei oder drei Elementen. §• 168. Auflösung der biquadratischen Gleichungen. Die verschiedenen Methoden der Auflösung der biquadratischen Gleichungen unterscheiden sich von einander durch die Reihenfolge, in der die verschiedenen Divisoren der Gruppe P benutzt werden. Es seien «, %, «2, «3 die Wurzeln der biquadratischen Gleichung A) f(x) = x4- — öj xs -\- a2 x2 — a3 * -}- «4 = 0. Wir bezeichnen mit D die Discriminante und setzen B) 1/5 = (a — Kj) (« — os2) (« — «3) («i — «2) (oj, — a3) («a — a3). Ausserdem erinnern wir noch an die Ausdrücke für die In- Invarianten (§. 77) :• C) A = al — 3 «iös + 12 ttt D) B = 27 al % -j- 27 a| -}- 2a| — 72 a2a4 — 9^^^, durch die man D in der Form ausdrückt: E) 27D = 4 J.3 — ^2. Adjungirt man zunächst ]/D, so reducirt sich die Gruppe der Gleichung auf Q, und wenn man weiter eine zu Qx gehörige Function sucht, so wird durch diese die Gruppe auf Qx reducirt. Da <2X innerhalb Q den Index 3 hat, so wird eine solche Func- Function von einer cubischen Gleichung abhängen, und zwar, da Qx ein Normaltheiler von Q ist, von einer Normalgleichung. Nehmen wir z. B. F) y = (« — «j) («2 — a3)
§. 168. Biquadratische Gleichungen. 571 als eine zu Q± gehörige Function, so sind die beiden dazu con- jugirten Werthe y1 = (a — O («3 — Kj) K }- 2/2 = (« — «3) («1 — «2)- Diese drei Grossen sind die Wurzeln einer cubischen Partial- resolvente, deren Coefficienteri als Invarianten von / leicht zu bilden sind (vergl. §.70, 71, wo die Grossen y, yu y% mit U, V, W bezeichnet waren). Die Gleichung wird [§. 70, G)] (8) y* — Ay+VD = 0. Ihre Discriminante ist i?2, und für das Product der Wurzel- Wurzeldifferenzen kann man das Vorzeichen leicht (durch Vergleichung der Glieder höchster Ordnung nach der Gauss'sehen Definition, §. 49, oder auch aus §. 70) bestimmen. So erhält man: (9) (y — 2/i) (y ~ 2/2) B/1 — 2/2) = B. Die Gleichung (8) ist, wie schon bemerkt, eine Normal- Normalgleichung, und es ist leicht, yu y2 durch y wirklich darzustellen. Wenn man (9) mit (y^ — y2) multiplicirt, so findet man durch Benutzung der Formeln Ü/-2/i)B/-2/2) = 31/3_^, (y1-y2y = y2 A0) = 6J.t/3 + 92/ V-D — 4J.2 2/i + 2/2 = - 2/, wodurch y1, y% bestimmt sind. Adjungirt man also ferner- fernerhin y, so reducirt sich die Gruppe der biquadratischen Glei- Gleichung auf & = 1, @,2) A,3), @,1) B, 3), @,3) A,2). Diese Gruppe ist imprimitiv (und zwar nach drei Arten), und die Gleichung kann jetzt durch zwei Quadratwurzeln gelöst werden. Am besten gelangt man dazu auf folgendem Wege. Die drei Grossen Vl = (« + «i — «2 — u3y A1) v% = (a — «j -)- os2 — «3J «3 = (« — «1 — «2 + «sJ gestatten alle die Permutationen der Gruppe $1 und sind daher rational durch y darstellbar. Man erhält diese Darstellung folgendermaassen: Es ist
572 Fünfzehnter Abschnitt. §. 168. vi — «i2 — 4 (os -f- «i) («2 -(- os3) 2/l — 2/2 = (« + «l) («2 + «3) — 2@50! + «2«3) «2 .= (« + «l) («2 + W3) + ««1 + «2«3, also, wenn man v2, i>3 ebenso bildet: 31»! = 3af — 8a2 — ^Vi ~\- ^y% A2) 3v2 = 3«^ — 8% — 4y, +4«/ 3v3 = 3a/ — 8a2 — 4y + 4^. Es kommt aber noch eine Relation hinzu, die sich daraus ergiebt, dass das Product (o! -f- «! — «2 — Kg)(a — «! + «2 — «3)(« «1 W2 + ai) eine symmetrische Function der « ist, die man leicht gleich — ai ~\~ 4= «1 «2 — ^ «3 findet. Wir machen also die Vorzeichen der drei Wurzelgrössen durch die Relation A3) — VvlVv^Vvl = af — 4ai«2 + 8a3 von einander abhängig und setzen: 05-1-0!! —- 0S2 0S3 Vv^ = 05 — 05! + O52 — O53 Vv3 = 05 — 06! — O62 -f- O63 a1=a-fai + a2-l- O53. Daraus ergiebt sich dann: 4 os =«!-{- Vv, -|- Vv2 -f- A5) 405! = % + l/vT—Vv2— 4 O52 = «i ]/v1 -\- 4os3 = «i — ]/v1 — Wenn man der VD in (8) das entgegengesetzte Zeichen giebt, und y durch —y ersetzt, so muss man nach A0) yu y2 mit — y%, — y1 vertauschen. Es bleibt also vt ungeändert und v2 und v3 werden mit einander vertauscht. Nimmt man für y eine andere Wurzel der Gleichung (8), etwa y1: so muss wegen (9)' Vn 2/2 durch j/2, y ersetzt werden und die Grossen vlt v2, v3 erleiden eine cyklische Permutation, wodurch auch die Grossen osi, os2, oh, in A5) cyklisch vertauscht werden. Wenn man endlich die Vorzeichen von Vi^, vv%, Vv3 anders wählt, aber so, dass
§. 168. Biquadratische Gleichungen. 573 immer A3) erfüllt bleibt, so treten unter den Grossen A5) gleich- gleichfalls gewisse Permutationen ein. Welche Werthe man den mehrwerthigen algebrai- algebraischen Grossen, die bei der Auflösung auftreten, auch beilegen mag, die Ausdrücke A5) stellen also immer die Wurzeln unserer biquadratischen Gleichung in irgend einer Reihenfolge dar. In Bezug auf die übrigen Wege zur Auflösung der biquadra- biquadratischen Gleichung können wir uns kürzer fassen. Wenn wir zunächst nicht ]/D adjungiren, sondern eine zu der Gruppe Px gehörige Function, so erhalten wir eine cubische Resolvente, die nicht Normalgleichung ist. Wir können für diese Function etwa y2 wählen, was der cubischen Gleichung A6) 2/6 — 2 Ay* -+- A*y* — D = 0 genügt. Besser noch nimmt man als Wurzeln der cubischen Resolvente A7) g = yx — y2, 0l=y2—y, 02= V — Vv Es gehört dann g zur Gruppe Pv wie schon aus der zweiten Gleichung A0) hervorgeht. Aus (8) und (9) erhält man für g die cubische Gleichung A8) ^ — 3 Ag + .5 = 0. Man erhält ferner, wenn man A9) u = aa1 -\- a2a3 setzt, g = a2 — 3 u, und daraus die Resolvente für u: B0) u* — a2u2 -)- (%% — Aa^u -)- 4a2«4, — «i2«* — a>l = 0. Wenn man aber von der Gleichung A8) oder B0) nicht eine, sondern alle Wurzeln ädjungirt, so gelangt man wieder zu der Gruppe Qt. Die Grossen vu v2, vz sind nach A2) unmittelbar durch g, gu g2 ausgedrückt, und man kann also die Formeln A5) zur Darstellung der u auch nach diesem Verfahren anwenden. Man kann ferner zur Lösung der biquadratischen Gleichung dadurch gelangen, dass man zuerst eine zu der cyklischen Gruppe P2 gehörige (eine cyklische) Function der Wurzeln ädjungirt, wie z. B. B1) w = aal ~f" aia23 ~f" a2a32 -+- a3a-.
574 Fünfzehnter Abschnitt. §. 168. Diese Function ist sechswerthig und ist also die Wurzel einer Gleichung sechsten Grades. Diese Gleichung sechsten Grades ist aber, wie man leicht sieht, imprimitiv, und kann auf eine Gleichung dritten Grades und auf zwei Quadratwurzeln zurückgeführt werden. Diese Gleichung sechsten Grades ist eine Totalresolvente, und zwei ihrer Wurzeln genügen zur rationalen Darstellung der Wurzeln u. Die Form dieser Resolventen wird nicht einfach. Man kann endlich noch darauf ausgehen, durch Adjunctiön einer zur Gruppe P3 gehörigen Function § die Function f(x) direct reducibel zu machen und in zwei quadratische Factoren zu zerlegen. Eine solche Function § ist gleichfalls die Wurzel einer Gleichung sechsten Grades, die sich aber auch durch Im- primitivität auf den dritten und zweiten Grad reducirt. Nimmt man z. B. B2) ! = « + «!-lax =1V^T, so sind von den sechs Wurzeln je zwei entgegengesetzt gleich, so dass eine cubische Gleichung für g2 resultirt. Durch eine dieser Grossen | la,ssen sich dann die quadratischen Factoren von f(x) rational darstellen. Nehmen wir zur Vereinfachung der Formeln at = 0 an und B3) f(x) = x* -f- ax* -f- bx + c, so wird ««1 -\~ «2«3 = I2 also B4) | ss die beiden quadratischen ~ + I» + a) = 0 ! J so dass die beiden quadratischen Factoren von/(#) folgende werden B5) und für £2 ergiebt sich aus B4) durch Multiplication die cubische Gleichung oder B6) |e + 2a|* + {aP- — 4c)g« — b>- — 0.
§. 169. Abel'sohe Gleichungen. 575 Nimmt man für § irgend eine Wurzel dieser Gleichung sechsten Grades, so giebt jede der Gleichungen B5) ein Paar Wurzeln von f(x) = 0. §• 169. Abel'sche Gleichungen. Der Grad einer transitiven Permutationsgruppe von m Ziffern ist immer durch m theilbar und also niemals kleiner als m. Denn ist P eine solche Gruppe, und Qo der Inbegriff der Per- Permutationen von P, die die Ziffer 0 ungeändert lassen, so ist auch Qo eine Gruppe und also ein Theiler von P. Nun kann man wegen der vorausgesetzten Transitivität in P ein System von Permutationen 3tu 3t2, . . ., %m—x finden, die 0 in 1, 0 in 2, ... 0 in m — 1 überführen, und dann ist Qo nrx das System aller der Permutationen von P, die 0 in 1 verwandeln. Danach ist A) P = Qo + Go*i + öo*. H h Go*»-i, also der Grad von P gleich dem Producte aus m und dem Grade von Qo. Die Galois'sche Gruppe einer irreducibeln Gleichung ist also niemals von niedrigerem Grade, als die Gleichung selbst. Eine Normalgleichung haben wir früher durch die Be- Bestimmung erklärt, dass sie irreducibel sei, und dass jede ihrer Wurzeln rational durch jede andere ausdrückbar sein sollte (§. 152). Daraus ergiebt sich, dass die Gruppe einer Normal- Normalgleichung sich auf die identische Gruppe reduciren muss, wenn man eine Wurzel adjungirt; und umgekehrt ist eine Gleichung, deren Gruppe so beschaffen ist, wenn sie zugleich irreducibel ist, immer eine Normalgleichung. Nun reducirt sich P durch Adjunction der Wurzel a0 auf Qo, durch ax auf jcj1 $03Ti etc. und wenn also P die Gruppe einer Normalgleichung sein soll, so ist nothwendig und hin- hinreichend, dass Qo die Einheitsgruppe ist, dass also durch x, 3tly 3t2, . . ., 3tm—i die Gruppe erschöpft sei. Wir haben also: Damit eine irreducible Gleichung eine Normal- Normalgleichung sei, ist nothwendig und hinreichend, dass der Grad der Gruppe mit dem Grade der Gleichung übereinstimme.
576 Fünfzehnter Abschnitt. §. 169. Wir betrachten hier zunächst die specielle Art von Gleichun- Gleichungen, zu denen die von Gauss zuerst aufgelösten Kreistheilungs- gleichungen gehören, die Abel allgemein auflösen gelehrt hat, und die wir also nach ihm Abel'sche Gleichungen nennen wollenx). Eine Gleichung mien Grades F(x) = 0 mit den Wurzeln a, av a2, . . ., «OT—i heisst eine Abel'sche Gleichung, wenn jede Wurzel, rational durch eine von ihnen, a, ausdrückbar ist, und wenn, falls B) «l=@l(«), «2 = ®2 («).-. «m-l = @m-l(«) diese rationalen Ausdrücke sind, die Bedingung C) @Ä@fc(«) = ®k®h(<x) für je zwei dieser Functionen besteht. Es bedeutet hierin das Zeichen ©/.©^(a), dass die Function ®h(%) für das Argument x = ®k(u) gebildet werden soll. Selbst- Selbstverständlich bezieht sich diese ganze Definition auf einen be- bestimmten als rational angenommenen Körper Sl. Zu diesen Gleichungen gehören gewiss, wenn Sl der Körper der rationalen Zahlen ist, die Gleichungen, durch die die Einheitswurzeln be- bestimmt sind. Denn jede mte Einheitswurzel ist, wenn r eine primitive unter ihnen ist, in der Form ®h(r) = ** enthalten, und es ist Ebenso gehört, wenn der Körper Sl die mten Einheitswurzeln r enthält, die reine Gleichung x™ — a = 0, in der a dem Körper Sl angehört, zu den Abel'schen Gleichungen. Denn ist u eine ihrer Wurzeln, so sind alle Wurzeln in der Form ah = rh u enthalten; es ist also @h(x) = rhx und daher ®h®h(x) = @fc@ft(a;) = r*+*x. Wenn die Function F(x) nicht irreducibel ist, so hat sie einen bestimmten irreducibeln Factor q> (x), der die Wurzel es hat, und unter den Wurzeln von <p(x) = 0 bestehen gleichfalls x) Abel, Memoire sur une classe d'equations resolubles algebriquement. Crelle's Journal f. Mathematik, Bd. 4, 1829. Oeuvres completes, nouvelle edition, 1881, Bd. 1, S. 418.
§. 169. Abel'sche Gleichungen. 577 die durch B) und C) ausgesprochenen Relationen. Es ist daher q>(x) = 0 nach §. 15.2 eine Galois'sche Resolvente Ton F(x) = 0, und wenn <p(x) = 0 gelöst ist, so sind damit alle Wurzeln von F(x) bekannt. Es genügt also, wenn wir uns auf die Betrachtung irreducibler Abel'scher Gleichungen beschränken. Die Galois'sche Gruppe einer Abel'schen Gleichung, sei sie irreducibel oder nicht (wenn nur ihre Wurzeln von einander verschieden sind), hat die Eigenschaft, dass bei der Zusammen- Zusammensetzung ihrer Permutationen das commutative Gesetz gilt; sie ist also eine commutative Gruppe. Es seien nämlich D) «, «j = 0J («), «2 = @2 («), . . ., «„_! ==: @m_! («) die Wurzeln von F(x) und E) «, «' = @», «" = @"(«), . . . die darunter enthaltenen Wurzeln des irreducibeln Factors cp(x) von F(x). Da, wie schon bemerkt, <jp(#) = 0 eine Galois'sche Resol- Resolvente ist, so besteht die Gruppe der Gleichung aus den Substitu- Substitutionen des Körpers £l(cc), also aus den Substitutionen F) ö = («, «), ö' = («, «'), ö" = («, «")... Diese Gruppe befolgt aber das commutative Gesetz; denn es sei «' = («,«') = [«,©'(«)] 6"= («,«") = [«.«»]; dann ist nach §. 154 ö' ö" = [«, @' («)] [©' («), @' @"(«)] = [«, @' @"(«)] 6"ö' = [«,©"(«)] [®"(«), @"@'(a)] = [«,©"©' («)]. Wegen C) ist daher ö'ö" = ö"ö', worin ö', 6" zwei beliebige der Substitutionen 6 sein können. Folglich ist die Gruppe der Substitutionen des Körpers Sl(u) und damit auch die isomorphe Permutationsgruppe der Gleichung F(x) = 0 commutativ. Es gilt nun auch das Umgekehrte, wobei aber die Irre-, ducibilität vorausgesetzt sein muss. Eine irreducible Gleichung cp(x) = 0 mit commu- tativer Gruppe ist eine Abel'sche Gleichung. Es seien a, csj, a2, ..., «OT—i die Wurzeln von q>(x) = 0, und P die Gruppe dieser Gleichung, die wegen der Irreducibilität von Weber, Algebra. I. 37
578 Fünfzehnter Abschnitt. §. 169. <p{%) transitiv ist, und die wir jetzt ausserdem als commutativ annehmen. Es sei Q der Theiler Tori P, der das Element 0 in Ruhe lässt. Ist dann sr» eine Permutation, die die Ziffer 0 in * überführt, so ist nr1 Q it{ die Gruppe der Permutation in P, die die Ziffer * nicht ändern. Da nun aber in jeder Zusammen- Zusammensetzung von Permutationen aus P die Componenten vertauscht werden können, so ist d. h. die Gruppe Q lässt auch die Ziffer * ungeändert. "Wegen der Transitivität vonP kann aber * jede der Ziffern 1, 2,..., m— 1 bedeuten, folglich besteht Q aus der einzigen identischen Permu- Permutation, und es giebt in P ausser der identischen keine Permu- Permutation, die eine Ziffer ungeändert lässt. Adjungirt man aber eine Wurzel u, so reducirt sich die Gruppe P auf eine Gruppe, die a ungeändert lässt, also auf die Einheitsgruppe, und die Gleichung ist gelöst, d. h. jede Wurzel von q>(%) kann durch eine beliebige unter ihnen, «, rational ausgedrückt werden. Demnach ist cp (x) = 0 eine Normalgleichung und somit ihre eigene Galois'sche Eesolvente. Ist cck = ®fc(a), so besteht die Galois'sche Gruppe dieser Gleichung aus den Substitutionen und es ist Da die Gruppe commutativ sein soll, so muss @ft@&(«) = @&@Ä(«) sein, d. h. <p (%) = 0 ist eine Abel'sche Gleichung. Dies ist der Grund, weshalb die commutativen Gruppen auch Abel'sche Gruppen genannt werden (§. 155). Es folgt also noch aus dem oben gegebenen Satze über die Gruppe von Normalgleichungen, dass bei einer transitiven Abel'sehen Permutationsgruppe die Zahl der Permutationen mit der Zahl der vertauschten Ziffern übereinstimmt. Hier haben wir die Irreducibilität der gegebenen Gleichung . vorausgesetzt. Wollen wir auch reducible Gleichungen F(x) = 0 mit commutativer Gruppe P berücksichtigen, so betrachten wir einen irreduciblen Theiler cp (x) von F(x). Die Gruppe P' der Gleichung q>(%) = 0 erhält man, wenn man die Permutationen von P auf die Wurzeln von q>{x) anwendet, und wenn daher P commutativ ist, so ist es auch P'.. Daraus ergiebt sich:
§.. 170. Cyklische Gleichungen. 579 Hat eine reducible Gleichung .F(a;) = 0 eine com- mutative Gruppe, so giebt jeder irreducible Thei- ler q> von F eine Abel'sche Gleichung <p = 0. Es ist aber nicht nothwendig, dass die Wurzeln' des einen Theilers q> rational durch die eines anderen ausdrückbar sind, und daher können wir, im Hinblick auf unsere Definition, die GleichungF(x) = 0 nicht immer als eine Abel'sche bezeichnen. Es ist endlich noch zu bemerken, dass bei einer commuta- commutativen Gruppe jeder Theiler normal ist, da ja immer Jt-1%jt = %isk, wenn it und % beliebige Elemente einer commutativen Gruppe sind. •§. 170. ßeduction der Abel'schen Gleichungen auf cyklische. Wir haben schon vorhin gesehen, dass in einer transitiven Abel'schen Gruppe ausser der identischen keine Permutation vor- vorkommt, die eine Ziffer ungeändert lässt. Daraus aber folgt noch ein anderer Satz. Nehmen wir an, eine Permutation % einer solchen Gruppe sei in ihre Cyklen zerlegt, und der Cyklus, der die wenig- wenigsten Glieder enthält, sei ein r-gliedriger. Dann wird jcr die Glieder dieses Cyklus ungeändert lassen und muss also die iden- identische Permutation sein. Daraus folgt aber, dass auch alle übrigen Cyklen von sr, wenn noch andere vorhanden sind, aus r Gliedern bestehen müssen, also: 1. Eine Permutation einer transitiven Abel'schen Gruppe enthält nur Cyklen von gleicherGliederzahl. Die Anzahl r der Glieder eines Cyklus muss ein Theiler von m sein, wenn m der Grad der Gruppe ist, und wenn m = r s ist, so ist s die Anzahl der r-gliedrigen Cyklen, aus denen % besteht. Ist nun P die Gruppe einer Abel'schen Gleichung F(x) = 0, so nehmen wir irgend eine nicht identische Permutation it aus P heraus und zerlegen sie in ihre Cykeln worin jeder der Cyklen y sich auf r Wurzeln der Gleichung F(x) = 0 bezieht. Wir wollen diese Wurzeln so anordnen, dass y = («, al5 «a, . . ., ccr-i) ysl (, i, 25 1 rl) wird. 37
580 Fünfzehnter Abschnitt. §. 170. Ist nx irgend eine Permutation von P, so ist wegen der Vertauschbarkeit C) 1C^l1tTCl = lt. Nach dem Satze über die Bildung der Permutationen sr^sTsr, (§. 160, 4.) darf also ic nicht geändert werden, wenn die Permu- Permutationen tcx in den Cyklen von % ausgeführt werden. Da aber die Cyklen vollständig bestimmt sind, abgesehen von ihrer An- Anordnung und von ihrem Änfangselement, so ergiebt sich, dass durch Anwendung irgend einer Permutation % aus P die Ele- Elemente der einzelnen Cyklen y nicht von einander getrennt, sondern nur unter einander (cyklisch) vertauscht und ausserdem die Cyklen mit einander vertauscht werden können. Die Gruppe ist also, wenn s > 1 ist, imprimitiv. Eine rationale Function der Argumente a, au . . ., ar—i, die ihren Werth nicht ändert, wenn die u der cyklischen Permu- Permutation y und ihren Wiederholungen unterworfen werden, heisst eine cyklische Function der a. Bezeichnet man mit D) ca = ij> («, «!, . . ., ar-i) eine solche cyklische Function und mit E) ca, cax, ra2, . . ., ras_! die conjugirten Werthe von oo, setzt also z. B. F) cal = ^(ß,ß1,...,ßr_1), so sind diese Grossen nach §.165 die Wurzeln einer irreducibeln Gleichung sten Grades: #(*) = 0, deren Gruppe man erhält, wenn man die durch P hervorgerufenen Permutationen der Grossen E) aufsucht. Man erhält aber die durch «x «2 unter den Grossen E) bewirkte Permutation, wenn man die beiden durch nx und sr2 einzeln hervorgerufenen Permutationen zusammensetzt, und die Gruppe der Permutationen von E) ist daher auch commutativ. Daher ist <&(t) = 0 eine Abel'sehe Gleichung sten Grades. Adjungirt man ca, so zerfällt F{x) in s Factoren rte? Grades: F(x) = F(x,co)F(x,(ol) . . . *>,(»,_!), von denen der erste, F(x,ca), die Wurzeln a, a1? . . ., u.r-\ hat, und die Gruppe der Gleichung F(x, ca) = 0 besteht allein aus der Periode der cyklischen Permutation y. Wir wollen eine Gleichung, deren Gruppe aus einem einzigen Cyklus und seinen Wiederholungen besteht, eine cyklische
§. 170. Cyklische Gleichungen. 581 Gleichung nennen, so dass die cyklischen Gleichungen der einfachste Specialfall der Abel'sehen Gleichungen sind. "Wir haben dann also bewiesen, dass die Lösung jeder Abel'sehen Gleichung zurückgeführt wird auf die Lösung einer Abel'sehen Gleichung niedrigeren Grades und auf die Lösung einer Reihe cyklischer Gleichungen. Diesen Satz kann man wieder auf die Hülfsgieichung stm Grades anwenden, und damit so lange fort- fortfahren, bis diese Hülfsgieichung sich auf den ersten Grad redu- cirt. Damit erhält man also das Resultat: Die Lösung einer Abel'schen Gleichung lässt sich immer auf die Lösung einer Reihe von cyklischen Gleichungen zurückführen, deren Grade Theiler des Grades der gegebenen Gleichung sind. Es ist nicht nothwendig, in die Definition der cyklischen Gleichungen die Irreducibilität mit aufzunehmen. Wir können daher allgemein die Definition so fassen: Eine Gleichung mten Grades F(x) = 0 mit m verschiedenen Wurzeln heisst eine cyklische Gleichung im Körper £1, wenn ihre Wurzeln a, ax, a2) • • -1 «m-1 nicht rational sind, aber sich so anordnen lassen, dass die cyklischen Functionen der Wurzeln in £1 rational sind. Wenn also G) n = (cc, ax, a2, . . ., Km_x) ist, so muss jede Function in Sl enthalten sein, die die Permu- Permutationen der cyklischen Gruppe (8) C = 1, n, 3r2, n\ . . ., rf"-1 gestattet. Die Galois'sche Gruppe einer cyklischen Gleichung ist entweder die Periode C selbst und dann ist die Gleichung irreducibel, oder sie ist ein Theiler von C; sie besteht dann, wenn e und / zwei ganzzahlige Factoren von m sind und m = ef ist, aus den Permutationen (9) Ce = 1, tc% tc*°, . . ., n(f-»e, und die cyklische Gleichung zerfällt in e Factoren ften Grades. Denn nehmen wir eine zu der Gruppe C gehörige Function t(>(tt, ccu ..., «m_i), so ist diese nach Voraussetzung gleich einer Grosse in ß, die wir mit a bezeichnen. Auf die rationale Gleichung -ip = a ist dann keine nicht in C enthaltene Permu-
582 Fünfzehnter Abschnitt. §. 170. tation anwendbar, und folglich kann die Gruppe der Gleichung keine. anderen Substitutionen enthalten als solche, die in C vor- vorkommen. Wenn nun tt in der Gruppe der Gleichung vorkommt,, so ist sie mit C identisch, und da C transitiv ist, ist die Gleichung irreducibel. Ist aber ne die niedrigste Potenz von «, die in der Gruppe der Gleichung vorkommt, so ist Ce diese Gruppe. Ce ist aber, wenn e > 1 ist, intransitiv, und die Gleichung ist reducibel. Die cyklischen Gleichungen haben, wie alle Abel'schen Gleichungen, die Eigenschaft, dass jede Wurzel rational durch jede andere ausdrückbar ist. Hier lassen sich diese Ausdrücke folgendermaassen cyklisch anordnen. Sind u, ot^, cc2, ..., «„,_! die Wurzeln der cyklischen Gleichung F(x) = 0, so ist die ganze Function (m — l.)ten Grades von x F{X) (J^ + _^_ _| 1 « J) = W \X « ' X «i1 [ X — «m —1/ ungeändert durch die Permutation it und also in Sl enthalten. Wenn wir .darin x = cc, ax, . . ., am—x setzen und das Zeichen einführen, so folgt A0) a1 = @(a), a2 und dies gilt, mag F(x) reducibel oder irreducibel sein, wenn nur F(x) und F'(x) keinen gemeinsamen Theiler haben. Wenn der Grad der cyklischen Gleichung keine Primzahl ist, so lässt sie sich durch das oben auf Abel'sehe Gleichungen im Allgemeinen angewandte Verfahren noch weiter reduciren. Wenn nämlich m = ef irgend eine Zerlegung von m in, zwei Factoren ist, so zerfällt die Permutation sre in e Cyklen y von je / Gliedern: y ==. («, cce, aie, . . .. «(/-De), Yi = («1, «e + l, «2C + 1» • • •> a(f—l)e + l), Ye — 1 =; \ae—1, a2e —1, a3e —1, • • •, am—l)- Nun bestimmen wir eine zu dem ersten dieser Cyklen ge- gehörige Function tp und setzen rj = 4>(u, cce, cc.2e, . . ., a(/_i) e), e + l, «2C + 1, • • •, «(/-l)e + l),' i, «2e-i, «3e-l, • • ., «m—l)-
§. 170. Cyklische Gleichungen. 583 Diese Grossen sind alle von einander verschieden, aber bei einer cyklischen Permutation ihrer Argumente bleiben sie un- geändert. Durch Anwendung der Permutation % gehen die Grossen ¦>?, ¦%,¦%) • • ••, Ve-i cyklisch in einander über, und nach der Voraussetzung sind also ihre cyklischen Functionen, und folglich auch ihre symmetrischen Functionen rational. Sie sind also die Wurzeln einer cyklischen Gleichung eten Grades, während F(x) in e Factoren ftea Grades F(x) = F(x, rj)F(x, tIi)... F(x, ne-i) zerfällt, deren jeder eine cyklische Gleichung /ten Grades für die Wurzeln eines der Cyklen y ergiebt. Denn setzen wir etwa F1 = (X — a) (x — O . . -. (x — M(/_i)e), so gestattet diese Function die Permutationen der Periode von y. Also gestattet sie auch die Permutationen der Gruppe, die nach Adjunction von rj zur Galois' sehen Gruppe unserer Gleichung wird, die ja nur aus Potenzen von y, y^ . . ., ye—i bestehen kann. Es ist daher nach dem Satze von Lagrange (§. 162, 2.) I1 rational durch rj darstellbar, also Fr = F(x, rj). Die Gleichung F(x, rj) = 0 ist aber wieder cyklisch in £1 (¦»?), da die cyklischen Functionen ihrer Wurzeln diesem Körper angehören. Die Auflösung der cyklischen Gleichungen mten Grades ist hierdurch abhängig gemacht von der Lösung cyklischer Glei- Gleichungen, deren Grade die Primfactoren von m sind. Ist also z. B. m eine Potenz von 2, so wird die Lösung durch eine Reihe von Quadratwurzeln bewerkstelligt. Auf diesem Wege hat Gauss zuerst die Kreistheilungsgleichungen behandelt1). Wir knüpfen endlich noch die für die Folge wichtige Be- Bemerkung hier an, dass für einen Primzahlgrad die Begriffe der Normalgleichung und der cyklischen Gleichung zu- zusammenfallen. Denn jedenfalls ist eine cyklische Gleichung vom Primzahlgrad, da sie irreducibel ist, eine Normalgleichung. Und wenn umgekehrt der Grad n einer Normalgleichung, der zu- zugleich der Grad der Gruppe dieser Gleichung ist, eine Primzahl ist, und % eine nicht identische Permutation dieser Gruppe, so ist der Grad von je, der ja ein Theiler von n sein muss, gleich n, und die Gruppe der Gleichung ist 1, ä, sz2, . . ., je"—1, also cyklisch. Gauss, Disquisitiones arithmeticae, Sectio VII.
584 Fünfzehnter Abschnitt. §. 171. "§• 171. Resolventen von Lagrange. Die Methode der Auflösung cyklischer Gleichungen, die wir jetzt kennen lernen wollen, ist gleichmässig auf Primzahlgrade und zusammengesetzte Grade anwendbar. Man bedient sich dazu gewisser Ausdrücke, die unter dem Namen der Resolventen von Lagrange bekannt sind1), die bei allen Untersuchungen über die algebraische Auflösung von Gleichungen von grossem Nutzen sind. Es sei F(x) = 0 eine Gleichung mit den Wurzeln a, «1? «2, • • •, «M-i. Wir bezeichnen mit £ irgend eine mte Einheits- Einheitswurzel und -führen die Bezeichnung ein A) (£,«) = « + £«! + £2«2 -| 1- £"i-1am_j. Die so definirten Summen sind es, die man die Lagrange'- schen Resolventen nennt. Wenn diese Functionen für alle mtea Einheitswurzeln £ bekannt sind, so ist auch die Gleichung selbst gelöst, denn es ist nach §. 141 F) B) 2sk = m oder = 0, je nachdem k durch m theilbar ist oder nicht, und daraus folgt C) worin sich die Summen über alle m1™ Einheitswurzeln s er- erstrecken. Man kann auch die anderen Wurzeln in gleicher Weise ausdrücken: D) maK=S £-*(£,«), so dass in der That Alles auf die Kenntniss von £ und der Functionen (£, «) zurückgeführt ist. Die Summen B) und C) lassen sich noch in etwas anderer Weise darstellen, da die sämmtlichen mieu Einheitswurzeln Potenzen einer primitiven unter ihnen sind. Versteht man also unter s eine festgehaltene primitive mte Einheitswurzel und unter X einen Index, der ein volles Restsystem nach dem Modul m, etwa die a) Lagrange, Reflexions etc., s. S. 508. Früher haben wir unter Resolventen auflösende Gleichungen verstanden, hier sind es auflösende Functionen.
§. 171. Resolventen von Lagrange. 585 Zahlenreihe 0, 1, . . ., m — 1 durchläuft, so können wir für die Gleichungen B), C) setzen ma Wir untersuchen diese Resolventen (£, «) zunächst als Functionen der m unabhängigen Veränderlichen «, und wollen wegen der einfacheren Darstellungsweise der Formeln übereinkommen, dass ccm = «0 = a, und überhaupt cch = ak sein soll, wenn h = Je (mod m) ist. Wir erhalten dann das ganze System der Variablen «, wenn wir in Kh den Index ein volles Restsystem nach dem Modul m durchlaufen lassen. Für diese Resolventen gelten nun die folgenden Sätze. 1. Wenn man auf die Indices der cc die cyklische Permutation ¦% = @, 1, . . ., m — 1) anwendet, so geht (£, a) in e~ 1(e,a) über, und durch die Permu- Permutation sr* geht (£, «) in e~k(e, «) über. Dies zeigt die Definition A) der Resolventen unmittelbar. Wir verstehen ferner unter v einen beliebigen positiven Exponenten und bilden nach dem polynomischen Lehrsatze (£,«)". In der entwickelten Potenz setzen wir sm = 1 und ordnen dann nach Potenzen von e. Es ergiebt sich dann ein Ausdruck von der Form E) (s, *y = Ap + £ A{» + s'A? H -h £«-i A^_x = i £ä4">, 0,tn—1 worin die JW, A^, . . .^-A^^^ Formen vtea Grades mit ganz- ganzzahligen Coefficienten und den Variablen et sind, aber von £ un- unabhängig. Auch hier möge Ah = A1c sein, so oft h = 7c (mod m). Danach beweisen wir den Satz: 2. Wenn man auf die Indices der a die cyklische Permutation ¦% anwendet, so erleiden die Indices der Coefficienten von (e,a)v die cyklische Permu- Permutation Jtr, d. h. JLW geht in A^+v über. Um dies nachzuweisen, bemerken wir, dass die Formel E) für jede beliebige mte Einheitswurzel s, einschliesslich 1, richtig bleibt, und hiernach folgt aus B) F)
586 Fünfzehnter Abschnitt. §. 171. Macht man auf der rechten Seite dieser Formel in den Indices der « die Permutation ä, so ergiebt sich nach 1. d. h. A!jp geht in ^\v über, wie im Satz 2. behauptet ist. Der Satz 2. ist ein specieller Fall eines allgemeinen Theo- Theorems. Entwickeln wir ein Product von beliebig vielen Factoren («, k)v (e\ «)ri (s\ «)V2 . . ., worin v, vx, v2 ... positive, Xt, lt . . . beliebige ganze Zahlen sind, und ordnen es, wie vorher («, «)r, nach Potenzen von s, so mag sich ergeben G) (£, «)• (e\ «)n (eV, «y* •••=it»B», 0,m —1 worin die Bj,- von £ unabhängige Formen von der Variablen « sind. Da auch diese Entwickelung für alle mten Einheitswurzeln s gilt, so kann man die Formel B) anwenden und erhält = 27 £-*(£, ct)v (e\ «)vi (s% a)r« . . ., woraus man nach 1. schliessen kann, dass B^ durch die Sub- Substitution % in übergeht. Wir haben also: 3. Die Permutation ä, auf die Indices der cc an- angewandt, ruft unter den Indices der Coeffi- cienten des nach e geordneten Productes (8) 0, ct)v (a^i, «)"i (s\ «)'s . . . die Permutation nv + xivi + h*2--- hervor. In diesen Theoremen kann die Permutation ¦% wiederholt werden; sie bleiben richtig, wenn ¦n, durch irgend eine Potenz von n ersetzt wird und sie gelten, was auch £ für eine mte Ein- Einheitswurzel sein mag. Ist aber e eine imprimitive Einheitswurzel, so treten gewisse Vereinfachungen ein, die wir noch kennen lernen müssen. Ist e ein Theiler von m, m — ef, und £ irgend eine ete Einheitswurzel, so wird der Ausdruck A) (£,«) = « -\~ £«! +-"''-l- £e-1«e-l ' -\~(Xe
§. 171. Resolventen von Lagrange. 587 Wir führen nun die Bezeichnung ein: V == « + K« + «2e + • * • + «</-l)e ¦J?e-1 = «e-1 + «Se-l + «3e-l + • • • + «m-U und nennen diese Grossen, .wie es Gauss in dem speciellen Falle der Kreistheilung gethan hat, , die /- gliedrigen Perioden der Grossen «. Es wird dann A0) . (£, a) = n +•£% + £2%H h«6^-!, wofür wir auch (£, vf) schreiben können. Die Anwendung der Permutation % auf die Indices von « bringt unter den nach dem Modul e zu nehmenden Indices der Grossen rj die cyklische Permutation A1) y = @, 1, 2, . . ., e — 1) hervor. Entsprechend der Formel A0) können wir die Formeln E) und G) nun auch so schreiben: (e, nY = worin dann EW = J.W _|_ J.W 4- . U J.W (r& = JBjt -f~ -Be + ü ~f" " • " ~|- -^(/-De + S ist, und JSjW und G^ ganze homogene Functionen der « sind, die sich auch als Functionen der rj darstellen lassen. Die Grossen ¦»?&, E^\ Gk bleiben ungeändert, wenn die Permu- Permutation 3re auf ihre Indices angewandt wird, d. h. wenn, der Index um ein Vielfaches von e verändert wird, und wir können also jetzt.die Sätze 2. uud 3. so vervollständigen: 4. Ist e eine beliebige ete Einheitswurzel, und e ein Theiler von m, so erleiden, wenn auf die Indices von « die Permutation ¦% ausgeübt wird, die Indices k der Coefficienten E]p von (s, i])v. .die Permutation yr; und die Indices der Coeffi- Coefficienten G des Productes (s, rj)v (e\ rj)vi (e\ ij)r2 . . . die Permutation y + h^+k^--- . ,. ; .
588 ¦ Fünfzehnter Abschnitt. §. 172. §. 172. Auflösung der cyklischen Gleichungen. Die Lagrange'sehen Resolventen führen durch Anwendung der jetzt bewiesenen Sätze zu der Auflösung der cyklischen Gleichungen, genauer gesagt, zur Reduction auf reine Glei- Gleichungen. Wir verstehen jetzt unter den a nicht mehr beliebige Variable, sondern die Wurzeln einer cyklischen Gleichung, so dass die cyklischen Functionen der cc als bekannte Grossen zu betrachten sind. Nach dem Theorem §. 171, 2. sind die Coefficienten von {s,cc)m cyklische Functionen der cc. Verstehen wir unter a0, aL, . . ., am_a Grossen in £1 und setzen A) ^a = o, + Ol 6* + a, c" H 1- a..! «*»-»*, so folgt aus diesem Theorem Bezeichnet darin s eine primitive mte Einheitswurzel, so sind in der Form (e\ cc) alle Resolventen enthalten. Bemerken wir noch, dass A, «) = a als die Summe der Wurzeln zu den bekannten Grossen gehört, so haben wir nach §• 171 C) w m m C) ma = a + Vti + V*. H h und damit also u durch Radicale mten Grades ausgedrückt, die unter den Wurzelzeichen aussei* den Grossen, die von Hause aus in £1 vorkommen, noch mto Einheitswurzeln enthalten. Jedes dieser Radicale hat, für sich betrachtet, m verschie- verschiedene Werthe, die sich um mte Einheitswurzeln als Factoren von einander unterscheiden. Geben wir jeder mtea Wurzel alle ihre Werthe, so erhalten wir aus C) viele verschiedene Werthe von «, unter deuen nach §. 171, D) die sämmtlichen Wurzeln «, «15 «2, . . ., «OT_i vorkommen. Aber die Zahl der so aus C) abgelei- abgeleiteten Ausdrücke ist viel grösser, und es handelt sich noch darum, die beizubehaltenden von den abzusondernden zu unterscheiden. Am einfachsten führt dazu folgender Weg.
§. 172. Auflösung cyklischer Gleichungen. 589 Wenden wir das Theorem §. 171, 3. auf nur zwei Factoren an, so ergiebt sich, dass (£, «)' (£*, «>« eine Function in £1 (e) ist, wenn v -\- l (i = 0 (mod m). Setzen wir also fi ¦= 1, v = m — A, so folgt, wenn eine Grosse in £&(e) bedeutet, also nach B): D) l—l und dadurch sind, wenn e eine festgehaltene primitive mte Ein- Einheitswurzel bedeutet, die sämmtlichen in C) vorkommenden Kadi- m cale rational durch eines von ihnen, Vih, ausgedrückt. Giebt man diesem einen seine m verschiedenen Werthe, so erhält man aus C) gerade die m verschiedenen Werthe «. Es ist nur ein Ausnahmefall, in dem dieses Verfahren nicht anwendbar ist, das ist der, wenn tf»a = 0 ist. Wir können aber durch eine kleine Modification des Verfahrens uns von einem solchen Ausnahmefall frei machen. Dem schicken wir Folgendes voraus. Es sei p eine in in aufgehende Primzahl und m=pn; wie oben sei £ irgend eine festgehaltene primitive mte Einheits- Einheitswurzel. Dann giebt es immer ein durch p nicht theilbares A., so dass (e\ a) von Null verschieden ist. Denn bilden wir nach der Formel §. 171, D) die Differenz ccn — «0, so erhalten wir m («„ — O = V (£-">¦ — 1) (e\ «). 0, m — 1 Nun ist aber s~nX — 1 immer = 0, so oft k durch p theilbar ist, uud wenn (e\ «) in allen anderen Fällen, wo also l nicht durch p theilbar ist, verschwindet, so ist «„ = «„, gegen die Voraussetzung, dass die « alle verschieden sein sollen. Es giebt also wenigstens ein durch p nicht theilbares A, so dass (V, «) von Null verschieden ist. Nun zerlegen wir m in seine Primfactoren und setzen m = "
, 590 Fünfzehnter Abschnitt. §. 172. worin 2>i, jpa •¦'• • Potenzen von verschiedenen Primzahleu sind. Wir setzen noch m = p1m1 = p2m2 . . ., und wählen, was nach dem soeben Bewiesenen stets möglich ist, /tj relativ' prim zu pu X2 relativ prim zu p2 etc., so dass 0*1, «), (e\ a) . . . von Null verschieden sind. Dann ist nach dem Theorem §. 171, 3.: E) (s\ k) (s\ «)mir 0^, a)™** • ¦ • == %i eine in £l(e) enthaltene Grosse, wenn F) l = — v (^ mi -\- /l2 m2 -\- • ¦ •) (mod m). Es ist aber (e\ «)"i eine Wurzel p^ Grades einer Func- tion 9Dj in ß(£), und wir setzen also G) (£\ «)«i = V<Pi, (e\ «)"• = V< Dann wird nach E) (8) ' Nun ist X1m1 -f- /t2m2 -|- • •• relativ prim zu m, da m2 . . . durch 2>i theilbar, Aj»«! zu j)j relativ prim ist, und also erhält man aus F) für jedes X eine nach dem Modul m völlig bestimmte Zahl v. Wenn wir also die Ausdrücke (8) in C) einsetzen und den p\ pj Radicalen Vfi, V<Pü • • • alle ihre Werthe beilegen, so erhalten wir für « genau m verschiedene Werthe und nicht mehr. Die letzten Resultate können wir benutzen, um eine Form der Darstellung der Wurzeln « in etwas verallgemeinerter Gestalt abzuleiten, die Abel an der angeführten Stelle mittheilt, und die sich auf den Fall bezieht, wo der Körper Sl reell ist, d. h. aus lauter reellen Zahlen besteht. Die Functionen cp, il>, %, wie wir sie oben benutzt haben, sind dann zusammengesetzt aus reellen Zahlen und aus der Einheitswurzel e, die man durch die Theilung der Kreisperipherie in m gleiche Theile findet; man kann etwa ^ 1% . . . 2% s ¦= e m = cos \- t sin — m ' m setzen. Die Function g)t geht, wenn £ in £—1 verwandelt wird, in den conjugirt imaginären Werth über, den wir mit <pi bezeichnen.
§. 172. Auflösung cyklischer Gleichungen. 591 Wir wollen eine positive Grosse ^ und einen Winkel ®x so annehmen, dass (9) K = ?! &\ <p[ = Pl e-*ei, oder ¦q>1 = Qt (cos ©! + * sin 0t) <pi = qx (cos ®! — » sin ©!), woraus noch folgt: A1) tf. = Vl qpj. Nun ist A2) (e*, «) (£~S «) = ± o, eine Grosse des Körpers ß(a_) (nach §. 171, 3.), und zwar ist es, da sie sich beim Uebergang zum conjugirt imaginären Werth, d. h. bei der Vertauschung von s mit s~l nicht ändert, eine reelle Grosse. Das Vorzeichen wollen wir so bestimmen, dass % positiv ist. Es ist also nach A1), da q? positiv ist, und es ergiebt sich daraus, dass bei ungeradem m jedenfalls das obere Zeichen gilt; bei geradem m kann auch das untere ein- eintreten. Es ist also A3) ?! = V^r, wo die Quadratwurzel positiv zu nehmen ist. Ferner sind reelle Grossen in -ß(f), und es ergiebt sich aus A0) b r ¦ A5) 008®!=-^, sin@!= l woraus noch die Relation folgt: «T = 1>? + c>. Demnach ergiebt sich und nun verfährt man mit den Functionen q>2 u. s. f. ebenso. Man bestimmt also ®2 • • • aus einem System von Gleichungen wie A5) und erhält, wenn man noch A6) mt ©! + ot2 ®2 -| = ® setzt, nach (8)
592 Fünfzehnter Abschnitt. §. 172. A7) Viin = vV«?1 a%* .. .) e ~™v %i. Nach A5) können wir setzen und wenn wir also durch Zerlegung in den reellen und imagi- imaginären Bestandtheil A8) F, -f id)"! (&2 -f ict)* • • - = B -\-iC erhalten und A9) a^a^ ¦ • • ¦= A setzen, so folgt nach A6) _ B + iC also B0) V1m cos® — B, VÄm sin© = G, und B1) Wi = V^^ (cos ^ - ,• sin ^) X,. Der Winkel ® ist durch B0) nur bis auf ein Vielfaches von 2% bestimmt, und wenn man also & -f- 2hn für @ setzt und h von 0 bis m — 1 gehen lässt, so erhält man aus B1) die m ver- &v schiedenen Werthe der Wurzelgrösse. Die Functionen cos — , . ®v ... , ,. , , , 0.0 und sin — können noch rational durch cos —, sin — aus- m mm gedrückt werden. Die Auflösung der cyklischen Gleichungen in dem reellen Körper £1 ist also auf Folgendes zurückgeführt. Man adjungirt zunächst dem Körper £1 die mte Ein- Einheitswurzel e (Theilung der Kreisperipherie in m gleiche Theile). Hierauf sind A, B, G bekannt. Man adjungirt ferner die positive Quadratwurzel "VA, dann sind cos® und sin® durch B0) bekannt. Endlich adjungirt man cos —, sin — (Theilung des Winkels ® in m Theile). m . m Dann ist die cyklische Gleichung durch B1) gelöst. Diese Betrachtungen führen noch zu einem interessanten Resultat über die Realitätsverhältnisse der Wurzeln cyklischer Gleichungen.
§. 173. Theilung des Winkels. 593 Stellen wir, wie in §. 170, A0), in der Reihe der Wurzeln «, «u . . ., «m—i jede rational durch die vorangehende dar: worin, da hier £1 reell vorausgesetzt ist, ®{x) eine reelle ratio- rationale Function von x bedeutet, so folgt zunächst, dass, wenn eine der Wurzeln reell ist, auch alle übrigen reell sein müssen. Dies findet immer bei ungeradem m statt, da eine reelle Glei- Gleichung ungeraden Grades immer wenigstens eine reelle Wurzel haben muss. Bei geradem m können auch imaginäre Wurzeln vorhanden sein, und wenn eine Wurzel imaginär ist, so müssen es alle sein, da, wenn eine reelle Wurzel vorkommt, alle anderen auch reell sind. Bezeichnen wir mit ©v(x) die v malige Wiederholung der Function @, so ist Ist also a = a0 mit a* conjugirt imaginär, so sind auch für jedes v die Functionen &r(u0) und @r(alc), d. h. «„ und av + lc conjugirt imaginär. Daraus folgt, dass 2k = m sein muss, und wir schliessen, dass im Falle imaginärer Wurzeln «fc und « ,» *+T für jeden Index h ein Paar conjugirt imaginärer Wurzeln bilden. Die cubischen Gleichungen werden diirch Adjunction der Quadratwurzel aus der Discriminante cyklische Gleichungen. Wenn die Discriminante positiv ist, so sind die Wurzeln in Uebereinstimmung mit diesem Satze reell. Theilung des Winkels. Zu den cyklischen Gleichungen gehören auch die Gleichungen, von denen die Theilung eines Winkels in m gleiche Theile ab- abhängt, auf die wir die allgemeinen cyklischen Gleichungen in einem reellen Körper zurückgeführt haben. Die Aufgabe kann so formulirt werden: Wenn cosmqo und sinmq) gegeben sind, so sollen daraus coscp und sin<p gefunden werden. Weber, Algebra. I. gg
594 ' Fünfzehnter Abschnitt. §. 173. Die Werthe von cos m <p und sin m <p denken wir uns kleiner als 1 und so, dass ihre Quadratsumme = 1 ist, gegeben. Wir adjungiren noch wte Einheitswurzeln, mit denen wir uns im nächsten Abschnitte noch eingehender beschäftigen werden, die aber jedenfalls von Gleichungen abhängen, deren Grad nie- niedriger als m ist. Um aber den Körper reell zu behalten, wollen wir nicht die Einheitswurzeln selbst, sondern .... . 2sr 2jt A) sm —, cos — v ' mm adjungiren. Es möge also der Körper £1 aus allen rationalen Zahlen und aus den rationalen Functionen von cos«.<p, sinmw, cos—, sin — x m m bestehen. Die Gleichung mien Grades, von der x = 2 cos q> abhängt, haben wir in §. 144 aufgestellt in der Form B) 2 cos»» <p = Am(x), worin Am(x) eine ganze Function mten Grades von x ist; wir haben aber dort auch noch die Gleichung sin mm gefunden, durch die sin<p rational durch x ausgedrückt ist. In diesen .Formeln sind die Einheitswurzeln noch nicht enthalten. Die m Wurzeln von B) haben nun folgende Bedeutung: x0 = 2 cos?, Xi = 2 cos (cp + ~\ . . ., xm-i = 2 cos [y + m )' und mit Hülfe von B) und C) und unter Adjunction der Grossen A) kann jede von ihnen als rationale Function einer anderen dargestellt werden, und zwar so: x1=f(x0), xi=f(x1), . . ., xo=f(xm-{). Irgend eine Function der x0, xt, . . ., a;m_j kann also dar- dargestellt werden als rationale Function F(x0), und bei einer cykli- schen Permutation geht F(x0) in Fix,), F(x,) in F(x2), . . ., F(xm^) in Fix,) über. Für eine cyklische Function ist also
§. 173. Theilung des "Winkels. 595 F(x0) = F(xJ ¦¦¦= F{xm I und es ist folglich F(x0) rational, da es als symmetrische Func- tion der Wurzeln dargestellt ist. Die Theilung des Winkels hängt also von einer cyklischen Gleichung ab. Diese cyklische Gleichung ist irreducibel; denn ersetzt man, in irgend einer rationalen Gleichung <& (x0, cos m <p, sin m q>) = 0, , , . 2srfc , . . a> durch a> -\ , so geht sie in ' m ® (ajft, cos m cp, sin m <p) = 0 über, und ist also für alle Wurzeln von B) befriedigt. Wollten wir nur cos m cp adjungiren, nicht zugleich sin m 90, dann würde die Gleichung keine cyklische mehr sein, was man leicht an dem Beispiel der Drei theilung bestätigt, wo eben sin m 90 die Quadratwurzel aus der Discriminante wird (§. 120). 38*
Sechzehnter Abschnitt. Kreistheilung. Irreducibilität der Kr eistheilungsgleichung. Die wichtigsten unter den Abel'schen Gleichungen sind die, von denen die Bestimmung der Einheitswurzeln abhängt, deren elementare Eigenschaften wir schon im zwölften Abschnitt kennen gelernt haben. Wegen der Beziehung zu der geometrischen Auf- Aufgabe, die Kreisperipherie in eine bestimmte Anzahl gleicher Theile zu theilen, heissen alle damit zusammenhängenden Gleichungen auch die Kreistheilungsgleichungen. Der Körper £1, der die als bekannt angesehenen Grossen enthält, ist hier nur der Körper der rationalen Zahlen, den wir den Körper B nennen wollen. Ist n eine beliebige natürliche Zahl, Primzahl oder zusammen- zusammengesetzte, so giebt es, wie wir in §. 140,141 gesehen haben, cp (n) = v primitive wte Einheitswurzeln, die einer ganzzahligen Gleichung A) Xn = x" -f «j a;*-i _|_ . . . 4- a, = 0 genügen. Die nächste Frage, die nun zu beantworten ist, ist die nach der Irreducibilität dieser Gleichung. Die Irreducibilität von Xn ist, für den Fall, dass n eine Primzahl ist, zuerst von Gauss bewiesen (Disq. arithmeticae art. 341). Später sind noch viele andere Beweise gegeben worden (von Kronecker, Schönemann, Eisenstein, Arndt, Dede- kind), die sich zum Theil auf denselben einfachen Fall oder den ebenso zu behandelnden Fall, wo n eine Potenz einer Primzahl
§. 174. Irreducibilität der Kreistheilungsgleichung. 597 ist, beziehen, zum Theil den allgemeinen Fall eines beliebig zu- zusammengesetzten n behandeln. Wir wollen hier einem besonders einfachen Beweise für die Irreducibilität von Xn folgen, den Dedekind gegeben hat, der sich gleich auf den allgemeinen Fall eines ganz beliebigen n bezieht. Wir haben schon im §. 12 gezeigt, dass die Polynomial- coefficienten für einen Primzahlexponenten p alle durch p theilbar sind, mit Ausnahme derer, die den pten Potenzen entsprechen und die bei der Theilung durch p den Rest 1 lassen. Diesem Satze können wir, wenn u, v, w, . . . Variable bedeuten, und wenn sich die Gongruenz nur auf die Coefficienten der Potenzen und Producte der Variablen bezieht, den Ausdruck geben: B) (u -f- v -j- w -j- • • -)p = up -\- vp -\- w* -f- ¦ ¦ • (mod p). Hieraus ergiebt sich nun ein Hülfssatz, auf den wir unseren Beweis stützen wollen. Es sei C)- f(x) = xm + alxm~1 + a2xm~2 -| [- am irgend eine ganze Function von x mit ganzzahligen rationalen Coefficienten au a2, . . ., am und die Wurzeln dieser Gleichung seien a, ß, y, . . ., so dass (§. 7) D) — % = 2 «, a2 = U u ß, — a3 = 2 u ß y, . . . Wir setzen nun, wenn p eine beliebige Primzahl ist, E) F{x) = (x- O (x - ß») (x — /)... = x™ -\- Ax xm~1 -f Ä2 xm~2 + • • • + Am, worin die Coefficienten Ax, A^, . . ., Am als ganzzahlige sym- symmetrische Functionen der u, ß, y, . . . nach dem Fundamental- Fundamentalsatz von den symmetrischen Functionen (§. 48) ganze^ganzzahlige Functionen der al5 Oa, . . ., am und also auch ganze rationale Zahlen sind. Zugleich ist und folglich nach dem Satze B) Ax = af, Ai = aP,...,Am = a? (mod p), und nach dem Fermat'schen Satze (§. 143) F) A1 = a1, A2 = %, . . ., Am = am (mod p), was wir auch so ausdrücken können, wenn wir wieder die Con- gruenz nur auf die Coefficienten entsprechender Potenzen von x beziehen: G) f{x) = F{x) (mod p).
598 Sechzehnter Abschnitt. §. 174. Die Ableitung der Function F(x) aus f{x) ist ein specieller Fall der Tschirnhausen-Transformation; denn man erhält die Gleichung F(y) = 0, wenn man x aus 1/ = ^ und f(x) = 0 eliminirt. Zur Berechnung von F(x) kann auch die Darstellung dienen: (8) F(x) = nf(eVx), worin das Product über alle pteu Einheitswurzeln a zu nehmen ist. Wir fügen noch hinzu, dass, wenn f(x) im Körper B irre- ducibel ist, und wenn die ap, ßp, y9,... von einander verschieden sind, auch F(x) irreducibel ist. Denn ist F1(x) ein irreducibler Factor von F, der für o,p verschwindet, so hat JFj (xp) eine Wurzel mit f(x) gemein, und ist daher wegen der vorausgesetzten Irreducibilität von f(x) durch/(a;) theilbar, es ist also F1 («*) = 0, F, (ß*) = 0, F1 (yp) = 0, . . ., d. h. JFi (x) verschwindet für alle Wurzeln von F(x), woraus die Irreducibilität von F(x) folgt. Hieraus ergiebt sich nun der Beweis der Irreducibilität von Xn auf folgende Weise: Es sei u eine primitive nte Einheitswurzel, und f(x) der im Körper B irreducible Factor von Xn, der für x = u verschwindet. Hat die höchste in f(x) vorkommende Potenz von x den Coeffi- cienten 1, so müssen auch die übrigen Coefficienten %, a2,..., om, nach dem Satze von Gauss (§. 2) ganze Zahlen sein. Wenn ft eine zu n theilerfremde Zahl ist, so ist o? eben- ebenfalls primitive wte Einheitswurzel, und jede primitive wte Einheits- Einheitswurzel, also jede Wurzel der Gleichung X„ = 0 ist in dieser Form enthalten. Wenn also bewiesen werden kann, dass für alle Exponenten ft, die mit n keinen gemeinsamen Theiler haben, /(««) = 0 ist, so folgt, dass f(x) durch Xn theilbar und folg- folglich mit Xn identisch ist, wodurch dann bewiesen ist, dass Xn in B irreducibel ist. Es genügt aber hierzu, nachzuweisen, dass für jede Prim- Primzahl p, die in n nicht aufgeht, /(«?) = 0 ist. Denn ist f(otP) = 0, so hat f(%v) mit/(a;) eine gemeinsame Wurzel u und folg- folglich ist f(%v) wegen der vorausgesetzten Irreducibilität von f(x) durch f(x) theilbar. Wenn also für eine zweite in n nicht auf- aufgehende Primzahl q, die auch mit p identisch sein kann, /(«*) = 0 ist, so folgt, dass auch /(«p«) =0 ist, und wenn man diesen Schluss wiederholt, so erkennt man, dass, wenn f(otP) für
§ 174. Irreducibilität der Kreistheiltmgsgleichung. 599 jede nicht in n aufgehende Primzahl verschwindet, auch /(«") verschwinden muss, wenn ft irgend ein Product von Primzahlen ist, die in n nicht aufgehen. Ist nun p eine in n nicht aufgehende Primzahl, und sind « und ß zwei von einander verschiedene Wurzeln von X„, so sind auch o? und ßp von einander verschiedene primitive nte Einheits- Einheitswurzeln, denn bestimmt man p' aus der Congruenz p'p = 1 (mod »), so folgt aus aP = ßp durch Erhebung und die Potenz p', dass « = ß sein muss. Sind nun a, ß, y, . . . die Wurzeln von fix), so bilden wir nach (8) die Function F(x), deren Wurzeln ap, ßp, yp, . . . sind, und die also nach dem oben Bewiesenen gleichfalls irfedu- cibel ist. Wenn nun f(x) von F(x) verschieden ist, so haben diese beiden Functionen auch keinen gemeinschaftlichen Theiler, und beide sind Theiler der Function Xn und folglich auch Theiler von xn — 1. Wir setzen x» — 1 = f(x) F(x) <p (x), worin <p(x) eine ganzzahlige Function ist. Hierfür können war aber wegen des Satzes G) auch setzen: X» — 1 = f(xy cp(x)+pi> (x), und durch Bildung der abgeleiteten Functionen: n x"-1 =f(x)%(x)-\-p@ (x), worin <p, i>, %, & ganze ganzzahlige Functionen sind. Wenn wir die erste dieser Gleichungen mit —n, die zweite mit x multi- pliciren und addiren, so ergiebt sich eine Gleichung, die wir als Congruenz so darstellen können: (9) n =/(*)*(«), (modp), worin 0 (x) wieder eine ganzzahlige Function ist. Da n nicht durch p theilbar ist, so können hier auch nicht alle Coefficienten von 0 (x) durch p theilbar sein, und wir können annehmen, dass der Coefficient der höchsten Potenz von <& nicht durch p theilbar ist. Dann aber ist die Congruenz (9) offenbar unmöglich, da auf der rechten Seite gewiss ein von x abhängiges Glied mit nicht durch p theilbarem Coefficienten vorkommt, was auf der linken Seite nicht der Fall ist. Es muss also F(x) mit f(x) identisch sein, und es ist daher f(u») — 0. W. z. b. w.
600 Sechzehnter Abschnitt. §. 174. Hiermit ist bewiesen: L Die Function Xn, deren Wurzeln die primitiven wten Einheitswurzeln sind, ist im Körper der ra- rationalen Zahlen irreducibel. Die Irreducibilität von Xn gilt aber, wie hieraus sofort folgt, in einem noch weiteren Sinne. II. Die Function Xn ist auch dann noch irreducibel, wenn dem Körper B beliebige Einheitswurzeln adjungirt werden, deren Grad relativ prim zu n ist. Es sei nämlich a zu n theilerfremd, r eine primitive wte und et, eine primitive aie Einheitswurzel, also nach §. 140 q = ru eine primitive wate Einheitswurzel. Bestimmen wir die ganzen Zahlen x, y so, dass ax -f- ny = 1 wird, so ist A0) r = Qax, a = Qnv, und wenn nun q> (x, <x) ein Theiler von Xn im Körper It («) ist, §o giebt es wenigstens ein r, für welches <p (r, k) — 0 ist. Daraus ergiebt sich aber nach A0) <11) <p(Qax, 9ny) = 0. Nun aber haben wir die Irreducibilität der Gleichung für die primitiven naUu Einheitswurzeln im Körper It bewiesen. Es folgt daher aus A1) für jede zu awtheilerfremde Zahl h A2) <p(Qhax, Qhnv) = 0, und wenn nun s eine beliebige zu n theilerfremde Zahl ist, so können wir h so bestimmen, dass h = s (mod n), h = 1 (mod a). Dann folgt aber aus A2) q> (r8, a) = 0, und folglich ist q> (x, a) durch Xn theilbar. Darin liegt aber die Irreducibilität von Xn im Körper R(a). Dieser Satz rührt von Kronecker her, der gewissermaassen den umgekehrten Weg geht, indem er zunächst die Irreduci-
§. 175. Kreistheilung. 601 bilität von Xn in R(a) unter der Voraussetzung beweist, dass n nur durch eine Primzahl theilbar ist, und daraus dann die Irreducibilität von Xn allgemein ableitet1). §. 175. Die Kreistheilungs-Perioden und die Perioden- Periodengleichungen. Wir beschäftigen uns nun zunächst mit den wten Einheits- Einheitswurzeln, unter der Voraussetzung, dass n eine ungerade Prim- Primzahl ist (die Primzahl 2 bietet zu keinen weiteren Fragen Anlass, da die einzigen zweiten Einheitswurzeln, +1, in B enthalten sind). Aüsser der rationalen nieu Einheitswurzel 1 existiren noch n — 1 primitive, die durch die transcendenten Ausdrücke 2 7t i ±7ti 6 7ti 2 (n — VjTti p n p n p n p n dargestellt werden können. Wenn wir eine von ihnen mit r bezeichnen, so ist das ganze System auch durch darzustellen. Im Exponenten von r kommt es nur auf den Rest nach dem Modul n an, da immer und nur dann rh = t* ist, wenn h = fc (mod n) ist. Die Grossen A) sind, wie wir schon im §. 140 gesehen haben, die Wurzeln der Gleichung (n — l)ten Grades B) X = x»-1 -f- x»-* + xn~3 -| 1- x + 1 = 0, deren Irreducibilität im vorigen Paragraphen bewiesen ist. Wir wollen jetzt zunächst nachweisen, dass diese Gleichung cyklisch ist. Diese Eigenschaft ergiebt sich aus der Existenz primitiver Wur- Wurzeln der Primzahl n, mit denen wir uns im §. 143 beschäftigt haben. Es wurde dort nachgewiesen, dass es für jede Primzahl n gewisse Zahlen g giebt, die man primitive Wurzeln von n nennt, die durch die Eigenschaft charakterisirt sind, dass unter den Resten der Potenzen x; g-i g i g > • • •> g > x) Kronecker, Mem. sur les facteurs irreducibles de l'expression x» — 1). LioQville's Journal, Bd. 19 A854).
602 Sechzehnter Abschnitt. §. 175. bei der Theilung durch n jede der Zahlen 1, 2, . . ., n — 1 ein und nur einmal vorkommt. Der Rest einer Potenz g11 bleibt derselbe, wenn h um ein Vielfaches von n — 1 verändert wird. Ist ga = a (mod w), so heisst a der Index von a (a = ind a) und a die Zahl oder der Numerus. Der Index wird nach dem Modul n — 1 genom- genommen, der Numerus nach dem Modul n (§. 143). Nehmen wir also eine solche primitive Wurzel von n an, so können wir, von der Reihenfolge abgesehen, die Grossen A) so darstellen: ™ n*a [ftp ^ ^ ^gn ^, oder, wenn wir C) setzen, D) r, t r<>h = rh Jede Zahl des Körpers B(r), d. h. jede rationale Function von r lässt sich in die Form bringen: E) <p (r) = b0 + hxr + b.2r* + • • • + &„_2r"-2, oder, da nach B) 1 _|_ r -f r2 -| h *""~1 = 0 ist, F) 9(r) = (&x - ft,) r + F4 — &0) ^2 H + F„_2 — &0)r«-2 — Urn~\ oder da die Potenzen r, r2, . . ., r**~a, von der Reihenfolge ab- abgesehen, mit r, ru r2, . . ., r„_2 übereinstimmen, in die Form G) q>(r) = ar + a^ + a2r2 -| • -+- a„_2r„_2, worin die Coefficienten b und a rationale Zahlen sind. Wenn von den Zahlensystemen a, b das eine ganzzahlig ist, so ist es auch das andere. I. Eine, solche Function <p (r) kann nur dann gleich Null sein, wenn alle ihre Coefficienten a, au . . ., a„_2 verschwinden; denn der Ausdruck E) zeigt, dass cp (r) nicht anders verschwinden kann, als wenn die &0, bx, ¦ . ., &„_2 Null sind. Sind aber diese Null, so zeigt F), dass auch die Coefficienten a alle Null sein müssen. Es kann also q> (r) nur auf eine Weise in die Form G) gebracht werden.
§. 175. Kreistheilungsperioden. 603 Treffen wir die Festsetzung, dass sich ah und r% nicht ändern sollen, wenn der Index h um ein Vielfaches von n — 1 wächst, so können wir auch . (8) cp (r) = 2 ahrh setzen, und darin h ein volles Restsystem nach dem Modul n — 1 durchlaufen lassen. Wir haben nun nachzuweisen, dass die Gruppe der Glei- Gleichung X = 0 keine andere ist, als die Periode der cyklischen Permutation % = (r, ru r2, . . ., r„_2). Diese Periode oder cyklische Gruppe bezeichnen wir mit (9) C — 1, 3T, 3T2, . . ., 3T»-2. Die Gleichung X=0 ist jedenfalls eine Normalgleichung, weil sie irreducibel ist, und weil alle ihre Wurzeln nach C) rational durch eine unter ihnen ausdrückbar sind; sie ist also ihre eigene Galois'sche Resolvente (§. 152). Ihre Substitutionen sind A0) (r, r), (r, rj, (r, r2), . . ., (r, rB_2), und nach C) ist (r, rk) = (n-, rk+h). Daraus folgt, dass (r, rx) unter den Wurzeln D) die cyklische Permutation % hervorruft, und dass also die Substitutionsgruppe A0) mit der Permutationsgruppe C isomorph ist. Also ist C die G a 1 o i s' sehe Gruppe von X = 0. Nach §. 170 lässt sich die Gleichung X = 0 auf eine Reihe von cyklischen Gleichungen niedrigeren Grades zurückführen, wenn man Functionen aufsucht, die zu den Theilern der Gruppe C gehören. Die Theiler von C sind aber, wenn n — 1 in zwei Factoren e, f zerlegt, also n — 1 = ef gesetzt wird, die cyklischen Gruppen A1) Ce = 1, »•, Jt2e, . . ., «</-»«, und die Permutation ne ist darin gleichbedeutend mit der Sub- Substitution (r, re). Um zu einer zu Ce gehörigen Function der Wurzeln von möglichst einfacher Form zu gelangen, betrachten wir nach Gauss die/-gliedrigen Perioden
604 Sechzehnter Abschnitt. §. 175. n = r + re + r2e H (- r(/_1)(j A2) ^1 = rl +re + l + r2« + l H \~ r(f-l)° + l ije_i = re_i + r^.i + r3e_! -| • -j- rB_2, die aus der ersten von ihnen durch die Substitutionen (r, r), (r, rj), (r, r2), . . ., (r, re—i) hervorgehen. Wir bezeichnen die Grossen A2) auch als ein System conjugirter Perioden. Jede dieser Functionen bleibt durch die Substitution (r, re) ungeändert, und sie sind alle von einander verschieden, da sich eine Gleichung ijh — ijfc = 0, wenn h und h verschieden ist, in der Form ar -\- c^ri -j- •••-)- a„_2rM_2 = 0 schreiben Hesse, wo die a, a^ . . ., a„_2 nicht alle zugleich ver- verschwindende ganze Zahlen sind (-|- 1, 0 oder — 1), was nach dem Theorem I. nicht möglich ist. Jede der Perioden A2) ist also eine zu der Gruppe Ce gehörige Function, und diese Grossen sind daher die Wurzeln einer irreducibeln ganzzahligen Gleichung eten Grades. Adjungirt man eine dieser Grossen, so hängt die Bestimmung von r noch von einer Gleichung vom Grade / ab. Nach den allgemeinen Sätzen des vierzehnten Abschnittes kann jede Function der r, die die Substitutionen der Gruppe O gestattet, rational durch jede der Grossen y\ dargestellt werden. Hier können wir aber noch den folgenden Satz aufstellen: II. Jede Zahl in B(r), die die Substitution (r, re) gestattet, also auch jede Zahl des Körpers 2?(ij), lässt sich als homogene lineare Function der Perioden ij, %, . . ., ije_x darstellen. Denn nach I. könneu wir jede Zahl von B(r) auf eine Weise in die Form A3) y(r) = Zahrh setzen, wo die Coefficienten au rationale Zahlen sind, und h ein volles Restsystem nach dem Modul n—1 durchläuft. Es ist aber <p(rt) = 2ahrh+e = lah-erh, und daher muss, wenn tp(r) = •pO'e) sein soll, au—e = au sein für jedes h; also auch ah = aÄ+e = ah+ie . . . Danach lässt sich A3) in die Form setzen h h h cp(r) = X a%v% + 2 «ft^Ä+e + • • • + 0, e—1 0, e—1 0, e—1
§. 175. Kreistheilungsperioden. 605 oder A4) cp (r) = a n -\- a, ^ -| (- ae_1ije_1, was zu beweisen war. Zu bemerken ist dabei noch, dass, wenn <p ganzzahlige Coefficienten hat, auch die Coefficienten der t]h ganze Zahlen werden. Da jede Zahl des Körpers -R(ij) auf eine und nur auf eine Art in der linearen Form A4) dargestellt werden kann, so nennen wir das Grössensystem ij, ijl5 ija, . . ., ije_a eine Basis des Kör- Körpers B(t)). Wenn man die Darstellung des Productes je zweier Perioden ¦jjkijfc in der Form A4) kennt, so kann man daraus durch eine wiederholte Anwendung alle rationalen Functionen der Perioden t\ in derselben Form darstellen. Ebenso kann man auch leicht die Gleichung bilden, deren Wurzeln die e Grossen r\ sind, wenn man das Verfahren auf das Product A5) Fe (x) = (x — rj) (x — rii) . . . (x — ije-i) anwendet. Diese Gleichung lässt sich auch in Determinanten- Determinantenform darstellen. Man setze nämlich A6) rjfjh = aO,hn -j- «LÄfl + • • • + «e-I.ÄlJe-l, worin die aOth, a^h, • . •, ae—\,% ganze Zahlen sind, über deren Berechnung später das Nähere folgen wird. Stellt man diese Gleichung für h = 0, 1, . . ., e — 1 in der Form auf: («0,0 — n)n + «1,0 »h + + «e-l»?e-l = 0 «o,i n + («i,i — n)n\ + + «e-1%-1 = o ao,e-in + «l,e-l% + • • • («e-l,e-l — 1j)ije-l = 0, so sieht man, da die rj, rj^ . . ., ije_! nicht verschwinden, dass die Determinante dieses Systems Null sein muss, also A7) «0,0 V, «1,0» • • •) «e —1,0 ! «0,1, «1,1 — 1?, . . ., «e-1,1 «0,e — 1, «l,e —1» • • •» «e—l,e—1 was, wenn man x für r\ schreibt, vom Vorzeichen abgesehen, mit Fe(x) übereinstimmen muss. Die Function Fe(x) hat also nicht bloss rationale, sondern ganzzahlige Coefficienten.
606 Sechzehnter Abschnitt. §. 176. Man kann nun auch die Gleichung /ten Grades bilden, deren Wurzeln r, re, r2e, . . ., *¦(/-» e sind; denn es ist für ein unbe- unbestimmtes x A8) ®e(x) = (x — r)(x — re)...(x — r(/_1)e) eine Function im Körper M(rj). Ihre Coefficienten sind in der Form cp(r), E), mit ganzzahligen b enthalten und lassen sich also in der Form A4) mit ganzzahligen a darstellen. Sie lassen sich leicht aus den Newton'schen Formeln berechnen, durch die die Coefficienten einer Gleichung mittelst der Potenzsummen der Wurzeln ausgedrückt werden (§. 46). Denn es ist nach A2) und C) ?**+*? + ••• + ?#_„.=% also geradezu einer der Potenzsummen gleich, und jede Potenz- Potenzsumme ist einer der Perioden gleich. Man sieht daher aus den Newton'schen Formeln zwar unmittelbar, dass die Coefficienten a rational sind, nicht aber, dass es ganze Zahlen sind. Die Gleichung A8) lässt sich aber ebenso behandeln, wie die Gleichung B); denn die Gruppe von <be{%) = 0 ist eben Ce, und wenn e' ein Theiler von / ist, etwa f = e'f, so ist Cee> ein Theiler von Ce. Zu Cee> gehört aber die Periode n' = r -j- ree' -\- r2ee' + f" «V'-D«* die also von einer Gleichung des Grades e' im Körper 2? (ij) abhängt. Wenn man die Zahlen e, e' . . . als Primzahlen annimmt, so besteht die Reihe der Resolventen aus einer Reihe von Glei- Gleichungen, deren Grade die Primfactoren von n — 1 sind. Was die Gruppe der Gleichung eten Grades betrifft, deren Wurzeln die e Grossen y\ sind, so finden wir diese sehr einfach aus der Bemerkung, dass die Substitution (r, r%) unter den % die Substitution (ijfc, r{ic+h) hervorruft, wenn der Index von r\ nach dem Modul e genommen wird. Die Gruppe von Fe(x) = 0 besteht daher aus den Potenzen der cyklischen Permutation §. 176. Die Gauss'sche Methode zur Berechnung der Resolventen. Um in concreten Fällen die Auflösung der Kreistheilungs- gleichung wirklich durchzuführen, kommt es nach dem, was wir
§. 176. Producte von Perioden. 607 im vorigen Paragraphen entwickelt hahen, nur darauf an, die Producte je zweier conjugirter Perioden als lineare Functionen derselben Perioden darzustellen. Dafür hat Gauss ein einfaches Verfahren angegeben, das wir jetzt kennen lernen wollen. Wir müssen dazu die Bezeichnung der Perioden ein wenig verändern. Wir schreiben zwei beliebige der Perioden §. 175, A2) in der Weise ,(D = ri + ry _j_ ri».] ^ ' ijC«) = rfl -4- r"' -|- r'"" -[-... so dass, wenn X ^ gh (mod n) ist, ijW = rjh oder auch qß) _ ^.ndi; es ist dann B) • (modw); lassen wir also die Zeichen s und t je ein volles Restsystem nach dem Modul / durchlaufen, so ist Das Product davon ist Halten wir bei der Bildung dieser Summe zunächst s fest, und summiren in Bezug auf t, so dürfen wir t durch t -j- s er- ersetzen, weil beide gleichzeitig ein volles Restsystem nach dem Modul / durchlaufen. Demnach wird Hierin aber darf die Reihenfolge der Summation vertauscht werden, so dass auch C) ij0) ijW = 11 ist. Die nach s genommene Summe ist aber selbst eine der Perioden, nämlich nach der Bezeich- Bezeichnung A) die Periode Es ergiebt sich also aus B) und C) D) ij(*> ijc«) = ^a+M) _j_ tf-+!>¦') -\ Die rechte Seite dieses Ausdruckes.enthält / Glieder; dar- darunter kann natürlich auch dieselbe Periode mehrmals auftreten;
608 Sechzehnter Abschnitt. §. 176. auch. kann darunter die uneigentliche Periode ij(°) vorkommen, die gleich der ganzen Zahl / zu setzen ist. Will man die homo- homogene Form des Ausdruckes wieder herstellen, so benutzt man die Relation n + % + Vz H + Ve-i — — 1, die ja nur eine andere Schreibweise der Gleichung §. 175, B) ist. Wenn man nach D) den Ausdruck für ein Product ij v\% berechnet hat, dem wir oben schon die Form gegeben haben, E) r\rjh = aOlhr) + «i.ä^i + ' * • + ae-i,hVe-i, so erhält man das Product von zwei beliebigen der Perioden durch die Substitution (ij, ijfc), F) VtcVh+ic = «o,ä% + ai,ft%+i + • • • + a«-i,Ä»7*-i- Um an einem einfachen Beispiele diese Regeln zu erläutern, nehmen wir n = 13. Für 13 ist 2 eine primitive Wurzel, und wir können die im §. 143 gegebene Indextabelle anwenden: I N 0, 1, 1, 2, 2, 4, 3, 8, 4, 3, 5, 6, 6, 12, 7, 11, 8, 9, 9, 5, 10, 10, 11 7 Wenn wir zuerst e = 3, / = 4 annehmen, so erhalten wir eine cubische Resolvente, deren Wurzeln n =r + rs -f r6 + r9 (8) . »?i = n -f r4 -f r7 -f r10 % = ra -\- r5 -f r8 -f rn sind. Aus der Tabelle G) ergiebt sich dafür auch •q = r -\- r~5 -(- r-1 + r5 = ijW (9) ij, = r* + rs -j- r~2 + r-3 = ij« ij2 = r* -|- r6 -f r~4 4- r~e = ijW. Wendet man die Formel D) an, so erhält man z. B.: rjrj = ijB) 4- ?j(-4) 4- ,j(o) 4- ^(e) = 4 4- ij(» 4- und so ergeben sich die Formeln: f}2= — 4i? — 3ij, — 2%, ^ 1J, = 1J 4- 2 1Jj 4- 1J2, tj %= 2ij 4- ij! 4- ij2, •woraus nach §. 175, A7), die Gleichung für 17
§. 176. Kreistheilungsperioden. 609 — 4 — ij, — 3, — 2 1, 2 — rj, 1=0, 2, i, i - n oder A0) ij3 -f- ij2 — 4ij -f 1 = 0 folgt. Die Discriminante dieser Gleichung ergiebt sich gleich 169 = 132, also positiv. Die Gleichung hat folglich drei reelle, und zwar, da das letzte Glied positiv und das vorletzte negativ ist, zwei positive und eine negative Wurzel. Setzen wir r = e 1Z , so wird . 2st . . 10 % . / 2% 3a\ n = 2cos — + 2cos _ = 2^^ - cos _), „ 4* , . 6ar „ / 4ar. 6jc\ ^ = 2COS 13 + 2C°S TF = 2(C°S 13 + C°S 13> % = 2cos ^ + 2cos -ir = _ 2(cos— + cos -j, oder auch . 4 jt 6a; . % bit n = 4 cos — cos —, fll = 4cos ^ cos ^, 2x 3a %=-4cos —cos-- Es ist also ij2 die negative, % die grössere, r\ die kleinere der beiden positiven Wurzeln. Die Gleichung 4ten Grades, deren Wurzeln r, r~l, r5, r~6 sind, lässt sich nun leicht bilden, wenn man g = r + r-i = 2cos^|, f = r* + r~ß = 2 cos ^ setzt. Es ist nämlich also A1) I2 —^l + % = 0 die quadratische Gleichung für £, aus der man die biquadratische Gleichung für r erhält, A2) r* — ijrs -f- (ij2 -f 2) r2 — nr -f 1 = 0. Die quadratische Gleichung A1) hat eine positive und eine Q, IT" negative Wurzel. Die positive Wurzel ist 2 cos -=— • Anstatt r Weber Algebra. I. 39
610 Sechzehnter Abschnitt. §. 177. selbst zu berechnen, berechnet man noch 2 sin —> was man als 13 die positive Quadratwurzel V4 — §2 erhält. An Stelle der drei viergliedrigen Perioden r\ hätte man auch zuerst zwei Perioden von sechs Gliedern betrachten können: A3) l = r + r3 + r4 + f + r~3 + ?¦-* ' lx = r» -f- r* -f r« -f r~2 + r~5 -f- r~6. Für das Product tti findet man nach der Formel D) den Werth 3 (£ -\- ti) oder — 3, so dass g, ^ die Wurzeln der qua- quadratischen Gleichung A4) & + t — 3 = 0 sind, woraus, da aus dem Ausdruck durch die Cosinus leicht zu sehen ist, dass £ positiv ist: nn , _ - 1 + Vl3 -l-VIä A5) £ = g ' ?1 = 2 Nach Adjunction der Werthe £, ^ kann man eine cubische Gleichung für die zweigliedrigen Perioden bilden. Setzt man nämlich | = r + r-1, |x == ^ + r-2, + ^ = - i, also sind g, g2, g4 die Wurzeln der cubischen Gleichung A6) x* — gas» — x — 1 + t = 0. §. 177. Zurückführung der Kreistheilungsgleichung auf reine Gleichungen. Gauss hat schon in seiner ersten Darstellung in den disq. arithm. die Kreistheilungsgleichungen durch Benutzung der Resol- so folgt ferner 62 = it = : r* + r-\ T3 _j_ r-3? 63 & ^5 _L_ y6 _L + &, i
§. 177. ZurüokfüLirung auf reine Gleichungen. venten direct auf reine Gleichungen zurückgeführt1). Um dies durchzuführen, setzen wir n — 1 = m, und bezeichnen, wie im vorigen Abschnitt, mit e eine primitive Einheitswurzel mten Grades, mit r, ru r2,..., rm_! die wten Einheits- Einheitswurzeln in der oben festgesetzten Reihenfolge. Die Lagrange'- sehen Resolventen sind dann (s*, r) = I slhrh = v s^t**, 0, n—2 0, n—2 worin X ein beliebiger, nach dem Modul m genommener Expo- Exponent ist. Setzen wir gh = s, also h = inds (mod m), so können wir auch setzen A) (e\ r) = 2 sn^srs. l,n — l Als Grundlage für die weitere Reduction dieser Ausdrücke dient die Berechnung des Productes zweier solcher Resolventen. Wir bezeichnen mit (i eine zweite Zahl wie X und verstehen unter s und t zwei Zeichen, die von einander unabhängig je ein Restsystem nach dem Modul n durchlaufen, mit Ausschluss der Null. Dann ist Wenn die Summation in Bezug auf t zuerst ausgeführt wird so kann st an Stelle von t gesetzt werden, da s von Null ver- verschieden ist, und also st und t zugleich ein volles Restsystem nach dem Modul n durchlaufen. Also wird s t B) (s\ r) («'S r) = 2 2rs(* + 1)£^+^inds£'uind*. Wir erledigen zuerst den speciellen Fall [i = — X, den :) Gauss, disq. arithm. art. 359, 360; disq. circa aequationes puras ulterior evolutio, "Werke Bd. II. Lagrange, res. des equations nume- riques. Jacobi, „Ueber die Kreistheilung und ihre Anwendung in der Zahlentheorie". Werke Bd. 6. Kummer, Crelle's Journal, Bd. 35 und Abhandl. d. Berl. Akademie 1856. Zu erwähnen sind noch Eisenstein und Cauchy. Die Lehre von der Kreistheilung ist im Zusammenhange dargestellt und von den historischen Nachweisen begleitet in dem Buche von Bachmann, „Die Lehre von der Kreistheilung". Leipzig 1872. 39*
612 Sechzehnter Abschnitt. §. 177. wir aus B) erhalten, wenn wir die Summation nach s zuerst ausführen: (e\ r) (s~\ r) = £ £-w<| Hierin ist = _^. i} wenn *= 1, 2, ...,» — 2 . = w — 1, wenn t = n — 1, also, da (nach §. 143) ind (n — 1) = 7a (n — 1) und s 2 = — 1 ist, (s*, r) (s~\ r) = — S £-«ndt _j_ (_ !JW. 1, n—1 In der nach £ genommenen Summe durchläuft ind t ein volles Restsystem nach dem Modul n — 1, und also ist, wenn X durch n — 1 nicht theilbar angenommen wird, 1, n— 1 und daher C) (s\ r) {e-\ r) = (- l)*w, während, wenn X durch n — 1 theilbar ist, (s\ r) = A, r) = — 1 wird. Wir behandeln also nun die Summe B.) weiter unter der Voraussetzung, dass X -\- (t nicht durch (n— 1) theilbar ist. s Dann ist 2 £(;i+rt™ds = 0, und es können in der Summe auf der rechten Seite von B) die dem Werthe t = n — 1 entsprechenden Glieder weggelassen werden. Man erhält so ' t s D) (a\ r) (f, r) = 2 £flüld' 2 1, n—2 l, n—1 t l,n—2 Nun durchläuft s(t -\- 1) bei feststehendem £ zugleich mit s ein volles Restsystem nach dem Modul n, und e"s ist also und die Formel D) ergiebt E) = wenn zur Abkürzung F) 2 ^todt- 1,»—2
§. 177. Auflösung durch die Resolventen. 613 gesetzt und X -\- ji durch n — 1 = m nicht theilbar angenommen wird. Diese Functionen ip sind dann aus den (w — l)ten Einheits- Einheitswurzeln £ mit ganzzahligen Coefficienten zusammengesetzt, und sind also bekannt, wenn die (n — l)ten Einheitswurzeln als be- bekannt vorausgesetzt werden. Es sind Zahlen des Körpers B(e). Wir nehmen jetzt X durch ji theilbar an, ersetzen also X durch pX und setzen G) et, = £¦», so dass a auch eine nicht primitive (w — l)te Einheitswurzel, z. B. eine eie Einheitswurzel sein kann (wenn, wie oben, m = ef ist und p durch / theilbar, etwa =/ genommen wird), wobei jedoch der Fall « = 1, also e = 1 auszuschliessen ist. Dann setzen wir (8) 2 CcM«-a + l)md(* + l) _ ^(«); 1, n—2 darin ist ^(w) eine Zahl des Körpers -R(ec), die mit Hülfe einer Indextabelle leicht berechnet werden kann; X kann dabei nach dem Modul e genommen werden. Die Formel E) giebt für diese Annahme (9) (tf,r)(a,r) = (<* + \r)fl>i(«), und diese Formel gilt, so lange (i (X -\- 1) nicht durch n — 1 theilbar ist, also, wenn ji und m theilerfremd, und daher « eine primitive mte Einheitswurzel ist, für A = 1, 2, . . ., n — 3, und wenn f der grösste gemeinschaftliche Theiler von ft und m und m = ef ist, für X = 1, 2, . . ., e — 2. Die Formel C) giebt jetzt, wenn ax nicht = 1 ist, A0) « r) (a~\ r) = (— 1)«*». Die Formeln (9), A0) genügen, um nicht nur die r selbst, sondern auch die sämmtlichen Perioden r) durch Kadicale zu bestimmen, deren Grade die in m aufgehenden Primzahlen sind, und unter denen die Functionen ^ als die bekannten Grossen vorkommen. Da die /-gliedrigen Perioden (für / = 1) die Grossen r mit umfassen, so wollen wir gleich zur Bestimmung dieser Perioden übergehen. Wir wollen also unter u eine primitive eie Einheitswurzel verstehen und ji = f setzen. Dann ist («*, r) = r -\- Kxri -\- a2Xr2 -(- • • • + a<-n-V*rn-2,
614 Sechzehnter Abschnitt. §. 177. oder nach §. 175, A2) A1) (a\ r) = (a\ rj) — n + «^, -\- a"ij2 \- «<«-»* *}«,_!, und die Formeln (9) und A0) ergeben A2) («V?) («,*?) = («*+S i?) «*(«) . _19 , «,, A3) «,)(«-*,,) = (-1>*«. *-i.4-.-.t« ^ Die Gleichung A3) zeigt, dass keine der Zahlen («*, r\) ver- verschwindet, und nach A2) sind auch die i>z(u) von Null verschie- verschieden, und wenn wir die Gleichung A2) für A = 1, 2, . . ., A — 1 bilden, so folgt («. V)(«, n) = («a, («», i?) («, i?) =(«», (a*-1, 1?) («, 1?) = (a Daraus erhalten wir durch Multiplication und Wegheben des Factors (a2, rj) . . . («il-1, ij) A4) (et, itf = (a\ rf) ^ («) ^», («)... ^^_! («). Dadurch ist («^, ij) rational durch («, ¦»?) ausgedrückt. Setzen wir aber in A4) X — e — 1, so ergiebt sich («, 1?)«-1 = (ar\ ^)^i(«)^2(«) • • • ^e-a(«), und durch Multiplication mit («, ij), wenn A3) in der Form («, q) («-S q) = (- l)/n benutzt wird, A5) («, t2)e = (— l)/w ^ («) if»2 («)... ^e_2 («), wodurch die Bildung von («, ij) auf eine eie Wurzel zurückgeführt ist. Setzen wir e = m, so erhalten wir (a, r). Wir wollen dies Verfahren auf den interessanten Fall n = 17 anwenden, der zu dem geometrisch merkwürdigen, vcn Gauss gefundenen Resultat führt, dass die Theilung der Kreisperipherie in 17 Theile von einer Reihe quadratischer Gleichungen abhängt, und dass daher das reguläre Siebzehneck mit Zirkel und Lineal construirt werden kann. Für die Primzahl 17 ist 3 eine primitive Wurzel, und man findet die Indextabelle 1 N 0 1 1 3 2 9 3 10 4 13 5 5 6 15 7 11 8 16 9 14 10 8 11 7 12 4 13 12 14 2 15 6
§. 177. Siebzehn-Theilung. 615 Die zweigliedrigen Perioden sind, wenn wir r = e17 setzen, 18ar % _ 10% . 3a; 2 2= — 2cos—, p^ ^y =- = — 2cos— A6) 263r 8jt n 10a; _ 7a; = 2cos —, ^5=2 2 -jy-= 2cos —, ^7 = 2cos^- = —2cos—• Zur Berechnung der Functionen ip wendet man am ein- einfachsten folgende Tabelle an: ind (* t ind t + 1) 1 0 14 2 14 1 3 1 12 4 12 5 5 5 15 6 15 11 7 11 10 8 10 2 9 2 3 10 3 7 11 7 13 12 13 4 13 4 9 14 9 6 15 6, 8 woraus man, wenn a eine 8te Einheitswurzel bedeutet, nach der Formel (8) findet: A7) ^a(a) = ^5(a) = 2 +3«+ a3+ «4 —j-3os^-j-4«e_j_ il>s(«) = ^4(«) = 3 -f-3« -f-2«2_|_3a3 4_ a Nimmt man l-M «=-—L^, «3 = 4, «* — — 1, so ergiebt sich ^ («) = if»6 («) = — 3 — * V8 ft (es) = ft (es) = • 1 — 4i also nach A5) A9) («, 1?)8 = 17 C + 4 V8I A —¦ 4 *)«. Aus A3) und A4) aber erhält man (- 1, ij)* = 17, B0) (inJ =(-1, »2) (-1 + 44), ausserdem hat man (l,ij) = — 1,
616 Sechzehnter Abschnitt. §. 177. (i, q)(—«, ij) = 17, B1) (a, q)(«-i, q)= 17, (a»,ij)(a-«, 12)= 17, und nach (9) B2) («, ^) («3, ,) = (_ i, ,) C + wodurch A, 12), (— 1, 12), (± *, v), («, «?), («-1, »2), («3, »2), («~3, *?) durch Quadratwurzeln bestimmt sind. Bei der Bestimmung, die wir über r und a, getroffen haben, ergiebt sich leicht aus der Betrachtung der Werthe der Cosinus A6), dass (— 1, rj) positiv, also gleich der positiven Quadrat- Quadratwurzel Vl7 ist, und dass ferner (i, rj) und (a, r[) positive reelle Theile haben, wodurch auch diese Grossen völlig bestimmt sind. Es ist also wenn alle Wurzeln positiv genommen werden, und nach der letzten Gleichung B0) lässt sich durch eine, wenn auch etwas lange Formel («, rj) durch Quadratwurzeln aus reellen Grossen darstellen. Auf die geometrischen Constructionen, die sich hier anknüpfen, gehen wir nicht ein1). Die benutzte Vorzeichenbestimmung erhält man einfach, wenn man nach A6) setzt 1 . , . 2ar % , 8» . ix 2 (— X' n) = COS — — COS _ -[- COS ^r + COS rff — COS — + COS _ + COS ^- + COS -pp Nach einer bekannten trigonometrischen Formel ist aber jc - cos— +. cos — = 2sm — sin grösser ist als sin 7^7-, so is o4 beiden Ausdrücke und damit die ganze Summe (— 1, rf) positiv. und da sin —— grösser ist als sin 7^7-, so ist die Summe dieser 34 o4 *) Vgl. hierüber v. Staudt, Construction des regulären Siebzehnecks. Crelle's Journ. Bd. 24, 1842.
§. 178. Die Zahlen tfi. 617 Es ergiebt sich ferner für den reellen Theil von (i, rj) ^ — ¦»22 + ^4—% = 2cosyy + 2cos^y+ 2cosyj-— 2cos—, was unmittelbar als positiv erkannt wird; endlich für den reellen Theil von («, ij) »2 — % + y^- Oh — n% — % + j?7) = 2cos —— 2cosjy+V2^cos^- + cos—+ cos—— was sich gleichfalls als positiv erweist. §. 178. Eigenschaften der Zahlen ip. Die im vorigen Paragraphen abgeleiteten Formeln für die Kesolventen gestatten eine Fülle von Anwendungen, auch ohne eine nähere Bestimmung der Primzahl n, für specielle Annahmen über die Zahl e; sie geben also zahlentheoretische Sätze für ganze Kategorien von Primzahlen. Für die Algebra liefern sie uns die Lösungen cyklischer Gleichungen von vorgeschriebenem Grade in beliebiger Menge. Der Ableitung der für die Algebra wichtigsten dieser An- Anwendungen schicken wir einige allgemeine Betrachtungen über die im vorigen Paragraphen definirten Functionen if> voraus. Zur Berechnung der Zahlen ^,« (s) [§. 177, E)] bedient man sich, wie wir im Falle n = 17 gesehen haben, einer Indextabelle. Es bestehen aber zwischen diesen Functionen Relationen, durch die sie sich auf eine geringere Zahl zurückführen lassen, worüber Jacobi merkwürdige Untersuchungen angestellt hat1). Die Function ^^(f) ändert sich nach ihrer Definition nicht, wenn A, ji vertauscht werden, obwohl ihr Ausdruck [§. 177, F)] dadurch eine andere Gestalt erhält. Wir bekommen also dieselbe Function ^(«), wenn wir A, ft durch A/,/ oder durch /, If ersetzen, also [§. 177, (8)] J) Vergl. Kronecker, Zur Theorie der Abel'sehen Gleichungen. Journ. f. Mathem. ßd. 93.
618 Sechzehnter Abschnitt. §. 178. Hängen also zwei Zahlen X, X' durch die Congruenz A) Xl' = 1 (mod e) mit einander zusammen, so ergiebt sich t t also die Formel B) Wenn wir sodann in §. 177, E) für X setzen — X — (i und also — X für X -\- p (wobei dann vorausgesetzt sein muss, dass X durch m nicht theilbar ist), so folgt (*-*-*, r) (£", r) _ (FVr) "" *-*-"•*(8)- Die linke Seite multipliciren wir mit und wenden im Zähler und Nenner die Formel (»i,r)(«-i,r) = (-l)in [§. 177, C)] an, dann folgt oder und wenn wir X, ji durch A/, / ersetzen und X" aus der Congruenz C) X -f A" -f 1 = 0 (mod e) bestimmen, Diese Formel kann man dann wieder mit der Formel B) verbinden, und so die Anzahl der für ein bestimmtes e zu berechnenden Functionen auf eine geringere zurückführen. Ist e eine ungerade Primzahl, so ist nach Jacobi die Zahl der Func- Functionen ipi, durch die sämmtliche e — 2 auf diese Weise aus- ausgedrückt werden können, gleich der zunächst über \e gelegenen ganzen Zahl. Eine dritte Formel ergiebt sich, wenn man in §. 177, E) für £ setzt £—1 und dann multiplicirt, also -¦«, r)
§. 178. Die Zahlen if>. 619 bildet. Und mit Hülfe von §. 177, C) findet man so die Formel E) ti,ll(B)il>x,ll(£~1) = n^ die nun wieder durch die Substitution Xf,f für A, ji specialisirt wird: F) 4>x(aL>x(ct,-i) = n. Schliesslich wollen wir noch eine Eigenschaft der Func- tionen i\> erwähnen, die sich auch unmittelbar aus ihrer Defini- Definition §. 177, E) ablesen lässt. Danach ist nämlich, wenn A, p, v drei solche Zahlen sind, dass X -\- [i, X -\- (i -\- v nicht durch m theilbar ist G) *, d. h. das Product 4>itll(s)il>i+lltr(s) bleibt ungeändert, wenn die drei Zahlen X, ji, v beliebig vertauscht werden (falls auch X -\- v und (t-\-v durch m nicht theilbar sind). Danach ergiebt sich z. B und wenn man darin X, (i, v durch 2A/,/,/ ersetzt, und beachtet, dass ip2f,2Zf(z) = ifu(«2) ist, (8) ^ai(«)^2i + i(a) = Tl>i(<«I>x(?fl), vorausgesetzt, dass 2, 2 A -j- 1, 2A-|-2 nicht durch e theilbar sind. Jacobi hat den Versuch gemacht, mit Hülfe dieser Formeln für ein gegebenes, als Primzahl vorausgesetztes e die sämmtlichen e — 2 Functionen tyxif*) durch die conjugirten Werthe einer einzigen, d. h. durch ^ («), ^ (a2), ^>t (a3), . . . auszudrücken, und hat die Kechnung bis e = 23 durchgeführt. Dass eine solche Darstellung allgemein möglich sei, wie Jacobi vermuthet zu haben scheint, ist jedoch nach den Unter- Untersuchungen von Kronecker nicht wahrscheinlich. Wir wollen als Beispiel den Fall e = 7 durchführen. Für diesen Fall ist l = 1, 2, 3, 4, 5 A' = 1, 4, 5, 2, 3 A" = 5, 4, 3, 2, 1, also ergeben die Formeln B) und D) und daraus noch
620 Sechzehnter Abschnitt. §. 178. und wenn man in (8) A = 1 setzt ii>t 0) *3 («) = *i 0) endlich nach F) Berechnet man hiernach die Formel §. 177, A5) («, nI = n xl>x («) ^2 («) 4>3 («) 4>i («) #5 («), so ergiebt sich (9) («, ^O = ^ («L ^ (a2J ^ («*). Durch diese Formel lässt sich unmittelbar die Kelation aus §• 177, A4) 14 _ 2 7 verificiren. Wir wollen diese Betrachtungen über die Functionen ip mit dem Beweise eines Satzes beschliessen, der uns später nützlich sein wird. Bestimmen wir eine positive ganze Zahl v < m aus der Congruenz A0) l -+- [i -\- v = 0 (mod m), so können wir die Function ^^ (e), wie sie durch §. 177, F) definirt ist, so darstellen t A1) ^,<t(£) == 2 £'lln 1, n— 2 Hierin wollen wir nun die mte Einheitswurzel £ durch die primitive Congruenzwurzel g der Primzahl w, die dem Index- Indexsystem zu Grunde liegt, ersetzen, d. h. wir wollen die ganze Zahl * * A2) ip).,fi(g) = 2 ^ind*+v'üid(t+i) = v ta (t -f- l)v (mod n) 1, n — 2 l, n—2 bilden. Betrachten wir diese Zahl nach dem Modul n, so können wir die Summation bis t = n — 1 ausdehnen, da für diesen Werth (t ~\- 1) congruent mit Null ist. Wir erhalten also A3) 4m,,«(#) = 2 ta(t -f- l)r (mod n). 1, n—1 Auf die Potenz (t -f- 1)" können wir den binomischen Lehr- Lehrsatz anwenden und erhalten, wenn, wie früher, _B£° die Binomial- coefficienten bedeuten, h t A4) 1>*,!>¦&) = 2 B^p y, P-+h (mod n). O.r l.n—1 v
§. 179. Die Gauss'schen Summen. 621 Setzen wir t = g* (mod n), so durchläuft s ein Kestsystein nach dem Modul m, und wir erhalten 1, n —1 0, m—1 Es ist aber nach der Summenformel für die geometrische Eeihe — 1) f gsiu + h) — gmiu+h) _ i = o (mod »), 0, m — 1 und folglich ist A5) 2 0»C"+*> == 0 (mod w), o,»t—i ausser wenn f* -\- h ^ 0 (mod m) ist, und in diesem Falle ist A6) 2 ^C«+ä) =TO = _ ! (m0(Jw). O,OT — 1 Nehmen wir A, ;* zwischen 0 und w an, so ist 1) wenn A -\- fi < »» ist, v = w — A — ft, 2) „ A -j- (i > m ist, v = 2m — X — ft. Der Exponent (i -\- h in der Summe A4) durchläuft also im Falle 1) die Werthe p -\- h = f*, p -\- 1, . . ., w — A, „ 2) „ „ F, ^ + 1, . . ., 2m — X. Im Falle 1) kommt also der in A6) vorausgesetzte Fall ji -f- h = 0 (mod w) gar nicht vor, im Falle 2) kommt er ein- einmal vor, für h = m — (i. Demnach haben wir aus A4) mit Kücksicht auf A5) und A6), wenn für den Binomialcoefficienten JBj? der Werth ll-h) gesetzt wird' „« (ß) = 0) A + f* < w §. 179. Die Gauss'schen Summen. Im §. 175 ist gezeigt, dass, wenn n — 1 = ef ist, die Perioden rj, %, ..., ^e—i einer ganzzahligen Gleichung eten Grades
622 'Sechzehnter Abschnitt. §. 179. genügen. Diese Gleichung hat nur reelle Wurzeln, wenn/ gerade ist, weil dann y2(n — 1) ein Vielfaches von e ist, und folglich r und r~x in derselben Periode vorkommen. Ist aber / ungerade, so sind alle Wurzeln imaginär. Es ist nun vom höchsten Interesse, diese Gleichung eUsa Grades für einzelne besondere Werthe von e ohne eine specielle Annahme über die Primzahl n, ausser der, dass n — 1 durch e theilbar sein soll, zu untersuchen. Wir betrachten die ersten speciellen Fälle und nehmen zu- zunächst e = 2 an, was bei jeder ungeraden Primzahl n zulässig ist; rj, rjx sind hier also die zwei Perioden von J/2 (w — 1) Glie- Gliedern, die wir jetzt mit A, B bezeichnen wollen, so dass A = r + r2 -f r4 H 1- rn-B B = rx + r3 + rb -| j- r„_2. Die r, r2, r4, .. . haben die Exponenten g°, g2, . . ., gn~B, d. h. die Exponenten von g sind gerade Zahlen. Die Exponenten von r sind also die quadratischen Beste von n (§. 145). Ebenso sind die Exponenten von r in der Summe B die Nichtreste. Bezeichnen wir also die Beste mit a, die Nichtreste mit b, so ist A) A = 2r", B = 2r\ und es ist (— 1, r) = A — B. Diese Ausdrücke A, B, werden die Gauss'sehen Summen genannt. Machen wir in der Formel §. 177, A0) die Annahme so ergiebt sich B) ^-B = während andererseits A + B = - 1, also C) 2A = — 1 ±K(— 1)~», 2B = -l + K(-l)"r». Das Vorzeichen, das man der Wurzel zu geben hat, hängt von der Wahl von r ab. Ist aber über r verfügt, so ist das Vorzeichen völlig bestimmt. Seine Ermittelung bietet eigen- thümliche Schwierigkeiten, die zu einer eigenen Abhandlung von Gauss Anlass gegeben haben1). J) Summatio quarundam serierum singularium. Gauss Werke, Bd.II. Auf andere Weise, mit Anwendung der höheren Analysis, ist das Zeichen
§. 179. Die Gauss'schen Summeu. 623 Setzen wir 1,71% D) r = e~'¦> so wird das Zeichen in den Formeln B) und C) ein bestimmtes, und die Formel B) lässt sich mit Benutzung des Legrendre'- schen Zeichens (§. 145) so darstellen: (ö) 2 l,u—1 ' Nach §. 145 ist abfer, wenn v die Reihe der Zahlen 1,2,..., i/s (n — 1) durchläuft, F) n(f — rrv) = Bi) 2 n sin tUL — { 2 yW) worin \/n positiv zu nehmen ist. Vergleichen wir dies mit E), so ergiebt sich, wenn j = ±1 gesetzt wird G) | und hieraus soll das Vorzeichen £ bestimmt werden. Die ganze Function der Variablen x (8) s verschwindet für x = r, und ist also, wegen der Irreducibilität der Kreistheilungsgleichung durch X„ = (xn — 1) : (x — 1) theil- bar. Da die Function (8) aber auch für x = 1 verschwindet, weil es ebenso viel quadratische Reste wie Nichtreste giebt, so ist sie auch durch (x — 1) und folglich durch (xn — 1) theilbar, und wenn wir also mit f(x) eine ganze und ganzzahlige Function von x bezeichnen, so ist identisch (9) s II(x* — xn~*) = i ß^jx* + (xn — 1) f(x). von Diriohlet, Cauchy, Kronecker bestimmt worden. Der Weg, den Gauss einschlägt, benutzt nur algebraische Hülfsmittel. Kronecker hat iu Liouville's Journal Ser. 2, Bd. 1 einen Weg für die Vorzeichenbestim- Vorzeichenbestimmung angegeben, der mit Benutzung einer Bemerkung von Dedekind (Schlömilch's Ztschr. Bd. 15, Literaturzeitung S. 21) gleichfalls zu einem rein algebraischen wird. Einen Weg, der durch sehr einfache Hülfsmittel, durch Benutzung elementarer goniometrischer Formeln zum Ziele führt, hat neuerdings Mertens eingeschlagen (Sitzungsber. d. Berliner Akademie, 27. Febr. 1896). Wir folgen im Text dem durch Dedekind vereinfachten Kronecker'schen Weg.
624 Sechzehnter Abschnitt. §. 179. Wenn wir in dieser identischen Gleichung x = 1 -\- y setzen, und nach Potenzen von y ordnen, so giebt ein Factor der linken Seite A + yy — A + yy-" = Bv — n)y n—l und die linke Seite fängt also mit der Potenz y 2 an, deren Coefficienten A0) eIIBv — n) = s2 2 . 1. 2 —^ (mod n). n — l Der Coefficient von y 2 auf der rechten Seite von (9) muss nun diesem Ausdrucke gleich sein, und wir setzen die Reste nach dem Modul n einander gleich. In der Entwicklung von xn — 1 = A -\~ y)n — 1 sind aber alle Coefficienten, mit Ausnahme des letzten, durch n theilbar, also ist in dem Product (xu —1)/(#) der Coefficient von n — l y 2 ganz durch n theilbar, da/(#) ganzzahlige Coefficienten hat. l n—l Der Coefficient von y 2 in x* ist aber nach dem binomischen Satze A1) und ist gleich Null, wenn h < \ (n — 1) ist. Da aber der Aus- Ausdruck A1) für diese Werthe von Tc gleichfalls verschwindet, so können wir die kleineren Werthe von h trotzdem stehen lassen und erhalten durch Multiplication mit .1. 2. ... ?=± = (-1)^ (n-l)(»-2) • • nach A0) und A1) (mod w)' n—l n—l A2) (—l)" 2 2 . 1. 2. . . . (W —1) . £ -^) (mod»), worin "k ein beliebiges volles Restsystem nach dem Modul n durchlaufen kann. Nach dem Euler'schen Satze [§. 145, A3), 6.] ist aber (modn),
§. 179. Die Gauss'schen Summen. 625 und nach dem Wilson'sehen Satze (§. 143) 1. 2 ...(»— 1) = — 1 (mod «), und da ^1 + ^^(^-1)^-3) (mod2) ist, so ergiebt sich aus A2) (H-l)(»»-3) » + 1 A3) —£ = (-i) 8 2ft 2 (fc (mod w). Ordnen wir den unter dem Summenzeichen stehenden Aus- Ausdruck nach Potenzen von ft, so erhält die Summe die Gestalt 2 worin die Coefficienten a^, a2, . . ., a„_3 ganze Zahlen sind. Nach den Sätzen §. 143, B2), B3) ist dies aber nach dem Modul n mit — 1 congruent und wir erhalten aus A2) (»—1) (»—3) £ = (— 1) 8 (mod ri). Daraus ergiebt sich, da £ nur = ± 1 sein kann, und n nicht = 2 ist, (u — l) (» — 3) A4) £ = (— 1) <• . Setzen wir diesen Werth in G) ein, so folgt nach F) A5) 2( — )»*= A 2 ^ Vw. Ist s irgend eine durch n nicht theilbare Zahl, so durch- durchläuft sie gleichzeitig mit Tc ein volles Restsystem nach dem Modul n, und wir können daher in der Summe A5) den Summationsbuchstaben h durch sie ersetzen. Dadurch ergiebt sich die allgemeinere Formel wodurch das Vorzeichen in B) und C) allgemein bestimmt ist, 2 ais nämlich, wenn r = e " gesetzt wird Weber, Algebra. I. 40
626 Sechzehnter Abschnitt. §. 179. A — B = f—\ Vn, n = 1 (mod 4) A — B=i(£\]/n, n = 3 (mod 4). Nach §.175, A8) sind nun die 1/2(n—1) Grossen ra und die i/2(m — 1) Grossen rh die Wurzeln je einer Gleichung 1/a(n—l)ten Grades, deren Coefficienten ganz und ganzzahlig, und zwar linear, durch A und B ausdrückbar sind. Wenn wir also mit T(x), Z{x) zwei ganze Functionen von x mit ganzen rationalen Coefficienten bezeichnen, von denen die erste den Grad 1/2 (n — 1), die zweite den Grad 1/2 (n — 1O1 hat, so haben wir 2 A(x) = 2 n(x — ra) = Y(x) — Z(x) 2 f—\rk, )l\ 2B(x)= 2n(x — r») = Y(x) + Z(x) 2 \—\rh, und die Coefficienten der Functionen Y(x), Z(x) können nach §. 175 berechnet werden, und ergeben sich als rationale ganze Zahlen. Multiplicirt man die beiden Formeln A8) mit einander, und gebraucht X in derselben Bedeutung wie in §. 175, B), so folgt die Identität A9) 4 X = Y(x)* — (— l)~ nZ(xf. Es lässt sich nun noch zeigen, dass die beiden in A8) ent- enthaltenen Functionen 0\x, V(— 1)~») = Y(x) qp Z(x) 1 / "-1 in dem Körper R, y (— 1) 2 w, der aus dem Körper der ratio- rationalen Zahlen durch Adjunction von V+ n entsteht, irreducibel sind. Denn ist #x ein Theiler von <&, so erhalten wir, wenn wir das Product <&x #i bilden, wo <3>i aus #i durch Aenderung des Vorzeichens der Wurzel V± n entsteht, eine ganze Function von x mit rationalen Coefficienten, die mit X eine Wurzel gemein hat, und folglich durch X theilbar ist Der Grad dieses Productes kann also nicht kleiner als n — 1 sein, und folglich kann der Grad von &r nicht kleiner als 1/2(n — 1), d. h. nicht
§. 179. Die Gauss'schen Summen. 627 kleiner als der Grad von <3> sein, und folglich ist <&j, von einem etwaigen constanten Factor abgesehen, mit <3> identisch. D. h. <3> ist irreducibel. Nehmen wir an, es seien die Functionen Y, Z irgendwie mit ganzzahligen Coefficienten so bestimmt, dass die Gleichung A9) 1/ »n.1 befriedigt ist, so hat T — Z \ (— 1) 2 n bei passender Ver- Verfügung über das Vorzeichen der Quadratwurzel mit A(x) einen Theiler gemein und ist also, da der Grad derselbe ist, mit A(x) bis auf einen Zahlenfactor identisch. Dieser Zahlenfactor ist aber dann bestimmt, wenn wir annehmen, dass Y von höherem Grade ist als Z, und dass der Coefficient von x1^"—« in Y gleich -)- 2 ist. Dann können bei geeigneter Vorzeichenbestim- Vorzeichenbestimmung für Z diese Functionen in A8) eingesetzt werden, und es folgt 2A(x) = Y(x) - Z(x) ß B0) Das Vorzeichen von Z lässt sich aber in folgender Weise bestimmen. Setzen wir x = 1, so folgt _ r«) = Z{\) 2 ! uud es ergiebt sich also wie oben, dass die ganze Function von x B1) iT(l — a*) — iT(l — x") — Z(l) £ f—) a;fc = (*" durch x11 — 1 theilbar ist, so dass f(x) eine ganze Function von x mit ganzzahligen Coefficienten bedeutet. Setzt man hierin wieder x = 1 -)- y und vergleicht beiderseits die Coefficienten von ylM«—1M so folgt wie vorhin woraus nach §. 145, A7) B2) Z(l) = — 2. 1. 2 • • • ^^ (mod n) entsteht, und hierdurch ist von zwei entgegengesetzten Func- Functionen Z(x) eine bestimmte gekennzeichnetl). l) Nach eiDer briellichen Mittheilung von Dedekind. 40*
628 Sechzehnter Abschnitt. §. 180. So findet man z. B. für n = 13, wenn man Y, Z zunächst mit unbestimmten Coefficienten ansetzt, durch einige Versuche die nachträglich leicht zu verificirende Lösung der Gleichung A9) 4 X = J2 — 13 Z2 r= 2x* -\- x° 4- 4a;* — x°* + 4#2 + x + 2 Z = #5 -j- #3 -j- #, also Z A) = 3, und da 3 = — 2. 1. 2. 3. 4. 5. 6 (mod 13) ist, so ist das Zeichen von Z nach B2) richtig gewählt. Hieraus erhält man nach A5) die Gleichung, deren Wur- Wurzeln sind: ,2ni ,6ni ,8ai r° = e~ lB , e~^~, e~ 1B , in der Gestalt 2 x« + (l — Vl3) x> + 4 x* — (l +Vl3) & + 4 x* _ -J- A —V13)-^ -1-2=0, worin Vl3 positiv zu nehmen ist. Nehmen wir die Wurzel mit entgegengesetzten Zeichen, so ergie*bt sich eine Gleichung, deren Wurzeln sind: r» = e~ 13 , 13 />— 13 §. 180. Die Perioden von 1/B(n — 1) und 1/i(n — 1) Gliedern.. Wir gehen jetzt zu dem Falle e = 3 über, wobei n — 1 durch 3 theilbar angenommen werden muss, also n = 7, 13, 19, 31, 37, 43 ... Wir bezeichnen mit q eine imaginäre dritte Einheitswurzel : und bestimmen die drei Perioden r), rj1, t]2 von je 1/s(n — 1) Gliedern, die, wie wir in §. 175 gesehen haben, die Wurzeln einer cyklischen cubischen Gleichung sind. Nach §. 177 ist ^(p) p 1,»—2 wofür, da — 2 = 1 (mod 3), auch
§. 180. Specielle Perioden. 629 1,«—2 gesetzt werden kann. Diese Zahl tpi (q) kann in einer der beiden Formen B) dargestellt werden, worin a, b, A ganze Zahlen sind und A = 2 a — & ist Es ist dann C) ^(p«) = a + 6p» = ^ und die Formeln A0), A5) des §. 177 ergeben D) v\ -f- nx + n2 = — 1 F) (p, vi) (p2, vi) = n, f! (p) f! (p2) = n, worin Beispielsweise erhält man für n = 7, 13, wenn man die primitiven Wurzeln 3, 2 zu Grunde legt und die Indextabellen anwendet: n = 7 w = 13 1 0 2 2 3 1 4 4 5 5 6 1 T T 2 1 3 4 4 T 5 9 6 5 7 11 8 T 9 8 10 10 11 7 12 für n = 7, a + & p = — A + 3 q), für w = 13, a + b q = — D + 3 p). Aus diesen Formeln können wir leicht die cubische Glei- Gleichung herleiten, deren Wurzeln die ¦»?, %, 172 sind. Sie hat wegen D) die Form (8) i' + ^ + ^ + ^O, und die ganzen Zahlen ß, y sind zu bestimmen. Führen wir die Multiplication in F) aus, so ergiebt sich also (9) -(n—1).
630 Sechzehnter Abschnitt. §. 180. Die Ausführung der Cuben in E) ergiebt, wenn wir für den Augenblick ss = n* 4- ni + ni, s = n*-ni + nlv» + nin, s' = nlri + nhi + rfn-i setzen «i^j (p) = s3 — 6 y -f- 3 s p -j- 3 s' p2. Aus (8) und (9) erhält man aber s3 = — w — 3 y [§. 46, (9)], also A0) »[tfi und ebenso A1) «[^i( wozu noch, wenn man D) in den Cubus erhebt, n — 1 = — 9y + 3s -f- 3s' kommt. Addirt man die drei letzten Gleichungen, so folgt »[tfifa) + ^i(?2)] + 3» — 1 = — 27y, oder endlich nach B) und C) A2) — 27y = «J. + 3,« — 1. Aus dieser Relation folgt, da y eine ganze Zahl ist, A3) Ä = l (mod 3). Nun ist nach B), C) und F) A4) n = a2 — ab-\-b\ oder A5) 4w = J.24- U\ und wenn wir diesen Werth in A2) substituiren, — 4 . 27y = ^3 _j_ 3 J.J2 _j_ 3^3 _|_ 952 _ 4. Setzen wir nach A3) für den Augenblick J. = 1 -|- 3 m, so folgt J.s -\- 3 J.2 — 4 = 0 (mod 27) und mithin 3&3(J.-j- 3) = 0 (mod 27), und daraus 3&2 = 0 (mod 27), Es ist also b durch 3 theilbar, und wenn wir b = 3 B setzen, so folgt aus A5) A6) 4« = i2 _j_ 27B*. Wir können auch leicht die Quadratwurzel aus der Dis- criminante bilden, nämlich A7) Vd = {n - ni) (n - ijO (Vl - %) = ¦* - s',
§. 180. Periodengleichungen. 631 wenn wir A0) und A1) von einander subtrahiren. Man erhält daraus A8) Vl) = nB. Die cubische Gleichung, deren Wurzeln die drei Grossen v\ sind, hat also, was übrigens schon aus dem am Anfang von §. 179 Bemerkten folgt, drei reelle Wurzeln. Sie vereinfacht sich, wenn man setzt, und ergiebt dann A9) g3 — 3«£ — nA = 0. Substituirt man auf der linken Seite für § der Reihe nach B0) — 2 Vn, — Vn, + Vn, + 2 Vn, so ergeben sich die Werthe — »B V» + A), + »B Vn — A), — »B Vn + A), + nBVn — A), die, weil nach A6) A absolut kleiner als 2Vn ist, abwechselnde Vorzeichen haben. Es liegt also in jedem der drei durch die Werthe B0) begrenzten Intervalle eine Wurzel der Gleichling A9). Ueber die Frage, welche der drei Wurzeln der cubischen Gleichung A9) für g = 3 rj -f- 1, welche für 3 ijx + 1 oder für 3172 -j- 1 zu setzen ist, lässt sich allgemein so viel sagen, dass das Vorzeichen des Productes A7) mit dem Vorzeichen von A8), das durch die Definition A), B) bestimmt ist, freilich aber noch von der Wahl der primitiven Wurzel g abhängt, übereinstimmen muss. Dadurch sind von den sechs möglichen Zuordnungen drei ausgeschlossen. Welche Zuordnung unter den drei übrigen zu treffen ist, hängt vou der Wahl von r ab, und würde zu ähnlichen Untersuchungen Anlass geben, wie sie im vorigen Paragraphen zur Bestimmung des Zeichens der Quadratwurzel durchgeführt sindx). Wir heben noch den durch die Formeln A4), A6) bewiesenen Satz hervor: Ist n eine Primzahl von der Form 3ft-)-l, so ist n durch die Form a2 — ab -\- 62 und in durch die Form J.2 -j- 27 JB2 darstellbar, wo a, &, A, B ganze Zahlen sind. *) Kummer, Journ. f. Mathematik, Bd. 32.
632 Sechzehnter Abschnitt. §. 180. .Daraus ergiebt sich noch, dass n auch in der Form #2-f- 3«/2 darstellbar ist. Denn wenn von den beiden Zahlen a, b eine, etwa a, gerade ist, so ist W==(f-iJ + 1*2' und wenn a und b beide ungerade sind, so ist Auch die zweigliedrigen Perioden der 9ten Einheitswurzeln genügen einer cubischen Gleichung, und weil diese Gleichung bei der später zu behandelnden allgemeinen Theorie der cubi- cubischen Kreistheilungskörper eine wichtige Rolle spielt, wollen wir sie der Vollständigkeit halber hier betrachten, obwohl sie eigent- eigentlich in ein allgemeineres Gebiet gehört, in dem die Grade der Einheitswurzeln keine Primzahlen mehr sind. Eine 9te Einheitswurzel r genügt der Gleichung 6ten Grades: B1) r« _|_ rs _|_ i — o, und wir haben drei conjugirte zweigliedrige Perioden B2) n = r-Jrr-1, <>}' = r3 -\--r~*, n" = ^ + r~\ die die Wurzeln der cubischen Gleichung B3) y* — 3fj + 1 = 0 sind. Ist p eine dritte Einheitswurzel, so können wir p = rs setzen, und erhalten die Resolventen B4) (p, rj) = rj -\- q rj' -\- p2ij", {q~\ rf) = r) -\- q~1 r\' -f- p~2 r)", für die man nach B2) mit Benutzung von B1) erhält (p, rf) =: 3r, (p—1, f}) = 3*™1, also B5) (p, n)z = 27 p, B6) (p, rj) (q~\ t]) = 9, : was den Formeln E) und F) ganz analog ist. Wir gehen noch in der Kürze auf den Fall e = 4 ein, der bei den Primzahlen n von der Form 4/ -\- 1 (/ eine ganze Zahl) eintritt, also bei n =± 5, 13, 17, 29, 37, 41 ... Die vier Perioden von je / Gliedern seien wieder t], t]u
§. 180. Periodengleichungen. 633 Für « in §. 177 haben wir i zu setzen, erhalten also (i, t)) = ri -\- irj! — ^2 — i^3, B7) (—l,rf) = ri— ^ -f n-2 — ya, (—i, t)) = n — i Vl — V2 -\- iy-i, und nach §. 177 (8), da — 2 = -f- 2 (mod 4) ist, #! (l) = j;iind«+2ind(« + l) t/>2 (*) = 2:iind«2+*» = a + 6«, worin a und b ganze Zahlen sind. ipl (i) hat dieselbe Form wie i/>2 (i). Wir werden aber sogleich die eine Function auf die andere zurückführen. Da nun tj -j- ij2, ^! -j~ ^3 die beiden 2/-gliedrigen Perioden sind, so ist nach den Resultaten von §.179 B9) (-hv) = V+Vt—Vi-V» = V», und also, da r) -j- ijj -j- ^2 -j- ij3 = — 1 ist, C0) 2(t2 + t22) = -1 + Vw, 2A?l+%) = -l-Vw, wo das Vorzeichen von Vw nach §. 179 zu bestimmen ist und bei passender Annahme über r positiv genommen werden darf. Wir haben ferner nach §. 177, A0), A4) C1) (*, n) (— i v) = (— l)fn 1 (*, nY = (- i, n) *i @. also nach B9) und §. 177, A5): C2) (*' n) = ^ (i) ^' (~ *» ^J = ^x (~ ^ (», 1?)* = (- 1)/» ^i (») rl>2 (*) = n ^i @2, woraus folgt: C3) ^ (*) = (— 1)/^ (») = (— l)/(a + 6 *), und hieraus nach C1): C4) i>! (*) ^ (— 0 = rl>.2 (t) ^2 (— «) = aa + 62 _ „. Um die biquadratische Gleichung zu bilden, deren Wurzeln q, Vn ^21 Vz sind, suchen wir zunächst die quadratische Gleichung mit den Wurzeln rj, rjt und erhalten sie aus Quadriren wir diese beiden Gleichungen und subtrahiren die zweite von der ersten, so folgt wegen C1) und C2) C5) 16 n rj2 = 1 + n — 2 Vn — 2 n (— 1)/ — 2 a{— iyVn.
634 Sechzehnter Abschnitt. ¦§. 180. Durch C0) und C5) sind aber die Coefficienten der ge- gesuchten quadratischen Gleichung bestimmt. Sie lautet: V + 2H16 und die biquadratische Gleichung für die vier Perioden erhält man, wenn man beiderseits quadrirt: C6) Suchen wir den Coefficienten der ersten Potenz von 17, der eine ganze Zahl sein muss, so finden wir dafür l+„-2n(-l)/ a(-iy+ 1. C7) ^ » g , / ist gerade, wenn » = 1, ungerade, wenn n = 5 (mod 8) ist, demnach ist 1 4- n — 2 » (— 1)/ = 0 (mod 8). Daraus aber folgt wegen C7), dass a(— iy ~\- 1 durch 4 theilbar sein muss, also C8) a = — (— 1)/ (mod 4), und, daraus ist nach C4) weiter zu schliessen, dass b gerade sein muss, also C9) 6 = 0 (mod 2). Die biquadratische Gleichung nimmt eine einfachere Gestalt an, wenn wir D0) 4 ij + 1 = % setzen. Sie erhält dann nach C6) die Gestalt: D1) [g« + »A — 2(— 1)/)]« — 4w[g + (— l)/ap = 0, oder wenn wir die beiden Fälle «=1 oder =5 (mod8) trennen: (g») V J (£2f 3wJ — 4w(g — af = 0. Wir wollen auch hier den in der Formel C4) ausgedrückten Satz hervorheben: Jede Primzahl von der Form 4/ -\- 1 lässt sich in die Summe zweier Quadrate zerlegen.
§. 181. Complexe Zahlen. 635 §. 181. Die complexen Zahlen von Gauss. Der zuletzt bewiesene Satz bildet die Grundlage für die Theorie des Zahlkörpers, der durch Adjunction der imaginären Einheit i = V— 1 aus dem Körper der rationalen Zahlen ent- entsteht, den wir nach unserer Festsetzung mit B (i) zu bezeichnen haben!). Wir haben hier die Primzahlen von der Form 4/ -\- 1 zu unterscheiden von denen der Form 4/ -f- 3, und wir wollen der Kürze wegen die ersten mit der Primzahl 2 zusammenfassen und mit p, die zweiten mit q bezeichnen, also j> = 4/+1,2; g = 4/+3 setzen. Es gelten dann folgende Sätze: 1. Für jedes p giebt es zwei ganze Zahlen a und b, so dass p = cfi + 62 ist. Dies ist für die Primzahlen von der Form 4/-)-1 im Schluss- Schlusssatze des letzten Paragraphen ausgesprochen und ist für p = 2 aus 2 = l2 -j- l2 unmittelbar ersichtlich. Dem steht ein zweiter Satz gegenüber: 2. Eine Primzahl q ist niemals in der Form a2 -)- 6* darstellbar, oder der noch allgemeinere: 3. Die Summe zweier Quadrate ganzer Zahlen a2-\-b2 ist nur dann durch eine Primzahl q theilbar, wenn a und b durch q theilbar sind. Der Satz 2. ergiebt sich einfach daraus, dass, wenn a2 -\- 62 ungerade ist, die eine der beiden Zahlen a, b gerade, also- ihr Quadrat durch 4 theilbar, die andere ungerade, also ihr Quadrat — 1 (mod 4), also a2 -f- b2 = 1 (mod 4) sein muss. Der Satz 3., der übrigens den zweiten in sich schliesst, wird so bewiesen. Angenommen, es sei a2 -\- b2, aber nicht b, durch q theilbar, so bestimmen wir b' aus der Congruenz bb' = 1 (mod q) und erhalten aus a2 -f- 62 = 0 (mod q) (ab1J = — 1 (mod q). :) Gauss, Theoria residuorum biquadraticorum, commentatio secunda. Werke, Bd. II.
636 Sechzehnter Abschnitt. §. 181. Dies ist aber urlmöglich, da nach §. 145, 4. für jede Primzahl q die Zahl — 1 quadratischer Nichtrest ist. Der Körper B (i) ist der Inbegriff aller Zahlen von der Form x -f- yi, wenn x, y ganze oder gebrochene rationale Zahlen sind. Die Zahlen a -(- bi, in denen a und b ganze Zahlen in B sind, heissen die ganzen Zahlen desKörpers B(i). Das Product zweier conjugirter Zahlen £ = x 4- yi, |' = x — yi, also £r = *2 + 2/2 heisst die Norm von £ und wird mit N(£) bezeichnet. Die Norm einer nicht verschwindenden Zahl £ ist eine positive rationale Zahl und die Norm einer ganzen Zahl ist eine ganze Zahl. Die Norm eines Productes oder eines Quotienten ist gleich dem Pro- Product oder dem Quotienten der Normen. Eine ganze Zahl, deren Norm gleich 1 ist, heisst eine Einheit. Da a2 -\- b'2 (für ganzzahlige a, b) nur dann = 1 sein kann, wenn a = ± 1, b = 0 oder a = 0, b = ± 1 ist, so giebt es in B{i) nur die vier Einheiten + 1, -1, +.', -.-. Der reciproke Werth einer Einheit ist auch eine Einheit. Zwei Zahlen, von denen die eine aus der anderen durch Multiplication mit einer Einheit entsteht, heissen associirte Zahlen. Jede complexe Zahl gehört zu einem System von vier asso- ciirten Zahlen a -\- bi, — a — bi, — b -f- ai, b — ai. Summe, Differenz und Product zweier ganzer Zahlen sind wieder ganze Zahlen. Eine ganze Zahl « heisst durch eine ganze Zahl ß theilbär, wenn eine dritte ganze Zahl y existirt, so dass a = ßy ist. Ist a durch ß theilbär, so ist N(a) durch N(ß) theilbär. Denn aus « = ßy folgt N(u) = N(ß)N(y). Sind «, ß, y ganze Zahlen in B(i) und ist a durch y theil- theilbär, so ist auch aß durch yß theilbär, und ist « und ß durch y theilbär, so ist auch « ± ß durch y theilbär. Jede ganze Zahl ist durch jede Einheit theilbär.
§. 181. Complexe Zahlen. 637 Die Einheiten sind aber nur durch Einheiten theilbar; denn ist a/3 eine Einheit, so ist N(u)N(ß) = 1, also N(a) und N(ß) = 1, d. h. a und ß sind Einheiten. Associirte Zahlen sind gegenseitig durch einander theilbar, und wenn zwei Zahlen gegenseitig theilbar sind, so sind sie associirt. Denn sind a : ß und ß : et beides ganze Zahlen, so ist das Product dieser beiden Zahlen = 1; also sind beides Ein- Einheiten. Für die Zahlen des Körpers B (i) gelten dieselben Gesetze über die Zerlegung in Primfactoren, wie bei den reellen ganzen Zahlen: Eine ganze Zahl a des Körpers B(i), die keine Einheit ist, heisst zusammengesetzt, wenn sie sich in mehrere ganzzahlige Factoren, deren keiner eine Einheit ist, zerlegen lässt. Lässt sie sich nicht so zerlegen, so soll sie eine Primzahl im Körper B(i) heissen. Ist § = x -\- yi eine gebrochene Zahl des Körpers B(i), so lässt sich eine ganze Zahl [i = m -\- ni so bestimmen, dass die Norm der Differenz § — ji, also (x — mJ -f- (y — wJ, kleiner ¦oder wenigstens nicht grösser als 1/2 ist; denn man braucht die ganzen rationalen Zahlen-m, n nur so zu wählen, dass x — m und y — n absolut genommen nicht grösser als Väi ihre Quadrate also nicht grösser als 1/i sind. Sind also a und a1 zwei ganze Zahlen in B(t), und av von Null verschieden, so kann man hiernach die ganzen Zahlen ji und «2 so bestimmen, dass ! ! (,) = 2 also « = ji «! -f- «2, N(a2) < N(al). Ist «2 nicht Null, so kann man ebenso mit den Zahlen «!, «2 verfahren und erhält und so bestimmt man eine Reihe ganzer Zahlen a, uu a2, 03 . . . mit stets abnehmender Norm, die sich fortsetzen lässt, so lange die Null nicht darunter vorkommt. Da diese Normen ganze ratio- rationale positive Zahlen sind, die immer abnehmen, so muss nach einer endlichen Zahl von Schritten die Null auftreten und man ¦erhält also ein Gleichungssystem:
638 Sechzehnter Abschnitt. §. 181; «1 = f*l «2 + «3. A) . - «A-2 = f*Ä — 2 «7s— 1 -j~ «Ä» «Ä_i = (tÄ_i au. ¦ Daraus schliesst man, dass die ganze Reihe der Zahlen «, «j, «2, . . ., also insbesondere auch « und «1) durch «Ä theilbar sind, und umgekehrt, dass jeder gemeinsame Theiler von a und «! Theiler von allen folgenden «, also auch von ah ist. Jede andere Zahl, die diese beiden Eigenschaften hat, muss mit ah associirt sein, und man nennt also ah (und jede mit ah associirte Zahl) den grössten gemeinschaftlichen Theiler von « und «j. Wenn wir aus dem Algorithmus A) die zwischenliegenden a eliminiren, indem wir «2 aus der ersten in die zweite, dann o% aus der zweiten in die dritte Gleichung substituiren u. s. f., so ergiebt sich ein Resultat von der Form ux -\- a^k = w^, und wir können also, wenn wir statt «, o^, ah setzen «, ß, 8, den Satz aussprechen: 4. Wenn «, ß irgend zwei ganze Zahlen in H(i) sind, und 8 ihr grösster gemeinschaftlicher Theiler, so kann man die ganzen Zahlen x, X so bestimmen, dass B) kx + ßX = 8 wird. Ist der grösste gemeinschaftliche Theiler 8 zweier Zahlen a, ß eine Einheit, so heissen a und ß relativ prim, und wir können in diesem Falle der Gleichung C) «3t 4- ßl = 1 durch ganzzahlige x, X genügen. Ist ß eine Primzahl, so ist entweder a durch ß theilbar, oder « und ß sind relativ prim. Im letzteren Fall besteht die Gleichung C). Ist dann y eine andere Zahl in H («'), so folgt aus C) uyx -\- ßyX = y. Es muss demnach, wenn ay durch ß theilbar ist, auch y durch ß theilbar sein. Also haben wir folgenden Fundamentalsatz: 5. Ein Product aus zwei oder mehr ganzen Zahlen in B(i) ist nur dann durch eine Primzahl in B(i)
§. 181. Complexe Zahlen. 639 theilbar, wenn wenigstens einer seiner Factoren durch diese Primzahl theilbar ist. Mächt man nun noch die Bemerkung, dass eine Primzahl nur dann durch eine andere theilbar sein kann, wenn der Quotient eine Einheit ist, wenn also beide associirt sind, und betrachtet associirte Primzahlen als nicht wesentlich verschieden, so folgt: 6. Eine ganze Zahl des Körpers JR(i) kann immer und nur auf eine Art in ein Product von Prim- Primzahlen zerlegt werden. Denn sei « irgend eine ganze Zahl in B(i). Ist a nicht selbst eine Primzahl, so ist sie zerlegbar, etwa in yß; die Normen von y und von ß sind aber kleiner als die Norm von a. Ist ß noch keine Primzahl, so ist es wieder zerlegbar, etwa in de; die Normen dieser Factoren, die alle positive ganze rationale Zahlen sind, nehmen immer ab, und man muss also nothwendig einmal auf einen Factor stossen, der eine Primzahl ist. Also ist jede Zahl « gewiss durch ,eine Primzahl % theilbar. Ist demnach a = %«', so gilt von «' dasselbe und es ist etwa a' = %' a" . . . Da die Normen von «, «', «" . . . wieder alle abnehmen, so muss man bei der Fortsetzung dieser Reihe schliesslich auf eine Einheit stossen. Es ist daher « in eine endliche Anzahl von Primfactoren zerlegbar, also « = % %' %" . . ., wobei ein zuletzt übrig bleibender Einheitsfactor mit einer der Primzahlen % vereinigt werden kann. Sind nun x, %', x" ... gleichfalls Primzahlen und ist a = x x' x" . . ., so folgt aus x%'%"... = %%'n" ... nach 5., dass eine der Primzahlen sr, z. B. die erste durch % theil- theilbar, also von % nicht wesentlich verschieden ist. Hebt man beiderseits mit jc = sr, so kann man denselben Schluss mit %' wiederholen u. s. f., und findet also, dass jede der Primzahlen x auch unter den % vorkommen muss, und wenn unter den x eine Primzahl mehrmals vorkommt, so muss sie mindestens ebenso oft unter den % vorkommen. Derselbe Schluss lässt sich aber auch umgekehrt machen, und daraus folgt, dass die Gesammtheit der x, von Einheitsfactoren- abgesehen, mit der Gesammtheit der % übereinstimmen muss. Es handelt sich nun noch darum, die Primzahlen des Körpers B(i) wirklich zu ermitteln.
640 Sechzehnter Abschnitt. §. 181. Jede Primzahl ist Theiler von unendlich vielen rationalen ganzen Zahlen, z. ß. von der Norm und allen ihren Vielfachen, unter den rationalen positiven ganzen Zahlen, die durch eine Prim- Primzahl % theilbar sind, ist eine, die wir mit n bezeichnen wollen, die kleinste, und diese muss eine Primzahl im Körper H sein. Denn wäre sie in H zerlegbar, so müsste nach 5. einer ihrer Fac- Factoren, also eine noch kleinere Zahl, durch % theilbar sein. Ebenso ist auch umgekehrt jede reelle Primzahl n wenigstens durch eine Primzahl % theilbar. Es sei also n = im, woraus durch Bildung der Norm w2 = N(it) N.(a) folgt. Da n eine Primzahl ist und N(jc)N(a) ganze Zahlen, so sind zwei Fälle möglich: 1. N(x) = n, N(a) = n, 2. N(n) = n2, N(u) = l. Im ersten Falle ist, wenn %' die zu % conjugirte Zahl be- bedeutet und % = a -\- bi gesetzt wird, n = nn' = a2 -f- b2, a = «', und man sieht, dass dieser Fall nur dann eintritt, wenn n zu den Primzahlen p gehört, die in die Summe von zwei Quadraten zerlegbar sind. Umgekehrt kann jede solche Zahl p in zwei conjugirte Factoren ac, %' zerlegt werden, deren keine eine Einheit ist. Die Primzahlen p sind also im Körper B(i) nicht Primzahlen. Im zweiten Falle, der hiernach bei den Primzahlen q ein- eintritt, ist « eine Einheit, also n mit % associirt, d. h. die reellen Primzahlen q sind auch im Körper R(i) Primzahlen. Die Primzahl 2 gehört, wie schon bemerkt, zu der ersten Art, und es ist 2 = A -f- i) A — i). Aber sie nimmt eine be- besondere Stellung ein, weil 1 — i = — i A -{-«), also 2 = — i(l-\- *'J ist. Die reelle Primzahl 2 ist also (von dem Factor — i ab- abgesehen) im Körper B(i) das Quadrat einer Primzahl. Dieser Fall tritt, wie man leicht sieht, bei keiner der übrigen Prim- Primzahlen p ein. Die Gesammtheit der Primzahlen des Körpers JR(i) besteht also aus den reellen Primzahlen q und aus den Factoren der Prim- Primzahlen 2>> Ist p in die Summe zweier Quadrate a2 -f- b2 zerlegt, so kennt man auch die conjugirten Factoren a i bi von p. Dazu kommen noch die associirten Zahlen. Aus 5. folgt dann noch, dass eine Primzahlp nur auf eine Art in die Summe von zwei Quadraten zerlegt werden kann. Durch diese Zerlegung sind aber die Zahlen a, b noch nicht völlig bestimmt, sondern sie
§. 182. Körper der dritten Einheitswurzeln. C41 können noch mit einander vertauscht und mit zwei Vorzeichen versehen werden. Das kommt darauf hinaus, dass man % durch jede der vier associirten Zahlen a -\-bi, — a — bi, — b -\- ai b — ai ersetzen kann. Ist ^-ungerade, so muss von den beiden Zahlen a, b die eine gerade, die andere ungerade sein. Wählen wir etwa für b die gerade der beiden Zahlen, und bestimmen das Vorzeichen so, dass a = 1 (mod 4) wird, so ist unter den vier associirten Zahlen eine bestimmte ausgewählt, die man die primäre nennen kann1). Diese Definition der primären Zahlen lässt sich auf alle ganzen Zahlen des Körpers B(i) übertragen, deren Norm un- ungerade ist, und man hat dann das Gesetz, dass das Product zweier primären Zahlen wieder eine primäre Zahl ergiebt. Das System von vier associirten Zahlen im Körper JR(i) ist analog dem Paar entgegengesetzter Zahlen im Körper B. In B betrachtet man die positiven Zahlen als die primären. Durch die Formel B8) des vorigen Paragraphen ist für irgend eine gegebene Primzahl p einer der Factoren a + b i aus der Kreistheilung abgeleitet. Nach den Formeln §. 180, C8), C9) ist diese Zahl primär, wenn p = 5 (mod 8), dagegen der pri- primären entgegengesetzt, wenn p = 1 (mod 8) ist. Darüber aber, welche von den beiden conjugirten Zahlen a ± b i durch diese Formeln dargestellt ist, haben wir kein allgemeines Kennzeichen. Beispielsweise sind die complexen Primzahlen in B(f), deren Normen kleiner als 200 sind: 1 + {, 1 -f 2*, 3 -f 2«, 1 -f 4», 5 -f 2«, 1 + 6», 5 + 4», 7 + 2», 5 + 6«, 3 + 8», 5 + 8«, 9 + 4», 1 + 10«, 3 + 10«, 7 + 8», 11 + 4i, 7 + 10«, 11 + 6«, 13 + 2«, 9 + 10*, 7 + 12», 1 + 14». §. 182. Der Körper der dritten Einheitswurzeln. Der Hauptsatz des vorigen Paragraphen, dass jede ganze Zahl des Körpers B(i) sich nur auf eine Art in unzerlegbare Factoren zerlegen lässt, demzufolge der Begriff der unzerlegbaren 2) Gauss giebt an der erwähnten Stelle zwei verschiedene Bestim- Bestimmungen für die primären Zahlen zur Auswahl, von denen dies die erste ist. Er behält weiterhin die zweite bei. Weber, Algebra. I. 41
642 Sechzehnter Abschnitt. §.182. Zahl mit dem der Primzahl zusammenfällt, beruht, wie'man sieht, in der Hauptsache auf dem Algorithmus des grössten gemein- gemeinschaftlichen Theilers, der in den Formeln §. 181, A) enthalten ist, und wenn man also in einem anderen Körper einen solchen, im Endlichen abbrechenden Algorithmus hat, so lassen sich dieselben Schlüsse ziehen. Dies findet statt bei dem Körper, der sich aus B mittelst der dritten Einheitswurzel q = -^ ableiten lässt und mit B(q) oder auch mit J?(V— 3) bezeichnet werden kann. Dieser Körper besteht aus dem Inbegriff aller Zählen der Form £ = x -f- $y, worin x, y rationale Zahlen sind, und die Norm einer solchen Zahl ist x + Q*y) = oft — xy_-\- y* ,= 2x—y + yV^3 2x — y—yV-B _ Ba—y)«-f 3y» 2 ' 2 4 Eine Zahl « = a -f- b q heisst eine ganze Zahl in Jt (p), wenn a, b ganze rationale Zahlen sind. Die Einheiten in diesem Körper ergeben sich aus N(u) = ai — ab-\- 6* = 1, oder Ba — bf -f 362 = 4, die nur erfüllt ist für b = 0, « = f 1 oder a = 0, b =t= + 1 oder a = -j-1> ft = —j— 1 oder a = — 1, b = — 1, so dass man also hier sechs Einheiten hat ± 1, ± Q, ± Q*. Ein System associirter Zahlen ist hier ±(a + b9), ±(a9 + bg*) ±= ±[—b + (a — b)g] ± (a92 + b) = ± (b — a - a9). Ist | eine beliebige gebrochene Zahl in R(q), so kann man die ganze Zahl ji so bestimmen, dass in £ — ii = x-\-(>y die Compo- nenten x und y absolut nicht grösser als 1/i sind und dass also JV(| — (i) = x* — xy + 2/2 ^ |. Auf Grund dieser Eigenschaft lässt sich, ganz wie im vorigen Paragraphen, der grösste gemeinschaftliche Theiler zweier Zahlen «, ß bestimmen und damit beweisen, dass sich jede ganze Zahl in R(q) nur auf eine Weise in Primzahlen dieses Körpers zer- zerlegen lässt, wenn associirte Zahlen nicht als wesentlich verschieden betrachtet werden.
§. 182. Körper der dritten Einheitswurzeln. 643 Wie im vorigen Paragraphen schliesst man, dass man alle Primzahlen des Körpers B (q) erhält, wenn man alle reellen Prim- Primzahlen zerlegt, und dass eine reelle Primzahl entweder in zwei conjugirte Primfactoren in B(q) zerfällt, p = nn\ oder dass sie auch im Körper B(q) eine Primzahl ist. Die Primzahl 3 zerfällt in die beiden Factoren A — q), A — 02); diese sind aber associirt und also ist 3 = — 02A — pJ mit dem Quadrat einer Primzahl in B(q) associirt. Man kann V— 3 für diese Primzahl wählen. Alle Primzahlen von der Form 3/-)- 1 lassen sich nach §. 180 in zwei conjugirte Factoren in B(q) zerlegen, während die Primzahlen von der Form 3/-)-2 niemals zerlegbar sind, weil ein Ausdruck von der Form a2 — a b + &2 nicht = 2 (mod 3) sein kann. Also erhält man alle Primzahlen in B(q), wenn man die reellen Primzahlen der Form 3/-f .2 und die conjugirten Factoren der übrigen reellen Primzahlen aufsucht. Ist a + b q eine complexe ganze Zahl, deren Norm a2 — a b + b2 nicht durch 3 theilbar ist, so muss von den beiden Zahlen a, b entweder eine durch 3 theilbar sein, die andere nicht, oder es muss a = b und folglich a2 — a b + &2 = 1 (mod 3) sein. Es ist also unter den associirten Zahlen a + b 0, b + a 02, b — (a — b) q, immer eine und nur eine, in der derCoefficient.von q (oder von q2) durch 3 theilbar ist. Nehmen wir an, es sei b = 3B durch 3 theilbar, und setzen N(a -\- b q) = p, so folgt, wenn noch 2 a — b = A gesetzt wird," ±p = £> + 27 B\ in Uebereinstimmung mit §. 180. Ist p eine reelle Primzahl, und hat man 4p in dieser Form dargestellt, so erhält man daraus die complexen Factoren von p (A + ZB \(A — SB \ * = V 2 h 3 qB) V 2 3qB) " Die complexen Primzahlen, deren Norm unter 200 ist, sind hier 1 — q, 1 + 3 p, 4+ 3 p, 5 + 39, 5 +9, 7 + 39, 7 + 6 q, 5 + 90, 7 + 9p, 8 + 90, 10 + 39, 11 + 30, 11 + 90, 7 + 120, 13 + 60, 13 + 30, 14 + 90, 13+120, 14 + 30, 11 + 15 0, 16+9 0, 13 + 15 0. 41*
Siebzehnter Abschnitt. Algebraische Auflösungen von Gleichungen. §. 183. Reduction der Gruppe durch reine Gleichungen. Eine der ältesten Fragen, an der sich vorzugsweise die neuere Algebra entwickelt hat, ist die nach der sogenannten algebraischen Auflösung der Gleichungen, worunter man eine Darstellung der Wurzeln einer Gleichung durch eine Reihe von Radicalen, oder die Berechnung durch eine endliche Kette von Wurzelziehungen versteht. Auf diese Frage fällt von der Gruppen- Gruppentheorie das hellste Licht. Präcisiren wir zunächst die Frage, um die es sich handelt, so ist es offenbar die, ob und wie man den Körper £1 durch successive Adjunction von Wurzelgrössen (Radicalen) so erweitern kann, dass entweder alle oder wenigstens ein Theil der Wurzeln im erweiterten Körper enthalten sind. Eine Wurzelgrösse ist aber eine solche, die zwar nicht selbst, von der aber irgend eine ganze Potenz in Sl enthalten ist, also, wenn a eine Grosse in Sl ist, die Wurzel einer Gleichung von der Form y» — a = 0, d. h. einer reinen Gleichung. Soll eine irreducible Gleichung algebraisch auflösbar sein, oder wenigstens eine oder einige algebraisch darstellbare Wurzeln haben, so muss nach einer successiven Adjunction von Wurzeln reiner Gleichungen in endlicher Anzahl die gegebene Gleichung reducibel werden, da ein Theil ihrer Wurzeln in dem erweiterten Körper enthalten sein soll. Da die anfängliche Gruppe P transitiv ist, so muss diese Gruppe schliesslich intransitiv werden, oder
§. 183. Keduction der Gruppe durch reine Gleichungen. 645 sich auf die Einheitsgruppe reduciren. Es muss also jedenfalls einmal der Fall eintreten, dass die Gruppe P durch Adjunction einer Wurzel einer reinen Gleichung reducirt wird. Die Untersuchung dieser Frage wird ausserordentlich ver- vereinfacht, wenn man sie noch etwas umformt1). Wir haben im §. 169 gesehen, dass die reinen Gleichungen zu den Abel'schen gehören, dass alle Abel'schen Gleichungen durch eine Kette von cyklischen Gleichungen vom Primzahlgrad und diese letzteren durch Radicale lösbar sind. Wir ersetzen also die Frage nach der Lösbarkeit durch Radi- Radicale durch die damit gleichbedeutende der Lösbarkeit durch Wurzeln Abel'scher Gleichungen. Ersetzen wir die Abel'sche Gleichung durch eine Kette von cyklischen Gleichungen von Primzahlgrad, so wird die erste Reduction der Gruppe durch Adjunction der Wurzel einer solchen Gleichung eintreten, und wir stehen also zunächst vor der Frage: Unter welchen Bedingungen wird die Gruppe P einer Gleichung »ten Grades f{x) = 0 durch Adjunction einer Wurzel einer cyklischen Gleichung von Prim- Primzahlgrad m reducirt? Wir beschränken uns hierbei nicht auf irreducible Gleichungen f(x) = 0, sondern erörtern die Frage allgemein, immer unter der selbstverständlichen Voraussetzung, dass f(x) keine mehr- mehrfachen Wurzeln hat. Es ist denkbar, dass es nöthig ist, dem Körper £1 zunächst verschiedene Wurzeln cyklischer Gleichungen (z. B. Einheits- Einheitswurzeln) zu adjungiren, die die Gruppe P nicht verändern. Da es sich aber jetzt nur um die Ermittelung der nothwendigen Eigenschaften der Gruppe P handelt, so nehmen wir an, es seien alle nöthigen Vorbereitungen getroffen und der Körper Sl so beschaffen, dass durch Adjunction einer Wurzel der cyklischen Gleichung q> (x) = 0, vom Primzahlgrad m, die Gruppe P sich auf einen ihrer Theiler, Q, reducirt. Bezeichnen wir die Wurzeln von q> (%) = 0 mit so sind alle diese Grossen rational (in £1) durch eine beliebige unter ihnen ausdrückbar, und wenn P die Gruppe von f(x) == 0 x) Auf diese Form der Fragestellung hat zuerst C. Jordan hin- hingewiesen (Traite des substitutions p. 386).
646 Siebzehnter Abschnitt. §. 184. in £1 ist, so ist Q die Gruppe derselben Gleichung in Sl (s), oder was dasselbe ist, in £1 (£j), Sl (s2), . . ., £1 (em—i). Nun können wir aber den Schlusssatz in §.164 anwenden. Nach diesem Satze muss der Index j des Theilers Q von P ein Theiler von m sein, und da m als Primzahl vorausgesetzt ist, so ist m=:j. Ausserdem ist nach demselben Satze s rational durch die Wurzeln der Gleichung f(x) = 0 darstellbar: e = if> (x0, ajj, . . ., xm-i). Diese Function gehört zur Gruppe Q, und wenn wir darauf sämmtliche Permutationen der Gruppe P anwenden, so erhalten wir die Functionen e, £x, £2, . . ., em—i und keine anderen. Diese Functionen gehören zu den conjugirten Gruppen n~1Qn. Da aber jede dieser Functionen rational durch jede andere aus- ausdrückbar ist, so müssen sie alle zu derselben Gruppe gehören, d. h. Q ist ein Normaltheiler von P. Wir haben also hiermit den ersten Satz bewiesen: I. Wenn die Gruppe einer Gleichung P durch Adjunction der Wurzeln einer Abel'schen Glei- Gleichung reducirt wird, so hat P einen Normal- Normaltheiler Q von Primzahlindex. Dieser Satz lässt sich auch umkehren. Wenn nämlich die Gruppe P einen Normaltheiler Q vom Index in hat, so können wir eine zu Q gehörige Function il> wählen, und die damit conjugirten Functionen 4>,ij>i,il>2, ¦ ¦ ¦¦, i>m—i gehören alle zu derselben Gruppe. Der Körper £l(il>) ist ein Normalkörper, und ^ die Wurzel einer Normalgleichung. Im Körper Sl (ip) ist Q die Gruppe von f(x) = 0 (§. 162). Wenn aber m eine Primzahl ist, so ist ip nach §. 170 die Wurzel einer cyklischen Gleichung, und damit ist also bewiesen: II. Wenn die Gruppe P von f(x) = 0 einen Normal- Normaltheiler Q von Primzahlindex m besitzt, so wird durch Adjunction der Wurzel einer cyklischen Gleichung wten Grades die Gruppe P auf Q reducirt. §. 184. Metacyklische Gleichungen. Wir wollen eine Gleichung, deren vollständige Lösung sich auf eine Kette von cyklischen Gleichungen zurückführen lässt,
§. 184. - Metacyklische Gleichungen. 647 eine metacyklische Gleichung nennen. Die cyklischen Gleichungen selbst sind als specieller Fall darunter mit enthalten, und nach dem im §. 183 Bemerkten sind die metacykliscjien Gleichungen dieselben, wie die durch Radicale lösbaren Glei- Gleichungen. Ist P die Gruppe einer solchen Gleichung, so muss sie nach dem vorigen Paragraphen einen Normaltheiler von Prim- Primzahlindex h, den wir jetzt mit P1 bezeichnen wollen, besitzen. Besteht Pt aus der einzigen identischen Permutation, so ist P selbst cyklisch und von Primzahlgrad. Ist P1 nicht die Einheits- Einheitsgruppe, so muss Pl wieder einen Normaltheiler P2 von Prim- Primzahlindex j2 enthalten u. s. f., bis wir endlich zur Einheitsgruppe gelangen. Dass es auch die für eine metacyklische Gleichung aus- ausreichende Bedingung ist, wenn ihre Gruppe P diese Zusammen- Zusammensetzung hat, ergiebt sich aus dem vorigen Paragraphen. Wir sprechen also den Satz aus: III. Die nothwendige und hinreichende Bedingung für eine metacyklische Gleichung ist die, dass es eine Reihe von Gruppen P) Pi> P21 P3 • • • giebt, deren erste die Galois'sche Gruppe der Gleichung, deren letzte die Einheitsgruppe ist, von denen jede folgende ein normaler Theiler der nächst vorangehenden von Primzahlindex ist. Hiernach nennen wir eine Permutationsgruppe P, die diese Eigenschaft hat, zu der sich also eine Kette von Gruppen P, Pl5 P2, . . ., Pu_!, 1 so bestimmen lässt, dass jedes Glied Normaltheiler des voran- vorangehenden von Primzahlindex ist, eine metacyklische Gruppe1). Wir haben hier die Bedingung für die vollständige Auf- Auflösbarkeit einer Gleichung durch eine Kette von cyklischen Gleichungen erhalten. Es handelt sich aber noch um die Frage, ob eine oder einige der Wurzeln auf diese Weise dargestellt werden können, während andere eine solche Darstellung nicht ') Der Ausdruck „metacyklische Gruppen" ist zuerst von Kronecker, wenn auch in beschränkterem Sinne, gebraucht. Ich möchte hier diese leichte Verallgemeinerung eines schon bekannten Ausdruckes an Stelle des von Frobenius und Holder benutzten Ausdruckes „auflösbare Gruppen" vorschlagen.
648 Siebzehnter Abschnitt. , §. 181. gestatten. Diese Frage ist nur berechtigt bei irreduciblen Glei- Gleichungen, da bei reduciblen Gleichungen alle denkbaren Com- binationen vorkommen können, und hier gilt nun der Satz: IV. Wenn eine W'urzel einer irreduciblen Glei- Gleichung durch Lösung cyklischer Gleichungen be- bestimmbar ist, so ist die Gleichung metacyklisch1). Wenn eine irreducible Gleichung nien Grades f(x) = 0 auch nur eine Wurzel hat, die durch successive Adjunction von Wurzeln cyklischer Gleichungen rational wird, so muss sie nothwendig durch diese Adjunction reducibel werden, da sich ja schliesslich eiii linearer Factor absondern muss. Es sei also P die Gruppe unserer Gleichung., nachdem alles Nöthige so weit adjungirt ist, dass zwar f(x) noch nicht reducibel ist, aber durch die nächste Adjunction der Wurzel s einer cyklischen Gleichung von Prim- Primzahlgrad m in Factoren zerfällt. Es muss dann P nach §. 183 einen Normaltheiler Q vom Index m haben, auf den sich die Gruppe der Gleichung nach Adjunction von a reducirt, und die Permutationsgruppe Q muss intransitiv sein. Wenn Q die Ein- Einheitsgruppe ist, so ist/(#) = () durch Adjunction von s voll- vollständig gelöst. Ist aber Q noch von der Einheitsgruppe ver- verschieden, so treten die Sätze des §. 165 in Kraft. Danach zerfällt /(#) nach Adjunction von s, da ja hier der Index m von Q eine Primzahl ist, in m Factoren, <p(x, a), <Pi(x, s), . . ., <pm_1(x, s), vom gleichen Grade (i und es ist pm = n. Ist z. B. n eine Primzahl, so muss ft = 1 sein; die Func- tionen <p sind linear, und die Gleichung f(x)= 0 ist vollständig gelöst; also ist der Satz IV. für Gleichungen von Primzahlgrad richtig. Im allgemeinen Falle muss einer der Factoren (iten Grades cp(x, e), q>x (x, s), . . ., cpm—i(x, s) etwa cp(x, s) eine Wurzel haben, die durch Adjunction der Wurzeln cyklischer Gleichungen rational wird, und wenn wir also annehmen, dass unser Satz für Gleichungen ft1*11 Grades schon bewiesen sei, so folgt, dass <p(x, s) = 0 selbst und also auch ihre Gruppe meta- metacyklisch ist. Da aber nach §. 165 die verschiedenen Gleichungen <p = 0, q>1 = 0, . . ., (pm—i = 0 dieselbe Gruppe haben, so sind sie alle und mithin auch f(x) = 0 metacyklisch. x) Dieser Satz rührt von Abel her. Neuerdings ist ein Beweis von Seiivanoff gegeben (Acta mathematica, Bd. 19, 1895).
§. 185. Einfachheit der alternirenden Gruppe. 649 Unter der Voraussetzung also, dass der Satz IV. für Glei- Gleichungen (tten Grades richtig ist, folgt seine Richtigkeit für Glei- Gleichungen (imten Grades; und da er für Gleichungen von Prim- Primzahlgrad gilt, so ist er allgemein nachgewiesen. §. 185. Einfachheit der alternirenden Gruppe. Wir haben früher gesehen (§. 156), dass, wenn wir die Coefficienten einer Gleichung nten Grades als unabhängige Variable und den Körper aller rationalen Functionen dieser Coefficienten als Rationalitätsbereich betrachten, die Galois'sche Gruppe der Gleichung die symmetrische Gruppe ist. In der symmetrischen Gruppe ist immer ein Nonnaltheiler vom Index 2 enthalten, die alternirende Gruppe, auf die sich die Gruppe der Gleichung reducirt, wenn die Quadratwurzel aus der Discriminante adjun- girt wird. Bei vier Ziffern hat die alternirende Gruppe, die aus der identischen Permutation, acht dreigliedrigen Cyklen und drei Paaren von Transpositionen besteht,' den Normaltheiler vom Index 3: 1, @,1) B, 3), @,2) A,3), @,3) A,2). Diese Gruppe hat drei verschiedene Normaltheiler vom Index 2, von denen wir einen 1, @, 1) B, 3) bevorzugen, von dem wieder die Einheitsgruppe ein Normaltheiler vom Index 2 ist. Die Gruppe der 24 Permutationen von vier Ziffern ist also metacyklisch, und darauf beruht jede Auflösungsmethode der biquadratischen Gleichung (§. 167, 168). Wir wollen nun nachweisen, dass, wenn n grösser als 4 ist, die alternirende Gruppe ausser der Einheitsgruppe überhaupt keine normalen Theiler hat, oder nach der früher eingeführten Bezeichnung einfach ist. Daraus folgt dann, dass die Bedingung, die wir für die algebraische Auflösbarkeit einer Gleichung als nothwendig gefunden haben, für die Gleichungen von höherem als dem vierten Grade, deren Gruppe die symmetrische oder die alternirende ist, nicht erfüllt ist, und dass also Gleichungen von höherem als dem vierten Grade, so lange die Coeffi- Coefficienten unabhängige Variable sind, nicht mehr alge- algebraisch lösbar sind.
650 Siebzehnter Abschnitt. §.185. Der Beweis, dass die alternirende Gruppe einfach ist, lässt sich so führen: Sei A die altemirende Gruppe der Permutationen von n Ziffern 1, 2, 3, . . ., n und Q ein normaler Theiler von A. Wir haben im §. 160, 7. und 4. gesehen, dass sich alle Permuta- Permutationen von A aus dreigliedrigen Cyklen zusammensetzen lassen, und dass man, wenn x und n irgend welche Permutationen sind, die transformirte Permutation zu x, n~x xn erhält, wenn man in den Cyklen von x die Vertauschungen n vornimmt. Ist nun x ein dreigliedriger Cyklus, etwa A, 2, 3), so kann man % aus A so wählen, dass n—^xn jeden beliebigen dreigliedrigen Cyklus der n Ziffern darstellt; denn man kann in /l, 2 3, ..„*x Vöti, «a, a3, . . ., aj die drei ersten Ziffern ax, a2, a% beliebig wählen, und, wenn es nöthig ist, damit n zu A gehöre, noch % und a2 vertauschen. Dadurch geht aus x einer der beiden Cyklen (ax, Oj, aB), (a2, ax, aB) hervor, von denen jeder die zweite Potenz des anderen ist. Wenn nun Q ein Normaltheiler von A ist, und x eine Permu- Permutation aus Q, so ist %-~ 1xn auch in Q enthalten, wenn n in A enthalten ist, und daraus folgt, dass, wenn in Q ein drei- dreigliedriger- Cyklus vorkommt, Q mit A identisch ist. Unser Beweis beruht nun darauf, dass, wenn x irgend eine Permutation in Q ist, auch n~x x n und folglich auch A) . X = x~1 n—xxn in Q vorkommen muss, und es ist dann zu zeigen, dass man, wenn x irgend eine nicht identische Permutation ist, n immer so aus A wählen kann, dass die Permutation l ein dreigliedriger Cyklus, und folglich Q mit A identisch wird. Wir nehmen zu diesem Zwecke sowohl x als n in ihre Cyklen zerlegt an und bemerken, dass man bei der Bildung von l solche Cyklen von x gar nicht zu berücksichtigen braucht, deren Ziffern durch % ungeändert bleiben, weil sie sich in x~1 und x gegen- gegenseitig aufheben. Wir müssen nun die verschiedenen möglichen Formen von x einzeln betrachten. 1. Es enthalte x einen Cyklus von mehr als drei Ziffern etwa A, 2, 3, ..., m), wir nehmen n = A,2,3) an und erhalten, indem wir x~ 1n~1x zuerst (nach §. 160, 4.) bilden, 1 = x-^n^xn = B, 4, 3)A, 2, 3) = A, 2, 4).
§. 185. Einfachheit der alternii'enden Gruppe. 651 In Q kommt also ein dreigliedriger Cyklus vor. 2. Es enthalte % zwei dreigliedrige Cyklen A, 2, 3) D, 5, 6). Wir nehmen n = A, 3, 4) an und erhalten "* = B, 5, 1)A, 3, 4) = A, 2, 5, 3, 4). Diese Permutation l, die in Q enthalten ist, fällt aber unter den Fall 1. 3. Es enthalte % einen dreigliedrigen und einen zwei- zweigliedrigen Cyklus A, 2, 3) D, 5). (Dass in %, wenn es zu A gehört, noch ein zweiter Cyklus von gerader Gliederzahl vorkommen muss, ist hier gleichgültig.) Für «•= A,2,4) ergiebt sich A = B, 5, 3)A, 2, 4) = A, 2, 5, 3, 4), was wieder unter den Fall 1. fällt. 4. Es enthalte % drei Transpositionen, A, 2) C, 4) E, 6). Für n =. A, 3, 5) folgt A = B, 6, 4)A, 3, 5), was unter den Fall 2. fällt. 5. Es enthalte % zwei Transpositionen und ein unverändertes Element A, 2) C, 4) E). Man setzt n = A, 2, 5) und erhält A = (l, 2, 5)A,2, 5) = A,5, 2). Damit sind alle Fälle erschöpft, wenn n > 4 ist. Für n = 4 bleibt der eine Fall noch übrig, dass n aus zwei Trans- Transpositionen besteht, der eben das besondere Verhalten bei n = 4 herbeiführt, wodurch die algebraische Auflösung der Gleichung 4ten Grades ermöglicht wirdv). Es folgt aus diesem Satze weiter, dass die symmetrische Gruppe keine anderen normalen Theiler hat, als sich selbst, die alternirende Gruppe und die Einheitsgruppe. Denn ist 8 die symmetrische, A die alternirende Gruppe, und Q ein normaler Theiler von S, so ist der grösste gemeinschaftliche Theiler Q' von A und Q ein normaler Theiler von A, ist also gleich A J) Dei" erste vollständige Beweis, dass die allgemeine Gleichung von höherem als dem 4ten Grade durch Radicale nicht lösbar ist, rührt von Abel her (Crelle's Journal, Bd. I, 1826). Ueber die älteren Beweisversuche von Ruffini A799 bis 1806) und ihr Verhältniss zum Abel'schen Beweis vergleiche man die Abhandlung von Burkhardt, „Die Anfänge der Gruppentheorie und Paolo Euffini" (Abhandlungen zur Geschichte der Mathematik VI. Supplement zu Schlömilch's Zeitschrift. Leipzig 1892).
652 Siebzehnter Abschnitt. §. 186. oder gleich 1. Denn ist %' ein Element in Q' also auch in A, % ein beliebiges Element in S, so ist n—^vJic zunächst in Q ent- enthalten, weil Q Normaltheiler von 8 ist. Es ist aber zugleich n-1%'n in A, also auch in Q' enthalten. Ist Q' gleich A, so ist Q entweder auch gleich A oder gleich 8. Ist Q' aber = 1, so enthält Q ausser der Einheit keine Permutation der ersten Art. Sind also % und A zwei verschiedene und von der Einheit verschiedene Permutationen von Q, so müssen %** und % X als von der ersten Art = 1 sein, d. h. l muss = % sein. Es kann also Q höchstens eine von der identischen verschiedene Permutation % enthalten. Da aber Q ein Normal- Normaltheiler von 8 sein soll, so muss für jede Permutation % aus der symmetrischen Gruppe 71—1%tc = % sein, d. h. % darf sich nicht ändern, wenn in seinen Cyklen irgend eine Permutation ausgeführt wird. Dies ist aber nur dann möglieb, wenn überhaupt nur zwei Ziffern 1, 2 vorhanden sind und % = A, 2) ist. Dann aber ist 1, A, 2) die ganze Gruppe S. §. 186. Nicht metaeyklische Gleichungen im Körper der rationalen Zahlen. Durch den Satz des vorigen Paragraphen ist der Nachweis geführt, dass eine Gleichung nien Grades, wenn n grösser als 4 ist, nicht mehr algebraisch gelöst werden kann, wenn die Coeffi- cienten als unabhängige Veränderliche betrachtet werden. Von grösserem Interesse noch ist aber die Frage, ob es in dem Körper der rationalen Zahlen Gleichungen nten Grades giebt, die nicht algebraisch lösbar sind. Die Frage lässt sich noch etwas all- allgemeiner stellen, nämlich so, ob es ganzzahlige Gleichungen giebt, deren Gruppe die symmetrische Gruppe ist, die also nach einer früher erklärten Ausdrucksweise keinen Affect haben. Bildet man die Galois'sche Resolvente G(t) — 0 vom Grade n (n) einer allgemeinen Gleichung nten Grades f(x) = 0 mit un- unbestimmten Coefficienten a, so ist G(f) eine ganze Function der Veränderlichen t und a, welche sich nicht in Factören zerlegen lässt, die wieder rationale Functionen von t und a sind. Sub- stituirt man für die Variablen a Grossen irgend eines Körpers £1, und wird dann G(t) in diesem Körper reducibel, so hat die
§. 186. Nicht metacyklische Gleichungen. 653 Gleichung f(x) = 0 im Rationalitätsbereich £1 einen Affect. Unsere Frage kommt also darauf hinaus, ob man in Q(f) für die Variablen a solche rationale Zahlen setzen kann, dass G(t) im Körper der rationalen Zahlen irreducibel bleibt. Diese Frage hat eine ganz allgemeine Beantwortung ge- gefunden in einer Abhandlung von Hubert1), wo der allgemeine Satz bewiesen ist, dass man in einer irreduciblen Function beliebig vieler Variablen für einen beliebigen Theil der Variablen solche rationale Zahlen setzen kann, dass eine irreducible Function der übrigen Variablen entsteht. Auf diesen allgemeinen Satz können wir hier nicht eingehen. Wir werden aber die gestellte Frage viel einfacher, wenn auch bei Weitem nicht so allgemein beantworten, indem wir zeigen, dass sich für jeden Primzahlgrad Gleichungen ohne Affect finden lassen. Wir haben in §. 160, 10. bewiesen, dass eine transitive Permutationsgruppe von n Ziffern, die nicht die symmetrische Gruppe ist, wenn n eine Primzahl ist, keine einzelne Transposition enthalten kann. Unter einer Gleichung mit einem Affect haben wir eine solche verstanden, deren Gruppe nicht die symmetrische ist. Hat also die irreducible Gleichung f(x) = 0 einen Affect und ist ihr Grad eine Primzahl, so muss ihre Gruppe P transitiv sein, und sie kann keine Transposition zweier Wurzeln enthalten. Wenn wir also irgend n — 2 der Wurzeln dem Rationalitätsbereich adjun- giren, so muss sie sich auf die Einheitsgruppe reduciren, da ja ausserdem nur noch die Vertauschung der beiden letzten Wurzeln übrig bleiben könnte, die in P nicht vorkommt. Daraus folgt also, dass die beiden letzten Wurzeln in dem erweiterten Körper Sl enthalten sind, oder der Satz: 1. Wenn eine irreducible Gleichung, deren Grad n eine Primzahl ist, einen Affect hat, so können zwei beliebige von ihren Wurzeln rational durch die übrigen ausgedrückt werden. Daraus folgt als Corollar: 2. Wenn der Körper Sl nur reelle Zahlen enthält, so kann eine irreducible Gleichung von Prim- !) Ueber die Irreducibilität ganzer rationaler Functionen mit ganz- zahligen Coefficienten. Journal für Mathematik, Bd. HO.
654 Siebzehnter Abschnitt. §. 186. zahlgrad n mit einem Affect in Sl nicht zwei imaginäre und n — 2 reelle Wurzeln haben. Nun giebt es aber unzählige Gleichungen von jedem be- beliebigen Grade », mit reellen Coefficienten, die zwei conjugirt imaginäre und n — 2 reelle Wurzeln haben; man kann ja in f(x) — {x— «J (x — a2) . , . (x — a„) = xn -\- axxn-x -\- a2xn~2 + ••• + «„ «!, a2 beliebig conjugirt imaginär und die übrigen a reell an- annehmen. Die Anzahl der reellen und imaginären Wurzeln von f(x) ändert sich aber nicht, wenn die Coefficienten innerhalb gewisser endlicher Grenzen stetig verändert werden (vergl. den siebenten Abschnitt), und folglich giebt es auch solche Gleichungen, deren Coefficienten rationale Zahlen sind, da man in beliebiger Nähe von irgend welchen gegebenen reellen Zahlen immer ratio- rationale Zahlen finden kann. Es ist also nur noch nachzuweisen, dass man diese rationalen Coefficienten so wählen kann, dass f(x) irreducibel wird. Dies ergiebt sich aber aus folgendem Satze: 3. Ist p eine Primzahl, c0, cx, <?2> • • ., cn eine Reihe ganzer Zahlen, von denen c0 durch p nicht theil- bar, cl5 c2) • ••>£» durch p theilbar, aber c„ nicht durch p2 theilbar ist, so ist die Function . <p (x) = Co Xn -f- Cj X»-1 + • • • + C„ irreducibel1). Denn wenn <p(x) in zwei Factoren mit rationalen Coeffi- Coefficienten zerfällt, so können (nach §. 2) die Factoren auch ganz- ganzzahlig angenommen werden. Sei also tp(x) = («!*!* + «!*»-! -\ \-ax) (ßox* + ft«*-» H h ß*), h und h beide grösser als Null und ihre Summe gleich n. Da Mhßic = cn ist, so muss einer der beiden Factoren a^, ßy, durch p theilbar sein, der andere nicht. Es möge ßk durch p theilbar, a^ nicht theilbar sein, und da nicht alle ß durch p theilbar sein können, weil sonst auch c0 durch p theilbar wäre, so sei ßv nicht durch p theilbar, ßv+i, ßv + n, ¦ • ., ß* durch p theilbar. Der Coefficient von xk~r in dem Product der beiden !) Auf diesen Satz hat Eisenstein den Beweis der Irreducibilität der Kreistheilungsgleichung und noch höherer Gleichungen gegründet. Crelle's Journal, Bd. 39 A850).
§. 187. Reelle Radicale. 655 Factoren ist danii ahßv -\- ah—i~ßv + 1 -\- • • -, also durch p nicht theilbar. Es müsste also h — v = n sein, was nicht möglich ist, da schon h < n sein muss. Setzt man also für die Coefficienten von f(x): so ist f(x) irreducibel, und man hat in der Wahl der ganzen Zahlen c noch Freiheit genug, um die rationalen Brüche at a2, . . ., an einem beliebig gegebenen Werthsystem beliebig nahe zu bringen. Damit ist aber der Satz bewiesen: 4. Es giebt von jedem beliebigen Primzahlgrade un- unendlich viele Gleichungen mit rationalen Coeffi- Coefficienten ohne Affect. Der Beweis, der hier geführt ist, zeigt, dass solche affect- freie Gleichungen gefunden werden können, deren Coefficienten ein endliches Gebiet überall dicht erfüllen, das Gebiet nämlich, in dem die reellen Coefficienten der Gleichungen mit nur zwei conjugirt imaginären Wurzeln liegen. Der Beweis ist also, ab- abgesehen davon, dass er sich nur auf Primzahlgrade beschränkt, auch insofern nicht erschöpfend, als er uns keinen Aufschluss giebt über die übrigen Gebiete, in denen aller Wahrscheinlichkeit nach die Sache sich ebenso verhält. §. 187. • '¦ Auflösung durch reelle Radicale. Bei der Auflösung der cubischen Gleichungen mit reellen Coefficienten hat man von Alters her die zwei Fälle unterschieden, in denen die Discriminante negativ oder positiv ist. Im zweiten Falle hat man, obwohl die Gleichung dann gerade drei reelle Wurzeln hat, bei der Anwendung der Cardanischen Formel die dritte Wurzel aus einem imaginären Ausdruck zu ziehen, und der Versuch, die Wurzeln in reeller Form darzustellen, führt immer wieder auf eine cubische Gleichung von derselben Beschaffenheit. Darum hat man diesen Fall den casus irreducibilis genannt. Die cubischen Gleichungen des casus irreducibilis sind ein specieller Fall der cyklischen Gleichungen mit reellen Wurzeln, die wir im §. 172 kennen gelernt haben, bei deren
656 Siebzehnter Abschnitt. §. 187. Lösung gleichfalls Wurzeln aus imaginären Grossen, oder was auf dasselbe hinauskommt, Winkeltheilungen, vorkommen. Dass diese Wurzeln aus imaginären Grossen oder Winkeltheilungen auf keine Weise zu vermeiden sind, können wir jetzt beweisen1). Wir setzen einen reellen ßationalitätsbereich il vor- voraus, und nehmen in ihm eine Normalgleichung g(f) = 0 an, d. h. eine irreducible Gleichung, deren Wurzeln alle rational durch eine beliebige von ihnen, q, ausdrückbar sind. Wenn eine von den Wurzeln reell ist, so müssen auch alle anderen reell sein, und g (t) hat also entweder lauter reelle oder lauter paarweise conjugirte imaginäre Wurzeln. g(t) = 0 kann die Galois'sche Resolvente irgend einer gegebenen, sei es irreduciblen, sei es reduciblen Gleichung F(x) = 0 sein, und wenn also g(f) nur reelle Wurzeln hat, so kann auch F(x) nur reelle Wurzeln haben, weil die Wurzeln von F(%) rational durch eine Wurzel von g(t) darstellbar sind. Wenn unter den Wurzeln von F(x) imaginäre sind, so hat g(f) nur imaginäre Wurzeln. Hat aber F(x) lauter reelle Wurzeln, so sind auch die Wurzeln von g(t) reell, weil sie ja rational durch die Wurzeln von F(x) ausgedrückt werden können. Wenn nun g(f) durch Adjunction einer Wurzel s einer irreduciblen Gleichung % = 0, deren Grad eine Primzahl ist, reducirt wird, so sind, wie wir im §. 164 gesehen haben, die sämmtlichen Wurzeln von % in ß(@) enthalten, und wenn also q reell ist, so sind alle Wurzeln von % reell. 1. Eine Normalgleichung mit reellen Wurzeln kann also nur durch solche irreducible Gleichungen von Primzahlgrad reducirt werden, die lauter reelle Wurzeln haben. Wir fragen nun, ob eine Reduction der Normalgleichung durch Adjunction eines reellen Radicales Va bewirkt werden kann. Wir dürfen dabei annehmen, dass der Grad p des Radicales eine Primzahl sei, weil jedes Radical sich auf eine Reihe von Wurzelziehungen von Primzahlgrad reduciren lässt. Auch können wir voraussetzen, dass a nicht die pte Potenz einer rationalen p Grosse sei, weil sonst die reelle Wurzel Va rational wäre. !) Vergl. Holder, Mathematische Annalen, Bd.38; Kneser, ebendas., Bd. 41.
§. 187. . Reelle Radieale. 657 Unter dieser Voraussetzung ist, wie wir jetzt beweisenjwollen, x* — a irreducibel. Denn bezeichnen wir einen, z.B. den.reellen p Werth Va mit a und eine imaginäre pte Einheitswurzel mit s, so sind A) oc, sa, s2a, . , ., «*—1 a die Wurzeln der Gleichung B) xp — a = 0. Ist diese Gleichung reducibel, so ist - . C) x* — a ¦= A(x)ft(x), und/j,/2 sind Functionen in Sl von niedrigerem als dem p^n Grade. Ein Theil der Wurzel A) wird auf fx = 0, ein anderer Theil auf/2 = 0 fallen. Ist also jt der Grad von /,, so muss für irgend einen Exponenten A £*«." = h eine Grosse in Sl sein [das von x unabhängige Glied in /i (#)], also, wenn man in die pte Potenz erhebt, D) aa = bP. Nun ist 0 < ft < p, und daher jt unäp relativ prim, so dass sich zwei ganze Zahlen h und k aus der Gleichung bestimmen lassen. Es ist dann also nach D) a = auh aPu = (&* a*)*; also wäre, gegen die Voraussetzung, a die ßte Potenz einer Grosse in fl. Dieser Satz ist, wie man sieht, unabhängig von der Voraus- Voraussetzung, dass ß ein reeller Körper sei. Nehmen wir ihn aber reell an, so hat die Gleichung B), wenn p nicht gleich 2 ist, ima- imaginäre Wurzeln, und kann nach 1. eine Normal gleichung <?(£),= 0 nicht reduciren. Wenn aber p ==2 ist, so kann g(f) nur dann durch die Gleichung B) reducirt werden, wenn a positjiv und der Grad von g(t) eine gerade Zahl.ist (§. 164); also:, . .• ,,. 2. Eine Normalgleichung ungeraden Grades kann nicht durch Adjunction eines reellen Radicals reducirt werden. Adjungirt man im Falle einer reellen cubischen Gleichung mit positiver Discriminante die Quadratwurzel aus dieser Discri- minante, so geht die Gleichung in eine Normalgleichung über und der Rätionalitätsbereich bleibt reell; er bleibt auch reell, Weber, Algebra. I. 42
658 Siebzehnter Abschnitt. §. 188. wenn man noch so viele reelle Kadicale adjungirt. Soll die Gleichung also durch reelle Kadicale lösbar sein, so muss sie bei solchen Adjunctionen endlich zerfallen, was nach 2. unmöglich ist. Dies ist der casus irreducibilis der cubischen Gleichungen. In demselben Falle finden sich die cyklischen und überhaupt alle irreduciblen Abel'schen Gleichungen von ungeradem Grade, die also niemals durch reelle Radicale lösbar sind. Hiernach können wir z. B. die cubischen Gleichungen im Körper der rationalen Zahlen in drei oder vier Arten unter- unterscheiden, die alle in gewissen von Alters her berühmten geo- geometrischen Problemen auftreten. Wir sehen dabei von den reduciblen Gleichungen ab. Der Grad der Galois'schen Gruppe muss dann immer durch 3 theilbar sein (§. 169) und ist also entweder gleich 3 oder gleich 6. Die Gruppe kann also nach §. 164 niemals durch Adjunction von blossen Quadratwurzeln auf einen niedrigeren als den dritten Grad reducirt werden; also kann auch die Gleichung nicht durch Quadratwurzeln gelöst werden. Die entsprechenden geometrischen Probleme sind nicht mit Zirkel und Lineal zu lösen. Ist die Gruppe vom Grade 3, so haben wir eine cyklische Gleichung. Hierher gehören die aus der Kreistheilung stammen- stammenden Gleichungen, z. B. die, von der die Construction des regel- mässigen Siebenecks abhängt. Die drei Wurzeln einer solchen Gleichung sind reell und können nicht durch reelle Radicale ausgedrückt werden. Unter den cubischen Gleichungen mit einer Gruppe 6terL Grades sind zu unterscheiden die mit positiver und mit negativer Discriminante. Die ersten gehören zum casus irreducibilis und lassen sich zurückführen auf die Gleichung, von der die Dreitheilung eines beliebigen Winkels abhängt. Zu den Gleichungen mit negativer Discriminante gehören als specielle Fälle auch die reinen cubischen Gleichungen x% = a, wenn a keine Cubikzahl ist. Für a = 2 ergiebt sich die Gleichung, von der das Delische Problem der Würfel Verdoppelung abhängt. §. 188. Metacyklische Gleichungen von Primzahlgrad. Die allgemeinen Bedingungen, die wir im §. 184 gefunden haben, sind noch nicht einfach genug, um eine unmittelbare An-
.§. 188. Gleichungen von Primzahlgrad. 659 wendung auf die Ermittelung von metacyklischen Gleichungen oder auf die Entscheidung über die Löslichkeit einer vorgelegten Gleichung durch Radicale zu gestatten. Wir leiten also, zunächst unter der Voraussetzung, dass der Grad n der Gleichung eine Primzahl sei, ein anderes von Galois aufgestelltes Kriterium her. Es sei jetzt f{x) = 0 eine irreducible Gleichung Yom Grade n, und n eine Primzahl und grösser als 2. Soll /(a;) = 0 alge- algebraisch lösbar sein, so muss ihre Gruppe P nach §. 184 meta- cyklisch sein, d. h. es muss eine Kette von Gruppen A) P, Pl, P» ¦ • ; Pp-i, 1 geben, deren jede ein Normaltheiler der nächst vorangehenden mit Primzahlindex ist. Durch successive Adjunction von Wur- Wurzeln cyklischer Gleichungen von Primzahlgrad wird die Gruppe der Gleichung von P auf Px, P2, . . ., P^—i, 1 reducirt. Die Function f(x) selbst kann, wie schon im §. 184 gezeigt ist, nicht reducirt werden, ehe die letzte Adjunction gemacht ist, worauf sie in n lineare Factoren zerfällt. Der Grad der letzten cyklischen Gleichung und mithin der Grad der vorletzten Gruppe Pfi—i muss also nach §. 165, 3. gleich n sein. Der Grad eines Elementes einer Gruppe ist immer ein Theiler vom Grade der Gruppe und daher kann Pfi—i ausser der identischen nur Permutationen von der Ordnung n enthalten. Sie ist also mit der Periode 1, sr, sr2,..., sr"-1 eines ihrer Elemente identisch. Daraus folgt nach §. 160, dass it eine cyklische Permu- Permutation von sämmtlichen n Ziffern sein muss, und wir können die Bezeichnung der Wurzeln von f(x) so wählen, dass * = @, 1, 2, ..., n— 1) wird. Bezeichnen wir die Wurzeln mit xt, und setzen fest, dass x\ = xz< sein soll, wenn z = z* (mod n) ist, so geht durch sr jedes z in z -\- 1 über, durch sr2 in z -f- 2 u. s. f., und wir können also sagen, dass die Gruppe P^—x aus den Sub- Substitutionen für s B) 0, s + b), l = 0, 1, 2, . . ., n - 1 besteht. Jede irreducible metacyklische Gleichung von Primzahl- Primzahlgrad kann also durch Adjunction von Radicalen in eine cyklische Gleichung verwandelt werden. Die Substitutionen (z, z -\- V) bilden einen speciellen Fall der allgemeineren linearen Substitution C) (*,<** + &), 42*
660 . Siebzehnter Abschnitt. §. 188. worin «und b feste Zahlen sind, die auch nach dem Modul n reducirt werden können, wo aber für a der Werth 0 natürlich auszuschliessen ist, weil sonst ja durch C) alle verschiedenen s in dasselbe b übergehen, also gar keine Permutation der Grossen xz ausgedrückt wäre. Ist aber a von 0 verschieden (mod «•), so -wird durch C) immer eine Permutation dargestellt sein, weil dann nur, wenn 3 = 3' ist, as -\- b = as' -\- b sein kann. Wir nennen C) eine Substitution für z, die unter den x eine Permu- Permutation hervorbringt. Die Anzahl der verschiedenen linearen Sub- Substitutionen von der Form C) ist n(n — 1). Ihnen entsprechen ebenso viele verschiedene Permutationen unter den x; denn es kann nur dann für jedes s az -\-b = a's -f~ b' (mod n) sein, wenn b = &' (aus z = 0 zu schliessen) und a = a! (aus z = 1 zu schliessen). Die Gesammtheit der Permutationen, die durch C) dar- dargestellt sind, bildet eine Gruppe; denn es seien A = O, an.-\-b), X'= (z, a'z-\- V) zwei von diesen Permutationen, so ist also D) X X' = X" = (*, a a'z + a' b + V), was -wieder von der Form (g, a" s -j- b") ist. Die durch alle Substitutionen von der Form C) gebildete Gruppe, die eine Verallgemeinerung der cyklischen Gruppe B) ist, wollen wir eine lineare Gruppe nennen1); die in ihr ent- enthaltenen Permutationen sollen lineare, Permutationen heissen. In der, linearen Gruppe sind verschiedene Divisoren ent- enthalten. Wir finden darunter eine Gruppe vom Grade n '¦—. 1, nämlich C, as\ die selbst wieder Divisoren haben kann. Die Compositionsregel D) zeigt, wie wir. alle Divisoren der linearen Gruppe bilden können. Ist X = (#, a s -\- b) eine lineare Substitution, so ergiebt sich nach D) durch Wiederholung für jeden Exponenten h E) A* = •[*, a** -f A 4- a + 1- a»-i)b], Kronecker nennt nur diese Gruppe metacyklisch.
§. 188. Gleichungen von Primzahlgrad. 661 und für a = 1 X» = (g, 0 + hb). Wenn also in einer Gruppe ij eine Substitution X vorkommt, in der a = 1 und b von Null verschieden ist, so enthält hiernach L die ganze cyklische Gruppe (z, z-\-V) (b = 0, 1, . . ., n — 1). Ist a nicht gleich 1, so setzen wir und schliessen daraus, dass, wenn e der kleinste positive Expo- Exponent ist, für den ae = 1 (mod n) ist, A vom Grade e ist. Die Periode der Substitution X giebt, wenn nicht a = 1 ist, eine intransitive Permutationsgruppe. Es giebt eine Ziffer s, die durch X und seine Wiederholungen nicht geändert wird, die aus der Congruenz z = as -\- b (mod n) bestimmt wird, und mit #0 = ^7 (mod n) bezeichnet werden kann, wenn unter — oder jt : v (mod n) eine ganze Zahl verstanden wird, die durch Multiplication mit dem Factor v nach dem Modul n mit p congruent wird. Die cyklische Gruppe (z, z -\- i) ist transitiv und vom Grade n. Wir beweisen zunächst den Satz: I. Jede transitive lineare Gruppe (mod n) enthält die cyklische Gruppe. Es sei g eine primitive Wurzel von n, und a der Index von a, d. h. ga = a (mod n) (§. 143). Der Kürze wegen nennen wir für den Augenblick a zugleich den Index der Substitution X ¦= (z, az -\- b). Der Index kann kleiner als n — 1 und gleich oder grösser als Null angenommen werden. Ist er gleich Null, so ist X entweder die identische Substitution, oder sie gehört der cyklischen Gruppe an. Nach D) gilt die Regel, dass der Index einer zusammengesetzten Substitution gleich der Summe der Indices der Componenten ist. Daraus folgt, dass alle Indices der Substitutionen einer linearen Gruppe L Vielfache des kleinsten positiven unter ihnen sind, und dass folglich, wenn a0 dieser kleinste positive Index ist, und gat> = a0 gesetzt wird, alle Substitutionen von L in der Form X = (z,ahoz-\- b)
662 • Siebzehnter Abschnitt. §. 188. dargestellt werden können, worin a0 festgehalten wird, und nur h und b gewisse Zahlenreihen durchlaufen. Eine Substitution von der Form Ao = 0, a0 s -f- &0) xnuss in der Gruppe L vorkommen. Wenn nun in der Gruppe L eine Substitution X vorkommt, in der mit h = 0 ein von Null verschiedenes b verbunden ist, so gehört dieses 1 der cyklischen Gruppe an, und L enthält die ganze cyklische Gruppe. Wenn aber h von Null verschieden ist, so bilden wir nach D) und E) die Zusammensetzung ^Ex 60) • Diese giebt dann und nur dann die identische Substitution, wenn —^ =¦ ~h r (m0" n)- aQ — 1 a\ — 1 v ' Wenn diese Congruenz für alle von Null verschiedenen h befriedigt ist, und wenn dem Index h = 0 nur die identische Substitution entspricht, so bleibt das Element — b0 : (a0 — 1) durch die ganze Gruppe ungeändert, und L ist intransitiv. Folg- Folglich giebt es in einer transitiven Gruppe L immer ein Ele- Element A, für das AA^Ä nicht die identische Substitution ist, ob- obwohl der Index Null ist, und L enthält also die ganze cyklische Gruppe. Bildet man die verschiedenen Eotenzen von Ao, so ergiebt sich, dass der Exponent h in den Substitutionen X der Gruppe L jeden Werth annehmen kann. Ist e der kleinste positive Exponent, der der Bedingung a% = 1 (mod n) genügt, so kommen also die Werthe h = 0, 1, 2, . . ., e — 1 vor, und darin ist e ein Theiler von n — 1. Aus der zusammengesetzten Sub- Substitution 0, a\g + 6) 0, e+l) = (e,a*e+-b + 1), die nach I. in einer transitiven Gruppe L ja auch vorkommen muss, sieht man weiter, dass mit jedem Werthe von h jeder der Werthe b = 0, 1, 2, . . ., n — 1 verbunden vorkommt, und die ganze Gruppe L besteht daher aus den Substitutionen
§. 188. Gleichungeu von Primzahlgrad. 663 und ist vom Grade en. Umgekehrt bildet jedes System von Substitutionen dieser Form eine Gruppe. Von den linearen Gruppen gilt nun der folgende Satz: II. Ist eine transitive lineare Gruppe L Normal- theiler einer anderen Permutationsgruppe P derselben n Ziffern, so ist auch P eine lineare Gruppe. Der Satz lässt sich so beweisen: Wenn % eine beliebige Permutation ist: Tt \o0, al5 a2, die auch durch {z, az) dargestellt werden kann, so kann man eine ganze Function <p (z) von z mit rationalen Coefficienten, deren Grad nicht höher als n— 1 ist, so bestimmen, dass az=<p{z) gesetzt werden kann. Man braucht nur die n Coefficienten in <p (z) aus den n linearen Gleichungen a0 = <p@), ax = <pA), . . ., aM_! = <p(n—\) zu bestimmen. Man kann dazu die im §. 15 abgeleitete Lagrange'sche Interpolationsformel verwenden, der man aber noch eine einfachere Gestalt geben kann, da es hier nur aut Congruenzen nach dem Modul n ankommt. Setzt man nämlich ¦4,0) = z(z — 1) 0 — 2) . . . (z — n -j- 1), so giebt die erwähnte Interpolationsformel Nun ist, wie wir im §. 143 gesehen haben, die Congruenz ip (z) = sn — z (mod n) identisch; also ist auch ip'(z) eee nz*-1 — 1 ^ — 1 (mod ri), und daher können wir (p (z) mit ganzzahligen Coefficienten so darstellen: Wenn, wie in unserer Aufgabe, die Zahlen a0, %, . . ., aM_i, von der Ordnung abgesehen, mit den Zahlen 0, 1, 2, . . ., n — 1 übereinstimmen, so ist, wenn n > 2 ist, ao-\- ax-\ 1- a„_i ^ 0
664 ¦ Siebzehnter Abschnitt. §.188. (mod n) und also <p(z) höchstens vom Grade n — 2, was aber für unseren Beweis nicht von Bedeutung ist. Hiernach lässt sich also jede beliebige Permutation »durch eine Substitution [z, <p(z)] darstellen. Ist nun L eine transitive lineare Gruppe und zugleich Normaltheiler von einer anderen Gruppe P, ist X eine beliebige Permutation von L, % eine gleichfalls beliebige Permutation von P, so ist %—1X% = V in L enthalten, und X% = %V. Setzen wir nach dem, was eben bewiesen ist, % = \z, q> (#)] und wählen für X die cyklische Substitution (z, s ~\- 1), die nach der Voraussetzung der Transitivität in L vorkommt, so muss sich a' und a so bestimmen lassen, dass (*, * + 1) [*, q> (*)] — [*, tp (*)] (*, a! e + o), oder, wenn man die Zusammensetzung ausführt, G) <p {s -(- 1) = a' <p (g)\ + a (mod n) für jedes ganzzahlige z. t)a (f>(s), den Grad' n nicht erreicht, so müssen (§. 143) in G) die Coefficienten der einzelnen Potenzen von s auf beiden Seiten congruent sein, und aus der Ver- Vergleichung der Coefficienten der höchsten Potenzen von s ergiebt sich a' =. 1 (inod «), also ¦¦ ' > ip {z -j- 1) ^ <p (?) -\- a (mod n). Setzt man hier z -\- 1, g--\- 2'.-;-. « -j- ä — 1 für z, so folgt q>(s -\- h) = (p (z)'-{- ah (mod n), wo h mit jeder beliebigen ganzen Zahl nach dem Modul w con- congruent sein kann. Darin kann man nun z = 0 setzen und erhält, wenn man wieder z für h schreibt und; (p(ß) = b setzt, (8) ... ¦ 9>0O— as -{-b. Es besteht also , die¦* Gruppe P aus lauter linearen Permu- Permutationen und unser Satz ist bewiesen. Wir fügen noch die Bemerkung hinzu, die sich unmittelbar aus dem Anblick der Formeln ergiebt, dass die cyklische Gruppe @, z-\^ b) ein normaler Theiler einer jeden linearen Gruppe ist, in der sie überhaupt enthalten ist. Wenn wir von dem bewiesenen Satze die Anwendung auf die Gruppe der metacyklisehen Gleichung machen, so erhalten wir den.Satz von Galois: . '. III. Die Gruppe einer irreduciblen metacyklisehen Gleichujig von Primzahlgrad ist linear.
§. 188. Lineare Gruppen. • 665 Denn kehren wir zu der Kette der Gruppen A) zurück, so haben wir gesehen, dass P^—x die cyklische Gruppe ist. Ist P«_i nicht mit P identisch, so ist Pp—X ein Normaltheiler von P^—a und also P,,_2 linear. P^_2 ist wieder Normaltheiler von P^_8, also ist auch P^s linear u. s. f., bis wir zu dem Schluss ge- gelangen, dass auch P selbst linear sein muss. Zugleich ergiebt sich, dass Pp.—\ Normaltheiler- aller vorangehenden Gruppen, also auch von P selbst ist.. Es gilt auch der umgekehrte Satz: IV. Jede irreducible Gleichung von Primzahlgrad, deren Gruppe linear ist, ist metäcyklisch. Um ihn zu beweisen, genügt es, zu zeigen, dass jede transi- transitive lineare Gruppe L einen Normaltheiler U hat, dessen Index eine Primzahl, und der selbst, wenn er nicht die Einheitsgruppe ist, eine transitive lineare Gruppe ist. Dies zeigt" aber unmittelbar die Darstellung der Substitu- Substitutionen der Gruppe L durch die Formel F). Wenn darin e = 1 ist, so ist L die cyklische Gruppe vom Grade n mit dem Normaltheiler 1. Ist aber e> 1, so sei p eine in e aufgehend« Primzahl, und e = pd. Die lineare Gruppe L' vom Grade ne', die aus den Substitutionen besteht: t, r „* , ia * = 0, .1, 2, . . ., e'. — 1 X = (,, «,», + 6), h=0]h2]^^n_v , ist gewiss ein Theiler von L vom Index p. Dieser Theiler ist aber auch normal, wie man aus der Compositionsregel D) ohne Mühe erkennt. Die Begrifie der transitiven linearen und der metacyklischen Gruppen decken sich also bei den Gleichungen von Primzahl- Primzahlgrad vollständig, und wir können daher auch in der Folge beide Ausdrücke synonym gebrauchen. Wenn wir von einer Gruppe jp zu einer conjugirten Gruppe P' = jt-1Pjt übergehen wollen, so geschieht dieser Uebergang dadurch, dass bei allen Permutationen von P in den Cyklen die Vertauschung % vorgenommen wird. P' wird also mit P bis auf die Bezeichnung der Wurzeln übereinstimmen, und ist daher, wenn P linear ist, auch als linear zu bezeichnen, wenn auch eine Aenderung in der Numerirung der Wurzeln nöthig ist, -um sie durch lineare Substitutionen darzustellen. '
666 Siebzehnter Abschnitt. §. 188. Zur Vereinfachung der Anwendung bemerke man noch, dass man die volle lineare Gruppe durch Wiederholung und Zusammensetzung der beiden Substitutionen (9) ä = («, * + l), t = (g,gg)t und jeden transitiven Theiler L der vollen linearen Gruppe ebenso aus A0) s = (*, * + 1), t°° = (*, a„ *) ableiten kann. Man nennt daher die beiden Substitutionen (9) oder A0) die erzeugenden Substitutionen dieser Gruppen. Setzen wir a0 = g2, so erhalten wir eine häufig vorkommende lineare Gruppe (#, az -\- b), in der a nur die quadratischen Reste von n durchläuft, die von Kronecker die halbmeta- cyklische Gruppe genannt worden ist. Diese Darstellung durch die erzeugenden Substitutionen gestattet einen einfachen Schluss auf die Beziehung der meta- cyklischen Gruppen zu der symmetrischen und der alternirenden Gruppe. Die aus s hervorgehende Permutation besteht aus einem einzigen Cyklus mit einer ungeraden Gliederzahl @,1,2,..., n — 1), und gehört daher zu der alternirenden Gruppe. Die Substitu- Substitution t lässt den Index 0 ungeändert und liefert für die übrigen Ziffern wieder einen einzigen Cyklus. Denn durch t geht 1 in g. g in g2, g2 in g3 etc. über und da die Potenzen 1, g, </2, . . ., gn~2, von der Reihenfolge abgesehen, mit den Ziffern 1, 2, .. ., n — 1 übereinstimmen, so entspricht t dem Cyklus A, g, g% . . ., gn~2), der aus einer geraden Gliederzahl besteht und folglich zu den Permutationen zweiter Art gehört, also nicht in der alternirenden Gruppe enthalten ist. Dagegen ist t2 wieder darin enthalten. Daraus ergiebt sich das Resultat: V. Die volle lineare Gruppe ist kein Theiler der alternirenden Gruppe. Der grösste gemeinschaft- gemeinschaftliche Theiler beider Gruppen ist die halbmeta- cyklische Gruppe. Man kann der Bedingung für die metacyklischen Gleichungen verschiedene Formen geben, die sich aus dem Bisherigen ableiten lassen. Die volle lineare Gruppe ist als Theiler vom Index v = 1 . 2 . 3 . . . (n — 2) in der symmetrischen Gruppe ent- enthalten. Eine zu der vollen linearen Gruppe gehörige Function y
§. 188. Metacyklische Gruppen. 667 der n Variablen x0, xL, . . ., #„_i, die wir eine metacyklische Function nennen können, genügt daher einer Resolvente F(y)=0 vom Grade v, deren Coefficienten symmetrische Functionen der x sind. Substituirt man nun für x die Wurzeln einer metacyklischen Gleichung f(x) = 0, so wird y rational. Wenn umgekehrt die Function y durch die Substitution der Wurzeln einer irreduciblen Gleichung/(#)=: 0 für die x rational wird, während F'(y) von Null verschieden bleibt, so ist f(x) metacyklisch; denn dann ist die Gruppe von f{x) — 0 gewiss ein Theiler der vollen linearen Gruppe, und daher selbst linear; und da/(x) irreducibel ist, so ist die Gleichungf(x) = 0 meta- metacyklisch. Es genügt aber auch für die algebraische Auflösbar- Auflösbarkeit von f(x) = 0, wenn die Resolvente F(y) = 0 nur über- überhaupt eine rationale Wurzel hat, die nicht Doppelwurzel ist. Denn die verschiedenen Wurzeln dieser Resolvente gehören zu conjugirten Gruppen, und wenn daher eine von diesen Wurzeln rational ist, so ist eine der conjugirten Gruppen metacyklisch. Wir haben also den Satz: VI. Die nothwendige und hinreichende Bedingung für die Lösbarkeit der Gleichung f(x) = 0 durch Radicale ist die, dass die Resolvente vUn Grades F(y) = 0, die man durch passende Wahl der Func- Function y so eingerichtet hat, dass sie keine Doppel- Doppelwurzeln erhält, eine rationale Wurzel hat. Eine andere Form dieser Bedingung ergiebt sich auf folgende Weise. Unter den Permutationen einer linearen Gruppe ist nur die identische, die irgend zwei Ziffern ungeändert lässt. Denn wenn (z,ag-\- b) zwei Ziffern nicht ändert, so muss die Congruenz az -j- b = s (mod n) zwei verschiedene Lösungen haben. Das ist aber nur möglich, wenn a = 1, b = 0 (mod n) ist Ist also die Gruppe P von f(x) linear, so reducirt sie sich durch Adjunction von zwei beliebigen Wurzeln auf die Einheit, und folglich sind alle Wurzeln rational durch zwei beliebige unter ihnen ausdrückbar. Also: VII. Ist eine irreducible Gleichung von Primzahlgrad metacyklisch, so sind alle Wurzeln rational durch zwei beliebige unter ihnen ausdrückbar.
668 Siebzehnter Abschnitt. §. 188. Aber dieser Satz gilt auch umgekehrt, was wir folgender- maassen einfach beweisen können. . Es habe eine irreducible Gleichung vom Primzahlgrad n die Eigenschaft, dass alle Wurzeln rational durch zwei beliebige unter ihnen ausdrückbar sind. Ist etwa xv = ^{x^^x^} eine solche Darstellung, so können auf diese Relation alle Permu- Permutationen der Gruppe P unserer Gleichung angewandt werden, und wenn also eine von diesen Permutationen x0 und x1 un- ungeändert lässt, so lässt sie auch alle xv ungeändert, d. h. es ist die identische Permutation. Also enthält P ausser der identischen Permutation keine, die zwei Ziffern nicht änderte Enthält nun eine der Permutationen % = ccx ... von P zwei oder mehr verschiedene Cyklen c, Cx ... und ist c vom Grade \ cx aber von einem höheren Grade, so ist nh = c\ . . ., und jch lässt die Ziffern von c ungeändert, während sie doch nicht die iden- identische Substitution ist, weil c\ nicht alle Ziffern ungeändert lässt. Dies ist aber nicht möglich, wenn h'> 1 ist. Es muss also ent- entweder % eine Ziffer ungeändert lassen, oder es muss aus Cyklen von gleichem Grade bestehen. Da aber n Primzahl ist, so kann % in diesem Falle nur einen Cyklus vom nim Grade bilden. Es enthält also P ausser der identischen nur cyklische Permutationen nten Grades, die wir mit y bezeichnen wollen, und Permutationen %, die eine Ziffer ungeändert lassen und ausser- dem aus Cyklen von gleichem Grade bestehen. Jede der Permutationen %, durch die die Ziffer 0 ungeändert bleibt, wollen wir mit %0 bezeichnen. Ebenso bedeuten %, %.M..., %n—i die Permutationen %, die die Ziffern 1, 2, . . ., n — 1 ungeändert lassen. Da P transitiv ist, so müssen ebensoviel %0, wie jq, wie %-i etc. vorhanden sein. Denn ist n eine Permutation, die 0 in 1 überführt, so ist jedes 7T-1%(j% ein %, und umgekehrt jedes nxl7C~1 ein x0, und ebenso für die übrigen Ziffern. Ist also (i die Anzahl der sc0, v die Anzahl der y,,m der Grad von P, so ist, da noch die identische Permutation hinzukommt, A1) m = [in -j- v,+ 1- Nun bilden die x0 mit der identischen Permutation zusammen eine Gruppe Q vom Grade (t -\- 1, und zwar einen .Theiler von P, nämlich den Inbegriff aller Permutationen von P, die 0 un-
§. 188. Metacyklische Gruppen. 669 geändert lassen. Sind also x1} 7i2, . . ., tt„_1 Permutationen in P, die 0 in 1, 2, ...,» — 1 überführen, so ist Qnx der Inbegriff aller der Permutationen von P, die 0 in 1 überführen u. s. f. Wir erhalten also die Zerlegung von P in die Nebengruppen P=Q+Qx1+Qx1-\ [- Qxn-i, woraus folgt A2) 'w===n((t+l), also aus A1) und A2) v = n — 1. Es giebt also n — 1 und nicht mehr cyklische Permutationen wten Grades in P und diese bilden folglich wieder mit der Ein- Einheit zusammen eine cyklische Gruppe C = l, y, y\ ¦ •., r"-1, da mit y zugleich alle Potenzen von y in P vorkommen. Wenn nun y eine cyklische Permutation nUn Grades ist, so ist auch jedes %— 1yhic zyklisch und muss also, wenn it zu P gehört, auch in C enthalten sein. C ist also ein Normaltheiler von P, und folglich muss nach dem Theorem II. die Gruppe P linear sein. VIII. Eine irreducible Gleichung von Primzahlgrad, bei der alle Wurzeln rational durch zwei be- beliebige von ihnen ausdrückbar sind,, ist meta- cyklisch. Wir schliessen aus diesen Sätzen noch auf eine merkwürdige, zuerst von Kronecker bemerkte Eigenschaft der metacyklischen Gleichungen für den Fall eines reellen Rationalitätsbereichs1). Wenn bei einer solchen Gleichung zwei Wurzeln reell sind, so folgt aus VII., dass alle ihre Wurzeln reell sind. Eine reelle Wurzel muss aber eine solche Gleichung, da sie ungeraden Grades ist, immer haben. Also folgt IX. Eine irreducible metacyklische Gleichung von un- ungeradem Primzahlgrad mit reellen Coefficienten hat entweder lauter reelle Wurzeln oder nur eine. Sind alle Wurzeln reell, so ist die Discriminante als Product von lauter Quadraten reeller Grossen (xh — a;&J positiv. Ist nur eine Wurzel reell, so entspricht jedem complexen Factor der Discriminante (xh — #&J ein conjugirter, und deren Product ist x) Ueber algebraisch auflösbare Gleichungen. Monatsbericht der Ber- Berliner Akademie, 14. April, 1856.
670 Siebzehnter Abschnitt. §. 189. positiv. Nur wenn xh und Xy, conjugirt imaginär, also xh — xk rein imaginär ist, so ist (% — x^J negativ und die Discriminante erhält also für jedes Paar conjugirt imaginärer Wurzeln den n—l Factor — 1. Das Vorzeichen der Discriminante ist also (— 1) 2 .. Daraus folgt: X. Wenn n = 1 (mod 4) ist, so ist die Discriminante immer positiv, ist aber w= 3 (mod 4), so ent- entscheidet das Vorzeichen der Discriminante, wel- welcher der beiden Fälle des Theorems IX. eintritt. §. 189. Anwendung auf die metacyklischen Gleichungen 5ten Grades. Wir machen noch eine Anwendung der allgemeinen Sätze auf die Gleichungen 5ten Grades. Ist n = 5, so hat die cyklische Gruppe 5, die halbmetacyklische 10 und die volle lineare Gruppe 20 Permutationen. Eine metacyklische Function genügt bei einer allgemeinen Gleichung Ö*"*1 Grades einer Resolvente gten Grades, und wenn diese Gleichung 6ten Grades eine rationale Wurzel hat, so ist die gegebene Gleichung 5ten Grades meta- cyklisch. Die halbmetacyklischen Functionen, d. h. die Func- Function en, die die Permutationen der halbmetacyklischen Gruppe gestatten, genügen einer Kesolvente 12ten Grades, die aber nach Adjunction der Quadratwurzel aus der Discriminante in zwei Factoren 6ten Grades zerfällt. Wenn man die erzeugenden Substitutionen für den Modul 5 s = 0, * + 1), * = 0, 2 4 P = 0, 4 0) auf die Ziffern 0, 1, 2, 3, 4 anwendet, so ergeben sich die Ver- Vertauschungen A) (S> (P) und es ist also, durch Cyklen dargestellt, . s = @, 1, 2, 3, 4), ' * = A, 2, 4, 3), P = A, 4) B, 3). Wenden wir die Substitutionen s, P, t auf die Paare von Ziffern @, 1), A, 2% B, 3), C, 4), D, 0) an, so folgt o, 1, o, o, 1, 2, 2, 4, 2, 3, 4, 3, 3, '4, 1, 2, 4 0 3 1,
§. 189. Gleichungen 5*«n Grades. 671 @,1), A,2), B,3), C,4), D,0) B) (s) A,2), B, 3), C, 4), D,0), @,1) (P) @,4), D,3), C,2), B,1), A,0); diese Paare bleiben also in ihrer Gesammtheit durch s und durch P, und folglich durch die halbmetacyklische Gruppe un- geändert, und eine symmetrische Function der entsprechenden Wurzelpaare ist halbmetacyklisch. Die Substitution t bewirkt die Vertauschungen . . ,„. @,1), A,2), B,3), C,4), D,0)' () (Q @, 2), B, 4), D, 1), A, 3), C, 0), führt also die fünf Paare in fünf andere über; und da es nur zehn Paare von fünf Dingen giebt, so kommen in den beiden Reihen C) alle Paare vor. Man kann nun auf sehr verschiedene Arten halbmeta- halbmetacyklische Functionen bilden. Die einfachste ist D) U = Xo Xx -f Xj, #2 + X2 X3 -f" Xs X4 -\- XiX,,, die durch t in E) u' = XoX?, -{- x2Xi + xtxx + xtx3 -{- xsx0 übergeht, und u' gehört selbst zu den halbmetacyklischen Func- Functionen. Ist F) f{x) = x'3 — ax* -\- bx* — ex2 -f- dx — e = 0 die Gleichung, deren Wurzeln x0, x^, x2, x3, xi sind, so ist also G) u + u' = b. Die Function . . (8) y = u — u' ist gleichfalls halbmetacyklisch, das Quadrat y2 aber ist voll- metacyklisch und also die Wurzel einer Resolvente 6ten Grades, wie schon Lagrange gefunden hat. Ist V^7 das Product der zehn Wurzeldifferenzen (x0 — xt), (x0 — x2) ¦ ¦ ., also z/ die Discriminante von f(x), so ist ebenfalls vollmetacyklisch und Wurzel einer Gleichung 6ten Gradesx). J) Jacobi, „observatiuncnlae ad theoriam aequationum pertinentes", Crelle's Journ. Bd. 13. Jaoobi's Werke, Bd. 3. Cayley, philos. transao- tions 1861, Collected math. papers, Vol. IV, p. 309.
672 Siebzehnter Abschnitt. . §. 189. Um die conjugirten Functionen zu u zu bilden, bezeichnen wir mit M die vollmetacyklische, mit N die halbmetacyklische, mit A die . alternirende Gruppe und zerlegen A in die Neben- Nebengruppen: A0) A = N + N A, 2) C, 4) -f Nt @, 1) -+- Nt @, 2) + Nt @, 3) + Nt @, 4). '¦ Diese Nebengruppen sind in der Thät alle von einander verschieden. Denn wäre z. B. N = JSf A, 2) C, 4), so müsste A, 2) C, 4) in N, also A, 2) C, A)t - A, 2) C, 4) A, 2, 4, 3) ¦= A, 4) in M vorkommen und dies ist nicht möglich, weil in M keine Permutation auftritt, die zwei Ziffern ungeändert lässt; und in ähnlicher Weise zeigt man, dass keine zwei anderen dieser Nebengruppen einander gleich sind. Hiernach ergeben sich für' u die innerhalb A conjugirten Werthe durch Anwendung der Permutationen A, 2) C, 4), t@, 1) = @, 1, 2, 4, 3), *(Ö, 2) = @, 2, 4, 3, 1) *@, 3) = @, 3, 1, 2, 4), *@, 4) = @, 4, 3, 1, 2): \- X1Xi + XiXs -\- XSXO, . . rm Us ~ XlX2 "*~ x*Xi ^ XiX° ~^~X(>Xz ~*~ XbX" ^ ' -Ut = X2X0 -(- X0X4, + XiXy + %lx3 + ^3^S) , % =-XBXi + X1X4, -\- XiX1 -\- XtX0 + XOXZ, u6 = xtx2 -{- xaxa -\- x^Xi -{- x1xs -\- xsxM und die entsprechenden 1^, u^, u'3, u'i, u's, u'6 findet man, wenn man auf % die Permutation t anwendet, und dann mit ¦wl ebenso verfährt, wie eben mit %, oder auch einfach, indem man die in jedem u fehlenden Paare zu dem entsprechenden u' ver- vereinigt, so dass für alle diese u die Bedingung-G) befriedigt ist. ,. . . Uri = XqXz 4" %(>%% + XXX3 ,-f- X1Xi -f-' Uz = XqX-l -\- X6Xi-\- XxXt -\- X2XS + U'3 = x°Xl + + + fl2) ' u'i = X0Xir{- XOXS -\- XXX% -\- X2Xt -f- U'6 = X0X2¦-{- XoXt -\- X1X2 -( U'6 = XOXS -\- X0Xi -\- XXX2 - Die sechs Grossen (8): y^y^ytty^y-^y^, sind die Wurzeln eine? Gleichung 6teii Grades, deren Coefficienten rational von a, 5, c, d, e
§. 189. Gleichungen 5*en Grades. 673 und V^ abhängen. Da die y alle ihr Vorzeichen ändern, wenn V'd das Vorzeichen ändert, so hat diese Gleichung die Form + «6 worin die a rationale Functionen der Coefficienten von f(x) sind. Es müssen aber auch ganze Functionen dieser Coefficienten sein; denn a2, a4, as, at V<d, a3 V^, as Vd sind ganze Functionen der x, die ja hier als unabhängige Variable gelten können, und es müssen also die drei letzteren durch das Differenzenprodnct ~\f2 theilbar sein, und dann müssen sich «2, a4, a6, at, a3, ab als ganze symmetrische Functionen der x erweisen. Bestimmt man die Grade in Bezug auf die x, so ergeben sich, da die y vom zweiten Grade sind, für a2, OzV^, a4, die Grade 2 4 6 ' 8 10 12. ist aber vom 10ten Grade in den x, und folglich muss at = 0, as = 0 und a5 eine Zahl sein. Die Functionen a2, a4, a6 sind in Bezug auf die Variablen x homogen, und wenn wir daher den Coefficienten a, b, c, d, e die Gewichte 1, 2, 3, 4, 5 beilegen, so sind die a2, at, a6 isobarische Functionen dieser Grossen mit den Gewichten 4, 8, 12 (§. 53). Man kann die Coefficienten a2, a4, a5, a6 durch wirkliche Bildung der Ausdrücke nach den Vorschriften über die Darstel- Darstellung der symmetrischen Functionen berechnen, was von Cayley geschehen ist. Rechnung und Formeln sind aber sehr weitläufig. Wir wollen uns hier damit begnügen, die Resolvente für einen besonderen Fall zu bilden. Der dabei gefundene Werth für die Zahl a5 ist dann natürlich allgemein gültig. Die Gleichung 5t(m Grades habe die Bring-Jerrard'sche Form i) A3) x° + ax + ß = 0. Dann sind o^i aii a& ganze rationale Functionen von « und ß. Von den Coefficienten der allgemeinen Gleichung F) ist d vom Gewicht 4, e vom Gewicht 5, und daraus folgt, dass der Coeffi- cient e in a2 gar nicht, in a4, a6 aber nur mit einem der Coeffi- Coefficienten a, b, c multiplicirt vorkommen kann, und dass also, wenn a, b, c Null gesetzt werden, e aus diesen Ausdrücken herausgehen ') Bunge, Aota mathematica, Bd. 7. Weber, Algebra. I. ' 43
674 Siebzehnter Abschnitt. §. 189. muss. Für die Gleichung A3) können also a2, a4, as nicht von ß abhängen, und man erhält mit Rücksicht auf das Gewicht, wenn m, mu m2, m% Zahlen bedeuten A4) a3 = mi«, a4 = m2 k2, a6 = mg a3, a6 = in. Die Zahlen m, «%, m2, m3 lassen sich aus einer speciellen Annahme bestimmen. Setzen wir ß = 0, so wird A5) • xQ = 0, xx = "^— a, #3 = * "^— a, und daraus ergiebt sich = (*o — #i) («o — «2) («o — «s) («0 — «4) («i — «2) ^ ~~ ^^ ^ ~~ X^ ^ ~~ ^^ ^ ~~ X^ ^3 ~" '^ = 16« V^ä5 = — 16 V«5 ^ = 256 «5. Da hier 6 = 0 ist, so wird nach G) und (8) y = 2m, und aus A1) und A5) ergeben sich die Werthe der y: . . 2/4 — D — üi) V«, 2/ä = D + 2») Vä. Danach erhält man für ß = 0 die folgende in «/ identische Gleichung: A7) 2/6 _|_ a2a4 + «4«/3 + «6 — % V^«/ . ={y + 2 V«)* & — Sy Vä + 20a) = y* — 20ay* -\- 240«22/2 + 512 Vas«/ + 32O«3; Daraus findet man aber die allgemeine Resolvente für die Gleichung A3), wenn man nach A6) für —16 V«5 setzt V^ also A8) «/e _ 20 ay* -f 240«»^ _ 32 y~jy _(_ 320 a3 = 0. Die Discriminante J hat hier, wie sich aus der Formel C) im §.80 ergiebt, den Ausdruck A9) 4 = 55/3* + 28«5. Einfacher noch wird die Gleichung für u, nämlich B0) ms_ 5KM4 _|_ 15K2M2 _ YJu + 5a3 = 0, und wenn man w2 = v setzt, so ergiebt sich für v die rationale Gleichung 6ten Grades B1) (v3 — 5«v2 -f- 15 ofiv -\- 5«3J =
§. 189. Gleichungen 5*™ Grades. 675 Eine andere Form dieser Gleichung erhält man aus A7), wenn man den zweiten der drei Ausdrücke mit dem multiplicirt, den man daraus erhält, wenn man V« in — V<% verwandelt. Dadurch bekommt man (v — «)* (v2 — 6 av -\- 25 a2) = 0, und in diesen muss B1) übergehen, wenn ß = 0 gesetzt wird. Da aber in B1) der von ß abhängige Theil durch A9) bestimmt ist, so folgt die gesuchte Form der Resolvente B2) (v — «)* (v2 — %kv -f 25 a2) = 55/3*v. Man kann noch die Frage aufwerfen, ob die hier eingeführte Function v immer wirklich metacyklisch ist, ob sie nicht viel- vielleicht bei besonderen Gleichungen noch andere Permutationen . gestattet. Wenn dieser Fall eintreten sollte, so müsste die Gleichung B1) oder B2) gleiche Wurzeln oder B0) gleiche oder entgegen- entgegengesetzte Wurzeln haben. Der Werth u = 0 oder v = 0 tritt nur dann ein, wenn a = 0 ist. Dann haben wir in der That in A3) die wohl- wohlbekannte metacyklische Gleichung xb -j- ß = 0; diesen Fall also lassen wir jetzt bei Seite. Die Gleichung B0) kann nur dann zwei entgegengesetzte Wurzeln haben, wenn J = 0 ist, wenn also die Gleichung A3) gleiche Wurzeln hat. Auch dies ist auszuschliessen, da wir A3) als irreducibel vorausgesetzt haben. Es bleibt also nur die Frage übrig, ob B0) gleiche Wurzeln haben kann. Es müsste dann mit B0) zugleich die abgeleitete Gleichung 6m5 — 20«m3 + 30«2m — Vd = 0 befriedigt sein, und wenn wir Vd aus dieser und aus B0) eliminiren, 5 m6 — 15 «tt* + 15 «2m2 — 5«3 = 5(w2 — aK = 0. Es müsste also v = a sein und also nach B2) ß = 0. Dann wäre aber die Gleichung 5ten Grades wieder reducibel, da sie den Factor x hat. • Will man also eine gegebene Gleichung von der Form A3) in Bezug auf ihre Auflösbarkeit prüfen, so hat man zuerst die Irreducibilität festzustellen, und dann zu untersuchen, ob B1) oder B2) eine rationale Wurzel hat. Sind a und ß ganze Zahlen, so muss auch ein rationales v eine ganze Zahl sein, die unter den Factoren von 25 a6 zu suchen ist. 43*
676 Siebzehnter Abschnitt. §.. 190. Ist z. B. k = 5, ß = ht, so ist, wenn t eine durch 5 nicht theilbare ganze Zahl ist, x -\- ax -j- ß nach §. 186, 3. irredu- cibel. Für v hat man Potenzen von 5, mit positivem oder negativem Vorzeichen einzusetzen, aber für keine solche Zahl kann B2) erfüllt sein, weil auf der linken Seite die Potenz von 5 nicht hoch genug wird. Es ist also keine Gleichung von der Form x3 •*¦)- 5x -\- 51 = 0 metacyklisch. Will man metacyklische Gleichungen ermitteln, so setze man in B2) ß = «fi, v = aX, wodurch man erhält: ( } P A — iyß2 — 6A + 25)' und wenn man hierin für X und fi rationale Grossen setzt (aus einem beliebigen Rationalitätsbereich, z. B. auch aus dem Körper der rationalen Functionen von X und fi), so ist die Gleichung 5ten Grades B4) x= -\-ax -)- ß = Ö algebraisch lösbar, da ja der Fall, dass diese Gleichung redu- cibel Wird, auch auf algebraisch lösbare Gleichungen führt. Umgekehrt können wir sagen, dass keine irreducible Glei- Gleichung 5ten Grades von der Form B4) algebraisch lösbar ist, in der die Coefficienten «, ß nicht in der Form B3) darstellbar sind. Setzen wir z. B. X = 3, fi = 1, so erhalten wir 28a = 3.55, 28/3 = 3.55. Die Gleichung B4) vereinfacht sich, wenn wir für x eine neue Unbekannte £ einführen, durch die Gleichung 4#=5£. "Wir erhalten so die Gleichung fs-|- 15|* -f 12 =0 als Beispiel einer algebraisch lösbaren Gleichung, die über- überdies nach dem vorhin erwähnten Satze (§.186,3.) irreducibel ist. §. 190. Die Gruppe der Eesolvente. Die Sätze, die wir im vorigen Paragraphen abgeleitet haben, gestatten einen merkwürdigen Schluss über die Gleichungen
§. 190. Gruppe der Resolvente. 677 Wir nehmen jetzt wieder die x0, xt, x2, xs, xt des vorigen Paragraphen als unabhängige Variable an. Dann sind die sechs Grossen Vi = («i — MiJ, V2 = (Mg — «4J, V3 = (U3 — U3K v4 = (ut — u\y, vh = («5 — «ya, v6 = (m6 — MgJ die Wurzeln einer Gleichung 6ten Grades, F{v) = 0, deren Coefficienten rational durch die symmetrischen Grundfunctionen a, b, c, d, e der x ausdrückbar sind, und die in dem Körper der rationalen Functionen dieser Grossen irreducibel ist. Diese Gleichung ist eine Resolvente der Gleichung 5ten Grades f(z) = 0, deren Wurzeln die x sind. Ist M die volle lineare Gruppe der x, so haben die zu M conjugirten Gruppen %~x M n keinen anderen gemeinschaft- gemeinschaftlichen Theiler, als die identische Permutation. Denn jeder gemeinsame Theiler aller dieser Gruppen müsste ein Normal- theiler der symmetrischen und folglich auch der alternirenden Gruppe sein; da er aber nicht die alternirende Gruppe selbst sein kann, so muss er sich nach §. 185 auf die Einheitsgruppe reduciren. Die Resolvente F(v) = 0 ist also nach der in §. 163 ein- eingeführten Bezeichnung eine Totalresolvente von f(x) = 0, und ihre Gruppe muss von gleichem Grade sein, wie die Gruppe von f(x) = 0, deren Grad 1 . 2 . 3 . 4 . 5 = 120 ist. Da F(e) auch irreducibel ist, so ist die Permutationsgruppe unter den Indices der sechs Grossen v transitiv. Sie ist vom Grade 120, während der Grad der symmetrischen Gruppe der Permutationen von sechs Ziffern 6 . 120 ist. Damit haben wir den Satz: Die symmetrische Permutationsgruppe von sechs Ziffern hat einen transitiven Divisor vom Index 6. Um diese merkwürdige Gruppe, die wir mit C bezeichnen wollen, zu finden, haben wir nur den Einfluss zu untersuchen, den die sämmtlichen 120 Permutationen der x auf die v oder auf die Grossen A1) des vorigen Paragraphen ausüben. Wir haben nun früher gesehen (§. 160, 2.), dass die Trans- Transpositionen @, 1), @, 2), @, 3), @, 4) durch wiederholte Zusammen- Zusammensetzung die ganze symmetrische Gruppe der Permutationen von fünf Ziffern erzeugen. Es genügt also, den Einfluss dieser vier Transpositionen auf die Indices der v zu ermitteln. Durch An- Anwendung einer Transposition @, 1) geht jeder der Ausdrücke
678 Siebzehnter Abschnitt. . §. 190. A1), §. 189 in einen der Ausdrücke A2) über und umgekehrt, und wenn man für die vier genannten Transpositionen diese Aenderung ermittelt, so erhält man die folgenden vier erzeugen- erzeugenden Permutationen %, 3i2, n3, ici der Gruppe G @,1): »1 = A,3) B, 5) D, 6) @, 2): », = A, 4) B, 3) E, 6) @, 3): *, = A, 5) B, 6) C, 4) @,4): »4=A, 6) B, 4) C, 5), wo sich die in den n vorkommenden Transpositionen A, 3) ... auf die Indices der u und der v beziehen. Unter den 120 Permutationen der Gruppe C kommen unter anderen auch vor ^s», = A, 2, 6) C, 4, 5) %t 3T2 3T3 = A, 6, 5, 4) Tlx 3T2 1t.6 3T4 = B, 4, 6, 3, 5) Crl3r23r33r4K= B, 3, 4, 5, 6). Hiernach lässt sich leicht eine zur Gruppe G gehörige Func- tion der sechs Grossen v bilden. Eine Function, wie vxvB + ^4 + v-av6, .,; bleibt durch nx und durch %x%i ungeändert; wenden wir darauf aber die Potenzen der cyklischen Permutation B, 3, 4, 5, 6) an, so gehen daraus fünf Functionen hervor, die wir so be- bezeichnen wollen: Wo = Vx V.2 + Vi V; + V3 Ve Wx =VlVi -\- V2 V6 -j- V3 v$ B) w.2 =vtv6-f- v2 v$ -\- v3 v4 Wenn wir auf die Functionen B) die Permutationen %, n2, 3T8, %i anwenden, so gehen diese Functionen nur in einander über, und zwar in folgender Weise: Jlx = (Wo, Wi), 3T2 = (Wo, Wa), ns = (WQ, Wz), %i == (WO, Wi), d. h. die nx, n2, n3, 3r4 entsprechen den Transpositionen @, 1), @, 2), @, 3), @, 4) unter den Indices der w, und also entspricht nach §. 160, 2. der ganzen Gruppe G die symmetrische Gruppe
§. 190. Permutationsgruppe von sechs Ziffern. 679 der Indices der w. Eine symmetrische Function der fünf Grossen w, die nicht zugleich eine symmetrische Function der v ist, wie die Summe der w, ist also eine zu C gehörige Function. Man kann z. B. die Summe der Quadrate dafür nehmen W = w02 -f- wl -f- wl -\- wf -f- w42, oder eine Function (l — w0) (* — wi) Q- — w2) (i. — w8) (l — Wi) für ein beliebiges rationales k Eine solche Grosse W ist die Wurzel einer irreduciblen Gleichung 6ten Grades, deren Coefficienten symmetrische Func- tionen der sechs Grossen v sind.
Achtzehnter Abschnitt. Wurzeln metacyklischer Gleichungen. §. 191. Stellung der Aufgabe. Hülfssatz. Wir haben im vorigen Abschnitte allgemeine Kennzeichen gefunden, durch die man entscheiden kann, ob eine vorgelegte Gleichung von Primzahlgrad metacyklisch ist oder nicht. Damit ist aber der Gegenstand noch bei Weitem nicht erschöpft. Es handelt sich vielmehr nach der Form der Problemstellung, wie sie von Abel herrührt, darum, ein Verfahren anzugeben, nach dem man alle metacyklischen Gleichungen finden kann. In dieser Form ist das Problem, über das Abel nur kurze Andeu- Andeutungen ohne Beweise hinterlassen hat, von Kronecker auf- aufgenommen worden, und in der Weise vollständig gelöst, dass zu- zunächst nicht die Gleichungen selbst, sondern ihre Wurzeln gefunden werden i). So hat Kronecker für jede Primzahl n einen Ausdruck angegeben, der aus einem gegebenen Körper Sl durch wiederholtes Wurzelziehen abgeleitet ist, und der die doppelte l) Abel, Sur la resolution algebrique des equations (Oeuvres completes, ed. Sylow, tome II, p. 217), Brief an Crelle am 14. März 1826 (Oeuvres tome II, p. 266). — Kronecker, Ueber die algebraisch auflösbaren Glei- Gleichungen. Monatsberichte der Berl. Akademie 1853, 1856. — Cayley, on a theorem of Abel's etc. A880, Math, papers t. XI, p. 132). — H. Weber, lieber algebraisch auflösbare Gleichungen von Primzahlgrad. Sitzungs- Sitzungsberichte der Gesellschaft zur Beförderung der Naturwissenschaften zu Mar- Marburg 1892. Die folgende Darstellung ist gegen die dort gegebene verein- vereinfacht und in einem Punkte berichtigt.
§. 191. Die Resolventen. 681 Eigenschaft hat, dass jede-Wurzel einer irreduciblen meta- cyklischen Gleichung wten Grades in Sl in diesem Ausdruck ent- enthalten ist, und dass auch umgekehrt jeder solche Ausdruck einer irreduciblen Gleichung wten Grades in Sl genügt. Die Grundlage für diese Untersuchung liefern uns die Resol- Resolventen von Lagrange. Es sei jetzt n eine Primzahl, x0, x±, x2, . . ., xn—x sei ein System unabhängiger Variablen, und die Bezeichnung so gewählt, dass xn = x0, xn+i = xx . . . ist. Endlich sei s eine nte Ein- Einheitswurzel. Wir setzen dann A) (£, X) = X0 + EXX + £*X2 + •'•• + f1—1^-! ,= 2 ShXh- 0,n—l Diese Ausdrücke haben wir schon im vierzehnten Abschnitte unter dem Namen der Resolventen von Lagrange kennen gelernt, und wir haben dort (§. 171) ihr Verhalten gegenüber den cyklischen Permutationen untersucht. Es kommt jetzt darauf an, den Einftuss linearer Permu- Permutationen von der im §. 188 betrachteten Art auf diese Functionen festzustellen. Wir schicken einen Hülfssatz voraus, den wir eigentlich nur aus dem Früheren zu reproduciren brauchen. Die imaginären nten Einheitswurzeln e sind die Wurzeln einer Gleichung X= 0, wenn B) x = g"-1 + r~2 h h t +1 gesetzt ist, und £ eine Variable bedeutet. Die Function X ist, wie wir früher gesehen haben (§. 174), irreducibel im Körper B der rationalen Zahlen. Legen wir irgend einen Körper Sl zu Grunde, in dem X irreducibel ist, und leiten daraus den Körper Sl(s) ab, der aus allen rationalen Functionen von s mit Coefficienten in Sl besteht, so ergiebt sich nach §. 149, dass jede Grosse dieses Körpers auf eine und nur auf eine Weise in die Form C) c0 -f d s + e, £2 H h c»-2 £"~2 gesetzt werden kann, worin die c Grossen in Sl sind. Der Kürze wegen wollen wir diese Form der Grossen in Sl(s) die Normalform nennen und wollen also den Satz aus- aussprechen : 1. Ist Sl ein Körper, in dem die Kreistheilungs- gleichung X = 0 irreducibel ist, so kann jede
682 Achtzehnter Abschnitt. §.191. Grosse des Körpers Sl(s) nur auf eine Weise in die Normalform O>(» = c0 + Cl s + c2 £2 _| 1- c„_2£»-2 gebracht werden, worin die Coefficienten c in ß enthalten sind. Wir können in diesem Satze für Sl den Körper nehmen, der aus B durch Adjunction von n unabhängigen Variablen xQ, xu %2, . . ., x„-i entsteht; denn wäre X" in diesem Körper redu- cibel. also wo Xlt X2 ganze Functionen von e und rationale Functionen der x sind, so könnte man für die Variablen x0, xu . . ., #„—1 solche rationale Zahlen setzen, dass Xu X2, ohne ihren Grad in Bezug auf e zu ändern, in Functionen in B übergehen (§. 43), und dieses widerspricht der Irreducibilität von X in B. Dieser Körper £1 hat verschiedene Divisoren, in denen X gleichfalls irreducibel ist, und die also alle im Theorem 1. für Sl genommen werden können. Solche Divisoren erhält man, wenn man irgend eine Permutationsgruppe P der n Ziffern 0, 1, 2, . . ., n — 1 festsetzt und den Inbegriff aller rationalen Functionen der xQ, xv . . ., #„_i in B betrachtet, die die Permu- Permutationen dieser Gruppe gestatten. Der Inbegriff aller dieser Functionen bildet offenbar einen Körper, und so bekommt man zu jeder Permutationsgruppe der n Ziffern einen bestimmten zugehörigen Körper Sl. Man kann die Grossen eines solchen Körpers rational darstellen durch die symmetrischen Functionen der x und durch eine zu der Gruppe P gehörige Function. Wir nennen den so bestimmten Körper Sl den zu der Gruppe P gehörigen Körper. Jeder solche Körper kann in 1. die Stelle von Sl vertreten (vergl. §. 159). Wir können also den zweiten Satz aufstellen: 2. Wenn eine rationale Function d>(xo, xu ..., #B_i, s) des Körpers Sl(e) ungeändert bleibt, wenn auf die Indices der x die Permutationen einer Gruppe P angewandt werden, so gestatten auch die Coeffi- Coefficienten c0, cu c2, . . ., e„_2 der Normalform von 9 die Permutationen von P.
§. 192. • Sätze über die Kesolventen. 683 Ist <&(e) irgend ein Element des Körpers &(f), so erhält man die conjugirten Grossen, wenn man für s irgend eine andere Wurzel von X = 0 setzt, also die Substitution («, sh) für h = 1, 2, . . ., n — 1 ausführt. Alle diese Körper sind wieder in £l(e) enthalten; sie sind also mit einander identisch, d. h. £l(s) ist ein Normalkörper über £1 (§§. 149, 152). Wenn eine Grosse <5(Y) die Eigenschaft hat, ungeändert zu bleiben, wenn s durch alle sh ersetzt wird, so ist sie selbst in £1 enthalten. Dies folgt schon aus den allgemeinen Sätzen des §. 151. Wir sehen aber die Richtigkeit sofort ein, wenn wir unter der Voraussetzung setzen, woraus dann nach 1. zu schliessen ist, dass clf c2, ..., cn_2 gleich Null sind. Also: 3. WTenn eine Grosse in £l(s) die sämmtlichen Sub- Substitutionen (£, sh) gestattet, so ist sie in Sl ent- enthalten. §. 192. Sätze über die Resolventen. Wir betrachten jetzt die Lagrange'schen Resolventen (s,x) unter der Voraussetzung, dass s eine imaginäre nte Einheits- Einheitswurzel und die x unabhängige Variable sind, und wenden darauf die Sätze des vorigen Paragraphen an. Wir untersuchen zunächst den Einfluss der linearen Per- mutationen auf (s, x); dazu genügt es, wenn wir den Einfluss der beiden erzeugenden Substitutionen A) s = (Ä,Ä + l), t = (h,gh) feststellen, worin das nach dem Modul n genommene h dielndices von x durchläuft und g eine primitive Wurzel der Primzahl n bedeutet (§. 188). Wenden wir aber auf B) 0, x) = xo + sxt + e*x2 -| (- En~1xn--L die Substitution s an, so geht diese Function über in X,. + EXz -\- £2% -f • (- En—1X0 = £-!(£, x). Der Einfluss der Substitution s ist also, dass ... , , (s, x) in s~1(s, x) übergeht. v ' ' y"'
684 Achtzehnter Abschnitt. ' §. 192. Gehen wir nun zur Substitution t über und setzen in h (£, x) = Xo + 2 £hXh l,n—1 ^a für #Ä, so geht diese Function über in C) • x0 + | e»*,* ' l,n — 1 In dieser Summe kann h ein beliebiges Kestsystem nach dem Modul n durchlaufen mit Ausschluss von 0, und wir können also h durch g~1h ersetzen; dadurch wird die Summe C) #a + 2 £g~lh xh = (so-1, x). Wendet man die Permutationen s und t wiederholt an, so ergiebt sich der Einfluss von s\ t\ der in den Vertauschungen (s,x), s-*(s,z) (s, x), (so-\ x) besteht, speciell also für A = — 1 0, x), s(s, x) (s, x), (ss, x), und wir bekommen den folgenden Satz: 4. Die erzeugenden Permutationen s, t der line- linearen Gruppe bewirken die Vertauschungen (s): (a,x), s~l(s,x); (s-1): 0, x), s(s, x) (*): (s,x), (e9-\x); (t~l): (e, *), (e», x). Aus 2. und 4. aber ergiebt sich, weil s die erzeugende Per- Permutation der cyklischen Gruppe ist, die Folgerung: 5. Stellt man die Functionen D) (s,x)» = 0(e), (s\x)(s,x)-* = F(s) in der Normalform [§. 191, C)]. dar, so sind die Coefficienten cyklische Functionen jvon x0, XU . . ., Xn-t (§. 170). Hierin kann A jede beliebige ganze Zahl, die nicht durch n theilbar ist, bedeuten. Aus der Function F(s) entspringen, wenn wir A = </ an- annehmen und für s seine n — 1 verschiedenen Werthe setzen, n — 1 Functionen, die alle durch s ungeändert bleiben, und die wir folgendermaassen bezeichnen wollen:
§. 192. Metacyklische Functionen. 685 (S>, X) F, X)-' = f0 so dass also, wenn (£», x)(s, x)~s = /(£) gesetzt wird, F) /»=/(**) ist. Wendet man auf E) die Permutation t~1 an, so erleiden, wie nach dem Theorem 4. zu sehen ist, die Functionen JOi fli / 8i • • •) fn—ü eine cyklische Permutation @, 1, 2, . . ., n — 2). Ausserdem sind die Functionen /„, so lange die x variabel sind, wie man aus E) ersieht, alle von einander verschieden, da sie in verschiedene lineare Factoren zerlegt sind. Bilden wir also eine cyklische Function dieser n — 1 Grossen G) • <?(/„, U /„ • . ., /B-2), so bleibt diese sowohl durch s als durch t~\ also durch t und folglich durch die ganze lineare Gruppe ungeändert, und wir erhalten das Theorem: 6. Stellt man eine cyklische Function der Grossen /(b/ii • • o/n—2 in der Normalform dar, so sind die Coefficienten metacyklische Functionen der Variablen x0, xu . . ., #„_!. Hierbei ist unter einer metacyklischen Function jede Func- Function zu verstehen, die durch die Permutationen der linearen Gruppe ungeändert bleibt. Die Functionen /0, /i, . . ., /n—2 gehen aber auch cyklisch in einander über, wenn man die x ungeändert lässt, und für s die Substitution (s, ss) macht. Wenn also die cyklische Function G der Grossen / in ihren Coefficienten s nicht enthält, so bleibt 0 durch sämmtliche Substitutionen (e, sh) ungeändert, und wir er- erhalten aus 3. das Theorem: 7. Ist O(/0, /i, . . ., /„_2) eine cyklische Function der Grossen /0, fu . . ., /„_2 mit rationalen Coeffi- Coefficienten, so ist C eine metacyklische Function der Variablen x0, xu . . ., xn_1 mit rationalen Coefficienten. Wenn wir die Functionen /0, fu . . ., fn-^ wie sie durch E) gegeben sind, der Reihe nach zu den Potenzen gn~2, gn~3 . . . 1
686 Achtzehnter Abschnitt. §. 192. erheben und dann alles multipliciren, und wenn wir noch be- beachten, dass ssn~1 = s ist, so heben sich im Product der linken Seite der Gleichungen E) alle Kesolventen mit Ausnahme von (s, x) heraus, und es folgt (8) (£,^-.»-^=/f-vr3.../„-, Bezeichnen wir nun mit A einen noch unbestimmten ganz- ganzzahligen Exponenten, so leiten wir aus (8) die folgende Kela- tion her: (9) (s\ x)- = [(e, ar~*~~V, x)] ff" ff'" . . . fn-2. Verstehen wir unter g1 irgend eine feste primitive Wurzel von n, so können wir g = g1 -\- Z».setzen, worin l eine beliebige ganze Zahl bedeutet, da ja die primitiven Wurzeln nur bis auf Vielfache von n definirt sind. Dann ist gn-\ = gn-i _j_ «(» — 1Igt~* (mod n% woraus g"~1 ~ l = g"-1 "~ l — Im-* (mod n), und l lässt sich so bestimmen, dass — ^ = 1 (mod») wird. In (9) setzen wir nun unter dieser Voraussetzung A0) A = — g"~1~ X = 1 (mod n\ und wie in D) A1) F(s) = (s\ x) («„*)-* = (e, x)"\ worin sl = s und 1 — A, was durch n theilbar ist, = »ft gesetzt ist. Daraus erhalten wir A2) (s, xf = [FWfT'fT' ¦ . • /„-* Diese Formeln lassen sich verallgemeinern, wenn man be- beachtet, dass die Functionen f0, /1? . . ., fn—i eine cyklische Permu- Permutation erleiden, wenn die Substitution (e, £«) ausgeführt wird. Setzen wir also fest, dass f% = fk sein soll, wenn h = Ti (mod n — 1) ist, und setzen A3) >(*¦)=>, = (e»>)"*, so ergiebt die Substitution (e, £»") in A2)
§. 192. Die Darstellung der Kesolventen. 687 Diese Formeln gelten für jedes v, wenn -wir auch noch in Bezug auf die Fv festsetzen, dass F% = F* sein soll, wenn h = Je (mod n — 1) ist. Es ergiebt sich dann aus 4., dass die Functionen .Fo, Ft, . . ., Fn—i durch die Substitution s ungeändert bleiben, und durch t~1 eine cyklische Permutation erfahren. Wenn wir hier die Exponenten auf ihre kleinsten positiven Reste nach dem Modul n reduciren wollen, so setzen wir A5) gv = nqv -\- rv, 0 < rv < n, r0 = 1, und die Zahlen r„ fallen in irgend einer Reihenfolge mit den Zahlen 1, 2, . . ., n — 1 zusammen, so dass r0 immer = 1 ist. Dann wird nach E) A6) /,_! = (?\ x) (sr'-\ x)~g, und wir setzen noch V-'J vv MfJv jv + 1 •¦¦Jv + n — 3, und erhalten aus A4) Die Exponenten rv bleiben ungeändert, wenn g durch g — In ersetzt wird, sind also von der Bedingung A0) unabhängig und können aus einer beliebigen primitiven Wurzel g abgeleitet werden. Die charakteristischen Eigenschaften der in diesen Formeln vorkommenden Functionen /„, Fv, 3>„, deren Gesammtheit wir mit av bezeichnen wollen, sind, um es nochmals zu wiederholen, folgende: a) Durch die cyklische Permutation s = (h,h-{~l) unter den Indices von x ändern sich die Func- Functionen a, nicht. ß) Durch die lineare Permutation t-1 — (h, g^h) unter den Indices der x wird unter den Indices der a die cyklische Permutation @, 1, 2,..., n—2) hervorgerufen. y) Durch die Substitution ö = (£, ss) wird unter den Indices von co dieselbe cyklische Permutation @, 1, 2, ...,» — 2) bewirkt. d) Die cyklischen Functionen von cor sind meta- cyklische Functionen der x und von s frei.
688 Achtzehnter Abschnitt. §. 193. Nach dem Satze von Lagrange (§. 162) kann man jede Function ©„, der die vier Eigenschaften a), ß), y), d) zukommen, rational im Körper £1 der metacyklischen Functionen von x durch eine von ihnen, av, ausdrücken, wenn nur die a0, cd^ ..., c3n-2 von einander verschieden sind; man kann also für diese Functionen die fv wählen. Denn bedeutet u eine Variable, und ist A9) (m — C3O) (w — coj) . . . (u — ra„_2) = 9(m), so gestattet die Function <p (u) die Permutationen s, t und auch die Substitution 6 = (e, a»), und ist also nach dem Satze 3. des §. 191 eine ganze Function von u mit in Bezug auf x meta- metacyklischen Coefficienten und unabhängig von s. Ist nun also 6>0, ®u . . ., @„_2 ein Functionensystein, dem die Eigenschaften «), ß), y), d) zukommen, so ist die Summe B0) 0,« —2 eine ganze Function (n — 2)ten Grades von u, die gleichfalls die Substitutionen s, t, 6 gestattet und die also Coefficienten in £1 hat. Setzt man B1) 4§^r = ®(«) J qp' (m) und setzt dann in B0) u = <x>v, so folgt ®v = ® (c3v), worin ® eine rationale Function bedeutet, deren Coefficienten metacyklische Functionen der x sind, und s nicht mehr enthalten. §. 193. Wurzeln metacyklischer Gleichungen. Es sollen jetzt in den Formeln des vorigen Paragraphen für die Variablen x0, xu . . ., #»_i die Wurzeln §0, &, . . ., |n_a einer in irgend einem Körper ß irreduciblen metacyklischen Gleichung vom Grade n eingeführt werden, und zwar in der Reihenfolge, dass die metacyklischen Functionen der % rational (in 5?) sind, was nach den Sätzen des vorigen Abschnittes immer möglich ist. Wir machen aber dabei zunächst noch zwei beschränkende Vor-
§. 193. Wurzeln metacyklischer Gleichungen. 689 aussetzungen, von denen wir nachträglich das Resultat wieder befreien werden. Diese Voraussetzungen sind: 1. dass durch diese Substitution der § für die x keine der Resolventen (s, §), in der s eine imaginäre wte Einheits- Einheitswurzel ist, verschwindet. Nach A3), A6), A7), §. 192 bekommen dann die Functionen /„, F.,, <&v bestimmte von Null verschiedene Werthe und wir machen die zweite Voraussetzung, 2. dass durch dieselbe Substitution nicht zwei der Func- Functionen /0, /1} . . ., /„_2 einander gleich werden. Wir nehmen an, es gehe durch die Substitution der £ für die x /0] /l) • • •! Jn—2 in über, so dass also die fc0, Ttu ..., fc„_2 von einander verschieden sind, und 0>o, #15 . . ., <Z>„_2 in wo aber unter den .ST auch gleiche vorkommen können. Wegen der Eigenschaft d) der Functionen /, sind die Grossen Jen, \, ..., Ä„_2 die Wurzeln einer cyklischen Gleichung (n — l)ten (also geraden) Grades ^ (u) = 0, so dass, wenn u eine Variable bedeutet, A) q(u) = (u — fc0) («* —Jh) . • • (m — fc„_2) eine Function (n — l)ten Grades von u mit rationalen Coeffi- cienten ist. Die Grossen ho, &i, . . ., kn—2 können rational durch einander ausgedrückt werden in der Form B) \ = @(k0), \ = ©(*,), • • -, fcn-2 = ®(*»-«), fco = ®(fe»-a) (§• 170). Ebenso können die Grossen Z"v nach dem Schlusssatze des §. 192 durch die fc„ ausgedrückt werden, und zwar in der Form C) K0 = <&(fc0), JKi = *(fci), • . -, -K«-2 = CP(fcn-2), worin 9 eine rationale Function (in ß) bedeutet. Danach liefert uns die Formel A8), §. 192 folgendes Resultat: Wir setzen zur Abkürzung D) • zv = i/fcv, Weber, Algebra. I. 44
690 Achtzehnter Abschnitt. §. 193. und erhalten und wenn man diese Formeln alle addirt, und noch die rationale Grosse A, x) = A setzt: F) n& = A -f i_Kv<"-«<«+-3 .'. . <<>+ b_2. Nach §. 192, A6) und A7) sind die Grossen Kv und Ttv alle von Null verschieden. Durch F) ist eine der Wurzeln £ dargestellt. Setzen -wir zur Abkürzung -«r — t»r Kv + 1 ¦ • ¦ «-r + „_2 und schreiben F) in der Form G) »|0 = A-j-KoVB'o + K.Vlt, + •.. + Kn^VB^, so ist also |0 durch % — 1 Eadicale wten Grades ausgedrückt, von denen jedes an sich n verschiedene Werthe haben kann. Diese Werthe können aber nicht von einander unabhängig sein, •weil sonst die Anzahl der Werthe von |, die sich aus G) er- ergeben, zu gross wäre. Man erhält in der That aus E), wenn man nach §. 192, A6) setzt, (8) Z", Vl"v = K9v-i Jfc,_i(Vü,_i)' und kann also hiernach alle diese Eadicale rational durch eines von ihnen und durch % ausdrücken. Der Ausdruck F) hat aber vor G) den grossen Vorzug, n dass er, wie man auch die n — 1 Radicale Vfc„ be- bestimmen mag, doch nur n verschiedene Werthe, näm- nämlich die n Wurzeln |, darstellt. Um dies nachzuweisen, bezeichnen wir mit s0, su . . ., £n_2 irgend ein beliebiges System ntet Einheitswurzeln, und ersetzen in E) n n n durch
§• 194. Verallgemeinerung des Kesultates. 691 Dann geht F) in eine andere Form über, die wir so dar- darstellen: worin Ev eine nte Einheitswurzel ist, die durch s so ausgedrückt wird: ^ / v v-f-i***c-|- ti 2 * Nun ist nach der Definition von rv [§. 192, A5)] A1) rv =grv-.1 (mod n), und nach A0), da der Index von r nach dem Modul n — 1 zu nehmen ist, 7? — frn~2 /»i —8 Ero _g» __ £»n-2 r»"» —8 /o V—1 V V -\-1 • * * V — 1' also \lä) Mjy =^ J!/^ 1 ^=^ Mi o • Sind also die £ irgendwie bestimmt, so ergiebt sich und dadurch sind nach A2) die übrigen Ev vollkommen bestimmt. Also ergeben sich in der That nur n Werthe aus F), die man z. B. dadurch erhalten kann, dass man einem der Radicale xv seine verschiedenen Werthe beilegt. (Man vergleiche hiermit die Cayley'sche Auflösung der cubischen Gleichungen §. 39.) Will man die Grossen £0, |l5 ...,£„_! in der Reihenfolge bestimmen, die der Bildung der cyklischen und metacyklischen Gruppe zu Grunde liegt, so muss man in E) vor derSummation mit s-hrv multipliciren und findet (§. 171) A4) nl-n = A + 1 «-»'..KX—«t;»-« . . . <°+K_.2, worin eine veränderte Bestimmung der Radicale nur eine cyklische Vertauschung der |h bedingt. §• 194. Befreiung von den beschränkenden Voraussetzungen. Es wäre eine wesentliche Beschränkung dieser Unter- Untersuchungen über auflösbare Gleichungen, wenn die Voraussetzungen 1., 2. des vorigen Paragrapheu aufrecht erhalten werden müssten. 44*
692 Achtzehnter Abschnitt. §. 194. Das ist aber nicht nothwendig, -wie -wir jetzt nachweisen wollen. Es seien jetzt ij0, rju . . ., rjn_1 die n Wurzeln irgend einer irreduciblen metacyklischen Gleichung nten Grades. Wir führen die neuen Unbekannten §0, |15 . . ., |„_i durch ein System von Gleichungen ein, worin il>(y) eine ganze Function (w — l)ten Grades B) ii>{y) = «o + «i2/ + «s^ H h ««-i^-1 mit unbestimmten Coefficienten aus dem Körper ß bedeuten soll. Wir nehmen aber an, dass die n Grossen £Oi In • • •> !»—i von einander verschieden sind; dann sind auch die £ die Wurzeln einer irreduciblen metacyklischen Gleichung, und durch A) ist eine Tsc hirnhaus e n - Transformation ausgedrückt (§. 58); g0 ist ein primitives Element des Körpers ß(%); folglich sind die Körper ß(|0) und ß(^0) und ebenso die conjugirten Körper $(£r) und Ä(ijr) mit einander identisch. Es ist also auch, wenn C) X(^) = ^o + ^i^ + ^2^2 -^ (- ä«-!*" gesetzt wird, worin die Coefficienten b gleichfalls Grossen in & sind, Es ist nun leicht einzusehen, dass man über die Coeffi- Coefficienten «0, «!,... a„_i in A) so verfügen kann, dass die Voraus- Voraussetzungen 1. und 2. des vorigen Paragraphen für die £ erfüllt sind. Denn betrachten wir die a als unabhängige Variable, so werden die durch A) bestimmten £ gleichfalls Variable, die mit den a durch eine lineare Substitution mit nicht verschwindender Determinante zusammenhängen. Die Determinante dieser Sub- Substitution ist nämlich nh d. h. gleich dem Differenzproduct der ij, das nach der Voraus- Voraussetzung von Null verschieden ist. Die Functionen (s, x) und die Differenzen fa —fo, die nach §. 192 nicht verschwindende Functionen der Variablen
§. 194. Verallgemeinerung des Resultates. 693 Xo, #,, ..., xn-i sind, gehen also, wenn für die x die Substitution Xu = ip (rjh) gemacht wird, in Functionen der Variablen a über, die auch nicht identisch verschwinden können. Nach dem Satze §. 43, 1. kann man also für die Grossen a0, au . . ., a„_i solche rationale Zahlen setzen, dass die Functionen (g, x) und die Differenzen fa — fy, die dann also in (g, f) und in ~ka — fe? über- übergehen, von Null verschieden werden, und dass auch die £& von einander verschieden bleiben, was zu beweisen war. Nachdem also dies festgestellt ist, führen wir das System der Variablen x0, x-y, . . ., #„_i und ein davon abhängiges System von Variablen y E) Vo = %(%o), Vl = %Ol), • • •, Vn-l = %(Xn-l) ein, worin % die Function C) bedeutet, und setzen (G) fc = &v. Wird auf die Indices der x irgend eine Permutation an- angewandt, so erleiden die Indices der y die gleiche Permutation. Wenn wir also auf F) die cyklische Permutation s anwenden, so ändert sich ®v nicht (nach §. 192, 4.). Wenn wir also ®v in der Normalform des §.191 darstellen, so sind seine Coefficienten cyklische Functionen von xfnxl,...,xn—i. Wendet man auf ©r die Permutation t—1 =(h,g-1h) an, so geht @r nach §. 192, 4. in ©r + 1 über, und die &v erleiden also eine cyklische Permutation. Denselben Erfolg hat aber auch die Substitution ß — (g, a»), und also hat das System der Functionen @0, ©,, . . ., @„_2 die Eigenschaften «) ß) y) d) (§. 192). Nach dem am Ende-des §. 192 bewiesenen Satze geht also, wenn wir die x durch die £ und folglich die y durch die y\ ersetzen, ©v in eine rationale Function von hv G) Q,.= Q(kr) über, und aus F) ergiebt sich (8) Fr», q) = «,(s", g). Wenn man hierin für (gr», |) den Ausdruck E), §. 193 substi- tuirt, so erhält man für (g'v, rf) einen Ausdruck von ganz der- derselben Form, nur mit dem Unterschiede, dass an Stelle von Kv getreten ist Qv Kv. Die Functionen Qv Kv haben im Wesentlichen dieselben Eigenschaften, wie die Function Kv, nur dass sie auch
694 Achtzehnter Abschnitt. §. 194. zum Theil Null sein können. Durch dieselbe Veränderung er- giebt dann §. 193 F) den Werth von ij0. Damit sind also die beschränkenden Voraussetzungen des §. 190 beseitigt, und wir haben das allgemeine Theorem: I. Jede Wurzel £ einer metacyklischen Gleichung vom Primzahlgrad n kann in der Form dargestellt werden (9) 1 = ^+2 z;<-»<;-«... <;„_„, 0) n — 2 ¦ worin A eine rationale Grosse, jfc0, fcx, . . ., ftM_2 die von einander und von Null verschiedenen Wur- Wurzeln einer cyklischen Gleichung (n — l)ten Grades, Kv eine rationale Function von Ttv ist, deren Form für alle v dieselbe ist. Die Exponenten r0, *x, . . ., r„_2 sind die kleinsten positiven Reste der Zahlen 1, g, g2, . . ., gn~2, wenn g eine primitive Wurzel von n ist. Die n Werthe, die man aus (9) erhält, wenn man den Radicalen rv=y]cr ihre ver- ; schiedenen Werthe beilegt, sind die n Wurzeln einer und derselben rationalen Gleichung. Die Formel (9) ergiebt sich aus §. 193 F), wenn A und 2T» durch nA und itl, ersetzt wird, was zur Vereinfachung ge- geschehen ist. Das Theorem I. lässt sich nun aber auch umkehren. Um das nachzuweisen, bezeichnen wir mit s irgend eine imaginäre nte Einheitswurzel und setzen V A0) & = Ä +0J_fl ^"<"~2<+~78 • • • <V«-2 h = 0, 1, 2, . . . n — 1, oder abgekürzt v n 0, n — 2 worin wie früher gesetzt ist. Wir haben nun die Aenderungen zu untersuchen, die sich für £Ä ergeben, wenn wir n 1. eines der Radicale tv = Ykv anders bestimmen und 2. die Jc0, Äj, . . ., fc„_2 cyklisch vertauschen.
§. 194. Wurzeln metacyklischer Gleichungen. 695 Wir wollen einem der Radicale, etwa dem ra, ein anderes Vorzeichen geben, also die Vertauschung A3) (ro, st>Ta) machen, wo ß ein beliebiger Exponent sein kann, und a einer der Indices 0, 1, . . ., n — 2 ist. In A2) hat, da der Index von r nach dem Modul n — 1 zu nehmen ist, das Radical xa den Exponenten rM+r_a_2 = rr_a_,, und also entspricht der Vertauschung A3) die Vertauschung A4) \VBv, S^v-a-l Nun ist nach der Bedeutung der Zahlen r allgemein r„+/J = rarp (mod n), und wenn man also die Vertauschung A3) in A1) einführt, so geht h in h -f- ßr^a—i über. 1. Es ruft also die Vertauschung A3) unter den Indices von f die cyklische Permutation (Ä, Ä -f ßr-^,^) hervor. Machen wir zweitens die cyklische Permutation A5) (r0, t15 . . ., rn_2), so entspricht diese den Vertauschungen A6) (\fK, VB^J, (K„ Kr+i), v = 0, 1, 2, ...,« — 2, und |Ä geht über in A -f- v e*r, Kv+1 = Ä 2. Demnach erleiden die Indices von f durch die Permu- Permutation A5) die Permutation Betrachten wir nun irgend eine rationale symmetrische (oder auch nur metacyklische) Function der f: so erhalten wir, wenn wir die Werthe A0) einführen, daraus eine rationale Function der Radicale Diese Function ändert sich aber nicht, wenn man einem dieser Radicale einen anderen seiner n Werthe giebt, und folglich muss die Function rational von fc0, hu ..., hn_2 abhäügen. Wegen
696 Achtzehnter Abschnitt. §. 194. 2. ändert sich diese Function aber auch nicht, wenn unter den \ die cyklische Permutation (jfc0, 1cl: . . ., Ä„_2) vorgenommen wird, und weil nun die Grossen Jcv die Wurzeln einer cyklischen Glei- Gleichung im Körper $ sind, so ist die Function S(£o> £i> • . •, In—i) eine Grosse in $, d. h. rational. Wendet man dies auf die Coefficienten der Gleichung an, deren Wurzeln die Grossen A0) sind, so folgt, dass diese Grossen die Wurzeln einer Gleichung nten Grades in $ sind. Was die Irreducibilität dieser Gleichung betrifft, so ist dar- darüber Folgendes zu bemerken: n Wenn das Radical VBo nicht rational durch ]c0 ausdrückbar ist, so ist nach §. 187 die Function A7) x» — Bo im Körper $(jfco), der aus $ durch Adjunction von Tc0 entsteht, irreducibel. Nach §. 193 (8) kann man jede der Wurzeln f, I» etwa f0, rational durch eine der Wurzeln dieser Function, vB0, ausdrücken, und die übrigen Wurzeln f erhält man, wenn man . n für y_ß0 die verschiedenen Wurzeln von A7) setzt. Wenn also 0 (f 0) = 0 eine in $ (ft0) rationale Gleichung ist, der eine der Wurzeln f genügt, so folgt aus der Irreducibilität von A7), dass dieser Gleichung auch alle anderen f genügen müssen, und dass folglich die Gleichung nten Grades, deren Wurzeln die f sind, im Körper $(&0), und um so mehr also im Körper $ irre- irreducibel ist. n Wenn aber V_B0 in $Gc0) enthalten ist, so sind auch die n sämmtlichen Vi?r in diesem Körper enthalten, wie aus §. 193, (8) hervorgeht. Es sind also zunächst alle £ in dem Körper $(ft0, e) enthalten. Durch die Substitution (fc0, ^) geht Bv—j in Bv über, und folglich Vi?r_i in svVBv, wenn ar eine nte Einheitswurzel ist. Es ergiebt sich aber, wenn man auf die Gleichung §. 193, (8) die Substitution (fc0, ftj) anwendet, A8) e, = «»_, = ef Hier muss nun £0 dem Körper StQc0) angehören, und die
§. 195. Realitätaverhältnisse. 697 gehören gleichfalls dem Körper $(ft0) an; zugleich geht Sv durch die Substitution (k0, ftj) in $,. + ! über. Die Summe A + KoSo + K^-i K,-a S,_s ist daher eine Grosse in dem ursprünglichen Rationalitäts- Rationalitätsbereich $, und nach A1) ist diese gleich einer der Grossen f. Wir können also das Theorem I. so umkehren: II. Jede in der Form (9) enthaltene Grosse f ist die Wurzel einer Gleichung nten Grades in $, und diese Gleichung ist irreducibel, wenn nicht eine der n conjugirten Grossen f selbst in St ent- enthalten ist. §. 195. Realitätsverhältnisse. Wenn der Körper S ein reeller ist, so giebt es, wie wir im §. 188 gesehen haben, zwei Arten von metacyklischen Glei- Gleichungen von Primzahlgrad n, solche mit einer reellen und n — 1 imaginären Wurzeln und solche mit lauter reellen Wurzeln. Ebenso haben wir im §. 172 gesehen, dass es zwei Arten von cyklischen Gleichungen eines geraden Grades giebt, nämlich solche mit lauter reellen und solche mit lauter imaginären Wurzeln. Wenn nun die cyklische Gleichung, deren Wurzeln die Grossen ft0, &i, • ¦ ., &»—2 sind, zur ersten Art gehört, wenn also &o, K, • ¦ •, &«—2 reell sind, und die Radicale r0, tx, . . ., t„_2 auch reell genommen werden, so zeigt die Formel A0) §. 194, dass f0 reell, £& und f_Ä conjugirt imaginär sind. Wenn andererseits die ~k imaginär sind, so ist nach §. 172 hy und Tc n—i conjugirt imaginär, und nach der Formel (8) in §. 193 können wir setzen, wenn 0 eine rationale Function be- bedeutet, n — l 2 oder auch n—l 3 +1
698 Achtzehnter. Abschnitt. §. 196. n — l Weil nun g eine primitive Wurzel von n ist, so ist g 3 +1 durch n theilbar, und die rechte Seite wird daher rational. Be- Bedeutet also W eine rationale Function, so ist VB n-lVBv = W(JCV), und diese Formel zeigt, dass also dass W(lcr) reell ist. Daraus folgt, dass r+„_i und conjugirt imaginär sind; denn erstens sind ihre nten Potenzen conjugirt imaginär, sie selbst also zunächst bis auf eine nte Ein- Einheitswurzel als Factor. Da aber ihr Product reell ist, so muss diese nte Einheitswurzel = 1 sein. Da nun ausserdem rv = — r n—i (mod n) ist, so zeigt die Formel A1), dass in diesem Falle die Wurzeln £„ alle reell sind. Damit ist also der Satz für einen reellen Körper $ be- bewiesen : Hat die cyklische Gleichung, deren Wurzeln die &o, 'kl,"-, kn—2 sind, reelle Wurzeln, so ist von den Wurzeln £ eine reell, die übrigen imaginär; hat diese cyklische Gleichung imaginäre Wurzeln, so sind alle f reell. §. 196. Metacyklische Gleichungen fünften Grades. Durch die Sätze der vorangehenden Paragraphen sind die Wurzeln einer metacyklischen Gleichung von Primzahlgrad in eine allgemein gültige Form gebracht, die es gestattet, alle diese Grossen wirklich zu bilden, wenn man die Kenntniss der Wurzeln cyklischer Gleichungen voraussetzt. Ganze Systeme cyklischer Gleichungen jeden Grades liefert uns z. ß. die Kreistheilungs- theorie, deren Wurzeln die Kreistheilungsperioden sind. So
§. 196. Metacyklische Gleichungen 5»en Grades. 699 können wir also beispielsweise für den Körper der rationalen Zahlen beliebig viele metacyklische Gleichungen bilden. Dass darin alle diese Gleichungen im Körper der rationalen Zahlen enthalten sind, ist ein sehr merkwürdiger, von Kronecker her- herrührender Satz, den wir irn zweiten Bande kennen lernen werden. Hier wollen wir als Anwendung und Veranschaulichung des Vor- Vorhergehenden noch die specielle Aufgabe behandeln, in einem be- beliebigen Körper $ die Wurzeln aller metacyklischen Gleichungen fünften Grades zu finden. Dazu ist erforderlich und hinreichend, dass wir die Wurzeln jfco, &i, &2> \ einer cyklischen Gleichung vierten Grades allgemein bestimmen, und zwar unter der Voraussetzung, dass ft0, &i, &21 ^s unter einander verschieden und keine von ihnen Null sei. Als Grundlage dient uns dabei die Function A) w = Qh — h) Oh — h), die von Null verschieden sein muss, und die für einen reellen Körper $ immer reell ist, da entweder fc0, j^, Tc2, hs reell sind oder ft0, Ti2 und Tci, ftf zwei conjugirt imaginäre Paare bilden. Bei der cyklischen Permutation @, 1, 2, 3) ändert w sein Vorzeichen. Also ist das Quadrat von w eine cyklische Function, die nach Voraussetzung bekannt sein soll. Wir setzen daher, indem wir durch die kleinen lateinischen Buchstaben a, b, c . . . Grossen in $, also rationale Grossen bezeichnen, B) w = 4 Vc, und bemerken noch, dass jede Function der jfc, die durch die cyklische Permutation @, 1, 2, 3) ihr Vorzeichen ändert, das Product einer rationalen Grosse mit Vc ist. Es handelt sich dann nur darum, cyklische Functionen in genügender Anzahl zu bilden, so dass man die vier Grossen jfc0, hu ft3, jfcj daraus berechnen und durch von einander unabhängige rationale Grossen algebraisch ausdrücken kann. Nun sind zwei weitere cyklische Functionen Oo — «ar -j- Oi — w {h0 — tv2) (f»i — 1»$) und wir bekommen also, wenn a, b rationale Grossen sind,
700 Achtzehnter Abschnitt. §. 196. . Die drei rationalen Grossen a, b, c sind aber nicht von ein- einander unabhängig, sondern es besteht nach B) und C) zwischen ihnen die Relation D) 62 = c A -f- a*). Aus C) ergiebt sich ferner h0 - lc2 = 2 Vb + a Vc \ — \ = <lVb — aVc, und zwischen den beiden Quadratwurzeln besteht die Relation F) Ve = Vb + aVc Vb — a Vc. Bezeichnen wir ferner mit C und B wieder zwei rationale Grossen, so ist k0 -f- 7cj -f- 7i2 + ^ = 4 C, (J 7c0 -/^-f-fc, — fc, also wodurch nach E) folgt: fc„ = C + BV7+V& + aVc \ = C - BV^ + Vb -aV7 lc2 = C + BVc -Vb+_aVc_ lcs= C — BVc—Vb — aVc. Es ist auch umgekehrt leicht, zu zeigen, dass diese Grossen die Wurzeln einer biquadratischen cyklischen Gleichung sind. Denn setzen wir zur Abkürzung A0) r = Vc, q = Vb + a Vc, q' = Vb.~ a V7, also nach F) r = q q', q2 = b -\- ar, q'* = b — ar, so können wir jede rationale Function der fc0, fea, 1c2, ^ als lineare Function mit rationalen Coefficienten von den sechs Radicalen 1, r, Q, Q1, tq, tq' darstellen. Die cyklische Permutation (k0, \, fc2, hä) entspricht der Vertauschung r, Q, Q1, — r, q', — Q, und wenn man diese Vertanschung wiederholt, so sieht man,
§. 196. Cyklische Gleichungen 4terL Grades. 701 dass eine cyklische Function der ft sich nicht ändern kann, wenn in der linearen Darstellung durch diese sechs Grossen folgende Vertauschungen gemacht werden: 1, r, o, o', ro, r o' 1, — r, q', — q, — ro', ro 1, r, — q, — q'. — ro, — ro' 1, — r, — q', q, ro', — ro, und wenn man die vier sich so ergebenden Ausdrücke addirt, so erhält man für die cyklische Function der Tc einen rationalen Ausdruck. Will man die biquadratische Gleichung bilden, deren Wurzeln die h sind, so führt man am besten h — C = x als Unbekannte ein. Man bekommt so durch einfache Rechnung die Gleichung -f- b)x% — iBacx -| Die Darstellung der ~k durch die Formeln (9) ist aber noch nicht vollständig befriedigend, weil zwischen den darin vor- vorkommenden rationalen Grossen a, b, c noch die Relation D) stattfindet, und wir suchen eine Darstellung durch unabhängige Grossen. Einen besonderen Fall müssen wir zunächst abmachen, nämlich b =¦ 0, was o = i zur Folge hat. Dann geben die Formeln (9) Äb = C- BVc-^—J und die biquadratische Gleichung A1) wird Xi _ 2B*cx* — iiBcx -\- Bitf -f- c = 0. Dieser Fall gehört aber nur dann hierher, wenn * im Körper $ -enthalten ist, also niemals bei reellen Körpern. Wenn aber b nicht verschwindet, so führen wir eine neue rationale Grosse h ein, indem wir f a3), c = ¥A + a2)
702 Achtzehnter Abschnitt. §. 196. setzen, wodurch dann die Relation D) identisch befriedigt ist, und es geben die Formeln (9), wenn man Bh durch B ersetzt, 0 = C + J5 Vl 4- « h = C — B Vl -f «2 — Vä (l + a2 — a Dieser Ausdruck für jfc0 hat noch den Vorzug, dass er, wie man auch die Vorzeichen der darin vorkommenden Quadrat- Quadratwurzeln bestimmen mag, nur vier verschiedene Werthe darstellt. Bei Abel findet sich für jfc0 ein etwas anderer Ausdruck, nämlich fco = G -f B Vl 4-e3 4- Vh (l + e2 + Vl 4" e2), der aus A2) hervorgeht, wenn man a = 1 : e setzt und dann B und ä durch J5e und he2 ersetzt. Der Ausdruck A2) ist also insofern allgemeiner, als er auch den besonderen Fall a = 0 umfasst, in dem die biquadratische GleichuDg in zwei quadratische Gleichungen zerfällt. Um nun die Wurzel einer metacyklischen Gleichung 5ten Grades darzustellen, sind diese Ausdrücke für ft0, jfcj, A;2, ft3 in die Formel (9) des §. 194 zu substituiren. Nehmen wir g = 2 an, so werden die Exponenten r^rur^r% der Reihe nach congruent mit 1,2,4,8, also gleich 1, 2, 4, 3, und es ergiebt sich, wenn, wie in §. 193 gesetzt wird, A3) | = A + Z"o r08 r* r.|r3 + ^ t•' r3* r| r0 + Z, r| r * r02 r, + Z3 r»t* %* xv Die Coefficienten in diesem Ausdruck, Ko, Ku K2, Kz, sind rationale Functionen der Tc0, Ttu Tc2, ks, die durch cyklische Permu- Permutation der Ti selbst cyklisch permutirt werden. Nach Abel ist Ko = Ä1 4- J-2 Jc0 4- J-3 h2 4- J.4 jfco fc2 zu setzen, worin Ax, A2, As, A± rational sind, und dieselben Ausdrücke legt auch Cayley zu Grunde. Diese Annahme ist aber nicht allgemein genug, weil zwischen ifcoifca, To0 und Tc2 eine aus A2) leicht abzuleitende lineare Relation besteht. Am ein- einfachsten drückt man die ~k durch die drei Radicale
§. 196. Metaoyklisolie Gleichungen ö4«1 Grades. 703 r = Vl + a% q = Vh (l + a2 + a VT q' = Vh (l + a2 — a Vl + a2), qq' = hr aus. Man kann das Radical q' linear ausdrücken durch r q und q, wie man aus der Formel hr2 q' = r p p'2 ersieht, wenn man rechts für p'2 seinen Ausdruck durch r ein- einsetzt und bedenkt, dass r2 rational ist. So erhält man, wenn man statt der cyklischen Permutation der h die Vertauschung / r, p, p'\ \— r, q', — q) anwendet, und mit A^ J.2, As, A4 rationale Grossen bezeichnet: Ko = Ay -\- Ai r -j- A3 q -f Ai r q Ki = Ai — A2 r 4- A% p' — A, r o' A4) / i = ^lj — j42 r — A$ q' -\- A± r q'. Diese Grossen K, K, K^ Ks sind selbst wieder die Wurzeln einer cyklischen biquadratischen Gleichung. Sie haben nur scheinbar eine allgemeinere Form, als die h; denn setzt man Kq in die Form so erkennt man die Form von l;0 in (9) wieder, natürlich mit veränderten a, 6, c.
Berichtigungen. Seite 151, Zeile 7 von unten ist zu lesen kleiner statt grösser. Seite 151, Formel A9), B0) ;? statt <f. Seite 278, Die Bedingungen (8), (9) für die Existenz von zwei Paaren gleicher Wurzeln sind zwar nothwendig, aber, wenigstens in dem Falle imaginärer Wurzeln, nicht hinreichend. Die nothwendigen und hinreichenden Bedingungen für diesen Fall erhält man am ein- einfachsten, wenn man die Forderung stellt, dass xl-\-ax*-\- bx-\- c ein Quadrat sein soll, in der Form & = o, os2 — 4e = o und für a<Co sind die Wurzeln reell, für a > o imaginär.