Автор: Феферман С.  

Теги: математика  

Год: 1971

Текст
                    С. Феферман
ЧИСЛОВЫЕ СИСТЕМЫ
Основания алгебры и анализа
М.: НАУКА, ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1971
СОДЕРЖАНИЕ
Предисловие редактора 7
Предисловие 9
Глава 1 Логические предпосылки 11
1.1. Введение 11
Математический метод A3).
1.2. Логика 15
Математические утверждения и их строение A5). Существование
A8). Логические связки B1).
Глава 2 Теоретико-множественные предпосылки 25
2.1. Множества 25
Множества как абстракции от условий B5). Расширение понятия
множества B8). Тождество и включение C1). Некоторые особенные
множества C3).
2.2. Алгебра множеств 37
Пересечение, объединение и дополнение C7). Основные законы
алгебры множеств D1). Расширение понятий пересечения и
объединения D5).
2.3. Отношения и функции 47
Отношения как абстракции от условий D7). Упорядоченные пары и
декартовы произведения D9). Область определения, область
значений, инверсия E1). Тернарные (и т. д.) отношения E4).
Операции над отношениями, композиция E5). Специальные виды
отношений E6). Отношения эквивалентности и разбиения E7).
Функции E8). Отношения конгруентности F3). Инверсия функции и
композиция функций F5).
2.4. Математические системы отношений и функций 67
Изоморфизм F8). Теоретико-множественная эквивалентность G0).
Подсистемы G1).
Глава 3 Положительные целые числа 77
3.1. Основные свойства 77
Системы Пеано и доказательства по индукции G8). Функции на
системах Пеано (80). Изоморфизм систем Пеано (84).
3.2. Арифметика положительных целых чисел 86
Рекурсивные определения (86). Сложение положительных целых
чисел (88). Умножение положительных целых чисел (91).
Возведение в степень и другие операции (93).
3.3. Порядок 94
Линейно упорядоченные системы (95). Вполне упорядоченные
системы (97). Упорядочение и арифметические операции A01).


3.4. Последовательности, суммы и произведения 103 Конечные и бесконечные последовательности A03). Обобщенные суммы и произведения A05). Обобщенные законы ассоциативности и коммутативности A06). Некоторые специальные суммы и произведения (ПО). Глава 4 Целые числа и области целостности 1 114 4.1. Расширение области натуральных чисел 114 Практические мотивировки A14). Алгебраические мотивировки A16). Коммутативные кольца с единицей A18). 4.2. Области целостности 122 Упорядоченные области целостности A23). Абсолютные величины A26). 4.3. Построение и характеристика целых чисел 127 Теорема существования A28). Однозначность характеристики A34). 4.4. Целые числа как система индексов 136 Более общие законы ассоциативности и коммутативности A39). Геометрическая прогрессия, биномиальное разложение A41). 4.5. Математические свойства целых чисел 145 Алгоритм деления A45). Отношение делимости и простые числа A47). Наибольшие общие делители A49), Разложение целых чисел на простые множители A53). Позиционные системы обозначений целых чисел A56). 4.6. Отношения конгруентности в области целых чисел 161 Гомоморфизмы A62). Свойства, сохраняющиеся при гомоморфизмах A63). Отношение конгруентности по модулю целого числа A66). Приложения к задаче Диофанта A68). Глава 5 Полиномы 172 5.1. Полиномиальные функции и полиномиальные формы 172 Существование и единственность простых трансцендентных расширений A74). Делимость и корни полиномов A83). Формальные производные A84). 5.2. Полиномы от нескольких переменных 185 ^-кратные трансцендентные расширения A86). Симметрические полиномы A91). Основная теорема о симметрических полиномах A94). Глава 6 Рациональные числа и поля 199 6.1. К расширению областей целостности 199 Алгебраические мотивировки A99). Геометрические мотивировки B00). Поля B02). Упорядоченные поля; плотные упорядочения B05). Некоторые конечные поля B06). 6.2. Поля частных 207 Теорема существования B07). Изоморфизм полей частных B13). Рациональные числа; поля рациональных форм B14). 6.3. Решения алгебраических уравнений в полях 216
Системы линейных уравнений B17). Линейные уравнения в областях целостности B22). Полиномиальные уравнения в рациональных числах B23). 6.4. Полиномы над произвольным полем 225 Основные свойства делимости B26). Простые полиномы B28). Алгоритм деления для полиномов B30). Наибольшие общие делители B31). Теорема об однозначной разложимости полиномов B33). Глава 7 Действительные числа 239 7.1. К расширению системы рациональных чисел 239 Алгебраические мотивировки B39). Геометрические мотивировки B41). Верхние и нижние классы сечений, непрерывно упорядоченные системы B44). Существование непрерывно упорядоченных систем B46). Наибольшие нижние и наименьшие верхние грани B49). 7.2. Непрерывно упорядоченные поля 253 Свойство Архимеда B53). Изоморфизм непрерывно упорядоченных полей B57). Пределы B58). Фундаментальные последовательности B61). Теорема Больцано — Вейерштрасса B62). Построение непрерывно упорядоченного поля B67). 7.3. Бесконечные ряды и разложения действительных чисел 276 Позиционные обозначения для действительных чисел B77). Степенные ряды B83). Экспоненциальная функция B85). 7.4. Полиномы и непрерывные функции в области действительных чисел 289 Теорема Вейерштрасса об обращении в нуль B90). Действительные полиномы и их корни B92). Вычисление корней B97). Локализация всех корней; теорема Штурма C00). Рациональные и действительные степени действительных чисел C08), 7.5. Алгебраические и трансцендентные числа 311 Метод Кантора C12). Счетные и несчетные множества C14). Существование трансцендентных действительных чисел C18). Метод Лиувилля C20). Глава 8 Комплексные числа 327 8.1. Основные свойства 327 Характеристика комплексных чисел C27). Комплексная сопряженность C30). Квадратные корни из комплексных чисел C31). Геометрическая интерпретация C33). Абсолютная величина C34). Основные свойства тригонометрических функций C37). Тригонометрическая форма, теорема Муавра C41). Корни и-й степени из комплексных чисел C42). 8.2. Полиномы и непрерывные функции в области комплексных чисел 346 Пределы и обобщенная теорема Больцано — Вейерштрасса C47). Обобщение понятия непрерывности C50). Полиномиальные функции; рост и минимум их модулей C52). Основная теорема
алгебры комплексных чисел C54). О вычислении корней комплексных полиномов C58). Разложение действительных полиномов C59). 8.3. Корни комплексных полиномов 360 Корни полиномов над подполем C60). Алгебраически замкнутые подполя C61). Кратные корни, дискриминанты C66). Корни кубического уравнения C70). Корни уравнений четвертой степени C73). Об уравнениях высших степеней C74). Глава 9 Поля алгебраических чисел и расширения полей 377 9.1. Порождение подпол ей 377 Общий процесс расширения C79). Простые расширения C79). Простые трансцендентные расширения C80). Простые алгебраические расширения C81). Присоединение корней к произвольным полям C85). 9.2. Алгебраические расширения 388 Линейно порожденные расширения; базы и размерность C90). Конечные расширения полей C93). Повторные конечные расширения C94). 9.3. Приложения к задачам о геометрических построениях 397 Основные геометрические понятия C97). Реализация в декартовой плоскости C97). Построения с помощью циркуля и линейки C99). Алгебраический эквивалент задач на построение D01). Некоторые классические задачи на построение D04). Правильные многоугольники; решение Гаусса D06). 9.4. Заключение Добавление I Некоторые аксиомы теории множеств Добавление II Аналитическое определение тригонометрических функций Список книг для дальнейшего чтения Именной указатель Предметный указатель Указатель обозначений ИМЕННОЙ УКАЗАТЕЛЬ Абель 375 Адамар 410 Арган 342 Архимед 253 Бернайс 412 Больцано 264, 347 Валле-Пуссен 410 Вейерштрасс 264, 290, 347, 355 Венн 37 Галуа 375, 408 Гаусс 355, 374, 406, 408,410 Гельфонд 323 Гёдель 412 Гольдбах 15, 55 Дедекинд 78, 246, 410 Декарт 50, 397,415 Диофант 168 Евдокс 246 Евклид 150, 233, 246, 350, 397 Зильберг410 Кантор 312, 317,412 Кардан 370, 373 Коши 258, 261 Кронекер4 10 409 412 422 430 431 432 436
Ку айн 412 Куммер 410 ЛагранжЗП,374 Лейбниц 32 Линдон 163 Лиувилль319, 323 Мальцев 8, 163 Морган де 46 Морри 422 Муавр 342 Нейман фон 412 Ньютон 298 Паскаль 142 Пеано 78, 412 Пифагор 169, 239. 346 Рассел 34, 412 Риман 62 Робинсон 164 Ролль 311 Рудин 427 Тарский 359 Тарталья 370 Тейлор 285 Ферма 33, 407, 410 Феррари 370 Ферро 370 Френкель 412 Фурье 12 Цермело412, 420 Чебышев 410 Штурм 301, 302, 358 Эйзенштейн 409 Эйлер 406 Эрдеш410 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолютная величина 126, 334 Аксиома 14 — абстракции 415 — бесконечности 78, 416 — выбора 30, 46, 113,417 — объемности 413 — ограниченного образования множеств 415 — систем Пеано 78 — существования множеств 413 — экстенсиональности 413 Аксиомы Пеано 79 Алгебра булева 44 — линейная 220 — множеств 37, 41 Алгоритм 20, 220, 307 — деления 146,229 — Евклида 150, 233 Антецедент 22 Антирефлексивность 56 Антисимметричность 45, 56, 95 Аргумент 336 Ассоциативность 45, 89, 93, 106, 118, 139 База 390 — линейная 393 Включение множеств 31 Возведение в степень 93, 121, 141, 204, 308 Вычисление корней 297, 358 Вычитание 118 Геометрические проблемы построений 397 Геометрия аналитическая 202 — синтетическая 202 Гомоморфизм 162 Грань верхняя 250 наименьшая 250 точная 250 — нижняя 250 наибольшая 250 точная 250 Группа 384 Движение жесткое 424 Двойственность утверждений 45, 119 Делимость полиномов 183 Делитель 147 — общий наибольший 149, 231 Диаграмма Аргана 342 — Венна 37 Дискриминант полинома 366 Дистрибутивность 45, 91, 118, 138
Доказательство от противного 23 — по индукции 79, 153 Дополнение множества 38, 415 Дробь непрерывная 281 Единица 118 — мнимая 330- Единственность разложения на простые множители 153, 233 Зависимость алгебраическая 396 — линейная 390 Задача Диофанта 168 Задачи на построение классические 404 Заключение 22 Закон сокращения 90, 93 — трихотомии 90, 95 Законы Де Моргана 46 Идеал 167, 410 Измерение длин 200, 242 Изоморфизм 68, 162 — непрерывно упорядоченных полей 257 — полей частных 213 — простых трансцендентных расширений 176 — систем Пеано 84 — упорядоченных областей целостности 134 — А-кратных трансцендентных расширений 187 Импликация 22 Инверсия отношения 53 — функции 65 Индивидуал 412 Индукция 79 — возвратная 153 Интеграл 422 Интервал 47 — замкнутый 262 Интуиционизм 20 Квадратура круга 409 Класс 25 — конгруентности 166 — сечения верхний 245 нижний 246 — эквивалентности 58 — mod m 166 — mod р(®3$2 Кольцо коммутативное с единицей 118 — целых чисел 136 Комбинация линейная 151, 390 Коммутативность 45, 89, 92, 106 Композиция отношений 56 — функций 66 Консеквент 22 Константа 15 Конструируемость 401, 408 Координаты 397 Корень квадратный 330, 332 главный 330, 332 — полинома 183 кратный 236 простой 236 — уравнения 3-й степени 370 4-й степени 373 — функции 182 Корень и-й степени 296, 343 главный 343 Косинус 333, 341,422 Коэффициент полинома старший 182 Коэффициенты полинома 182 — полиномиальной функции 173 — системы линейных уравнений 218 Кратное 120 Круг единичный 335, 422 — сходимости 356 Логика 15 — символическая (формальная — математическая) 15 Максимум абсолютный 20, 292 Матрица 220 Метаматематика 421 Метод Кантора 312,317 — Лиувклля 319, 320 — Ньютона 298 Метрика 265 Минимум абсолютный 292
Многоугольник правильный 406 Множества попарно непересекающиеся 41 Множество 25, 412 — бесконечное 27, 70 — вполне упорядоченное 97 — всех подмножеств 31, 36, 313, 414 — замкнутое относительно операции 63 — канторово совершенное 324 — конечное 27, 70, 104 — линейно упорядоченное 95 — непрерывно упорядоченное 245, 253 — несчетное 315 — ограниченное 250 сверху 249 снизу 250 — плотно упорядоченное 205 — пустое 33 — счетное 315 Модуль 126, 334, 352 Мощность множества 70 Независимость линейная 390 Непересекающиеся множества 70 Неравенство треугольника 126, 334 Несоизмеримость 23 Нуль функции 182, 290 Область значений 52 — определения 52 — целостности 122 конечная 206 упорядоченная 124 характеристики п 171 Образ гомоморфный 162 — изоморфный 162 Объединение множеств 38, 46, 414 Окружность 397 Операция 62 — бинарная 63 — возведения в степень 93 — вычитания 118 — над отношениями 55 — рекурсивно определенная 88 — сложения 88 — умножения 91 — унарная 63 Определение примитивно рекурсивное 88 — рекурсивное 88 —Определитель 220 Остаток 145 Отношение 47, 51, 416 — антирефлексивное 56 — антисимметричное 56 Отношение бинарное 55 — делимости 147, 183, 199, 226 — конгруентности 64 в поле 207 целых числах 161 modwi 166 — линейной упорядоченности 95 — рефлексивное 56 — симметричное 56 — тернарное 55 — тождества 56 — транзитивное 56 — эквивалентности 57 — и-арное 55 Отображение гомоморфное 162 — изоморфное 162 Пара упорядоченная 49, 414 Парадокс Рассела 34,412 Параметр 18 Переменная 15 — свободная 25 — связанная 25 Пересечение множеств 38, 46, 417 Перестановка 139 Плоскость 341 — Гаусса 341 — Декарта 397 — Евклида 397 Площадь 336, 422 Поверхность Римана 62 Подмножество 31 Подобласть 122
— упорядоченная 124 Подполе 202 — упорядоченное 202 Подпоследовательность 262, 347 Подсистема 72 Позиционные обозначения 156, 277 Поле 202 — алгебраически замкнутое 361 полное 355 — алгебраических чисел 377 — комплексных чисел 330 — конечное 206 — корневое 377,386 —, порожденное коэффициентами 377 —, — множеством 377 — рациональных форм 215 чисел 214 — упорядоченное 202 — частных 214 Полином 172, 225 — линейный 190 — неприводимый 228 — нормированный 182 —, нули 182 — однородный 190 — от нескольких переменных 187 — постоянный 183 — простой 228 — симметрический 191 элементарный 192 Полиномы взаимно простые 233 Полнота алгебраическая 355 — топологическая 265 Порождение подпол ей- 377 Порядок корня 236 Последовательность бесконечная 104, 137 — конечная 104, 137 — Коши 261 — ограниченная 262, 347 — приведенная 301 — псевдобесконечная 174 Последовательность пустая 137 — сходящаяся 259, 347 равномерно 310 — фундаментальная 261 — Штурма 301, 302, 358 Построение с помощью циркуля и линейки 399 Постулат 14 Посылка 22 Правило знаков 120 — параллелограмма 334 Предел последовательности 259, 347 верхний 275 нижний 275 Предложение 15 —Предположение 22 Принцип абстракции 415 Присоединение корней 385 Проблема Гольдбаха 55 Прогрессия геометрическая 141 Произведение декартово 50, 415 Производная полинома формальная 184 — функции 422 Пространство векторное 390 конечномерное 390 — евклидово 350 Прямая 397 —Равенство истинное 164 — множеств 31 Равночисленность множеств 70 Радиан 265 Радиус сходимости ряда 285 Разбиение 58 Разложение биномиальное 141, 309 — в непрерывную дробь 281 — двоичное 279 — десятичное 277 — на простые множители целого числа 153 полинома 359 — периодическое 281 — Тейлора 285 Размерность 392 Разрешимость в радикалах 369, 408
Распределение простых чисел 410 Расстояние 265, 397 Рассуждение логическое 14 Расширение области целостности кратное 187 простое 174 трансцендентное 174 — поля алгебраическое 377, 388 конечное 393 кратное трансцендентное 187 линейно порожденное 390 простое 379 алгебраическое 380 трансцендентное 174, 312, 374, 380 — системы 72 Результант 375 Рекурсия примитивная 88 Рефлексивность 32, S6, 95 Решение задачи Диофанта 169 примитивное 169 — системы линейных уравнений 218 Ряд 276 — бесконечный 276 — расходящийся 276 — степенной 283 — сходящийся 276 Свободная переменная 25 Свойство Архимеда 254 Связанная переменная 25 Связка логическая 21 Связность 95 Сегмент 85 Сектор 336 Сечение 85 — Дедекинда 246 Симметрия 32, 46 Синус 333, 422 Система 68 — алгебраическая 68 — алгебраически полная 355 — вполне упорядоченная 97, 136, 153 — линейно упорядоченная 95 — линейных уравнений 217 — математическая 68 — непрерывно упорядоченная 245, 253 — образующих 390 — Пеано78, 417 Системы однотипные 68 Сложение 88 Совокупность 25 Соответствие 66 Степень полинома 182 — полиномиальной функции 173 Суждение декларативное 15 — утвердительное 15 Сумма множеств 38, 45, 46, 414 — ряда частичная 276 Теорема алгебры основная 354, 423 — анализа фундаментальная 423 — Больцано — Вейерштрасса 264, 347 — Вейерштрасса о нулях 290 — Лиувилля 321 — Муавра 342 — Пифагора 169, 239, 346 — Ролля288, 311 — существования непрерывно упорядоченных полей 268 систем 246 полей частных 207 упорядоченных областей целостности 128 — Ферма 33, 410 — Эйзенштейна 409 Теория алгоритмов 307 — множеств аксиоматическая 35,412 — рекурсивных функций 307 — чисел алгебраическая 410 аналитическая 410 — Штурма 302 Тождество 31, 56 — неразличимых 32 Топология общая 350 Точка 397 Транзитивность 32, 56, 95 Транспозиция 144
Треугольник Паскаля 142 Трисекция угла 404 Угол 333, 337, 422 Удвоение куба 404 Умножение 91 Упорядочение архимедово 254 — линейное (= простое = тотальное) 95 — непрерывное 245, 253 — плотное 205 Упорядоченная область целостности 124 — пара 49 — тройка 54 — четверка 55 — и-ка 55 Упорядоченность полная 97 Уравнение алгебраическое 216 — квадратное 296. 332 — кубическое 370 — полиномиальное 223 Уравнение степени выше четвертой 374 — четвертой степени 373 Условие 15 — замены 391 — необходимое и достаточное 23 — с несколькими свободными переменными 26, 47 — с одной свободной переменной 26 Утверждение математическое 15 — метаматематическое 44 Форма линейная 390 — полиномиальная 173 — рациональная 215 — тригонометрическая 341 Формула Эйлера 406 Функция 59 — аналитическая 356 — бинарная 63 — взаимно однозначная 66 — голоморфная 356 — многозначная 62 — непрерывная 289, 351 — неявная 60 — обратная 65 — однозначная 62 — одно-однозначная 66 — показательная 285, 346 — полиномиальная 173, 182 — постоянная 183, 357 — следования 77 — степенная 93, 120 — тригонометрическая 337, 422 , аналитическое определение 422 — целая 356 — частичная подходящая 86 — Эйлера 406 — экспоненциальная 285, 346 Цикл 144 Частное 145, 203 Числа взаимно простые 152 Числа положительные целые 11, 78, 85, 100 Число 11 — алгебраически зависимое 396 целое 375 — алгебраическое 312, 361 — действительное 239, 275 — иррациональное 11, 224 — кардинальное 71 — комплексное 11, 326, 330 , аргумент 336 , геометрическое представление 333 , модуль 334 , тригонометрическая форма 341 — комплексно сопряженное 331 — конструируемое 401 — Лиувилля 323 — мнимое 11, 330 — нечетное 96, 147 — перемен знака 301 — простое 18, 148 — рациональное 11, 214 трансцендентное 312 — Ферма 407
простое 407 — непосредственно — целое 11, 136 предшествующий 99 алгебраическое 375 следующий 99 положительное 85 — обратный по сложению 119 — четное 96, 147 умножению 203 Член множества 27 — первый 97 Эквивалентность логическая 23 — последний 97 — теоретико-множественная 70, 313 Эффективная вычислительная Экспонента 309 процедура 307 Элемент 27
ПРЕДИСЛОВИЕ РЕДАКТОРА Основные числовые системы — арифметика натуральных чисел, кольцо целых рациональных чисел, кольцо полиномов, поле рацио- рациональных чисел, поле вещественных чисел, поле комплексных чисел и др.— изучаются математиками с древних времен. Многие понятия и идеи, возникшие при изучении этих систем, породили новые направления в науке и сыграли важную роль в развитии математики и ее приложений. Теория числовых систем поэтому лежит в основе всех математических курсов, читаемых сейчас в высших учебных заведениях, и входит в программу курсов алгебры, математиче- математического анализа, вычислительной математики. Каждый лектор при этом выбирает из обширного материала то, что ему кажется наибо- наиболее важным, излагает его со своей точки зрения, иллюстрируя на классическом материале нужные ему идеи и конструкции. Есте- Естественно, что никакой цельной картины при этом, как правило, не возникает. И в литературе на русском языке нет полного изложения всей единой теории, созданной трудами многих поколений мате- математиков, которое учитывало бы интересы широкого круга читате- читателей. Этот пробел частично будет восполнен предлагаемым переводом книги Фефермана «Числовые системы». О содержании книги вполне можно судить по подробному оглав- оглавлению. Вначале автор излагает элементы математической логики, наивной теории множеств вплоть до возникновения парадоксов. Затем выбирается некоторая система аксиом теории множеств (она приводится полностью в добавлении I), лежащая в основе всего дальнейшего изложения. Аксиоматическое изложение обычно пере- перегружается формальными выкладками, затрудняющими чтение. Автор, на мой взгляд, удачно избегает этого, вместе с тем сохраняя достаточную строгость, и всюду заботится о логической обоснован- обоснованности каждого нового шага, каждого введения нового понятия, стараясь заблаговременно подготовить читателя к этому. Автор также показывает важность полученных результатов, мотивирует
8 ПРЕДИСЛОВИЕ РЕДАКТОРА необходимость изучения возникающих вопросов и, наконец, не только знакомит читателя с некоторым кругом идей и методов, но и старается развивать у него определенные навыки творческого мышления, навыки в решении задач. Перечисленные методические достоинства наряду с несомнен- несомненными научными позволяют рекомендовать книгу в качестве учебного пособия для физико-математических школ, для студентов младших курсов педагогических вузов и университетов. Без сомнения, она должна заинтересовать также учителей математики школ и препо- преподавателей математики высших учебных заведений. Перевод книги предпринят по инициативе академика А. И. Маль- Мальцева, считавшего, что книга Фефермана может служить учебным пособием по курсу элементарной математики в педагогических институтах. Безвременная кончина прервала работу Анатолия Ива- Ивановича над редактированием перевода. А. Д. Тайманов
ПРЕДИСЛОВИЕ Цель этой книги состоит в последовательном построении и раз- развитии основных числовых систем математики, именно положитель- положительных целых чисел, целых чисел, рациональных чисел, действитель- действительных чисел и комплексных чисел. По мнению многих математиков, эта область науки должна быть изучена каждым серьезным студен- студентом-математиком. И лучше всего, если он сделает это как можно быстрее после первого года занятий математическим анализом — или перед, или во время изучения более тонких областей анализа и алгебры. Несмотря на важность указанной области в математическом образовании, в большинстве американских университетов, по-види- по-видимому, отсутствуют специальные пособия для ее изучения. Иногда сжатый обзор материала дается в промежуточных (начальных) курсах алгебры или анализа. Иногда же в этих курсах рассматри- рассматривают действительные числа как заданные аксиоматически вместо того, чтобы выводить их свойства из более фундаментальных поня- понятий и результатов. Мы полагаем, что эта ситуация возникла по нескольким причи- причинам. Прежде всего классические изложения материала находятся ныне в своеобразной изоляции от остальной математики. Кажется, что используемые идеи и методы годны «лишь для данного случая» и лишены взаимосвязанности, присущей остальным важным мате- математическим понятиям. Во-вторых, скорость, с которой теперь растет познание, повелительно диктует студенту-математику спешить овладеть мастерством в главнейших областях его будущей специаль- специальности. Наконец, «абстрактный» дух современной математики вызы- вызывает растущее стремление излагать все ее части аксиоматически. Как результат этих обстоятельств в образовании студента часто возникает разрыв между «конкретной» вычислительной работой в дифференциальном и интегральном исчислениях и работой повы- повышенного типа. Несомненно, что современные абстрактный анализ.
10 ПРЕДИСЛОВИЕ и алгебра были развиты как средства овладения (и последующего выхода за его пределы) кругом частных понятий и результатов, относившихся к классическим числовым системам, разработанным еще до начала нашего столетия. Однако твердое владение главней- главнейшими частными случаями — наилучшая основа для правильной оценки более новых разработок. Нам кажется поэтому, что материал данной книги является наиболее подходящим для указанного переходного периода в мате- математическом образовании студента. Мы пытались дать здесь изложе- изложение, которое было бы, с одной стороны, вполне современным, пол- полным и строгим, а с другой стороны, отвечающим состоянию знаний студента и нуждам современной математики. Мы думаем, что такой подход делает возможным приспособление текста к различным учебным ситуациям. Он может быть использо- использован для полусеместрового или полугодового специального курса, не предполагающего у слушателей каких-либо специальных пред- предварительных познаний. Он может быть использован и в обычном начальном курсе алгебры или анализа. При этом в соответствии с назначением такого курса или со вкусами лектора некоторые части текста книги могут быть упомянуты лишь мимоходом или вовсе опущены. Книгу можно также использовать в качестве основ- основного пособия при чтении упомянутых курсов, или же студент может изучать ее самостоятельно. Именно помня о последней возможно- возможности, мы предпочли сделать книгу независимой и заботились более о ясности и полноте, чем о краткости изложения. С. Феферман Стенфорд, Калифорния Октябрь 1963 г.
ГЛАВА 1 ЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ 1.1. Введение Основными числовыми системами математики являются сле- следующие: A) совокупность Р положительных целых чисел 1, 2, 3, . . .; B) совокупность I целых чисел . . ., —3, —2, —1, 0, 1,2, 3, . . .; C) совокупность Ra рациональных чисел, состоящая из всех дробей вида alb, где а, Ь — целые числа и Ъф 0 (например, 2/3, —8/7, 21—4); D) совокупность Re действительных (или вещественных) чисел, состоящая из рациональных чисел и иррациональных чисел (таких, как V2, — у^Ъ, /З/я", elV%\ E) совокупность С комплексных чисел, состоящая из действитель- действительных чисел, мнимых чисел и их комбинаций (таких, как ]/=!, 5/6 - Уз l/=i, Yn + 2 ^=1). Исторически понимание и использование этих числовых систем развивались в течение нескольких тысячелетий, более или менее в указанном выше порядке. Имеются убедительные причины того, что комплексные числа стали в каком-то смысле завершением этого развития. В настоящей книге мы дадим систематическое описание упомянутого развития. Одновременно мы надеемся убедить читате- читателя в том, что в этом развитии не было ничего случайного. Един- Единственной случайностью в этом вопросе может быть лишь использо- использование некоторых слов таких, как «рациональный», «иррациональ- «иррациональный», «действительный», «мнимый», «комплексный» (эти слова показы- показывают то начальное сопротивление, которое встречало введение новых чисел на каждой стадии развития числовых систем). Сила привыч- привычки, выработавшаяся в результате долгого использования этих слов, удерживает нас от замены их более подходящими. В средней школе студент уже научился немного понимать при- природу разного рода чисел и производить над ними различные ариф- арифметические действия. Однако в ряде случаев его идеи о таких чис- числах могут оказаться не очень ясными. Откуда мы знаем, что число
12 ГЛ, 1. ЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ V2 не рационально? Что мы имеем в виду, когда говорим, что чис- число л. приблизительно равно 22/7 и что более точное его приближен- приближенное значение равно 3,1416, а еще более точное 3,14159? Мы привыкли думать о вещественных числах как о числах, измеряющих длины, а об их произведениях, например л-]^2,— как о числах, измеряю- измеряющих площадь прямоугольника, в данном случае со сторонами л; и ]/2. На каком основании в качестве меры площади мы снова берем вещественное число, т. е. длину делаем в каком-то смысле эквивалентной площади? Теперь студент в своем образовании достиг ступени, на которой он может ожидать получить и быть способным усвоить ясные (хотя и не всегда простые) ответы на подобные вопросы. Конечно, можно пойти весьма далеко и на основе некритиче- некритического использования различных числовых систем. Более того, основная часть дифференциального и интегрального исчислений, какими мы их знаем сегодня, так же как и те физические теории, которые выражаются в их терминах, были развиты именно этим путем. Например, в анализе нам предлагают производить вычисле- вычисления бесконечной длины такие, как , _±j_± Lj 3 ' 9 27 ' " ' " В этом частном случае на основе формулы A + г) A - г + г2 - г3 + ...) = 1 (которая легко проверяется путем «раскрытия скобок») мы быстро приходим к выводу, что результатом вычислений должно быть число 1/A + V3) = 3/4. Однако, стоя на некритической точке зре- зрения, мы должны как-то избежать вопроса, чему равна сумма ряда 1 —1 + 1 — 1 + .... так как если мы применим упомянутую формулу, то получим ответ 1/A -f- 1) = V2, но столь же «очевидно», что ответ должен быть A - 1) + A — 1) + . . . = 0 + 0 + . . . = О, а также 1 + (—1 + 1) + (—1 + 1) + . . . = 1 + 0 + 0 + . . . = 1. Дело не в том, что некритический подход дает ложные результаты, а скорее в том, что на ряд существенных вопросов он вообще не дает вразумительных ответов. При изучении рядов Фурье (имеющих много применений в тех- технике и физике) во второй половине девятнадцатого столетия возник
1.1. ВВЕДЕНИЕ 13 ряд вопросов, которые нельзя было обойти и правильный ответ на которые не мог быть получен на основе некритического использования числовых систем. Отзываясь на это, большое число работающих в области математики и логики начали разработку программ для критического рассмотрения и разъяснения соответ- соответствующих понятий. Результат их работы постепенно оформился в последовательную теорию, с помощью которой, к удовольствию большинства математиков, могли быть решены вызывавшие беспо- беспокойство вопросы. В настоящее время понимание указанной теории служит предварительным условием для занятий современной мате- математикой. В этой книге мы ограничимся только той частью упомянутой теории, которая имеет дело преимущественно с числовыми система- системами самими по себе, и будем рассматривать лишь математические вопросы, наиболее непосредственно связанные с числовыми систе- системами. Самыми близкими из них являются, во-первых (в области алгебры), определение степеней чисел и различного рода вопросы о решении алгебраических уравнений и, во-вторых (в области анализа), развитие понятия предела и его основных свойств. {По ряду причин в этой книге алгебраическим вопросам уделено несколько большее внимание.) Хотя наша книга носит подзаголовок «Основания алгебры и анализа», это не должно наводить на мысль, что предмет книги можно вполне осмысленно разделить на две части, первая из которых целиком посвящена изучению числовых систем, а вторая — применениям результатов этого изучения к критиче- критическому пересмотру содержания математики. Уже сами результаты алгебры и анализа и предполагаемая их известность на неформаль- неформальном уровне требовали определенной формы изложения. Пренебречь этим было бы невыгодно для нашего критического рассмотрения. Поэтому мы всюду пытались сохранить преимущества как строгости, так и интуиции, соединяя точность изложения с мотивировками и подходящими приложениями. Математический метод. Объекты, с которыми имеет дело мате- математика, например числа и геометрические фигуры, по своей природе абстрактны, и число их в каждом конкретном исследовании обычно бесконечно. Хотя наши идеи об этих объектах находятся в тесном родстве с нашими восприятиями различных группировок материаль- материальных предметов, весьма редко случается, чтобы мы могли решить математический вопрос путем непосредственного обращения к реаль- реальному миру. Например, эксперименты с карандашом, бумагой, линейкой и циркулем могут привести нас к заключению, что все медианы произвольного треугольника пересекаются в одной точке, но никакое количество экспериментов не помогло бы нам проверить истинность этого утверждения для бесконечного числа возможных треугольников. Специфически математический метод для решения подобных вопросов состоит в следующем. Некоторые утверждения,
14 ГЛ. 1. ЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ касающиеся рассматриваемых объектов, признаются очевидными и как бы составляющими часть нашего представления об объектах. Эти утверждения принято называть аксиомами или постулатами. Как только основные понятия и аксиомы установлены, все дальней- дальнейшее в математике получается посредством логических рассуждений, в которых все новые понятия, если они появляются, определяются через предыдущие. Вполне мыслимо, что кто-нибудь не захочет принять ту или иную систему аксиом. Он может это сделать либо потому, что он не в состоянии представить себе никаких объектов, к которым аксиомы могли бы быть правильно применены, либо вследствие того, что предложенные аксиомы не выражают правиль- правильно свойств тех понятий, к которым, по его мнению, аксиомы должны применяться. Не существует логических способов заставить такого человека изменить свое мнение. Для этого человека математика (по меньшей мере та ее часть, которая развивается из данной част- частной системы аксиом) представляется бессодержательной игрой, хотя эта игра может ему и нравиться. Тем не менее истинная цен- ценность и мощь математического метода состоят в том, что тем, кто рассматривает аксиомы как выражения простых и основных за- законов, управляющих известными объектами, математический метод позволяет надежно и неопровержимо получать более сложные и часто неожиданные истинные утверждения об этих объектах. Читатель, без сомнения, знаком с указанным описанием ма- математической деятельности — «аксиомы — определения — теоре- теоремы»— из курса планиметрии. Он может даже прийти к заключению, что такой подход к математике бессодержателен и бесплоден. И на самом деле, читатель гораздо больше склонен убеждаться в истин- истинности какого-нибудь утверждения геометрии или анализа посред- посредством нескольких чертежей с «типичными» случаями или ряда мани- манипуляций с бесконечными рядами, выглядящих как будто правильно, чем посредством тщательных логических рассуждений. Однако такой подход чрезвычайно ограничен. Он способен дать лишь поверхностные оценку и понимание математики. Поэтому в нашем изложении точность определений, строгость и полнота доказательств будут находиться на первом плане. Это не значит, что интуиция должна быть оставлена. Напротив, в противоположность механиче- механическому экспериментированию нахождение точных доказательств часто требует сочетания высокого остроумия с полным интуитив- интуитивным пониманием дела. Читатель должен выработать в себе такое понимание как изучая доказательства, изложенные в книге, так и придумывая свои собственные доказательства. С целью иллюстрации некоторых основных «предчисловых» понятий в данной и в следующей главах будет предполагаться неко- некоторое знакомство с числовыми системами. Однако за этими преде- пределами мы будем строго следовать очерченному выше пути, опираясь лишь на ряд простейших допущений о числах.
1.2. ЛОГИКА 15 1.2. Логика Дать точное и полное описание понятия логического вывода вполне возможно. Это было сделано в последние 50 лет в рамках той области математики, которая носит название символической или формальной (а также математической) логики. Мы не предпола- предполагаем, что читатель знаком с символической логикой, и даже не будем пытаться описать ее здесь, так как логическое мышление в математике может быть изучено только посредством наблюдения и опыта. (В действительности способность правильно рассуждать и понимать правильные рассуждения является необходимой пред- предпосылкой для изучения формальной логики.) Тем не менее в нашем изучении числовых систем будут встречаться логические вопросы, которых стоит коснуться неформально, прежде чем мы перейдем к основной теме *). Математические утверждения и их строение. В математике мы имеем дело только с утвердительными (или декларативными) суждениями (называемыми также предложениями), которые могут быть либо истинными, либо ложными. Поэтому такие утверждения, как «гипотеза Гольдбаха, вероятно, истинна», или такие вопросы, как «каждая ли карта может быть раскрашена четырьмя красками?», не являются частью самой математики, хотя они и играют большую роль при ее создании **). Когда мы ниже пользуемся словом «утверждение», мы имеем в виду лишь утвердительные суждения. Переход от арифметики к высшим разделам математики соот- соответствует переходу от частных утверждений таких, как 12 + 7 = = 19, 12-7 = 86 (первое истинно, второе ложно), к утверждениям, включающим в себя ссылки на произвольные объекты известного рода. Наиболее экономные способы формулировки таких утвержде- утверждений состоят в использовании переменных, т. е. известных букв, например а, Ь, х, у, z, m, n и т. д., посредством которых в заданном утверждении можно обозначать любой или некоторый из указанных объектов. Другие символы такие, как 12, е, л, У 2 и т. д., предназна- предназначенные для упоминания известных фиксированных объектов, назы- называются обычно константами. Выражение A.2.1) х + у = 0, содержащее переменные х, у, не считается утверждением, так как оно ни истинно, ни ложно. Оно называется условием (на хну). Однако его можно использовать, чтобы образовать утверждение, *) Читателю, желающему ближе познакомиться с математической логикой, мы можем рекомендовать книги, перечисленные в библиографии. **) На самом деле утверждения и вопросы такого рода являются частью математики, но могут быть опущены при формальном изложении.— Прим. ред.
J6 ГЛ. 1. ЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ и притом разными способами. Один способ — подставить вместо переменных константы, например 3 вместо х и —2 вместо у, что приведет нас к частному утверждению <1.2.2) 3 + (-2) = О, разумеется, ложному. Другой способ — использовать слова «все» {каждый, произвольный, любой) и «некоторый» (существует, имеет- имеется). Ниже указаны некоторые утверждения, которые получаются с помощью упомянутых слов из условия A.2.1): A.2.3) для всех целых х, у, х + у = 0; ¦A-2.4) для некоторых целых х, у, х + у = 0; A.2.5) для любого целого х имеется такое целое у, что х-\~у = 0; A.2.6) для любого положительного целого х существует такое положительное целое у, что х + у = 0. Ясно, что утверждение A.2.3) ложно, а A.2.4) истинно (в частно- частности, 0 + 0 = 0). Утверждение A.2.5) истинно, так как для произ- произвольного целого х число —х является тем значением для у, которое удовлетворяет условию. Наконец, утверждение A.2.6), очевидно, ложно. Рассмотрим теперь условие A.2.7) х + у = Ъ и утверждения A.2.8) для каждого целого х существует такое целое у, что х + у = 5; A.2.9) для каждого положительного целого х существует такое положительное целое у, что х + у = 5. Утверждение A.2.8) истинно, так как для любого целого х целое число 5 — х является тем значением для у, при котором усло- условие A.2.7) истинно. По поводу A.2.9) заметим, что положительные целые х, удовлетворяющие условию A.2.10) существует такое положительное целое у, что дг-f У "¦ 5, имеются, именно 1, 2, 3 и 4; однако A.2.9) ложно, так как усло- условие A.2.10) истинно не для всех положительных целых х, в частно- частности, оно не истинно для числа 5. Отсюда видно, что переменные в математических утверждениях играют, грубо говоря, ту же роль, что местоимения «этот», «тот» в обычной речи. Если бы мы не использовали таких средств, как переменные, то даже простейшие математические утверждения вроде A.2.11) для всех целых х и у, х2 — у2 = (х — у) (х + у)
1 2. ЛОГИКА 17 потребовали бы излишне сложных формулировок, например, ана- аналогичных следующей: A.2.12) для любых двух целых чисел (не обязательно различных) результат возведения в квадрат первого и вычитания квадрата второго равен результату перемножения двух сомножителей, из которых первый есть результат вы- вычитания из первого заданного числа второго, а второй сомножитель есть результат сложения обоих заданных чисел. По-видимому, математика без употребления переменных вряд ли вышла бы сколько-нибудь далеко за пределы арифметики и, во всяком случае, овладеть ею было бы много труднее. Использование букв в качестве переменных, конечно, не существенно. С тем же успехом можно использовать любые другие простые символы и, например, A.2.11) можно переписать в виде A.2.13) для всех целых ~ и \ ("J — СJ = (" — ") (" + "). Один предупреждающий сигнал должен прозвучать по пободу употребления во многих математических текстах слов «переменная» и «константа» (постоянная). Например, иногда может встретиться фраза A.2.14) рассмотрим полином ах2 -f Ьх + с, где а, Ь, с — неко- некоторые постоянные. В действительности, в A.2.14) все буквы а, Ь, с и х являются пере- переменными в нашем смысле. Фраза же A.2.14) означает, что в после- последующем за ней рассуждении хотят получить некоторые сведения о поседении величины ах2 + Ьх + с при произвольных заданных а, Ь, с и меняющемся х. В аналогичных случаях, вероятно, лучше говорить об а, Ь, с как о параметрах, что часто и делается. Второе наше замечание по поводу математических выражений, казалось бы, противоречащее сказанному выше, касается обычая говорить об условиях вида A.2.15) х + у = у + х как об истинных утверждениях. Этим хотят выразить, что условие истинно для всех значений переменных. Из контекста при этом необходимо выяснить, о каких именно объектах идет речь. Напри- Например, в указанном частном случае они могут быть вещественными числами. Тогда в полной форме утверждение было бы A.2.16) для любых вещественных чисел х, у, х + у = у + х. Аналогично, следующее «утверждение» A.2.17) если^ \ < —2, то 4 < л2
18 ГЛ. 1. ЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ могло бы (при рассмотрении вещественных чисел) иметь такой перевод: A.2.18) для любого вещественного числа х, если х < —2, то 4 < г\ В отдельных случаях, если это не приведет к неясностям, мы можем следовать и практике, указанной в A.2.15) и A.2.17). Существование. С рассматривавшимся типом утверждений свя- связан очень важный вопрос о том, какой смысл имеет в математике существование. Еще в начальных курсах математики студент привык иметь дело с задачами, имеющими определенное решение. Каждый раз он ожидает явно найти решение или же найти формулу или правило, при помощи которых можно найти решение в каждом частном случае. Типичный пример: формула для решения квадрат- квадратного уравнения ах2 + Ъх + с = 0. Рассмотрим теперь следующее положение. При изучении вопросов делимости целых чисел, напри- например при нахождении наибольшего общего делителя или наимень- наименьшего общего кратного, важную роль играют простые числа. Это— положительные целые числа, отличные от 1 и не имеющие других положительных целых делителей, кроме 1 и самих себя. Вот несколь- несколько первых простых чисел: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, ... Может быть доказано, что A.2.19) существует бесконечно много простых чисел. Это вытекает из следующего утверждения: A.2.20) для каждого простого числа х существует простое чис- число у такое, что х < у. Однако не известно никакой простой формулы, которая бы позволя- позволяла с каждым простым числом х связать следующее большее простое число. С другой стороны, известен несложный (хотя и громоздкий) метод для вычисления этого числа. Например, если нам дано, что число 89 простое, то нам нужно только последовательно вычислять все простые делители чисел 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, . . . Выполняя эту работу, мы, согласно A.2.20), должны натол- натолкнуться на простое число. В заданном случае оно равно 97. Итак, даже в случае, когда мы в состоянии доказать существование реше- решения, мы должны иногда удовлетвориться лишь указанием систе- систематического метода для вычисления решения, не будучи в силах найти формулу, которая бы «выражала» это решение. В качестве второго примера рассмотрим следующее утвержде- утверждение, которое также может быть доказано: A.2.21) существует вещественное число х такое, что ...... J?.-zJ# + 2 = 0.
1.2. ЛОГИКА 19 Интуитивные доводы в пользу истинности A.2.21) очень простые. Полином хъ — 7х2 -\- 2 имеет значение 2 при х = 0 и значение —4 при х = 1. Так как значения этого полинома меняются непрерывно между 2 и —4, когда х меняется от 0 до 1, то должно существовать х между 0 и 1, для которого значение полинома равно 0. (Это не есть точное доказательство. Точные доказательства для утверждений такого рода мы сможем дать в глаЕе 7.) Здесь снова нет никакой известной формулы, которая бы точно выражала решение указан- указанного уравнения (и в некотором смысле, точно разъясняемом в кур- курсах высшей алгебры, вероятно, нет надежды найти такую формулу; более подробно этот вопрос будет рассматриваться в главах 8 и 9). Более того, никакое конечное вычисление заранее указанной длины не может окончиться «выдачей» нам индивидуального вещественного числа, удовлетворяющего A.2.21). Тем не менее следующая беско- бесконечная последовательность вычислений позволяет подходить к реше- решению все ближе и ближе, хотя она и не кончается через конечное число шагов точным решением. Сначала находим значения полино- полинома х& — 7ха + 2 в точках 0,0; 0,1; 0,2; . . .; 0,9; 1,0. Возможно, что одно из этих рациональных чисел окажется корнем и на этом наши вычисления кончаются. Если нет, то найдутся две последовательных точки, в одной из которых значение полинома положительно, а в другой отрицательно. В нашем случае, например, @,5M—7-@,5J-|- +2>0и @,бN —7.@,бJ +2<0. Поэтому между 0,5 и 0,6 заведомо лежит корень полинома. После этого вычисляем значение полинома в точках 0,50; 0,51; 0,52; . . .; 0,59; 0,60, попутно узнавая, будет ли оно равно нулю, положительно или отрицательно. Продолжая идти указанным путем, можно найти сколько угодно последователь- последовательных знаков десятичного разложения корня. Ясно, что необходи- необходимость выполнения потенциально бесконечной последовательности вычислений менее удовлетворительна, чем возможность получить решение конечным числом шагов. Однако если других есзмсжнсс- тей нет, то приходится удовлетвориться и потенциально бесконеч- бесконечной последовательностью вычислений. Для последнего примера, относящегося к смыслу понятия суще- существования, мы возьмем один Еопрос из анализа. В ряде задач бывает важно найти относительный или абсолютный максимум значений какой-то функции. Простые примеры показывают, что функция / (х) может быть определена для каждого значения х, удовлетворяю- удовлетворяющего условию а -^ х -^ Ь, и тем не менее она может не иметь абсо- абсолютного максимума на этом отрезке. Однако может быть доказана следующая теорема (мы получим ее в главе 7): A.2.22) если a, b — вещественные числа, а < b и f (x) — функция, непрерывная для всех х, удовлетворяющих условию а <; -^ х ^ Ь, то существует вещественное число с, а ^ с <^ Ъ, для которого f (с) является абсолютным максимумом.
20 ГЛ. 1, ЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ Из анализа доказательства этой теоремы невозможно извлечь никакой эффективной процедуры для вычисления, например, деся- десятичного разложения числа с. На самом деле, известны непрерывные функции, для которых существует систематическая процедура, позволяющая вычислять десятичное разложение / (х), как только известна процедура вычисления десятичных знаков х, и в то же время для этих функций нет никакой систематической процедуры для вычисления десятичного разложения точки абсолютного мак- максимума *). Читатель с удивлением может спросить, какое же значение или даже смысл имеют утверждения типа A.2.22), если мы не можем быть уверены, что в любом заданном конкретном случае мы сумеем вычислить решение. В этом он может найти поддержку у небольшой, но отважной группы логиков и математиков, известных под именем конструктивистов и интуиционистов. Обычные же взгляды боль- большинства математиков на указанный вопрос могут быть суммированы следующим образом: (а) нет никаких оснований для оптимистической веры, что люди могут решить все проблемы, которые они ставят перед собой; тем не менее имеет смысл ставить такие проблемы; (б) утверждение существования гарантирует нам некоторый минимум информации, отправляясь от которого, мы можем попы- попытаться получить большую информацию в более частных случаях (например, в случае утверждения A.2.22) можно изучать вопрос при некоторых дополнительных условиях, наложенных на функцию, типа дифференцируемости, которые могли бы гарантировать вычис- вычислимость точек максимума); (в) на указанном пути мы могли бы прийти к доказательствам корректности некоторых вычислительных процедур. В этих доказа- доказательствах может использоваться длинная цепочка «чистых» теорем существования, причем может не оказаться путей для исключения таких «невычислительных» утверждений из наших рассуждений. Подводя итог, мы видим, что каждое доказательство существо- существования приводит к одному из четырех случаев. Первый: из доказа- доказательства мы можем извлечь простую формулу для решения, подоб- подобную, например, формуле для решения квадратного уравнения. Второй: доказательство может давать нам конечную вычислитель- вычислительную процедуру (часто называемую алгоритмом), как в случае A.2.20). Третий: доказательство может привести нас к бесконечным вычислительным процедурам, как в случае A.2.21). Такое положе- положение обычно для задач, решениями которых служат вещественные или комплексные числа. Наконец, может случиться, что доказа- *) Точная формулировка этого утверждения и его доказательство осно- основываются на теории рекурсивных функций, развитой в последние годы.— Прим. перев.
1.2. ЛОГИКА 21 тельство существования не ведет ни к каким вычислительным про- процедурам и остается чистым доказательством существования, как в случае A.2.22). Читатель будет сталкиваться с этими различными случаями и в данной книге и в своей дальнейшей работе в области математики. Он должен иметь острый взгляд, способный быстро раз- различить вышеупомянутые случаи и тогда, когда они явно не указаны. Если у него возникнет беспокойство по поводу недостаточного вни- внимания, уделяемого вычислениям в дальнейших математических курсах, то он должен помнить, что это гораздо чаще вызывается необходимостью, чем пресыщенностью. Оставляя в стороне эти принципиальные соображения, заметим, что слово «существует» должно истолковываться, как «существует по меньшей мере одно». Так, в A.2.21) должен существовать еще корень в промежутке от 1 до 2 (вычислите значение полинома в точ- точке 2!). Аналогично, в A.2.22) может существовать много значений с, в которых данная функция достигает максимума. Чтобы сказать, что существует в точности один объект, удовлетворяющий задан- заданному условию, мы будем пользоваться словами «существует точно один» или «существует единственный». Например, истинно, что A.2.23) существует единственное вещественное число х, для которого х5 — 7х2 Ц- 2 = О и 0 < х < 1. Логические связки. Возвратимся снова к анализу логического строения математических утверждений. Помимо слов «все», «неко- «некоторый», существуют и другие слова, имеющие чисто логические функции, т. е. служащие для того, чтобы из заданных условий строить более сложные условия, истинность или ложность которых целиком определяется истинностью или ложностью исходных усло- условий. Примером служат слова «не», «и», «или». Однако смысл слова «или» в математике не всегда соответствует смыслу этого слова в обычной речи. По соглашению математиков слово «или» в мате- математике всегда употребляется в неисключающем смысле, т. е. полу- получающееся в результате утверждение истинно, когда истинна либо одна из двух его частей, либо истинны обе части. Так, утверждение A.2.24) для любого целого х, х ^ 2 или 2 ^ х считается истинным, хотя оно не считается таковым при исключаю- исключающем истолковании союза «или». Возможно, что в обычной речи мы не всегда уделяем достаточного внимания неисключающему зна- значению союза «или». Например, утверждая, что «мы должны иметь гораздо более мощные ракеты или мы не сможем доставить человека на Марс», необходимо помнить, что, и обладая гораздо более мощ- мощными ракетами, мы можем оказаться не в состоянии доставить чело- человека на Марс. Выражения «если..., то...» (часто заменяется словом «влечет») и «тогда и только тогда, когда» представляют собой логические
22 ГЛ. 1. ЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ связки, часто употребляющиеся в логике и математике и сравни- сравнительно редкие в обычной речи. Условие, образованное посредством первой связки, например, A.2.25) если х<—\, то 9 < х2, называется импликацией. Первая ее часть х < —1 называется пред- предположением (посылкой), или антецедентом, а вторая часть назы- называется заключением, или консеквентом. Обычное употребление импликаций несколько отличается от употребления их в математике. В обычной речи мы часто подразумеваем, что между посылкой и заключением импликации есть какая-то причинная связь или род- родство. Примером этого могут служить фразы: «Если вы съедите это зеленое яблоко, то вы заболеете» и «Если вы сделаете это снова, то вы будете наказаны». Представляется очень трудным придать этого вида связям точный смысл, особенно для математических утверждений. Простейший способ ввести единообразие в употреб- употребление импликаций — это потребовать, чтобы истинность или лож- ложность импликации зависела только от истинности или ложности ее посылки и заключения и не зависела от смысла этих компонент. Мы видим лишь один путь для доказательства ложности имплика- импликации, именно доказать, что ее посылка истинна, а заключение ложно. Во всех остальных (трех) случаях при таком понимании импликации она должна считаться истинной. Рассмотрим, например, следующие аналоги импликации A.2.25): A.2.25') (а) если — 4< — 1, то 9< (—4J; (б) если 4 < —1, то 9 < 42; (в) если 3< — 1, то 9 < З2; (г) если — 3 < — 1, то 9 < (—ЗJ. Среди этих четырех импликаций только у одной (г) посылка истин- истинна, а заключение ложно. Поэтому остальные три импликации истин- истинны. Это может выглядеть несколько необычным, особенно в слу- случаях (б) и (в), но лишь до тех пор, пока мы пытаемся думать о заклю- заключении как о «необходимо вытекающем» из посылки. Посылки в обеих случаях ложны, и в таких случаях об импликации иногда говорят как о тривиально (или пусто) истинной. Если читателем все еще владеют сомнения, то он должен вспомнить такие утверждения, как «если вы подпрыгнете на 3 метра, то я съем свою шляпу». Какой из импликаций A.2.25') (б), (в) аналогично это утверждение? Из всех четырех случаев A.2.25') только (г) показывает, что A.2.25) истинно не для всех целых х. Читатель может подумать, что обсуждать импликации, имеющие ложные посылки,— чисто академическое дело. Однако это не так. В математике встречается очень много рассуждений, заключающих в себе подобные положения. Достаточно вспомнить, какую большую
1.2. ЛОГИКА 23 роль играют в ней доказательства от противного (или путем при- приведения к абсурду). В доказательствах этого вида, чтобы показать, что некоторое утверждение Jb не истинно, поступают следующим образом. Мы представляем себе, что Jb истинно и затем стараемся вывести из него утверждение 38, ложность которого уже установле- установлена. Иными словами, мы стараемся доказать импликацию A.2.26) если Jb, то 38. Если удалось доказать истинность этой импликации, то из ложно- ложности 98 мы заключаем, что Jb не может быть истинно. Конечно, если бы мы наперед знали, что Л ложно, то не стали бы интересо- интересоваться импликацией A.2.26), так как она была бы тривиально истинной. Мы сейчас не будем давать примеров на доказательства от противного. Несколько таких доказательств будут даны позже, и мы их специально отметим. Существует еще одно значение, которое иногда придается импликациям в математике и которое находится в более тесном родстве с повседневным «необходимым следствием». Оно появляется тогда, когда мы говорим, что утверждение Jb влечет утверждение 38, понимая под этим, что 98 может быть логически выведено из Jk на основе принятых аксиом. С точки зрения формальной логики это может быть лишь в случае, когда из аксиом может быть выведено утверждение «если Л, то JF», так что и здесь может не оказаться никакой необходимой связи между Л и 98. Однако с неформаль- неформальной точки зрения мы обычно занимаемся лишь импликациями, посылки и заключения которых в какой-то степени родственны. Обратимся теперь к употреблению выражения «тогда и только тогда, когда-». Условие вида A.2.27) \х— 2|<3 тогда и только тогда, когда —1 < х и х < 5, называется эквивалентностью. Оно равносильно двум импликациям: A.2.27') (а) если — 1 < х и х < 5, то \ х — 2 |< 3; (б) если [ х — 2 | < 3, то —1 < х и х < 5; вторая из них отвечает словам «только тогда» в A.2.27). Мы также будем говорить, с тем же значением, что A.2.28) —1 < х и х < 5 есть необходимое и достаточное условие для | х — 2 |< 3. Здесь слово «достаточное» соответствует начальному слову «тогда» в A.2.27). Из условий истинности импликации вытекает, что экви- эквивалентность истинна, если обе ее части истинны [как в A.2.27) при х = 3] или обе части ложны [как в A.2.27) при х = 5]; в осталь- остальных случаях она ложна. Здесь снова никаких особых «необходимых»
24 ГЛ. 1. ЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ связей между обеими компонентами эквивалентности не требуется. Мы будем также говорить, что утверждения Л и 98 эквивалентны, если эквивалентность ч.Л> тогда и только тогда, когда 9&ъ может быть доказана на основе принятой системы аксиом. Обычно в этом случае подразумевается, что содержанке утверждений Jb и 98 имеет в какой-то степени родственный характер. Упражнения 1. В каждом из следующих случаев определите, ложно или истинно соответствующее утверждение и дайте краткое неформальное обоснование ответа: (а) Существует такое целое х, что х2 — 4 = 0. (б) Существует единственное положительное целое х, для которого X* — 4=0. (в) Существует такое рациональное число х, что х2 -f х + 1 = 0. (г) Для любого положительного вещественного числа х существует такое вещественное число у, что у2 = х. (д) Для любого вещественного числа х существует такое вещественное число у, что у2 = х. (е) Для любого целого х существует такое целое //, что х = 2у или х = 2</ + 1. (ж) Для любого положительного целого х, если х > 3, то хг > 9. (з) Для любого положительного целого х, если х > 2, то х2 > 9. (и) Для всех вещественных чисел х и у, если х <С у и у Ф 0, то */# < 1. (к) Для любого целого х, х2 < 16 тогда и только тогда, когда —4 < х и х < 4. (л) Для всех целых х, хъ < 27 тогда и только тогда, когда х < 3. (м) Для любого целого х, (х3 — 1)/13 < 2 тогда и только тогда, когда х < 2. 2. Какие из четырех возможных комбинаций истинности и ложности посылки и заключения можно осуществить, подставляя для х различные конкретные целые значения в импликацию если х2 > 9, то х < 0 или х > 2? Указать соответствующие примеры для х. Является ли эта импликация истинной для всех целых х?
ГЛАВА 2 ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ 2.1. Множества Множества как абстракции от условий. Рассмотрим следующие два условия: B.1.1) х — вещественное число и \х — 2 | < 3; B.1.2) х — вещественное число и —1<х и х<5. Легко видеть, что эти условия равносильны для всех значений х. Это наводит на мысль, что оба условия в каком-то смысле одинако- одинаковы, хотя внешне выражаемые ими свойства и различны. Более точно это можно выразить следующим способом: совокупность объектов, удовлетворяющих условию B.1.3), в точности та же, что и совокупность объектов, удовлетворяющих условию B.1.2). Среди объектов, содержащихся в этой совокупности, находятся числа 3, 0,9/2, —2/3, У2 + 3, я + 1 и т. д., а среди объектов, не содержащихся в этой совокупности, находятся 5, —5/4, J/"—1, луна и т. д. Мы ке способны перечислить все члены указанной совокупности, но это ке должно удерживать нас от того, чтобы считать эту совокупность существующей и не зависящей от любых частных способов описания той же совокупности. Когда этим путем мы переносим наше внимание с частных спо- способов выделения некоторой группы объектов к совокупности этих объектов самой по себе, мы приходим к понятию множества (другие названия: совокупность, класс). Каждое условие, содержащее одну переменную, определяет множество. Вообще это же имеет место и для условий определенного рода, содержащих несколько пере- переменных: некоторые из этих переменных могут быть связаны словами «каждый», «некоторый». Такие переменные называются связанными. Остальные называются свободными. Например, условие B.1.3) х целое и у целое и х = Зу или х = Зу + 1 имеет две свободные переменные х и у; условие B.1.4) х целое и существует такое целое у, что х — Зу или х = Зу + 1,
26 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ имеет одну свободную переменную х и одну связанную переменную у, а условие (на самом деле утверждение) B.1.5) для каждого целого х существует такое целое у, что х = Зу или х = Зу + 1, не имеет свободных переменных. Второе из этих условий, хотя и содержит две переменные, все же определяет множество (вклю- (включающее числа —3, —2, 0, 1, 3, 4 и т. д.), так как лишь одна из ука- указанных переменных свободна. Итак, все, что мы хотим сказать, состоит в том, что каждое условие, содержащее лишь одну свободную переменную, определяет множество — совокупность всех тех объек- объектов, которые удовлетворяют этому условию. (В конце данного раз- раздела мы еще вернемся к смыслу сделанного утверждения, а до тех пор оно будет достаточно для наших целей.) Чтобы отметить, что мы имеем дело с условиями, содержащими одну свободную переменную, мы будем записывать их в виде Л{Х), %(Х), &(у), 6G1) И Т. Д., где в первых двух выражениях подразумевается, что свободной переменной является х, в третьем у и в четвертом п. Аналогично, J (х, п), 95{х,п), &(у,г), &(п,р) и т. д. обозначают условия с двумя свободными переменными. Беря усло- условие с одной свободной переменной, например Jk (x), мы обозначаем через B.1.6) {х: Л{х)} множество, состоящее из всех тех объектов х, которые удовлетво- удовлетворяют взятому условию. Выражение B.1.6) может читаться: множе- множество всех х таких, что Л (х). В действительности, запись B.1.6) снабжает нас символическим средством обозначения множества, заданного посредством условия Jk (x). Это средство аналогично использованию констант для обозначения особых чисел. Более того так же, как для констант, обозначающих числа B + 3 и 5 обозна- обозначают одно и то же число), различные выражения, например {х: Л (х)} и {у: Л (у)}, могут быть использованы для обозначения того же самого множества. Мы имеем для этого простое условие: B.1.7) {х: А {х)} = {х: 98 (х)} тогда и только тогда, когда, для всех х, Л (х) эквивалентно 98 (х). •В дальнейшем нам будет нужно делать утверждения и формули- формулировать условия, относящиеся к некоторым или ко всем множествам заданного типа, и потому так же, как и для утверждений о числах, лам будут нужны переменные, значениями которых служат множе- множества. Для этой цели мы будем употреблять заглавные буквы А, В, С, D, E, M, N, S, X, Y, Z и т. п., а в отдельных случаях и буквы
2.1. МНОЖЕСТВА 27 А, В, С и т. д. Использование таких переменных бывает полезно даже при рассмотрении тех или иных специальных множеств. Допустим, например, что в некотором рассуждении нам приходится несколько раз упоминать множество {х: х — вещественное число и \х — 2 |<3}. Так как это делает рассуждение громоздким, то предпочтительнее ввести для указанного множества временное обозначение, говоря B.1.8) пусть S = {х: х — вещественное число и | х — 2 | < 3}. Как дополнение к этому мы введем простое обозначение для утверж- утверждения, что некоторый объект с удовлетворяет условию, использо- использованному для определения множества S. Мы пишем B.1.9) ceS и читаем: с содержится в S, пли с есть член S, или с есть элемент S, или с принадлежит S. Если мы хотим сказать, что с не принадле- принадлежит S, то пишем B.1.10) c$S. Таким образом, для специального множества S, введенного в B.1.8), следующие выражения являются истинными утверждениями: B.1.11) 3?S; --|?S; 5?S; ]/^Т?5; для каждого веще- О ственного числа х из х^-5 следует x^S. Для большинства множеств невозможно явно перечислить все их элементы. Это бесконечные множества. Те множества, для кото- которых явное перечисление элементов (по меньшей мере в принципе) возможно при условии предоставления достаточного времени и места, называются конечными. Это объяснение слова «конечный», несомненно, достаточно туманное. Большинство людей предпочли бы рассматривать понятия конечности и бесконечности как интуи- интуитивно ясные и приемлемые в качестве основных неопределяемых понятий для дальнейшего изложения. Однако в разделе 2.4 мы уви- увидим, что указанные понятия можно выразить через более простые неопределенные понятия, причем эти выражения будут находиться в полном согласии с нашими интуитивными представлениями. Для конечных множеств наряду с основным обозначением B.1.6) существует и другое естественное обозначение. Оно получится, если выписать одно за другим описания всех элементов множества и результат заключить в фигурные скобки. Так, B.1.12) (-5, я + 2, *П\ обозначает множество, единственными элементами которого будут —5, л + 2, у^2. Например, мы имеем B.1.13) {х: х целое и | х — 2 |< 3} = {0, 1, 2, 3,4}.
28 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ В этом обозначении конечных множеств не существенно, в каком порядке перечисляются элементы, а некоторые из них могут упоми- упоминаться и более одного раза. Например, выражения (я+ 2, -5, ^2), {^2, -5, -5, я + 2}, — 5, у 2, л+ 2, обозначают одно и то же множество, совпадающее с множеством, обозначенным в B.1.12). Аналогичные обозначения иногда упо- употребляют и для бесконечных множеств. Например, мы можем исполь- использовать выражение B.1.14) {1, 4, 9, ...} для обозначения множества квадратов положительных натуральных чисел, т. е. для обозначения множества {т: для некоторого п 6 Р, т = п?}. К сожалению, указанное обозначение двусмысленно и должно использоваться осторожно. Например, B.1.14) можно использовать, равным образом и для обозначения множества {т: для некоторого п 6 Р, т = я2 + (п ¦— 1) (л — 2) (п — 3)}. Лучше там, где возможно, обозначать «общий элемент» множества, например, B.1.15) {1, 4, 9, . .., п\ ...}. Это «точечное» обозначение часто используется и для указания конечных множеств. Например, мы можем взять B.1.16) A, 4, 9, . . ., /г3} в качестве обозначения конечного множества, состоящего из квадра- квадратов первых п натуральных чисел, в случае, когда п — какое-нибудь натуральное число. Расширение понятия множества. С каждым конечным множе- множеством может быть связано условие, посредством которого это мно- множество определяется в форме B.1.6). Например, множество B.1.12) — то же самое, что и множество B.1.17) {х: х — —5 или х = п + 2 или х = j/}. Никакой аналогичной возможности для бесконечных множеств нет. Мы уже видели, что многие условия ведут к бесконечным множе- множествам. Однако мы должны привыкнуть к мысли о возможности суще- существования и таких множеств, для которых мы не можем найти соот- соответствующих условий. Сначала трудно увидеть, какое применение имеют эти множества. Однако опыт, полученный математиками при
2 1. МНОЖЕСТВА 29 развитии анализа, показывает, что практически без них нельзя обойтись в ряде доказательств. Положение здесь весьма похоже на положение с проблемами существования, обсуждавшимися в пре- предыдущем разделе, особенно в случаях, когда кто-нибудь может утверждать существование решения задачи, не будучи в состоя- состоянии указать конкретной процедуры для вычисления этого ре- решения. Следующий пример покажет более ясно, о существовании каких множеств идет речь. (Мы сейчас не в состоянии объяснить, какие причины привели к построению таких примеров.) Наш пример будет связан с идеей считать вещественные числа в каком- то смысле родственными, если их разности рациональны, и раз- различающимися существенно, если разности иррациональны. С этой точки зрения числа у 2, /2 + -g-, /2 ^ будут род- родственными, а числа у^2 + т й я т 2 не родственными. Такая клас- классификация ведет нас к разбиению всех вещественных чисел на отдельные множества, причем числа х, у считаются принадлежа- принадлежащими к одному множеству, если их разность х — у рациональна, и принадлежащими к разным множествам, если эта разность не рациональна. Пусть совокупность всех этих множеств будет назва- названа А- Таким образом, Si = {x: существует такое рациональное число г, что х — г = р 2}, $2 = {х: существует такое рациональное число г, что х — г —я) обозначают два индивидуальных множества из А- Ясно, что все множества из А бесконечны. Теперь мы объявляем, что существует множество В, имеющее с каждым множеством из А в точности один общий элемент. Например, В может содержать j/ 2 + — и не содержать никаких других элементов из Sb может содержать п =- и не содержать никаких других элементов из S2. Иными словами, множество В обладает следующим свойством: если х, у — два различных элемента из В, то число х — у не рационально (в противном случае они находились бы в одном и том же множе- множестве из А) и для каждого вещественного числа х существует такое у 6 В, что число х — у рационально (так как по меньшей мере один элемент выбран из каждого множества). Существование множества В может быть сделано в каком-то смысле наглядным при помощи чер- чертежа (рис. 1). Вообразите, что каждый круг представляет множе- множество из А- В каждом из них выбрано по элементу, отмеченному жир- жирной точкой, и множество В состоит из всех отмеченных элементов. К сожалению, по-видимому, невозможно указать наперед какое- нибудь конкретное правило для выбора из каждого множества
30 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ индивидуального элемента. Иными словами, нет никакого усло- условия 88 {х) (которое не предполагало бы наперед знания множе- множества В), для которого В = {х: 98 (х)}. (Чтобы утверждение каза- казалось вам более вероятным, попробуйте найти такое правило!) Утверждение, что множество В с указанными сисйствами суще- существует, является типичным следствием более общего утверждения, Рис. 1. называемого принципом, или аксиомой, выбора. У нас будет несколь- несколько поводов применить этот принцип при изложении свойств веще- вещественных чисел. Мы думаем, что читатель сочтет каждое из этих приложений не вызывающим никаких сомнений. Итак, наши первоначальные представления о множествах как собраниях элементов, определенных посредством некоторых усло- условий, мы расширили, включив и множества, которые нельзя опреде- определить конкретными условиями. Предыдущий пример указывает еще один путь для расширения понятия множества. Множества могут образовываться объединением объектов любой природы. В частно- частности, допустив однажды, что объектами могут быть множества, мы обязаны допустить и множества, элементами которых служат множе- множества, элементами которых являются множества и т. д. Одним иа примеров может служить построенная выше совокупность множеств А- В качестве другого примера возьмем множество B.1.18) В = {X: X — конечное множество положительных целых чисел}. Тогда B.1.19) {1, 5, 6} €В, {2, 5, 7, 11} еВ, {—1, 5, 7, 11}$ В, {т: для некоторого я ? Р, m = п2} (| В (Р — множество положительных целых чисел). Еще пример: B.1.20) С={^'- X — произвольное .множество положительных, целых чисел); тогда B.1.21) {т: для некоторого п ? Р, т — п2} ? С, {т: т = 0 или, для некоторого п ? Р, т = я2} ? С. Построенная выше совокупность А может быть определена как B.1.22) А == {S: S — такое множество вещественных чисел, что* для некоторого х ? Re, 5 = {у: у ? Re и х — у ? Ra}}>
2.1. МНОЖЕСТВА 31 где Re — множество вещественных и Ra — множество рациональ- рациональных чисел. Тождество и включение. Так как не каждое множество опреде- определяется посредством некоторого условия, то в общем случае мы не можем применить B.1.7), чтобы узнать, тождественны ли два заданных множества. Однако наше интуитивное представление о множествах требует, чтобы множество целиком определялось своими элементами. Мы можем выразить это совершенно точно, говоря, что следующее условие истинно для произвольных множеств А и В: B.1.23) А = В тогда и только тогда, когда, для любого х, х?А эквивалентно х 6 В. Более общим отношением между множествами является отношение включения. Мы говорим, что множество В включено в множество А. или что В есть подмножество множества А, символически B.1.24) (а) В <= А, в том и только в том случае, когда B.1.24) (б) для любого х, если х?В, то х?А. (Некоторые авторы вместо символа S предпочитают пользоваться символом с:, тогда как другие предпочитают писать В cz А лишь в случае, когда В ^ А и В Ф А. Будьте внимательны к таким рас- расхождениям!) Ясно, что тогда для любых множеств А я В B.1.25) А = В тогда и только тогда, когда В ^ А и А ^ В. В частности, B.1.26) А <= А для любого множества Л. Ясно, далее, что для любых множеств А, В, С выполняется B.1.27) если С s В и В s А, то С S А. Отношение включения может быть использовано для упрощения условий, при помощи которых выше определялись множества. Например, множество С из B.1.20) есть {X: X s P}, а множество В из B.1.18) есть {X: X конечно и X s P}. Далее, ВеС Вообще для любого заданного множества А мы можем образовать множество B.1.28) {X: X = А}, называемое множеством всех подмножеств множества А. Теперь настал подходящий момент обсудить (что на первый взгляд может показаться отступлением) общее употребление поня- понятий тождества или равенства в математике. Некоторые читатели могут признать эти понятия парадоксальными. Они рассуждают:
32 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ если мы говорим, что два объекта тождественны, то перед нами не два объекта, а один; если же у нас лишь один объект, то незачем говорить, что он тождествен самому себе, это тривиально. В этом рассуждении неправильно понимается слово «два». На самом деле мы думаем о двух описаниях объекта. Когда мы пишем 5 = 2 + 3, мы говорим, что объект, обозначенный символом 5, тот же самый, что и объект, обозначенный выражением 2 + 3; это верно и является нетривиальной частицей информации. С другой стороны, мы узнаем, что хотя утверждение 2 + 2 = 5 имеет смысл, оно ложно, так как объекты, обозначенные через 5 и 2 + 2, различны. Употребление слов «тот же самый» или «тождественный с» при- принадлежит наиболее важной части нашей способности рассуждать и не может быть объяснено при помощи более простых понятий. Мы можем, однако, высказать несколько утверждений, описываю- описывающих отдельные способы употребления указанных слов. Отправной пункт: объекты х и у тождественны, х = у, когда они обладают одинаковыми свойствами. Более точно B.1.29) х = у тогда и только тогда, когда, для любого множе- множества S, х ? S эквивалентно у ? 5. Это условие известно как тождество неразличимых. Явное призна- признание его значения восходит к философу и математику Лейбницу. Здесь х и у—совершенно произвольные объекты: камешки, числа или даже множества. В частности, из B.1.23) и B.1.29) вытекает, что если два множества А и В тождественны, т. е. если они имеют в точности те же элементы, то, для всех множеств S, А 6 S тогда и только тогда, когда В ? S. Следующие знакомые утверждения являются непосредственны- непосредственными следствиями B.1.29): B.1.30) Для любых объектов х, у, г (а) х = х; (б) если х — у, то у = х; (в) если х = у и у = z, то х = г. Первое из утверждений называется законом рефлексивности тожде- тождества , второе — законом, симметричности и третье — законом тран- транзитивности. Помимо отношения тождества существует много дру- других отношений между объектами, также удовлетворяющих этим законам. Например, назовем два вещественных числа х, у эквива- эквивалентными и будем писать х = у, если число х — у рационально. Тогда легко увидеть, что все утверждения B.1.30) будут истинны для любых вещественных чисел, если в них знак = заменить зна- знаком =. Такие «подобные тождеству» отношения представляют боль- большой интерес и будут часто встречаться в нашей работе. Важно усвоить из сказанного, что законы B.1.30) недостаточны, чтобы пол-
2.1. МНОЖЕСТВА 33 ностью охарактеризовать тождество, и что для этого требуются много более сильные условия, подобные условию B.1.29). Ряд других свойств тождества, знакомых читателю из его школьных занятий, например «если к равным величинам прибавить равные, то получатся равные результаты», будут обсуждены в разделе 2.3. Некоторые особенные множества. При употреблении первона- первоначального способа образования множеств из данных условий Jb (х) путем перехода к множествам {х: Л (х)} возникает ряд особенно- особенностей. Например, совершенно законно образовать множество {х: х — простое число и 17 < х их< 29}, которое, как мы пони- понимаем, совпадает с множеством {19, 23}. Поэтому должно быть совер- совершенно законным и такое образование множества: B.1.31) {а;: х — простое число и 23 < х и х<29}, но оно оказывается не имеющим ни одного элемента. Мы можем не пользоваться такими множествами, если захотим. Однако, чтобы поступать таким образом, мы должны были бы каждый раз наперед знать, имеется ли хотя бы один объект, удовлетворяющий рассма- рассматриваемому условию. В частности, мы должны были бы воздержи- воздерживаться от образования множества B.1.32) {п: п 6 Р и п > 2 и существуют такие х ? Р, у 6 Р, г б Р, что хп + уп = гп}, так как до сих пор мы не знаем, содержит ли это множество какие- нибудь элементы или нет (т. е. мы не знаем, истинна или ложна так называемая большая теорема Ферма). Много легче в полном согла- согласии с нашими другими представлениями о множествах не делать указанного ограничения. Мы будем говорить, что множество А пустое, если х (J А для всех объектов х. В таком случае из B.1.23) немедленно получаем B.1.33) если множества А и В оба пустые, то А = В. Например, B.1.34) {х: х — простое число и 23 < х и л:<29} = = {г: z есть единорог}. В силу B.1.33) мы можем говорить о единственном пустом множе- множестве, для которого вводим постоянное обозначение B.1.35) 0. (Некоторые авторы вместо 0 пишут «О» или «Л».) По соглашению 0 считается конечным множеством (для перечисления его элемен- элементов не требуется никакого времени). Из нашего определения пустого множества и из определе- определения B.1.24) отношения включения вытекает, что для любого
34 ГЛ. 2, ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ множества А B.1.36) 0 <= А, так как в этом случае импликация B.1.24) (б) тривиально истинна. Могло бы показаться, что в противоположность пустому множе- множеству, так сказать, на другом конце шкалы множеств мы могли бы образовать невообразимо большие множества вроде множества {Л': X — бесконечное множество} или даже множества B.1.37) А = {X: X — множество). Если мы позволим себе образовывать такие множества, то для множе- множества А из B.1.37) получим А ? А. Однако Бертраном Расселом было открыто, что такое неограниченное образование множеств мг.жет вести к противоречиям; одно из последних стало теперь называться парадоксом Рассела. Именно, образуем множество B.1.38) А = {X: X — множество и X & X}. Теперь либо А 6 А, либо А (+ А, причем эти утверждения одновре- одновременно быть истинными не могут. Однако в первом случае А должно удовлетворять условию, определяющему множество А, т. е. должно быть А$А. Во втором случае множество А не удовлетворяет условию, определяющему А, и потому А 6 А. Итак, в обоих случаях мы при- пришли к противоречию. Противоречие можно устранить, либо признав, что объект А не существует, либо что он не является множеством. То, что противоречия возникают из неограниченного образова- образования множеств вида {х: Л (х)}, еще не означает, что мы должны вообще не пользоваться подобными конструкциями. Положение здесь сходно с действиями над бесконечными рядами. Факт, что можно получить противоречащие значения для суммы ряда 1 — 1 + 1 — 1 -г . . ., не заставил нас перестать пользоваться бес- бесконечными рядами. В обоих случаях мы перешли от ясно понимае- понимаемых действий над конечными совокупностями объектов к аналогич- аналогичным действиям над бесконечными совокупностями. Противоречия показывают, что наша интуиция — не совсем надежный путеводи- путеводитель по бесконечности. Необходимо, следовательно, сделать нашу интуицию более отчетливой, установив точные условия, при кото- которых упомянутые действия и группировки могут выполняться. Произвести это желательно так, чтобы наша интуиция конечного была без противоречий распространена и на область бесконечного. Мы уже отмечали в первом разделе данной главы, что основная задача этой книги — явно выполнить указанную программу для числовых систем, в особенности для системы вещественных чисел, где впервые на самом деле возникают реальные трудности. Фактически в нашем изложении мы будем исходить из допуще- допущения, что существует множество положительных целых чисел, обладающее несколькими фиксированными простыми свойствами,
2.1. МНОЖЕСТВА 3l и затем последовательно «конструировать» целые числа, рациональ- рациональные числа, вещественные и комплексные числа. Единственными допущениями, помимо указанного, будут допущения, связанные с понятием множества. Поэтому для завершения картины мы долж- должны были бы попытаться явно перечислить все те условия, которые могли бы потребоваться в нашем изложении, чтобы непротиво- непротиворечиво распространить понятие множества и на сферу бесконеч- бесконечных множеств. Такая систематизация, действительно, была выпол- выполнена в последние 50 лет и приняла ныне форму аксиоматической теории множеств, оказавшейся приемлемой для большинства мате- математиков. К сожалению, подробное обсуждение аксиом теории множеств увело бы нас слишком далеко в сторону. Хотя логически такое обсуждение должно предшествовать изложению материала данной книги и оно не труднее его, все же мы думаем, что для своей под- подходящей мотивировки оно требует несколько большей изощренно- изощренности и большего знакомства с нуждами математики. Заинтересован- Заинтересованный читатель поступил бы правильно, сопроводив работу над этой книгой последующим изучением аксиоматической теории множеств. В настоящее время существует ряд превосходных вводных курсов в этой области, которые читатель мог бы использовать для указан- указанной цели. Некоторые из них перечислены в библиографии. Мы можем, однако, кратко отметить, некоторые из принципов, употребляемых в аксиоматической теории множеств, которые пока- покажут, каким образом наши идеи о множествах можно развивать без противоречий. Мы не будем излагать сразу все эти принципы, а будем вводить их постепенно на протяжении всей данной главы. Для удобства мы соберем их вместе в добавлении I, снабдив некото- некоторыми дополнительными замечаниями. Однако чтение добавления лучше всего отложить до того момента, когда читатель закончит изучение по меньшей мере stou главы и раздела 3.1. Трудность, связанная с парадоксом Рассела, грубо говоря, была вызвана тем, что мы позволили себе рассматривать слишком большие множества. Рассмотрим теперь следующий ограничивающий принцип: B.1.39) для любого мноясества S и условия А {х) существует такое множество А, что, для любых х, х ? А эквивалентно x?S и Л (х). Иными словами, если мы уже имеем какое-то множество 5, то мы можем образовать и любое меньшее множество {х: х 6 5 и Л (х)}. (Если мы теперь попытаемся снова получить парадокс Рассела, образуя множество А = {X: X ? S и X (J X}, то мы увидим, что противоречие не возникнет, так как множество А ке обязано теперь быть элементом S.) Если читатель вновь просмотрит Есе примеры, обсуждавшиеся в данном разделе, то он увидит, что во всех случаях
36 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ мы образовывали множества посредством ограничения каких-то уже заранее существовавших множеств, например множества Р положительных целых чисел, множества I целых чисел или множе- множества Re вещественных чисел. С другой стороны, имеется второй принцип, позволяющий переходить от заданного множества А к умеренно большему множеству: B.1.40) для любого множества А существует такое множество В, что, для любого X, X 6 В эквивалентно X s A. Иными словами, каково бы ни было заданное множество А, мы можем образовать множество {X: X ? А} всех подмножеств А. При помощи этих средств, предполагая существование лишь про- простых бесконечных множеств вроде множества Р положительных целых чисел, можно доказать существование, в известном смысле, больших множеств. В частности, мы покажем, как может быть уста- установлено существование множества Re вещественных чисел при помощи комбинации принципов, подобных B.1.39) и B.1.40). Читатель может иметь в виду эти принципы при дальнейшей работе; однако он должен сознавать, что они ни в какой степени не состав- составляют полной системы аксиом для теории множеств и что поэтому в большом числе случаев наши теоретико-множественные рассужде- рассуждения будут основываться на его интуитивном понимании предмета. Упражнения Ниже Р — множество положительных целых, I — множество целых и Re — множество вещественных чисел. 1. Какое из следующих множеств конечно и какое бесконечно? Для слу- случая конечного множества перечислите все его элементы. (а) {х: х 6 Re и х2 — 5х + 4 = 0}. (б) {х: х ? Р и х2 — 5х + 4 > 0}. (в) {х: х ? Р и х — делитель 24). (г) {х: х ? Р и, для некоторого у ? Р, 2х + Зу = 24}. (д) {х: х d Р и, для некоторого у 6 I, 2х + Зу = 24}. (е) {X: Xs A, 4, 5} и X имеет не более двух элементов), (ж) {X: X s P и X имеет не более двух элементов}. 2. Перечислите все элементы каждого из следующих конечных множеств: А4 = {X: X <= {1}}, А2 = {X: X с= {1, 2}}, А3 = {X: X д= {1, 2, 3}}. Сколько, по-вашему, элементов в Ап={Х:Х = {1,2,...,п}}? 3. Какие из следующих утверждений истинны и какие ложны? В каждом случае дайте краткое объяснение вашего ответа. (а) {х: х G Re и х2 — 5х + 4 = 0} <= {х: х ? Р и х2 — 5х + 4 > 0}. (б) {х: х 6 Re и л;2 — 5х + 4 = 0} ф 0. . (в) {х: х ? Re и л;2 + х + 2 = 0} ф 0. (г) {х: х ? Re и л; — 4 > 0} = {х: х ? Re и х2 — 5л; + 4 > 0}. (д) {%: х е Re и х — 2 > 0} Е= {х: х ? Re и х2 — 5л; + 4 > 0}. 4. Пусть А = {S: Sel и, для некоторого л; 6 I, S = {у: у ? I и х — у кратно 5}}. Одним из элементов А является множество {. . ., —4, 1, 6, 11, . . .}. Каковы остальные элементы А? Найдите множество В, имеющее в точности по одному общему элементу с каждым множеством совокупности А.
2.2. АЛГЕБРА МНОЖЕСТВ 37 2.2. Алгебра множеств Пересечение, объединение и дополнение. Пусть 5 — любое множе- множество. Мы знаем по B.1.39), что для любого условия А (х) с одной свободной переменной существует множество А = {х: х ? 5 и Л (х)}; ясно, что A s 5. Для интуитивного понимания последующих рассуждений представьте, что элементы множества 5 на рис. 2 изображены точками, а множество А состоит из точек, нахо- находящихся в заштрихованном кусочке. Конечно, для конкретных множеств А и 5 эта диаграмма может совсем не соответствовать естественному представлению отношений между А и 5. Например, если 5 есть множество I целых чисел и А = {х: х 6 I и (х + 1) (х — 2) (х — 5) > 0}, то более естественным представлением будет рис. 3. Так что, когда мы используем диаграмму типа рис. 2, мы должны помнить, Рис. 2. Рис. 3. что она может изображать фактически существующие геометриче- геометрические связи со значительным искажением. Ради простоты использо- использования такого рода диаграмм мы убе- уберем из них точки, оставляя их лишь в воображении (рис. 4). Подобная диаграмма имеет двоя- двоякое преимущество: ее менее утоми- утомительно вычерчивать и она позволяет вообразить, что 5 может быть бесконеч- рис, 4. ным. Такие рисунки и их комбинации часто называются диаграммами Венна. Из данных условий А (х) и 98 (х) мы можем образовать новые условия B.2.1) А (х) и 98 (х), Л (х) или 35 (х), не Л (х), используя связки «и», «или» и «не». Если А = {х: х ? S и А (х)} и В = {х: х ? S и 98 (х)}, то в соответствии с условием B.2.1)
38 ГЛ- 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ мы можем из А и В образовать новые множества B.2.2) С, = {х: xeS, и J (х) и Я (х)}, С2 = {х: х в S, и А (х) или J> (*)}, С3 = {х: х 6 S, и не Л (х)}. Здесь для всех х ? S выполняются условия B.2.3) х 6 С\ тогда и только тогда, когда х ? А и х ? В, х 6 Со тогда и только тогда, когда х ? А или х ? В, х 6 С3 тогда и только тогда, когда х ^ А. Фактически, для любых множеств А и В, определены они или нет некоторыми условиями, мы можем образовать множества d и С2, а для любого заданного множества S — множество С3. Мы определяем B.2.4) А П В = {х: х 6 А и х ? 5}, Л U В = {л-: л: 6 А или х ? В}, Д"E) = {л-: *6 S u х^ Л}. Л П В называется пересечением множеств А и 0, Л 'J В называет- называется объединением множеств Л и В и Л^> называется дополнением А до 5. (Мы должны наложить ограничение на множество S, так как если множества {а;: х ? Л} слишком велики, то они могут привести к парадоксальным заключениям.) Будем полагать в дальнейшем, что 5 есть некоторое произвольное, но фиксированное множество. Тогда можно писать Л вместо Л('5). Множества, образованные по правилам B.2.4), могут быть пред- представлены следующим образом (рис. 5—7): Рис. 5. А П В — дважды заштрихованная площадь. Рис. 6. /4 1JS — вся за- заштрихованная площадь. Рис. 7. А — дважды гза- штрихованная площадь.
2.2. АЛГЕБРА МНОЖЕСТВ 39 Этим же способом могут быть представлены и следующие более сложные комбинации (рис. 8—9): Рис. 8. А П В — дважды заштрихованная площадь. Рис. 9. (A ptB)[j{BptA)- дважды заштрихованная площадь. Как видно из рис. 9, (А П В) {] (В (] А) — множество элементов, которые находятся или в А или в В, но не в А и В одновременно; это соответствует использованию слова «или» в исключающем смыс- смысле в противоположность не исключающему использованию слова «или» при образовании А [) В. Если мы определим B.2.5) А — В = А П В, то из рис. 5, 6 и 9 увидим, что (А П В) U (В П А) = (A U 5) - (А П В). При желании это последнее утверждение легко может быть доказано при помощи лишь одних определений B.2.4) и B.2.5). Следующие диаграммы изображают комбинации, включающие три множества А, В и С (рис. 10—12): Рис. 10. (А П В) П С—дваж- С—дважды заштрихованная площадь. Из этой диаграммы видно, что (А ("| В) П С = A f| (В П С). Рис. 11. A ft (В {] С) — дважды заштрихованная площадь. Рис. 12. Ли (В П Q - дважды заштрихованная площадь.
40 ГЛ. 2 ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ Теперь мы можем проверить с помощью диаграмм, что А П (В U Q = (Л п В) U (A n Q Л U E П Q = (Л U 5) П (A U Q. Пусть читатель сам нарисует диаграммы для других комбинаций таких, как А f] (В f] С), (А [) В) П С", Л U E П Q, И П б) U U (В П Q и др. Отношение включения В s Л изображено в виде диаграммы на рис. 13: Рис. 13. В — дважды за- заштрихованная площадь. Так что если В s Л, то Л П В = Л U Я = Л. Обратно, из рис. 5 и 6 и вышеприведенных условий следует, что 8ei Далее, для любого подмножества Л множества S имеем 0 s Л и Л sS. Отношение, противоположное отношению включения, возникает, когда Л и Вне имеют ни одного общего элемента. Мы говорим, что А я В непересекающиеся, если Л П В = 0. Согласно этому опре- определению, пустое множество не пересекается с любым множеством, включая и самого себя. Отношение непересечения может быть изображено так (рис. 14): Рис. 14. Из рис. 7 и 13 следует, что если А (] В = 0, то А ^ В и В е Л. Обратно, если выполняется любое из этих соотношений, то множества А и В непересекающиеся.
2.2. АЛГЕБРА МНОЖЕСТВ 41 Три (или более) множества А, В, С называются попарно непере- непересекающимися, если никакие два из них не пересекаются. Очевидно, что это не эквивалентно утверждению А [} В () С = 0, как пока- показывает следующая диаграмма (рис. 15): Рис. 15. Основные законы алгебры множеств. Если мы просмотрим рис. 5— 12, то увидим, что на них показаны только «типичные» взаимоот- взаимоотношения между множествами в том смысле, что никакая пара множеств, изображенных на этих диаграммах, не находится в отно- отношении включения или непересечения. По этой причине доказатель- доказательство, основанное на диаграммах Венна, может казаться несколько ненадежным (так же как и доказательства в геометрии с помощью чертежей). Однако каждое такое доказательство легко сделать и вполне строгим: достаточно возвратиться к исходным определе- определениям понятий 0, ?, Г), U и "• Но существует и другой путь (снова по аналогии с геометрией), именно, сначала попытаться установить ряд основных свойств указанных понятий, из которых затем выво- выводить дальнейшие их свойства. Следующий список и представляет собой совокупность таких основных свойств. B.2.6) Для любого множества S и его подмножеств А, В, С имеем: (i) А{]А=АиА[]А = А; (ii) A[)B = B(]AuA{JB = B[jA; (iii) Ar\(B[)Q = (Ar\B)r\CuAU(BUQ = = (A[}B)[)C; (iv) А П (B U Q = (А П B) U (А П С) и A U (В П Q = (A U В) П (Л U Q; (v) Л fl 0 = 0 « i U S = S; (vi) A C\ S_= А и A U 0_= A; (vii) Af]A=0uA[jA=S; (viii) А П В = A~\J В~иА1)В = А(]В~; (ix) 1 = A; (x) В s А тогда и только тогда, когда А П В = В; (xi) В s А тогда и только тогда, когда А [} В = А.
42 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ Множество утверждений (i) — (ix) полно в том смысле, что любое равенство, образованное при помощи 0, S, |~|, U и "(по отношению к S) и любого числа букв А, В, С, . . ., имеющее место для любого множества S и его подмножеств А, В, С, . . ., может быть выведено из (i) — (ix) (см. стр. 44). В качестве примера рас- рассмотрим утверждение B.2.7) (А П В) U (В П А) = (А [] В) f] (А П В), соответствующее B.2.5) и полученное ранее при помощи диа- диаграмм. Оно может быть теперь выведено из (i) — (ix) следующим образом: по по по по по по по по (Vlll) (iv) (И) (iv) (vii) (ii) (vi) (ii) (A U В) П (А П B) = = (Л US)n(^US) = [(Л и 5) n л] и \(А \] в)[\в] = [Л П (A U 5)] и [S П (Л U 5)] = l(A f] Л) U (A D 5)] U 1E П Л) U (ЯП ^ = [0 U (Л П 5)] и l(B_ {] A)U 0] = [(Л П В) U 01 U KB П Л) и 0] - (Л п В) и (fifl ?) = (Л n S) U (б П А) После небольшой практики вырабатывается навык быстро про- производить такого рода выводы. При этом в каждом отдельном преобра- преобразовании не обязательно опираться лишь на один из законов (i) —- (ix), а можно учитывать результат сразу нескольких из них. Из B.2.7) следует, что B.2.8) Л = В тогда и только тогда, когда А |~] В = 0 и В Л Л~= 0. То, что правая часть этой эквивалентности следует из левой части, ясно. Для доказательства обратной импликации предпо- предположим, что правая часть истинна. В соответствии с B.2.7), пола- полагая С = (Л U В) П (Л Г) В), имеем С = 0 [) 0 = 0. Отсюда Л U С = Л по B.2.6) (vi). Далее имеем Л и С = [Л U И U 5)] П Ы \}(А~ГГВ)] по (iv) = [Л U В] П [Л U (Л U 5I по (Hi), (i), (viii) = [Л U В] П [5 U В] по (Hi), (vii) = [Л U В] П 5 по (v) = Л U В по (vi).
2.2. АЛГЕБРА МНОЖЕСТВ 43 При помощи тех же рассуждений получаем В U С = A U В и, следовательно, А [) С — В (J С. Так как С = 0, то А = В, Пока мы не использовали условий B.2.6) (х), (xi), показываю- показывающих, что отношение S может быть определено в терминах П или U. Операции f] и U не независимы, так как мы можем вывести из B.2.6) (i) — (ix), что B.2.9) А Г) В = В тогда и только тогда, когда А [} В = А. Докажем, например, что кз А [\ В—В следует A [j В —А. Пусть, действительно, А [\ В = В. Чтобы показать, что A U В = А, достаточно в соответствии с B.2.8) показать, что {А\]В)[\А=0 и А[](А[}В)=0. Первое следует из Второе следует из (Проследите, какие из условий B.2.6) здесь использованы.) Доказа- Доказательство B.2.9) в другом направлении предоставляется читателю. В дополнение к B.2.6) (х) или к B.2.6) (xi) отношение s можно удобно характеризовать и так: B.2.10) В е А тогда и только тогда, когда В [} А = 0. [Докажите это, исходя из B.2.6) (х), используя В = (В [\ А) [) U (В П А).] Теперь из B.2.6) (i) — (ix) и (х), (xi) или B.2.10) мы можем вывести ряд дальнейших свойств отношения е. Из них наиболее важны: B.2.11) Для любого множества S и его подмножеств А, В, С 0) 0 ?= А, (ii) A c= S, (Hi) A <= Л, (iv) если А ? В и В s А, то А = В, (v) если A s В и В ^ С, то A s С. Почти все это мы уже получили непосредственно из нашего опреде- определения е в предыдущем разделе. Заметьте, что B.2.11) (iv) есть как бы повторение B.2.8) с использованием B.2.10).
44 ГЛ. 2, ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ Мы еще не обсуждали вопрос о правильности утверждений B.2.6) при наших основных определениях. Это может быть доказано путем использования условия B.1.23) предыдущего раздела, в соответ- соответствии с которым два множества равны, если они имеют одни и те же элементы. Поэтому, например, чтобы проверить вторую полови- половину B.2.6) (iv), предположим, что х ? А {] (В f] С). Тогда по B.2.4) х 6 А или х 6 В П С, откуда х 6 А или (х 6 В и х 6 С). Предполо- Предположим, что х 6 А; тогда х ? А или х 6 В, т. е. х ? A (J В, и аналогич- аналогично х ? A \J С. Следовательно, х ? (А [] В) (] (А [] С). С другой стороны, если х ? В и х 6 С, то х ? А [) В, а также х g A Q С, откуда снова х 6 (Л U В) Г) (<4 U С). Итак, мы показали, что если х 6 A [) (В |~| С), то я G (Л U В) П П (Л U С). Обратная импликация устанавливается аналогичным путем, и в результате мы получаем, что х ? А {] (В (] С) тогда и только тогда, когда х ? (А [] В) f\ (А {} С); другими словами, A U (В Г) С) = (Л U В) П {A U Q- При помощи этого же процес- процесса мы можем убедиться в истинности каждого утверждения из B.2.6) (для этого надо немного потренировать воображение и про- произвести большое число выкладок). Доказательство полноты B.2.6), на которую мы ранее ссыла- ссылались,— совершенно иное дело. Это метаматематическое утверж- утверждение, которое касается возможности определенных выводов в про- противоположность математической реализации тех или иных конкрет- конкретных выводов. Формальное изучение этих законов, восходящее к Дж. Булю, составляет начальную часть того, что теперь называют теорией булевых алгебр. Доказательство полноты, которое мы здесь не даем, легко найти в различных современных руководствах по булевым алгебрам. Читатель, без сомнения, уже увидел бросающееся в глаза сход- сходство между некоторыми утверждениями из B.2.6) и законами эле- элементарной алгебры. Действительно, если мы заменим символы П > U > 0, 5 соответственно символами •, +, 0, 1, то утверждения B.2.6) (i) — (vi) примут следующий вид: B.2.6') (i) А-А = А и А + А = А; (И) А-В = В-А и А + В = В + А; (ш) А-(В-С) = (А-В)-С и А + (В + С) = = (А + В) + С; (iv) А -(В + С) = (А -В) + (А -С) и А + (В -С) = = (А + В) -(А + С); (v) Л-0 = 0 и А + 1 = 1; (vi) АЛ = А и А + 0 = А. Из них только (i), вторая часть (iv) и вторая часть (v) не встре- встречаются в элементарной алгебре. Вследствие этих и ряда других фор- формальных аналогий многие авторы пересечение Л и В называют про-
2,2. АЛГЕБРА МНОЖЕСТВ 45 изведением А и В (пишется или А -В или АВ), а их объединение — суммой А я В (пишется А + В). Легко заметить, что отношение s для множеств и отношение <С для чисел также обладают рядом сход- сходных свойств. В частности, это верно для B.2.11) (Hi) — (v). Однако для любых двух чисел а и b мы имеем а <^ b или b <; а; но это не верно для множеств, так как существуют такие множества А и В, что Лне^ВиВне = Л. Из-за многих аналогий, существую- существующих между законами, которым подчиняются действия над множе- множествами и действия над числами, использование слова «алгебра» применительно к множествам вполне целесообразно. Более того, ряд различных названий законов элементарной алгебры целесооб- целесообразно сохранить и для соответствующих законов, относящихся к множествам. В частности, B.2.6) (ii), (iii) и (iv) называются соот- соответственно коммутативным, ассоциативным и дистрибутивным законами. B.2.6) (vi) показывает, что 5 и 0 действуют как единицы соответственно для П и U (СР- B.2.6') (vi)). Наконец, B.2.11) (iii), (iv) и (v) могут быть названы соответственно рефлексивным, анти- антисимметричным и транзитивным законами. В дальнейшем мы еще не один раз встретимся с аналогичным положением при рассмотре- рассмотрении ряда алгебраических вопросов. Другой интересный аспект утверждений B.2.6) — их симме- симметричность, или двойственность (дуальность). Это значит, что если мы знак П заменим знаком U , знак 5 заменим знаком 0, (J заменим П, 0 заменим S, а знак ~ оставим без изменения, то каждое из утверждений B.2.6) (i) — (viii) превратится в какое-то другое утверждение этой же системы. Утверждение B.2.6) (ix) при этом преобразовании переходит в себя (так как оно содержит только знак ~) и потому называется симметричным. Так как любое истинное равенство может быть выведено из B.2.6) (i) — (ix), то двойственное равенство, полученное такой перестановкой из истинного равенства, должно снова быть выводимым. Например, мы показали, что равенство выводимо. Отсюда следует, что равенство тоже выводимо, что, впрочем, может быть проверено и независимо. Расширение понятий пересечения и объединения. Ассоциатив- Ассоциативные законы А П (В П С) = (А |"| В) Г) С и A (J (В {] С) = = (A U В) U С позволяют нам использовать выражения А Г) [\В{]СиА[]В[\С без каких бы то ни было неясностей. (Напро- (Напротив, использование круглых скобок в B.2.6) (iv) необходимо; вообще говоря, A f| (В [} С) Ф (А (] В) [] С.) Аналогично, мы можем использовать А (] В (] С (] D для обозначения любого
46 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ из следующих идентичных множеств: А (~| (В ("| (С П D)), А П (E Г) Q П Я), ((Л П S) П С) П ?>. (Л П S) П (С П Я), (Л П (В A С)) П D. Таким путем мы сможем расширить понятие пересечения на любую конечную совокупность множеств А, В, С, . . ., X. Это же можно определить и независимо, полагая А [) В [) С {} . . . г] X = {х: х Е А и х ? В и х ? С и . . . и х е X} и А[)В1)С[)...{)Х = = {х: х 6 А или х в В или х ? С или . . . или х ? X}. Более общо, рассмотрим любую непустую совокупность ЬЛ подмножеств S, т. е. если I ? М, то X Е 5. Мы определяем B.2.12) г\Х[Х?Щ = {х: х?Х для любого Х?Щ; U X[X ? М] = {х: х?Х для некоторого X ? М}. Что это действительно обобщает понятия П. U. видно из B.2.13) если М = {А,В}, то П*[Х€М] = ЛПЯ и \JX[X?W] = A\}B. Соответствующее утверждение верно для любой конечной совокуп- совокупности М- Многие законы в B.2.6) могут быть обобщены на произволь- произвольные объединения и пересечения. Например, дистрибутивные законы принимают следующий вид: B.2.14) ЛП (\JX[X (Более точно, если N — совокупность всех множеств Y вида А (] X, где X 6 М, то мы имеем, например, А П (U X [X ? MJ) = = U Y [Y ? NI-) Два равенства, выводимых на этом пути из утверждения B.2.6) (viii), обычно называются законами Де Мор- Моргана. Это равенства B.2.15) nX[X€M] = UX[XeMJ, их [хеш = пх[хемь Алгебра множеств дает нам возможность лучше понять множе- множества и их взаимоотношения. Она с успехом может применяться также для более компактной и точной зап-иси различных утвержде- утверждений теорий множеств. Рассмотрим, например, аксиому выбора, которую мы описали в предыдущем разделе с помощью диаграммы (рис. 1). Теперь она может быть выражена следующим образом: B.2.16) Пусть М — любая непустая совокупность таких мно- множеств, что для каждого X ? М мы имеем X ф 0 и для каждых X, Y 6 М, если X Ф Y, то X f\ Y = 0; тогда существует множество А такое, что А [\ X содержит единственный элемент для каждого X 6 М.
2.3. ОТНОШЕНИЯ И ФУНКЦИИ 47 Упражнения 1. (Алгебра интервалов). Пусть Re — множество действительных чисел. Для а, Ь 6 Re положим [а, Ь] = {х: х 6 Re и а < х < 6}, [а. Ъ) = {х: ж ? Re и а < л: < Ъ), (а, Ь] = {х: х е Re и а < л: < 6}, (я, 6) = {ж: х- ? Re и д < х < Ь}; все эти множества называются интервалами. Их удобна изображать на прямой; например, интервал fa, Ь) при а < b может быть показан, как (а) В каких случаях интервал пуст? Какие интервалы содержат только один элемент? (б) Вычислить Ц, 3) П [2, б], [1, 3) U [2, 6], [1, 3) — [2, 6], [2, 6] — [1, 3). Изобразить результаты на диаграммах. (в) Является ли пересечение двух интервалов снова интервалом? Рас- Рассмотреть этот же вопрос для объединения и разности интервалов. Является ли дополнение интервала снова интервалом? (Обосновать ваши утверждения.) (г) Предположим, что а < Ь и с ¦< d. Дать необходимое и достаточное условие для [а, Ъ\ с [с, d]. (д) Пусть М — совокупность всех интервалов вида [0, 1/я], где п — положительное целое число. Найти UX [X ? М], Г\Х [X 6 Щ, U ([0, 2] — - X) [X ? М]. 2. Пусть S — произвольное множество и X, У, Z — его подмножества. Для каждого из следующих утверждений либо доказать его при помощи основных законов B.2.6), либо показать при помощи диаграмм Венна, что оно не всегда верно: (а) (X(JY)=XnY; (б) (X{JY)r\Z = (X (в) (X\J Y)C]Z = (X\JZ)n Y; (г) если X с у и X с Z, то X с Y [\ Z; (Д) (Х[\У)\ЛХ^\Х)Я.У\ (е) если У = (Х П У) U (У П X), то Х = ^. 3. Пусть Л' (X) означает число элементов в X, когда А* — конечное мно- множество. Показать, что N (X{jY) = N (Х)+ N (У) — Л/ (X П У)- Выразить N (X (J У (J Z) аналогично через /V (X), /V (У), Л/ (Z), /V (X П П. N (X П 2), Л' (У П 2), tf (X П К П 2). 2.3. Отношения и функции Отношения как абстракции от условий. В разделе 2.1 мы устра- устранили неоднозначность формулировки условия Л (х) с одной свобод- свободной переменной путем перехода к ассоциированному с Л (х) множе- множеству. Именно, абстрактно отождествлялись условия Л (х) и 8} (х), если ассоциированные с ними множества {х: Л (х)} и (х: 38 (х)} одинаковы, т. е. если А (х) и SB (x) эквивалентны для всех
48 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ значений х. Сейчас мы покажем, как можно аналогичным образом поступить и с условиями с несколькими свободными переменными. Начнем с рассмотрения условий Л (х, у), включающих две сво- свободные переменные, таких, как B.3.1) х, у — положительные целые числа и 2х2 — Зху + у2 ^ 0. Нетрудно увидеть (разлагая 2л;2 — Зху + у2 на множители и пере- перебирая представляющиеся возможности), что для любых х, у усло- условие B.3.1) эквивалентно следующему условию SB (x, у): B.3.2) х, у — положительные целые числа и у <^ х или 2х <^ у. Это второе условие позволяет легче увидеть, какие числа являют- являются «решениями» B.3.1) в том смысле, что для них условие Л (х, у) справедливо. Например, для х — 1 решениями будут у = 1 и у = 2, 3, . . .; для х = 2 решениями будут у = 1, 2 и у = 4, 5, . . .; для х = 5 решениями будут у = 1, 2, 3, 4, 5 и у = 10, 11, 12, ... и т. д. Мы не можем перечислить все реше- решения х, у, поскольку их бесконечно много, но можем вообразить некий бесконечный список, заглянув в который, можно было бы определить, является ли данная пара а, Ь решением. Воспользуемся теперь на время понятием списка в этом обобщенном смысле, при- причем список схематически изобразим в виде таблицы х\\ 11. ..2222. ..55555 5 5... г/|123...1245...12345 1О11... Поскольку условия B.3.1) и B.3.2) эквивалентны для всех значений переменных х, у, то списки значений, составленные для обоих усло- условий, одинаковы. Другими словами, «список» для условий с двумя свободными переменными играет ту же роль, что и «множество» для условий с одной свободной переменной. К сожалению, понятие списка содержит ряд неопределенных выражений типа «может быть записан на бумаге» или «данных в определенном порядке», от кото- которых необходимо избавиться. Для этого нашу абстракцию надо про- продвинуть еще на один шаг. Предположим, что условие B.3.2) задано нам в такой форме: B.3.3) ( ), (...) — положительные целые числа и (...)<!( ) или 2 (_)< (...). Что означает теперь, что данная пара чисел удовлетворяет этому условию? Если речь идет о паре 1; 2, то, очевидно, абсолютно все равно, подставим ли мы 1 на место ( ) и 2 на место (...) или наобо- наоборот. Если же речь идет о паре 2; 3, то результаты будут различными, если мы подставим 2 на место ( ) и 3 на место (...) или наоборот: в первом случае условие не выполняется, а во втором — выпол- выполняется. Поэтому порядок, в котором рассматриваются данные
2.3. ОТНОШЕНИЯ И ФУНКЦИИ 49 числа а, Ь, и способ их сопоставления со свободными переменными («пустыми местами») условия должны быть точно определены. Мы приходим, таким образом, к понятию упорядоченной пары объек- объектов а, Ь, записывать которую будем в виде B.3.4) (а, Ь). Упорядоченные пары и декартовы произведения. Упорядоченная пара (а, Ь) по своим свойствам резко отличается от рассматри- рассматривавшейся ранее неупорядоченной пары {а, Ь}. Действительно. {а, Ь) = {Ь, а), а из понятия упорядоченной пары с необходимо- необходимостью следует (a, b) =t (Ь, а), если исключить случай а = Ь. Итак, B.3.5) (а, Ь) = (с, d) тогда и только тогда, когда а = с и Ъ = d. Мы полагаем, что допустить существование объектов (а, Ь) с таким свойством не труднее, чем допустить существование мно- множеств, и принимаем понятие упорядоченной пары как первичное, не определяя его. Впрочем, с помощью несколько казуистического приема можно определить упорядоченную пару в терминах более общих понятий (первое упражнение в конце этого раздела). После того как определены упорядоченные пары, следующий шаг прост. Именно, вместо того чтобы говорить о списках, возможно бесконечных, мы будем говорить просто о множествах упорядочен- упорядоченных пар. В частности, ассоциированным с условием B.3.2) будет B.3.6) множество всех упорядоченных пар (х, у) таких, что х, у — положительные целые числа и у <; х или 2х <С у. Среди членов этого множества находятся пары A,1), A,2), A, 3), . . ., B, 1), B, 2), B, 4), . . ., E, 4), E, 5), E, 10), пары же B, 3), C, 4), C, 5), . . ., как и (—1, 2), (я, 1) и т. д., ему не при- принадлежат. Итак, с любым заданным условием Л (х, у) кажется воз- возможным ассоциировать B.3.7) множество всех упорядоченных пар (х, у) таких, что Jh (х, у). В разделе 2.1 мы сделали некоторые предостережения относи- относительно неограниченного образования множеств; такие же предосте- предостережения нужны и здесь. Так, не ясно, можно ли образовывать столь «большие» множества упорядоченных пар, как {(X, Y): X, Y — множества и X <=Y) или {(X, Y): X, Y — множества и X ? Y). Чтобы избежать возможности возникновения парадоксов и в то же время обеспечить достаточную свободу в образовании множеств типа B.3.7), в аксиоматической теории множеств
50 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ принимается следующее утверждение: B.3.8) для любых множеств А, В существует такое множество С, что, для всех z, z ? С тогда и только тогда, когда г = (х, у) для некоторых х ? А и у 6 В. Другими словами, множество С имеет своими элементами те и толь- только те упорядоченные пары (х, у), для которых х 6 А и у ? В. Это множество обозначается B.3.9) А X В и называется декартовым произведением множеств А и В (по имени математика и философа Декарта). Легко видеть, что B.3.10) если z ? А X В, то существуют единственные х, у такие, что х g А, у ? В и z = (x, у). Назовем х первым, ay — вторым членом г. Применяя принцип B.1.39), получаем B.3.11) для любых множеств А, В и условия Л (х, у) суще- существует такое множество W, что для любого z включение z ? W имеет место тогда и только тогда, когда z ? ? А X В, и для тех единственных х, у, для которых z = (х, у), выполнено Л (х, у). Это множество можно записать в виде W = {г: для некоторых х 6 А, у ? В, Л (х, у) и z = (х, у)} или, короче, B.3.12) W = {(х, у): х 6 А, у ? В и А (х, у)}. В частности, множество из B.3.6) запишется как B.3.13) {(х, у): х 6 Р, у в Р « #< х или 2х < у}. Если А, В — конечные множества, то и А X В конечно, так как мы можем просто перечислить все возможные комбинации элементов х из множества А я у из множества В (в случае А = 0 или В = 0 имеем А X В = 0). Так, если А = {—2, 0, 5}, В == {3, 5}, то А х В = {(-2, 3), (-2, 5), @, 3), @, 5), E, 3), E, 5)}; в этом случае А X В содержит 6 (различных) элементов. Вообще если А — конечное множество из п различных элементов ах, а2, аг, . . ., ап, а В — конечное множество из т различных элементов bu b2, b3, . . ., bm, to A X В содержит тп различных элементов (at, bi), . . ., (av, bm), (az, b,), . . ., (a2, bm), . . . • • -. (an> b±), . . ., (an, bm). Простая геометрическая интерпретация понятия декартова произ- произведения приведена на рис. 16. На рисунке жирные точки соответ-
2.3. ОТНОШЕНИЯ И ФУНКЦИИ 51 ствуют элементам множеств А и В, а отмеченные крестиками — элементам множества А X В. Например, вторая снизу точка, лежащая над а3, соответствует элементу (а3, Ь2). Точно так же можно геометрически интерпретировать произведение бесконеч- бесконечных множеств, в частности множество Р X Р. В этом последнем От' * '< О, X х- X 0, • х х х- Рис. 16. / 2 3 4 5 Рис. 17. случае любому подмножеству множества Р X Р соответствует опре- определенное подмножество точек, лежащих на пересечениях верти- вертикальных и горизонтальных линий. Для множества {{х, у): х g P, у 6 Р и 2х < у + 1 или у < х} соответствующая картина дана на рис. 17. Область определения, область значений, инверсия. Вообще если А, В — множества и W Е А X В, то о множестве W говорят как об отношении между элементами множества А и элементами мно- множества В. При этом если (а, Ь) ? W, то говорят, что отношение W выполняется между аи Ь, а само включение (a, b) d W часто записы- записывается aWb или Wab. Например, множество W = {{х, у): х?Р, у 6 Р и х < у) называется также отношением «меньше, чем», и запись (а, Ь) ? W заменяется на а < Ь. Символ < может иногда употребляться и для обозначения самого отношения, как в записи (а, Ь) ? <. Чаще всего нам придется иметь дело с отношениями между элементами одного и того же множества А, т. е. с подмноже- подмножествами множества Л X Л. На самом деле, можно такими отношения- отношениями и ограничиться, так как, обозначая С = А [} В, имеем Л х В ^ ^ С X С, что является специальным случаем общего утверждения: B.3.14) если A s А' и В s В', то А х В s Л' х В'. Из B.3.14) вытекает, что отношение 1Гне определяет однозначно множеств, между которыми оно определено. Однако «наименьшие» такие множества существуют и единственны. Чтобы их найти, определим для любого множества W (вне зависимости от того,
52 I Л. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ B.3.18) в содержит ли оно вообще какие-нибудь упорядоченные пары) B.3.15) область определения 3 (W) отношения W — как множе- множество {х: для некоторого у, (х, у) ? W), B.3.16) область значений Ж (W) отношения W — как множест- множество {у: для некоторого х, (х, у) 6 W}. Легко проверяются следующие свойства этих множеств: B.3.17) если W — множество упорядоченных пар, то W ^ ? 3 (W) X М (W) и поэтому W — отношение между элементами из 3 (W) и М (W), для любых множеств А, В из W <= А х В вытекает 3) (W) <= А и М (W) <= В. В некоторых случаях само отношение задается указанием его области определения и области значений. Так, если Pt есть множе- множество всех точек плоскости, a L — множество линий на плоскости, то отношением инцидентности является отношение {{х, у):х? Pt, у ? L, и х лежит на у} с областью определения Pt и областью зна- значений L. Чаще, однако, область определения и область значений отношения не фигурируют в яв- явном виде в определении отноше- отношения и должны из него выводить- выводиться. Например, для отношения W = {(х, у): л- 6 I, у 6 I и х2 + + 4г/2^16} можно усмотреть, что область определения есть (-4,-3,-2,-1,0, 1,2,3,4}, а область значений {—2, —1, 0, 1, 2}. Конечно, отношение вовсе не обязано выполняться между любыми элементами области определения и области значений. Эта ситуация наблюдается и в предыдущем примере, в котором многие пары, принадлежащие произведению 3 (IF) X М (W), не принад- принадлежат W. Один из способов геометрического изображения области опре- определения и области значений отношения в А X В приведен на рис. 18. Заштрихованная площадь на рис. 18 соответствует множеству А X В, дважды заштрихованная — отношению W, а жирные линии — области определения и области значений отношения W. Прямоугольник, ограниченный пунктирными линиями, соответст- соответствует здесь множеству 3) (W) X Ж (W). Поскольку отношения представляют собой множества специаль- специального вида, условие отождествления множеств B.1.23) равным обра- образом может применяться и к отношениям. Учитывая, что элементами Рис. 18.
2.3. ОТНОШЕНИЯ И ФУНКЦИИ 53 отношений являются упорядоченные пары, это условие можно сфор- сформулировать следующим образом: B.3.19) если U, W — отношения, то для равенства U =W необходимо и достаточно, чтоды для любых х, у вклю- включение (х, у) g U выполнялось тогда и только тогда, когда выполняется включение (х, у) б W. В частности, для отношений, заданных условиями, имеем B.3.20) {(*, у): х 6 А, у ? В и Л (х, у)} = {(*, у): х 6 А, у ? В и $} (х, у)} тогда и только тогда, когда для любых х ? А и у ? В условия <Л (х, у) и $1 (х, у) эквивалентны. В этом смысле отношения для условий с двумя свободными пере- переменными играют роль, вполне аналогичную роли множеств для условий с одной свободной переменной,— они служат для отожде- отождествления эквивалентных условий. В этой аналогии есть, однако, место, относительно которого нужно быть осторожным. Именно, если с условием Л (х) связано самое большее одно множество, с условием Jh (x, у), вообще говоря, можно связать два отношения. Чтобы усмотреть это, вернемся к B.3.3), где для записи условия вместо переменных х и у были использованы символы и ... и где не ясно, какой символ следует считать пробегающим область опре- определения и какой — область значений. Ассоциированными с данным отношением, таким образом, оказываются два отношения W и W. Первое состоит из пар ( , ...), удовлетворяющих условию B.3.3), а второе — из пар (..., ), удовлетворяющих условию B.3.3). Можно сказать, что отношения W и W связаны следующим образом: B.3.21) для любых х, у имеем (х, у) ? W тогда и только тогда, когда (у, х) 6 W. Отношение W к этом случае называется инверсией отношения W; следовательно, и отношение Наесть инверсия отношения W. Рассмот- Рассмотрим например, отношение W = {A, 1), B, 1), C, 2)} с 3 (W) = = {1,2, 3} и М (W) = {1, 2}. Инверсией W является отношение W = {A, 1), A,2), B, 3)} с 3(W) = {1,2} mM(W)= {1,2, 3}. Геомет- Геометрически эти отношения изображаются следующим образом (рис. 19). 3 - W 2 W J Рис. 19.
54 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ Хотя отношение W и его инверсия W, вообще говоря, различ- различны, наличие эквивалентности B.3.21) позволяет по свойствам отноше- отношения W судить о свойствах отношения W. Поэтому при изучении мно- множества решений условия по сути дела неважно, какое из двух ассо- ассоциированных с ним отношений рассматривать, и важно только зафиксировать одно из них. Тернарные (и т. д.) отношения. Подход к изучению условий с более чем двумя свободными переменными теперь ясен. Для усло- условий с тремя свободными переменными мы будем использовать упоря- упорядоченные тройки B.3.22) {а, Ъ, с), обладающие характеристическим свойством B.3.23) (а, Ь, с) = (d, e, f) тогда и только тогда, когда а = d, b = е и с = /. Оказывается, в этом случае нам не придется принимать понятие упорядоченной тройки в качестве первичного неопределимого, так как все, что мы хотим от упорядоченной тройки,— это выпол- выполнение B.3.23), а определив B.3.24) {а, Ь, с) = {{а, Ь), с), мы можем вывести B.3.23) из характеристического свойства B.3.5) упорядоченных пар. Приходим, таким образом, к определению B.3.25) А X В X С = (А X В) X С, так что А X В X С есть множество всех троек (х, у, г) в смысле B.3.24) таких, что х ? А, у 6 В и z ^ С. Например, для А = = {—2, 0, 5}, В = {3, 5} и С = {0, 3} имеем А X В X С = = {(-2, 3, 0), (-2, 5, 0), @, 3, 0), @, 5, 0), E, 3, 0), E, 5, 0), (-2, 3, 3), (-2, 5, 3), @, 3, 3), @, 5, 3), E, 3, 3), E, 5, 3)}. Конечно, множества АхВхСиАх(ВхС) различны. Напри- Например, по определению (—2, 3, 0) = ((—2, 3), 0) и отлично от (—2, C, 0)). Однако существует очевидное взаимно однозначное соответствие между элементами этих множеств. Аналогичным образом можно теперь определить понятие упоря- упорядоченной четверки (а, Ь, с, d), произведения А X В х С X D и, увеличивая далее число сомножителей, на этом пути усмотреть, как трактовать условия с любым числом свободных переменных, Таким образом, для любого положительного целого п получаем
2.3. ОТНОШЕНИЯ И ФУНКЦИИ 55 понятие упорядоченной п-ки, согласующееся для п = 2 и п = 3 с понятиями упорядоченной пары и упорядоченной тройки соответ- соответственно. Мы определили отношение как подмножество произведения А х В для некоторых А, В или, эквивалентным образом, на осно- основании B.3.17) как множество упорядоченных пар @ есть также отношение, так как 0 s A X В для любых А, В). В соот- соответствии с определением B.3.24) каждая упорядоченная тройка (а, Ъ, с) является в то же время упорядоченной парой, хотя, конеч- конечно, обратное неверно. Поэтому каждое множество W упорядоченных троек есть множество упорядоченных пар и, следовательно, отно- отношение. Это отношение имеет, однако, весьма специальный вид; мы будем называть такие отношения тернарными (вообще, исполь- используя понятие упорядоченной n-ки, для любого целого положитель- положительного п можно выделить п-арные отношения). О произвольном отношении в таком случае нужно говорить как о бинарном, но мы это будем делать только в том случае, когда хотим подчеркнуть, что речь идет о множестве упорядоченных пар. Нематематическим примером тернарного отношения может слу- служить множество W = {(х, у, г): х, у, z — люди иг — сын х и у}. Непосредственно видно, что для многих а, Ъ не существует такого с, что (а, Ъ, с) 6 W, например, а, Ъ могут не быть женатыми или быть женатыми, но не иметь сыновей и т. д. С другой стороны, каждый мужчина есть сын некоторых а, Ъ, так что М (W) есть множество всех мужчин. Другие свойства W: из (а, Ь, с) ? W следует (Ь, а, с) ? € W; из (а, Ь, с) ? W и (а, Ь, с') ? W не следует с = с'. Математиче- Математическим примером тернарного отношения является множество W = = {(х, у, г): х и у ¦— нечетные простые числа и z = х + у}- Если О — множество нечетных простых чисел 3, 5, 7, 11, . . ., а Ев — множество четных чисел z >¦ 6, то 3 (W) =OxOhJ (W) ? ^ Ев; справедливость же равенства М (W) = Е6 — открытый вопрос (знаменитая проблема Гольдбаха). Отметим еще два свой- свойства W: из (а, Ъ, с) 6 W следует (b, a,c)?W, а из {а, Ъ, с) 6 W и (а, Ь, с') g W' следует с = с'. Операции над отношениями, композиция. В математике часто рассматриваются различные отношения на множестве S (между элементами множества S), т. е. подмножества произведения S X S. С такими отношениями связана алгебра, подобная алгебре под- подмножеств произвольного множества. Имеет смысл вопрос, справед- справедливо ли W ^ W для двух данных отношений W, W на S? Так, {(х, у): х, у 6 I и х< у} s {(х, у): х, у 6 1 и х< у}, но в обрат- обратном направлении включение не имеет места. Относительно включе- включения пустое отношение 0 является наименьшим, a S X S — наи- наибольшим среди всех отношений на S. Для любых отношений W, W на S множества W П W, W [j W и W = r(SxS> = S X S —W также являются отношениями на S.
56 i-'Ь 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ Например, {(х, у): х, у 6 I и х < у) U {(х, у): х, у 6 I и х = у} = = {(л:, г/): л;, г/ 6 I и к < г/} и (на I X I) {{х, у): х,у el и х< у} = {{х, у): х, у 6 I и у < *}. Операции f) > U и ~ соответствуют употреблению слов «и», «или», «не» в B.2.2). Слова «для любого» и «для некоторого» также уже употреблялись в связи с операциями над множествами, именно U и П в B.2.12), но там переменными были множества, а не элементы. Операцией над отношениями, в которой используются слова «для некоторого» в применении к элементам, является переход от отно- отношения W к его области определения 3) (W) [B.3.15)]. Однако 3j{W), вообще говоря, не является отношением, даже когда W есть отношение. Удобной и полезной операцией над отношениями, при- приводящей снова к отношению, является следующая: B.3.26) W о W' = {(%, у): для некоторого г, (х, г) 6 W и {г, у) б W}. Отношение W ° W называется композицией отношений W и W. Так, если W = {(х, у): х есть сын у} и W = {(х, у): х есть ребе- ребенок у}, то W ° W = {(х, у): х есть внук или внучка у). Другой при- пример. Если W = {{х, у): х, у?\ и х< у}, то W ° W = {(х, у): х, у 6 I и х + Ку}. Над отношением может быть определена также подобная опера- операция, использующая слова «для любого», но она нам не понадобится. Специальные виды отношений. Приведем несколько интересных математических отношений на множестве I целых чисел: отношение тождества {(х, у): х, у 6 I и х = //}, отношение «меньше-» {(х, у): х, у 6 I и х <С у}; отношение «меньше или равно» {(х, у): х, у ? I и л: ^ у}; отношение делимости {(х, у): х, у ? I и х является дели- делителем у}. В множестве подмножеств множества I отметим отношение включения {{X, Y): X s 1', Y ¦= I п X ¦= Y). Все они обладают рядом важных свойств, которые мы сейчас сформулируем для произвольного отношения W на множестве S. B.3.27) W называется рефлексивным (в S), если (а, а) б ? W для любого а 6 S; W называется антирефлексивным (в S), если (а, а) $ W ни для какого а ? S; W называется симметричным, если из (a, b) ? W следует (Ь, а) 6 W; W называется антисимметричным, если из (а, Ъ) 6 W и (b,a) ?W следует а = Ь; W называется транзитивным, если из (a, b) ? W и (Ь, с) ?W следует (а, с) ?W.
2.3, ОТНОШЕНИЯ И ФУНКЦИИ 57 Если множество S здесь не указано, то предполагаем, что S = = 3 (W) U M (W). Из указанных выше отношений на множестве целых чисел, например, отношение тождества рефлексивно, симме- симметрично, транзитивно (и также антисимметрично); отношение «меньше или равно» рефлексивно, антисимметрично и транзитивно (но не симметрично). Читатель может сам провести классификацию остальных отношений относительно этих свойств. Отношения эквивалентности и разбиения. Введем определение: B.3.28) W называется отношением эквивалент- эквивалентности (на S) или эквивалентностью на 5, если W рефлексивно (на S), симметрично и транзи- транзитивно. Отношения эквивалентности во многих отношениях похожи на отно- отношения тождества. Рассмотрим, например, следующие два отноше- отношения: W = {(х, у): х, у ? I и х — у делится на 3}; W' = {(х, у): х, у 6 Re и х ¦— у 6 Ra}. Первое из этих отношений определено на множестве целых чисел, второе — на множестве действительных чисел. Записывая а == b вместо (a, b) ? W, имеем где по транзитивности отношение = выполняется между любыми членами одной строки и, с другой стороны, никогда не выполняется между элементами разных строк. Поэтому, полагая Хо = {¦¦¦, —6, -3, 0, 3, 6, . . .}, Xi = {-5, —2, 1, 4, 7, . . .}, Х2 = {-4, —1, 2, 5, 8, . . .}, имеем, что Хо, Xit Xz ¦— попарно непересекающиеся множества, причем каждое целое число принадлежит одному из них, т. е. Хо U Xi U Х2 = I и для любых a, b ? I выполняется а = b тогда и только тогда, когда а и b принадлежат одному и тому же множеству X,. Более того, для любого целого а множество Wa = = {х: х 6 I и х == а} совпадает с одним из Хо, Хи Xz, а потому для любых целых a, b либо Wa = Wb, либо Wa f] Wb = 0- Очевидно далее, что а = b тогда и только тогда, когда Wa = W-D- Аналогич- Аналогичная ситуация имеет место и для отношения W, с той лишь разни- разницей, что труднее записать все получающиеся множества. Оказывает- Оказывается, однако, что весь процесс можно описать в самой общей ситуации. B.3.29) Пусть W — отношение эквивалентности (в S), Wa = = {х: х 6 S и (х, a) g W} для любого а ? S и пусть, наконец, М — совокупность всех множеств Wa для а 6 S. Тогда A) для любых X, Y 6 М либо X = Y, либо X П У = 0; B) U X [X 6 М] = S; C) (а, Ъ) € W тогда и только тогда, когда существует такое X 6 М, что a, b ? X, а также тогда и только тогда, когда Wa = Wb.
58 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ Элементы множества М называются классами эквивалентности по отношению W; если отношение W фиксировано, то часто пишут [а] вместо Wa. Предложение B.3.29) показывает, что отношению эквивалентности W в S соответствует естественным образом отноше- отношение тождества в М. B.3.30) Совокупность М подмножеств множества S называется разбиением S, если, во-первых, для любого х 6 М имеем X Ф 0, во-вторых, для любых X, Y ? М либо X = Y, либо X (] Y = 0 и, наконец, U X [X 6 MJ = = S. Тогда мы имеем B.3.31) Пусть М — разбиение множества S. Определим отно- отношение W в S, полагая {а, Ь) 6 W тогда и только тогда, когда существует такое X 6 М, что a, b ? X. W есть отношение эквивалентности в S, классами эквивалент- эквивалентности по которому являются как раз элементы множе- множества М- Проверку этого утверждения оставим читателю. B.3.29) и B.3.31) показывают, что между разбиениями и отношениями эквивалент- эквивалентности имеется прямое соответствие. Отношение тождества имеет и другие интересные математические свойства. Например, если а, Ь, с — целые числа ий= Ь, то а + с = = Ь + с и а -с = b -с. В какой степени этими свойствами обладают и другие отношения эквивалентности? Для рассматривавшегося выше отношения ==, заданного условием: а==Ь тогда и только тогда, когда существует такое целое и, что а — b — Зи,— из а ¦== b следует а + с == b + с (вычислите (а + с) — ф + с)) и а-с = b -с (вычислите а-с—b-с). Для отношения W' (которое будем далее записывать ==') в множестве действительных чисел, определенного условием: а = 'Ь тогда и только тогда, когда а — b 6 Ra,— из а =' b следует снова а + с =' b + с, но на этот раз а •<;==' Ь-с неверно (так 1 = '0, но 1 -У 2 =?' 0-]/). Отношения эквивалент- эквивалентности, обладающие этими добавочными алгебраическими свойства- свойствами, окажутся в дальнейшем очень полезными для нас. Функции. Перейдем теперь к изучению другого очень важного класса отношений, так называемых функций. Определение функ- функции, принятое в теории множеств, является уточнением интуитивно ясного понятия. Одна из таких интуитивных концепций имеет под собой физическую основу: одна физическая величина точно опре- определена заданием нескольких других. Например, расстояние, кото- которое падающее тело проходит в заданный промежуток времени, зависит (в простейшем случае) только от времени и не зависит, скажем, от массы тела. Для физиков было естественным надеяться, что такие взаимоотношения допускают точное описание математиче-
2.3. ОТНОШЕНИЯ И ФУНКЦИИ 59 скими «законами», причем под указанием такого закона понималось указание вычислительной процедуры, связывающей с каждым зна- значением некоторой величины х другую строго определенную величи- величину у. Так, в вышеописанной физической ситуации эксперимент под- подтверждает, что у = 4,9х2, где х — секунды, а у — метры. Но легко понять, что в природе существуют ситуации, когда мы не можем найти закона, точно отражающего взаимоотношения величин. На языке отношений общее понятие детерминированности или функциональной зависимости допускает точное определение, не зависящее ни от каких интуитивных соображений, частных способов выражения и т. д. B.3.32) Отношение F называется функцией, если для любо- любого х ? ?В (F) существует единственное такое у, что (х, у) 6 F; это единственное у обозначается F (х). Поскольку для любого отношения F и любого х ? 3) (F) всегда существует по меньшей мере одно у, для которого (х, у) ? F, свой- свойство отношения быть функцией может быть переформулировано так: B.3.33) Отношение F является функцией тогда и только тогда, когда для любых х, уи у2 из (х, у±) 6 F и (х, у2) 6 F следует yt = у г- Понятие функции как закона может быть включено в приведен- приведенную схему при помощи построения отношений из условий Л (х, у). Так, например, функция, определяемая соотношением у = х3 — 1 в множестве действительных чисел, может быть задана как B.3.34) (a) F={(x,y):x, у 6 Re и г/ = х3 — 1} или, эквивалентным образом, как B.3.34) (б) F = {(х, х3—1):хе Re} (поскольку из х ? Re следует х3 — 1 (; Re). В большем соответствии с обычной практикой будем также писать B.3.34) (в) F есть функция с областью определения Re такая, что F (х) = х3 — 1 для любого х 6 Re. Нужно подчеркнуть, что рассматриваемая функция F отлична от функции G = {(%, у): х, у ? I и у = х3 — 1}. Как отношения, F и G связаны включением G s F, поскольку из (х, у) 6 G следует (х, у) е F, но G=/= F, поскольку 35 (G) = I, a 35 \F) = Re. В этом смысле понятие функции B.3.32) более тонко, чем смутное понятие закона. Это так и должно быть, ибо F nG обладают многими различ- различными свойствами. Например, для любого у ? Re существует такое х б 3 (F), что F (х) = у, иными словами, М (F) = Re. Но для
60 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ любого у 6 I уже не всегда существует х 6 3) (G) с G (х) = у E Ф Xs — 1 ни для какого х ? I). Даже в случае, когда нас интересует некоторая конкретная функция, заданная конкретными условиями, общее понятие функ- функции, приведенное выше, может оказаться весьма полезным. Напри- Например, если мы получили некоторый результат относительно всех непрерывных функций, то для проверки применимости его к нашей функции достаточно проверить, что заданные условия определяют именно непрерывную функцию. Можно сказать по этому поводу, что произвольные функции и конкретные закономерности нахо- находятся в том же отношении, что и переменные и константы. Графическая интерпретация отношений особенно удобна и есте- естественна в применении к функциям. Обычно мы имеем дело с функция- функциями, у которых область определения и область значений принадлежат одному и тому же множеству, например множеству Re действи- действительных чисел. Для этого последнего примера функция является подмножеством произведения Re X Re и при ее графическом изображении обычно рисуют вначале два «отправных» множества в Re X Re, именно «ось х», состоящую из пар (х, 0) для произволь- произвольного х ? Re, и «ось у», состоящую из пар @, у) для произвольного у ? Re. (Например, точку, заведомо расположенную на оси х, мож- можно полностью задать одним числом х; оси, конечно, пересекаются в единственной точке @, 0).) График функции может теперь выгля- выглядеть, например, так (рис. 20): Рис. 20. Условия, при которых отношение F является функцией, при графической интерпретации отношения также становятся нагляд- наглядными: никакие две точки графика не могут лежать одна над дру- другой — в противном случае было бы (х, yi) ? F, (х, у2) 6 F и одно- одновременно у± Ф г/2- С другой стороны, данному у может вообще не соответствовать ни одного х такого, что (х, у) ? F, или соответство- соответствовать несколько таких х. Одним из понятий, часто встречающихся в математических кур- курсах, является понятие неявной функции. Например, условие х3 — у=\ неявно определяет у как функцию х, именно в явной форме у = х3 — 1. Также говорят, что и условие х2 + уг = 1 неявно определяет у как функцию х (формально у = У^1—хг), но в этом
2.3. ОТНОШЕНИЯ И ФУНКЦИИ 61 случае ситуация гораздо тоньше. Во-первых, нужно оговорить, какого рода значения пробегают переменные х и у. Если, напри- например, это действительные числа, то автоматически —l-^x-^ + l. Во-вторых, условившись для определенности обозначать через Yа (единственный) положительный корень из а при а>0, видим, что нашему условию удовлетворяют по крайней мере две функции, определяемые условиями y—Yl—x1 или у=—]/г1—х2 для 1. В действительности, таких функций много; другим 7 Рис. 21. примером, в частности, является у = (—1)п^1— х2 для — 1 + + ?-<*<—1 + ^^ = 0, 1,|2, 3,иг/A)=0. Графики этих функ- функций изображены на рис. 21. Объединение первых двух графиков дает как раз множество тех (х, у), для которых хг-\-у2=1. Однако это множество, очевидно, не является функцией. Утверждению о том, что данная функция F является неявной функцией, ассоциированной с условием jk (x, у), можно придать точный смысл следующим образом (в зависимости от фиксирован- фиксированного множества S, содержащего область определения и область значений функции F): область определения функции F есть {х: х ? S и Л (х, у) для некоторого у ? S) и для каждого х 6 35 (F) имеем F (х) 6 S и J. (x, F(x)). Каковы бы ни были условие Л (х, у) и множество S, положим Wx = {(х, у): у 6 S и Л (х, у)} для любого х 6 5; пусть D — = {х: Wх ^0}иМ — совокупность всех множеств WX для х 6 D. Если W^ =? Wxv то Xi=^x2, а поэтому и WXl(] 17X2 = 0- По аксиоме выбора существует такое множество F, что F f] Wх для любого х 6 D содержит в точности один элемент; другими сло- словами, множество F обладает тем свойством, что для каждого х ? D существует единственное у ?. S, для которого (х, у) 6 F (и автомати- автоматически (х, у) ? Wx и Л (х, у)). Таким образом, всегда существует хотя бы одна неявная функция, ассоциированная с любым условием А (х, у) и любым множеством S. Заметим, что в анализе проблема существования неявной функ- функции гораздо глубже: при каких условиях мы можем доказать суще-
62 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ ствование по крайней мере одной неявной функции, обладающей дополнительными условиями типа непрерывности, дифференцируе- мости и т. д.? Именно по отношению к таким функциям правило неявного дифференцирования, скажем, играет такую большую роль. С неявными функциями тесно связаны так называемые много- многозначные функции. Авторы, использующие этот термин, часто назы- называют определенные выше функции однозначными. Например, изве- известно, что для любого комплексного числа z существуют ровно два таких комплексных числа w, что w2 = г. Вопрос разделения этих корней не так прост, как в случае действительных чисел — мы не можем говорить о положительном или отрицательном комплекс- комплексном числе; уравнение F (г) = У z не определяет функции в нашем значении слова. В теории комплексных чисел есть два подхода к этой проблеме. С одной стороны, можно говорить о ветвях «функ- «функции» У г, т. е. о двух определенных однозначных функциях, которые вместе дают оба возможных значения корня для каждого г. С дру- другой стороны, можно расширить понятие комплексного числа исполь- использованием римановых поверхностей. Для рассматривающейся функ- функции «корень квадратный» вместо каждого комплексного числа z Ф О рассматриваем два комплексных числа zi и г2 на специальной поверхности и одну однозначную функцию F, для которой F (г,) есть одно значение квадратного корня из z, a F (z2) — другое. В этой книге под словом «функция» всегда будет пониматься одно- однозначная функция в смысле B.3.32) или B.3.33), и все ситуации, в которых потребуются многозначные функции, мы будем описывать в терминах однозначных. Тернарное отношение, т. е. множество упорядоченных троек ((х, у), z), также может быть функцией. Условия этого даются пред- предложением B.3.33): для любых х, у, zt, zz из ((х, у), zt) ? F и ((х, у), г2) (Е 6 F следует zt = z2. Согласно нашим обозначениям, единственное г, относящееся к (х, у) (если такое существует), должно записываться в виде F ((х, у)); условимся для краткости одни скобки опускать и записывать его F (х, у). Если функция F является тернарным отношением, то мы будем ее называть также бинарной функцией (или функцией двух переменных, функцией двух аргументов). Те же определения, конечно, могут быть даны и для любого числа переменных, так что для любого целого положительного п мы будем говорить о функциях п переменных, или n-арных функциях. Наибо- Наиболее наглядным способом показать, что рассматриваемая функция F является, скажем, бинарной,— это описать ее область определения 3 (F), например 3 (F) = S X S. В алгебре вместо слова «функция» обычно употребляется слово «операция», при сохранении в точности того же значения. Так, когда мы говорим об операции умножения в области действитель- действительных чисел, мы имеем в виду бинарную функцию F с областью опре- определения Re X Re такую, что F (а, Ь) = а-Ь для всех а, Ь ? Re.
2.3, ОТНОШЕНИЯ И ФУНКЦИИ 63 Операции называются унарной, бинарной и т. д. при тех же усло- условиях, что и функции; так, операция умножения есть бинарная операция. B.3.35) Предположим, что G есть операция с областью опреде- определения S и что A s S. Говорят, что А замкнуто относительно G, если из х ? А следует G (х) ? А. Пред- Предположим, что F есть бинарная операция с областью определения S x S и что А ^ S. Говорят, что А замк- замкнуто относительно F, если из х, у ? А следует F(x,y)eA. Рассмотрим, например, операцию обращения ненулевых действи- действительных чисел: 3 (G) = Re — {0}, G (х) = — . Множество Ra — — {0} ненулевых рациональных чисел замкнуто относительно обра- обращения, а множество I — {0} ненулевых целых чисел — нет. Опера- Операция вычитания действительных чисел есть функция F с F (х, у) = = х — у, 3 (F) = Re х Re. Множество I целых чисел замкнуто относительно вычитания, а множество Р положительных целых чисел — нет. Отношения конгруентности. Встречающиеся в математике утверждения, связывающие равенство с операциями типа «если к равным величинам прибавить равные, то результаты равны», на нашем языке отношений и функций выглядят тривиальными. Например, если F — любая бинарная операция, at = а2, Ъ^ = Ь2 и (аи bi) 6 3 (F), то F (au bt) = F (а2, Ь\). Действительно, по определению F (au bj), имеем {{аи bd, F (аи ^)) 6 F и потому, в силу равенства (аи Ь^) = (аг, Ь2), также ((о2, Ь2), F (а,, Ь,)) 6 F. Следовательно, F (аь Ь4) есть то самое г, для которого ((а2, Ь2), z) g 6 F; но существует только одно такое г, и мы обозначали его F (az> bz). Подобные рассуждения, очевидно, применимы и в случае любого числа переменных. С другой стороны, если = есть отноше- отношение эквивалентности в множестве S, замкнутом относительно опе- операции F, то уже, вообще говоря, из а^ = аг и Ь^ = Ь2 не следует F (alt b^ = F (а2, Ь2). Случаи, в которых это верно, вызывают особый интерес: B.3.36) Пусть W — отношение эквивалентности в множестве S (вместо записи (а, Ь) ? W будем употреблять а^=Ь). Введем следующие определения:
64 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ (Г) Пусть G— унарная операция с 3 (G) = S, М (G) е5; тогда W называется отноше- отношением конгруентности относительно G, если из п! е= аг следует G (а^ = G (а2). (и) Пусть F — бинарная операция с 3 (F) = S X S, М (F) ? S; тогда W называется отноше- отношением конгруентности относительно F, если из а, = az, Ьг == Ь2 следует F (au bj = F (а2, Ь2). Заметим, что мы применяем к W термин «отношение конгруентно- конгруентности», только в том случае, если мы уже знаем, что W — отноше- отношение эквивалентности. Ясно, что понятие отношения конгруент- конгруентности можно было бы определить и в случае большего числа пере- переменных, но нам это не потребуется. Иногда удобно также более общее понятие «W есть отношение конгруентности относительно отношения U». Если, например, U бинарно, а == — знак эквивалентности относительно W, то из а1 == й2, bi е= Ь2 и (flj, bi) ? U должно вытекать (а2, bz) 6 U. Свойство W быть отношением конгруентности относительно, скажем, бинарной функции F может быть перефразировано так: класс эквивалентности по W, содержащий F (а, Ь), однозначно определен классами эквивалентности по W, содержащими а и Ь соответственно, и не зависит от выбора «представителей» внутри этих классов; короче говоря, функция F «хорошо определена» по отношению к W. Другими словами, приходим к функции, опреде- определенной на классах эквивалентности: B.3.37) Пусть W — отношение конгруентности на множестве S относительно бинарной операции F на S. Пусть, далее, М — совокупность классов эквивалентности [а] = Wa для а ? S. Тогда существует такая бинарная операция F с областью определения М, что для любых a, b ? S F (la], Ш) = [F (а, Ь)]. Нам остается только проверить здесь, что отношение, состоящее из троек (([a], [b]), [F (а, Ь)\), есть действительно функция. Но, если ([а'], [Ь'\) = ([а], Ш), то а = й', b = b' и, следовательно, F (a, b) = F (а, о), т. е. IF (a, b)] = [F (а , Ь')]. Рассмотрим в качестве примера следующее отношение W = {(х, у): х, у ? I их — у делится на 3} на множестве целых чисел. В этом случае имеется три класса эквивалентности: [0], [1], [2]. Бинарная опера- операция суммирования F (a, b) = a+ b «хорошо определена» относитель- относительно W, так как по B.3.37) на классах эквивалентности получаем ассоциативную операцию F(^, Y), которую будем обозначать Y@X. Легко проверяется, что [0]© [1] = [1], [1]© [2] = [3] = [0],
2.3 ОТНОШЕНИЯ И ФУНКЦИИ 65 12]® 12] = [4] = [1] и т. д. Более сжато: © [0] [1] [2] [0] [0] [1] [2] [1] [1] [2] [0] [2] [2] [0] [1] Аналогично можно определить функции любого числа переменных на классах эквивалентности во всех случаях, когда отношение экви- эквивалентности есть отношение конгруентности относительно таких функций. Точно так же, если W — отношение конгруентности отно- относительно бинарного отношения U, то можно однозначно определить соответствующее отношение I) между классами эквивалентности таким образом: ([а], Ш) 6 U тогда и только тогда, когда (a, b) ? U. Инверсия функции и композиция функций. Поскольку функции являются частными случаями отношений, мы можем применять к ним введенные ранее понятия инверсии и композиции. Так, инверсией для (унарной) функции F является множество всех тех пар (у, х), для которых {х, у) 6 F, т. е. множество всех пар (F (х), х) для х 6 3 (F); очевидно, инверсия функции не обязана быть снова функцией. Например, для функции F (х) = х2 с областью определе- определения I обе пары B, 4) и (—2, 4) принадлежат F, а потому обе пары D, 2) и D, —2) должны принадлежать ее инверсии, так что инверсия F функции F не является функцией. С другой стороны, инверсия G функции G (х) = 2х + 1 с областью определения I является функ- функцией: из (у, xt) 6 G и (у, хг) 6 G следует у = 2х± + 1 и у = 2хг + 1, и потому 2х± + 1 = 2х2 + 1 и xt = x2. Область определения функ- функции G совпадает с областью значений функции G, т. е. с множеством всех нечетных целых чисел. Формально мы могли бы определить G (х) = —н— на этой области. Можно усмотреть, что B.3.38) инверсия функции F тогда и только тогда сама является функцией, когда для любых хи хг 6 3 (F) из F (х^ = = F (х2) следует хх — хг {эквивалентным образом, из хх Ф хг следует F (л^) Ф F (х2)). Если инверсия F функции F является функцией, то мы будем назы- называть F функцией, обратной к F, и записывать ее F'1; в этом случае F будет называться также взаимно однозначной {одно-однозначной) функцией или соответствием (между 3 {F) и М {F)). B.3.39) Если F — взаимно однозначная функция, то 3){F~1) = = M{F) и M{F~l) = 3){F), для любого a?3){F) спра- справедливо а = F'1 {F (а)) и для любого b?3) (F'1) спра- справедливо b = F{F~1{b)).
66 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ Докажем, например, что а = F'1 {F (а)) для любого а ? ?fi {F) Так как F'1 (Ь) для любого b есть единственное такое х, что (Ь, х) ? 6 F'1, т. е. такое х, что .F (х) = Ь, то Z7 (F (а)) есть единственное л: такое, что F (х) = F (а), т. е. само а. Понятие взаимно однозначной функции непосредственно приме- применимо и к функциям любого числа переменных, единственное изме- изменение состоит в рассмотрении в качестве области определения функции множеств упорядоченных пар, троек и т. д. Например, функция G (х, у) — х + у с областью определения Р х Р не являет- является взаимно однозначной, а функция Н (х, у) = 2х -Зу при той же области определения взаимно однозначна. (Почему?) Согласно определению B.3.26), композиция F ° G двух функций F и G есть множество всех таких упорядоченных пар (х, у), что для некоторого z выполнено одновременно (х, г) ? F и (г, у) ? G. Но для любых х, у из существования такого г, что (х, г) ? i7, следует jc f S (f) и, так как F — функция, z должно быть равно F (х). Точно так же из (z, у) 6 G вытекает z 6 3> (G), т. е. F (х) ? 3) (G) и У — G (г), а потому у = G {F (х)). Следовательно, мы доказали, что B.3.40) если F, G — функции, то и Н = F ° G — функция, при- причем область определения функции Н состоит из всех тех х, для которых F (х) 6 3b (G), и для каждого х 6 6 3 (Н) выполнено Н (х) = G (F (х)). a G (х) = ластью определения I. Упражнения Например, если F (х) = хг с областью определения Re, = 2л; + 1 с областью определения I, то (F ° G) (х) = 2х2 + 1 с об- 1. (а) Показать, что для любых (не обязательно различных) элементов а, 6, с, d выполнено {а, Ь}— {с, d} тогда и только тогда, когда а = с и Ь = d или а = d и b = с. (б) Показать, что для любых элементов а, 6, с, d выполнено {{а}, {а, 6}}= = {{с}, {с, d}} тогда и только тогда, когда а = с и 6 = d. Поэтому упорядо- упорядоченную пару можно определить равенством (а, Ь) = {{а}, {а, Ь}} в чисто теоретико-множественных терминах. (в) Показать, что существование декартова произведения А X В B.3.8) можно было доказать, исходя из существования А {] В на основе пред- предложений B.1.39) — B.1.40), если упорядоченную пару определить, как в (б). 2. Найти область значений и область определения каждого из следую- следующих отношений; геометрически интерпретировать результаты: (а) {(х, у): x,yeRe и х2 + 4г/2 < 1}, (б) {(*, у): х,уеЯе и г/2 = х), (в) {(х, у): х, у ? Re и у = х2}, (г) {(*, г/): х, у е Re и г/2 = х2}, (д) {(х, г/, г): х, у, г ё Re и х — 2г/ + г = 3},- (е) {(х, г/, г): х, г/, г G Re и х2 + у2 + г2 < 1 и х + у = 1}. 3. С точки зрения наличия свойств рефлексивности, антирефлексивно- антирефлексивности, симметричности, антисимметричности, транзитивности, свойства быть
2.4. МАТЕМАТИЧЕСКИЕ СИСТЕМЫ ОТНОШЕНИЙ И ФУНКЦИЙ 67 отношением эквивалентности дать классификацию следующих отношений, приводя обоснования: (а) {(х,у): х,у?1 и лг < г/+ 1}, (б) {(х, у): х, у е I и Xs = г/2}, (в) {(х,у): x,ytl и |х|<|г/|}, (г) {(х, у): х, у d I и х, у оба четны и х ¦< г/, или х, у оба нечетны и х ^ у, или л; четно, а у нечетно}, (д) {(X, Y): X с= I, К с= I и ХПК=0). 4. Показать, что следующие утверждения справедливы для любых отношений U, V, W (напомним, что W — инверсия отношения W): (а) ?/o(VolF) = (?/°V)°r, (б) U = U, (в) (uTv) = VoU, (г) (/ о (У у W) = ((/ о V) U (U ° Ю- Показать, что равенство U о (V П №) = (?/ ° V) П (^ ° №)> вообще говоря, не имеет места. 5. Показать, что отношение W с областью определения 3) (W) = 5 тогда и только тогда является отношением эквивалентности на 5, когда W = W и W oW ?= W. 6. Найти композиции функций F о G и G о F в каждом из следующих случаев, указав области определения: (а) F(x) = x2-9(x?Re), G (х) = Ух (х g Re, .v>0), (б) F(x)=-L(xgRe, x^O), G = F, (в) F(x) = *2(*GRe), G(x)=( ?' еСЛИ ~i<^<1'1 . v ' ' ' l_ 1, если x < — 1 или 1 < x. 7. Какие из следующих функций взаимно однозначны? В каждом таком случае найдите обратную функцию и область ее определения: (а) F (х) = х2+ 1, хб Re, (б) F (х) = х3, хе Re, (в) F (х) = \1(х* +1), * € Re, * > О, (г) F (х, у) = 2*-у, х, у 6 Re. 8. Пусть, для любых х, у ? I, (я, г/) S W7 тогда и только тогда, когда х — у делится на 4 ((х, у) 6 W записываем как х = у). (а) Показать, что = есть отношение эквивалентности с четырьмя клас- классами эквивалентности [0], [1], [2], [3]. (б) На классах эквивалентности определим операции ® и® формулами [а] © [Ь] — [а -(- Ь], [а] (х) [Ь] = [а-Ь]. Построить таблицу действия для каждой операции. Какие из следующих утверждений верны и какие неверны (М — множество классов эквивалентности). Докажите это. (i) Для каждого X ? М, X ф [0] =Х; (и) для каждого Х?М, X(g)[l] = X; (iii) для каждого X ? М существует такое Y ? М, что ХфУ=[0]; (iv) для каждого Х? М, X Ф [0] существует такое Kg М, что X(9)Y = [\h (v) если X, У, ZeM, Х=^ [0] и X0 Y = X0Z, то F = Z; (vi) если X, Y, Z?M, то X<g>(Y ® Z) = {X <g>Y) ®(X®Z). 2.4. Математические системы отношений и функций В этой книге мы будем изучать свойства различных числовых множеств S по отношению к различным операциям Fu F2, . . . на S и отношениям Wit W2, . . . в S. Далее мы часто будем выделять некоторые элементы alt az, ... множества S, которые обладают
68 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ специальными свойствами, отличающими их от других элементов. Различные такие системы, состоящие из функций, отношений и выде- выделенных элементов, могут обладать близкими свойствами. Например, множество действительных чисел Re с операцией сложения и выде- выделенным элементом 0 «очень похоже» на множество действительных положительных чисел Re' с операцией умножения и выделенным элементом 1. Так, х + у = у + х для всех х, у 6 Re и х -у = у -х для всех х, у 6 Re', х + 0 = х для всех х 6 Re и хЛ = х для всех х 6 Re'; для любого х ? Re существует такое у t Re, что х + у = О (именно —х) и для каждого „v 6 Re' существует такое у ? Re', что х-у = 1 (именно —5 и т. д. Поэтому представляется разумным говорить о свойствах систем (упорядоченных троек) (Re, +, 0) и (Re', •, 1). Приходим, таким образом, к следующему понятию: B.4.1) Математическая или алгебраическая система есть упорядоченная (к -\- I -\- m -\- \)-ка (S, Fu F2, . . ., Fk, Wlt W2, . . ., Wu au a2, ¦ . ., am), в которой Flt F2, . . ., Fh — операции на множестве S, относительно которых S замкнуто, Wit Wz, . . ., W\ — отношения в S, и оЛ, а2, ¦ . ., am — некоторые выделен- выделенные элементы из S. Изоморфизм. С алгебраической точки зрения важны не столько конкретные способы определения операций и функций на S, сколько свойства множества S относительно этих функций и операций. В этом смысле мы будем говорить, что рассматриваем по сути дела одну систему, если системы (S, Fit Fz, . . ., Fk, Wit Wz, . . ., Wи au a,, . ., am) и (S\ F[, F't F'h, W[, W'2 W'h a[, a'2, . . . . . ., a'n) обладают одинаковыми свойствами. Чтобы выразить это точнее, нужно прежде всего выделить типы систем, которые можно сравнивать. B.4.2) Две математические системы (S, Fit Fz, ..., Fh, Wt, Wz, ..., Wlt au a2, .... am) и (S\ F[, F'2, . .., F'h; W[, W't, ..., Ж/[,, а[, а'„..., а'т.) называются однотипными, если (i) & = ?', / = /' и т = т'\ (ii) соответствующие функции Ft и Fi> имеют одина- одинаковое число аргументов, так что если Ft унарна naS, 3(Ft) = S, то F\ унарна на S', 3>{F'i) = S', а если Ft бинарна на S, 3> (Ft) = S x S, то F[ би- бинарна на S' и 3}(F'i) = S'xS';
2,4. МАТЕМАТИЧЕСКИЕ СИСТЕМЫ ОТНОШЕНИЙ И ФУНКЦИЙ 69 (iii) соответствующие отношения W\ и Wt применяют- применяются к одному и тому же числу аргументов, так что, если W-t бинарно в S, WiczS x S, то W; би- бинарно в S', W'iCzS'xS'. Например, (Re, <) и (Re, +) неоднотипны, (Re, ¦) и (Re. Sq), где Sq (x) = х2, также неоднотипны, a (Re, + , •, V 2) н (Re', •, + , —3) однотипны. Алгебраическая неразличимость двух систем теперь может быть выражена следующим образом: B.4.3) Две математические системы (S, .. .) и (S', ...) такие, как в B.4.2), называются, изоморфными, если они однотипны и если существует функция G, обладающая следующими свойствами: (i) G есть взаимно однозначное соответствие между S и S'(m. e. 3{G) = S и M{G) = S'); (и) G(ai) = a'l, ..., G(am) = a'm; (iii) если Wv скажем, бинарно, то, для любых х, y?S, (х, у) ? Wi тогда и только тогда, когда (G(x), G (У)) 6 Wi; аналогичны требования на Wz, W2, ... ..., Wi, W'i (при любом количестве аргументов); (iv) если Ft, скажем, унарна, то, для любых х, y(iS, (х, у) ? Fi тогда и только тогда, когда (G (х), G(y))?F'v т. е. G(/71(x)) = Jp;(G(x)); если Fu ска- скажем, бинарна, то, для любых х, у, z? S, (х, у, г) ? F{ тогда и только тогда, когда (G(x), G(y), G(z))?F[, т. е. G(Fx(x, у)) — F[(G(x), G(y)); требования на F2, F» ..., Fh, F'h при любом количестве аргу- аргументов аналогичны. Если требования (i) — (iv) выполнены, то будем говорить, что G осуществляет изоморфизм между системами (S, ...) и (S', ...), и писать (S, . ..) ^ s*(S', ...)• В качестве иллюстрации покажем наличие изоморфизма (Re, +, <, 0) ^ (Re', -, <, 1), где, как обычно, Re' = {х: х 6 Re и х> 0}, символ -f использует- используется для записи бинарной операции F (х, у) = х + у на Re X Re, • обозначает операцию F' (х, у) = х-у на Re' X Re', а значок < в правой части означает ограничение отношения < на множе- множество Re'. Искомой взаимно однозначной функцией G, осуществляю- осуществляющей изоморфизм, будет G (х) = 2х для х 6 Re. Для доказательства достаточно проверить, что
70 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ (О 3 (G) = Re, M (G) = Re' (т. е. для каждого у ? Re' с у > О существует такое л: ? Re, что 2х = у), и G взаимно однозначна (т. е. из 2Х1 = 2Х2 следует xt = х2); (И) G @) = 1 (т. е. 2° = 1); (iii) х < у тогда и только тогда, когда G (х) < G (у) (т. е. тогда и только тогда, когда 2Ж<2У); (iv) G (F (х, у)) = F' (G (х), G (у)) (т. е. G (х + у) = G (x)-G(y), или 2Ж+Ы = 2х-2У). Но эти свойства экспоненциальной функции знакомы читателю (то значение х в (i), для которого 2* = у, обычно обозначается logs у)', в дальнейшем в этой книге мы еще рассмотрим их. Теоретико-множественная эквивалентность. Одним из частных случаев математической системы являются системы, вовсе не содержащие ни функций, ни отношений, ни выделенных элементов, другими словами, «1-ки» (S) множеств S. В этом случае B.4.4) утверждение, что S изоморфно S', сводится к утвержде- утверждению, что между S и S' существует взаимно однозначное соответствие G. В таком случае мы будем говорить так- также, что S и S' теоретико-множественно эквивалентны, или равночисленны. Последний термин употребляется потому, что элементы а, Ь, . . . из S и а , Ъ', ... из 5' можно соединить в пары по правилу а = = G (а), Ь' = G (Ь), . . .; это — абстракция от наиболее примитив- примитивного способа счета (чтобы сосчитать овец, можно привязать каждую к отдельному дереву). Однако, если мы будем говорить, что множе- множества имеют одинаковое количество элементов в том случае, когда они теоретико-множественно эквивалентны, то придем немедленно к ситуации, кажущейся парадоксальной: множества S = Р = = {1, 2, 3, . . .} и S' = {2, 4, 6, . . .} теоретико-множественно эквивалентны (изоморфизм устанавливается, например, функцией G (х) = 2х), и одновременно второе является собственным подмноже- подмножеством первого. В действительности, противоречия здесь тем не менее нет, если не настаивать на том, чтобы для произвольных множеств выполнялось очевидное для конечных множеств свойство, согласно которому собственное подмножество не может иметь того же числа элементов, что и все множество. На самом деле эти сооб- соображения делают возможным теоретико-множественное определение конечности и бесконечности множества: B.4.5) Множество S конечно тогда и только тогда, когда оно не является теоретико-множественно эквивалент- эквивалентным никакому своему собственному подмножеству; множе- множество S бесконечно тогда и только тогда, когда оно не является конечным.
2.4. МАТЕМАТИЧЕСКИЕ СИСТЕМЫ ОТНОШЕНИЙ И ФУНКЦИЙ 71 Говорят, что два множества имеют одинаковую мощность, если они теоретико-множественно эквивалентны; заметим, что в этом определении ничего не говорится о том, что такое мощность, а определяется только отношение между множествами, именно отношение быть множествами, одинаковой мощности. Однако мы могли бы пытаться образовать множество B.4.6) W = {(S, S'): S и S' теоретико-множественно экви- эквивалентны} и немедленно получить ^2.4.7) W есть отношение эквивалентности в смысле B.3.28). Мы могли бы пойти дальше, образовать классы эквивалентности по отношению W, затем назвать кардинальными числами сами эти классы и, наконец, назвать мощностью множества то карди- кардинальное число (класс эквивалентности), к которому данное множе- множество принадлежит. Однако в рамках обычной теории множеств построение множества W, как в B.4.6), не может быть оправдано. Тем не менее с некоторыми модификациями этот подход оказывается применимым к задаче определения обычного понятия числа в точ- точных теоретико-множественных терминах. Мы не собираемся сейчас развивать этот подход, оставив его до главы 3, которая начнется с того, что основным и интуитивно ясным понятиям конечных чисел будет придана аксиоматическая форма. Нам еще представится возможность по разным поводам вернуть- вернуться к понятию теоретико-множественной эквивалентности. В частно- частности, в главе 7 мы рассмотрим еще один «парадокс бесконечности», мы увидим также, что вопреки «естественной» догадке не все беско- бесконечные множества имеют одинаковую мощность. Многие вопросы современной теории множеств связаны именно с различными «вели- «величинами бесконечности». Подсистемы. Другим важным понятием в теории общих алгеб- алгебраических систем, с которым нам часто придется сталкиваться, является понятие подсистемы. Может быть, точный смысл даваемо- даваемого ниже определения легче усмотреть из примеров, в которых одна из систем не является подсистемой другой. Так, две системы (Re, +, <) и (Re', •, <), как мы уже видели, изоморфны. Для множества Re' положительных действительных чисел имеем Re' ? Re. Однако мы не можем сказать, что система (Re', •, <) есть подсистема системы (Re, +, <), так как, вообще говоря, зна- значения операции х -у в первой системе и х + у во второй системе различны (верно, что для некоторых х, у 6 Re' выполнено х-у = = х + у, например, х = 2, у = 2 или х = 3/2, у = 3 и т. д., но, и это главное, неверно, что для всех х, у ? Re' выполнено х-у = = х -\- у, например, 1 •! Ф 1 + 1). С другой стороны, систему
72 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ (Re', <) мы будем рассматривать как подсистему системы (Re, <), поскольку отношение < в первой системе выполняется тогда и толь- только тогда, когда оно выполняется во второй системе. Итак, имеем определение: B.4.8) Рассмотрим две однотипных системы (S, Flt . . ., Fh, Wt Wh a, am) и (S', F[, . . ., F'h, W[, . . ., W'i, a[, . . ., a'm). Будем говорить, что вторая система есть подси- подсистема первой или что первая система есть рас- расширение второй, если (О S' = S; (ii) а[ = аи а'2 = аг а'т — ат; (iii) если отношение Wit скажем, бинарно, то, для любых х, у g S', (х, у) ? W[ тогда и только тогда, когда (х, у) g Wu требования на Wz, W2, . . ., Wu W'i при любом количестве аргументов аналогичны; (iv) если Fu скажем, бинарно, то, для всех х, у ?S', К (х> У) — Fi (х, у); требования на F2, F'2, . . . . . ., Fk, Fft при любом количестве аргументов аналогичны. Будем также говорить, что S' есть подсистема первой системы или просто чт68' есть подсистема S по отношению к заданным операциям, отношениям и константам, если эти условия (i) — (iv) выполнены. Если заранее известно, что одна система является подсистемой другой, или если это хотят подчеркнуть, то обычно для обозначения операций, отношений и выделенных элементов обеих систем исполь- используют одинаковые символы. Так, например, пишут (Re', +, •) и (Re, +, •). Такая запись неявно включает утверждение, что в первой системе + означает бинарную операцию F' с областью определения Re' X Re' и областью значений, содержащейся в Re', такую, что F' (х, у) = х + У для любых х, у 6 Re', где -\ опера- операция, входящая во вторую систему; такое же утверждение относится и к операции • умножения. Неявно используется также тот факт, что для операции + на Re имеем х + у 6 Re' для всех х, у 6 Re' (замкнутость Re' относительно операции + из второй системы). Заметим в этой связи, что о (Re', —) нельзя говорить как о подсисте- подсистеме (Re, —), хотя Re' = Re, поскольку множество Re' не является замкнутым относительно вычитания, и потому (Re', —) не является даже системой.
2.4. МАТЕМАТИЧЕСКИЕ СИСТЕМЫ ОТНОШЕНИЙ И ФУНКЦИЙ 73 Вследствие условий (Hi), (iv) нашего определения B.4.8) такая вольность в записи различных операций и отношений не приводит, вообще говоря, к недоразумениям. Единственный случай, в котором необходимо быть осторожным, это когда мы имеем дело с несколь- несколькими расширениями одной системы, которые, конечно, между собой не обязательно связаны отношением включения. Мы можем в таких случаях для одного из расширений сохранить исходные символы, а для записи операций, отношений, элементов других расширений использовать новые символы, например Re', +, •), (Re, + > •)> (S, ф, ®). Здесь тот факт, что первая система является подсисте- подсистемой третьей, можно выразить записями Re' s S и, для всех х, у 6 Re', х + у = х (В у их -у = х ® у, в то время как справед- справедливость того же утверждения для первой и второй систем содержит- содержится уже в обозначениях. Многие любопытные алгебраические свойства системы насле- наследуются всеми подсистемами данной системы. Так, в обозначениях B.4.8) если операция ^ коммутативна (т. е. Ft (х, у) = Fi (у, х) для всех х, у ?5), то коммутативна и операция F[ (т. е. F[ (x, у) = = F[ (у, х) для всех х, у ? 5'). Но в противоположность системам, связанным отношением изоморфизма, у систем, связанных усло- условием B.4.8), не обязательно одинаковы все алгебраические свойства. Так, в системе (Re, +) существует такое х (? Re), что х + у — у для всех у (? Re),— именно х = 0,— в системе же (Re', +) соответ- соответствующее утверждение неверно, т. е. не существует такого х F Re'), что х + у = у для всех у (? Re'). Конечно, могут быть такие слу- случаи, когда собственная подсистема изоморфна всей системе,— например, (Е, +) и (I, +), где Е — множество всех четных чисел,— но такие случаи редко встречаются в алгебре. Позднее мы еще будем говорить о связи между свойствами систем и некоторых их подсистем. Мы заканчиваем раздел некоторыми общими резуль- результатами об изоморфизмах между системами и о расширениях систем, которые нам потребуются в будущем. Ситуация, с которой мы будем чаще всего встречаться, следующая. Имеем систему (S, . . .) = (S, Fu . . ., Fh, Wt Wh au . . ., an), которую мы считаем в некотором отношении дефектной, и хотим расширить ее до новой системы E*, . . .), лишенной этих дефектов. Например, дефектом системы (Р, +) положительных целых чисел можно считать невозможность введения операции вычитания, и это служит мотивировкой перехода от Р к множеству всех целых чисел I и распространения операции + с Р на I: на последнем операция вычитания всегда выполнима. На практике может оказаться, что легко найти систему (S*, . • •)» однотипную с E, . . .) и обладающую желаемыми свойствами, но не содержащую исходную систему в качестве подсистемы, а лишь
74 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ содержащую подсистему (S, . . .)> изоморфную исходной. Графиче- Графически ситуация может быть изображена так (рис. 22): G Рис. 22. Здесь G — функция, осуществляющая изоморфизм (S, . . .) ^ ^ (S, • • ¦)• Всегда ли можно найти расширение (S*, . . .) систе- системы E, . . .), обладающее теми же свойствами, что и система (S*, • • •)? Утвердительный ответ на этот вопрос следует из утверж- утверждения: B.4.9) Пусть (S, . . .), (S, • • •) и (S*, . . .) — однотипные математические системы, (S, . . .)^ (S, ¦ . .) и (S, ¦ ¦ •) — подсистема системы (S*, . . .)• Существует такая систе- система (S*, . . .), что (S*. . . .)е (S*. . . ¦) и (S, . . .) — подсистема системы (S*, . . .). Графически это означает, что мы можем дополнить рис. 22 так (рис. 23): н G н / Рис. 23. Здесь Н — функция, осуществляющая изоморфизм между искомой системой (S*, . . .) и системой (S*, • ¦ •)>—должна быть выбрана так, чтобы^О и Н были согласованы на S, т. е. G (х) = Н (х) для всех х 6 S. Проведем доказательство утверждения B.4.9) для достаточно типичного случая систем вида (S, F, W, а), где F — бинарная опе- операция на S, a W — бинарное отношение в S. Итак, имеем три одно- однотипных системы (S, F, W, a), (S, F, W, a), (S*. F*. W*, а*). По предположению, (S, . . .) ^ (S, • • •). Следовательно, существует функция G, удовлетворяющая следующим условиям: A) G взаимно однозначна, 3 (G) = S и Я (G) = S; B) G (а) = а;
2.4. МАТЕМАТИЧЕСКИЕ СИСТЕМЫ ОТНОШЕНИЙ И ФУНКЦИЙ 75 C) (х, у) 6 W тогда и только тогда, когда (G (x), G (у)) б W для всех (х, у) б S; D) G (F (х, у)) = F (G (x), G (у)) для всех х, у б S. По пред- предположению B.4.9), система (S, • . ¦) есть подсистема системы (S*, • • .)> а потому E) S ?= S*; F) а = а*; G) (и, v) 6 W тогда и только тогда, когда (и, v) б W* для всех и, v 6 S; (8) F (и, v) — F* (и, v) для всех и, v g S- Первый шаг в построении искомой системы (S*, . . .) состоит в нахождении такого множества S* и такой функции Н, что (9) S SS*; A0) Н взаимно однозначна, 3> (Н) = S*, Л (Я) = S*; A1) Н (х) = G (х) для всех х б S. Прежде всего, нам нужно определить элементы множества S*—S так, чтобы они находились во взаимно однозначном соответствии с элементами S* — S- Естественно, множества S и S* могли иметь общие элементы. Поэтому будем рассматривать другой экзем- экземпляр множества S* — S, именно декартово произведение {S} X X {S* — S}, состоящее из элементов (S, и) для всех и б S* —S. Но, согласно данному в упражнении 1 к предыдущему разделу определению упорядоченной пары, (S, и) = {{S}, {S, и}} и (S, и) б S невозможно. Действительно, в противном случае мы имели бы три множества X, Y, S, связанные соотношениями S б X, X ?Y, Y б S, что невозможно при наших предположениях о множествах (эта ситуация специально избегается в аксиоматиче- аксиоматической теории множеств). Итак, S f] ({S} X (S* — S)) = 0- Поэтому можно положить S* = S U ({S} x (S* — S)) и корректно опре- определить функцию Н, положив Н (х) = G (х) для х б S и Н (х) = и для х 6 {S} х (S* — S). где и б S* —S —единственное, для кото- которого х = (S, и) по определению упорядоченной пары. Свойства (9), A0), A1) для построенных S* и Н проверяются непосредственно. Имея (9) — A1), остальную часть построения провести легко. Прежде всего положим A2) а* = а. Далее, отношение W* задаем на множестве S* так, как W задано на образах элементов множества S* относительно функции Н, т. е. A3) (х, у) б W* тогда и только тогда, когда (Н (х), Н (у)) б W* для всех х, у б S*.
76 ГЛ. 2. ТЕОРЕТИКО-МНОЖЕСТВЕННЫЕ ПРЕДПОСЫЛКИ Наконец, чтобы решить, какое значение z приписать функции F* (х, у) при (х, у) ? S*, посмотрим, какое значение w имеет F* (Я (х), Я (у)), и выберем z так, чтобы w соответствовало ему относительно Я. Другими словами, определим A4) F* (х, у) = Я-1 (F* (Я (х), Я (у)) для всех х, у ? S*. Поэтому A5) Я (F* (х, у)) = F* (Я (х), Я (у)) для всех х, у ? S*. Из A0) — A5) вытекает A6) Я устанавливает изоморфизм между (S*, F*, W*, а*) и (S*. F*, W*. а*). Остается показать A7) (S, F, W, а) есть подсистема систем (S*, F*,W*, a*). Проверим, например, условия на F и F*. Рассмотрим любые х, у 6 5. Поскольку F (х, у) ? S, имеем Я (F (х, у)) = F (Я (х), Я ДО) по D) и A1). Но по A) и A1) Я (х), Н (у) € S, так что F (Я (х), Я ДО) = F* (Я (х), Я по (8). Следовательно, Я OF (х, y)) = F* (Я (х), Я (у)) и F (х, #) = Я-1 (F* (Я (х), Я Итак, .F (х, у) = f* (д:, г/) по определению A4) функции F*. Доказательства условий на W, W* проводятся аналогично, используя A) — (8), A1) и A3). Поскольку а* выбрано равным а, доказательство полностью завершено.
ГЛАВА 3 ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА 3.1. Основные свойства Положительные целые числа употребляются для двух главных целей — для счета и для упорядочивания. Простейшими конкрет- конкретными представителями этих чисел являются ряды черточек Пересчитывая (конечное) множество объектов, мы каждому объекту ставим в соответствие некоторую черточку и, таким образом, уста- устанавливаем взаимно однозначное соответствие между данным множе- множеством и множеством черточек. Упорядочивая множества, мы зану- занумеровываем его элементы в соответствии с последовательностью черточек как первый, второй, третий и т. д. Основные свойства положительных целых чисел могут быть описаны и изучены с любой из этих двух точек зрения, причем первая приводит к теории карди- кардинальных чисел в теории множеств, а вторая — к теории порядковых чисел. Мы начнем с развития второго подхода с тем, чтобы позже вернуться и к первому. Итак, мы будем рассматривать положительные целые числа как объекты, которые можно сравнивать посредством некоторого отно- отношения порядка <. Мы будем говорить, что а предшествует Ь, или что b следует за а, если а < Ь. Мы могли бы пытаться охарактери- охарактеризовать положительные целые числа посредством свойств отноше- отношения <• Но это удобнее сделать через свойства другого, еще более примитивного отношения — отношения «а непосредственно предше- предшествует Ь», или «Ь непосредственно следует за а»; в нашей интерпре- интерпретации черточками это означает, что Ъ получается из а добавлением одной черточки. Мы будем говорить при этом «Ь следует за а» и писать b = Sc(a). Очевидно, Sc — функция, определенная на множестве всех положительных целых чисел. Какими основными свойствами она обладает? Прежде всего существует положительное целое число, которое мы обозначаем 1, не следующее ни за каким положительным целым числом. Во-вторых, каждое положительное целое число Ь, отлич- отличное от 1, следует за единственным положительным целым числом а, т. е. из 6==Sc (а4) и b =? Sc (а2) следует щ = а2; другими словами, функция следования Sc взаимно однозначна. Наконец, легко
78 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА усмотреть, что, применяя функцию Sc достаточное число раз, любое положительное целое можно получить из 1. В более точных теоретико-множественных терминах последнее означает, что если множество А содержит число 1 и число Sc (х) вместе с каж- каждым х, то А содержит все положительные целые числа. Системы Пеано и доказательства по индукции. Мы пришли к рас- рассмотрению систем, обладающих тремя основными свойствами. 3.1. Определение. Под системой Пеано мы понимаем систему (Р, Sc, 1), где Sc — функция на Р, относительно которой Р замкнуто, и где 1 ? Р, такую, что (i) Sc (х) Ф 1 для всех х ? Р; (и) для всех х, г/6 Р из Sc (х) — Sc (у) следует х = у; (Ш) если А ^ Р, 1 6 А и А обладает тем свойством, что из х ? А следует Sc (х) ? А, то А = Р. При нашем интуитивном понимании целых положительных чисел эти свойства, очевидно, выполнены *). Поэтому тот, кто согласен с существованием целых положительных чисел, должен согласиться и с существованием по крайней мере одной системы Пеано; вывести же существование системы Пеано из общих принципов теории мно- множеств, описанных в предыдущих главах, невозможно. Итак, мы будем рассматривать утверждение о существовании хотя бы одной системы Пеано как основную, первоначальную гипотезу, лежащую в основе всего дальнейшего изучения (другая, эквивалентная этой гипотеза, называемая аксиомой бесконечности, приведена в при- приложении 1). 3.2. Аксиома. Существует по меньшей мере одна система Пеано. Кроме аксиомы 3.2 и аксиом теории множеств, на которые мы ссылались в главе 2, никаких других аксиом или предположений в этой книге нам не потребуется. Одной из наших главных целей будет доказательство того, что система Пеано по сути дела единственна, т. е. любые дие системы Пеано (Р, Sc, 1) и (Р', Sc', Г) изоморфны. Убедимся прежде всего, что для единственности все условия определения 3.1 существенны (не добиваясь формальной строгости аргументации). Простейшая система (Р\ Sc', Г), удовлетворяющая усло- условиям 3.1 (ii) и 3.1 (iii), но не 3.1 (i), состоит из единственного эле- элемента Г, Р' = {Г}, и функции Sc', заданной равенством Sc' (Г) = *) Хотя положительные целые числа изучались уже в древности и исполь- использование аксиоматического метода насчитывает два тысячелетия, в явной форме аксиоматический подход к теории положительных целых чисел был применен только в конце девятнадцатого столетия, первоначально в работах мате- математиков Р. Дедекинда и Дж. Пеано. Система условий 3.1 прямо соответ- соответствует аксиомам Пеано.
3,1, ОСНОВНЫЕ СВОЙСТВА 79 = Г. Система (Р', Sc', Г), удовлетворяющая условиям 3.1 (i) и 3.1 (in), но не 3.1 (п), должна содержать по меньшей мере два различных элемента. Пусть Г, 2'— два любых объекта, Р' = = {Г, 2'}, Sc' (Г) = 2' и Sc' B') = 2'; тем самым искомая система (Р\ Sc', Г) построена. Наконец, чтобы построить систему, удовле- удовлетворяющую условиям 3.1 (i) и 3.1 (и), но не 3.1 (Hi), нам придется рассматривать бесконечное множество объектов, так как в нем долж- должны содержаться элементы Г, Sc' (Г), Sc' (Sc' (Г)), каждый из которых, кроме первого, по свойству 3.1 (i) отличен от Г, а по свой- свойству 3.1 (п) из, скажем, Sc' (Sc' (Г)) = Sc' (Г) следовало бы Sc' (Г) = Г, что противоречит 3.1 (i), а потому все элементы после- последовательности различны. Но, помимо элементов последовательности, в множестве могут содержаться и другие элементы. Введем в него, например, новый элемент Ь, отличный от всех Г, Sc' (Г), Sc' (Sc' (I')) и элементы Sc' (b), Sc' (Sc' (b)), . . . Пусть Р состоит из всех элементов, полученных операцией Sc' из элементов Г и Ъ. Полученная система (Р', Sc', Г) не удовлетворяет условию (in) из 3.1, поскольку за множество А можно взять множество элементов {Г, Sc' (Г), Sc' (Sc' (I')), . . .}. Заметим, что в этом последнем примере системы, не являющейся системой Пеано, существовал элемент Ъ, не следовавший ни за каким элементом. В системе Пеано такое возможно, только если 6=1, как показывает следующая теорема. 3.3. Теорема. Пусть (Р, Sc, 1) — система Пеано. Для любо- любого х 6 Р либо х = 1, либо существует такое у 6 Р, что х = Sc (у), причем в последнем случае такое у единственно. Доказательство. Из приведенных выше примеров ясно, что для доказательства теоремы необходимо использовать усло- условие (ш) из определения 3.1. Пусть А = {х: х ?Р и х = I или х = Sc (у) для некоторого у ? Р}. Мы хотим доказать — это и есть первое утверждение теоремы,— что А = Р. Очевидно, А ^ Р и 1 ? А. Остается показать, что Sc (х) 6 А для любого х ? А, т. е. что для любого х ? А либо Sc (х) — 1, либо Sc (х) = Sc (z) для некоторого z 6 Р. Первое, очевидно, противоречит свойству 3.1 (i) систем Пеано, зато второе всегда выполнено •— достаточно положить z = x. Для доказатель- доказательства единственности у сошлемся на свойство 3.1 (и) — из Sc {у) = = х и Sc (г) = х следует у = z. Первая часть приведенного выше доказательства — простей- простейший пример так называемого доказательства по индукции. Вообще такое доказательство применимо, когда мы хотим показать, что некоторое условие Л (х) удовлетворяется при всех х 6 Р, где (Р, Sc, 1) — система Пеано. Именно, мы образуем множество А = = {х: х 6 Р и Л (х)} и с помощью 3.1 (ш) доказываем, что А = Р. Основные этапы доказательства таковы:
80 ГЛ. 3, ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА (i) показать, что справедливо Л A); (и) показать, что из х ?Р и справедливости Л (х) следует справедливость A (Sc (л;)). Мы будем в дальнейшем часто прибегать к такому методу доказа- доказательства в применении к целым положительным числам. Функции на системах Пеано. До сих пор операции сложения, умножения, возведения в степень на множестве положительных целых чисел еистематически не изучались. Теперь мы могли бы попытаться выяснить основные их свойства, причем сразу в приме- применении к любым системам Пеано. Однако существует стандартная процедура, сводящая изучение свойств этих операций к изучению свойств самих систем Пеано. Допустим, например, что мы уже ввели и исследовали операцию умножения. Как теперь вычислить степень 2а для любого а 6 Р? Интуитивно, 2а является произведе- произведением а экземпляров элемента 2, т. е. 21 = 2, 22 = 2-2, 23 = B -2) -2 = 22 -2, 24 = (B -2) -2) -2, вообще если Ъ непосредственно предшествует а, а = Sc (b), то мы вычисляем 2а, вычислив вначале 2Ь и умножив результат на 2, т. е. 2Sc (ь) _ 2Ь. о Продолжая рассуждение, т. е. переходя далее от Ъ к непосредствен- непосредственно предшествующему элементу и т. д., мы сведем вычисление 2й к вычислению 21, которое, по приведенному выше интуитивному определению, есть 2. Итак, правила C.1.1) 2* = 2; полностью определяют функцию 2а для а 6 Р. Заметим, что эти правила не задают в явном виде функцию 2а, а задают только неко- некоторую процедуру вычисления 2а, и интуитивно ясно, что эта про- процедура приведет к единственному значению 2а для любого фикси- фиксированного а 6 Р. В общих терминах описанная процедура представ- представляется следующим образом. Мы предполагаем, что нам задана некоторая унарная функция G (х) (в разобранном случае G была функцией умножения на 2, G (х) — х-2 для любого х ? Р), и мы хотим определить функцию F (х) (в разобранном случае F (х) = 2х), принимающую при х = 1 заданное значение с (в нашем случае с — 2). Именно, отношение F (Sc (x)) к F (х) для любого х?Р мы задаем, используя функцию G: F (Sc (х)) = F (х) «2 = G (F (х)). Вопрос состоит в том, можем ли мы утверждать для любого с 6 Р и любой функции G на Р со значениями в Р, что существует
3.1. ОСНОВНЫЕ СВОЙСТВА 81 функция F с областью определения Р, для которой C.1.2) F(l) = c, F (Sc (*)) = G(F (x)) для любого х?Р. Далее, можем ли мы утверждать, что такая функция единственна, или может существовать несколько таких функций? Интуитивные причины существования и единственности функции F ясны, однако формальное доказательство (см. нижеследующую теорему) содержит некоторые новые идеи. (Читателю рекомендуется прочитать это доказательство дважды — первый раз, обращая внимание только на общую идею, и второй раз, чтобы увидеть необходимость всех деталей; можно также, наоборот, совсем пропустить это место с тем, чтобы возвратиться к нему после изучения всех применений теоремы в остальной части главы.) В сформулированной ниже теореме мы рассматриваем чуть более общую ситуацию: ищем функцию F с областью определения Р и некоторым подмножеством фиксирован- фиксированного множества S в качестве области значений; при этом, чтобы G (F (х)) было определено, функция G должна иметь область опре- определения S. 3.4. Теорема. Пусть заданы множество S, элемент с 6 S и некоторая функция G с 2Ё (G) — S, M (G) s S. Пусть далее (Р, Sc, 1) — система Пеано. Существует, и притом единственная, такая функция F, что (i) 3S (F) = Р и Я (F) <= S; (и) F(l) = c; (iii) F (Sc (x)) = G(F (x)) для всех х ? P. Доказательство распадается на две части — доказа- доказательство существования хотя бы одной такой функции и доказа- доказательство ее единственности. Часть 1. Искомая функция F есть некоторое отношение W s P X S, обладающее свойствами (и)' (l,c)eW; (iii)' если (х, у) 6 W, то (Sc (x), G (у)) 6 W (последнее утверждение — перефразировка утверждения (iii), что из F (х) = у следует F (Sc (x)) = G (у)). Конечно, отношения, удо- удовлетворяющие свойствам (и)' и (iii)', существуют (например, само Р X S), и их, вероятно, много; искать среди них нужное будем, руководствуясь критерием: пара (а, Ь) должна принадлежать иско- искомому F, только если это диктуется условиями (и)' и (iii)', т. е. F ищем как наименьшее из всех отношений, удовлетворяющих условиям (И)' и (iii)'. Итак, A) пусть М — совокупность всех отношений W, удовлетворяю- удовлетворяющих условиям (и') и (iii)'. Положим F = ("I W [W ? ML
82 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Из свойств операции пересечения следует B) если W 6 М, то F g=W. Прежде всего нужно показать, что построенное F удовлетворяет условиям (И)', (iii)', т. е. само содержится в К\. C) (Uc)?F. Это прямо следует из того, что A, с) ? W для всех IF f M и из определения пересечения f|. Далее, D) если (х, у) € F, то (Sc (x), G (у)) 6 F. Действительно, если (х, у) ? F, то (х, у) 6 W для всех W ? М, поэтому по условию (iii)' (Sc (x), G (у)) ? W для всех W 6 М, так что (Sc (x), G{y)) eF = f)W [W e MJ. Проверим теперь выполнение условия (i) для построенного отношения F, т. е. покажем, что для любого х 6 Р существует такое у, что (х, у) (: F (поскольку F s P X S, отсюда и будет следовать 3) (F) = Р и № (F) д5). Положим В = 2) (F), т. е. E) В = {х: х 6 Р «, 5ля некоторого у, (х, у) ? F}. Докажем по индукции, что В = Р. Во-первых, по C) A, с) 6 F и потому 1 ? В. Во-вторых, если х ? В, т. е. существует таксе у, что (х, у) 6 -F. то по D) также (Sc (x), G (у)) 6 F и, следовательно, Sc (x) е В- Мы должны далее проверить, что F — функция, т. е. что для любых х, zu гг из (х, zj 6 F и (х, z2) 6 ^ следует Zj = г2. Доказа- Доказательство проведем по индукции. Образуем множество F) А = {х: х 6 Р и для всех zu zz ?Р из (х, z4) ? F и (х, z2) 6 F следует zt = z2}. Применяя 3.1 (iii), покажем, что А = Р. Во-первых, G) 1 6Л. Чтобы доказать это, достаточно проверить, что для любого z из A, г) 6 F следует z = с. Докажем последнее от противного, пред- предполагая, что существует такое г, что A, z) 6 ^ и z Ф с. Рассмотрим отношение W = F — {A, г)}. Поскольку A, с) 6 -F и A, с) ^= A, г), то A, с) 6 W. Далее, если (и, г/) 6 IP, то (и, г/) 6 ^ и (Sc (и), G (г/)) 6 6 /\ а так как Sc (и) ^ 1. то (Sc (и), G (у)) Ф A, г) и потому (Sc (и), G (г/)) 6 ^ = F — {A, г)}- Следовательно, построенное IF обладает свойствами (ii)', (iii)', т. е. W 6 М- По B) отсюда следует F s IF, что, очевидно, абсурдно, так как A, г) 6 F, но A, г) ^ W. Наше предположение привело к противоречию, и G) доказано. Для завершения доказательства равенства А = Р осталось пока- показать, что (8) если х 6 А, то Sc (x) ? Л.
Л. ОСНОВНЫЕ СВОЙСТВА 83 Итак, пусть х 6 А, т. е. из (х, г,) ^ F и (х, г2) 6 F следует г4 = г2. Мы должны доказать, что тогда и из (Sc (х), ш4) 6 ^ и (Sc (х), до2) € ^ следует а»! = до2. Для этого достаточно показать, что (9) если (Sc (x), w) 6 -Р. /яо существует такое г, что w = G (г) и (х, г) 6 i7. Действительно, если (9) верно, то из (Sc (x), Wi) 6 F и (Sc (х), и»2) € ? F должно вытекать существование таких zu гг, что а^ = G(zi), wz — G (z2), (x, Zj) ? .F, (x, z2) ? F, и, поскольку x 6 А, также должны вытекать требующиеся равенства гг = z2, G (z4) = G (z2), a»i = ffi'2. Докажем теперь (9) от противного: предположим, что существует таксе w, что (Sc (x), w) 6 F, но для любого z из (х, z) ^ F следует G (г) Ф w *). Рассмотрим отношение W7 = F — {Sc (x), w} и покажем, что W 6 М- Во-первых, A, с) 6 F и A, с) ^ (Sc (x), w), так что A, с) 6 №¦ Далее, пусть (ы, г/) 6 W- Тогда (ы, у) ? F и (Sc (ы), G (у)) 6 F. По свойству C.1) (ii) из иф х следовало бы (Sc (и), G (у)) Ф (Sc (x), w) и потому (Sc (и), G (у)) 6 W; так что остается рассмотреть случай и = х. Но если ы = х и (Sc («), G (г/))= = (Sc (x), w), то w = G (г/), где (х, г/) ? F, что противоречит сде- сделанному допущению относительно w. Следовательно, (Sc (и), G (у))ф Ф (Sc (x), w) и поэтому снова (Sc (и), G (у)) 6 W. Итак, A, с) 6 IF, и из (и, у) ?W следует (Sc (и), G (у)) 6 W; тем самым W 6 М и по B) jF e W, что невозможно ввиду (Sc (х), ги) f f и (Sc (x), до) $ $ W7. Предположение о том, что (9) не справедливо, привело к про- противоречию, и (9) доказано, а поскольку из (9) следует (8), то по индукции А = Р. Следовательно, A0) F — функция. Мы доказали, таким образом, существование хотя бы одной функ- функции, удовлетворяющей условиям (ii) — (Hi). Переходим к един- единственности, доказательство которой гораздо проще. Часть 2. Пусть функции Fit F2 удовлетворяют условиям (i) — (iii); покажем, что F± — Fz, т. е. что, для любого х ? Р, Fi (х) = F2 (x). Доказывать будем опять-таки индукцией по х. По свойству (ii) Fi A) = с и Fz A) = с, так что Ft A) = ^2 A). Пусть теперь /^ (х) = F2 (х); покажем что тогда jFj (Sc (x)) = = ,F2 (Sc (*)). Но Ft (Sc (x)) = G (F, (x)) и ,Р2 (Sc (x)) = G (F2 (x)), и если Fj (x) = F2 (x), то ^ (Sc (x)) = F2 (Sc (x)). Как мы увидим, теорема 3.4 играет очень важную роль в разви- развитии всей теории положительных целых чисел. Иногда нам будет *) Формальное предположение несправедливости (9) требует также рас- рассмотрения случая: (х, г) ? F ни для одного г, но это, очевидно, противоречит доказанному Z (F) = Р.— Прим. перев.
84 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА удобна чуть более общая теорема, доказательство которой мы опускаем, так как оно почти полностью совпадает с доказательством теоремы 3.4: 3.4'. Теорема. Пусть заданы (Р, Sc, 1) — система Пеано, множество S, элемент с ? S и некоторая бинарная функция G с 3 (G) = Р X S и М (G) s S. Существует, и притом единствен- единственная, функция F, удовлетворяющая условиям: (i) SB (F) = Р и Я (F) <= S; (И) F A) = с; (Hi) F (Sc (х)) = G (х, F (х)) для всех х ? Р. Изоморфизм систем Пеано. Теперь мы в состоянии доказать вторую главную теорему, показывающую, что существует по сути дела только одна система Пеано. 3.5. Теорема. Любые две системы Пеано изоморфны. Доказательство. Пусть (Р, Sc, 1) и (Р', Sc', Г) — системы Пеано. Мы установим существование такой функции F, что A) F взаимно однозначна; B) 3 (F) = Р и Я (F) = Р'; C) F A) = 1'; D) F (Sc (х)) = Sc' (F (х)) для любого х?Р (так выглядят условия B.4.3) изоморфизма систем в нашем случае). Применим доказанную теорему 3.4, полагая S = Р', с = Г и G = = Sc'. Полученная функция F, очевидно, удовлетворяет условиям C), D). Кроме того, 3 (F) = Р и М (F) s P'. Остается поэтому проверить равенство М (F) = Р' и взаимную однозначность F. Для доказательства равенства М (F) — Р', ввиду справедливости включения М (F) s P', достаточно доказать, что для любого у 6 Р' существует такое х?Р, что F (х) = у. Пусть E) А = {у: у ^ Р' и, для некоторого х ? Р, у = F (х)}. Покажем индукцией в Р', что А = Р', т. е. применим 3.1 (Hi) к (Р'( Sc', Г). Очевидно, Г 6 А. Пусть у ? А, так что у = F (х), где х 6 Р. Тогда Sc' (у) = Sc' (F (х)) = F (Sc (x)) по D) и, следова- следовательно, Sc (у) g Л. Индукция, а с ней и доказательство B) завер- завершены. Остается показать взаимную однозначность F. Пусть F) В = {х: х 6 Р и для всех г 6 Р из F (х) = F (z) следует х = z). Покажем, что В = Р. Снова применим индукцию, на этот раз в Р. Для доказательства включения 1 6 В нужно показать, что G) для всех г 6 Р из F (г) = Г следует z — 1.
3.1. ОСНОВНЫЕ СВОЙСТВА 85 Предположим противное, т. е. существование такого z ? Р, что F (г) = Г, но гф 1. По теореме 3.3 существует такое у 6 Р, что z = Sc(y), и потому 1' = F (г) = F (Sc (г/)) = Sc' (F (г/)) по D), или Г = Sc' (f (t/)), но это невозможно по определению системы Пеано (Р', Sc', Г). Итак, 1 ? В. Пусть теперь х 6 В, т.е. (8) для всех z ? Р ыз F (z) = F (х) следует z = х. Нам нужно показать, что Sc (x) 6 В, т. е. (9) для всех w 6 Р из F (w) = F (Sc (*)) следует w = Sc (я). Пусть да 6 Р и i7 (ш) = F (Sc (х)) = Sc' (.F (*)). Легко видеть отсю- отсюда, что F (w) Ф Г, а потому по теореме 3.3 существует такое z 6 Р, что до = Sc (z) и, следовательно, F (w) = F (Sc (г)) = Sc' (.F (г)). Но (Р', Sc', Г) — система Пеано, поэтому из Sc' (F (z)) = Sc' (F (x)) получаем F (z) — F (x) и, по предположению (8), также z = x, Sc (z) = Sc (x), т.е. w = Sc (x), что и требовалось. Мы уже удостоверились, что свойствами, определяющими систе- системы Пеано, обладают положительные целые числа в нашем интуи- интуитивном понимании. Теорема 3.5 показывает теперь, что эти свойства полностью характеризуют положительные целые числа, по крайней мере с точностью до изоморфизма. Поэтому, когда мы будем изучать алгебраические свойства этих чисел, мы можем рассматривать какую-нибудь одну систему Пеано; существование же такой системы мы предположили в 3.2. 3.6. Соглашение. В дальнейшем мы будем предполагать, что (Р, Sc, 1) — некоторая фиксированная система Пеано, и будем называть Р множеством положительных целых чисел. Поэтому, употребляя в дальнейшем символы Р, Sc, 1, мы не будем специально оговаривать, что (Р, Sc, 1) является системой Пеано. Упражнения Решите следующие упражнения, не используя теорему 3.4, т. е. пред- предполагая, что (Р, Sc, 1) — любая система Пеано. 1. Докажите, что Sc (х) ф х для всех * ? Р. 2. Другое доказательство теоремы 3.4. Назовем множество В сегментом в Р, если (i) В <= Р; (П) 1 6 В; (ш) если Sc (у) 6 В, то у ? В. Пусть, для каждого х ? Р, Мж = {В: В есть сегмент в Р и х 6 В) и пусть [1, *] = п В [В 6 MJ (интуитивно, [1, *] есть множество всех таких у 6 Р, что у <; х). Доказать утверждения: (а) Если х 6 Р, то [1, х] — сегмент в Р и х?[\,х]. (б) [1, 1] = {1}. (в) Если х 6 Р, то [1, Sc (*)] = [1, х] U {Sc (*)}• (г) Если Х6Р, то Sc<x)$[l, x].
86 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Пусть S, с, G таковы, как в условиях теоремы 3.4. Назовем Я подходя- подходящей частичной функцией для [1, х], если (i) 3 (Я) = [1, х] и М (Я) ? S; (И) Я A) = с; (ш) если Sc (у) 6 [1, *], то Я (Sc (у)) = G (Я (у)). Доказать, что (д) Для каждого х 6 Р существует по меньшей мере одна подходящая частичная функция для [1, х]. (е) Для каждого х ? Р существует не более одной подходящей частичной функции для [1, х]. Из (д) и (е) следует, что для каждого х ? Р существует единственная под- подходящая частичная функция для [1, х]; обозначим ее Нх. Доказать, что (ж) Для любых х ? Р и у G [1, х] выполнено Hsc(x) (у) = Яж (у). Наконец, зададим функцию F с областью определения Р условием F (х) = = Нх (х) для каждого х 6 Р- Доказать, что (з) Функция F удовлетворяет условиям 3.4 (i) — (ш). Получаем, таким образом, другое доказательство части 1 теоремы 3.4. Часть 2 доказательства сохраняется. 3.2. Арифметика положительных целых чисел Рекурсивные определения. Мы уже указывали, что операции сло- сложения, умножения, возведения в степень и т. д. могут быть в некото- некотором смысле сведены к операции следования Sc. Рассмотрим вначале сумму а + Ъ двух положительных целых чисел. Если Ь = 1, то эта сумма может быть найдена просто как Sc (а). Если Ъ-ф\, то Sc (с) = Ь для единственного с, и если мы уже знаем сумму а + с, то вычисление а -\- Ъ сводится к прибавлению 1, т. е. а + b = — Sc (a + с). Вообще мы хотим, чтобы, для любых х, у 6 Р. C.2.1) х+ I =Sc(x), х + Sc (у) = Sc (x + у). Итак, мы ищем функцию Ft (x, у) такую, что, для любых х, у 6 Р, C.2.2) F, (х, 1) = Sc (x), F, (х, Sc (у)) = Sc (F, (х, у)). Аналогично, если мы уже определили сложение, то мы хотим определить произведение х-у так, чтобы C.2.3) хЛ = х, х-&с (у) = (х-у) + х, поскольку x-Sc (у) — х- (у + 1). Иначе говоря, мы ищем такую функцию F2 (x, у), что, для любых х, у 6 Р, C.2.4) F2 (х, 1) = х, Fz (х, Sc (у)) = F2 (x, у) + х. Вопрос о существовании функций Fit F2, очевидно, связан с некото- некоторой теоремой типа 3.4. Единственное отличие состоит в том, что ищется на этот раз функция двух переменных с областью определе- определения Р х Р. Для простоты формулировки ограничимся случаем, когда область значений искомой функции лежит в Р. Следующая общая теорема существования применима ко всем арифметическим операциям.
3.2. АРИФМЕТИКА ПОЛОЖИТЕЛЬНЫХ ЦЕЛЫХ ЧИСЕЛ 87 3.7. Теорема. Пусть заданы две функции G и Н с 3) (G) = = Р X Р, М (G) •= Р, 3) (Н) = Р, Si (Я) ? Р. Существует, и при- притом единственная, такая функция F, что (i) 3) (F) = Р хР и M(F) g= Р; (ii) F (х, 1) = Н (х) для любых х ? Р; (iii) F (x, Sc (у)) = G (x, F (х, у)) для любых х, у ? Р. Доказательство. Для любого х 6 Р положим A) сх = Я (*), B) Gx B) = G (х, 2), т. е. Gx есть функция, для которой C) 3 (Gx) = Р, Ж (Gx) «= Р. Из теоремы 3.4 следует, что для каждого фиксированного х 6 Р существует единственная функция f^., удовлетворяющая условиям D) (i) 3) (Fx) = Р, М (Fx) s P; (ii) /^ A) = сх; (iii) ^x (Sc (#)) = Gx (Fx (у)) для всех у ? Р. Положим тогда E) F (х, у) = Fх (у) для всех х, у ? Р, где Fх — единственная функция, удовлетворяющая условиям D). Легко видеть, что функция F удовлетворяет условиям (i) — (iii) нашей теоремы. Остается проверить единственность такой функ- функции F. Пусть, в самом деле, функция F' также удовлетворяет этим условиям. Легко доказать индукцией по у, что для всех у 6 Р и всех х 6 Р выполнено F (х, у) = F' (х, у). Можно доказывать и по-другому, обозначая величину F' (х, у) через F'x (у) для каж- каждого х ? Р и убеждаясь, что F'x удовлетворяет условиям (i) — (iii) теоремы 3.4. Но в силу этой теоремы такая функция единственна, поэтому F'x (у) — Fx (у) для всех у ? Р и, следовательно, F (х, у) = = F' (х, у) для всех х, у 6 Р- Аналогично тому, как это было сделано с теоремой 3.4, мы можем сформулировать чуть более общую теорему 3.7', доказатель- доказательство которой получается из теоремы 3.4' так же, как только что было получено доказательство теоремы 3.7 из теоремы 3.4. 3.7'. Теорема. Пусть заданы две функции G и Н с 33 (G) = = Р х Р X Р, М (G) <= Р, 3) (Н) = Р, М (Н) s Р. Существует, и притом единственная, такая функция F, что (i) 3) (F) = Р X Р и М (F) <= Р; (ii) F (х, 1) = Н (х) для всех х ? Р; (iii) F (x, Sc (х)) = G (х, у, F (х, у)) для всех х, у 6JP.
88 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Подобным образом, для любого целого положительного т, можно было бы доказать существование и единственность функций т + 1 переменных, удовлетворяющих условиям любых (И)' (ту Xi, Х2 F ¦ F (хи ., X (хи х2, . . ., т С "> Х2, . . ., Хт, У)) Xjn* Xjni для 1) Sc гт (У))- всех Xi, (Хи = G х2, х2, (Xi, ¦ • • 1 х2, . • > хт, Хт) yi д ;р. ( ( (у)) ( у, F ( )) Р Любая операция, которая вводится как единственная функция, удовлетворяющая такого рода условиям, называется рекурсивно определенной, или заданной рекурсивным определением. Поскольку в таком определении явного задания функции не приводится, рекурсивное определение нельзя рассматривать как определение, если не приведено доказательство существования и единственности соответствующей функции. Существует много других схем, которые позволяют доказать существование и единственность функций, опре- определенных на множестве положительных целых чисел и удовлетво- удовлетворяющих нужным условиям. Вышеописанные схемы являются про- простейшими и потому называются примитивно рекурсивными опре- определениями. Для большинства наших целей достаточен еще более простой класс определений вида 3.7. Сложение положительных целых чисел 3.8. Определение. Обозначим через х + у значение бинар- бинарной функции F (х, у), однозначно определенной по теореме 3.7 функ- функциями Н (х) = Sc (х) и G (x, z) = Sc (z). Тогда: (i) + есть бинарная операция на Р, относительно которой Р замкнуто; (И) х + 1 = Sc (х) для любого х 6 Р; (Hi) х + Sc (у) = Sc (x + у) для любых х, у 6 Р. Различные известные свойства сложения такие, как коммута- коммутативность, ассоциативность и т. д., могут быть выведены непосред- непосредственно из этого определения, без каких-либо дополнительных предположений или аксиом о положительных целых числах. Приво- Приводимые ниже теоремы показывают, как такой вывод производится. 3.9. Теорема (закон ассоциативности для +)• Для любых X, у, 2 6 Р х + (у + z) = (х + у) + z. Доказательство проводится индукцией по г. Рассмо- Рассмотрим любые х, у 6 Р- Пусть A) А = {z: z ? Р и х + (у + г) = (х + у) + г). Тогда B) 1 € Л,
3.2. АРИФМЕТИКА ПОЛОЖИТЕЛЬНЫХ ЦЕЛЫХ ЧИСЕЛ 89 поскольку х + (у + 1) = х + Sc (у) по 3.8 (и) = Sc (х + у) по 3.8 (iii) = (х + у) + 1 по 3.8 (И). Также C) если г 6 А, то Sc (z) 6 Л. Для доказательства этого предположим, что z ? А. Тогда х + (у + Sc (г)) = x + Sc(y + z) по 3.8 (Hi) = Sc (x + (г/ + z)) по 3.8 (iii) = Sc ((х + г/) + г), поскольку z ? А = (х + у) + Sc (z) no 3.8 (iii). Но из B), C) и 3.1 (iii) следует А = Р, что и требовалось. Замечание. В приведенном индуктивном доказательстве переменные х, у участвовали в качестве параметров, не меняясь на протяжении всего доказательства. Можно было бы провести доказательство без параметров, рассматривая множество В = {z: z 6 Р и, для всех х, у 6 Р, х + (у + z) = (х + у) + z}. Оба доказательства в равной степени приемлемы; отметим только, что в некоторых ситуациях (см. доказательства теорем 3.4, 3.5) пригодны только доказательства второго типа. В следующих доказательствах проверка некоторых шагов опу- опущена, читатель сам может ее восстановить совершенно так же, как в доказательстве 3.9. 3.10. Л е м м а. х + 1 = 1 + х для любого х 6 Р- Доказательство. Пусть A) Л = {1:х?Р«х+1 = 1+1}. Очевидно, B) 1 € А. Также C) если х 6 А, то Sc (x) 6 А. Действительно, пусть х 6 А. Тогда Sc (х) + 1 = (х + 1) + 1 = A + х) + 1 = 1 + (х + 1) по 3.9 = 1 + Sc (x). Следовательно, А = Р. 3.11. Теорема (закон коммутативности, для +). Для любых х,уеР х + у = у + х.
90 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Доказательство. Пусть х 6 Р. Положим A) А = {у: у е Р и х + у = у + х). Тогда B) 1 € Л по 3.10. Также имеем C) если у 6 А, то Sc {у) ? А. Действительно, пусть у ? Л. Тогда х + Sc (у) = Sc (х + у) = Sc (у + х), поскольку г/ 6 Л = 0 + Sc (х) = У + (х+\) = г/ + A + х) по 3.10 = (г/ + 1) + * по закону ассоциативности = Sc (у) + х. 3.12. Теорема (закон сокращения для +)¦ Для любых х, у, z ?Р из х + z — у ~\- z следует х = у. Доказательство. Пусть х, у 6 Р. Положим A) А = {z: z 6 Р и W3 х + z = # + z следует х = у}, B) 1 € Л. Действительно, из х + 1 = у + 1, т. е. Sc (х) == Sc (t/), следует по 3.1 (П), что х = у. C) Ясли z 6 Л, mo Sc (z) 6 Л. Пусть, действительно, г 6 Л и х + Sc (z) = г/ + Sc (г), т. е. Sc (x + z) = Sc (г/ + г). Но тогда х + z = у + z по 3.1 (ii). Поэто- Поэтому у = z по индуктивному предположению z 6 Л. 3.13. Теорема. Для любых х, у ? Р, у Ф х + у. Доказательство предоставляется читателю. 3.14. Теорема (закон трихотомии для +). Для любых х, у 6 6 Р справедливо одно из трех утверждений: (i) * = У, (ii) для некоторого и 6 Р. * = # + «; (ш) для некоторого v ? Р, г/ = х + v. Более того, никакие два из этих утверждений не могут выполняться одновременно. Наконец, и в случае (ii) и v в случае (ш) единственны. Доказательство. Начнем с доказательства последних утверждений. Пусть выполнены одновременно (i) и (ii). Тогда х = = х + и, что противоречит 3.13; аналогичным образом несовместны (i) и (ш). Пусть одновременно выполнены (ii) и (iii). Тогда х =
3.2. АРИФМЕТИКА ПОЛОЖИТЕЛЬНЫХ ЦЕЛЫХ ЧИСЕЛ 91 = у -\- и = (х + v) -\- и и, по закону ассоциативности, х = = х + (v + и), что снова противоречит 3.13. Единственность и и v прямо вытекает из закона сокращения для +. Нужно теперь показать, что хотя бы одно из (i) — (Hi) всегда выполнено. Зафиксируем любое j^P и проведем индукцию по х. Пусть A) Л = {х: х 6 Р и х = у, или х = у + и для некоторого и 6 Р, или у = х + у для некоторого v 6 Р}, B) 1 6 Л. Действительно, либо г/ = 1, либо г/ Ф 1. Если г/ Ф 1, то в силу 3.3 существует такое v, что у = Sc (у), т. е. г/ = у + 1 = 1 + v. Следовательно, выполнено либо первое, либо третье условие, и 1 6 Л. C) Если х?А, то Sc (x) 6 А. Пусть х ? А. По определению множества А это означает, что либо х = г/, либо х = г/ + ы для некоторого ы 6 Р. либо г/ = л; + v для некоторого у 6 Р- В первом случае имеем Sc (х) = Sc (у) = = у + 1, и Sc (х) 6 А. Во втором случае Sc (х) = Sc (г/ + и) = = у + Sc (и) и снова Sc (x) ? А. Наконец, рассмотрим последний случай — существует такое v, что у = х -)- v. Если w = 1, то г/ = х + 1 = Sc (х) и Sc (х) ? Л; если же у =? 1, то v = Sc (да) для некоторого w и тогда у = х + Sc (w) = д; + (^ + 1) = х + A + w) = = (х+ 1) + w = Sc(x) + w, так что снова Sc (х) ? Л. Итак, C) справедливо, и Л = Р. Умножение положительных целых чисел. Перейдем к определе- определению умножения и проверке элементарных его свойств. 3.15. Определение. Обозначим через х-у значение бинар- бинарной функции F (х, у), однозначно определенной по теореме 3.7 функ- функциями Н (х) = х и G (x, z) = z + х. Тогда (i) • есть бинарная операция на Р, относительно которой Р замкнуто; (И) х-1 = х для любого х 6 Р; (iii) X'Sc (#) = (x-t/) + х для любых х, у ? Р. 3.16. Теорема (левый закон дистрибутивности для • отно- относительно +). х-{у + г) = (х>г/) + (х-г) для любых х, у, z ? Р. Доказательство. Пусть х, г/ 6 Р. Применяем индукцию по г. A) х-(г/+1) = (х.г/) + (х-1).
92 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Действительно, х-(у + 1) = x-Sc (у) = (х-у) + х = (х-у) + {хЛ). B) Если х-(у + z) = (*•#) + (л>г), /по л;-(у + Sc (г)) = = (х-у) + [x-Sc(z)l Действительно, по предположению, х-(у + Sc (г)) = x-Sc (у + г) = [*•(</ + *I + * = [(х-у) + (х-г)] + х = (х-г/) + l(x-z) + х] = (х-г/) + [x-Sc(z)]. Индуктивные предположения проверены. 3.17. Теорема (правый закон дистрибутивности для • от- относительно +). (х + у) -z = (x-z) + (у -г) для любых х, у, z 6 Р. Доказательство. Пусть (х, у) 6 Р- Проводим индукцию по г. Очевидно, A) (x + y)-l = (x-\) + (yl), B) если (х + y)-z = (x-z) + (г/-г), то (х + г/) -Sc (z) = = (x-Sc(z)) + (y-Sc(z)). Действительно, используя ассоциативный и коммутативный законы, получаем (х + у) -Sc (г) = [(х + у) -г] + (х + у) = [(x-z)+(yz)]+(x+y) = (по ассоциативному и комму- коммутативному законам для +) 3.18. Л е м м а. 1 -х = х для всех х 6 Р. Доказательство (индукцией по х). Очевидно, 1-1 = 1. Пусть 1-х = х; тогда 1 >Sc (х) = A -х) + 1 = х + 1, т. е. 1 -Sc (x) — = Sc (x). 3.19. Теорема (закон коммутативности для -). х-у = ух для любых х, у 6 Р. Доказательство. Пусть х? Р. Применим индукцию по у. A) хЛ = 1-х. Действительно, хЛ — х по определению • и 1 -х = х по 3.18. B) Если х-у = у-х, то х-Sc (у) = Sc (г/)-х.
3.2. АРИФМЕТИКА ПОЛОЖИТЕЛЬНЫХ ЦЕЛЫХ ЧИСЕЛ 93 Действительно, по предположению, х -Sc (у) = х-у + х = (у -х) + х = (ух) + A-х) = (у + 1)-х по 3.17 = Sc (у) -х. 3.20. Теорема (закон ассоциативности для •). Для любых х, у, z 6 Р x-(yz) = (х-у)-г. Доказательство предоставляем читателю. 3.21. Теорема (закон сокращения для •)• Для любых х, у, z 6 Р из x-z = у-z следует х — у. Доказательство. Допустим противное, т. е. что х Ф у, и покажем, что х-гф y-z. По закону трихотомии 3.14, для некото- некоторого и 6 Р. х = у + и или, для некоторого v 6 Р, у = х + v. В первом случае x-z = (у + и) -г = (у -г) + (и -г) по закону дистри- дистрибутивности. Но «-г Е Р, поэтому, по тому же закону, x-z Фуг. Аналогично разбирается и второй случай у = x+v. Возведение в степень и другие операции. Мы убедились, насколько просто и безыскусственно хорошо известные арифметические свой- свойства сложения и умножения могут быть выведены из их основных свойств, положенных в основу рекурсивных определений. Проведем, очень кратко, подобное изучение операции возведения в степень. 3.22. Определение. Обозначим xv значение бинарной функ- функции F (х, у), однозначно определенной по теореме 3.7 функциями Н (х) = х и G (х, г) = г -х. Тогда (i) возведение в степень есть бинарная операция на Р, относи- относительно которой Р замкнуто; (ii) х1 = х для любого х 6 Р; (Hi) xSc<.v) = (xv)-x для любых х, у?Р. 3.23. Теорема. Для любых х, у, z?P мы имеем (i) 1"=1; (ii) xv-xz = xv+z; (Hi) Доказательство. Докажем только (ii), оставив проверку остальных утверждений читателю. Применяем индукцию по г. A) xv-x1 = xv+1, так как xv+1 = xSc (v) = xv ¦ x = xv • x1. B) Если xv-xz = xv+z, то х
94 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Действительно, тогда ХУ . xSc (г) = ХУ (х* . Х) = (ХУ . „г) . х = х^ . х = = Xv+Sc <2>. Рекурсивно могут быть определены и другие известные функции. Например, для х\ определяющими являются условия 1! = 1, (Sc(*))! =Sc (*)•(*!). Это — унарная функция, существование которой можно вывести либо из существования некоторой бинарной функции F (х, у) по теореме 3.7 (и F (х, у) = у\), либо прямо по теореме 3.4, пола- полагая S = Р. Упражнения 1. Докажите теорему 3.13. 2. Проверьте, что теорема 3.16 не используется в доказательствах тео- теорем 3.17—3.19. Дайте прямое доказательство теоремы 3.16, использующее эти теоремы. 3. Докажите теорему 3.20. 4. Докажите (ш) в теореме 3.23. 5. Докажите, что для любого у ? Р имеем или у = 1, или существует единственное такое х 6 Р, что у = 2-х, или существует единственное такое х 6 Р, что у = B-х) + 1. 6. Дайте рекурсивное определение функции F с областью определения Р, для которой F A) = 1 и, для всех х 6 P. F B-х) = 2 и F (B-х) -\- 1) = 1. 3.3. Порядок Основным понятием, с помощью которого были определены систе- системы Пеано и затем изучены некоторые свойства положительных целых чисел, было понятие «а непосредственно предшествует Ь», или «Ь непосредственно следует за a», b = Sc (а). Вообще говоря, можно рассматривать более широкое отношение следования, считая, что а предшествует Ъ (a<ib), или Ъ следует за а (Ь>а), если Ь получается из а конечным применением операции Sc, т. е. нахо- находится в ряду Sc (a), Sc (Sc (a)), Sc (Sc (Sc (a))), . . . Используя стандартные обозначения 2 = 1 + 1, 3 = 2+1, имеем Sc (a) = а + 1, Sc (Sc (a)) = Sc (a) + 1 = (а + 1) + 1 = а + A + 1) = а + 2; аналогично Sc (Sc (Sc (о))) = а + 3, ... Итак, приходим к отно- отношению порядка <. 3.24. Определение. Для любых х, у 6 Р положим (i) х < у тогда и только тогда, когда у = х + v для некото- некоторого v б Р; (ii) х > у тогда и только тогда, когда у < х;
3.3. ПОРЯДОК 95 (iii) х <^ у тогда и только тогда, когда x<Zy или х = у; (iv) х !> у тогда и только тогда, когда у < х или у = х. Собственно говоря, введенные в 3.24 отношения являются множе- множествами: W = {(х, у): х, у 6 Р и у = х + v для некоторого v ? Р}, W = {(х, у): х, у (Е Р и у = х или у = х + у для некоторого 3.25. Теорема. Для любых х, у, z 6 Р имеют место (i) (закон трихотомии для <) выполняется одно и только одно из трех условий х < у, х = у, х > у; (ii) (закон транзитивности для <) «з х <Су и у < г следует X < Z. Доказательство. Утверждение (i) прямо следует из определения < и теоремы 3.14. Для доказательства (ii) заметим, что из х < у и у < z следует # = х + ыиг = # + у для некоторых «, а 6 Р- Тогда z — (х + и) + v = х + (ы + v) я х < г. 3.26. Следствие. Для любых х, у, z ? P имеют место (i) (закон рефлексивности для <;) х ^ х; (ii) (закон связности для <;) или х<СУ> или у <С х'> (iii) (закон антисимметричности для <;) если х <; у и у <; х, то х = г/; (iv) (закон транзитивности для <;) если х ^ у и у -^ z, то х -^ z. Условимся о некоторых сокращениях в записи. Будем писать х < г/ < z вместо i<p (/<г, x<j^z вместо х ¦<. у я у <; г и х <; г/ <; z вместо х <; у и у -^. z; запись вида х < г/ > z мы употреблять, однако, не будем, хотя и ей можно придать опреде- определенный смысл. Далее, вместо «не х< у» будем писать х < г/, что, конечно, эквивалентно х ^- г/ по закону трихотомии, и соответствен- соответственно х ^ г/ вместо «не х^ у», что эквивалентно у<Сх. Линейно упорядоченные системы *) 3.27'. Определение. Бинарное отношение <^ в множестве S называется линейным упорядочением S (также простым или тотальным упорядочением S), если для него верны законы трихотомии и транзитивности 3.25 (i), (ii) для всех х, у, z 6 S, в которых символ < заменен на символ <^; система (S, <3 при этом называется линейно упоря- упорядоченной системой. Таким образом, отношение < есть линейное упорядочение Р, конечно, никоим образом не единственное. Другое упорядочение, *) Мы сохраняем здесь более распространенный термин «линейное упорядочение» вместо относительно нового «простое упорядочение» для перевода simple ordering.— Прим. перев.
96 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА например, есть C.3.1) 2, 4, 6, . . ., 1, 3, 5, ... Более точно это последнее упорядочение может быть задано сле- следующим образом: C.3.2) х <( у тогда и только тогда, когда х четно, у четно и х < у, или х нечетно, у нечетно и х < у, или х четно и у нечетно. (Здесь под «х четно» понимается, что существует такое и 6 Р. что х = 2-й, а под «х нечетно»— что существует такое v ? Р, что х = = 2-у+ 1.) Доказательство того, что отношение <^, определенное в C.3.2), есть линейное упорядочение, предоставляется читателю. Мы хотим найти для отношения < на Р характеристику, опре- определяющую < с точностью до изоморфизма, которая была бы чисто внутренней, т. е. формулировалась в терминах самого отношения <, без обращения к участвующей в определении отношения < опера- операции + . Предыдущий пример показывает, что свойство быть линей- линейным упорядочением явно недостаточно для того, чтобы характери- характеризовать Р. Прежде чем перейти к отысканию точной характеристики <, убедимся, что требования, входящие в определение линейного упо- упорядочения, независимы. Приведем простой пример. Пусть х, у 6 Р и C.3.3) х << у тогда и только тогда, когда х четно, у четно и х < у или х нечетно, у нечетно и х < у. Мы видим, что из выполнения закона транзитивности не следует выполнения закона трихотомии (здесь ни одно из утверждений 2 <^ 1, 2 = 1, 1 <^ 2 не выполняется). Примером, в котором закон трихотомии, наоборот, выполнен, а закон транзитивности нет, дает множество { 1, 2, 3} с отношением 1 <^' 2, 2 <^' 3, 3 <^' 1. Конечно, читатель без труда приведет на этом основании и пример отноше- отношения на Р с теми же свойствами. В следующей главе мы перейдем к рассмотрению множества всех целых чисел, имеющего естественное упорядочение q о 10 19 3 Можно построить упорядочение положительных целых чисел, изо- изоморфное этому упорядочению: C.3.4) . . ., 6, 4, 2, 1, 3, 5, . . ., точнее, для любых х, у 6 Р. C.3.5) х <^ у тогда и только тогда, когда х четно, у четно и х> у, или х нечетно, у нечетно и х < у или х четно, а у нечетно. -
S.3. ПОРЯДОК 97 Непосредственно проверяется, что так введенное отношение пред- представляет собой линейное упорядочение. Существенным отличием этого упорядочения от естественного упорядочения < является отсутствие «первого» элемента. 3.28. Определение. Пусть (S, <^) — линейно упорядочен- упорядоченная система и A s S. Элемент с называется первым или наименьшим элементом множества А, если с 6 А и для всех х 6 А из х Ф с следует с <^ х. Соответственно элемент с называется последним или наибольшим элементом множества А, если с 6 А и для всех х 6 А из х Ф с следует х <( с. 3.29. Лемма. Пусть (S, <0 — линейно упорядоченная систе- система и А ^ S. Если у множества А есть первый элемент, то он единствен; то же для последнего элемента. Доказательство. Допустим, что у множества А два первых элемента: с и с', и сфс. По закону трихотомии либо с' <^ с, либо с <^ с . Если с' <^ с, то, по определению первого эле- элемента, с 6 А и из с Ф с' должно следовать с' <^ с , что противоречит предположению; аналогично невозможно с <^ с . Следовательно, с = с'. Доказательство единственности последнего элемента дослов- дословно то же самое. Таким образом, если множество А имеет хотя бы один первый элемент, то'понятие «первый элемент» строго определено. Конечно, может оказаться, что первого элемента в А нет, как, например, для А = Р в примере C.3.5). Вполне упорядоченные системы 3.30. Определение. Множество S называется вполне упорядоченным с помощью отношения <^, а система E, <0 — вполне упорядоченной системой, если (i) (S, <Q — линейно упорядоченная система; (и) каждое непустое подмножество А множества S имеет первый элемент. Таким образом, система (Р, <0 из C.3.5) не является вполне упорядоченной, а (Р, <), как будет показано, является; также вполне упорядоченной является система (Р, <Q из C.3.2) (см. упражнения). Прежде чем перейти к доказательству полной упоря- упорядоченности системы (Р, <), установим некоторые свойства отноше- отношения <С, связывающие <, Sc и 1. Эти свойства можно понимать как рекурсивные характеристики отношения < в Р, показывающие, при каких условиях имеет место х <. 1 и у < Sc (x). Условия сформулированы в первых двух частях следующей теоремы; осталь- остальные части теоремы — простые их следствия. 3.31. Теорема. Для любых х, у 6 Р (О х < 1; (И) х < Sc (у) тогда и только тогда, когда х<^у; (Hi) 1 < х;
98 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА (iv) Sc (у) <; х тогда и только тогда, когда у < х; (v) у < Sc (у) и не существует такого г 6 Р, что у < г < Sc (у). Доказательство, (i) Пусть х< 1. По определению 3.24 (i) существует такое v 6 Р, что 1 = х + v, но либо w = 1, либо v = до + 1, и в любом случае 1 = z + 1, что невозможно. (п) Предположим сначала, что х ^ г/, т. е. х < г/ или х = у. В первом случае для некоторого w 6 Р имеем z/ = х + а и тогда Sc (г/) = х + Sc (v), так что х < Sc (г/). Во втором случае Sc (х) = = Sc (у) = х + 1, так что снова x<Sc(z/). Пусть, наоборот, х < Sc (у), т. е., для некоторого v 6 Р, Sc (г/) = х + v. Если v — 1, то Sc (г/) = х + 1 = Sc (х) и х = г/; если же и = Sc (до) для неко- некоторого w 6 Р, to''Sc (г/) = х + Sc (ш) = Sc (х + ш), у = х + w и х<у. Части (iii) и (iv) выводятся из (i) и (и) непосредственно по закону трихотомии (в форме: г<1 w тогда и только тогда, когда ш <fz). Часть (v) прямо следует из (ii). 3.32. Теорема. Система (Р, <Г) вполне упорядочена. Доказательство. Линейная упорядоченность (Р, <) была уже установлена теоремой 3.25. Пусть теперь A s P и А ф 0. Предположим, что А не имеет первого элемента, и образуем множе- множество A) В = {х: х 6 Р и х < у для каждого у 6 А}. Тогда B) В?=Л = Р — А. Действительно, если х ^ В, нох^Л, тох?Л их<х, что невоз- невозможно по закону трихотомии. Докажем индукцией по х, что В = Р. C) 1 е в. Действительно, 1 <; у для всех у 6 А по 3.31 (iii). Если бы 1 6 А, то 1 был бы первым элементом в А вопреки предположению; следо- следовательно, 1 $ А и 1 < у для всех у ? А. D) Если х?В, то Sc (x) 6 В. Пусть х?В. Тогда, для любого у Q. А, х < г/ и, по 3.31 (iv), Sc (x) <; у. Если при этом Sc (х) ? А, то Sc (x) — первый элемент множества А, что невозможно, а если Sc (x) (J А, то Sc (x) < у для всех у ? Л, т. е. Sc (х) ? б. Из C) и D) следует В = Р и поэтому Р с Л, откуда с очевидностью следует А = 0 вопреки пред- предположению. Доказанная теорема дает нам новое очень полезное свойство положительных целых чисел, позволяющее ввести индуктивные доказательства второго типа, часто более удобные; примеры таких доказательств можно найти в следующей главе.
з.з. порядок 99 Однако и эта теорема не характеризует полностью упорядочение < на Р. Примером полного упорядочения Р, не изоморфного есте- естественному упорядочению <., является C.3.6) 2, 3, 4 1. Еще один пример был дан в C.3.2). Что это действительно вполне упорядоченные системы, предоставляем убедиться читателю. Сле- Следует отметить тот факт, что в обоих этих примерах кроме первого элемента есть еще и другие, у которых нет «непосредственно пред- предшествующего». 3.33. Определение. Пусть << — бинарное отношение в S и х, у 6 S. Элемент а называется непосредственно предшествующим элементу Ь, а элемент Ъ непосред- непосредственно следующим за а, если а <( Ь и не существует г 6 S, для которого а <( г и z <( b. В системе C.3.6), например, для элемента 1 нет ни непосред- непосредственно предшествующего, ни непосредственно следующего за ним. Доказательство следующей леммы оставляем читателю. 3.34. Лемма. Пусть (S, <Q — любая вполне упорядоченная система. Тогда (i) если х ? 5 и, для некоторого w 6 S, х -< w, то в S существует единственный непосредственно следующий за х элемент; (и) для любого х (Е 5 в S не может быть более одного элемента, непосредственно предшествующего х. Таким образом, в любой вполне упорядоченной системе (S, -О мы можем ввести операцию Sc' с областью определения {х: х 6 S и, для некоторого w ? S, х <( w}, определив для любого х из этой области Sc' (x) как элемент, непосредственно следующий за х. Обозначая первый элемент множества 5 через Г, видим, что любая вполне упорядоченная система обладает свойствами, соответствую- соответствующими рекурсивному описанию C.31) (i), (и) упорядочения ¦<. Характеристика положительных целых чисел в терминах упорядоче- упорядочений теперь почти получена, осталось добавить два простых свойства: 3.35. Теорема. Пусть Р' ф 0 и (Р', <') — система со следующими свойствами: (i) (P', <') вполне упорядочена; (п) за каждым элементом х?Р' есть непосредственно следую- следующий; обозначим его Sc'(;t); (iii) каждый элемент х? Р', кроме х = Г {где Г — первый элемент множества Р'), имеет непосредственно предшествующий. Тогда (Р\ Sc', Г) есть система Пеано. Доказательство. Проверим поочередно все требования определения 3.1 систем Пеано. A) Sc' (х) Ф V для всех х б Р\
tOO ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Если Sc' (х) = Г, то Г был бы непосредственно следующим за х и х < Г, что противоречит выбору Г как первого элемента. B) Для всех х, у 6 Р', если Sc' (х) = Sc' (г/), mo x = у. Пусть г = Sc' (х) = Sc' (у). Тогда л: и */ непосредственно предше- предшествуют элементу z, что противоречит утверждению (и) леммы 3.34. C) Если А ^ Р, \' ? А' и А обладает тем свойством, что из х 6 А следует Sc' (х) ? А, то А = Р'. Пусть, действительно, условия выполнены, но А ф Р'. Положим В = Р' — А; тогда В s P' и В Ф 0. Следовательно, в В есть пер- первый элемент b относительно упорядочения <'. Имеем либо b = V, либо 6 = Sc' (х) для некоторого х ? Р'. Но Г ? Л и, следовательно, Г $ 5, так что b Ф Г. Пусть b = Sc' (х); тогда х <?? и х ^ Вг поскольку b ^. у для всех у ? В. Следовательно, х 6 Л и по индук- индуктивному предположению Sc' (х) 6 Л, т. е. Ь ? Л, что противоречит определению 6. Доказанная теорема естественно приводит к следующей: 3.36. Теорема. Система (Р, ¦<) удовлетворяет условиям 3.35 (i) — (ш), есш за 1 выбрать наименьший элемент Р, а за операцию Sc (x) — операцию перехода к непосредственно следующему за х для любого х 6 Р. Пусть, далее, Р' Ф 0 и система (Р\ <') также обладает свойствами 3.35 (i) — (iii). Тогда (Р, <) ^ (Р\ <'). Доказательство. То, что система (Р, <) обладает нуж- нужными свойствами, сразу следует из 3.23, 3.31 (iii), (v) и 3.3. Пусть (Р', <;') также ими обладает; будем доказывать изоморфность (Ps <;) и (Р\ <'), т. е. наличие взаимно однозначного соответствия между Р и Р', сохраняющего отношение <. Пусть Sc' и Г опре- определены, как в формулировке теоремы 3.35. Из теоремы 3.5 и из того, что (Р\ Sc', Г) — система Пеано, следует, что A) (Р, Sc, 1) ^ (Р\ Sc', 1'). Иначе говоря, существует такая функция F, что B) F взаимно однозначна; C) 3) (F) = Р и М (F) = Р'; D) ^ A) = 1'; E) F (Sc (х)) = Sc' (F (х)) для любого х б Р. Нам же нужно показать, что F) для любых х, у 6 Р. х < у тогда и только тогда, когда F (х) < F (у).
3.3. ПОРЯДОК 101 Зафиксируем любое х 6 Р. Далее идет индукция по у. G) х < 1 тогда и только тогда, когда F (х) <' F A). Поскольку F A) = Г, то обе половины G) неверны, и G), таким образом, доказано. Пусть теперь условие F) выполнено для у; покажем, что оно выполнено и для Sc (у), т. е. (8) х < Sc (у) тогда и только тогда, когда F (х) <' F (Sc (у)). Действительно, по 3.31 (ii), x < Sc (r/) тогда и только тогда, когда х < у или х = у. С другой стороны, из .F (Sc (у)) = Sc' (f (г/)) следует, что F (Sc (г/)) является непосредственно следующим за F (у) относительно <'. Следовательно, Z7 (х) <' .Р (Sc (г/)) тогда и только тогда, когда F (х) <' .Р (г/) или F (х) = F (у), а потому тогда и только тогда, когда х < у или х = у (используем индуктив- индуктивное предположение F) и взаимную однозначность F). Индукция, а вместе с ней и все доказательство, завершены. Поясним смысл последних двух теорем. Теорема 3.36 показы- показывает, что естественное линейное упорядочение целых положитель- положительных чисел полностью характеризуется свойствами 3.35 (i) — (Hi), допускающими чисто внутреннюю формулировку через свойства упорядочения <', так как и Sc', и Г выражаются через <С'. Теоре- Теорема 3.35 показывает, что, отправляясь от предположения, что систе- система (Р, <) удовлетворяет условиям 3.35 (i) — (iii), мы можем опре- определить Sc и 1 и затем доказывать различные свойства целых положи- положительных чисел, как это мы делали ранее. Иначе говоря, мы могли бы вместо аксиомы 3.2 сформулировать в виде аксиомы существование хотя бы одной системы, удовлетворяющей условиям 3.35 (i) — (iii). С точки зрения интуиции обе аксиомы, пожалуй, равноценны, и выбор, сделанный в книге, диктовался вкусом и удобствами автора. Упорядочение и арифметические операции. До сих пор мы не изучали сколько-нибудь подробно связи между упорядочением и арифметическими операциями. Основные результаты, относя- относящиеся сюда, сформулированы в следующей теореме. 3.37. Теорема. Для любых х, у, z 6 Р (i) х <Z у тогда и только тогда, когда х + г <. у + г; (ii) х <Г у тогда и только тогда, когда X'Z<iy^z; (iii) x <Z у тогда и только тогда, когда xz < yz; (iv) если 1 < г, то 1 < zx; (v) если 1 < г, то х < у тогда и только тогда, когда zx < zv\ (vi) все пять предыдущих утверждений остаются в силе, если всюду, кроме условия 1<гв (v), знак < заменить на <;.
102 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Доказательство, (i) x -f г <. у + г тогда и только тогда, когда существует такое и 6 Р, что у + z = (х + г) + и, т. е. # + z — (х + и) + г, что, по закону сокращения 3.12, эквивалент- эквивалентно существованию такого и ? Р, для которого у = х + и; следова- следовательно, х < у. (п) Если х < г/, то, для некоторого ы ? Р, z/ = л: + «. Следовательно, г/ -г = (х + ы) -г = (х -г) + (и -г) по дистрибутивности, и поэтому x-z<iy'Z. Пусть, наоборот, х -г < г/ -г. Если х < г/, то или х — у или г/ < х по трихотомии. Но в первом случае было бы также x-z = y-z в противоположность допущению, а во втором, как это было уже сделано в начале дока- доказательства (и), из у < х мы вывели бы yz < л>г, снова в противо- противоположность допущению. (ш) Пусть х<су. Применим индукцию по г. Для г=1 спра- справедливость лг<г/г очевидна. Пусть xz<.yz. Тогда xSc^=--xz-x и ySc^=yz-y. По предположению, xz<cyz, следовательно, xz-x<yz-х по (п), а потому, снова по (п) и по коммутативности •, yz-x<.yz-y. По транзитивности отношения < отсюда следует xz-x<cyz-y, завершающее доказательство. Доказательство обрат- обратного проводится от противного, как в (п). Доказательства (iv), (v) и (vi) оставляем читателю. 3.38. Следствие. Для любых х, у, г ? Р (i) если х <с у и г<ш, то х -f- 2 < г/ + w; (и) если х < г/ ы г < ш, то л>г< г/-ш; (iii) белы х <с у и z ^ w, то хг < г/то; (iv) еслы 1 < х < г/ ы г < w, то xz < yw. Доказывается непосредственно по 3.37, при этом используется транзитивность отношения <• 3.39. Следствие. Для любых х, у, z ? Р (i) если xz = г/2, то х = у; (и) если 1 < г и г* = гу, mo x = у. Следствие 3.39 дает нам закон сокращения для экспоненты. Другими словами, 3.39 (i) показывает, что для любого фиксирован- фиксированного z ? Р функция F (х) = хг взаимно однозначна, а 3.39 (ii) пока- показывает, что при 1 < z взаимно однозначна функция G (х) = 2х. Доказываем следствие, используя 3.37 (iii), (v) и закон трихотомии. Упражнения 1. Пусть задана система (S, ¦() и S' s S. Обозначим через -<' отноше- отношение <0 ограниченное на S'. Показать, что из линейной упорядоченности (S, <О следует линейная упорядоченность (S', <^'). Показать то же самое для полной упорядоченности.
3.4. ПОСЛЕДОВАТЕЛЬНОСТИ, СУММЫ И ПРОИЗВЕДЕНИЯ 103 2. Пусть заданы две системы (Sj, <0 и (S^, <d) и Si П S2 = 0. Положим S = 5| U Sj и определим отношение -< на S условием: х < У тогда и только тогда, когда х, у ? Si и х <i у, или х, у ? S2 и х «<2 У. или х ? Si и у ? S2. Показать, что из линейной упорядоченности (Si, <<i) и (S2, <2) следует линейная упорядоченность (S, -<). Показать то же для полной упорядоченности. 3. Показать, что упорядочения, соответствующие 2, 3, 4, . . ., 1 и 2, 4, 6 1, 3, 5 являются полными упорядочениями. 4. Привести пример линейного упорядочения Р, при котором каждое непустое множество в Р имеет последний элемент. 5. Доказать лемму 3.34. 6. Доказать утверждения (iv) и (v) теоремы 3.37. 3.4. Последовательности, суммы и произведения Конечные и бесконечные последовательности. С точки зрения изученных нами свойств положительные целые числа похожи на многие другие числовые системы; поэтому, в частности, для их обозначения мы употребляли «нейтральные» буквы а, Ь, с, х, у, г, . . . Однако, когда положительные целые числа употребляются для упорядочения или подсчета элементов некоторого произвольного множества S, общепринято пользоваться буквами i, j, k, I, m, n, p, q, ... He делая из этого правила, мы также будем в основном придерживаться такой тенденции. На частном случае теоретико-множественной эквивалентности понятие подсчета элементов с помощью положительных целых чисел уже обсуждалось в конце раздела 2.3. 3.40. Определение. Для любых п ? Р и множества S будем говорить, что множество S содержит п элементов, если S теоретико-множественно эквивалентно множеству {k: k ? Р и k < п}. Другими словами, 5 содержит п элементов, если существует вза- взаимно однозначная функция Н с областью определения {k: k ? Р и k ^ п) и областью значений S. Если при этом элемент Н (Щ обозначить ah, то множество S может быть записано в виде {аи az, . . ., ah, . . ., а„}. Кажется интуитивно ясным, что всякое множество, допускающее такую запись, конечно, и, наоборот, вся- всякое конечное множество (исключая пустое) содержит вполне опре- определенное число п, п ? Р, элементов. Напомним теперь, что, согласно формальному теоретико-множественному определению B.4.5), множество 5 называется конечным, если оно не является теоретико- множественно эквивалентным никакому своему собственному под- подмножеству. Любопытно, что доказательство наличия сформулиро- сформулированной выше связи между так определенными конечными множе- множествами и положительными целыми числами не может быть проведено без аксиомы выбора, применяемой к бесконечным множествам!
104 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА В рамках стоящих перед нами задач доказательство это не является абсолютно необходимым, и мы предпочтем ограничиться строгой формулировкой самого факта. Заинтересовавшийся читатель может либо попытаться сам найти доказательство (заведомо не простое), следуя изложенной в упражнениях схеме, либо обратиться к курсам аксиоматической теории множеств (см. библиографию). C.4.1) Непустое множество S конечно тогда и только тогда, когда существует такое п, п ? Р, что S содержит п элементов. Во многих приложениях оказывается удобным рассматривать функцию, чуть более общую, чем функцию пересчета Н. Во-первых, опуская требование взаимной однозначности, приходим к понятию последовательности объектов хи х2, . . ., xh, ¦ ¦ ., хп; во-вторых, допуская функции Н с бесконечной областью определения Р, приходим к понятию нумерации бесконечного множества объектов х1г х2, . . ., xh, . . .; в обоих случаях среди объектов могут быть уже равные. 3.41. Определение, (i) Пусть п ? Р. Конечной последовательностью из п членов в множестве S называется произвольная функция Н с областью определения {k: k?P и k^ п) и областью значений, лежащей в S. Эта последовательность обозначается (Я A), Н B) Я (п)) или (Н (fe))i<;ft<sn. причем k-м членом последовательности называется Н (k). H {Щ обозначается также через хь, а сама последовательность обозначается через (хи хг, . . ., xk, . . ., хп) или (хк}^к^п. (и) Бесконечной последовательностью в S называется произвольная функция Н с областью определения Р и областью значений, лежащей в S. Эта последовательность обозна- обозначается (Н A), Н B), . . ., Я (k), . . .) или (Н (k))heP. Если k-й член последовательности обозначен xh, то сама последователь- последовательность обозначается (хи хг, . . ., xh, . . .) или (xh)hSP. Две последовательности (xit х2, . . ., хп) и (уи у2, . . ., уп), согласно этому определению, одинаковы тогда и только тогда, когда xk = yh для любого k <; п. В частности, (хи х2) = (уи у2) тогда и только тогда, когда х^ = yt и х2 = У?., так что двучленные последовательности обладают теми же свойствами, что и упорядо- упорядоченные пары (xit x2); точная запись последовательности (xit x2) в терминах упорядоченных пар: {A, xt) B, х2)}. Точно так же одинаковы свойства трехчленных последовательностей и упорядочен- упорядоченных троек и т. п. Поэтому, вообще говоря, и-членные последова- последовательности (хи х2, . . ., хп) могут использоваться в тех же ситуа- ситуациях, что и упорядоченные n-ки (jq, x2, . . ., хп), а понятие беско- бесконечной последовательности (xit х2, . . ., xh, . . .) можно даже положить в основу определения упорядоченных наборов с беско- бесконечным числом членов.
3.4. ПОСЛЕДОВАТЕЛЬНОСТИ, СУММЫ И ПРОИЗВЕДЕНИЯ 105 Причины, по которым для записи последовательностей мы упо- употребляем символы ( ), отличные от символов { }, употребляв- употреблявшихся для записи множеств, ясны: они те же, что и причины введе- введения специальных символов ( ) для записи упорядоченных множеств Хотя {1, 2, 3} = {1, 3, 2}, но, очевидно, A, 2, 3)=^ A, 3, 2). Заметим, что некоторые все же пишут {л^^^гсл вместо {xh)i:?h^n, так что читатель должен быть осторожным. Мы же будем всегда рассматривать {хи х2, . , ., хп} как множество, именно как {у: у = xh для некоторого k ? Р, 1 <^ k ^ п}; аналогично понимаем {х1г х2, . . ., xk, . . .}. Например, множество, определенное после- последовательностью A, 3, 2, 1, 3), есть {1, 3, 2, 1, 3} = {1, 2, 3}. Нетрудно видеть, что {xit х2, . . ., хп} содержит т элементов- для некоторого т ^ п (в смысле определения 3.40). Обобщенные суммы и произведения. Понятие последовательно- последовательности, помимо всего прочего, полезно еще тем, что позволяет расши- расширять операции, применявшиеся к фиксированному числу объектов, до операций, применимых к «произвольным» множествам объектов. 3.42. Определение. Пусть на множестве S задана бинар- бинарная операция +, относительно которой S замкнуто, и пусть задана бесконечная последовательность (xit х2 xh, . . .) в S. Для п каждого п ? Р обозначим через Л xk элемент из S, однозначно опре- определенный условиями 0) и+1 п (ii) Л. xh— \Z.xh) +*n+i для каждого п?Р. Корректность этого определения может быть установлена сле- следующим образом. Последовательность {хи х2 xk, . . .) есть некоторая функция Н с областью определения Р, Н (k) = xh для каждого k. Мы ищем такую функцию F с областью определения Р, п чтобы F (п) было равно > xh. Условия (i), (ii) для функции F перепишутся так: C.4.2) (i)' F(l) = H(l); (ii)' F(Sc(n)) = F(n) + H(Sc(n)) для каждого п Пусть C.4.3) с = ЯA); G{n, z) = 2 + Я(Sc(n)) для любых п?Р и z?S
106 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Тогда условия C.4.2) эквивалентны C.4.4) (i)* F(\) = c; (ii)" F(Sc(n)) = G(n, F(n)) для каждого п?Р. <3, Я, с однозначно определены заданной функцией Н. Применив к ним теорему 3.4, получаем существование и единственность функ- функции F, удовлетворяющей условиям C.4.4), 3 (F) = Р, М (F) S S, так что 3.42 оказывается просто другой формой рекурсивного опре- определения (и потому следует ожидать, что различные свойства опре- п деленной таким образом функции > xk придется доказывать по индукции). Нам потребуется также подобное обобщение операции •; соот- соответствующее определение получается из 3.42 просто заменой + на • и \ на YL ¦ . Опред 3.43. Определение. Пусть на множестве S задана бинар- бинарная операция •, относительно которой S замкнуто, и пусть в S задана бесконечная последовательность (xi, х%, . . ., xh, . . .}. Для п каждого п (Е Р обозначим Ц xh элемент из S, однозначно определен- определенный условиями: 1 /:\ | ¦ у „ . п+ 1 п (ii) JJ xk=( JJ xk)»xn+i для каждого ngP. В дальнейшем, если операции обозначаются + или •, определе- определены ли они для положительных целых чисел или для рассматриваю- рассматривающихся в последующих главах более широких числовых систем, операции, определенные на последовательностях, мы будем всегда обозначать соответственно 2 и П ' Заметим также, что величины Л xh и Ц Xh зависят только от тех членов бесконечной последовательности (xit x2, ...,xk, ...), для которых &-<я (см. упражнение 1 ниже). Обобщенные законы ассоциативности и коммутативности. 4 Согласно определению 3.42, вычисление > хи для данной после-
3.4. ПОСЛЕДОВАТЕЛЬНОСТИ, СУММЫ И ПРОИЗВЕДЕНИЯ 107 довательности (хи х2, х3, л:4) должно производиться следующим образом: 4 3 2 C.4.5) хз) ^ Если Xi, x2, x3, xt—положительные целые числа, а -\ обычная операция сложения +, определенная по 3.8, то в силу ассоциа- ассоциативности сложения получим C.4.6) ((xi+xs) + x3) + xt = (x1 + xd +(хз + Хь) = = Xi + ((х2 + х3) + xt) = (xi + (х2 + х3)) + xit или, используя символ 2' 4 2 C.4.7) (а) 2 xh= 2 ft=l ft=i 1 = 2 ftl 12 = 2 **+ 2 У* = ft=l й=1 3 2 ft=l 3 = 2 zh, fc=l u z2, z3) = {xu x2 + x3, д:4>. где C.4.7) (б) (г/,, у2) = (х2 В частности, 3 3 C.4.7) (в) 2 xh+i= 2 wh, где (wu w2, w3) = (x2, x3, xt). ft=i ft=i Вообще говоря, мы не можем ожидать для операции \^ выполнения равенств C.4.7), если для операции + на 5 не выполнен закон ассо- ассоциативности. Если же + ассоциативна, то мы можем сформулиро- сформулировать общее утверждение, охватывающее C.4.7); мы сделаем это в следующей главе. Сейчас же мы сформулируем только утвержде- утверждение, охватывающее равенство первого и второго, а также первого и четвертого членов C.4.7) (а). 3.44. Теорема. Пусть на множестве S задана бинарная операция +, относительно которой S замкнуто, и + ассоциативна, т. е. (х + у) + z = х + (у + г) для любых х, у, z 6 5. Пусть, далее, (xh) — любая бесконечная последовательность в S. Тогда для любых п, т 6 Р имеет место 0)
108 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Если, аналогично, • —ассоциативная операция на S, то п-\-т п т (и) П а= Доказательство, (i) и (ii) доказываются абсолютно оди- одинаково, поэтому докажем только (i). Зафиксируем п и применим индукцию по т. 7J+1 П 1 Но это следует непосредственно из определения 3.42, так как 1 — 1 Предположим теперь, что (i) выполнено для некоторого т, и по- покажем, что тогда оно выполнено для Sc(m), т. е. n+(m+l) n m+1 B) J] ж* = ( Л**) + ( Д Xn+h) ' J] Действительно, ) xh = Xh по ассоциативности + на Р по 3-42 (и) п+т n Xn+k) ) по индуктивному предположению m+l по ассоциативности + на S по 3.42 (и).
3.4. ПОСЛЕДОВАТЕЛЬНОСТИ, СУММЫ И ПРОИЗВЕДЕНИЯ ]09 Поэтому для ассоциативных операций + и • мы можем вместо п п . xh уПОТреблЯТЬ Xi»X2» ¦ . ¦ *Хп И Xi + Хг соответственно. Условимся, далее, для упрощения записи некоторые круглые скобки в конкретных суммах произведений опускать. Например, писать 3-х2-у -+- 5-у3 + х-г2-у вместо C-х2-у) + + E-у3) + (x-z2-y) или ((C-х2) -у) + (Ъ-у3)) + ((х-г2)-*/). Там, где это не приводит к двусмысленности, символ • также будем опускать; приведенный выше пример перепишется тогда в виде 3x2z/ + 5г/3 + + xz2y (недоразумение может возникнуть при попытке опустить • в произведении 2 -3; понимать ли 23 как 2 раза по 3 или как число 23? Скобки же существенны, например, чтобы отличить 2 (х + 1) от B-х) + 1 = 2х+ 1. Из данной последовательности {хи х2, х3, х4) с помощью пере- перестановки членов могут быть построены различные последовательно- последовательности с одним и тем же множеством членов {х1; х2, х3, х4}, например (хи xs, x2, х4) или (х4, хи х3, х2). Сумма первой из этих двух равна {(х± + х3) + х2) + хь если операция + ассоциативна, то сумма равна (Xi + (х3 + Х2)) + *4, а если эта операция еще и коммута- коммутативна, то сумма равна (х4 + (х2 + х3)) + х4 и потому, по пред- предположенной ассоциативности +, ((х4 + х2) + х3) + х4. Иными словами, общей формулировкой коммутативности для ассоциатив- п п лои операции + может служить утверждение, что > xh = > yh, если только последовательность (уи у2, . . ., уп) получена из (xj, х2 хп > перестановкой членов. В общем виде это утверж- утверждение мы докажем в следующей главе, а сейчас выведем только одно специальное следствие ассоциативности и коммутативности, которое, для рассматривавшегося выше примера, принимает вид ( V I Ч/* \ I | Ч/* I v \ ^-^ ( V I Ч/* Л I / V I ч^ \ V^i "Г "^2/ ^Г \"^3 Т" *™4У — \ 1 "Г "^3/ ^\ \™2 ^1 "*/» или, обозначая иг = х3 и uz = xi, (Xi + Хг) + (Ui + U2) = (Xt + Ut) + (Х2 + U2). 3.45.. Теорема. Пусть множество S замкнуто относительно -бинарной операции +, ассоциативной и коммутативной на S ¦-{т.е., для любых х, у, z?S, (x + y) + z = x + (y + z) и х+у = = У + Х)- Пусть, далее, (xk)ksP и (yh)hsP — dee любые бесконечные ^последовательности элементов S. Тогда (i)
ПО ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА Аналогично, если • ассоциативна и коммутативна на S, то п п п 00 (П •**)•( П й)=П й»г/й). ft 1 ft= 1 fe=: i Доказательство предоставляется читателю. В той же форме легко формулируется закон дистрибутивности; доказательство его мы также оставляем читателю. 3.46. Теорема. Пусть множество S замкнуто относительно бинарных операций +, •, а операция • дистрибутивна справа на S относительно +. т. е., для любых х, у, г ? 5, Пусть, далее, (хи)ъ?р — любая бесконечная последовательность в S и z?S. Тогда для любого п?Р (Т xh)mz = Аналогичный результат справедлив для дистрибутивности слева, т. е. когда zm(x + у) = (zmx) + (z»y) для любых х, у, z 6 S. Конеч- Конечно, если операция • коммутативна, то последние два результата эквивалентны. Некоторые специальные суммы и произведения. Читатель знаком с различными специальными суммами типа суммы первых п положи- положительных целых чисел 1, 2, 3, . . ., п; суммы первых п членов ариф- арифметической прогрессии а, а + d, a + Bd), . . ., а + (nd); суммы первых п квадратов 1, 4, 9, . . ., и2; суммы первых п членов гео- геометрической прогрессии а, а-г, а-г2, . . ., й-г" и т. д. Употребляя символ 2. первую из них можно записать в виде ,348^ У k- "(" + 1) или, учитывая, что деление мы еще не определяли, в виде п C.4.9) 2 2 k = n(n+l). Доказательство C.4.9) легко провести индукцией, но мы отложим его, как и вообще рассмотрения арифметических и геометрических прогрессий, до того момента, когда мы будем иметь право исполь- использовать отрицательные числа и дроби.
3.4. ПОСЛЕДОВАТЕЛЬНОСТИ, СУММЫ И ПРОИЗВЕДЕНИЯ Ш Произведение первых п положительных целых чисел, которое обычно обозначается п\, мы можем определить как п C.4.10) ft! = II^ и тогда рекурсивная характеристика п\, приведенная в самом конце предыдущего раздела, будет прямым следствием определе- определения 3.43: C.4.11) 11 = 1, В действительности, даже обычное умножение и возведение в сте- степень могут быть введены посредством обобщенных сумм и произве- произведений. Рассмотрим, например, последовательность (х,х,. . ., х, .. .), все члены которой тождественно равны данному х ? Р. Для любого п 6Р C.4.12) S|* = n-x и п C.4.13) Л х = хп. Такие определения соответствуют интуитивному пониманию про- произведения п -х как n-кратной суммы х -f- х + . . . + х, а степени хп — как n-кратного произведения х-Х' . . . -х. Утвержде- Утверждения C.4.12) и C.4.13) легко доказываются по индукции. Сделаем еще одно замечание относительно использования сим- __ п волов V" и IJ . Переменную k в Л. хь часто называют «фик- «фиктивной» переменной, ввиду того что C.4.14) С другой стороны, у xh и Л xh, вообще говоря, различны. Поэ- n m тому роль индексов п и к в > *д существенно различна и в чем- п и k в \ ft то похожа соответственно на роль свободных и связанных пере- переменных в формулировках условий. Аналогичная ситуация встречается
412 ГЛ. 3. ПОЛОЖИТЕЛЬНЫЕ ЦЕЛЫЕ ЧИСЛА п п « в анализе при интегрировании: \ х^&х — \ y2dy. Можно было 1 1 •бы строить теорию сумм, произведений, интегралов, не прибегая к помощи связанных переменных. Например, вместо последова- последовательностей (Xft)ft?p можно рассматривать непосредственно функции Н, п H(k) = xh для всех x?jP и вместо \^ xk писать <3.4.15) Рекурсивные свойства суммы (соответствующие 3.42) запишутся тогда C.4.16) .. ' я) +#(Sc(n)). I Sc (n) \ ,^ n I \ \ // По сути дела мы уже прибегали к этому варианту, доказывая кор- корректность определения 3.42. Обозначения такого типа, конечно, ¦с теоретико-множественной точки зрения более оправданы, но не достаточно удобны с точки зрения использования. Например, чтобы выразить C.4.9), пришлось бы писать так: C.4.17) Пусть Н — функция с областью определения Р и H{k) = k для всех &?Р. Тогда 2 2" Н = п (п + 1) для каждого я?Р. Упражнения 1. Пусть в множестве S заданы две бесконечные последовательности ixh)h?p и (yh>h?V и « 6 Р —любое фиксированное число. Доказать, что тлзхи — Ун для любого k^n следует п п п п **- 11 Ук- й=1 й=1 2. Доказать теорему 3.45. 3. Доказать теорему 3.46. п 4. Показать, что 6 ^] № = п (п + 1) B«-+1) для любого п g P. 5. Следующая серия задач предлагается в качестве схемы доказатель- доказательства утверждения C.4.1), что непустое множество S конечно в смысле B.4.5) тогда и только тогда, когда существует такое п ? Р, что S содержит п элемен- элементов. Докажите, что (как и раньше, [1, п] = {k: k ? Р и k <I п}) (а) {х} конечно для любого элемента х; (б) если S конечно их — любой элемент, то S [J {х} конечно; (в) [I, я] конечно для любого я б Р;
3.4. ПОСЛЕДОВАТЕЛЬНОСТИ. СУММЫ И ПРОИЗВЕДЕНИЯ 113 (г) если S конечно и S' теоретико-множественно эквивалентно S, то S' конечно; (д) пусть М — любая непустая совокупность непустых множеств, тогда существует функция Gc^(G)=MnG (X) ? X для любого X ? М (У к а - з а н и е. Это — следствие аксиомы выбора B.2.16). Рассмотреть совокуп- совокупность N всех множеств X' вида X' = {(X, х): х 6 X}, где X ? М. Приме- Применить B.2.16) к N); (е) пусть множество S обладает тем свойством, что оно не является теоретико-множественно эквивалентным никакому [1, п] для п ? Р; тогда существует взаимно однозначная функция F с 2) (F) = Р и iR (F) ^ S (Указание. Пусть М — совокупность всех непустых подмножеств мно- множества S, а функция G выбрана для М по (д). Искомую функцию F определить рекурсивно, принимая за F (п + 1) элемент из S, не лежащий в множестве {F A), . . ., F (п)}, заданный посредством G(S-{F A), ..., F («)}).); (ж) если существует взаимно однозначная функция F с 3) (F) = Р и 31 (F) g S, то S бесконечно. Из всех этих утверждений выведите C.4.1).
ГЛАВА 4 ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ 4.1. Расширение области натуральных чисел Практические мотивировки. Чтобы передать информацию о целочисленных величинах, необходима система обозначений, позволяющая записывать сколь угодно большие положительные целые числа. Ясно, что система черточек являлась, пожалуй, самой простой и естественной из всех таких систем; но столь же ясны были неудобства ее практического упо- употребления. Записать в этой системе количество овец в стаде средних размеров или количество мешков пшеницы в снятом урсжае доста- достаточно канительно, а арифметические операции над такими числами, требующиеся для коммерческих целей, весьма трудоемки при такой записи. Если, скажем, за каждый из мешков пшеницы просят по кусочков золота, то пройдет немало времени, пока покупатель сообразит, стоит ли платить такую цену! Итак, удобная система обозначений для больших чисел стала практической необходимостью уже в давние времена. Идея ее построения состояла в том, чтобы выделить достаточно большие стандартные группы прежних единиц в качестве новых единиц, так чтобы большое число разбивалось на меньшее число обозримых частей. Например, если в качестве большой единицы выбрать |||||, то записанное выше с помощью черточек количество мешков в новых обозначениях будут выглядеть гораздо проще: ж ж ш ш ни
4.1. РАСШИРЕНИЕ ОБЛАСТИ НАТУРАЛЬНЫХ ЧИСЕЛ Ц5 где перечеркивание означает полную единицу |||||. Дальнейшего сокращения записи можно добиться, обозначая^ -fHtt" через Jf и вво- вводя новую единицу Jf, содержащую Jf групп по Jf элементов, и т. д. В нашем случае число состоит из Jf раз по Jf и |||| раз по |, или, располагая единицы по величине, Jf— одна, Jf—нет, |— ||||. Требующееся для последней схемы указание отсутствия некоторых единиц удобнее всего записывается введением специального симво- символа 0; число мешков теперь имеет вид | : Jf, 0 : Jf, |||| : [, а число кусочков золота за каждый мешок— \\-Jf, ||||: I- Дальнейшая эко- экономия места и времени достигается введением специальных символов Для |, ||, |||, НИ, например, 1, 2, 3, 4. Тогда получаем 1 : Jf, 0 : Jf, 4 : j и 2 : jf, 4 : |. Последнее упрощение при фиксированном выборе единицы Jf и при договоренности, что порядок записи строго фикси- фиксирован (наименьшая единица пишется последней), состоит в пере- переходе от записей 1:^,0:/|/,4:|и2:^,4:|к записям 104 и 24, где сами обозначения единиц опущены; в записи, таким образом, значение единицы определяется положением (позицией) соответ- соответствующего символа в записи. Естественно, при использовании дру- других основных единиц мы получили бы другую запись для тех же чисел. Так, если в качестве основной единицы взять ||!1||||||, а все предшествующие числа обозначить 1, 2, 3, 4, 5, 6, 7, 8, 9, то получим 29 и 14. Если же основная единица есть ||, то эти числа запишутся как 11101 и 111. Выбор базисной единицы будем в дальнейшем назы- сать выбором основания системы счисления, причем слова «по осно- основанию ШИШИ» будем опускать. Таким образом, 104 и 24 — запись чисел 29 и 14 в системе по основанию 5, а их же запись в системе по основанию 2 («двоичной системе») будет 11101 и 111. Заметим, что в последнее время произошел отход от использования исключитель- исключительно десятичной системы счисления и все чаще в практических целях используются системы с малыми основаниями. Так, в машинной математике, в электронно-вычислительных машинах используется главным образом двоичная система. К использованию символа 0 для обозначения «пустого» количе- количества нас привел, таким образом, чисто практический вопрос, свя- связанный с экономной записью положительных целых чисел, и шаг этот с формальной точки зрения никаких возражений встретить не может. Однако для доказательства корректности введенной системы обозначений (в том смысле, что каждое число может быть записано единственным — по данному основанию — способом) нам придется потребовать дополнительно, чтобы символ 0 удовлетворял некоторым алгебраическим условиям. Так, для записи числа в систе- системе по основанию 5 мы разбиваем число на группы единиц 1, 5, 52, . . .; например, представляя число 29 в виде 1-52 + 4-1 и записывая результат 104, мы подразумеваем 1 -52 + 0*5 + 4-1. Иначе говоря,
116 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ мы полагаем, что для символа 0 выполнено при любом а D.1.1) 0-а = 0, 0 + а = а. Также неявно мы подразумеваем здесь выполнение закона ассоциа- ассоциативности для множества положительных целых чисел, пополненного новым «числом» 0. Для этого множества нам придется также потре- потребовать коммутативность обеих операций и дистрибутивность • относительно +, если мы хотим сохранить для любой позиционной системы счисления ту простоту выполнения арифметических опера- операций, которую мы продемонстрируем на примере умножения числа 14 на 29 в системах счисления по основанию 10 и 5: 29 104 J4 _24 D.1.2) И6 (при основании 10), 431 (при основании 5), 406 зТТГ где вычисляются, конечно, B • 10 + 9)-A -10 + 4) и A -52 + 0-5 + + 4)-B-5+ 4). Итак, мы видим, что по крайней мере некоторые проблемы, касающиеся положительных целых чисел, могут быть решены путем присоединения к множеству положительных целых чисел нового элемента 0 и распространения на полученное множество операций •, + так, чтобы они удовлетворяли условиям D.1.1) и большинству других законов, обычных для положительных целых чисел. Мы, конечно, не можем ожидать выполнения всех законов; закон сокра- сокращения для умножения, очевидно, не выполняется, так как для произвольных а, Ь имеем 0-а = 0-Ь. Выполнения каких именно законов следовало бы потребовать для нашего расширенного множе- множества, показывает анализ позиционной записи чисел и арифметиче- арифметических вычислений в этой записи. Алгебраические мотивировки. Исторически алгебра возникла из рассмотрения задач, в которых некоторую величину или вели- величины нужно было отыскать по тем условиям, которым они должны удовлетворять. Частным случаем такой задачи является, например, отыскание положительных целых чисел х, у (если такие существуют), удовлетворяющих условиям D.1.3) 4х + у = Ю и Зх + 2у=12. Прямолинейный подход к решению этой задачи — записать пары положительных целых в виде некоторой последовательности и про- пробовать далее эти пары одну за другой в надежде наткнуться в конце концов на решение. Однако если нам не повезло, то ответа мы дать не можем; какое бы конечное число пар мы ни перебрали, всегда остаются две возможности: то ли мы просто не дошли до нужной пары, то ли ее нет вообще. Для данной конкретной задачи эту труд-
4.1. РАСШИРЕНИЕ ОБЛАСТИ НАТУРАЛЬНЫХ ЧИСЕЛ Ц7 ность легко обойти, заметив, что для решения должно быть 4х < 10, Зх < 12, у < 10 и 2г/ < 12, т. е. х <^ 2 и г/ -<! 5, так что решение нужно искать среди 10 возможных пар, и задача решается далее тривиальным перебором. Конечно, в других задачах, даже если их удастся таким образом упростить, заключительный перебор может оказаться чрезвычайно затруднительным. Кардинальное упрощение решения достигается совсем другим путем — исключением одной переменной. Умножив обе части первого равенства D.1.3) на 2, получаем 8х + 2у — 20. Это равенство можно истолковать следую- следующим образом: 2г/ есть то число, прибавление которого к 8х дает 20; будем записывать это высказывание как 2г/ = 20 — 8х. Аналогич- Аналогично, из второго равенства D.1.3) получаем 2г/= 12 — Зх, или, сравнивая полученные высказывания или равенства, 20 — 8х = = 12 — Зх. Возвращаясь к стандартной записи, получаем 20 + Зх= = 12 -+- 8х. Далее, по законам сокращения и дистрибутивности, 8 -\- Зх = E -+- 3) х = Ъх + Зх и 8 = 5х. Поскольку таких целых положительных чисел не существует, задача D.1.3) в положитель- положительных целых числах неразрешима. В разобранном примере мы рассматривали выражения вида Ь — а, понимая под этим, что Ь — а = г эквивалентно Ь = a -j- z. Конечно, так определенное вычитание не является операцией в на- нашем понимании этого слова, так как Ь — а определено далеко не при всех а, Ь ? Р (именно, только при Ъ>а,а,Ъ^ Р).^Тем не менее, выра- выражения такого типа оказываются очень полезными при решении мно- многих задач о целых положительных числах, хотя и возникают неко- некоторые трудности, связанные с проверкой условий их законности. Эти трудности можно ликвидировать, разрешив рассмотрение «разности» Ь — а для любых а, Ь, т. е. добавив к множеству целых положительных чисел Р новые «числа» так, чтобы на полученное множество распространялась операция + и чтобы теперь*—»стала операцией. Например, новому множеству должно принадлежать а — а, т. е. такое г, что а = а + z, и «изобретенный» выше эле- ¦ мент 0 — первый кандидат на включение в это множество. Итак, мы хотим распространить операции + и • на новый, более широкий класс объектов (которые мы в дальнейшем будем называть целыми числами) так, чтобы сохранилось как можно больше свойств операций + и • и, кроме того, выполнялось D.1.4) для любых целых чисел а, Ь существует такое целое число z, что а + 2 = Ь. Построение нужного расширения будет состоять из двух этапов. Во-первых, мы выделим набор основных свойств, которыми должны обладать операции + и • на искомом множестве D, и изучим неко- некоторые их следствия. Во-вторых, докажем существование хотя бы
118 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ одного расширения с нужными свойствами и, убедившись, что их много, выделим одно — целые числа — как в определенном смысле минимальное. Коммутативные кольца с единицей 4.1. Определение. Система (D, +, •, 0, 1) называется коммутативным кольцом с единицей, если 0,1 ? D, D замкнуто относительно бинарных операций + и • и если для любых х, у, z 6 D имеем (i) 0^=1; (ii) х-ь у=--у + х и Х9у — у»х; (ш) д: + (г/ + г) = (л: + г/) + z и x»(yz) = (xe у)» z; (iv) х-\-0 = х и х»\=х; (v) л:»(«/ + г) = (л:# y) + {x&z); (vi) существует такое и ? D, что х + а = г/. Сделаем некоторые замечания относительно приведенных усло- условий. Прежде всего условия (ii) — (iv) симметричны относительно бпераций +, 0 и *, 1 — вторая часть каждого условия получается из первой заменой + на » и 0 на 1. Следовательно, все следствия из условий (ii) — (iv) должны обладать тем же свойством. Усло- Условие (ii) выражает коммутативность операций, (ш) — ассоциатив- ассоциативность их, (v) —дистрибутивность • относительно +, a (iv) выде- выделяет 0 и 1 как соответственно нулевой и единичный элементы относи- относительно -J- и •. За исключением первой части условия (iv), условия- условиями (ii) — (v) обладает множество Р с операциями + и •. Условие (vi) обеспечивает наличие искомой операции вычитания, хотя, для того чтобы говорить об операции, нужно доказать единственность такого и, что у = х + и, т. е. нужно доказать, что язх+и = уих-\-и = у следует и = v, т. е. что имеет место закон сокращения для D. Мы скоро покажем (теорема 4.3), что этот закон — следствие условий 4.1. Развитие соврелгенной алгебры показало пользу рассмотрения систем, удовлетворяющих не всем условиям 4.1, а только их части. В частности, рассматриваются системы, удовлетворяющие усло- условиям (in), (v), (vi) и первым частям (ii) и (iv); эти системы называют- называются кольцами. Кольцо при этом называется коммутативным., если при этом выполняется вторая часть условия (ii), и называется коль- кольцом с единицей, если существует элемент 1, удовлетворяющий (i) и второй части (iv). Коммутативное кольцо с единицей обладает всеми нужными с нашей точки зрения свойствами целых положительных чисел и дает возможность определить вычитание. Позже мы убедимся, что таких колец много, и поскольку в дальнейшем нам будут полезны разные кольца, имеет смысл посмотреть, какими свойствами обладает любое коммутативное кольцо с единицей, оставив выделе- выделение конкретного кольца целых чисел до следующего раздела.
4.1. РАСШИРЕНИЕ ОБЛАСТИ НАТУРЛЛЬПЫК ЧИСЕЛ 119 Итак, во всей оставшейся части раздела (D, +, •, 0, 1) — произвольное коммутативное кольцо с единицей. Мы начнем с установления единственности 0 и 1 как соответ- соответственно нулевого и единичного элемента. 4.2. Теорема. Пусть и ? D- (i) Если х -+¦ и = х для всех х 6 D, то и = 0. (ii) Если х»и = х для всех х ? D, то и = 1. Доказательство. Докажем (i). Полагая в (i) x = 0, получим 0 + и = 0; но, в силу коммутативности +, 0 -+¦ и = = и + 0 = 0. Отсюда, в силу 4.1 (iv), и = 0. Доказательство (ii) получается заменой + на • и 0 на 1. 4.3. Теорема. Если х, у, z 6 D и х -f- у = х + z, то у = г. Доказательство. Согласно 4.1 (vi), существует такое и, что х + и = 0 и, ввиду коммутативности сложения, и -f- х — = 0. Прибавим и к обеим частям равенства х -\- у = х 4- z: и + {х + у) = и + (х + z). Отсюда, в силу ассоциативности + и выбора и, 0 -f у = 0 + г. Но тогда, вследствие коммутативности -$-, у-{-0~г-\-0яу — z ввиду 4.1 (iv). (Таким образом мы произвели «вычитание» и из обеих частей равенства х -f- У = х + z.) Непосредственно из 4.1 (vi) и 4.3 выводится 4.4. Следствие. Для любых х, у 6 D существует един- единственное и такое, что х + и = у. 4.5. Определение, (i) Для любых х, у ? D пусть у —- х есть единственное такое и, что х + и = у. (ii) Для любого х 6 D будем обозначать ~—х = 0 — х. Таким образом, у — х — бинарная операция, а <—х — унарная операция; по отношению к обеим операциям D замкнуто. 4.6. Теорема. Для любых х, у, z 6 D имеем: (i) х + (—х) = 0; (ii) если х + и — 0, то и = —ж; (Ш) 0 — * = у + (~~Х). Доказательство, (i) следует непосредственно из 4.5 (i) и (ii), a (ii) следует из 4.4. По определению разности у —• х, усло- условие (iii) эквивалентно х + (у + (¦—#)) — # и> ввиду ассоциативно- ассоциативности и коммутативности операции +. # + (х + (—х)) = у; но послед- последнее легко следует из х + (—#) = 0 и г/ + 0 = г/. Части (i) и (ii) характеризуют -—г как элемент, обратный к х. 4.7. Теорема. Для любого х 6 D, я«0 = 0.
120 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Доказательство. Достаточно найти и такое, что и + х*0 = и + 0. Но Х9Х + хтО — хт(х + 0) по дистрибутивности • относительно + = хтх по 4.1 (iv) = хтх + 0 снова по 4.1 (iv). 4.8. Теорема. Для любых х, у ? D имеем: (i) — (—*) = х; (ii) *•(—#) = — (хту); (iii) (—х)*г/ = — (хту); (iv) (—*)•(—#) = хту. Доказательство, (i) Вследствие 4.6 (ii) для доказатель- доказательства достаточно показать, что (—х) + х = 0; однако это следует непосредственно из 4.6 (i). (ii) Согласно 4.6 (ii), достаточно показать, что хту + + х»(—у) = 0. Но x»y-j-xm(—y)=x»(y+(—y)) по дистрибутивности » относительно + =*#0 по 4.6 (i) =0 по 4.7. (iii) следует непосредственно из (ii) и коммутативности •. (iv) легко следует из (i) — (iii). Таким образом, «правило знаков» 4.8 (iv), которое кажется столь необоснованным для многих начинающих изучать арифметику, в действительности является формальным следствием условий, опре- определяющих коммутативное кольцо. 4.9. Теорема. Для любых х, у, z ? D Xm(y — Z) = Хту — X'Z. Доказательство хт(у — г) = хт(у + (—г)) по 4.6 (iii) = хту + хт(—г) по дистрибутивности • относительно + = x*y+(—(xmz)) по 4.8 (ii) = xmy—xmz no 4.6 (iii). Как это было сделано в разделе 3.4, любой последовательности (хи xz, ...,xk, ...) элементов из D можно сопоставить «сумму» п h и «произведение» Д xh — обобщения операций + и •. В частности, следующим образом можно определить кратное и степень:
4.1. РАСШИРЕНИЕ ОБЛАСТИ НАТУРАЛЬНЫХ ЧИСЕЛ 12} 4.10. Определение. Пусть x?D и /г?Р. Положим п п (i) пх = у ' xft = У л: п п любого 1-<< Следует, конечно, отметить, что пх не есть сокращение для п»х. Ведь ниоткуда не следует, что Р s D, так что не всегда n?D и птх может быть вообще не определено. Основные свойства кратного и степени сформулированы в сле- следующих двух теоремах, доказательства которых представляются читателю. 4.11. Теорема. Для любых х, г/ 6 D и т, /г 6 Р выполнено: (i) lx — x; (ii) (т-\-п)х =-mx-\- пх; (iii) (т ¦ п) х = т {пх); (iv) /г0==0; (v) /г (л + у) = пх + пу; (vi) /г (л • г/) = (ш;) • г/; (vii) п(—х) = —(пх); (viii) п(х—г/) = пх —пг/. 4.12. Теорема. Для любых х, z/?D и т, п?Р выполнено (i) x1=x; (ii) xm+n = xm*xn; (iii) xm-n=(xm)"; (iv) 0n = 0; (v) ln=l; (vi) (xmy)n = xn»yn. В первых частях этих теорем D.11 (i) — (iii) и 4.12 (i) — (iii)) выясняется связь соответственно кратного и степени с операциями в Р, а в остальных — с операциями в D при фиксированном п. Конечно, здесь указаны далеко не все связи, а лишь наиболее простые •— читатель легко убедится в этом сам. Упражнения 1. Докажите 4.11 (ii), (iii), (v), (vi), (vii). 2. Докажите 4.12 (iii), (vi). 3. Докажите, что, для любых х, у, z, w 6 D, х —' у = г — w тогда и только тогда, когда х -}- ш = г -{- У- 4. Докажите, что для любых х, у, г, w 6 D выполняется (а) (х — у) + (г - w) = (х 4- г) — (у 4- w), (б) (х — у) — (г — w) = (х + w) — (г/+ г). (в) (х — г/) • (г ¦— w) = (х • z ~\- у » w) ~ (у 9 z-\- х 9 w). 5. Можете ли вы построить систему, удовлетворяющую всем условиям из 4.1, кроме первого, 0 ф 1?
122 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ 4.2. Области целостности Положительные целые числа обладают рядом свойств, которых мы не можем требовать от произвольной системы с вычитанием. Рассмотрим, например, закон сокращения для умножения. Согласно этому закону, для любых х, у, z 6 Р из хту — x»z следует у = г, в произвольном же коммутативном кольце с единицей 0е1 = Ос О и О Ф 1. Однако наша интуиция подсказывает, что х = 0 — совер- совершенно особый случай и что имеет смысл рассматривать закон сокра- сокращения в «урезанной» форме. Системы, в которых такой закон выпол- выполняется, получили специальное название. 4.13. Определение. Система (D, +, •, 0, 1) называется областью целостности, если (D, + , •, 0, 1) — комму- коммутативное кольцо с единицей и если для любых х, у, z ? D из хту = xmz и х Ф 0 следует у = г. Подсистема (D', +, «, 0, 1) системы (D, +, *, О, I), являющаяся областью целостности, называется подобластью области (D, +, •, 0, 1). "Легко видеть, что если (D, + , в, 0, 1) —область целостности hD's D, то D' образует подобласть области D относительно опера- операций в D тогда и только тогда, когда 1 6 D и для любых х, у 6 D' имеют место включения х + у 6 D', х — у 6 D' и х»у 6 D'. Впоследствии мы приведем ряд примеров коммутативных колец с единицей, не являющихся областями целостности. Следующая теорема дает полезный эквивалент введенному понятию. 4.14. Теорема. Коммутативное кольцо с единицей (D, +, •, О, !) тогда и только тогда является областью целостности, когда для любых х, у 6 D из х&у = 0 следует х = 0 или у = 0. Доказательство. Пусть (D, +, •, 0, 1) — область целостности и х*у = 0. Если х = 0, то теорема доказана. Пусть теперь х ф 0. Нужно показать, что из х Ф 0 следует у = 0. Но, ввиду 4.7, xmQ = 0 и потому х@у = х«0. В силу определения 4.13 из х Ф 0 следует сразу у = 0, что и требовалось. Пусть, наоборот, (D, +, », 0, 1) — произвольное коммутатив- коммутативное кольцо с единицей, причем для любых a, b ? D из а»Ь = 0 следует а = 0 или Ь = 0. Возьмем любые х, у, z 6 D такие, что .г^Ои х*г/ = д;#г. Вследствие 4.6 х&у «=» xez = 0 и хе(г/ —. г) = 0 по 4.9. Поскольку мы предположили, что хфО, то у — г = 0, или г = г/ по 4.6, что и требовалось. Теорема 4.14 представляет собой первый шаг на пути изучения решений алгебраических уравнений в областях целостности. Так, если D — произвольное коммутативное кольцо с единицей, 2 = 21 = 1 + 1 и 3 = 31 ==2+1, то на основании результатов раз- раздела 4.1 можно утверждать, что х2 — 2»х — 3 = (х — 3) е(х + 1).
4.2. ОБЛАСТИ ЦЕЛОСТНОСТИ 123 Следовательно, для любого х ? D, х2 — 2*д; — 3 = 0 тогда и только тогда, когда (х — 3)*(л: + 1) = 0. Можно утверждать, что последнее равенство выполнено при х — 3 = 0 или х + 1 = 0, т. е. при д; = 3 или х = —1 (в силу 4.7 и 4.14); но только в случае, когда D — область целостности, можно утверждать, что других решений уравнение х2 — 2*х — 3 = 0 не имеет. Мы пока еще не доказали существования хотя бы одного комму- коммутативного кольца с единицей, тем более не доказали существования хотя бы одной области целостности. С этой точки зрения обращает на себя внимание тот факт, что в их определения явно входят только два элемента 0 и 1. Естественно поэтому попробовать построить коммутативное кольцо с единицей, содержащее только эти элемен- элементы. Таблицы действий операций сложения и умножения должны при этом выглядеть так: + 10! • I 0 1 0 1 0 1 0 1 о о 0 1 В первой таблице три результата следуют прямо из х + 0 = 0 + + х = х. Последнее равенство 1 + 1=0 следует из того, что дол- должен существовать такой элемент и, что 1 + и = 0, но им не может быть и = 0. Вторая таблица заполнена на основании равенств х»0 = 0 = 0*х и х*\ = х. Придавая переменным х, у, z всевозмож- всевозможные значения, можно теперь проверить, что все условия 4.1 и 4.13 (или 4.14) выполнены, т. е. что наша двухэлементная система дей- действительно является областью целостности. Практическая проверка выполнения всех условий — скучная и длительная процедура; только проверка дистрибутивности требует, например, рассмотре- рассмотрения восьми случаев. Однако тот же результат можно получить в виде следствия более общей теоремы (доказанной в конце главы), в кото- которой будет построена целая система областей целостности. Упорядоченные области целостности. На первый взгляд при- приведенный выше пример двухэлементной области целостности плохо согласуется с интуитивной концепцией целого числа, которая и при- привела к изучению таких систем. Но никакого реального противоре- противоречия здесь нет: пример просто показывает, что мы наложили слишком мало условий, чтобы выделить целые числа. Мы, например, на мно- множестве Р имели еще отношение порядка. Можно попробовать ввести подобное отношение и для новых чисел. По многим причинам (они будут ниже приведены) естественно ожидать, что 0 «меньше» 1, а 1 «меньше» 1 + 1. Но тогда ясно, что отношения, подчиняюще- подчиняющегося закону трихотомии, на двухэлементном множестве, построен- построенном выше, нет: ведь 1 + 1=0. Можно ожидать поэтому, что тре- требование упорядоченности позволит отсеять такие непривычные системы.
124 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Мы уже рассматривали интуитивную картину упорядочения целых чисел . . ., —3, —2, —1, 0, 1, 2, 3 где х < у тогда и только тогда, когда элемент х расположен левее у. Конечно, это не есть полная упорядоченность, но во всяком случае линейная упорядоченность. Связь этого упорядочения с арифмети- арифметическими операциями + , • (по крайней мере для положительных целых чисел), как мы видели в 3.37 (i), (ii), состоит в том, что для любых х, у, z 6 Р из х < у следует х + z < у + г и x-z<yz. Мы вправе ожидать, что первое из этих двух неравенств сохранится и для любого z (отрицательного или равного 0); что же касается второго, то для 2 = 0 оно, конечно, переходит в равенство, а для г < 0 — даже в обратное неравенство у-г < х-г, как нам подсказы- подсказывает интуиция. Точно формулируя эти условия, получаем 4.15. Определение. Система (D, +, •, <, 0, 1) назы- называется упорядоченной областью целостно- целостности, если выполняются следующие условия: (i) (D, +> •> 0, 1) — область целостности; " (ii) (D, <) •—линейно упорядоченная система; (iii) для всех х, у, z 6 D, если х < у, то х + z < у + г; (iv) для всех х, у, z ? D, если х < у и 0 < г, то x»z < yz. В любой такой области мы обозначим через D+ множество {х: х 6 D и 0 < х}. Если (D\ +. •> <> 0, 1) — подсистема системы (D, +, •, <, 0, 1), которая является упорядоченной областью целостности, то она называется упорядоченной подобластью второй системы. Существование упорядоченной области целостности будет дока- доказано путем построения целых чисел в следующем разделе. 4.16. Теорема. Пусть (D, +, •, <, 0, 1) — упорядоченная область целостности. Тогда для любых х, у 6 D мы имеем: (i) х < у тогда и только тогда, когда г/ — д; 6 D+; (и) если x,y?D+, то x + y?D+ и x*r/6D+; (iii) имеет место один и только один из следующих случаев: x€D+, x = 0, —xeD+; (iv) если х=^=0, то хг ? D+; (v) I 6D+; (vi) если х 6 D+ и п 6 Р, то и 6 D+ и x"?D+. Доказательство (i). Если х < у, то х + (—х) < у + + (—х) по 4.15 (iii). Отсюда 0 < у — х. Наоборот, если 0 < у — х, то мы имеем 0 + х < (У "~ х) + х, откуда х < у. (ii) Предположим, что 0 < х, 0 < у. Тогда 0 + у < х + у по 4.15 (iii), или у < х -}- у. Отсюда в силу транзитивности также
4.2, ОБЛАСТИ ЦЕЛОСТНОСТИ 125 О < х + у. Из 4.15 (iv) также следует, что 0»г/ < х*у, что экви- эквивалентно 0 < х*у. (iii) —. х 6 D+ тогда и только тогда, когда 0 < —я, или 0 < < о ~ х, что, согласно (i), эквивалентно х < 0. Следовательно, (iii) следует прямо из закона трихотомии для <, записанного для 0 и х. Доказать (iv) — (vi) мы предоставляем самому читателю. Условия 4.16 (i), (ii), (iii) приводят к новой характеристике упорядоченных областей целостности. 4.17. Теорема. Предположим, что (D, +, •, 0, 1) — область целостности, в которой выделено множество Pos s D, удовлетво- удовлетворяющее следующим условиям: (i) если х, у 6 Pos, то х + у cz Pos и х»у 6 Pos; (ii) для любого х ? D имеет место в точности один из следующих трех случаев: х 6 Pos, х = 0, —х 6 Pos. Положим х < у в том и только в том случае, когда у — х 6 Pos. Тогда (D, +, •, <, 0, 1) —упорядоченная область целостности, в которой Pos = D+- Доказательство оставляем читателю. Легко видеть, что построенная в предыдущем разделе двухэле- двухэлементная область целостности не может быть превращена в упорядо- упорядоченную, так как из определения D+ и 4.16 (v) следует, что 0 < 1 и 0 + 1 < 1 + 1, что в силу равенства 0 = 1 + 1 противоречит закону трихотомии для <. В действительности, всякая упорядоченная область целостности содержит много различных элементов. Если п обозначает элемент п\, то повторным прибавлением 1 к обеим частям неравенства 0 < 1 получаем цепочку 0<1<2<3< •••<n<n + + 1 < • • • Построенное множество Р элементов п выглядит очень «похоже» на положительные целые числа, по крайней мере с точки зрения упорядоченности. На самом деле, как мы сейчас увидим, верно гораздо большее. До конца этого раздела (D, +,*,<, 0, 1) — произвольная упорядоченная область целост- целостности. 4.18. Теорема. Пусть Р = {п\: п ? Р}. Тогда (Р, +, •,<, 1) ^(Р, +, •, <, 1). Доказательство. Для каждого п 6 Р положим F (п) = = п\. Тогда 35 (F) = Р, Я (F) = Р и F A) = 1. Далее, используя рассуждения, приведенные выше, имеем для любых п, т 6 Р A) п <С т тогда и только тогда, когда F (п) < F (т). Отсюда B) F взаимно однозначна;
126 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ действительно, при пф т будет или п <т, или т < п, откуда или F (п) < F (т), или F (т) < F (п), во всяком случае /•" (п) Ф F (т). Остается установить, что C) F (п + т) = F (п) + F (т) и D) F (п-т) = F (n)»F (т). Равенство C) прямо следует из 4.11 (ii) при х = 1: (я -{- /га) I = = п\ + ml, а D) — из 4.11 (iii), (vi) также при х = 1: (п-т) 1 = = п (ml) = п (!в/л1) = nle/nl. Абсолютные величины. Мы знакомы с понятием абсолютной вели- величины, или модуля, числа, которая равна самому числу, когда оно положительно, и равна противоположному числу, если данное число отрицательно. При помощи закона трихотомии мы можем ввести подобное понятие в любой упорядоченной области целостности. 4.19. Определени е. Для каждого х в D, I x | задается сле- дующим и условиям и: (i) если О^х, то \ х \ — х; (ii) если х < 0, то | х \ = —х. 4.20. Теорема. Для любых х, у, и ? D мы имеем: (i) 0 ^ \х |; (ii) — | х | ^ х ^ \х |; (iii) ес./ш 0 ^ ы « —м ^ х ^ ы, то \ х \ ^ и; (iv) I х + г/ |< | х | + | у |; (v) |х*г/ | = |х |*| у |. Доказательство. Утверждение (i) очевидно, если 0 < х; при х < 0 оно следует из упражнения 1 (в) ниже. Отсюда — | х | ^ 0 < | х |. Так как х = — | х \, когда х < 0, то это приводит к (ii). (iii) очевидно при 0 ^ х. Если же х < 0, то из -—ы ^ х следует —»х г^ и (упражнение 1 (в)) и отсюда сноеэ | х К ^ и. (iv) доказывается путем сложения неравенств — | х | ^ < х^ 1 х | и — | у | < у ^ | у ]; действительно, получаем — A*1+ \ У \) ^ х + У ^ 1*1+ \ У \, откуда, заменяя в (iii) х на х + у, а и на ] х | + | у |, получаем искомое заключение, (v) легко доказывается путем рассмотрения всех четырех возможных случаев х<0,0<х, г/<О,О^г/. Часть 4.20 (iv) является изве- известным неравенством треугольника. Упражнения D — произвольная упорядоченная область целостности. 1. Докажите, что для любых х, у, г € D мы имеем: (а) х ¦< у тогда и только тогда, когда х -j- г ¦< у + г; (б) если 0 < г, то х "К у тогда и только тогда, когда х»г •<
4,3. ПОСТРОЕНИЕ И ХАРАКТЕРИСТИКА ЦЕЛЫХ ЧИСЕЛ ]27 (в) х < у тогда и только тогда, когда —г/ < —х; (г) при г < 0 выполняется х < у тогда и только тогда, когда г/вг< x*z. 2. Докажите теорему 4.16 (iv), (v) и (vi). 3. Докажите теорему 4.17. 4. Докажите, что || * | »— | г/ || <J | х = г/ | ¦ 5. Для каких значений п € Р хп = уп влечет х = у для всех х, у 6 D? Докажите. 4.3. Построение и характеристика целых чисел В соответствии с 4.18 множество произведений п\ в упорядочен- упорядоченной области целостности образует систему, изоморфную системе положительных целых чисел. Естественно считать, что сама область целостности выглядит как множество целых чисел, если ока обла- обладает дополнительно следующим сеойстеом: D.3.1) Для любого x?D или х = п\ для некоторого п ? Р, или х = О, или х = —. (п\) для некоторого п ? Р. Мы хотим доказать, что существует по крайней мере одна область с таким свойством и что любые две области с этим свойством изо- изоморфны. Тогда мы будем вправе выбрать одну из них и назвать ее системой целых чисел. Имеются два подхода к доказательству существования. Первый состоит в том, чтобы присоединить множество новых объектов к дан- данной области положительных целых чисел, непосредственно опреде- определить операции, а затем доказать, что новая система является упорядоченной областью целостности с дополнительным свойством D.3.1). Пусть 0, 1*, 2*, . . . будут такими объектами, из которых ни один не содержится в Р и которые все попарно различны (напри- (например, мы можем положить 0 = A, 1) и я* = (я + 1, 1) для п 6 Р). Конечно, я* должен быть элементом —я в конструируемой области; однако мы не можем его так записывать, пока не определим соот- соответствующие операции. Пусть Р* = {я*: п 6 Р} и D = Р U {0} U U Р*. Мы хотим определить операции х + у, х@у и отношение х < у для любых х, у 6 D- На самом деле отношение < легко опре- определяется через + (х < У тогда и только тогда, когда существует такое ш 6 Р, что х -{- w = у), так что непосредственно нужно опре- определять только операции. Сделать это можно, разбирая отдельно все девять возможных случаев принадлежности х и у множест- множествам Р*, {0}, Р. Покажем, например, как определяется х + у при х 6 Р и произвольном у: D.3.2) x+y, x, x — z, (z-x)*, o, если если если если если *€Р, г/?Р; Х?Р, у = 0; х?Р, #?Р*, у = х?Р, г/GP*, У = х?Р, и у = х*. Z* Z* и и
128 ГЛ 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Под и — v, и, v 6 Р, здесь понимается такое w 6 Р, что v -f- u> = и, т. е. и — v определено только при v < и C.24; корректность записи и — v следует из 3.12). Мотивировкой определения D.3.2) служит желание, чтобы получающаяся из + по 4.5 операция — обладала естественными свойствами типа u — v = и — v для и, о 6 Р и v < и для г 6 Р, или % + z* = х + (—z) = * — г при Легко убедиться, что точное определение + в оставшихся случаях, формальное определение операции в и последующая про- проверка всех условий, входящих в определение упорядоченной обла- области целостности,— исключительно трудоемкая задача. К счастью, возможен другой подход к доказательству теоремы существования, менее трудоемкий, но зато и несколько менее есте- естественный. Преимуществом его также является возможность приме- применения к доказательствам существования некоторых других систем. Главная идея состоит в перенесении внимания с прямого построения отрицательных чисел, как в D.3.1), на возможность выполнения в полном объеме операции вычитания. Другими словами, вместо условия D.3.1) мы потребуем наличие свойства D.3.3) для любого х ? D существуют такие п, т 6 Р. что х = п\ — ml. В частности, элемент х = q\ при q 6 Р может быть записан в виде (q + 1) 1 — 11, а элемент 0 — как п\ — п\. Итак, любой паре (п, т) 6 Р х Р мы ставим в соответствие разность п\ — ml. Но в противоположность D.3.1) единственности здесь нет: один и тот же элемент х 6 D может допускать две записи: д; = nl — ml и х = — п'\ — т'\ при (п, т) ф (п , т'). Легко усмотреть, что это воз- возможно только при п 4- пг = п' -\- т. Получаем, таким образом, отношение эквивалентности на Р х Р, классы эквивалентности по которому и будут элементами конструируемой области целостности. Чтобы определить операции сложения и умножения на классах эквивалентности, заметим, что из х = п\ — ml и у = р\ — q\ следует х + у = (п + р) 1 — (m + q) 1 и хту = (пр + mq) 1 — — (nq + fnp) 1 (см. упражнение 4 к п. 4.1). Получаем некоторые ассоциативные операции © и ® на парах (п, т): (п, т) © (р, q) = (п 4- р, т + q); (п, т) <g> (p, q) = (пр 4- mq, nq + тр), и остается лишь проверить, что они порождают и операции на клас- классах эквивалентности в смысле п. 2.3. Детальное осуществление изложенной схемы проводится в следующей теореме. Теорема существования 4.21. Теорема. Существует упорядоченная область цело- целостности (D, +> •> <» 0, 1), обладающая тем свойством, что для любого х 6 D или существует п ?Р> для которого х = п\, или х = 0, или существует п 6 Р. для которого х = — п\.
4.3. ПОСТРОЕНИЕ И ХАРАКТЕРИСТИКА ЦЕЛЫХ ЧИСЕЛ 129 Доказательство. Положим A) W = {((л, т), (я', т')) : (и, /п), (и', т') € Р X Р м ft -f m' = ft' + и}. Тогда W — бинарное отношение в Р X Р. Мы будем также писать B) (и, т) = (и', т') для ((и, /п), (и', /п')) € w- Сначала мы проверим, что C) W — отношение эквивалентности в Р х Р. Это следует из следующих утверждений, справедливых для любых п, т, л', т', и", т" 6 Р: (а) (и, т) = (п, т); (б) если (и, т) == (и', т'), то (/г', т') = (и, т); (в) если (п, т) = («', т') ы («', т') ^ (п", т"), то (п, т) == s (ft", m"). (а) и (б) следуют прямо из определения отношения =. Для доказа- доказательства (в) заметим, что из п + т' = п' + т и п' + т" = п" + т' следует /г + т' + п + т" = /г' + т + п" + т', откуда, используя коммутативность сложения и закон сокращения, получаем искомое равенство п -\- т" — п" + tn. Теперь определим для любых п, т, р, q 6 Р D) (п, т) © {р, q) = (п + р, т + q); E) (n, m) <g> (jo, <7) = (np + m<7, nq + mp); F) (n, m) <^ (p, G) тогда и только тогда, когда п + q < m + p. Покажем, что для любых п', /тг', /5', ^' 6 Р G) если {п, т) == (п , т') и (р, q) = (р , q'), то (а) (п, т) © (р, q) =* (п', т') © (р', <?'), (б) (и, яг) ® (р, <7) = (и', т') ® (р , q') и (в) (/г, т) <; (р, q) тогда и только тогда, когда (п', т') <( Пусть, действительно, п -{- т' = п' -\- т и р -\- q' = р' -\- q. Для (а) нужно показать, что (п + р) + (/n' + q') = («' + р') + (m + <7). Но для этого достаточно почленно сложить исходные равенства и воспользоваться ассоциативностью сложения. Проверку G) (б) оставляем читателю. Для доказательства (в) предположим вначале,
130 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ что (п, т) <( (р, q), т. е. п + q < т + р, и, как ранее, « + /л' = — п -\- т и р + д' = р' + q- По 3.37 (i) тогда п + Ц + т' <. < т + р + т'', откуда n'+m + q^m + p + m' и я' + <7 < < р + т'; но тогда также п' + <7 + q' < р + тп' -\- q и «' + q + + G' < р' + <7 + тп', так что «'+<?'</?'+ от', что и требовалось доказать. Противоположное утверждение о том, что из («', т') <( (р', q') следует (п, т) <( (р, q), доказывается ана- аналогично. Короче условия G) (а), (б) могут быть сформулированы так: == является отношением конгруентности (в смысле B.3.36)) отно- относительно © , <g> и <(. Рассмотрим теперь совокупность D всех классов эквивалентно- эквивалентности W(n, т) по отношению W, т. е. положим (8) D = {X: X = Wm, тп) для некоторых п, т 6 Р}- Тем самым D — подмножество множества всех подмножеств Р х Р. Согласно B.3.29), для любых X, Y 6 D либо X = Y, либо X ft Y = = 0. В нашем случае, если X = W<n, m) и Y = W(n',m'>, то X = Y тогда и только тогда, когда (п, т) = (п', т'). Как и ранее, для краткости мы будем писать [(п, т)\ вместо W(Jlt m) и даже про- просто [п, т], если только из текста ясно, о чем идет речь. Как мы видели в B.3.37), из G) (а) — (в) следует (9) существуют операции +, •, определенные на D, и отноше- отношение < между элементами D такие, что для любых тп, п, р, q 6 Р имеют место: (а) In, т] + [р, q] = [(и, т) Ф (р, flr)], (б) [п, т]*[р, q] = [(«, m) <g> (p, ^)], (в) [п, т] < [р, q] тогда и только тогда, когда (п, т) -< ¦< (Р> Я)- Теперь для завершения построения нашей области целостности нам не хватает лишь определения элементов 0 и 1. Положим A0) (а) 0 = [1, 1] и (б) 1 = [2, 1]. Непосредственно из определения отношения = видно, что для любого п 6 Р имеет место (И) (а) (п, п) = A, 1) и (б) (п + 1, п) =э B, 1), а потому A2) (а) 0 = [п, п] и (б) 1 = [п + 1, и]. Покажем теперь, что A3) (D, +>•.<, 0, 1) —система, удовлетворяющая усло- условиям нашей теоремы.
4.3. ПОСТРОЕНИЕ И ХАРАКТЕРИСТИКА ЦЕЛЫХ ЧИСЕЛ J31 Для этого надо показать, что для нее выполняются все усло- условия 4.1 (i) — (vi) для коммутативного кольца с единицей, дополни- дополнительные условия 4.13 (или 4.14) и 4.15 для упорядоченной области целостности и новое условие, содержащееся в формулировке теоре- теоремы 4.21. Ограничимся при этом только изложением некоторых типичных рассуждений. Сначала рассмотрим коммутативный закон для +: A4) X + У = У + X для любых X, У ? D. Пусть X = In, т] и У — [р, q] для некоторых п , т, р, q ? Р. Тогда, согласно (9)(а), X + У = [(л, т) ® (р, q)] и У + X =* = [(р, q) © (п, т)\. Таким образом, достаточно показать, что (я, т) ® (р, q) = (р, q) ® (п, т), т. е. что (п + р, т + <?) ==ш ^ (р + п, q + tn). Но это прямо следует из коммутативности и ассоциативности операции + на Р. Рассмотрим далее утверждение, касающееся роли 1: A5) Х*>1 = X для любого X 6 D- Пусть X = In, т]. Тогда, согласно (9)(б) и (Ю)(б), Х*\ = [(п, т) ® ® B, 1)]. Отсюда Х»\ = [2п + т, 2/л + п]. Таким образом, доста- достаточно доказать, что Bп -\- т, 2т -\- п) = (п, т), т. е. что т + Bп + т) = Bт + п) + п. Но последнее очевидно. Чтобы доказать возможность вычитания, мы должны показать, что A6) для любых X, У 6 D существует U ? D такое, что X + U = Г. Предполагая, что все предыдущие условия из 4.1 для коммутатив- коммутативного кольца с единицей уже установлены, достаточно найти V 6 D такое, что X + V = 0, а затем положить U = V + Y. Пусть X = [п, т], что соответствует разности п — т. Тогда противополож- противоположный к X класс следует искать в виде V = \т, п] как соответствую- соответствующий обратной разности т — п. Действительно, тогда X + V = [п, т] + [т, п] = [(л, т) Ф (т, п)] из (9)(а) = [л + т, т -\- п] из D) = 0 из A2)(а). Чтобы доказать, что D — область целостности, мы покажем, что A7) для любых X, У 6 D, если Х*»У — 0, то или X = 0, или Y = 0.
132 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Пусть X = [п, т], У = [р, q]. Тогда X»Y = [(п, т) <g> (р, q)] = [пр + mq, mp + nq]. Если XmY = 0, то (пр + mq, mp + nq) == A, 1), откуда пр + + mq = /пр + пд\ Предположим, что X Ф О, т. е. что пф т. В силу трихотомии т <с п или п < т. В первом случае п = т + г для некоторого г ? Р. Отсюда /пр -\- rp -\- mq = mp + /я<7 + rq; no дистрибутивности • относительно + в Р и по закону сокращения для + в Р имеем rp = rq; отсюда по закону сокращения для • в Р получим р = q. Таким образом, Y = 0. Доказательство для случая п < т проводится аналогично. Теперь рассмотрим свойства 4.15, чтобы показать, что D — упорядоченная область целостности. Докажем, например, что A8) для любых X, Y ? D. если X ф Y, то или X < У, или Y < X. Для доказательства положим X = [п, т], Y = [р, q] и предполо- предположим, что X Ф Y. Тогда (п, т) ф (р, q), i.e. n + ЯФ tn + р. Отсюда или n -f- <7 < т -f- P, или т + Р<я + <7- В первом слу- случае (п, т) -^ (р, д), а во втором (р, д) <( (п, т) согласно F). Отсюда или In, т] < [р, q), или [р, G] < [п, т] согласно (9)(в). Докажем, далее, что A9) для любых X, Y, Z e D, если X < Y, то X + Z < <Y + Z. Пусть, действительно, X = [п, т], Y = [р, q], Z = [г, s]. По пред- предположению, (п, т) -^ (р, q), т. е. n + q < Р + т- Мы хотим пока- показать, что (п -\- г, т -\- s) <^ (р + г> <7 + s)> т- е. что п + г + <7 + + s<m-(-s + j5 + r. Это достигается прибавлением г -f- s к обеим частям данного нам неравенства. Наконец, мы докажем свойство, упомянутое в формулировке теоремы. Для того чтобы сделать это, мы должны сначала вычис- п лить п\ и — п\ для любого п 6 Р- По определению, п\ = \ 1. Индукцией по п легко показать, что B0) п\ = [п + 1, 1] и, как в доказательстве A6), что —п\ = [1, п + И- Нам нужно показать теперь B1) для любого X 6 D или X == п\ для некоторого « 6 Р, млы X = 0, или X = —nl для некоторого п 6 Р. Пусть X = [р, <7]. Если р > q, то р = q + г, где г 6 Р; в этом случае (р, q) = [r-\- I, 1] и X = г\. Если р = <7, то X = 0 согласно A2)(а). Если р < q, то q = р -\- г для некоторого г ? Р; в этом случае (р, #) = A, г + 1) и X = —П.
4.3. ПОСТРОЕНИЕ И ХАРАКТЕРИСТИКА ЦЕЛЫХ ЧИСЕЛ 133 Проверка остальных свойств, требующихся для доказательства A3), а вместе с тем и теоремы 4.21 проводится точно так же комби- комбинацией утверждений A) — A2); мы оставляем эту проверку чита- читателю. Стоит только отметить, что для доказательства потребуются практически все свойства +, •, <, доказанные в главе 3. Используя теорему 4.21, легко показать существование системы желаемого вида, фактически содержащей Р. 4.22. Теорема. Существует такая упорядоченная область целостности (I, +, •, <, 0, 1), что (i) она содержит (Р, +, •, <( 1) как подсистему и (и) для любого х 6 I или х 6 Р, или х = 0, или —х 6 Р. Доказательство. Пусть (D, +, •, <, 0, 1) — система, удовлетворяющая условиям 4.21. Пусть Р = {п\ : п ? Р}. Соглас- Согласно 4.18, (Р,+, -,<, 1) ~(Р, + ,., <, 1), причем изоморфизмом устанавливается функцией G (п) = п\ для каждого п 6 Р. Система (Р, +, •, <, 1) —подсистема системы (D, +, •, <, 1). Определим Я так, чтобы графически оно соответ- соответствовало следующему чертежу (рис. 24): >{ н н )- Рис. 24. Ситуация, как мы видим, вполне аналогична ситуации B.4.9), проиллюстрированной на рис. 22 и 23. Как и там, мы можем выбрать множество I, содержащее Р, и определить операции +, • и отноше- отношение < на I так, чтобы (I, +, •, <, 1) содержало (Р, +, •, <, 1) в качестве подсистемы, удовлетворяя, таким образом, (i), и про- продолжить одновременно G до изоморфизма Н между этой новой систе- системой и системой (D, +, •, <, 1)- Если мы обозначим, наконец, сим- символом 0 тот единственный элемент 2 в I, для которого Н (г) =0, то Н осуществляет также изоморфизм (I,+, -,<, 0, 1) «(D, +, •, <,0, 1). Так"гкак изоморфные системы имеют одинаковые алгебраические свойства, то наша новая система (I, . . .) должна быть упорядочен- упорядоченной областью целостности. Рассмотрим теперь любое х ? I. Тогда Н (х) + Н (—х) = Н (х + (—х)) = Я @) = 0, откуда Я (—х) =
S34 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ я= —Я (х). Но тогда для любого х 6 I будет или Я (х) ? Р, или Я (я) == 0, или —Я (х) 6 Р> поскольку D удовлетворяет условиям теоремы 4.21. В первом случае Я (х) = G (х) и х 6 Р. так как Я — продолжение G. Во втором случае х = 0. В последнем случае Я (—х) 6 Р и тогда —я 6 Р- Теорема доказана. Однозначность характеристики. Если мы теперь покажем, что любые две системы вида 4.22 изоморфны, то тем самым обоснуем выбор одной из них в качестве системы целых чисел. На самом деле. ыы сделаем даже немного больше, показав, что, кроме того, любая упорядоченная область целостности D содержит упорядоченную подобласть I, изоморфную системе I. 4.23. Теорема. Пусть (I, +, •, <, 0, 1) — система, удо- удовлетворяющая условиям 4.22 (i), (ii), a (D, +. •> <> 0. 1) — любая упорядоченная область целостности. Для любых и 6 D, п 6 ' п определим пи следующим одразом: пи= у щ, ии = и, если п ? Р; пи = 0, если [п = 0 и пи — —((—п) и), если —п ? Р. Пусть G — функция с Ъ (G) = I такая, что G (п) = п\ для каждого п 6 I. и пусть I = M (G). Тогда (i) I образует упорядоченную подобласть в D, и G устанавливает изоморфизм (I, +, •,<, 0, 1) s(|, +, •, <,0, 1). (ii) Если D также удовлетворяет условию 4.21, то D = !• Доказательство. В этом доказательстве удобнее иметь дело с разностями кратных положительных целых чисел, чем просто с элементами и их отрицательными значениями. Сперва заме- заметим, что A) если х 6 I, то существуют п, т 6 Р такие, что х=п — т. Действительно, согласно 4.22 (ii), или х 6 Р. или х = 0, или (—х) t Р. В первом случае х = (х -\- 1) — 1, во втором х = 1 — 1 и в последнем х = 1 — A + (—х)). (Обратное к A) утверждение тривиально по 4.21.) Заметим, далее, что B) если п, т 6 Р. то G (п — т) = п\ — ml. Действительно, по закону трихотомии в Р, или существует k ? Р, для которого п = т + k, или п = т, или существует / ? Р, для которого т = п -\- I. В первом случае по 4.11 (ii) G (п — т) = G (k) = kl = (m + k) I — ml. Во втором случае G (п — т) = G @) = 0 = п\ — п\. В последнем случае G(n — m) = G(—t) = —(/1),
4.3. ПОСТРОЕНИЕ И ХАРАКТЕРИСТИКА ЦЕЛЫХ ЧИСЕЛ 135 так как — ( — /) = /; но — (Л) = п\ — (п + /) 1, снова по 4.11 (и). Утверждения A) и B) позволяют нам теперь применить к дока- доказательству нашей теоремы теорему 4.18, точнее, построенный в ней изоморфизм. C) G взаимно однозначна. Для доказательства предположим, что х, у 6 I и G (х) = G (у). По A) мы можем найти такие п, т, р, q ? Р, что х = п — m и z/ = = р — q. Тогда, согласно B), п\ — ml — р\ — q\\ отсюда п\ + + ql = ml + pi и (п + q) 1 = (т + р) 1 согласно 4.18 (или 4.11 (и)). Но тогда п -\- q = m -f- р по 4.18 и отсюда д; = п — т = = р — q = У- Покажем теперь, что D) для любых х, у 6 I G (х + у) = G (.v) + G (г/) и G (*-у) = G (x).G (г/). Выбрав снова п, т, р, q ?Р так, чтобы x = n — /п, у = р — q, получаем х -\- у = {п -\- р) — (т -\- q). Тогда G (х + у) = (п + р) 1 — (т + q) 1 = (л1 + р\) - (ml + (/I) = (nl — ml) + (pi — q\) = G(x) + G (y). Вторая часть D) доказывается аналогично с использованием алгебры областей целостности. Поскольку G @) = 0 и G A) == 1, то, чтобы закончить доказательство первой части теоремы, нужно показать, что E) для любых х, у 6 I имеем х < у тогда и только тогда, когда G (х) < G (у). Но I — упорядоченная область целостности, поэтому п — т <С < р — q тогда и только тогда, когда п + q < т -\- р; по теоре- теореме 4.18 последнее условие эквивалентно п\ + ^1 < ml 4- pi и, по свойству упорядочения, эквивалентно nl — ml < pi — gi, что и требовалось доказать. Чтобы доказать утверждение (и) нашей теоремы, предположим, что для любого и 6 D выполняется или и = nl с п 6 Р. или и = 0, или м = —(nl) с и 6 Р. Тогда существует такое k ? I, что ы = = G (k) (k = n, k = 0 или & = —« соответственно). Отсюда D s s J? (G) = ! и, следовательно, D = |. Используя доказанную теорему, можно показать, что теоре- теорема 4.11 обобщается на I, т. е. что если (D, +. •. 0, 1) —произвольное коммутативное кольцо с единицей, то 4.11 (i) — (vii) остаются справедливыми для любых х, у ? D и т, п ? I. Однако, нам в даль- дальнейшем этот факт не потребуется.
136 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ На основании теорем 4.22 и 4.23 мы имеем право на 4.24. Соглашение. Во всей остающейся части книги пред- предполагаем, что (I, +, •, <С, 0, 1) — некоторая фиксированная упоря- боченная область целостности, удовлетворяющая 4.22 (i), (ii). Мы будем называть I множеством целых чисел. Упражнения 1. Используя обозначения, введенные в доказательстве теоремы 4.21, показать, что, для любых п, т, р, q, р', q' 6 Р, из (р, q) = (р', q') следует (п, т) ?§) (р, q) = (п, т) 0 (р', q'). Вывести отсюда G)(б). 2. Используя обозначения, принятые в 4.21, показать, что, для любых X, Y, Z 6 D, (а) X + О = X; (б) X»(VZ) = (X*Y)*Z; (в) X»(Y + Z) = X*Y + X*Z\ (г) если X < Y и 0 < Z, то X*Z < Y*Z. 3. Доказать, что для любого х 6 I имеем х 6 Р тогда и только тогда, когда 0 < х. 4. Доказать, что, для любых х, у 6 I, у < х тогда и только тогда, когда У + 1 < х. 4.4. Целые числа как система индексов Прежде чем обратиться к математическим свойствам системы целых чисел, еще шире раскрывающим ее строение, особенно в во- вопросах, связанных с делимостью, мы покажем сначала пользу целых чисел при изучении обобщенных сумм и произведений в произволь- произвольных коммутативных кольцах. Это можно сделать на основании сле- следующей теоремы, позволяющей использовать не только Р, но и дру- другие сегменты системы I в качестве множества индексов. 4.25. Теорема. Пусть а ? I и пусть Ра = {х: х G I и х > а}. Тогда (Ро, <) = (Р, <) и (Ро, <) — вполне упорядоченная система, в которой первый элемент есть а, следующий за любым элементом х элемент есть х -\- \ и для каждого х > а предшествующим элемен- элементом для х является х — 1. Доказательство. Определим функцию F на Ра равен- равенством A) F(x) = (x-a) + l для каждого х > а. Тогда B) 35 (F) = Pot M(F) = Р. Действительно, если у ? Р, то у > 0 согласно упражнению 3 выше; Пусть х = у -\- а— 1; тогда х > а — 1, откуда х > а согласно тому же упражнению, т. е. х 6 Ро- Очевидно, у = F (х). C) F взаимно однозначна.
4.4. ЦЕЛЫЕ ЧИСЛА КАК СИСТЕМА ИНДЕКСОВ 137 Действительно, если F (х) = F (у), что эквивалентно х + A — а) = = у + A — а), то мы, сокращая, получаем х = у. Наконец, для х,у?Р, D) х <. у тогда и только тогда, когда F (х) < F (у). Это следует непосредственно из упражнения 1 (а) к п. 4.2. Таким образом, F устанавливает изоморфизм E) (Ра, <) S* (Р, <)• Но, по предположению, Р вполне упорядочено, следовательно, Ра тоже вполне упорядочено. Далее, F (а) = 1, так что а — первый элемент в упорядочении множества Ро. Из F (х ~\- 1) = F {х) + 1 по D) следует, что число х + 1 должно в Ро следовать за х; с другой стороны, если х> а, то л: — 1 "^ а и F (х — I) ~\- 1 = F (х), так что х — 1 должно быть числом, предшествующим х. Таким образом, индуктивные доказательства и рекурсивные определения могут строиться по любой из систем Ро. До сих пор мы вели их всегда по Р = Р1; но в дальнейшем будем также использо- использовать Ро и Р2 и реже некоторые другие. Заметим, что построенный в 4.25 изоморфизм F является изоморфизмом только в смысле поряд- порядка: если на Р и Р„ рассматривать, скажем, операцию ~\-, то относи- относительно этой операции F изоморфизмом не является. Например, Р и Ро изоморфны, но 0 + 0 = 0, a F @) + F @) = 1 + 1 Ф F @). Конечно, на Ро можно ввести такую операцию +'» чтобы получен- полученная система (Ро> +', <) была изоморфна системе (Р, +, <), но никакого практического интереса эта операция не представляет. Пусть S — произвольное множество. Обобщим введенное в 3.41 понятие бесконечной последовательности, рассматривая теперь функции, определенные на Ро; такие последовательности будем записывать D.4.1) (х0, хи . . ., xk, . . .}. Для любого п > 0 построим далее я-членную последовательность D.4.2) (х0, . . ., *„_!>, состоящую из первых п членов последовательности D.4.1). Мы можем также включить сюда и случай п = 0, введя понятие пустой последовательности; ее можно представить себе как функцию F с 3 (F) = 0, откуда № (F) = 0 (собственно говоря, и F = 0). Для простоты (если не оговорено противное) предполагаем в последующем, что D.4.3) (D, +, •, <, 0, 1) — коммутативное кольцо с единицей. 4.26. Определение. Пусть (х0, ...,*», ...) —бесконечная п п последовательность элементов из D. Тогда J xk и 1J xh
138 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ определяются для любых п, m?l, m>0, следующими условиями'. п п (i) У 1а = 0 и IX xh — l, если n<tn; k=m n—1 n n— 1 п**=(п если т-^п. Условие (i) может рассматриваться как определение суммы и про- произведения пустой последовательности. Выбор значений 0 и 1 в (О случаен, если мы просто хотим определить некоторые операции,' и не случаен, если мы хотим, чтобы получились операции, обла- обладающие основными свойствами обычных сумм и произведений. Например, благодаря нашему выбору 1 О | \ . , — X. и аналогично 1 11 •?.'1 = 1 • Xi = Xt, так что определение 4.26 согласуется с 3.42 (i) и 3.43 (i). Условие (ii) приведенного выше определения является рекурсивным определе- определением на Рт для каждого т Е I, т > 0. Индукцией по Рт легко уста- устанавливается следующая 4.27. Теорема. Пусть (х0, . . ., xk, ... >— бесконечная последовательность элементов из D и пусть п, т, q 6 I, т > 0. q > 0. Тогда п п (i) j xh и П xk, определенные, как в 4.26, соответствуют значениям, данным в 3.42 и 3.43; п п—m-\-q (ii) ^~ h=m h—q n (iii) 2 • у Xk= У 2 e Xh для любого
4.4. ЦЕЛЫЕ ЧИСЛА КАК СИСТЕМА ИНДЕКСОВ 139 4.27 (ш) следует непосредственно из (ii) при q = 1 и дистрибутив- дистрибутивного закона 3.46. Условие 4.27 (ii) позволяет при проведении индукции выбирать начальное k любым, руководствуясь лишь соображениями удобства. Более общие законы ассоциативности и коммутативности. Для формулировки общего закона ассоциативности нам потребуются некоторые новые обозначения. Пусть п4, п2, . . ., tit — произволь- произвольные неотрицательные целые числа и п = nt + п2 -f . . . -|~ щ. Из элементов х%, х2, . . ., хп составим группы причем, если n-t = 0, то соответствующая группа пуста. 4.28. Теорема. Пусть (хи х2, . . ., хк, . . .) — произволь- произвольная бесконечная последовательность в D, о. (щ, п2, . . ., щ) — некоторая последовательность неотрицательных целых чисел. Для каждого i = 1, 2, . . ., t положим т% = 2 ni*) и п — т* + п*' Тогда U ТТ Хъ - И / П X и 11 ля— 11 ^ 11 лтг- ft=i i=i ft=l Предлагаем читателю убедиться, что это действительно точная формулировка желаемого результата, и доказать его. Для формулировки общего закона коммутативности нам необ- необходимо понятие перестановки (сомножителей, слагаемых и т. д.). 4.29. Определение. Функция F называется переста- перестановкой множества S, если она взаимно однозначна и 3 (F) — ~ М (F) = S. Например, последовательность (х3, хи х2, х4) полу- получается из последовательности (xit x2, х3, л;4) перестановкой F, где F A) = 3, F B) = 1, F C) = 2, F D) = 4. 4.30. Теорема. Пусть (хи . . ., xh, . . . > — некоторая бес- бесконечная последовательность в D ¦ Для любого п 6 Р и любой треста - новки F множества {1, . . ., п) имеем п п Хъ ~ 11 Xp(h). ft=l й=1 Доказательство. Применяем индукцию по п 6 Р- Для п = 1 утверждение теоремы тривиально. Предположим, что оно справедливо для п. Пусть G — любая перестановка множества *) Аналогично 4.26 (i), мы считаем mi = 2 nj — ®-—Прим. перев.
140 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ {1 п -\- 1}. Тогда G (т) = п + 1 для единственного т, 1 <! т <; п + 1. Тем самым и+1 т—1 п+1 A) 2^ xG(k)=^2^ xGi*) + xn+i+ V ^G(ft) согласно 4.28 m—1 n = jT JfG(ft) + jT *о<ы-о + ATn+i согласно 4.27 (ii). (Отметим, что любая из сумм в правой части равенства может быть пустой.) Положим теперь B) F(k)=\ ' I G(k+l), если Так как для 1гф т все значения G (k) ^ п, то C) 1 < F (k) < n для всех k < п. Докажем теперь, что F — перестановка множества {1, . . ., п}. Согласно B) и C), нам нужно только проверить, что F взаимно однозначна. Предположим, что F (/г4) = F (k2). Если оба ku k2 < m или оба > /и, то из B) вытекает, что G (к±) = G (k2) и поэтому kt = k2. Если же, скажем, &4 < т ^ й2, то G (&j) = G (й2 + 1), откуда /jj = /г2 + 1, что противоречит нашему предположению k± < т ^ <; /г2. По аналогичным причинам невозможен и случай &2 < m <; /г4. Из A) и B) получаем тп+1 т— 1 E) + лгп +1 согласно D) по индуктивному предположению п+1 Индуктивный шаг завершен, теорема доказана. Обобщим теперь понятие степени хп (определение 4.10) так, чтобы включить случай п = 0. 4.31. Определение. Пусть х Е D, п 6 I, п !> 0. Положим
4.4. ЦЕЛЫЕ ЧИСЛА КАК СИСТЕМА ИНДЕКСОВ 14] 4.32. Теорема. Для любых х, у 6 D все свойства степени 4.12 (i) — (vi) сохраняются для п, т 6 I при п > О, т ;> 0, за исклю- исключением свойства 4.12 (iv) @" = 0 только для п > 0). Дополнительно, х° = 1 для всех х ? D. Соответствующие доказательства получаются прямо из 4.12 путем рассмотрения «лишних» случаев п = 0, т = 0 или могут быть получены из общих свойств 4.26—4.28 для П. Геометрическая прогрессия, биномиальное разложение. Закончим раздел использованием понятий суммы, произведения и степени для вычисления сумм специального вида в произвольных коммутатив- коммутативных кольцах с единицей (D, +, •, 0, 1), именно сумм геометриче- геометрических прогрессий и биномиальных разложений. В первом случае с очевидностью справедлива 4.33. Теорема. Для любого х 6 D имеем (х — 1)« ^ xh — = (Xn+1 — 1). Во втором случае, исходя из знакомых разложений D.4.4) (х + уJ = х2 + 2ху + у\ D.4.5) (х + у)* = х* + Зх*у + Зху2 + у\ D.4.6) (х + уу = х* + 4х3г/ + 6*У + Axf + ^ и т. д., мы можем предположить, что общее биномиальное разложе- разложение должно иметь вид D.4.7) y) 2 fc=0 где Сйп) — некоторые коэффициенты. Как же их вычислить? Запи- Запишем левую часть в виде D.4.8) (х+у)п=(х + у)-(х + у)-.. .-(х+у) п раз и занумеруем множители (первый, второй, . . ., n-й). Нетрудно усмотреть, что в этом произведении коэффициент при xn~hyh равен в точности числу способов, которым мы можем выбрать k множите- множителей. Другими словами, С^ есть число различных ^-элементных подмножеств, содержащихся в данном n-элементном множестве (число выборов из п элементов по k элементов). Исходя из этого определения, ясно, что D.4.9) С(оад = 1, СГ=1, an) = C(nnlh. Для коэффициентов СГ' справедливо также рекурсивное соотно- соотношение <4.4.10) С^'^СГ + С^ при
142 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Действительно, рассмотрим множество {аь . . ., ап, an+i}, содер- содержащее п + 1 попарно различных элементов, и пусть X — его подмножество, содержащее ровно k элементов. Конечно, либо Ип+1 6 X, либо an+i (J X. Количество множеств X, для которых о-п +i d X, по нашему определению, есть С«,п>, а количество множеств X, для которых ап +1 ? X, то же самое, что и количество (k — 1)-элементных подмножеств Y = X — {an+i} множества {аи а2, . . ., ап), т. е. СП- Равенство D.4.10) соответствует известному треугольнику Паскаля D,4.11) 1 1 1 2 1 13 3 1, 14 6 4 1 где в каждом ряду любое число есть либо сумма двух ближайших к нему чисел из лежащего выше ряда, либо равно 1, если это число крайнее. Равенства D.4.9) и D.4.10), как следует из треугольника Паскаля, дают нам простую рекурсивную процедуру вычисле- вычисления С?\ Существует другой подход к вычислению С^", основанный на подсчете перестановок. Конечно, число перестановок любого мно- множества из п элементов равно числу перестановок множества {1, 2, . . ., п). Но мы знаем по 3.40, что любая функция на этом множестве может быть записана последовательностью (bu fc2. • • • . . ., bn), причем такая последовательность является перестановкой тогда и только тогда, когда {Ьъ Ь2, . . ., Ьп) = {1, 2, . . ., п). Подсчет количества перестановок множества {1, . . ., п) мы свели, таким образом, к подсчету последовательностей FЬ . . ., Ьп), для которых {&ь . . ., Ьп) = {\, 2, . . ., п). Но последний выпол- выполняется легко: &4 может быть выбрано любым, т. е. одним из п спо- способов; если &i уже выбрано, то Ь2 может быть выбрано одним из п — 1 способов; Ь3 (при фиксированных bu b2) может быть выбрано п — 2 способами; . . .; Ьп-! может быть выбрано, когда уже выбра- выбраны Ьи h, ¦ ¦ -, bn-z> одним из двух способов; тем самым Ьп опре- определено однозначно. Следовательно, число перестановок есть п-(п— 1) ... 2-1 = я!. Основная наша цель — подсчитать количество Си" й-элемент- ных подмножеств множества {1, 2, . . ., п). Пусть X — такое подмножество и X = {\, 2, ..., п) — X. Любая перестановка множества X записывается в виде <оь . . ., bh), причем {Ьи . . .¦ . . ., bk) — X, а любая перестановка множества X — в виде (Ь[, . . ., b'n-h), причем {Ь[, . . ., b'n-h) = X. Но любые такие две перестановки определяют, конечно, перестановку (bit Ь2, . . .. Ьп),
4.4. ЦЕЛЫЕ ЧИСЛА КАК СИСТЕМА ИНДЕКСОВ 143 где bk+t — b'i при 1 <J i^ n — k, всего множества {1, . . ., п}. Так как всего перестановок множества X может быть k\, а множе- множества X — (п — Щ\, то мы построим, таким образом, k\ (п — k)\ перестановок множества {1, 2, . . ., п) (конечно, различные пере- перестановки X и X приводят к различным перестановкам {1, 2, ... . . ., п}). Далее, если Xi и Хг — различные ^-элементные под- подмножества, то перестановки множества {1, 2, . . ., п}, построенные по перестановкам Хи Xt и Х2, Х2, также различны: из (Ь(*\ . . . ¦ • -, Ьп1)) = ФЧ\ . . ., Ь™) следует, конечно, Итак, мы построили уже k] (п — k)\ С™ перестановок множества {1, . . ., п). Но для любой перестановки (Ьи . . ., Ьп} этого множе- множества (bit . . ., bk) есть перестановка множества X — {blt . . ., bk}, a (fcfc+i bn) — перестановка X = {bh+i, . . ., bn), так что мы построили все перестановки и окончательно или, в более привычной записи, D-4.12) ся» =«1 Эти соображения служат основой для следующих определений и теорем. В дальнейшем вместо Chn) нам будет удобнее писать С?. 4.34. Определение. Пусть п, k ? I; 0 -< п в (i), (ii) (см. ниже) и 1 <; k .^ п в (Hi). Определим п\, С„ и С?+1 следующим образом: п 0) «!=П«; (и) с°„ = сй = 1; /;;;\ Ch /-А , >->ft—1 (lii) bn+i—bn-t-U7i Условие (i) представляет собой обобщение операции п\ на слу- случай п = 0 такое, чтобы в соответствии с 4.26 (ii) было 0! = 1. Остальные два условия — рекурсивное определение С? для всех п, k, 0 ^ k ^ п. 4.35. Теорема. Пусть п, k ? I, 0 <; k < п. Тогда k\ (п — Щ\ С* = п\. 4.36. Теорема. Для любых х, у 6 D ы п 6 I, п > 0, имеем tln—h Доказательства этих двух теорем, которые проводятся соот- соответствующей индукцией, предоставляются читателю.
144 ГЛ. ¦. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Упражнения 1. Доказать теорему 4.28. 2. Пусть F — перестановка конечного множества S и X = {х: х ? S и F (х) Ф х). Если F не есть тождественная перестановка, то X ф 0. Пусть, например, X = {at, . . ., аи). Перестановка F называется k-циклом и обозначается (at, . . ., ад), если, для любого I < k, F (а;) = а^+i и F (ад) = at. 2-цикл (аь а2) называется транспозицией. Тождественная перестановка обозначает- обозначается (а) для любого а ? S. Если F — цикл (ait . . ., ад) и G — цикл (bt, . . . . . ., bfj, то через (at, ¦ ¦ ., ад) FlF . . ., bt) будем обозначать перестановку F о G. Циклы называются непересекающимися, если {а[, . . ., ak) f] П {bi, . . ., 6;} = 0. Так введенное произведение циклов ассоциативно. (Почему?) Таким образом, произведение (ait . . ., ад) (bt, . ¦ -, b{) ... . . . (zi, . . ., Zf) циклов определено корректно. Доказать следующие пред- предложения или ответить на предложенные вопросы, обосновывая ответ. (а) Коммутативно ли произведение циклов? (б) Каждая перестановка есть произведение непересекающихся циклов. (в) Каждая перестановка есть произведение транспозиций (не обяза- обязательно непересекающихся). (г) Что можно сказать о единственности представлений (б), (в)? (д) Выразить как произведения непересекающихся циклов: A23) D56) A35) B46), A234) D321), A2) A45) B3) B1). (е) Использовать (в) для нахождения другого доказательства обобщен- обобщенного коммутативного закона 4.30. 3. Доказать теорему 4.35. 4. Доказать теорему 4.36. 5. Используя интерпретацию Сп при помощи множеств, доказать, что число подмножеств множества с п элементами равно 2П. п 6. Заметим, что (в целых числах) 2 (ak — ak-i) — an—ао- Поэтому п п п й= 1 й= 1 й= 1 т. е. 2 S^ A=l ft=l п п Используя это, найти ^ ^2> 2 ^3- Найти также общий рекурсивный метод для ft=l ft=l п вычисления 2 ^т> гДе т — любое фиксированное положительное целое число. п 7. Вычислить A-х) W A+*2") й=0
4.5. МАТЕМАТИЧЕСКИЕ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ 145 4.5. Математические свойства целых чисел В предыдущем разделе мы имели дело с целыми числами как вспомогательной системой при рассмотрении алгебраических свойств произвольных коммутативных колец с единицей. В этом разделе мы рассмотрим алгебраические свойства самой системы целых чисел, в основном в связи с понятием делимости. Как будет видно из последующего, большая часть результатов или прямо касается только положительных целых чисел, или легко может быть переформулирована в терминах Р. Иначе говоря, можно было бы их доказать и до введения целых чисел, но теперь, с использова- использованием нуля и операции вычитания, доказательства получаются го- гораздо проще из-за свободы алгебраических манипуляций. Алгоритм деления. В произвольном кольце вычитание одного элемента х из другого у сводится к отысканию, на основании свой- свойства единственности, такого и, что х + и = у. Подобным образом можно определить деление на элемент х элемента у как отыскание такого и, что хши = у. Конечно, в общем случае такого элемента может не быть, например, если х = О, у ф 0, то элемента и, для которого Овм = у, не существует, причем элемента и может не быть и при х Ф 0: 7 не делится на 3 и т. д. Вообще говоря, мы можем лишь описать, насколько наше число 7 близко к такому, которое делится на 3. Рассмотрим, действительно, кратные 3-1, 3-2, 3-3, ... числа 3, т. е. числа 3, 6, 9, ... Поскольку 7 «немного» больше, чем 6 = 3-2, мы будем говорить, что частное от деления 7 на 3 есть 2, а остаток есть 1, записывая это 7 = 3-2+ 1. Анало- Аналогично, 8 = 3-2 + 2, т. е. частное от деления 8 на 3 есть 2, а остаток 2. Вообще будем говорить, что частное от деления числа а на число Ь есть q, а остаток есть г, если D.5.1) bq < а < b (q + 1) и а = bq + г или, эквивалентным образом, D.5.2) а = bq + г, где 0 < г < Ь. Изучение такого «почти» деления, или деления с остатком, при- приводит к многим интересным результатам. Первое, что нужно выяс- выяснить, естественно,— для любых ли a, b, b Ф 0, возможно, представ- представление D.5.1) — D.5.2) и однозначно ли определяются из D.5.1) — D.5.2) частное q и остаток г. Ответы на эти вопросы дает следующая 4.37. Теорема. Для любых a, b 61, b > 0, существуют q, r 6 1 такие, что а = bq + г и 0<r<fc. Если, кроме того, q', г' ? I и a=bq' + г', 0 < г' < Ь, то q = q' и г = г'. Доказательство. Рассмотрим вначале случай а > 0, т. е. (согласно упражнению 3 к п. 4.3) а Е Р. Зафиксируем любое b > 0. Индукцией по а 6 Р докажем, что A) существуют такие q, r 6 I, что a = bq-\-ruO^.r<zb.
146 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Для а — 1 утверждение A) справедливо. Действительно, если Ъ = 1, то 1 = ЬЛ + 0; если же Ъ > 1, то 1 = Ь-0 + 1. Предпо- Предположим, что A) верно для а, т. е. а = bq + f. Тогда а + 1 = bq + + г + 1, где 0< г + 1<^ 6. Если г + 1 < Ь, то все доказано. Если же г + 1 = Ь, то а + 1 = Ь^ + 6 = Ь (q + 1) + 0, что снова дает нам искомое представление. Чтобы доказать возможность пред- представления для а <; 0, заметим, что для а = 0 выполняется 0 = = 6-0 + 0, а при а < 0, т. е. при —а ? Р, согласно 4.22, из A) следует —а = bqx + ги где 0 <; ^ < Ь. Если г4 = 0, то а == = Ь (—<7i) + 0. Если же л ^ 0, то а = Ь (—<7i) — л = & (—^ — 1) + (Ь — г4) или, полагая q — —qi — 1 и г = Ъ — ги получим а = bq + г, где, в силу 0 < fi < b, имеем 0 < Ъ — ^ < 6, т. е. 0 < г < 6. Другое доказательство того же утверждения A), т. е. первой части теоремы, опирается на ее следствие: B) для любого а ? I существует такое q Е I, что bq ^ а < < & (<7 + 1). B) можно доказать, исходя из полной упорядоченности множе- множества Р положительных целых чисел, т. е. выбором первого элемента множества А = {Ьх — а: х Е I и а < Ьх} (сначала, конечно, нужно показать непустоту А). Осталось доказать единственность деления. Пусть а допускает два разложения: C) bq + r = bq' + r', где 0 < г < Ь, 0 </•'<'&, и пусть г Ф г''. Тогда или г^>г', или г' > г. В первом случае получаем D) г - г' = Ь (q' - q). Так как г — г' > 0 и 6 > 0, то и g' — q>0 и, следовательно, q' — q^> 1. Поэтому правая часть равенства D) ;>Ь. С другой стороны, левая часть равенства (А) г — г'-^ г ¦< Ь, что ведет к про- противоречию. Аналогично показывается невозможность случая г' > г. Итак, г = г', т. е. bq = bq', b (q — q') = 0. Ho I — область целостности и b Ф 0; следовательно, q ¦— q' = 0, q = q'. В доказанной теореме условие Ь > 0 можно заменить менее ограничительным b Ф 0; предоставляем сделать это читателю. Результат 4.37 часто называют алгоритмом деления. Поводом для такого названия служит возможность описания некоторого механического процесса, с помощью которого можно вычислить частное q и остаток г от деления любого числа а на число b Ф 0. Опишем этот процесс. Для х Е I вычисляем разность а — Ьх в таком
4.5. МАТЕМАТИЧЕСКИЕ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ 147 порядке: а — Ь-0, а—ЬЛ, а — Ь(—1), а—b-2, a — b(—2),..., причем после каждого вычисления сравниваем результат с числа- числами 0 и Ь. Процесс вычисления заканчиваем, когда на некотором этапе оказывается О ^ а — bq < b. Доказанная теорема показы- показывает, что описанный процесс обязательно окончится после конеч- конечного числа шагов. (Можно было вместо одного алгоритма построить три, пригодных соответственно для случаев Ъ <с а, —b ^ a ^ b и а < —Ь; каждый из этих алгоритмов был бы проще.) В частном случае b = 2 теорема 4.37 утверждает, что для любого целого числа а существует такое q, что а = 2q, или существует такое q, что а = 2q-\- 1, причем одновременно обе возможности выполняться не могут. Получаем привычнее разделение всех чисел на четные и нечетные. Отношение делимости и простые числа. Случай, когда остаток при делении равен 0, представляет особый интерес. 4.38. Определение. Пусть a, b ? I. Мы говорим, что а делится на &, или что а к р а т н о Ь, или что b д е л и т а, или что Ь является д е л и теле м а, и пишем b \ а, если сущест- существует q ? I такое, что а = bq. В противном случае говорим, что а не делится на b (соответственно, а не кратно b, b не делит а, Ъ не является делителем а), и пишем b Jfa. 4.39. Теорема. Пусть а, Ъ, с, аи . . ., ап 6 I. Тогда (О а | 0; (ii) 0 | а тогда и только тогда, когда а = 0; (ш) 1 I а; (iv) а | 1 тогда и только тогда, когда а = ±1; (v) а | а; (vi) если с \Ъ и b \ а, то с \ а; (vii) b | а и а \ b тогда и только тогда, когда а — ±Ь; (viii) если с \ а, то с \ ab; (ix) если с \ а и с \Ь, то с \ (а + Ь); (х) если существует такое i, I ^ i ^ п, что с |а,-, то п U ak. Доказательство. Утверждения (i) — (iii) тривиальны.. В (iv) и (vii) равенство а — ±Ь используется в качестве сокраще- сокращения для «а = b или а — —Ь». Утверждение (iv) очевидно в сторону «тогда». Докажем его в сторону «только тогда», т. е. докажем, что если а | 1, то а — ±1. Итак, пусть а ] 1, т. е. 1 = aq для некоторого q 6 I- Тогда 1 = | 1 | = | а ]• \ q |. Так как, очевидно, а Ф О, qфO, то | а |>0 и | q |>0 и |а|-|о|>|а|>1. Таким образом, I а |'= 1: если а>1, то|а| = а>1,а если а<—1, то | а | == = —а *> 1.Утверждения (v) и (vi) тривиальны.
148 ГЛ 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Утверждение (vii) в сторону «тогда» снова очевидно. Докажем лишь, что из b | а и а \ b следует а = ±Ь. Пусть b \ а и а \ Ъ, т. е. а = bqu Ь — aq2. Тогда а = bqx = (aqz) Ц\ = а (q2qi). Если а = 0, то Ъ = О согласно (и). В этом случае (vii) доказано. Если а Ф 0, то, сокра- сокращая, мы получим 1 = qxq2, следовательно, 1 | ^ и ^ = ±1 (соглас- (согласно (iv)). Отсюда а—±Ь, что и требовалось доказать. Легко видеть, что (viii) и (ix) также выполняются (последнее проверяется по дистрибутивности), (х) следует из (viii) и обобщенных ассоциатив- ассоциативного и коммутативного законов 4.28 и 4.30. 4.40. Определение. Число р 6 I называется простым, если р ф 0, р Ф ±1 и для всех а из а \ р следует а = ±1 или а = ±р. Можно механически проверить, что первыми положительными простыми числами являются 2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37. Зачастую к простым числам относят только положительные простые числа. Однако.с алгебраической точки зрения предыдущее опреде- определение более естественно (это выяснится позднее, при изучении вопросов делимости полиномов). Ниже мы докажем, что имеется бесконечно много положительных простых чисел (и, следовательно, бесконечно много отрицательных). Легко проверить следующее полезное свойство чисел, не являющихся простыми. 4.41. Лемма. Если а ? I, а>1 и а — не простое число, то существуют такие аи а2 6 I, что 1 < at < а, \<а2<аиа = = ai-a2. Конечно, одно или оба из чисел аи а2 могут оказаться простыми. Однако если, скажем, а^ не простое, то оно в свою очередь может быть разложено по лемме 4.41 в произведение а^ = а'х-а'г, где а[ и а'2 больше 1. Проделаем затем то же самое и с а2. если а2 не про- простое. Естественно ожидать, что, продолжая этот процесс, через конечное число шагов мы получим представление а = pi-p2-. . . -рп, где ри р2 рп — положительные простые числа. Можно пред- предположить, что при выполнении этих вычислений в другом порядке получится новое представление, например а=р[ -р'2' ...-р'т, где пфт или п=т, но последовательность (р[, р'г, . . ., р'т) не является перестановкой последовательности (рх, р2, . . ., рп). Некорректность этого предположения можно доказать таким путем. Сначала докажем, что из/? | be следует/? | b или р \ с для любого про- простого числа р. Тогда из рг | (р[-р'2' ¦ • ¦ -р'т) будет следовать, что либо рх\р[,т6ор1 \{р[- ... -р'т), откуда или pi=p[, или р,| (/?!,• ... -р'т); при продолжении этой процедуры мы в конечном счете получим, что либо pi = р[, либо pi = р'2, либо..., либо pt = р'т- Затем, сокра- сокращая на р^ обе части равенства pi-p2- . . . -рп = р[-р'2- ¦ . . -р'т и повторяя рассуждения для р2, р3, . . ., мы в конце концов дока- докажем, что представления должны быть одинаковы, за исключением
4.5. МАТЕМАТИЧЕСКИЕ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ 149 разве что порядка множителей. В ближайшем будущем мы и будем заниматься точным осуществлением этих идей. Предлагаемая схема, может быть, не является наилучшей в смысле простоты, но обладает тем преимуществом, что легче обобщается на другие системы, и при ее осуществлении попутно получаем полезные результаты. Наибольшие общие делители 4.42. Определение. Пусть a, b, d ? I. Мы будем назы- называть d наибольшим общим делителем (н. о. д.) чисел а и Ь, если (i) d | а и d | b; (ii) если х ? I, x \ а и x \b, mo x \ d. He доказывая пока существования н. о. д., сформулируем простей- простейшие их свойства. Если du d2 оба являются н. о. д. чисел а и Ь, то di | d2 и d2 | di\ следовательно, d4 = ±d2 согласно 4.39 (vii). Далее, если d4 — н. о. д. чисел а и Ь, то и —d — н. о. д. чисел а и Ъ. (Поэтому слово «наибольший» здесь не указывает на величину в обычном смысле слова.) Эти соображения никак не доказывают существования н. о. д. для любой пары а, Ь. Однако в некоторых особых случаях легко устанавливается существование н. о. д. Так, если а = 0, то а делит- делится на любое число, а так как Ъ \ Ь, то Ь — общий делитель а и Ь и, очевидно, их н. о. д. Н. о. д. существует также в случае а = Ъ. Остаются, таким образом, случаи а ф О, Ь Ф О и а Ф Ь. Для про- простоты предположим сначала, что a>fc>0. Следующий процесс дает нам в этом случае доказательство существования н. о. д. чисел а, Ь, а заодно и так называемый алгоритм Евклида нахождения н. о. д. Процесс основан на следующем замечании. Если D.5.3) а = bq + г, 0 < г < Ь, то, для любого d ? I, D.5.4) d | а и d \ b тогда и только тогда, когда d \ b и d | г. Следовательно, н. о. д. чисел а и b в то же самое время должен быть н. о. д. чисел b я г. Проблема нахождения н. о. д. чисел а и b сво- сводится к, по-видимому, более простой проблеме нахождения н. о. д. b и г, причем г <с Ь. Если г = 0, то b — н. о. д. В противном слу- случае мы повторяем рассуждение, отправляясь от Ь, г. Если за п шагов мы ни разу не получим нулевого остатка, т. е. D.5.5) a = bq + ru 0 < rt < b; b = ri<7i + rz, 0 < r2 < n; r3, 0 < r3 < r2; rn-z = 'n-iqn-i + rn, 0 < rn < /•„-!,
150 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ то на следующем шаге получаем D.5.6) rn_, = rnqn + гп+ь 0 < г„ +1 < гп. Тогда D.5.7) если rn+i = 0, mo rn = (н. о. д. /•„-! и гп) = . . . = (н. о. д. /-j и г2) = (н. о. д. b и rt) = (н. о. д. а и 6). Заметим, что последовательность чисел г); г2, ... однозначно опре- определяется числами а, Ь. Может ли случиться, что процесс никогда не окончится, т.е. гп+^Ф 0 для любого л? Но если это так, то множество А = {гь г2, . . ., гп, . . .} положительных целых чисел не имеет наименьшего элемента, что противоречит полной упоря- упорядоченности Р. Следовательно, процесс оборвется на некотором п, а последний не равный нулю остаток и будет н. о. д. В этом и состоит алгоритм Евклида. Предположим теперь, что выполнены D.5.5), D.5.6) и rn+i = 0. Мы можем записать путь, которым определяются ги г2, . . ., гп по а, Ь, следующим образом: rx = a — bq, г2 = Ь — nqi = Ъ — {а — bq) q{ = — aqv + b A -f qqv) и т. д. Тем самым получаем представления rt = axt + byiy где xi = 1, Di = —q, r2 = a«2 + by2, где x2 =— ^i, «/2=1+ Wi. и т- Д- Предположим, что уже получены представления и /•„-! = ax,,-! + byh-i при /г >- 3, тогда Гп=гк-2 — Гь-tfb-,. = a (*ft-2 — xh-iqh-i) так что для Гь также получаем rfe = ох^ + %ь- Отсюда следует, что и остаток гп, который является положительным н. о. д. а и Ь, может быть представлен в виде ах + by, где х, у Е I. Рассмотрим, наоборот, любое число вида ах + by', где *', г/' целые. Если с ? I, с | а и с | 6, то с | (ах' + Ьг/') согласно 4.39 (viii), (ix); в частности, гп \ {ах' + by'). Если ax' + by' положительно, то гп -С ах' + ^'- Итак, положительный н. о. д. чисел а и b — наименьшее положительное число вида ах' + by'. Эта характе- характеристика позволяет дать новое доказательство существования н. о. д., которое, хотя и немного труднее, чем предыдущее, зато в некотором смысле более содержательное.
4.5. МАТЕМАТИЧЕСКИЕ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ 151 Нам потребуются следующие два свойства множества L всех линейных комбинаций ах + by, где х, у ? I: D.5.8) (а) если и 6 L и z ? I, то иг 6 L; (б) если и, v 6 L, то и + v ? L. Легко видеть, что если L' — любое другое множество, удовлетво- удовлетворяющее условиям D.5.8) (а), (б), и a, b E L', то L s V. Очевидно также, что а = а-\ —1— Ь-0 и Ь = а-0 + Ь-1 сами принадлежат L. Следовательно, L — наименьшее множество из всех L', удовлетво- удовлетворяющих условиям D.5.8). В следующей теореме этот результат будет существенно уточнен: будет изучена структура любого множества 5, удовлетворяющего условиям D.5.8). 4.43. Теорема. Предположим, что S <= I, S ф 0 и что (i) если и ? S и z ? I, то иг 6 S; (и) если и, v ? S, то и + v ? S. Тогда или S = {0}, «лы существует d у> 0 такое, что S = {ск: г 6 1}; б последнем случае d определяется однозначно. Доказательство. Предположим, что S ^ {0}, т. е. суще- существует и 6 5, иф 0. Если « < 0, то —ы = ы (—1) 6 5; следова- следовательно, если S =^{0}, то S содержит положительное целое число. Пусть Л = S f] Р; Р вполне упорядочено, а/1 сР непусто, сле- следовательно, А содержит наименьший элемент; назовем его d. Тогда A) d e S; B) d > 0; C) если и G 5 и и > 0, то W^> d. Из A) и предположения (i) непосредственно следует, что D) {Лг: г 6 1} g= S. Чтобы доказать обратное, предположим, что и 6 S. Согласно алго- алгоритму деления 4.37, мы можем написать E) и = dz + г, где г, г ? I и 0 < г < d. Тогда г = и — dz = ы + d (—z). Так как и, d ? S, то из (i), (ii) следует, что также г ? S. Если г > 0, то, по C), r>d, что невозмож- невозможно. Поэтому г = 0 и и = dz. Итак, F) S ?= {^: 2S I}. Формулы D) и F) вместе дают желаемое равенство. Таким образом, d 6 S и является делителем любого элемента в S. Предположим, что d' — любой другой элемент, обладающий этим свойством, при- причем d' > 0. Тогда d | d' и d' \ d; следовательно, d = ±d' no 4.39 (vii). Но d = —d' противоречит d > 0 и d' > 0; поэтому d = d'.
152 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ 4.44. Теорема. Пусть а, Ь 6 I и а фО или b Ф 0. Тогда а и b имеют единственный положительный наибольший общий дели- делитель d. Для подходящих s, t ? I при этом d = as + bt. Доказательство. Пусть S = {ах + by: х, у ? I}. 5 удовлетворяет условиям 4.43 (i), (ii). Далее, a, b ? S; таким обра- образом, Бф 0, Бф {0}. Выберем d> 0 такое, что S = {dz: z? I}. Так как d 6 5, то d = as + bt&nn некоторых s, t, а так как a, b ? S, то d — делитель а и b. Если с — другой общий делитель а, Ь, то с \ (as -\- bt) согласно 4.39 (via), (ix), т. е. с \ d. Следовательно, d — н. о. д. чисел а, Ь. Как мы видели, любой другой н. о. д. d' удовлетворяет свойству d' = +d. Поэтому если d'> 0, то a" =d. 4.45. Определение. Мы определяем {а, Ь) для всех a, b ? I с а Ф 0 или Ьф 0 как единственный положительный н. о. д. чисел а, Ь. Числа аи b называются взаимно простыми, если (а, Ь) = 1. Здесь может возникнуть путаница из-за одинаковых обозначений для н. о. д. и упорядоченной пары. Но оба эти обозначения обще- общеприняты. В тексте будет оговариваться, в каком смысле исполь- используются эти обозначения. Если (а, Ь) = 1, то a, b не имеют общих делителей, отличных от ±1- Поэтому справедлива следующая теорема (в которой, как и в дальнейшем, использование символа (а, Ь) будет неявно вклю- включать предположение, что аф 0 или ЬфО). 4.46. Теорема. Предположим, что а, Ь, с 6 I. Если (а, с) = 1 и с | ab, то с \ Ь. Доказательство. Так как (а, с) = 1, то по 4.44 спра- справедливо A) 1 = as + ct для некоторых s, t? I. Отсюда B) b = (ab) s + с (bt). Из с | ab и с | с (bt) следует, что с | Ь. 4.47. Теорема. Предположим, что р — простое число и а, Ь, аи . . ., ап ? I. Тогда (i) если р )( а, то (а, р) = 1; (ii) если р \ ab, то р \ а или р \ Ь; (iii) если р \ (at- ... -ап), то р | at для некоторого i. Доказательство оставляем читателю. Хотя свойства, сформулированные в теореме 4.47, доказываются весьма просто, они очень важны. Вспомним, например, что одно из них послужило причиной рассмотрения н. о. д. 4.48. Теорема. Если а, Ъ, с ? I, (а, Ъ) = 1, а ) с, b \ с, то (ab) | с. Доказательство также представляется читателю.
4.5. МАТЕМАТИЧЕСКИЕ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ 153 Разложение целых чисел на простые множители. Почва для дока- доказательства существования и единственности разложения на простые множители практически подготовлена. Рассмотрим вначале вопрос существования разложения для любого а>1. Итак, пусть а>1 фикси- фиксировано. Если а простое, то утверждение тривиально. Если а не про- простое, то а = «! -а2, причем 1 < а^ < а, 1 < а2 < а. Если бы поэто- поэтому мы уже доказали для всех b < а существование разложения Ь, то получили бы, таким образом, разложение самого а. Иначе говоря, в нашей задаче нужно несколько измененное индуктивное доказа- доказательство, в котором индуктивное предположение состоит в спра- справедливости утверждения для всех предшествующих а элементов, а не только для одного непосредственно предшествующего элемен- элементу а. Корректность индуктивных доказательств этого нового типа устанавливается следующей общей теоремой. 4.49. Теорема. Пусть (S, <Q — вполне упорядоченная систе- система, А ? S и пусть Sa = {х: х Е S и х -<^ а} для любого а Е S. Если А обладает тем свойством, что из Sa ? А следует а Е A , то А = S. Доказательство. Допустим противное, т. е. А Ф S; тогда B = S — АФ0, и, в силу полной упорядоченности S, В содержит первый элемент, скажем Ь. Пусть х — любой элемент из Sb- Тогда, по определению Sb, x -<^ b и, следовательно, х <| В, т. е. х Е А. Поэтому Sb ? А и по условию теоремы b E А, что про- противоречит выбору b Е В. Итак, Л == S. Аналогичным образом нетрудно показать справедливость и обрат- обратной теоремы: линейно упорядоченная система (S, <Q будет вполне упорядоченной, если любое ее подмножество A ^S обладает тем свойством, что если для любого а 6 5 из Sa^A следует а 6 Аг то А = S. Доказательства, проводящиеся на основе свойства 4.49 вполне упорядоченных систем, называются иногда возвратной (course-of- values) индукцией в силу присутствующей в них ссылки на пове- поведение всех элементов, предшествующих а. С точки зрения практического использования такой индукции нужно отметить, что при проверке утверждения «из 5О ? А сле- следует а 6 А для всех a s 5» может оказаться, что а — первый эле- элемент множества S, так что Sa = 0 пусто. Поэтому для такого а необходимо давать прямое доказательство включения а Е А. 4.50. Теорема. Для любого а ? 1, а > 1 имеем: (i) существует последовательность (ри . ¦ ., рп) положитель- положительных простых чисел такая, что а = /v . . . -рп; (п) если (qu . . ., qm) — любая другая последовательность положительных простых чисел такая, что а = qt • . . . -qm, то
154 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ п = т и, для некоторой перестановки F множества {1, . . ., п), Цп = Ртоо для всех k <; п. Доказательство. Докажем (i) и (ii) с помощью нашей новой индукции по множеству Р2 целых чисел ^>2. Пусть А — мно- жестЕо всех а ? Р2, для которых существует последовательность (Pi, . . ., рп), удовлетворяющая (i), единственная с точностью до порядка в смысле (ii). Согласно 4.49, чтобы доказать теорему, достаточно показать, что A) если {х: 2 <; х < a} s А, то а?А. Примем предположение A). Сперва мы покажем, что (i) также верно для а. Если а простое, то это так. В противном случае мы, согласно 4.41, имеем B) а=ага2, где l<at<.a, 1<а2<а. По предположению, существуют две последовательности </?,, ..., рП1) и (р[, ..., р'пг) положительных целых чисел такие, что п\ C) а,~_: [J pk, a2= И p'h. k i hi Пусть n — nt-j-rto и Pm+k — p'h для l^Ck^Cno. Тогда, согласно 4.27 (ii) и 4.28. ' D) а = ([Ы-< Й Р*) = (ЙР*)- Теперь, чтобы доказать (ii), предположим еще, что E) а= П flffc, где (gl7 ...,qm) простые. Но F) а=(П Pk)-P,.\ m следовательно, pn I [j g/t. Тогда по 4.47 существует такое /, 1<л<;яг, что рп\Ц1- В силу простоты и положительности рп, с\; A <Рп) это может случиться только при pn — qi. Пусть G — любая перестановка множества {1, ...,т} такая, что G(m) = i. Тогда, согласно обобщенному коммутативному закону 4.30. т т т—1 т—1 G) а= [] Qk= П ^о<й) = ( П 9G<ft))<7i = ( П Из F) и G), сокращая, получаем п— 1 тп— i (8) П л= П gevn. h= I h— 1
4.5. МАТЕМАТИЧЕСКИЕ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ 155 Может случиться, что [J pk в (8), которое мы назовем аь рав- на 1, а тогда а = pi = ^ь и в этом случае (ii) устанавливается три- тривиально. В противном случае 2 ^ аи и из а = afpn и 2 ^ рп получаем о4 < а. Следовательно, мы можем применить наше индук- индуктивное предположение к at, т. е. из (8) следует п — 1 = т — 1 и, для некоторой перестановки Н множества {1, . . ., п— 1}, (9) Ясф Определим { H(j), если кф1 и k A0) F(k)={ U , . ' { п, если k = i. F вполне определяется этими условиями, так как любое k, кроме k = i, есть G (j) для некоторого / < п по выбору G, причем такое / единственно. Далее, F — перестановка множества {1, . . ., я}. Для доказательства предположим, что F (&t) = F (k2), где ku k2 ^ <; п. Если ku k2 оба не равны i и ki = G (/i), k2 = G (/2), где ju /2 < <; «, то F (^ = Я (/i), F (k2) = H (/2), отсюда Д = /2 по взаимной однозначности Я и тогда ki = k2. Единственным другим случаем является ki ф i, k2 = i. Но в этом случае F (&4) ф F (k2). To, что ,,?. (F) == 3 (F), проверяется тривиально. Чтобы закончить индук- индукцию, нам осталось только заметить по (9), A0) и qt = pn, что A1) qh = pF(h) для всех k ^ п. Из этой теоремы без труда может быть получено 4.51. Следствие. Для любого а 6 I, а > 1, существуют единственные последовательности (рь . . ., рп) и <ib . . ., tn) такие, что: (i) для любых k, I, I <^. k <C I ^ n, pk — положительное про- простое число и pk<pu (ii) ih 6 Р <5ля любого k ^ п; (iii) а = /?*!• . . . -р]п. Доказательство предоставляется читателю. Теоремы 4.50 и 4.51 обычно рассматриваются как различные формы одной теоремы единственности разложения целых чисел. Если разложение числа а — такое, например, как в 4.50,— уже получено, то найти все положительные делители а нетрудно: ими будут произведения элементов подпоследовательностей (phl, . . . . . ., pk ) последовательности, определяющей разложение, где 1 -^ ki < k2 < . . . < km <; п. Поэтому, зная разложения чисел а и Ь, легко найти их н. о. д. (описать конкретный способ его нахож- нахождения предоставим читателю). Анализ доказательства существования в теореме 4.50 показы- показывает, что разложение любого числа получается конечным числом
156 ГЛ- 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ шагов. Можно указать и конкретный алгоритм, позволяющий искать такое разложение. Действительно, пусть задано а>1. Перебирая положительные простые числа, меньшие или равные аг в порядке их возрастания: 2, 3, 5, . . ., находим первое, делящее а. Пусть это pi. Тогда а = Pi-au 1 <; а4 < а. Если at Ф 1, то повто- повторяем процедуру для оь отыскивая среди положительных простых чисел C^-pi, но ^fli) первый делитель р2 числа а4. Имеем at = р2а2 и 1 < а2 < й) и т. д. Получаем, таким образом, убывающую после- последовательность а > «i > а2 > . . ., которая, конечно, на некотором шаге оборвется, т. е. ап Ф 1 и an+i = 1. Тогда а = рх-р2- . . . -рп. 4.52. Теорема. Множество положительных простых чисел бесконечно. Доказательство. Индукцией по Р доказываем, что для любого п 6 Р существует по крайней мере п попарно различных простых положительных чисел. Для п = 1 теорема очевидна. Пусть мы доказали, что для п существуют положительные попарно раз- различные простые числа qit q2, ¦ . ., qn- Рассмотрим число а = = (qi'q2- ¦ ¦ • -.дп) + 1- По теореме 4.50 его можно разложить в произведение положительных простых чисел, и поэтому у него есть простые делители. Пусть р \ а. Если р = qh для некоторого k, то р \(qi-q2- . . . -qn) и поэтому р | (а — (qr • . . . -qn)), т. е. р \ 1, что противоречит определению простого числа. Получилась система <7i> Ч2, ¦ • •. qny р из п + 1 попарно различных простых чисел. Так как доказанное утверждение справедливо для любого п 6 Р. то множество положительных простых чисел бесконечно. Поскольку алгоритм деления позволяет, очевидно, построить алгоритм отыскания делителей произвольного числа а, то одновре- одновременно можно построить и алгоритм распознавания простых чисел, т. е. алгоритм, за конечное число шагов позволяющий проверить, является ли данное число простым. Поэтому, проверяя все числа в порядке возрастания, можно также составить список всех положи- положительных простых чисел, не превосходящих данного числа т. Однако сказать заранее, сколько именно таких простых чисел окажется,— проблема чрезвычайно трудная. Приближенное ее решение — одно из наиболее впечатляющих достижений математики в нашем сто- столетии. Позиционные системы обозначений целых чисел. Вернемся к вопросу (послужившему одной из отправных точек для расшире- расширения множества положительных целых чисел) о возможности пози- позиционного представления положительных целых чисел. Так, в деся- десятичной системе под записью 2037 понималось число 2-Ю3 + 0-Ю2 + + 3-10 + 7, которое, для однородности записи, можно также пред- представить в виде 2-Ю3 + 0-Ю2 + 3-10 + 7-10°. Сейчас мы докажем существование и единственность такого представления, причем сразу для системы счисления с произвольным основанием Ь> 1. Отметим только, что если коэффициентами разложения в десятичной
4.5. МАТЕМАТИЧЕСКИЙ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ 157 системе являются числа 0, 1, 2, . ., 9, то следует ожидать, что коэффициентами разложения в системе с основанием b будут О, 1, 2, . . ., Ь—\. 4.53. Теорема. Предположим, что а 6 Р, b 6 I, b>l. Существует единственное п 6 I, п>0, и единственная последова- последовательность (с0 сп) целых чисел такие, что (i) а = 2 сфп-к; (ii) для каждого k, 0 <; k ^ п, имеем 0 -< ch < 6; (i'i) co=^ 0. Доказательство. Мы одновременно докажем и существо- существование, и единственность такого представления индукцией типа 4.49 по Р. Итак, предположим, что а?Р и что для каждого at?P, й(<й имеет место единственное представление желаемого вида. Рас- Рассмотрим отдельно два случая: a<ib и а>6. Если a<cb, то а = о == а • 1 = а• ?>° = 2 ckb°~k, где с0 = а (таким образом, здесь (ii) и (Hi) п выполняются). Пусть, кроме того, а— 2 c'hbn'h. Если п>0, /!=0 п то а=-Со&"+ 2 ch&n-h> и так как каждое из c'hbn~h неотрицательно, ft=i то а>.?$?"; но с„>-1, так что a^>bn = b-bn~1^>b, а это противо- противоречит предположению a<cb. Следовательно, п = 0 и а = Сц&° = Сд; отсюда с'0 = с0 и представление единственно. Рассмотрим теперь второй случай а>Ь. Пусть A) а = qb + г, гЗе 0 < г < Ь. Тогда г <С а и а — г>0; также а — г = qb, откуда q > 0, или B) 9 6 Р. Но 1 < Ъ и q < qb ^. а, или C) ? < а. Согласно B), C), мы можем применить индуктивное предположе- предположение к q. Следовательно, существуют единственные т G I, m^>0 нецелые числа (d0, . . ., dm> такие, что m D) (i) 9=S4&m-u; (ii) (iii)
158 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Тогда по закону дистрибутивности из A) получаем, что E) fl= S 4&<m+1)-ft-rr. ft=b Определим F) м = т-|-1, cn = r и cfe = <4 для 0<;&-<?i—1. Таким образом, мы можем переписать E) в виде a = ?2 chbn-k-\ cn= ^\chbn-k. k=0 h-=0 Очевидно, c0 Ф 0 и 0 ^ ch < Ь при О <С k <; д, так что F) дает по меньшей мере одно искомое представление для а. Предположим, что есть и другое: G) (i) fl==|] <*&»'-*; ft=O (ii) 0<Cft<6 при (iii) c^O. Если n' = 0, то a — c'0<cb, что противоречит a~^>b. Поэтому п'>0, и мы можем написать Таким образом, полагая (8) m' = n'— 1, 4=4 и m' (9) g' = 2 4&m'"ft, получим A0) a = q'b + c^. Ho 0^c4'<&, так что по условию единственности алгоритма деления A1) q' = q и с'п. = г. Теперь мы применим индуктивное предположение о единствен- единственности представления D) числа q: т' = т и dh—dh для 0^.k^m. Но тогда изF) и (8)получаемп'=т' + \=т + 1 = п, с'„> = с'п = г = с„ и c'k = d'h = dh = си для ()<;&¦</г— 1. Следовательно, представле- представление а единственно и индукция закончена. При помощи результата 4.33 о геометрических прогрессиях доказанную теорему можно несколько пополнить.
4.5. МАТЕМАТИЧЕСКИЕ СВОЙСТВА ЦЕЛЫХ ЧИСЕЛ 169 4.54. Теорема. Для а?Р, представленного как в 4.53, имеем 6"<;а<;6пн, причем п однозначно определяется этими неравен- неравенствами. Доказательство. Из с0ф0 следует 6п<а. С другой сто- стороны, cft<6 — 1 для любого k, так что а= 2 h 0 2 h = 0 2 ft = О () S Й--0 ft=0 Осталось установить единственность. Если, например, т<с.п и ft<a<ftm+1, то /п+ 1 <м, откуда &тп+<6п<а, что невозможно. Аналогично можно показать, что невозможно и п<ст, следова- следовательно, п — т. Мы сформулировали теорему о представлении в виде, соответ- соответствующем обычному обозначению чисел, в порядке убывания сте- степеней Ь. Используя закон коммутативности, можно с тем же п успехом представить а как 2 chbh, где 0<cft<fr и спф0. Из представления 4.53 можно вывести знакомые нам правила сложения и умножения целых чисел, изучавшиеся в элементарной арифметике. Пусть требуется сложить, скажем, где j. Положим гг пг k и аг = 2 сг, фП2~\ ft=0 и напишем 2 ft=0 ft—О где Тогда du й = n = 2 ft0 если если если Пусть dft = dlt h -\- d2, k Для 0 <; k ^ п. Тогда d0 ф 0. Однака это не означает, что обязательно 0 -С dh < b. Можно только утверждать, что 0 <^ dk ^ 26 — 2. Это заставляет нас рассмотреть так называемый «перенос». Например, если 0 ^ dn < 6, то в каче- качестве /г-й цифры сп в разложении числа а± -\- а2 возьмем само dn. Если же dn = b + г, где 0 <; г < 6, то в этом случае мы полагаем
160 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ сп = г и «переносим» 1 в коэффициент при Ь1. В качестве нового коэффициента при Ь1 получаем dn_^ + 1 (которое <2Ь). Пусть {?„_! равно йп_х + 1 или dn_! в зависимости от того, какой из слу- случаев имел место. В силу d«-i < 2b к й'п^ можно применить проце- процедуру, описанную для dn. Если &<;#,_!, то d'n^ = Ъ + с„_ь 0 ^ с„_4 < Ь, и d^_ib = 1 -б2 -f- cn_ib; мы теперь должны перенести 1 в коэффициент при Ь2. Продолжая в том же духе, мы в конечном счете получим представление для а4 + а2. Читателю стоит детально проанализировать законы, делающие эту процедуру возможной, и провести аналогичный анализ для умножения. До сих пор мы не рассматривали никаких других областей цело- целостности, кроме целых чисел. Стоит отметить, что многие из понятий и теорем, полученных нами, легко распространяются и на другие области целостности. Так обстоит дело, например, с алгоритмом деления, понятием делимости, существованием н. о. д., понятием простоты, разложением на простые множители. Конечно, доказа- доказательства придется менять, так как до сих пор большинство доказа- доказательств основывалось на полной упорядоченности положительной части множества целых чисел. Только один раз нам удастся прямо воспользоваться таким методом — при изучении вопросов дели- делимости полиномов, где индукция будет вестись по степеням поли- полиномов. Конечно, перенести на другие области целостности можно не все теоремы. Например, теорема 4.53, служащая основой позицион- позиционной системы, является специфической для целых чисел: если любой положительный элемент упорядоченной области целостности может быть записан в системе с основанием 2, т. е. 1 + 1, то множество положительных элементов этой области целостности окажется изо- изоморфным Р, а сама область — изоморфной множеству целых чисел. Упражнения 1. Сформулировать и доказать теорему, соответствующую алгоритму деления 4.37 с ограничением Ь Ф 0 вместо Ь > 0. 2. Доказать лемму 4.40. 3. Доказать теорему 4.47 (i) — (iii). 4. Доказать теорему 4.48. 5. Найти н. о. д. A960, 252) и A65, 182) при помощи алгоритма Евклида и разложением на простые множители. В каждом случае найти s, t в I с {а, Ь) = as + Ы. 6. Пусть а, Ь, с 6 Р. (а) Упростить (ab, ас); (б) Если (а, с) = (Ь, с) = 1, то чему равно (а, Ь, с)? Почему? 7. Доказать следствие 4.50. 8. Дать прямое доказательство 4.50 (п) методом возвратной индукции по с = аЬ. 9. Показать, что из а2 \ Ь2 следует а | Ь. 10. Доказать, что имеется бесконечно много положительных простых чисел р, для которых существует k с р = 4k + 1. Можно ли найти другие формы р = ak -\- Ь, для которых выполнялось бы это условие?
4.6. ОТНОШЕНИЯ КОНГРУЕНТНОСТИ В ОБЛАСТИ ЦЕЛЫХ ЧИСЕЛ 161 11. Вычислить результаты следующих операций в системе счисления с основанием 4. Проверить вычислением в десятичной системе: (а) 3102+223; (б) 3102-223. 12. Доказать, что если сумма цифр числа а по основанию 10 делится на 9, то и а делится на 9. Существуют ли, кроме 9, другие числа с подобным свойством? 4.6. Отношения конгруентности в области целых чисел В построении системы, изоморфной множеству целых чисел (теорема 4.21), отчетливо видны два самостоятельных этапа. На пер- первом этапе были определены некоторые операции ф и ® на множе- множестве Р х Р и отношение = между его элементами и было доказано, что отношение = является конгруентностью относительно операций Фи ®. На втором этапе по операциям Ф , ®, заданным на Р х Р, были построены операции + и •> определенные на множе- множестве D классов эквивалентности Р х Р по отношению ==. Если первый этап — построение операций Ф, <g> и отношения = — специфичен для рассматривавшейся задачи (в данном случае опера- операции строились с тем расчетом, чтобы в конце концов получить систе- систему с вычитанием), то второй этап носит совершенно общий харак- характер: по системе (S; Fu F2, . . ., Fh; Wlt W2, . . ., Wv, au a2, . . ., am) и отношению конгруентности == на этой системе строится новая система (S, Fi, F2, •••, Fft; Wi, W2, •••, W;; а4> а2, •••, am), где S — множество классов эквивалентности S по отношению =. Конечно, алгебраические свойства второй системы вполне опреде- определяются свойствами первой. Естественно возникает вопрос, какие свойства первой системы прямо наследуются второй. Будем обозначать тот класс эквивалентности по отношению ==, которому принадлежит данное х ? S, через [х]. Напомним усло- условия B.3.36), при которых отношение == называлось отношением конгруентности. Если, например, F и W — соответственно опера- операция и отношение из исходной системы, скажем, бинарные, ИХ[ = х2, yi = уг, то F (хи j/i) = F (x2, y2), a (xlt y%) € W тогда и только тогда, когда (х2, у2) 6 W (и аналогично для я-арных операций и отноше- отношений). Новые операция F и отношение W на множестве классов экви- эквивалентности определяются теперь так: D.6.1) F (Ы, [у]) = [F (х, у)]; D.6.2) ([х], [у]) 6 W тогда и только тогда, когда (х, у) 6 W. Конечно, для данного класса эквивалентности X существует много различных элементов х таких, что [х] — X, поэтому D.6.1) и D.6.2)
162 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ корректно определяют соответственно операцию F и отношение W только в силу того, что = есть отношение конгруентности относи- относительно F и W. Для новой системы мы определили, таким образом, отношения и операции. Осталось выделить константы. Пусть D.6.3) а = Ы для каждой постоянной а исходной системы. Гомоморфизмы. Рассмотрим функцию G (х) = [х] для всех х 6 S. Она обладает следующими свойствами: D.6.4) (а) 3 (G) = S, М (G) = S, (б) G (at) = ai, G (а2) = а2, . . ., G (ат) = ат; (в) если отношение Wlt скажем, бинарно, то, для любых х, у б S, (х, у) 6 Wi тогда и только тогда, когда (G (x), G (у)) 6 Wi, и аналогично для Wz, . . ., Wi при любом числе аргументов; (г) -если операция F\, скажем, бинарна, то, для любых х, у 6 S, G (Ft (х, у)) = Fi (G (x), G (у)) и анало- аналогично для F2, . . ., Fh при любом числе аргументов. Рассматривая D.6.4), можно заметить, что туда входят все свой- свойства, необходимые для того, чтобы G осуществляло изоморфизм между S и S, кроме взаимной однозначности. Функции, подчиняю- подчиняющиеся таким условиям, играют большую роль в математике и полу- получили специальное название гомоморфизмов. Вообще любая функ- функция G из системы (S; Fit F2, . . ., Fh; Wu W2, ¦ ¦ ., Wr, au a2, . . . am) на однотипную систему (S'; F[, F'2, . . ., F^; W[, W2 W\; a\, a'2, . . ., a'm), подчиняющаяся условиям D.6.4) (в которых вместо S, F, W, а надо понимать 5', F', W', а'), называется гомоморфным отображением первой системы на вторую, а вторая система назы- называется гомоморфным (относительно гомоморфизма G) образом пер- первой. В случае взаимной однозначности G мы будем также употреб- употреблять термины «изоморфное отображение» (или просто «изоморфизм») и «изоморфный образ», что, конечно, хорошо согласуется с нашими определениями. Утверждение D.6.4) показывает, таким образом, что любое отношение конгруентности = порождает гомоморфное отображение G (х) = [х]. Легко видеть, что отношение конгруент- конгруентности связано с порождаемым им гомоморфным отображением сле- следующим образом: D.6.5) Для любых х, у 6 S, x=sy тогда и только тогда, когда G(x)=G (у). Сейчас мы покажем, что любое гомоморфное отображение порож- порождается некоторым отношением конгруентности. Пусть, действитель- действительно, G — гомоморфное отображение системы (S, F±, . . .) на систему
4.6. ОТНОШЕНИЯ КОНГРУЕНТНОСТИ В ОБЛАСТИ ЦЕЛЫХ ЧИСЕЛ 163 (S', F[, . . .). Определим отношение == условием D.6.5). (Можно заметить, что если G взаимно однозначно, т. е. является изоморфиз- изоморфизмом, то = есть просто тождественное отношение.) D.6.5) показывает, что = является отношением эквивалентности в S. Покажем, что оно является и конгруентностью. Предположим, что xt = yit х2 == г/2, т. е. G (xY) = G (yt), G (x2) = G (у2). Если Wu скажем, бинарно, то, по определению гомоморфизма, (хи хг) 6 Wi тогда и только тогда, когда (G (xj, G {х2)) 6 W[, а (уи у2) ? Wx тогда и только тогда, когда (G (г/0, G (у2)) ? W[. Но G (xi) = G (г/0, G (х2) = G (у2), так что (хь %2) 6 №i в том и только в том случае, когда (уи у2) б Wi. Далее, если Fu скажем, бинарна, то нужно показать, что Fi (xu x2) ^ Fl (г/ь у2), т. е. что G (/ч (хь х2)) = = G (Fi (г/ь г/2))- Но это прямо следует из f; (g (Xi), g (x2)) = f; (G ы, g ы). Итак, == есть отношение конгруентности на системе (S, Fi, . . .). По отношению ^ строим соответствующую систему (S, Fi, • ¦ .), где S — множество классов эквивалентности. Мы утверждаем, что D.6.6) (S1, F[, . . .) = (S, Fi, • • •)• Для доказательства достаточно построить взаимно однозначное гомоморфное отображение Я системы (S', F', . . .) на (S, F, . . .), исходя из условия D.6.7) Я (G (х)) = М для любого х 6 S. Чтобы убедиться, что D.6.7) действительно одно- однозначно определяет некоторое отображение, нужно только прове- проверить, что из G (х) = G (у) следует [х] = [у], что очевидно. Также очевидно, что Я обладает всеми требуемыми свойствами. По доказанному, любые гомоморфные образы можно получить из отношений конгруентности. Поэтому выбор того, что именно рассматривать: гомоморфный образ или отношение конгруентно- конгруентности,— будет определяться каждый раз только соображениями удобства. Свойства, сохраняющиеся при гомоморфизмах. Вопрос, с которо- которого мы начали этот параграф, можно теперь сформулировать так: какие алгебраические свойства систем сохраняются при переходе к любому гомоморфному образу этой системы"} Точный ответ зависит от смысла, который мы вкладываем в слова «алгебраические свой- свойства». Точное же определение последнего термина может быть дано только в рамках символической логики, причем удовлетворительный ответ был получен лишь в последнее время *). Найденный класс свойств достаточно широк, и описать его без применения логиче- *) А. И. М а л ь ц е в, Алгебраические системы, «Наука», 1970; Р. Л и н - дон, Заметки по логике, «Мир», 1968.
164 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ ских терминов трудно. Мы хотим указать, не претендуя на стро- строгость изложения, только некоторые примеры таких свойств. Предположим, что элемент bi получается из элементов х, у, z, . . . 6 S и из аи а2, . . . применением операций Fb F2, . . . Рассматривая х, у, z в качестве переменных, можно Ьх понимать как значение ^ (х, у, z, . . .) некоторой функции ^. Если значения /i (х, у, z, . . .) и 4 (х, у, z, . . .) совпадают для всех х, у, z, . . . 6 S, то мы будем говорить, что равенство D.6.8) h (х, у, г, . . ¦) = к (х, у,г, .. .) истинно в S. Например, равенство F2 (Fi (x, 1), Ft (x, 1)) = = Ft {F2 {х, х), Fi (x, Fi {x, 1))) верно в системе целых чисел, если •^2 (х, у) = х-у и Fi (х, у) = х + у. В системе S может, например, оказаться истинным равенство .Fi (F2 {x), F^ (a2, x)) = F2 (a^, где Fi — некоторая бинарная операция, a F2 — унарная. Можно пока- показать, что каждое равенство, истинное в системе S, также истинно в любом гомоморфном образе системы S. Например, чтобы увидеть, что приведенное выше равенство истинно в E', F[, . . .), рассмо- рассмотрим любое х' б S'. Мы хотим показать, что F[ (F'2 (xf), F[ (а'г, х')) = = F'2(a'^. Пусть G — гомоморфизм S на S'. Тогда а[ = G ( a'z = G (a2) и x' = G (x) для некоторого х 6 S. Поэтому F[ (F[ (x'), F[ (a'2, x')) = F[ (F'2 (G (x)), F[ (G (a2), G (x))) = F[ (G (F2 (x)), G (F, (a2, x))) = G (F, (F2 (x), Л (a2, x))) = G (F2 (at)) Переход от каждой строки к следующей происходит на основании свойства гомоморфизма G, за исключением перехода от третьей стро- строки к четвертой, где мы использовали предположение, что-равен- что-равенство Fi (F2 (x), Fi (a2, x)) = F2 (at) истинно в исходной системе. Между прочим, теперь мы можем расширить наши замечания в главе 2 в связи со свойствами, которыми обладает система и ее подсистема. Легко видеть, что любое равенство, истинное в систе- системе S, истинно также в любой ее подсистеме. Получаем, таким обра- образом, одновременно частичный ответ и на следующий вопрос: какие алгебраические свойства сохраняются при переходе от системы S к любой ее подсистеме? Полный ответ на этот вопрос также содержит- содержится в недавних работах по логике *). В противоположность равенствам неравенства в общем случае не сохраняются при гомоморфизмах. Например, могут существовать *) А. Р о б и н с о н, Введение в теорию моделей и метаматематику алгеб- алгебры, «Наука», 1967, гл. III, § 3.3.
4.6. ОТНОШЕНИЯ КОНГРУЕНТНОСТИ В ОБЛАСТИ ЦЕЛЫХ ЧИСЕЛ 165 такие элементы аи а2 ? S, что пуф а2, но G (ау) = G (а2) (ведь G не обязана быть взаимно однозначной). В то же время неравенства сохраняются при переходе к подсистемам. Другие, чуть более слож- сложные свойства не сохраняются и при этом переходе, например свой- свойства «существования» (см. ниже). Задача отыскания свойств отношений, сохраняющихся при гомо- гомоморфных отображениях или переходе к подсистемам, нисколько не сложнее, чем рассматривавшаяся выше задача о свойствах опера- операций и констант, но ее еще сложнее формулировать в рамках нашей книги, т. е. без привлечения логического языка. Читатель легко может убедиться, что при переходе от системы (S, W), где W — бинарное отношение, к любой ее подсистеме или при гомоморфизме сохраняются свойства рефлексивности, симметричности и транзи- транзитивности. Свойство линейной упорядоченности также сохраняется при переходе к подсистеме. Естественно посмотреть, как обстоит дело с этим свойством при гомоморфных отображениях. Оказывает- Оказывается, для упорядоченных систем этот вопрос интереса не представляет, так как не существует нетривиальных гомоморфизмов упорядочен- упорядоченных систем. Если, действительно, (S, <^) — линейно упорядочен- упорядоченная система, и == — отношение конгруентности на ней, то, для любых хи х2, уи уг 6 S, из Ху = уи х2 == у2, xt << x2 следует г/i <^ г/2- Если соответствующий гомоморфизм G нетривиален, т. е. не является изоморфизмом, то должны существовать такие хи у у, что Ху = у у, но ХуФ уу. Тогда либо xt <( yit либо у у <^ Ху. В первом случае, в силу Ху = г/ь г/i = уи вытекало бы г/i <^ г/i, что невозможно, и аналогично, во втором случае мы получили бы А <<^ Xi. Следовательно, = — тождественное отношение. Как мы скоро увидим, существует сколько угодно нетривиальных гомомор- гомоморфизмов системы (I, +. *> 0. !)• Приведенное выше рассуждение показывает, что ни один из них не является гомоморфизмом относи- относительно отношения порядка <. (Иногда поэтому рассматривают несколько видоизмененное понятие гомоморфизма специально для систем с одними лишь отношениями так, чтобы нетривиальные, обра- образы упорядоченных систем существовали и были упорядоченными.) Изложенные соображения позволяют легко доказать следующую теорему. 4.55. Теорема. Гомоморфный образ (относительно гомомор- гомоморфизма G) любого коммутативного кольца с единицей (D, +, •, 0, 1) также является коммутативным кольцом с единицей, если только G@)^G A). Доказательство. Все условия из определения 4.1 ком- коммутативного кольца с единицей, за исключением 4.1 (i) и 4.1 (vi), являются равенствами и потому сохраняются при любом гомомор- гомоморфизме; условие 4.1 (i) прямо входит в формулировку теоремы. Остается проверить, таким образом, только 4.1 (vi). Будем обозна- обозначать +' операцию, соответствующую операции +, на образе D»
166 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ так что G (х + у) = G (х) + 'G (у) для любых х, у 6 D- Рассмотрим произвольные х', у' ? J? (G). Мы хотим показать существование такого и' 6 М (G), что х' +'"' = У ¦ Возьмем любые такие х, у ? D, что х' = G (х) и у' = G (г/). По условию, (D, +, •, 0, 1) — коммута- коммутативное кольцо, поэтому существует такое и ? D, что х + « = У- Но тогда G (х + и) = G (х) +' G (и) = G (у), т. е. х' +' G (и) = г/'. Следовательно, и' = G (и) и искомое «' нами найдено. Читатель легко сам может построить пример, показывающий, что не всякая подсистема коммутативного кольца с единицей являет- является таким кольцом. Что касается свойства 4.14 быть областью целостности (из х*у — 0 следует х = 0 или у = 0), то сразу не видно, сохраняется ли оно при гомоморфизме. Впоследствии мы построим ряд примеров, показывающих, что это не имеет места (что, конечно, не означает, что вообще никакой гомоморфный образ области целостности не может быть областью целостности). Сейчас мы составим классификацию всех отношений конгруент- ности (и, следовательно, всех гомоморфных образов) на множестве целых чисел. Отношение конгруентности по модулю целого числа 4.56. Определение. Пусть х, у, т ? I. Полагаем х =т у, если т | (х — у). Вместо х =т у будем также писать х = у (mod m) (читается «х конгруентно у по модулю т») *). 4.57. Теорема, (i) Для любого т 6 I, ==т есть отношение конгруентности для (I, —|—, -, 0, 1). (и) s=m совпадает с отношением =(-т). (ш) Для т = 0 отношение =т есть просто отношение ра- равенства; для т — 1 это — универсальное отношение 1x1. (iv) Множество классов эквивалентности по отношению =т состоит ровно из т элементов [0]т, [1]т, . . ., [т — 1]т, где через [х]т обозначен класс эквивалентности, содержащий х. Доказательство теоремы предоставляется читателю. Множества [0],п, [1]т [т — 1]т часто называют также классами кон- конгруентности mod т. Например, для т = 3, [0]s ={..., -6, -3, 0, 3, 6, . . .}, . [1]3 = {. . ., -2, 1, 4, 7, . . .}, [2]3 ={..., -1, 2, 5, 8, . . .}. 4.58. Теорема. Отношения =т для т 6 I ¦— единственные отношения конгруентности на системе (I, +. *. 0, 1). Доказательство. Пусть = — любое отношение кон- конгруентности на I. Изучение этого отношения может быть сведено *) В теории чисел иногда говорят« сравнимо с у по модулю /л».— Прим. ред.
4.6. ОТНОШЕНИЯ КОНГРУЕНТНОСТИ В ОБЛАСТИ ЦЕЛЫХ ЧИСЕЛ J67 к изучению множества A) S = {u:u^0}, так как B) х = у тогда и только тогда, когда х — у ? S. S обладает следующими свойствами: C) Sel, S^0; D) если и 6 S и г б I, то иг 6 S; E) если и, v ? S, то и + и 6 S. Другими словами, S — непустое подмножество множества I, замк- замкнутое по отношению к линейным комбинациям. Свойства D), E) следуют непосредственно из предположения, что = — отношение конгруентности. По теореме 4.43 получаем F) или S = {0}, или S = {тг: г 6 1} для некоторого т>0. В первом случае х = у тогда и только тогда, когда х — у = 0, т. е. х = у; следовательно, = совпадает в этом случае с ==0- Во вто- втором случае х = у в том и только в том случае, когда х — у —• неко- некоторое целое число, делящееся на т; таким образом, = в этом слу- случае совпадает с =т. Можно заметить, что и, наоборот, любое множество S, удовле- удовлетворяющее условиям C) — E), порождает в силу B) некоторое отношение конгруентности. Построенное в A) по отношению конгруентности на коммута- коммутативном кольце множество S является примером идеала — понятия, которое в современной алгебре и теории чисел играет большую роль. В частности, теория идеалов позволяет упростить изучение гомо- гомоморфизмов произвольных коммутативных колец. Теоремы 4.57 и 4.58 содержат полную классификацию отноше- отношений конгруентности на множестве целых чисел. Обращаясь к гомо- гомоморфным образам, в случае т = 0 получаем, например, некоторую изоморфную систему, а в случае т = \ — систему, состоящую из единственного элемента ([0]!). 4.59. Определение. Пусть т ? Р. Обозначим через 1т совокупность классов конгруентности mod т, т. е. Im = {[0]m, [l]m, . . ., [т — l]m}- Обозначим далее через +т, -т операции на классах конгруентности modm, соответствующие +, •. Таким образом, @ Ыт +т [t/m\ = [х + у]т; (П) Ыт'т 1у]т = \Х'у]т.
168 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Будем также писать х + У (mod m) вместо [х -(- у]т и х-у (mod m) вместо [х-у]т. Для т = 4, например, имеем четыре класса конгруентности: [0]4, [1]4, [2]4, [3]4, которые мы также (как обычно это делается), хотя и с некоторой осторожностью, будем обозначать через 0, 1,2, 3. Тогда для операций + и • (mod 4) получаем таблицы: 4- 0 1 2 3 0 0 1 2 3 1 1 2 3 0 2 2 3 0 1 3 3 0 1 2 • 0 1 2 3 0 0 0 0 0 1 0 1 2 3 2 0 2 0 2 3 0 3 2 1 В точных обозначениях таблицы расшифровывались бы так: [2]4+4[3]4 = Ш4, [2]4-4[3]4= [2]4. Заметим, что в.последнем случае [2]4-4 [3]4 = [2]4*4 [1]4, но [3]4 Ф Ф [1]4, т.е. закон сокращения для умножения в этой системе не выполняется, следовательно, она не является областью целостности. 4.60. Теорема. Пусть m ? I, m>l. Тогда (Im, +т, -т, [0]т, [1]т)—коммутативное кольцо с единицей. Оно является областью целостности тогда и только тогда, когда т простое. Доказательство. Первое утверждение теоремы следует непосредственно из 4.55 и того факта, что t0]m ф [1]т (в противном случае выполнялось бы 1 == 0 (mod m), или, что то же самое, т\\). Доказываем вторую часть. Предположим, что т простое и что [х]т'т [у]т = [0]т, т. е. по 4.59 [х-у]т = [0]т, откуда х-у г= 0 (mod m). Тогда т\{х-у). Из 4.47 (Л) в этом случае или т | х, или т | у, откуда или х = == 0 (mod т), или у = 0 (mod т); следовательно, или [х]т = [0]т, или [у]т = [0]т. В одну сторону утверждение доказано. Пусть, наоборот, система является областью целостности. Если т не про- простое, тот = й-6, где 0 < а < т, 0 < Ъ < т D.41). Тогда [0]т = = \rn\m = [а]т -т \Ь]т, хотя Ыт Ф [0]т, \Ь]т Ф [0]т. Мы пришли к противоречию. Следовательно, т простое. Теорема полностью доказана. В действительности, для простого т системы \т обладают и дру- другими интересными свойствами; мы рассмотрим их в следующей главе. Приложения к задаче Диофанта. Мы хотим закончить эту главу решением одной проблемы из элементарной теории чисел — про- проблемы, в решении которой существенно используется теорема о раз- разложении на простые множители и, в меньшей степени, отношения конгруентности.
4.6. ОТНОШЕНИЯ КОНГРУЕНТНОСТИ В ОБЛАСТИ ЦЕЛЫХ ЧИСЕЛ 169 Класс задач, о котором будет идти речь, впервые систематически изучался греческим математиком Диофантом. Для х 6 I утверждение «х = 0 (mod 2) или х = 1 (mod 2)»— то же самое, что «х или четно, или нечетно». В первом случае х = 2k для некоторого k ? I, во втором х = 2k -\- 1. Рассмотрим BkJ = 4fc2 и Bk + IJ = 4/г2 + 4fe 4- 1 = 4k {k + 1) + 1. Так как или k, или k + 1 четно, то k (k + 1) всегда четно. Следова- Следовательно, B& + IJ == 1 (mod 8). С другой стороны, BkJ = 0 (mod 8) или 2k% == 4 (mod 8) соответственно при четном или нечетном k, а следовательно, и k2. Таким образом, в любом случае х2 = О, 1 или 4 (mod 8) вне зависимости от того, каково х. Это позволяет нам высказать некоторые соображения относительно возможных значений х2 + у2. Например, х2 + у2 (mod 8) не может быть рав- равным 3, 6 или 7. Нетрудно убедиться в существовании прямоугольного треуголь- треугольника с катетами длиной 3 и 4 и гипотенузой длиной 5, а также с кате- катетами 5, 12 и гипотенузой 13. Для этого мы используем теорему Пифагора, утверждающую, что прямоугольный треугольник с кате- катетами х, у и гипотенузой г существует тогда и только тогда, когда х2 + У2 = г2. Конечно, не для всяких х, у 6 Р мы можем найти z 6 Р, удовлетворяющее этому условию. Естествен вопрос: суще- существует ли простой систематический метод отыскания всех х, у, г 6 Р таких, что х2 -\- у2 = г2. Можно, конечно, записать все тройки (х, у, z) элементов из Р (здесь достаточно ограничиться теми эле- элементами, для которых х < г, у < z) в определенном порядке, скажем, A, 1, 2), A, 1, 3), A, 2, 3), B, 1, 3), A, 1, 4), A, 2, 4>, A, 3, 4), . . ., и пробовать их одну за другой. Но, конечно, этот метод неприемлем с многих точек зрения. Приведенный ниже ана- анализ в этом отношении более удовлетворителен. Будем называть решением тройку {х, у, г), для которой х, у, z 6 6 Р и х2 + У2 = z2. Рассмотрим любое такое решение. Пусть d = = (х, у) и х = xxd, у = у id. Тогда (хи г/4) = 1; действительно, если существует простое р с р \ хи р \ уи то pd \ x, pd \ у, что противоречит выбору d, d = (х, у). Из х2 + у2 = z2 следует, что d2 | z2, и потому d | г (ср. упражнение 9 к п. 4.5). Положим z — Zid. Тогда х2 -\- t/ — 72 Будем называть тройку (х, у, г), х, у, z ? Р, примитивным решением, если х% + У2 = z2 и (х, у) = 1. Согласно предыдущему, каждому решению {х, у, z) отвечает некоторое примитивное решение, именно (хи уи zt), и такое число d, что (х, у, z) = — (Xid, ytd, Zid) (наоборот, если (х\, yit Zi)—примитивное решение, то {Xid, у id, Zid) — решение для любого d).
170 ГЛ. 4. ЦЕЛЫЕ ЧИСЛА И ОБЛАСТИ ЦЕЛОСТНОСТИ Пусть теперь {х, у, г) — примитивное решение. Легко пока- показать, что (х, z) = 1 и (у, г) = 1. Так как (х, у) = 1, то х и у не могут быть четными или нечетными одновременно. Действительно, если оба они нечетные, то х2 = 1 (mod 8) и у2 = 1 (mod 8), откуда г2 = 2 (mod 8), чего, как мы видели, не может быть ни для какого z. По соображениям симметрии нам достаточно ограничиться случаем, когда х четно, т. е. х = 2t, t ? Р, и у нечетно. Тогда из (х, z) = 1 следует, что z также нечетно. Перепишем наше равенство в виде х2=г2—у2=(г-\-у)(г— у). Поскольку и г, и у нечетны, то г -\- у и z — у четны. Следовательно, мы можем найти г, s б Р такие, что г + У = 2/", z — у — 2s, откуда следует, что г = г + s, г/ = г — s и, следова- следовательно, г > s. Далее мы видим, что (г, s) = 1, так как на (г, s) делятся г + s и г — s, а следовательно, г/ и г. Наконец, из \Р = = Br) Bs) заключаем, что /2 = rs. Предположим, что р простое и р \ г; тогда (р, s) = 1, откуда р \ t и тогда р2 | rs. Но (/?2, s) = 1, т. е. р2 \ г. Положив г = phu t = ptu получаем t\ = г^. Легко, индукцией по t, показать теперь, что из t2 = rs и (г, s) = 1 следует г = и2 и s = о2 для некоторых «, v 6 Р- Действительно, по индуктивному предположению, г\ = = u\, s = у2 для некоторых uu v и тогда г = (p«iJ и индукция завершена. Наконец, из (г, s) = 1 следует (u, v) = 1, а потому из ^2 = rs получаем ? = uv. Заметим, что невозможно г = s (mod 2), так как в этом случае у = 0 (mod 2) и г/ четно в противоположность нашему предположе- предположению. Другими словами, г и s не могут одновременно быть четными или нечетными, или, как это часто говорят, они имеют противо- противоположную четность. Далее, и2 четно или нечетно в зависимости от и, т. е. и2 == и (mod 2). Следовательно, невозможно и = = о (mod 2). Суммируем сказанное: D.6.9) если (х, у, г) — примитивное решение, х четно, а у не- нечетно, то существуют такие и, v 6 Р, что х = 2uv, у = и2 — о2, г = и2 + у2, м > у; при зтол (и, v) = 1 и и, v имеют противоположную четность. Обратно, из BuvJ + (и2 — v2J = {и2 + у2J видно, что любые и, v при м > о дают решение. Утверждение D.6.9) вместе с замечанием, сводящим произвольные решения к примитив- примитивным, дает нам простое и полное описание всех решений. Частным случаем пар (и, v), удовлетворяющих условиям D.6.9), являются B, 1), D, 1 >, C, 2), E, 2). Они соответствуют примитив- примитивным решениям D, 3, 5), (8, 15, 17 >, <12, 5, 13), B0, 21, 29).
4.6. ОТНОШЕНИЯ КОНГРУЕНТНОСТИ В ОБЛАСТИ ЦЕЛЫХ ЧИСЕЛ 171 Упражнения 1. Доказать теорему 4.57. 2. Существуют ли х, у, г 6 I, для которых х2 + у2 + г2 = 807? 3. Построить таблицы сложения и умножения для 12, Ь, Is. Ie- 4. Показать, что х& = х (mod р) для любого х ? I и любого простого /?. (Указание. Используйте индукцию.) Что можно сказать относительно хР-1 (mod р), хР~2 (mod р) (для (/? > 2)? (Связать с упражнением 3.) 5. Пусть а ? Р. Показать, что а = b (mod 9), когда Ь — сумма цифр в представлении а по основанию 10. (Ср. упражнение 12 к п. 4.5.) 6. Привести пример такой системы и ее подсистемы, что система является коммутативным кольцом с единицей, а подсистема нет. 7. Пусть (D, -J-, •, 0, 1) — любая область целостности. (а) Показать, что если п ? Р и пх = 0 хотя бы для одного х 6 D, х Ф- 0, то пу = 0 для всех у 6 D. (Указание. Рассмотреть я (*•#).) Область D называется областью характеристики со (иногда также областью характери- характеристики 0), если из пх = 0, п ? Р, следует х = 0. Если D не является областью характеристики со, то существует наименьшее положительное целое число п такое, что пх = 0 для некоторого х ? D, л: ^= 0. В этом случае говорят, что D имеет характеристику п. (б) Показать, что если характеристика D отлична от со, то она есть про- простое число. Понятие характеристики может быть использовано для обобщения теоремы 4.23 на случай неупорядоченных систем. Полагая I = {п\; п 6 I}, как в 4.23, видим, что 0, 1 6 I и I замкнуто относительно +, •• Можно пока- показать, что (в) если D — область характеристики р (простой), то подсистема I (с операциями из D, ограниченными на I) изоморфна области \р целых чисел mod p. 8. Показать, что если х, у, г 6 Р и х4 + у4 = г2, то существуют xit yu zi ? ? Р, для которых Zi < г и х\ + у{ = г2. Показа й ствуют х, у, г 6 Р, для которых х4 + у4 =
ГЛАВА 5 ПОЛИНОМЫ 5.1. Полиномиальные функции и полиномиальные формы Прерываем наше изучение различных числовых систем, чтобы ввести общее алгебраическое понятие полинома. Как мы увидим, в дальнейшем оно будет играть очень важную роль. Впечатляющий успех алгебры и арифметики в развитии математики достигнут в основном благодаря двум обстоятельствам. Во-первых, алгебра дает простой, компактный и абстрактный язык для формулировки различных математических проблем, позволяющий выявить мате- математическую сущность проблем, отбросив ненужные детали. В типич- типичном случае проблема принимает вид уравнения или нескольких уравнений от одной или нескольких переменных х, у, . . ., для которых мы ищем решения. Во-вторых, алгебра дает нам систе- систематический метод решений этих уравнений. Природа решений, естественно, колеблется в зависимости от того, имеем ли мы дело с целыми числами, рациональными числами, действительными числами и т. д. В настоящей главе мы сконцентрируем внимание на первом из этих аспектов алгебры и прежде всего постараемся придать точный смысл термину «алгебраическое уравнение». В целях достижения требуемой общности мы не будем делать никаких предположений относительно исследуемой системы, кроме одного: что она есть область целостности. Таким образом, в этой главе под (D, +, •, 0, 1) подразумевается произвольная область целостности. Оказывается, изучение структуры алгебраических выражений, в частности полиномов, даже при таких общих предположениях приносит суще- существенные результаты. В последующих главах для каждой конкрет- конкретной системы выясняется, что еще можно сказать о полиномах и полиномиальных уравнениях. Более того, сама разработка новых систем обычно тесно связана с теорией уравнений. Именно, если в нашей системе не всегда разрешимо уравнение некоторого вида (а мы хотим, чтобы оно было разрешимо), то ищем расширение системы, обладающее нужным свойством. Простейшее алгебраическое выражение в системе D записывает- записывается с помощью символов операций +> •, одного или нескольких символов, обозначающих постоянные, и одного символа, х, обозна- обозначающего «переменную». Используя ассоциативность, коммутатив- коммутативность, дистрибутивность операций + и •, выражение, вероятно,
5.1. ПОЛИНОМИАЛЬНЫЕ ФУНКЦИИ И ПОЛИНОМИАЛЬНЫЕ ФОРМЫ 173 можно существенно упростить, приведя его к виду, скажем, 2 + (—5)«х + 3«х2. Надеяться, однако, что нам удастся — без обращения к чисто логическому описанию языка — придать стро- строгий смысл выражениям «постоянная» и т. д. и описать произвольные алгебраические выражения, не приходится. Единственный выход для нас состоит в попытке выделить класс выражений, допускающих простое и строгое определение, который был бы вместе с тем доста- достаточно широк. 5.1. Определение. Под полиномиальной функцией (от одной переменной) степени п (п ;> 0) с коэф- коэффициентами в D мы понимаем функцию f такую, что @ 3> (/) = D; (п) для некоторой последовательности (а0, аи . . ., ап) эле- элементов D, где ап Ф 0 при я > 0, и для любого х ? D {а0, ait . . ., ап) называется последовательностью коэффициентов функции f. Это определение страдает тем недостатком, что полиномиальная функция определяет свои коэффициенты, вообще говоря, неодно- неоднозначно. Например, на 13 функции f (х) = хг — х и g (х) = [0] совпадают для всех х ? 13,что легко проверяется подстановкой всех трех возможных величин для х. Поэтому последовательности коэф- коэффициентов <[0]) и <[0], [—1], [0], [1]) определяют одну и ту же функцию. Можно даже показать, что так дело обстоит в любой конечной области целостности. Удобно с этой точки зрения вместо полиномиальных функций на области D рассматривать некоторые объекты, формально обладающие теми же свойствами, но не обла- обладающие этим недостатком. Мы имеем в виду использование символи- п ческого объекта ? и объектов Л а?г, где « > 0 и й„ ^ 0, которые будем называть полиномиальными формами (от ?). Наложим на п аг|г следующие требования: E.1.1) если > а?г — ? Ь&1, то т = п и at^bi для всех i. г—О г=0 В частности, отсюда следует п E.1.2) если 2_. ^гЕг = О, то аг = 0 для всех i.
174 ГЛ. 5. ПОЛИНОМЫ Действительно, обозначим через k наибольшее такое i, что ai Ф 0. Если k = 0, то, считая, как обычно, ?° = 1, получаем ао«1 =0 и а0 = 0. Если & > 0, то противоречие получим, применяя E.1.1), в котором полагаем п = k, т = 0 и Ьо = 0. Обратно, из утвержде- утверждения E.1.2) следует E.1.1). Действительно, если, например, л !> т, то, положив bt =0 при т <с i ^ п (если потребуется), из V" а^1 = = \ Ь;?г получаем ^(#г— &0 ?г = 0, т.е. at = bi по E.1.2). Конечно, все эти рассуждения неявно предполагают, что над фор- формами действуют операции +. •> получающиеся распространением операций +, •, определенных в области D, т. е. на формах нулевой степени, и что эта система форм сама есть область целостности. Приведем теперь строгое определение. 5.2. Определение. Предположим, что (Е, +> •> 0, 1) — область целостности и % ? Е. Е называется простым рас- расширением D с помощью %, символически Е = D [?], если выполняются следующие условия: @ D образует подобласть Е; (и) для каждого ц? Е существуют такие элементы а0, at, ... • • •, ап g D, что т] = Е называется простым трансцендентным расшире- расширением D с помощью |, если, дополнительно, (ш) 5ля любых а0, ..., ап g D из \ а^1 = 0 следует at=0 для всех 0<! (Причина использования термина «трансцендентный» будет объяснена в главе 7.) Существование и единственность простых трансцендентных расширений. Наша цель — соответствующее использование поли- полиномиальных форм — будет достигнута, если мы докажем, что любая область целостности D имеет по меньшей мере одно простое транс- трансцендентное расширение и что, с точностью до изоморфизма, такое расширение единственно. Прежде чем перейти к доказательству, изу- изучим некоторые общие свойства произвольных простых расширений. Введем, для свободы оперирования с формами, ещеодно определение. 5.3. Определение. Пусть Е = D [|] — простое расшире- расширение D. Бесконечную последовательность (а0, ..., ait . ..) элемен- элементов из D назовем псевдобесконечной, если существует такое п^>0, что at = 0 для всех i>n. Для этой последователь- последовательности, по определению, полагаем | ;
5.1. ПОЛИНОМИАЛЬНЫЕ ФУНКЦИИ И ПОЛИНОМИАЛЬНЫЕ ФОРМЫ 175 Легко видеть, что определение элемента Л aff не зависит ог выбора п, так как а* = 0 для всех i > п. 5.4. Лемма. Предположим, что E = D [|] — простое расшире- расширение D- Предположим также, что (а0, ..., а{, ...) и (Ьо, ..., bt,...) — две псевдобесконечные последовательности элементов из D* Тогда найдутся такие псевдобесконечные последовательности (с0, ..., Ci . . .), (d0, ..., di, ...) элементов из О, для которых со оо оо (i) \\ atl1 + 21Ь^1 = ^с^*' причем a^at + bi для всех i, и (") B,a&)• 12Jili= IddtVinpmeMdi = _ i--0 i=(J i=0 3=0 Доказательство, (i) Пусть k, l таковы, что а; = 0 для i>k, bt = O для i>l и n — наибольшее из /г и /. Тогда п i=0 bjg') no 3.45 (i) 71 Доказательство (ii) предоставляется читателю в качестве упражнения. Иногда также удобно записывать di в виде di= 2 o,jbh. Если читатель напишет соответствующие законы для суммы и произведения элементов > Огб . ?&& > то сам увидит преимущества этой записи. Однако в конкретных вычислениях обычно удобнее стан- стандартная запись. Например, E.1.3) где, в частности, E.1.4)
176 ГЛ# 5. ПОЛИНОМЫ Действительно, продолжим конечные последовательности {а0, ...,ап), (bo,...,bm) до псевдобесконечных последователь- последовательностей, полагая щ = 0 для i>n, bt = Q для i>т. Тогда из t i>n-\-m следует dt = \аг&,-_; = 0, так как если 0<[/.<t, то или п</, или m<i — j, откуда в любом случае a>b;_7- = 0. С другой стороны, j-=0 поскольку если 0<!/<«, то m<in-\-m — /, откуда fen+m_; = 0, тогда как при n<Cj^.n-\-m мы имеем о/ = 0. 5.5. Лемма. Предположим, что E = D[?] — простое транс- трансцендентное расширение D. Предположим также, что (а0,... ..., at, ...), (b0, ..., bt, ...)—dee псевдобесконечные последова- последовательности элементов из D. Тогда ОО ОО V* а^1 ="- \\ b&>% тогда и только тогда, когда at = bt для всех i. Доказательство. Если две суммы равны, то f|l = 0. Применяя 5.4 (П) к этому случаю, мы имеем ОО (—1) \btll= У](""^<Iг- Тогда из 5.4 (i) следует, что (at— bi)ll = 0. Но, далее, существует такое п, что at = bi = O, п и потому flj = bt для всех i > п. Тогда > (аг- — Ьг) 1г = = 0 и, в силу нашего определения 5.3 трансцен- дентного расширения, также (аг^&г) = 0 для всех /<>. Отсюда a,- = bt для всех i. 5.6. Теорема. Предположим, что Е = D \%\, Е' = D [|'1 — два простых трансцендентных расширения множества D. Тогда Е = Е', причем изоморфное отображение F можно выбрать так, чтобы F (а) = а для каждого аб D и F (?) = ?'.
5.1. ПОЛИНОМИАЛЬНЫЕ ФУНКЦИИ И ПОЛИНОМИАЛЬНЫЕ ФОРМЫ 177 Доказательство. Обе области целостности (Е, +, •, О, 1) и (Е\ ® , ® , 0, 1) содержат D и имеют операции, согласо- согласованные с операциями в D в применении к элементам D- Конечно, на других элементах, вообще говоря, они не согласованы, и мы будем писать ?Гдля сумм в Е'. Для каждого г| 6 Е можно найти такую псевдобесконечную последовательность (а0, . . ., at, . . .) элемен- элементов из D, что A) т]= Я? Согласно лемме 5.5, г\ однозначно определяет последовательность элементов а;. Определим F как B) F(r\) = i=0 Тогда, очевидно, C) 3) (F) = Е, Л (F) = Е' и F взаимно однозначна (последнее следует из 5.5). Покажем теперь, что F — гомоморфизм относительно операций в Е. Пусть т], ??Е, ц= / д<зг-| bj|*. Тогда г=0 D) FD\ + t) = F поскольку правила 5.4 (i), (ii) для вычислений+, • на беско- бесконечных суммах выполняются в Е так же, как для ©, ® в Е'. Например, в первом случае мы имеем где Ci = at + bi. Таким образом, F(r\ + ?.) = ^сг(|')г, где сг = = ai©bi, щ, 6i€D, и, наконец, i=0 i=0 Аналогично доказывается и гомоморфизм F относительно опера- ции •. Если а?В, то а= 2 а'?> гДе а-о~а, at = Q для г>0, i=0
178 гл- 5- полиномы откуда E) F(a) = a; в частности, F) F@) = 0, ОО Наконец, |= Л.а^г> гДе ai=li а* —О для i^l, откуда G) F (?) = Г- Теорема доказана. Как легко видеть, любой изоморфизм F, удовле- удовлетворяющий E) и G), на деле однозначно определен этими условиями: F (ц) для всех ц 6 Е можно найти по B). Чтобы простые трансцендентные расширения играли ту же роль, что и полиномиальные выражения, мы, в силу единственности этих расширений с точностью до изоморфизма, нуждаемся лишь в доказа- доказательстве теоремы существования. Из 5.5 мы находим ответ на вопрос, каковы будут элементы такого расширения: это обычные псевдобеско- псевдобесконечные последовательности(а0, ...,аг-, ...),{Ь0, ..., bt, ...)такие, что если (а0, . . ., аи . . .)={Ь0, ..., Ьи . . . >, то аг-=Ьг- для всех i. Определение суммы и произведения двух таких последовательно- последовательностей дается в 5.4 (i) и в 5.4 (и). Наконец, мы можем отождествить каждое а 6 D с последовательностью (а, 0, 0, . . ., О, . . .) и | с последовательностью @, 1, 0, . . ., О, . . .). 5.7. Теорема. Для каждой области целостности D суще- существует простое трансцендентное расширение Е = D [|]. Доказательство. Сначала мы построим область цело- целостности (Е, +, •, 0, 1), которая является простым трансцендентным расширением некоторой области целостности D, изоморфной D. Пусть A) Е — множество всех псевдобесконечных последовательно- последовательностей элементов из D. Превратим теперь Е в область целостности, полагая для любых (а0, . . ., а%, . . .), (Ьо Ьг, . . .) 6 Ё B) (а0, ...,ah ...)~+фй, ..., Ъи ...) = (с0, ..., си •••), где ct = ai + bt для всех i; C) (по, ..., at, ...)m(b0, ...,bt, ...} = (d0, ...,dt, ...), где i dt = V* ajbi.j для каждого i.
5.1. ПОЛИНОМИАЛЬНЫЕ ФУНКЦИИ И ПОЛИНОМИАЛЬНЫЕ ФОРМЫ 179 То, что Е замкнуто относительно +. очевидно, а то, что оно замкну- замкнуто относительно •, легко проверяется из тех же соображений, что и E.1.3). Определим функцию F (которая будет изоморфно отобра- отображать D в Е) следующим образом: D) F (а) = {а, О, 0, . . ., О, . . . > для каждого а 6 D; положим также а = F (a), D = Я (F). В частности, тем самым заданы 0 и 1. Наконец, мы полагаем E) 1 = <0, 1, 0, ..., О, ...). Покажем, что F) (Е, +, •, б, Т) — область целостности. Основные законы 4.1 (i), (ii), (iv), (vi) и первая половина (iii) для коммутативного кольца с единицей проверяются легко. Рассмо- Рассмотрим остающиеся условия: ассоциативный закон для • и (левый) дистрибутивный закон для • относительно +• Для любых (а0, . . ., at, ...),_ ф0, ¦ ¦ ., bt, . ._L>, (c0 cit . . .) 6 Е. (а0, . . ., at, . . .)»(F0> • • •> bi, . . . >»<с0, . . ., си . . .)) есть последовательность, k-й член которой представляет собой k k-i и соответственно k-и член ((а0, ..., аг, ...) • ф0, ..., bt, ...})• • (с0) ...,ct, ...) есть k S I Л atbg-t) ck-s- Рассмотрим любое k. Элементы первой суммы, дающей k-й член, таким образом, имеют вид aibjCk~i-j, где (i, j) — пара, для которой i <; k, j <; k — i. Члены второй суммы имеют вид atbs-tCh-s, где (s, t) — пара, для которой s ^ k, t ^. s. Имеется очевидное взаимно однозначное соответствие между парами (i, /} и (s, t), по которому aibjCk-i~j = atbs-tck-s: возьмем t = i и s = i + / для данной (i, j), или, что эквивалентно, i = t и / = s — t для данных (s, t). Следовательно, обе последовательности имеют одинаковые k-e члены для любого k. Если воспользоваться упоминавшимися в замечании к лемме 5.4 обозначениями, то k-e члены последовательностей запишутся так: Oil (bi2cis)
180 ГЛ. 5. ПОЛИНОМЫ и так что их равенство становится просто очевидным, Доказать дистрибутивный закон предоставляем самому читателю. Чтобы завершить доказательство утверждения F), осталось показать, используя 4.15, что если(а0, ..., at, .. .)=?0 и ф0, . .., bt, ¦. .)Ф0, то и их произведение (d0, ...,di, ...)ф0. Пусть п — наиболь- наибольшее i такое, что аг=^=0, и т — наибольшее i такое, что &,^0. Но, как мы заметили в E.1.4), из 5.4 следует dn+m = anbm, т. е. йп+тф0. F) доказано. Чтобы показать, что E = D[5L мы сначала посмотрим, как выглядят степени ? и формальные полиномы от 1. Как и в любой области целостности, (!)° = Т. G) (I)' = (е„, . .., еи • • •), где г,= \ и е, = 0 для всех i =?/. Используя C) и E), утверждение G) легко доказать индукцией по /. Далее, (8) если a CD, то а» <60, ..., Ьи .. .) = (ab0, ..., abu ...), что следует из C) и D). Наконец, легко видеть (индукцией по п, используя G), (8) и B)), что (9) если (а0, ...,щ, . ..>?Е и аг = 0 для i>n, то Из (9) непосредственно следует A0) если а0, ..., an?D и то at = 0 для всех i ^ п. Действительно, продолжим (а0, . . ., ап) до бесконечной после- последовательности (я0. • • •. ciu ¦•¦)-, удовлетворяющей предположе- предположению (9). Тогда единственным случаем, при котором мы имеем (а0 аи . . •) = @, . . ., 0, . . . >, является а; — 0 для всех i. Таким образом, мы видим, что A1) Ё — простое трансцендентное расширение D.
5.1. ПОЛИНОМИАЛЬНЫЕ ФУНКЦИИ И ПОЛИНОМИАЛЬНЫЕ ФОРМЫ 181 Наконец, мы утверждаем, что A2) F устанавливает изоморфизм между (D, +,»,0, 1) и (D,+, •, О, Т). То, что F взаимно однозначна, очевидно. Остающаяся часть доказа- доказательства A2) основывается на A3) если a, &?D, то а + Ь = а + Ъ, которое следует непосредственно из B) и (8). Чтобы закончить доказательство теоремы, т. е. найти простое трансцендентное расширение Е = D [?] области целостности D, нам нужно лишь применить общий результат B.4.9) примерно так, как мы это делали в конце доказательства 4.22. Теоремы 5.6 и 5.7 утверждают, таким образом, существование и единственность (с точностью до изоморфизма) простого трансцен- трансцендентного расширения D [?] любой области целостности D. Для целей алгебры безразлично, какое из таких расширений выбрать. 5.8. Соглашение. В остающейся части этой книги мы полагаем, что (DI5L +, •> 0, 1) — некоторое простое трансцен- трансцендентное расширение области целостности (D, +, •, 0, 1). Элементы D [?] будут называться полиномиальными формами, или просто полиномами над D. В дальнейшем нам часто придется сравнивать поведение одного и того же полинома в различных областях целостности. Скажем, если D — подобласть области целостности Е, то полиномы над D можно одновременно рассматривать как полиномы над всей Е. п Действительно, множество всех тех форм Л а&1 простого транс- трансцендентного расширения Е Ш области Е, у которых а0, . . ., ап ? 6 D, образует, конечно, простое трансцендентное расширение обла- области D и потому изоморфно D [?]. Для простоты, в силу произвола в выборе |, вытекающего из единственности расширения, мы будем всегда считать в таких случаях, что в D и Е выбрано одинаковое ?, т. е. D 111 = D l%] вместо D ЦГе* D [?]. Вернемся теперь к изучению связи полиномиальных форм и поли- полиномиальных функций. 5.9. Определение. Пусть D —подобласть^ области п целостности (Е, +, •, 0. 1) и пусть у аЦг — любой элемент из D[g].
182 гл. 5. полиномы п (i) Сопоставим с элементом /ail1 полиномиальную функ- п цию f, для которой 3(f) = E, положив f(x)= }агхг для всех (и) Если D [t,] с Е, то значение f (|) функции f на элементе % есть исходный полином /E)= (iii) Будем говорить, что х есть корень или нуль функ- функции f на D, если х ? D и f (х) = 0. В силу единственности записи 5.5 полиномиальных форм, функ- функция / определена корректно; правда, если желать наведения абсо- абсолютной строгости, нужно писать /Е вместо f, так как функция f, конечно, зависит от выбора области Е, содержащей D в качестве подобласти. Но мы будем рассматривать почти исключительно слу- случаи, когда различные такие Ei и Ег сами связаны отношением вклю- включения, а в таком случае (если, например, Ei — подобласть обла- области Ег) соответствующие функции /ei и /Ег на Ei совпадают, так что ситуация достаточно проста. Имея это в виду и употребляя, где это действительно необходимо, полные обозначения, в основном мы будем все же для полиномиальных функций употреблять обозна- обозначения f (I), g(l) и т. д. п Заметим, кроме того, что f A)^=0, где f(?)= V\z;|\ обозна- обозначает просто, что некоторое а(ф0 и что из /(|) = 0 следует f (х) — 0 независимо от того, какое Е рассматривалось. Конечно, никакой информации о наличии корней функции / в D неравен- неравенство / (|) Ф 0 не содержит. 5.10. Определение. Предположим, что f(l)^D[l\- (i) Мы говорим, что полином /(?) имеет степень л, и пишем deg(/(|)) = л, если или л = 0 и f(E) = a0, а0ф0, где или л>0 и f(l)= > atl\ где апф0. (ii) Если /(?)=/ ail1, где л>0 и апф0, то мы говорим, что (а0, аи ...,ап) — последовательность коэффициен- коэффициентов полинома /(|) и что ап — его старший коэффи- коэффициент. Мы говорим также, что /(I) — нормированный полином, если ап=\; f(|) называется постоянным поли-
5.1. ПОЛИНОМИАЛЬНЫЕ ФУНКЦИИ И ПОЛИНОМИАЛЬНЫЕ ФОРМЫ J83 номом, а определяемая им функция f— постоянной функ- функцией, если f(|)GD, т. е. deg(/(g)) = O. 5.11. Лемма. Предположим, что /(?),¦ g(l) ?D [g]. Тогда 0) deg(/(g) + ?(g))<max(deg(/(g)), deg (g (?))); (ii) если !A)фОи§A)Ф 0, mo deg (/ (g).? (g)) = deg (/ (g)) + + deg (g (g)). Доказательство предоставляется читателю. Понятно, почему в (i) утверждается только неравенство: напри- например, если / (?) = 1 +1 и g (g) = 1 -1, то / (g) + g (g) = 2. Ана- Аналогично, понятна существенность предположений в (ii). Делимость и корни полиномов. Мы будем особенно интересовать- интересоваться свойствами делимости полиномов. Прежде всего дадим само определение. 5.12. О п р е д е л е н и е. Для данных f(?), g (g) € D [g] мы говорим, что g (g) делит f (g) в D [g],— символически, g(l) \f (D— если f{l)=g (I) h (g) для некоторого h (g) 6 D [?]. Мы увидим, что отношение [ между элементами D [g] имеет поразительно много общих свойств с соответствующим отношением в I. Удобнее отложить детальное изучение делимости до следующей главы, когда мы введем понятие поля, характерной особенностью которого является тривиальность делимости. Сейчас же мы рассмо- рассмотрим только один частный случай, когда g (g) имеет специальный вид (—а) + g, или, что то же, g —а. 5.13. Теорем а. Предположим, что f [g] 6 D [g], f (g) ф О, и предположим, что а 6 D- Тогда (g — а) \ f (g) тогда и только тогда, когда f (а) = 0. Доказательство. Если / (g) = (g — a) h (g), то f (x) = = (х — a) h (х) для всех х 6 D. Отсюда / (а) = 0. Пусть, наоборот, п /(а)=0. Положим /(g)= \fitl1, Ьпф0. В силу /(я) = 0 имеем п>0 и п п г= п * (S4— а*) = J^6i (?' — а*) = \bt (E - а) (g-i + ag1-» + . .. + a* (последнее следует из 4.33). Используя общий дистрибутивный закон, мы можем вынести (g i— a) за знак суммы и получить желае- желаемый результат.
184 ГЛ. 5. ПОЛИНОМЫ 5.14. Теорема. Любой полином / (|) 6 D [?], / (I) ф 0, сте- степени п имеет самое большее п корней в D. Доказательство (индукцией по п). Если п = 0, то / (I) = а0, где а0 Ф 0. Таким образом, / (I) имеет 0 корней. Пред- Предположим, что теорема верна для п и что / (?) имеет степень п + 1. Если / E) не имеет корней в D, то все доказано. В противном случае пусть а 6 D, f (а) = 0. Тогда, по предыдущему, / Ц) = Ц — a) h (g) для подходящего h (?), которое, по 5.11 (и), имеет степень п. Так как / (х) = (х — a) h (х), то мы видим, что элемент b из D, b Ф а, является корнем / (?) тогда и только тогда, когда он является кор- корнем h (?). Применение индуктивного предположения к h (?) дает желаемый результат. 5.15. Следствие. Если D бесконечна и f (?), g E) € D [|], mo / (S) = g (I) тоаЗа и только тогда, когда f (x) = g (x) для всех х 6 D. Таким образом, если D бесконечна, то мы имеем взаимно одно- однозначное соответствие между формальными полиномами / (|) в D [?] и определяемыми ими полиномиальными функциями / с областью определения, точно совпадающей с D. Как мы уже замечали после определения 5.1, это не выполняется ни для какого конеч- конечного D- Формальные производные. Следующее определение «формальной производной» полиномов, согласованное с определением основной операции дифференциального исчисления, и соответствующая тео- теорема будут нам полезны в дальнейшей работе. Доказательства предоставляются читателю. 5.16. Определение. Для любого f(l)? D [%], /(?) = положим то f (|) называется формальной производной и запи- записывается иногда также (/ (|))'. Если deg (f (I)) = п > 0, то, очевидно, deg (/' (|)) = п — 1. Будем также писать (/' (?))' = / (|)<2\ ((/' (?))')' = / A)<3) и т. д. 5.17. Теорема. Если b ? D и f (?), g(?) € D rs1 ~" (i) (Ь/ (g))' = bf (I); (ii) (/ (?) + Я (?))' = /' (I) + ?' (S); (iii) (f (I) g (?))' = / (?) / (?) + /' (?) Я G); (iv) ((/ (g))")' = Л (/ (W)h-4' A)для k?P. [(f (?))'' иногда для краткости обозначают /(|)ft.]
5.2. ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 185 Упражнения 1. Доказать 5.4 (И). 2. Доказать, что левый_дистрибутивный закон для -)- относительно • выполняется для системы Е, определенной в 5.7. 3. Доказать лемму 5.11. 4. Пусть D — совокупность полиномиальных функций / с коэффициен- коэффициентами в D. Для любых /, g 6 D определим f -J- g как функцию /if с ht (x) = = f (х) + g (х) для всех х ? D и fg как функцию й2 с й2 М = f {x)*g (x) для всех х ? D. Для любого а ? D определим а как постоянную функцию f 6 D с f (х) = а для любого д: ? D. Определим, наконец, функцию F на D [?] следующим образом. Для каждой / (?) 6 D [|], F (/ (?)) есть полиноми- полиномиальная функция с областью определения D, сопоставляемая/ (?) по 5.9 (i). Доказать, что (а) D замкнута относительно -J-, ~%, и а ? D для каждого a f D; (б) F — гомоморфное отображение (D [|], +. •• 0, 1) на (D, +, •, 0, 1). (в) Если D бесконечно, то F — изоморфизм. Где здесь неявно используется часть (б) доказательства 5.13? 5. (а) Доказать теорему 5.17 (i) — (iv). (б) Что такое (/ {l)v)' для f (g) 6 1р [\] (р простое)? 6. Предположим, что (D, -J-, •, <;, 0, 1) — упорядоченная область цело- целостности (следовательно, бесконечная). Определим Pos как множество всех п таких / (|) ? D [|], что для п = deg (f (D) и f (%) — Л atll имеем 0 < ап. i=U Для / (|), g (|) g D (i) положим g (|) <;/ (|) тогда и только тогда, когда / (I) — g (I) 6 Pos. Доказать (а) Если deg (/ (|)) = deg (g (|)) = 0, / (|) = a, g (I) = *, то g (g) < <?/ (I) тогда и только тогда, когда b<^ а в D. (б) (D [|], +, •, <;, 0, 1) —упорядоченная область целостности. (в) Существует такое / (|) 6 D (I), что a<J f (|) для всех а ? D. 5.2. Полиномы от нескольких переменных Рассмотрим «общий» полином второй степени от переменных f Ни i2) = cto + aili + CL2Z2 + а3Ц + a?il2 + аьЦ, где g0, Щ, ¦ ¦ •. а& 6 D. Может показаться на первый взгляд, что это —совсем новое понятие. Однако, переписав его в виде / (Si, Ы = («о + fliSi + asSJ) + (a2 + Cig.) g2 + а- -Л\, легко убедиться, что / (g1; |2) допускает определение в уже изве- известных терминах как полином g0 (g4) + ?1 (Si) ?2 + Яг (Si) l\ от переменной |2 с коэффициентами из D ISJ, т. е. как элемент системы (D [?J) [Ы- Симметричным образом, / (gt, |2) можно понимать и как элемент системы (D ШгО HJ- Эквивалентность таких двух подходов устанавливается следующей общей теоремой. 5.18. Теорема. Предположим, что D [SJ — простое транс- трансцендентное расширение D с помощью |t и что (D [|J) [S2] —
186 гл. 5. полиномы простое трансцендентное расширение D ГЫ с помощью |2. Тогда 0) (D Ы Ы = (D [?2]) IU; (ii) D [|г1 — простое трансцендентное расширение D с помощью %z u (D [|2]) [?il — простое трансцендентное расширение D [|г1 С ПОМОЩЬЮ ?i. Доказательство. Предположим, что нам задан некоторый элемент из (D[?2])[?il; обозначим его через /Ei, 52)- Тогда для некоторого и>0 и ^0(У, •••, ^n(E2)€D(?2) получим f(g1; y = п = 2Яг (?2) *ii- Мы можем выбрать /и достаточно большим для г=0 того, чтобы для каждого i = 0, ..., пмы имели а;,0, ..., а*, =0 m Здесь мы применяем коммутативность и обобщенные ассоциативный и дистрибутивный законы, что возможно, так как (D [^2]) [it! — область целостности. Последнее равенство показывает, что f (?i. У € (D [У) [У. Таким образом, (D Ы) Ы s(D [^1) [У • Так как трансцендентность ^, 5з здесь не использовалась, то мы можем установить и обратное включение аналогичным путем, ¦откуда и следует (i). Чтобы доказать (ii), предположим, что / Eи 5г) представлены так, как это сделано выше, и что / Ei, ?2) = 0. Мы хотим показать, что?г(?2) = 0 для всех t. Из представления f (Ii, h) = ^(^аг- ^0 ^ и трансцендентности g2 над D [^] сле- п дует, что каждый полином \ аг,;5* = О. Но тогда из трансцен- трансцендентности gj над D следует, что аг>^ = 0 для любых i, j. Отсюда т gi(E,2)= 7,Щ,зЦ = 0, что заканчивает доказательство. k-кратные трансцендентные расширения. Попытка обобщить понятие полинома на случай нескольких переменных приводит к следующему определению.
5.2. ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 187 5.19. Определение. Пусть D — подобласть области цело- целостности (Е, +, •, 0, 1) « пусть в области Е выделены элементы \и \г, ¦ ¦ •. 1ь- Зададим D [?ь . . ., Ы рекурсивными условиями: (i) если k = 0, то D [?i, . . ., Ы = D; (ii) D \Ъи . . ., Ы = (D Hi lk-i}) Цк] для любого k>0. D I5i, • . ., 5й1 будем называть ^-кратным транс- трансцендентным расширением области D (иначе говоря, для любого О < ? <I n, D [?ь . . ., Ы есть простое транс- трансцендентное расширение области D [Si, . . ., 5i-J с помощью ?г). Теорема 5.18 теперь легко обобщается следующим образом: 5.20. Теорема. Пусть, для k > 0, D [?i, . . ., \п] — k-крат- ное трансцендентное расширение области D и пусть Н — любая перевтановка из множества {1, . . ., k). Тогда (i) Dili, •.., ?fc] = D[!H(i). ¦••, 1н(й)]; (ii) D [|h(d> • • •. |я(л)] — k-кратное трансцендентное расши- расширение D- Доказательство легко получается из теоремы 5.18 последовательной перестановкой стоящих рядом индексов, т. е. транспозициями (упражнение 2 к п. 4.4). Конечно, изоморфные области имеют изоморфные трансцендент- трансцендентные расширения одинаковой кратности: 5.21. Теорема. Предположим, что D, D' — изоморфные области целостности, причем изоморфизм осуществляется функ- функцией G, 3 (G) = D, M (G) = D'. Предположим, далее, что D [?i, . . ., Is], D' [gi, . . ., Eh] — k-кратные трансцендентные расширения областей D, D' соответственно. Тогда D [?i Eft] = = D' [?j, . . ., 5hl, причем функцию F, осуществляющую изомор- изоморфизм, можно выбрать так, чтобы F(a)— G (а) для любого а 6 D и F E0 = |i для любого i. Доказательство осуществляется индукцией по k, при- причем индуктивный шаг проводится на основе чуть усиленной теоре- теоремы 5.6. (Нужно рассматривать расширения изоморфных областей вместо расширений одной области; доказательство 5.6 в этой новой формулировке остается полностью тем же.) Конечно, нет никакой необходимости доказывать существование ^-кратных трансцендентных расширений: оно прямо следует из определения и теоремы существования простого трансцендентного расширения. 5.22. Соглашение. В остающейся части этой книги под (D [?i, . . ., Eft]. +, •, 0, 1) понимаем некоторое фиксированное k-кратное трансцендентное расширение области целостности (D, +. •» 0, 1); элементы из D I5i, • • ¦, Is] называем полино-
188 гл. о. полиномы миальными формами, или просто полиномами от k «переменных» li, . . ., Ей над D. Чтобы объяснить (и обобщить) использование такой записи, как / (|1; |2) в 5.18, вводим следующее определение. 5.23. Определение. Предположим, что (Е, + , •, 0, 1) — область целостности, содержащая D в качестве подобласти. (i) Каждому элементу ц ? D [|ь . • • > \ы\ сопоставим k-арную функцию f с 3) (/) = {{хи . . ., xh): Xi, . . ., xh 6 Е} следующими рекурсивными условиями: (а) если k=\, то f определяется по 5.9 (i); (б) если k>\ и данный полином ц есть \ ?,•??, причем It € D [in ..., lh-i\ и каждый полином Z,t определяет (k— \)-арную функцию gi (для любого расширения Е области D), то, для любых xit ... ,,хь G Е, i=0 (ii) fi частности, если D [Hi, . . ., Ы s E, mo значение функ- функции f, сопоставляемой полиному r\, определено на %it . . ., |fe и f (%u ¦ ¦ ., Ъъ) = т). (iii) Говорят, что (х{, . . ., xh) является корнем полинома f (|ь . . ., lk) в D, если хи . . ., xh 6 D и f (xu . . ., xk) = 0. Рекурсивные условия (а), (б) действительно позволяют по каж- каждому полиному однозначно построить некоторую функцию. По нашему соглашению 5.22 мы имеем дело с фиксированным ^-кратным трансцендентным расширением D [\i, ¦ ¦., Ы области D. Если k — 1, то искомая функция определяется по 5.9, коррект- корректность которого уже была установлена. Если k> 1, то D [^ц •••, Zk] — простое трансцендентное расширение области D[ei- •••¦> Ift-iJ с помощью |й и каждый элемент т] g D [|ц .. ., |ь] представим п поэтому в виде т]= V?j?jU причем представление единственно в том смысле, что из т] = } ййч следует ?; = ы Для всех i^.min(n,m) и t,t — O = t,'i для всех j>min(«,/я). Использова- Использование же любого из таких представлений приводит к одной и той же функции. Как и в случае определения 5.9, для полной корректности надо, вообще говоря, указывать, по какому именно расширению Е обла- области D строилась функция, т. е. указывать область определения 3 (/) этой функции. Но, как и там, опасность возникновения недоразуме-
5.2. ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 189 ний мала. Зато возникает другая тонкость, и к ней надо отнестись серьезнее. Предположим, например, что полином т] = из D Ни . . ., Ы не зависит от %h, т. е. ц = ?0, ?0 € D [\и ¦ ¦ ¦ . . ., Eft-il. Полином Ti мы можем рассматривать и как полином от \и • • -, 1й, и как полином от ?ь . . ., |ft_j и построим, таким образом, две разные функции f, g: одну Парную, другую (k — 1)- арную. Отношение между этими функциями простое: / (*i xh-u xh) = g(xit . . ., xk-i) для любых а*!, . . ., xh-i, xh. Поэтому мы всегда будем, хотя бы неявно, указывать, с какими полиномами мы имеем дело, употреб- употребляя, например, обозначения / (ii, . . ., is), g Aь . . ., ift-i) и т. д., причем такая запись вовсе не означает, что, например, f зависит от всех своих переменных. Теорема 5.20 позволяет нам, в частности, рассматривать для любого / <; k полином f (|i, . . ., |h) как полином от |г: из D [Sj, . . ., I;,] = D [?ii ¦ ¦ •, |/-i, ?/+i, • • -i 5hi Id == = (D ilu . . ., li-u li+u ¦ • ., Ы) lid следует /(in • • •> ife) В силу трансцендентности расширения (D lii, . . ., ij-i, ij+i, • • • • • •> is!) [?d можно утверждать единственность такого представ- представления. Поэтому каждому полиному f и любому k ^ и можно одно- однозначно сопоставить число deg; (f) — степень полинома f, рассма- рассматриваемого как полином от |г. Например, полином / (It, Ы = 2 + 3gt - 51^2 + gj - 4^2 над областью I относительно ii имеет степень 2, а относительно |2 — степень 1. Поскольку каждый член полинома как суммы сам является полиномом, можно говорить о степенях каждого члена отдельно относительно каждой из переменных и о степени члена как сумме степеней этого члена относительно всех переменных. Так, в приведенном выше примере, члены — 5?4|2 и ^\ имеют одина- одинаковую степень 2, первый член — степень 0, второй — степень 1, последний — степень 3. Как правило, удобно, пользуясь коммута- коммутативностью, собрать вместе члены полинома одинаковой степени. Для общей формулировки возможности такого перестроения поли- полинома нам потребуется следующее удобное обозначение. Для любого
190 гл. 5. полиномы i^O, ? ? I, положим Si = {(/i, • • ., /ft): /i, • • ., /ft € ; 0</1, .. ., 0</fe; /, + ... +/ft = i 5.24. Теорема. Для любого полинома f (?1( . . ., gft) € D Hi, . . ., 5ft] существует такое п^О, что где Oj4 ift?D- Это представление единственно в том смысле, что из fy'i, ...,jh)?Si следует a^ зк = ьц jh при , n); щ ы~® nPu l>mi n>m и bj зь = ^ пРи i> n, m> n. Доказательство предоставляется читателю. Для краткости будем также писать .rti-i вместо В каком порядке происходит суммирование, в силу коммутатив- коммутативности, не важно. 5.25. Определение. Предположим, что f{\y, ...,%h)? (i) Будем говорить, что полином f имеет относительно b,i, ...,|ft степень п, и писать deg(/Ei, ...,5a)) = ", если либо f(%u •••.5ft)€D, и тогда м = 0, либо существует представление fdu ..-,W = У. где я>0 и щ н1^® хотя бы для одной (]\, ..., jh)?Sn. (И) Будем называть полиномом f однородным степени п, если он имеет степень п и У ..+ifc (iii) Будем называть линейным однородный полином сте- степени 1.
5,2. ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 19} Симметрические полиномы. Если Я— любая перестановка из {1, ..., k}, то, в силу теоремы 5.21, существует такой изомор- изоморфизм F между (идентичными между собой) ^-кратными трансцен- трансцендентными расширениями D [Si, ..-Ли] и D [Sh<i], ¦¦¦Лщъ,)] обла- области D, что F (а) = а и F (?г) = |н(г> для любого i {a ? D) • Для любого полинома f(li, .. ., Sa)€D[Si» ...,Ы получаем F(f(lu . ..,?ft)) = = f(lH(i), ...,gH(ft)). Например, если ЯA) = 2, ЯB) = 3, ЯC) = 1 и / (Si, 1г> ?з) — 2^1 — 3??!з + SiBs' то ^ (f (Si, g* Ы) = f (?a, g3. Si) = 2g2 - З^з + ?&¦ Очень интересный класс полиномов выделяется условием его инва- ривантности относительно изоморфизмов, т. е. условием для любой перестановки Я из {1, . . ., к}. Такие полиномы носят название симметрических. Так, симметрическими полиномами отно- относительно ?1( ?2» 1з являются, как легко проверить, полиномы Si + ?2 + 1з, S1S2 + Ыз + 1Лз, II + И + 1\ и Iig2?3- Заметим, что, рассматриваемые как полиномы относительно \и |2. \г, \^ они симметрическими, конечно, больше не являются — ведь они инвариантны только относительно тех изоморфизмов, порождаю- порождающихся перестановками Н из {1, . . ., 4}, у которых Я D) = 4. Симметрические полиномы тесно связаны с корнями полиномов от одной переменной. Усмотреть эту связь можно из следующих примеров. Пусть / (?) € D [?] — приведенный полином степени 3, корнями которого являются х1г хъ х3 6 D. Тогда / (|) = (Е, — х^ • • (Е — хг)- (I — х3) или, раскрывая скобки, / (I) = Е3 + fell2 + Ь2Е + 6з, r»ebj = —(xj + -«2 + -«з); Ь2 = JCiJc2 + хгх3 + XiX3; b3 = — {xix2x3). Аналогично, если f A) — полином степени 4 с корнями хи х2, х3, Xi, ТО f (I) = (I - *!)•(? - х2).{1 - х3).E - х4) = = I4 + Ь^3 + Ь2?2 + Ь3\ + bt> где h = -~(xi + х2 + х3 + х4), Т Х\Хь -\- Х%Х3 -\- Х^Х^ -f- Итак, предлагается следующее 5.26. Определение, (i) Полином f(lu ..., U) GD [Si, ••., Ы называется симметрическим полиномом от 1и ..., %kr
192 ГЛ. 5. ПОЛИНОМЫ если /(ii, ..., ?й) = /(?я<1>1 • • •> ?жй>) для любой перестановки Н из {1, ...,*}. (и) п-м элементарным симметрическим полино- м ом @ <«<&) от 1и ..., lh называется полиномом о0 (In ...,?&) = 1, еслип^О, uondi, . .., gft)= 2 g(lgB. ..?, l<2<<n^ Доказать симметричность полиномов а„, построенных в (и), проще всего можно, придав им вид, в котором не использовалось бы отношение порядка в множестве индексов. Обозначим для этого через Мп класс всех n-элементных (п ^ k) подмножеств множества A, . . ., k). Каждое такое X ? М„ однозначно определяется набо- набором {/j, ...,/„} = X, где 1 < /,< /2< . . . < /„<fe. Тогда E.2.1) 1(п хМп iex Пусть теперь Я — любая перестановка из {1, ...,&}; тем самым однозначно определена и перестановка Н элементов из Мп, если положить Н ({/4 ln}) = {Я (li), . . ., Я (/„)}. Конечно, если lit . . ., /„ попарно различны, то и Я (У, . . ., Я (/„) попарно раз- различны, и наоборот, и если в наборе 1[ 1'п все элементы попарно различны, то существует набор lt, . . ., ln такой, что {1[, . . ., 1'п}= = {Я AХ), . . ., Н (/„)} (это и есть отказ от порядка — ведь Я не обязательно сохраняет его). Тогда n (Ен A>? • • • > ?н (ft)) = ^ (П 1я п и-1(пь-) 6Н(Х) ГёМп ('?!' и поэтому an(lHw, ...,lH(k)) = an(lu . ..,lk). Итак, доказана 5.27. Теорема. Для любого 0 <; п <; fe, ст„ (|1? . . ., |ft) — однородный симметрический полином степени п от %it . . ., 1^. Сформулируем теперь точно указывавшуюся связь между сим- симметрическими полиномами и корнями полиномов от одной перемен- переменной, на этот раз для произвольной степени и любого числа пере- переменных. 5.28. Теорема. Для любых xit xz, . . ., хп ? D и любого k ^ п ^ 0 имеют место (i) (g — Xl)»(l — xz) •...•(% — хп) = (ii)
5.2. ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 193 Доказательство. Доказательство (i) оставляем читате- читателю; (и) следует непосредственно из определения. Действительно, слева стоит, очевидно, однородный симметрический полином от к переменных, справа такой же полином от k — 1 переменной. Если, например, рассматривать определение из E.2.1), то A) M?lt ...,&_„ 0)= где X ? М'п тогда и только тогда, когда X = {lh 1г, . . ., /п}, где 1 < /] < /2 <...</„<; k — 1, так как все остальные X 6 6 Mjj, для которых k ? X, дают слагаемое, равное 0. Но A), очевид- очевидно, эквивалентно (и). Можно дать и другое доказательство того же (ii). Рассмотрим (k -f- 1)-кратное трансцендентное расширение D [?, 1ь . . ., Ы и fe-кратное трансцендентное расширение D [|, Ii ifc-J- Считая пункт (i) этой теоремы доказанным, получим B) (| — У... (? — gfe-JG —?*) = ft-1 C) (g —6,) ¦•.(!-?*-!)=¦¦ Из B) следует а из C) й-i ¦-k-i )* a,- (glr . .., !,_,) Iй Из единственности представления полиномов в D [g, ?i, . . ., Ift-il как полиномов от % с коэффициентами в D [|i, . . ., ^-il мы полу- получаем искомый результат. (Заметьте, что здесь нет противоречия, так как ^h (ll, ¦ ¦ •> ?ft-l. ift) — Si • • • Eft-lEft дает aft (|1( . . ., lk-it 0) = 0.) Удивительным фактом является то, что каждый симметрический полином может быть представлен комбинацией элементарных
194 гл. 5. полиномы симметрических полиномов. Например, 55i + 5h + 5|3 +Ш+Ц+ Ц = = 5а± (?ь lz, is) + <*i (ii, ?2, isJ — 2a2 (it, i2> i3) = = g (Ot (ii, i2, is), ^2 (ii, ?2, is)), где g (ii, i2) = 5ii + I? — 2^2- Его можно также записать в виде полинома h (at (i4, i2, i3), a2 (ii, i2, i3), a3 (i1( ?2> Ы) от всех (нетривиальных) элементарных симметрических полиномов от ?ь i2, |3, где h (ij, i2, i3) == 5ii + ^ — 2g2 + 0g3. Справедливо и общее утверждение. Основная теорема о симметрических полиномах 5.29. Теорема. Для любого симметрического полинома f (ii, ?2, ¦ • •> Ы от ?i> • • •» Sft найдется такой полином g (Si, • • -, SO € D [Si, • . ., ift], что f (Ii ift) = g(Oi (ii, • • ., ift), • • •, ^ (ii, • •.. is))- Доказательство. Для простоты обозначений A) мы пишем ст; вместо аг (|ь . . ., |й). Заметим, что каждый полином а? — однородный полином степени /, так что для любого / (независимо от k) B) deg(a|)=/./ (следует из упражнения 2 (б) ниже). В терминах A) утверждение нашей теоремы принимает следующий вид: C) Если f (ii, . . ., ift) — симметрический полином от ii, . . ., ift и deg (/ (ij, . . ., ift)) = n, то можно найти такой полином g (?ь . . ., ift), что fill, ¦ ¦ ., 50 =<?(^Ь • • -, OTft). Проводим индукцию по k. Назовем ее первичной индукцией. Для k = 1 любой полином / (|i) симметричен относительно ii. Далее, Oi (ii) = i4 и поэтому достаточно положить g (i4) = / (ij. Предположим теперь, что C) выполняется для k — 1 и любого п, где k > 1 (это и есть предположение первичной индукции), и дока- докажем C) для k, причем доказательство снова будем вести индукцией, на этот раз по п; мы назовем ее вторичной индукцией. Для п = 0 будет f (ii, . . ., ift) € D, и мы снова можем взять g (i,, . . ., ife) = = / (ii, . . ., is). Предположим, что п>0 и что результат (из k — 1 следует k) верен для всех полиномов от \и . . ., ift степени <п; это предположение вторичной индукции. Рассмотрим симме- симметрический полином / (ii, . . ., in) степени и. Тогда, если мы положим D) /о (li gft-i) = / (ii, • . ., ift-i, 0),
5.2, ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 195 ТО E) /о (ii, . . ., ?ft-i) — симметрический полином от Si> ... . . ., ^_4 степени deg f0 (Si Sb-i) = п0 < и. Действительно, любая перестановка Яо из {1, . . ., k— 1} может быть продолжена до перестановки Н из {1, . . ., k), если поло- положить Н (k) = k. Отсюда, по предположению первичной индукции для k — 1, F) можно найти такой полином g0 (Si, . . ., Ss-i)> что /о (Si. • ¦ ¦, lh-i) = So (<*i (Si. • • •. Ss-i), • • •, ah-i Ни ¦ ¦ •. Sft-i))- По 5.28 (ii), cii (Zi, . . ., Efc-j) = cr, (|,, . . ., lh-u 0) для каждого / ^ k—1. Таким образом, G) если мы положим аг = аг(|1, ..., ?,,_,, 0), то Заметим, что /0 (?i> • • •» ?s-i) — первый коэффициент в пред- представлении f (Ii, . . ., is) как полинома от |й. Так как /0 (ii. • • • . . ., Eft-j) симметричен только относительно |i, . . ., lh-t, то мы не можем утверждать, что / (^ gfe) — f0 (llt . . ., gft—4) сим- симметричен относительно |j, . . ., \h. Однако представление G) позволяет нам рассмотреть следующую разность, тесно связанную с предыдущей. (8) Пусть fi (Ii, . . ., lk) = f (It, . . ., lh) — g0 (au ah-i). Тогда ft (?j, . . ., Eft) симметричен относительно ?i, .... ?д м deg (f4 fo, . . ., SO) < «• Симметричность fiEi, •••, is) очевидна, так как и f(?4, ..., gft) и fi^o (oi (En • • •, ife), • • •. сть-! (Si, • • •, Sft)) симметричны относи- относительно Si, •••, Is- Что касается степени, то тут достаточно пока- показать, что deg(?„(<*!, • • •, <Tft-i))<n0. Мы знаем, что go(lt, ..., |й.,) может быть записана как сумма членов вида bjlt..., jh_ Ц1.. .?*-~ь где bji,...,j^j^O- Тогда ^0(^i» •••> ^fc-i) является соответствую- соответствующей суммой членов bju.,.t j^ol1 •• .о^{. В соответствии с B), которое не зависит от k, общая степень каждого такого члена есть mlu...tih=j1 + 2]1+...+(k—l)]h-1, где по E) —G) mii,...jft<»o- Также go(°i» •••, aft-i) — соответствующая сумма членов
196 гл. 5. полиномы и общая степень таких членов остается равной т^ , . Отсюда deg(go@1, ..., Oh-i))*Cn0 (на самом деле, легко видеть, что степень равна п0). Далее, из D) —(8) следует теперь, что Ф) fi(h, .-., lk-и 0) = 0. Таким образом,если мы рассматриваем /i(?i, • •., ht) как элемент из (D [|4, .. ., tU-iI) [Ы, т- е- как полином от 1ъ с коэффициентами в D \Ъ,п ..., %k-i], то он имеет корень 0. Но тогда по 5.13 U | fi (gj, ...,ik) в D [%i, ..., Ы- Другими словами, A0) мы можем найти полином hh E, ..., 50 в D [5i> • • •, 5,'Л такой, что ^(fej- ¦••, lh) = lhhk(h, ¦¦-, Ik)- Теперь рассмотрим любую перестановку II в {1, ..., Щ с H(k) — = k—l. Тогда ¦••> hi) = f\ (Sffo, •••, huh)) = последний мы запишем как gft-i^* (Si. •••> hi)- Из (9) следует, что ftftdi, •••, 5л-1, 0) = 0, так чго по тем же соображениям, что и выше, |й|ЛП^1. •••. lh) в D[gi, ..., Ы- Таким образом, мы можем найти полином hh-i(li, ¦ ¦ -Ли) такой, что fi(li, . . ., In) = = |fc-i?fc/ifc-i(ii, • • •, 5ч). Повторением тех же соображений о пере- перестановках с H(k) = k—l, H(k — l)-= k — 2 мы можем найти Aft_2(g1, .. ., Ik) с Так как 0^A^ ..., 5ft) = 5il2 ••• 5fc> т0 мы в конечном итоге получаем A1) существует такой полином h (Ъи ...,bi)?D Ц±, . • •, Ы. что fj (II . .., %ъ) = стАЛ E1ч • • •, U), причем h (ilt .. . ..., %ь) — симметрический полином от gi- ..., |% ы de Вторая часть этого заключения видна из (8) и того, что deg@O = &. Мы должны также иметь симметричность потому, что для любой перестановки Н из {1, ..., k) Действительно, из симметричности f4 и закона сокращения в обла- области целостности получается h{lu ..., lh)=h{lHa), ..., По нашему предположению вторичной индукции теперь A2) существует такой полином gi Ei, • • .. hi)> h (h, ¦ ¦ ¦, lh) = ohgi (at, . . ., 00-
5.2. ПОЛИНОМЫ ОТ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ 197 На этом индуктивный шаг вторичной индукции заканчивается: из (8) следует A3) / (lit . . ., lk) = akgt (аи . . ., о,,) — g0 (oi, • • •, <*fc-i). и если рассматривать g0 (?j, . . ., ?&-]) как полином от |ь . . ., ?;;, т. е. то для полинома e(Ei, • •., Eft) = E*gi (ii. • ¦.. Ел) -to (Ei. • • -, Eft) получаем f (Elf . . ., |ft) = g (au . . ., ah), что и требовалось. Таким образом, C) выполняется для k и полиномов любой степени п. Переход от k— 1 к k в первичной индукции, а тем самым и теорема доказаны. Доказательство дает нам заодно систематический метод для представления любого данного симметрического полинома кйк полинома от элементарных симметрических полиномов. Однако вычисления здесь Еесьма трудоемки даже для сравнительно простых симметрических полиномов. Менее сложный метод, но пригодный лишь для полиномов специального вида, предлагается в упраж- упражнениях. В последующих главах мы увидим, какую большую роль играют теоремы 5.28 и 5.29 при изучении разрешимости алгебраических уравнений. Заметим, наконец, что можно было доказать и единственность фигурировавшего в теореме 5.29 полинома g (Еь . . ., ?;;). Но этот факт нам в дальнейшем не потребуется, и поэтому мы не стали его доказывать. Упражнения 1. Доказать теорему 5.24. 2. Доказать следующие обобщения теоремы 5.11 для произвольных полиномов КЛи .... ift), g(li Cft) € D [gi, ..., Ы: (а) deg (/ (g,, .... ?ft) + g(Ii. .... Sft))< max (deg (Hfii, •••- h)), deg(?(gi, ..., ih))); (б) если /(It, ..., h) ф 0 и g(li, ..., lk) --{= 0, то deg(/(gb ..., |ft) • 3. (а) Показать, что теорема 5.14 не обобщается на полиномы от несколь- нескольких переменных, приведя пример / (|ь |2) 6 I [5ь ?г] такой, что/ (Ii, ^г) ?= 0, но / (%i, 1г) имеет в I бесконечно много корней. (б) Покажите, что, несмотря на это, теорема 5.15 обобщается на поли- полиномы от нескольких переменных (даже хотя теорема 5.14 была необходимой для доказательства 5.15): если D бесконечно, / (?ь . . ., %и)'ё (li> ¦ • •> ih) € € D [gi lh] и / (xt, . . ., xk) = g (xi xk) для всех хи . . ., xk 6 € D, то / Fi h) = g (Si. • • -. У-
198 гл. 5. полиномы 4. Доказать теорему 5.28 (i). 5. Представить \\%2 + |?|3 + Ш4+ Щ3 + Щ,1 + 11ъ2в виде g fa, o2, a3) (как обычно, ai — Oidt, |2, |3)). 6. Пусть k, т — произвольные положительные целые числа и пусть ут = к = \ |j". Положим Yo = m- Показать, что где n = min(^, m) и о-;=стг (gj, ...,gft). Использовать это для представления з |j как полинома от элементарных симметрических полиномов от |i, \z, |з- 7. Проверьте, что (Si — Ы2 (Si — hJ (h — Ы2 = <Ф1 — ^1 — 4<J?(J3 — 27а§ +
ГЛАВА 6 РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ 6.1.: К расширению областей целостности Алгебраические мотивировки. Изучение операции деления при- приводит к необходимости расширения областей целостности двумя путями. Первый путь чисто алгебраический, второй, по существу, геометрический. Рассмотрим первый. Как мы уже видели в начале главы 4, наличие вычитания позволяет существенно упростить зада- задачу отыскания решений системы уравнений вида F.1.1) а±х + hy = си а2х + Ь2у = с2, где аи Ьи а2, Ь2, с1( с2 — элементы некоторой области целостности D- Действительно, умножая первое уравнение на Ь2, второе на bi и вычитая второе уравнение из первого, видим, что любое х 6 D, для которого существует такое у 6 D, что пара (х, у) удовлетворяет уравнениям F.1.1), должно само удовлетворять уравнению F.1.2) (aib2'—a2bi)x = cib2—-C2bl. Аналогичное условие можно найти и для у. Оба полученных урав- уравнения имеют вид F.1.3) Ьх = а. Что можно сказать о разрешимости такого уравнения? Прежде всего, если Ь = 0, то оно разрешимо тогда и только тогда, когда а = О, причем любое х 6 D является решением. Если же Ь Ф О, то, наоборот, мы можем лишь утверждать (на основе закона сокра- сокращения в областях целостности), что существует не более одного решения: из tof = а и Ьх2 = а, т. е. bxt = bx2, следует Xi = х2. Действительно, на примере области целых чисел мы видим сколько угодно случаев, когда решения вообще нет. Тем не менее было бы очень удобно (например, для записи решений и т. д.) при рассмотре- рассмотрении систем вида F.1.1) иметь область целостности К, содержащую D и такую, что F.1.4) для любых a, b 6 D, b Ф 0, существует такое л: 6 К, что Ьх = а. Другими словами, а делится на & в К. Естественно, мы хотим, чтобы такое К было минимальным в том смысле, что все его элементы
200 гл- 6- РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ возникают как результат деления некоторых элементов из D: F.1.5) для любого и 6 К существуют такие a, b 6 D, b ф 0, что Ьи = а. Конечно, для элементов самого D это условие выполняется: если и 6 D, то достаточно положить b = I, a — и. Убедимся теперь, что из свойств F.1.4) и F.1.5) следует также делимость любого элемента из К на элемент из К, отличный от 0. Действительно, если и, v 6 К и ифО, то по F.1.5) существуют такие ait a2, bu b2 6 D, что ЬХФ 0, Ь2Ф 0 и b^ = ait b2v = а2, причем из и Ф 0 следует также fii ф 0. С другой стороны, по F.1.4) для элементов b2ait Ь^2 найдет- найдется такое х ? К, что Ь^а^х = Ь^, т. е. b2btux = i>162t^ или, сокращая на Ь^ т^ 0, их = о. Итак, F.1.6) для любых и, и 6 К, « # 0, существует такое х 6 К, что «х = о. Одна из задач, стоящих перед нами в этой главе,— показать для любой области целостности D существование и единственность (с точностью до "изоморфизма) расширения К, удовлетворяющего условиям F.1.4) — F.1.5) или, что эквивалентно, F.1.5) — F.1.6). После того как эта задача будет решена, мы сможем говорить о част- частном от деления двух целых чисел -г (Ь Ф 0) как о результате деле- деления в любом таком расширении. Геометрические мотивировки. Геометрический подход к понятию делимости связан с применением вычислений для измерения прямо- прямолинейных отрезков. Выбрав некоторый фиксированный отрезок в качестве единицы измерения, мы сможем назвать любое целое положительное число п длиной отрезка, если этот отрезок можно разбить на п отрезков единичной длины. Конечно, приписать так определенную длину мы сможем лишь очень небольшому количе- количеству отрезков. Увеличить количество «измеримых» отрезков можно, укоротив единичный отрезок. Сделаем это таким образом, чтобы относительно нового единичного отрезка старый имел определенную длину, скажем, b, b 6 Р. Если теперь некоторый отрезок имеет дли- длину a, a g P, то и будем считать, что его длина относительно старой единицы есть -г . Из этого геометрического подхода легко извлечь чисто алгебраические следствия. Действительно, простейшие нагляд- наглядные соображения показывают, что для любых а, Ь, с, d ? Р F.1.7) (i) -|- = -~- тогда и только тогда, когда а—с; ,... а ас (и) —- = ——• v ' b be (iii) -!¦¦ c-a+c • b b ' (iv) -f-<-f- тогда и только тогда, когда а<с.
(iii) -r<-r тогда и только тогда, когда ad<ibc. 4 ' о d 6.1. К РАСШИРЕНИЮ ОБЛАСТЕЙ ЦЕЛОСТНОСТИ 201 Первое соотношение очевидно. Второе получается, если выбрать еще меньший единичный отрезок такой, что относительно него преж- прежний единичный отрезок имеет длину с. Третье условие выражает тот факт, что длина отрезка Р\Р% равна /t + h, если длины отрез- отрезков PiP2 и Р2Рз соответственно равны /j и /2 и Р2 лежит между Pi и Р3 ((iii) при этом рассматривается как определение операции + на длинах). Аналогично, последнее соотношение обосновывается введением отношения < между длинами: 1{ < 12 тогда и только тогда, когда на прямой существуют такие точки Pit P2, Р3, что Р2 лежит между Pi и Р3, а 1и /2 — соответственно длины отрезков PiP2 и PiP3- Из соотношений F.1.7) следуют также F.1.8) (i) — = — тогда и только тогда, когда ad = bc; (и) а .1, с - ad+bc ¦ (U) b + d ~ bd ' -r<-r о d Первое получается двукратным применением F.1.7) (ii) к равен- равенству] -2- = 2- и из F.1.7) (i). (ii) доказывается применением F.1.7) (ii)-(iii): а . с __ ad . be ^_ cd-\-bc Т + Т"~~Ы + Id"~ bd ' аналогично получаем (iii), применяя F.1.7) (i), (ii), (iv). Полагая в F.1.8) b = d = 1, непосредственно видим, что дроби вида -р образуют относительно введенных операции + и отношения < систему, изоморфную системе (Р, +, <) положительных чисел. Конечно, из F.1.8) можно вывести и другие свойства дробей, такие, как коммутативность, ассоциативность операции +> возможность сокращения. Соответствующее рассмотрение использования целых чисел для измерения площадей прямоугольников приводит к операции Главная идея состоит в выборе некоторого фиксированного квадра- квадрата в виде единицы измерения; тогда площадь прямоугольника со сторонами lt и 12 и будет обозначаться li»l2- Проводя детально все рассуждение, придем к системе (Ra4, +, •, <, 1), для которой F.1.10) (i) (Р,+, •, <, 1) — подсистема системы (Rab +, •, <, 1); (ii) для любых a, b 6 Р существует такое х 6 Ralr что Ых — а;
202 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ (ш) для любого х 6 Raj существуют такие а, Ь 6 Р, что Ь»х = а; (iv) любое утверждение, справедливое для множества положительных элементов произвольной упорядо- упорядоченной области целостности, справедливо и для Raj. Несколько уточним (iv). Rat будет удовлетворять законам коммутативности и ассоциативности для обеих операций •, +> левому дистрибутивному закону для • относительно -{- и, для всех х ? Ra^ x»l = х. Далее, будут выполняться без ограничений законы сокращения для + и •, а также свойства отношения <, соответ- соответствующие 4.15 (и) — (iv). Наконец, х < у будет иметь место в том и только в том случае, когда существует такое и 6 Rai, что х+ и = у. В точности так же, как по множеству Р положительных целых чисел была построена область целостности, содержащая Р в каче- качестве множества положительных элементов, по множеству Rat сможем построить область целостности Ra2, для которой Raj — множество положительных элементов. После этого мы сможем убе- убедиться, что получили систему, изоморфную системе рациональных чисел, т. е. убедиться в эквивалентности обоих подходов. В некото- некотором смысле, наоборот, мы увидим, что характеристические свой- свойства F.1.8) дробей прямо следуют из утверждения, что Ra — упо- упорядоченная область целостности, удовлетворяющая условию F.1.6). Исторически геометрический подход к истолкованию делимости и отношений предшествовал алгебраическому. Однако с принятой в этой книге точки зрения нам удобнее пользоваться последним. Более того, следуя алгебраическому подходу, мы избавляемся от необходимости делать дополнительные предположения геометриче- геометрического характера. Конечно, вслед за этим можно привести и всю соответствующую геометрическую картину, приходя к ней с по- помощью координатных систем (метод аналитической — в противо- противоположность синтетической — геометрии). Позже мы еще осветим этот вопрос подробнее. Тем не менее для мотивировки отдельных шагов мы будем обращаться и к геометрическим иллюстрациям, сохраняя в общем чисто алгебраический подход. Поля. Определим теперь более точно системы, которые собираем- собираемся строить. 6.1. Определение. Область целостности (К, +. •. 0, 1) называется полем, если для любых a, b 6 К, b Ф 0, существует такое х ? К, что Ь*х = а. Упорядоченная область целостности при том же условии называется упорядоченным полем. Поле К (соответственно упорядоченное поле) называется (упор я - доченным) подполем (упорядоченного) поля К', если К—под- К—подсистема системы К'.
6.1. К РАСШИРЕНИЮ ОБЛАСТЕЙ ЦЕЛОСТНОСТИ 203 Во всей оставшейся части этого раздела (К, +. •> 0, 1) — произвольное поле. Заметим, что единственность такого л; 6 К, что Ых = а, мы уже доказали. 6.2. Определение. Для любых a, b 6 К, b Ф 0, обозна- обозначаем через -г или а/b то единственное х, для которого а = Ь*х\ в частности, под Ь'1 понимаем -г ¦ Таким образом, функция F (а, Ь) = а/b является операцией с областью определения К X (К — {0}) и областью значений К, a G (Ь) = Ь~х является операцией с областью определения К •— {0} и областью значений К—{0}. Будем называть а/b отношением а к Ь, или частным от деления а на Ь, а Ь~х — обратным к Ь; последнее название употребляется потому, что характерным свойством Ь'1 является равенство Ь~*»Ь — 1. Легко видеть, что если L — такое множество, что 1 6 L, L ? К, для любых a, b ? L также а + b, a — b, a»b 6 1_ и, при Ь фО, а/Ь 6 L, то L образует подполе К по отношению к операциям в К. Более того, если К — упорядоченное поле, то L — автоматически также упорядоченное подполе. 6.3. Теорема. Для любых а, Ь, с, d, е ? К, если b Ф 0, d Ф 0 и е Ф 0, то (i) у = а*(Ь~1); (ii) тг=0 тогда и только тогда, когда а = 0; (ш) -г = -г тогда и только тогда, когда a»d = b*c; ,. . а а • е , . а , с а» d4-b »с ,, -. , ч (v) ~h^"K = ъ%й (аналогично для — вместо +); , .. а с а • с (viii) если а^=0, то [-г\ =— ; (ix) l-^l. Доказательство. Доказательства следуют непосредственно из 6.2. Чтобы установить (i), мы должны показать, что Ъ • (а • Ь) = = а; но это следует из Ъ • Ь'1 — 1. Часть (ii) — следствие основного свойства областей целостности. Для доказательства (iv) заметим прежде всего, что Ь»еф0. Если -|- =х, т. е. Ь»х = а, то
204 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ {Ъ»е)*х — а*е, так что также х = а»е/Ь»е. Из (i), (ii), (iv) и упрощенных вариантов (iii), (v), а именно (iii)' y = y тогда и только тогда, когда а = с; можно получить (iii), (v) тем же самым путем, которым мы выводили F.1.8) из F.1.7). Для доказательства (iii)' мы заметим из (ii), что Ъ~х Ф 0; отсюда, по закону сокращения, а»Ь~х = с*Ь~г в том и толь- только в том случае, когда а = с. С другой стороны, (v)' является частным случаем дистрибутивности: (а • Ь'г) + (с • Ь-1) = (а + с) • Ь~х. Доказательства остающихся утверждений элементарны. Определение 6.2 элемента Ь позволяет преобразовывать любое утверждение'об обратных элементах в утверждения о дробях. 6.3 (i) показывает, наоборот, как заменять дроби в утверждениях на обратные элементы. Различные знакомые свойства обратных элементов и дробей легко получаются из 6.3 с помощью этих прин- принципов. Например, Ь~х ф 0, если b Ф 0. Далее, 1 Ь«1-1 *»14 Также, если сфО, то (a/b)/(c/d) = (a/b) • {c/dyx = (a/b) • (d/c) = a^~ ¦ 6.4. Определение. Зададим х~т для *€К, х Ф Q и т ^Р формулой x~m = (лг1)'". 6.5. Теорема. Предположим, что х, у 6 К, х ф 0, ц Ф 0 и т, и 6 I. Тогда х~т = (лг1) = (х™)'1. Далее, теорема 4.12 по отношению к расширенному определению 6.4 возведения в степень продолжает выполняться, за исключением соотношения 4.12 (iv). Доказательство. Заметим, что первое утверждение теоремы должно выполняться теперь для всех т 6 I, а не только для т g Р, как в определении. Чтобы распространить (х~т) = (х'1)™ на отрицательные т (это тривиально для т = 0), предположим, что т = —k, где k 6 Р. Тогда (х'1)™ = (лг1)"* = xh = x~m. Чтобы увидеть, что (л:)™ = (л;™) для mfP, заметим, что xm*(x)m = = (хшх'1)™ = 1т = 1. Снова длят = 0 это очевидно. Длят = —k, где fe 6 Р> получаем Второе утверждение теоремы ввиду 4.32 (вариант теоремы 4.12, включающий случаи т — 0 и п — 0) сводится к первому утвержде-
6.1. К РАСШИРЕНИЮ ОБЛАСТЕЙ ЦЕЛОСТНОСТИ 205 нию рассмотрением соответствующих случаев. Так, чтобы доказать хт+п = хт»хп, достаточно рассмотреть случай т + п ;> 0, п ^ 0. Тогда хт+п»х-п = xw+n~n = хт, отсюда, в силу хп»х~п = 1, полу- получим хт+п = хт»хп. Остальные части также легко проверить непо- непосредственно. Известное свойство хт~п = хт/хп следует непосредственно из 6.5. Упорядоченные поля; плотные упорядочения. Посмотрим теперь, какие свойства имеет отношение упорядочения для дробей. Мы, таким образом, предполагаем в следующих утверждениях, что (К, +, •, <, 0, 1) — любое упорядоченное поле. 6.6. Теорема. Для любых а, Ь, с, d 6 К, если b ф 0, d Ф 0, то (i) 0 < -г тогда и только тогда, когда 0 < а * Ъ; Ь с Ч (и) -J7 < -j тогда и только тогда, когда (а е d) • (Ъ • й) < (Ь • с) • (Ь • d); (iii) если 0<6*d, то -r<-j тогда и только тогда, когда (iv) 0 < d < b тогда и только тогда, когда 0 < -г < -j. Доказательство. В любой упорядоченной области цело- целостности из Ь Ф 0 следует 0 < Ь%. Далее, \/Ь ф 0, откуда также О < A/?>J = 1/Ь2. Таким образом, (i) доказывается умножением левого неравенства на б2 и правого на \/Ь2. Доказательства соотно- соотношений (ii) — (iv) аналогичны и предоставляются читателю. Отношения упорядочения в упорядоченных полях обладают инте- интересным специальным свойством. В следующем определении мы фор- формулируем это свойство для произвольных упорядоченных систем. 6.7. Определение. Множество S называется плотно упорядоченным отношением <^, и (S, <[) называется плотно упорядоченной системой, если выпол- выполняются следующие условия: (i) (S, <Э — линейно упорядоченная система; (ii) для любых х, у 6 S, х -< у, существует такое z 6 S, что х < z < у. 6.8. Теорема. Любое упорядоченное поле К плотно упорядо- упорядочено отношением <. Доказательство. Нам достаточно лишь проверить, что для любых х, у ? К из х < у следует х < (х + у)/2 < у. Согласно 6.6 (iii), первое неравенство эквивалентно 2х < х + у, а второе
206 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ эквивалентно х + у < 2у. Оба они следуют непосредственно из х < у. Заметим, что в любой плотно упорядоченной системе 5 имеется бесконечно много элементов между любыми двумя различными эле- элементами х, у. Пусть, действительно, х <^ у. Тогда существует такое ги что х <( zi -< у; следовательно, существует г2, для которого х К zi К Z2 < У, существует г3, для которого х < zt < г2 < z3 < у, и т. д. Это доказательство неявно использует аксиому выбора, так как на каждом этапе мы должны выбрать один элемент среди множе- множества подходящих. (Несколько более слабое утверждение, что для любого х 6 Р существует п различных элементов zt, z2, . . ., zn, для которых х <( zt <[ у (i = 1, . . ., п), может быть доказано без помощи аксиомы выбора.) Доказательство 6.8, однако, дает нам одно правило выбора в упорядоченных полях: если х < у, то х < (х + у)/2 < у и шх<х-±1< <х + У1/2 + у <у и т.д. Некоторые конечные поля. До сих пор мы еще не доказали суще- существование каких бы то ни было полей. В следующем разделе мы докажем основную теорему о том, что любая область целостности может быть расширена до поля. Однако, перед тем как сделать это, можно проверить, что некоторые из областей целостности ,уже встре- встречавшиеся нам, на деле являются полями. Это области \р вычетов по модулю простого р D.60). Более того, имеет место 6.9. Теорема. Любая конечная область целостности есть поле. Доказательство. Пусть К — конечная область цело- целостности. Зафиксируем любой элемент b Ф0 и положим F (х) == Ь»х для каждого л: 6 К. Тогда $ (F) = К, Я (F) Е К. Далее, F — взаимно однозначная функция, так как из b»Xi = Ь*хг при Ь ф 0 следует Xi = хг. Если М (F) Ф К, то К теоретико-множественно эквивалентно некоторому собственному подмножеству К, а именно 3) (F). Но это противоречит определению конечности B.4.5). Сле- Следовательно, М (F) = К. Но тогда для любого а 6 К существует такое х, что Ъ*х = а. Так как Ь было выбрано произвольным обра- образом, то отсюда видно, что К образует поле. Теорема 6.9 не является перефразировкой утверждения, что все 1Р являются полями, так как можно показать, что существует много других конечных областей целостности, помимо 1Р. Для этих специфических областей целостности можно дать и дру- другое доказательство теоремы 6.9. Вспомним, что элементами множе- множества 1Р являются классы эквивалентности [k]p для k 6 I по отноше- отношению конгруентности =гр. Тогда, для любых a, b ? 1Р, а = Шр, b = [т]р для некоторых k, т; далее, если Ь Ф [0]р в \р, то т Ф Ф 0 (mod р). Нужно показать существование такого х 6 1р, что
6.2. ПОЛЯ ЧАСТНЫХ 207 b»x = а; для этого достаточно найти /6 1, для которого т-/ = == k (mod р). Согласно 4.44 и 4.47 (i), (т, р) = 1 и поэтому суще- существуют такие s, t, что ms -f- pt = 1. Тогда m (sfe) -f- p (tk) = k, откуда m (sk) == k (mod p). Можно привести и более простое доказательство, используя упражнение 5 к п. 4.6. Из него можно видеть, что если т ф< Ф 0 (mod р), то mv~l == 1 (mod р), откуда т-тр~2 = 1 (mod p). Другими словами, класс эквивалентности для тр~2 является обрат- обратным к классу т в 1Р. Но этого достаточно для проверки того, что 1„ — поле. Например, обратным к [2]7 в 17 будет [25]7 = [32]7 = = [4]7. Естественно предполагать, что из данного поля можно строить новые, рассматривая его гомоморфные образы, как это мы делали для областей целостности. Однако, как показывает следующая тео- теорема, на этот раз ничего существенно нового получить не удастся. Доказательство теоремы оставляется в качестве упражнения. 6.10. Теорема. Предположим, что (К, +, •, 0, 1) — поле. Единственными отношениями конгруентности на К являются тождественное отношение и универсальное отношение К X К. (Другими словами, если = является отношением конгруентности на К, то либо х = у тогда и только тогда, когда х = у, либо х = у для всех х, у ? К-) Следовательно, каждое гомоморфное отображе- отображение G этой системы или является изоморфным отображением, или удовлетворяет условию G (х) = G (у) для всех х, у 6 К- В п. 6.3 мы снова возвратимся к рассмотрению произвольных полей, особенно в связи с алгебраической проблемой разрешимости уравнения. Упражнения 1. Доказать теорему 6.6 (ii) — (iv). 2. Доказать теорему 6.10. 3. Доказать, что существует поле, состоящее ровно из четырех элементов. (Вспомнить упражнение 7 к п. 4.6.) Постарайтесь построить соответствующие таблицы сложения и умножения, без уточнения деталей. 4. Предположим, что К — поле, п > 0, Ьо, . . ., Ъ^, Со, ¦ ¦ ., сп 6 К и что bi Ф bj, если i Ф /. Показать, что существует такой полином / (?) ? 6 К [I], что f (bj) = сг для каждого t <! п и deg (/ (|)) < п (так называемая интерполяционная теорема). Определяется ли f (Q этими условиями одно- однозначно? 6.2. Поля частных Теорема существования. Идея построения поля К по данной области целостности D вполне аналогична идее, использовавшейся в 4.21 при построении системы целых чисел по системе положитель- положительных целых чисел,— рассмотрение подходящей конгруенции на множестве пар. Любой паре элементов a, b 6 D, если только Ь Ф 0, должно однозначно соответствовать частное а/Ь из К, причем, как мы уже видели при обсуждении F.1.4) — F.1.6), никаких других
208 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ элементов в К не должно быть. Другими словами, элементами поля К должны быть частные элементов из D и только они. Рассмотрим множество пар (а, Ь) 6 D X D, для которых а/b принадлежат К, т.е. множество всех пар (а, Ь)> для которых Ь Ф 0. Теорема 6.3 (соотношение (Hi)) показывает, что двум таким парам (а, Ь), {а , Ь') соответствует одно частное в том и только в том случае, когда а*Ъ' = Ь»а . Понятно теперь, что последнее условие определяет отношение эквивалентности W на множестве пар, и тогда классы эквивалентности относительно W можно считать элементами поля К. Конечно, нужно еще определить операции. Это делается стандарт- стандартным методом. Вначале на множестве пар строим операции, руковод- руководствуясь, скажем, соотношениями из теоремы 6.3, затем доказываем, что относительно этих операций наше отношение W представляет собой конгруентность. Это делает возможным корректное определе- определение операций и на множестве классов эквивалентности по W. Проведем теперь строго все это рассуждение. 6.11. Теорема. По любой данной области целостности (D, +> •> 0, 1) можно построить такое поле (Q, +, •, 0, 1), что (i) D образует подобласть Q по отношению ко всем операциям в Q; (ii) для любого х 6 Q существуют такие a, b ? D, что b Ф 0 и а/b — х. Если область D упорядочена отношением <, то и поле Q можно упорядочить, продолжая отношение порядка с D на Q так, что его значения на D остаются неизменными. Доказательство. Положим A) W = {((а, Ь), (а, Ь')) : {а, Ь), (а, Ь') € D X (D - {0}) и а*Ь' = а'»Ь}. Будем писать также B) (а, Ь) = (а, Ь') для ((а, Ь), (а, Ь')) € W. Тогда C) W — отношение эквивалентности в D x (D — {0}). Для доказательства этого утверждения мы, как всегда, должны проверить рефлексивность, симметричность и транзитивность W. Не является очевидным лишь последнее свойство. Предположим, что а, а , а", Ь, Ь'\ Ь" 6 D, причем Ь, V, Ь" отличны от 0. Из (а, Ь) =г s= {а, Ь'), {а', V) з= (а", Ъ") следует аЬ' = а'Ъ, а'Ъ" = а"Ь'. Умно- Умножая обе части первого равенства на b'b", а второго на bb', получаем ab'b'b" = а'Ь'ЬЬ'. Но (Ь'Jф0, откуда ab" = а"Ь, т.е. (а, Ь) з ^ (а", Ь"). Согласно C), мы можем иметь дело с классами эквивалентности W(a,b) относительно W. Как и в^ доказательстве 4.21, мы будем
6.2. ПОЛЯ ЧАСТНЫХ 209 также обозначать эти классы [(а, Ь)] и [а, Ь], где это возможно. Чтобы определить соответствующие операции на классах [а, Ь], мы должны сначала определить операции ф и ® на любых элементах (а, Ь), (с, d) из D X (D' — {0}): D) (а, Ъ) Ф (с, d) = (amd + bmc, b*d), E) (а, Ь) ® (с, d) = (а*с, b»d). Заметим, что D X (D — {0}) замкнуто относительно Ф , ® только в силу bmd Ф 0, а это последнее следует из b ф 0, d Ф 0 только в областях целостности. Иначе говоря, построение возмож- возможно только для областей целостности, а не для произвольных колец. F) W — конгруентность относительно ® , <8> . Прежде чем доказывать F), заметим, что Ф и <8> по самому опре- определению коммутативны и поэтому в F) достаточно доказать, что из (а, Ъ) = (а', Ь') следует (а) (а, Ь) Ф (с, d) = (а', Ь') Ф (с, d); (б) (а, Ъ) ® (с, d) s (а', Ь') ® (с, d). Действительно, в общем случае, если (a, b) ^ (a, b'), (с, d) ^ == (с', d'), то (а, Ь) Ф (с, d) = (а, Ь') Ф (с, d) == (с, d) Ф (а', Ь') = (с', d') Ф (а', Ь') ^ (а1, V) Ф (с', d'), где мы применяем F)(а) в первой и третьей строках, а коммутатив- коммутативность — в остальных двух. Аналогично можно доказать F) и для <8>. Согласно A), F)(а) сводится к установлению равенства (ad + be) b'd = (ad + b'c) bd, которое, в свою очередь, сводится к adb' + beb' = a'db + b'cb или, окончательно, к adb' = a'db, что верно в силу ab' = a'b. Аналогично, F)(б) сводится к установлению равенства (ас) (b'd) = = (а'с) (bd), получающегося непосредственно из ab' — a'b. Таким образом, F) установлено. Пусть G) Q- = {X : X=W(a, ь> для некоторого (а, Ь) 6 Dx(D — {0})}. Другими словами, Q — совокупность классов эквивалентности [(а, Ь)] = [а, Ь] относительно W. Два таких класса [a, b]y [a', b'\ совпадают в том и только в том случае, когда (a, b) = (d, b). Как мы знаем из общих рассмотрений B.3.37), из"F)(а) и F)(б) следует,
210 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ ЧТО (8) существуют такие операции -\-, •, определенные на Q, что для любых [а, Ь], [с, d]?Q. (а) [a, b] +[c, d] = [(a, ft) ® (с, d)], (б) [a,b]~[c,d] = [(a,b)®(c,d)]. Далее, для любого а ? D положим (9) а = [а, 1]. Заметим, что для любого [а, Ь] ? Q из A) непосредственно следует A0) (а) [а, ?>] = 0 тогда и только тогда, когда а = 0, (б) [а, &] — 1 тогда и только~тогда, когда а — Ь. Теперь мы утверждаем, что A1) • (Q, ~+,~, 0, Т) есть поле. Проверка этого факта при помощи D), E), G) —A0) не вызывает затруднений. Проверим лишь несколько менее очевидных законов: ассоциативность -{-, дистрибутивность -+- относительно •, обра- обратимость сложения и умножения. A2) Для любых X,Y,Z?Q XT(YTZ) = (X + Y)~+Z. Представляя X, Y, Z в виде [а, Ь], [с, d], [e, /], приводим A2) к виду (adf + b (cf + de),b df) = ((ad + bc)f + bde, bdf); но это последнее — просто равенство. A3) Для любых X, Г, Z?Q, X~(YTZ) = (X~ Y)~(X~Z). Здесь мы должны показать, что (a (cf + de), bdf) = (acbf + bdae, bdbf). Последнее же следует из того, что (g, h) = (bg, bh) для любых g, h, b, если только b^=0. A4) Для любого X?Q существует такое Y?Q, что При данном Х = [а, Ь] очевидным значением для Y является [—a, b]. Действительно, тогда согласно A0)(а).
6.2. ПОЛЯ ЧАСТНЫХ 211 A5) Для любого X?Q, ХфЪ, существует такое Y?Q, что X~Y = 1. Так как Х=[а, Ь]ФО, то из (Ю)(а) следует, что афО. Отсюда [b, a] G Q. Согласно A0)(б), [а, Ь] '¦ [b, a] = [ab, 6а] =7. Закончив на этом доказательство A1), отметим, что утвержде- утверждение A5) указывает метод нахождения обратных элементов в Q: A6) [a,b]-J=[b,a\ при афО. Теперь мы хотим показать, что поле Q содержит подсистему, изоморфную D. Такую подсистему естественно искать как мно- множество элементов а для a?D. Определим функцию G следующими условиями: A7) ?5(G)=D, G(a) = a для каждого a?D; положим A8) D = J??(G). То, что D является подсистемой Q, следует из A9) (а) a + b — (a) + (b), (б) aH=(af(b) для любых a, ?>ED- A9)(а), (б) показывают также, что G является гомоморфным отображением D на D. Для того чтобы установить, что B0) G устанавливает изоморфизм между (D, +, •, 0, 1) и (D, +, 7, 0, Т), остается показать взаимную однозначность G. Но если a = 6, то мы имеем (а, 1) = (Ь, 1), откуда а = 6. Итак, мы уже построили поле Q, содержащее подобласть D, изоморфную D. Проверим ее минимальность. B1) Для любого X?Q существуют такие A, B?D, что Действительно, если Х = [а, Ь] и ЬфО, то Х = [а, 1]-[1, 6] = = (а)-(Ь)~1 согласно A6). Чтобы закончить доказательство, остается по полю Q, содержа- содержащему подобласть, изоморфную D, построить поле Q, содержащее D. Но это делается, как обычно, на основании общей теоремы B.4.9).
212 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ В нашем случае ситуация графически изображается так: н н G Поскольку (Q, . . .) является полем и (Q, . . .) = (Q> • • •)> то и (Q, . . .) — поле. В силу того, что каждый элемент X из Q являет- является частным от деления элемента А на В (А, В 6 D), любой элемент х 6 Q есть частное от деления элемента Н~х (А) на Я (В), т. е. эле- элемента G (А) еО на G- (В) ?0. Если на D определено отношение <, превращающее D в упоря- упорядоченную область целостности, то мы можем продолжить отношение < на все Q. Определим вначале множество положительных элементов в Q: B2) пусть Pos состоит из всех отношений а/b в Q, для которых а, Ь 6 D и 0 < Такое определение, конечно, правомочно в силу 6.6 (i). Заметим, что, в соответствии с B2), х 6 Pos в том и только в том случае, когда существует некоторая пара (а,- Ь) ? D X D, для которой 0 < а*Ъ и х = а/Ъ. Из этого еще не следует непосредственно, что если х 6 Pos, то для любой пары (с, d) в D X D, для которой х = c/d, мы имеем 0 < cmd, т. е. что определение B2) элемента х 6 Pos не зависит от конкретного представления х как отношения элемен- элементов из D- Последнее, однако, верно: B3) ест (а, Ь), (с, d) 6 D X (D — {0}) и а/Ь - c/d, то 0 < а»Ь тогда и только тогда, когда 0 < cmd. Действительно, ad = be, откуда (ad)(bc) = Ь2с2. Если с = 0, то необходимо а = 0 и заключение тривиально. В противном случае Ь2с2 > 0, откуда (ab)(cd) > 0, что опять дает желаемый результат. Из B3) следует B4) если а 6 D, то а 6 Pos тогда и только тогда, когда 0 < а. Действительно, нам нужно лишь рассмотреть представление а = = а/1. Отсюда, если мы определим для любых х, у 6 Q B5) х < у тогда и только тогда, когда г/ — х ? Pos, то увидим, что это отношение является продолжением данного отно- отношения на D, без изменения его значения для х, у 6 D-
6.2. ПОЛЯ ЧАСТНЫХ 213 Теперь для завершения доказательства нашей теоремы мы нуж- нуждаемся лишь в проверке условий 4.17 (i), (ii). Для х, у ? Q это B6) если х, у 6 Pos, то х + у 6 Pos и хшу 6 Pos и B7) выполняется ровно один из следующих трех случаев; х 6 Pos, х = 0, —х 6 Pos. Доказательства предоставляются читателю. Заметим, что теорема представляет действительный интерес только в том случае, когда D само не образует поля. В противном случае, согласно условиям (i) и (ii), каждый элемент Q находится в D и, согласно (i), D = Q. Изоморфизм полей частных. Теперь мы хотим показать, что в алгебраическом смысле, т. е. с точностью до изоморфизма, поле Q, удовлетворяющее условиям 6.11 (i), (ii), однозначно определяется системой D- На деле же мы можем доказать по аналогии с 4.23 следующее более общее утверждение. 6.12. Теорема. Пусть (D, +, •, 0, 1) — область целостно- целостности и (Q, +, в, 0, 1) — поле, удовлетворяющее условиям 6.11 (i), (ii) относительно D- Предположим далее, что (К, ©, <8>, 0, 1) — другое поле, такое, что (D, +, •, 0, 1) является подобластью (К, Ф, <8>, 0, 1). Пусть Q' состоит из всех л: 6 К таких, что для некоторых a, b 6 D с ЪФ§ мы имеем х = а <8> b (b~l — обратная величина в К). Тогда Q' образует поле, и (Q, +,., О, 1) ~(Q', ©, ®,0, 1). В частности, если К также удовлетворяет условиям 6.11 (i) — (ii), то К = Q' и системы, задаваемые Q и К, изоморфны. Такой же результат имеет место, если Q и К— поля, упорядоченные отно- отношениями порядка, совпадающими на D. Доказательство. Чтобы определить желаемый изомор- изоморфизм, положим для данных а, Ь 6 D, Ь Ф О A) G (а.6) = а ® Ь-К Нам нужно показать, что A) определяет единственное значение G (х) для каждого х 6 Q независимо от любого конкретного представле- представления х = aefe. Действительно, для любого другого такого пред- представления х = с*&~1 получаем a*d = bee. Отсюда, согласно опреде- определению подсистемы, а <8> d = b <8> с и потому в К имеем а <8> b~l = с <g> d~l, что и требовалось. Очевидно, далее B) 35 (G) = Q, М (G) = Q'. Го, что C) G взаимно однозначна,
214 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ видно из утверждения, обратного приведенному выше: если а <8> b~l = с ® drl, то amb'1 = ced^1. Наконец, D) G (х + у) = G (х) 0 G (у) и G {х*у) = G (x) ® G (у) для любых л:, г/ 6 Q, так как правила 6.3 (v), (vi) для вычис- вычисления суммы и произведения частных выполняются одинаково в Q и в Q'. Очевидно, E) 6@) = 0 и G(l) = 1. Наконец, если Q и К упорядочены, то упорядочения Q и Q' должны быть изоморфны по G, так как аналогичное правило 6.6 (ii) о поряд- порядке частных выполняется в Q так же, как и в Q'. Рациональные числа; поля рациональных форм. Единственное (с точностью до изоморфизма) поле Q, удовлетворяющее 6.11 (i), (ii), обычно называется полем частных из D. Применим теперь предыдущие теоремы к системе целых чисел. 6.13. Т е'о р е м а. Мы можем построить упорядоченное поле (Ra, +, •, <, 0, 1), которое (i) содержит (I, +, •, <, 0, 1) в качестве подсистемы и тако- таково, что (ii) для любого х 6 Ra существуют такие а, Ь 6 I. что b Ф 0 и х = alb. Далее, любое другое упорядоченное поле, содержащее целые числа, содержит упорядоченное подполе, изоморфное Ra. Ввиду единственности такой системы примем следующее 6.14. Соглашение. В остающейся части этой книги мы подразумеваем под (Ra, -f, •, <, 0, 1) фиксированное упорядоченное поле, удовлетворяющее 6.13 (i), (ii). Мы будем называть Ra множе- множеством рациональных чисел. Таким образом, рациональные числа образуют некоторое (на самом деле наименьшее) поле, содержащее область целых чисел. Конечно, такое поле не единственно. Два других особенно инте- интересных поля, содержащих поле рациональных чисел, образуют дей- действительные и комплексные числа, с которыми мы будем иметь дело в следующих двух главах. Попутно нам придется встретить и ряд других «промежуточных» алгебраически интересных полей. В главе 5 к уже известным областям целостности: целых чисел 1 и целых чисел по модулю р, \р, мы добавили новые области цело- целостности, состоящие из полиномиальных форм над любой данной областью целостности. Аналогично можно поступить и по отноше- отношению к полям. 6.15. Теорема. Предположим, что (D, +. •> 0, 1) — любая область целостности, k ? Р и что (D \\i, ¦ ¦ ¦, Ы. +. •> 0. 1) — k-кратног трансцендентное расширение D, задаваемое 5.22. Тогда
6.2. ПОЛЯ ЧАСТНЫХ 21S мы можем построить поле (D (Si Sb), +, •, 0, 1) со следую- следующими свойствами: (i) D (Si, . • ., Ift] является подобластью области D (Si. • • •> Sfc) «о отношению к данным операциям; (и) для любого р 6 D (Si. • • •> Ы существуют такие полиномы f (Si, • • •• Sa). ff (Si, • • ., Ik) € D (Si, • • -, Sft], что g (Si, . . ., Sft) ^ 0 и p = / (Si, . . ., lh)/g (Si, • • •, Sft)- Такое расширение D (Si, • • •> Sft), опять же с точностью до изо- изоморфизма, определяется однозначно и поэтому примем следующее 6.16. Соглашение. В остающейся части этой книги мы подразумеваем под (D (Si, • • •, Sft), +> •, О, 1) некоторое фикси- фиксированное поле, удовлетворяющее 6.15 (i), (ii), причем (D, +, •, 0, 1) — область целостности, a D [Si, • • •> S?J является k-кратным транс- трансцендентным расширением D посредством^, . . ., lh. D (Si, • • •> Ik) называется полем рациональных форм от Si, ¦ ¦ • • • , Ik- При k = 1 мы обычно пишем D Ш и D (S) соответственно для области полиномиальных форм и поля рациональных форм от S- Так же как мы естественным путем по каждой полиномиальной форме г) строили определенную функцию /, мы можем пытаться по каждой рациональной форме р построить определенную функцию г. Именно, если р = / (S)/g (S) и g (S) ф 0, то можно ожидать, что г (х) = f (x)/g (х) для любого х. Однако такая функция г опре- определена только для тех х, для которых g (х) Ф 0, т. е. для х, не являющихся корнями полинома g (S). Не видно алгебраического пути, позволяющего определить г (х) при g (х) = 0. Конечно, можно рассматривать и функции, у которых область определения не совпадает с D, но нас подстерегает другая неприятность: область определения (а значит, и сама функция) зависит от представления данной рациональной формы. Так, / (Q/g (?) и Д (S)/gi (S) — пред- представления одной и той же рациональной формы, если /t (S) = = f (g) (| — а) и gi (S) = g (S) (S — я). Но если а не есть корень g (S), то функция, построенная по представлению Д (S)/gi (S), не определена в точке а, а функция, построенная по представлению f(?,)/g (S), определена в этой точке. Конечно, та же проблема возни- возникает и при k> 1. Вместо того чтобы различными искусственными путями обходить эти трудности, мы предпочтем вообще отказаться от самой идеи сопоставления каждой рациональной форме опреде- определенной функции. Первоначально необходимость рассмотрения полиномиальных форм вместо полиномиальных функций возникла из рассмотрения конечных областей D, когда функции не обладают некоторыми же- желаемыми свойствами. В силу же теоремы 5.15 при бесконечных D оба подхода алгебраически эквивалентны. Приведенные выше соображе- соображения показывают, что, несмотря на это, удобнее и для бесконечных D
216 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ предпочесть рассмотрение рациональных форм. Красота общей кон- конструкции поля частных выражается как раз в том, что с частными / (У/? (I) можно проводить все алгебраические действия, не забо- заботясь о корнях знаменателя, при единственном ограничении, что g (?) не есть тождественный 0. Упражнения 1. Доказать утверждения B6) и B7) из доказательства теоремы 6.11. 2. Предположим, что х (Е Ra, 0 < х, х* < 2, и пусть у = х + + B — *2)/2 (х + 1). Показать, что х < у и у* < 2. При данном х > 0, *s > 2 найти г/ 6 Ra, для которого 0 <. у < х и г/г > 2. 6.3. Решения алгебраических уравнений в полях Поля обеспечивают нам большую гибкость при решении алгеб- алгебраических уравнений. В общем случае мы рассматриваем не одно, а несколько таких уравнений, или, как обычно говорят, систему уравнений от нескольких переменных, причем эти уравнения мы будем решать совместно. В каждом уравнении системы слева и спра- справа стоят некоторые «выражения», содержащие переменные |1( ... . . ., |h и постоянные (конкретные элементы рассматривающегося поля), связанные операциями +, •, —, ~х поля. Пользуясь соотно- соотношениями 6.3 (v) — (viii), каждое выражение можно шаг за шагом свести к единственной дроби вида g (Ei, . . ., lh)/h (|ь . . ., lh), где g (li, . . ., \h) и h (li lh) — некоторые полиномы, причем h (Ij, . . ., ?ft) Ф 0. Вопрос, существуют ли решения уравнения, в котором слева и справа стоят соответственно gi(Ei. ¦¦¦Ль) 82(h, ¦¦¦Ли) Mil. •••.&) Mil- ....Е*)* равнозначен вопросу о существовании таких элементов хи .. ., xh поля, что ht (хи ..., xh) ф 0, h2 (x±, ...,хк и gl(Xj, ..., Xh) _ g2(Xj Xh) M*i. •••> -vft) h2(xb ..., xk) Полагая можно также сказать, что вопрос заключается в том, существуют ли Xj хь, для которых / (*i xh) = 0 и которые удовлетворяют неравенствам для /ц, /г2- Таким образом, все решения исходной системы находятся среди решений системы полиномиальных уравнений /г- (|ь . . ., Ей) = 0, 1 <! i<! m, т. е.
6.3. РЕШЕНИЯ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В ПОЛЯХ 217 среди наборов (хи . . ., xh), для которых /; (xit . . ., xk) = 0 для всех L (Обратим внимание на слово «среди», так как необходимо исключить те решения указанной системы, для которых некоторые знаменатели обращаются в 0.) Будем теперь рассматривать исклю- исключительно полиномиальные системы уравнений. Для такой системы нас интересуют, конечно, две основных проблемы: существуют ли решения вообще, и, если да, то как их найти — иначе говоря, проблема существования и проблема построе- построения решения. Под нахождением, или построением, решения мы пони- понимаем згдачу выражения решений через коэффициенты системы с помощью основных операций в поле, причем по возможности (если мы хотим получить попутно какие-то следствия для областей целостности) без операции деления. В такой общей формулировке, конечно, сказать можно не так много. Наиболее доступными для изучения оказываются два частных случая — во-первых, случай линейных систем, когда все уравнения линейны, т. е. полиномы в них степени 1, и, во-вторых, случай одного уравнения от одной переменной, k = т = 1. Изучение каждого из этих случаев есть развитый самостоятельный раздел алгебры — линейная алгебра и теория полиномов над произвольным полем соответственно. Первого из них мы только коснемся, со вторым же будем все время встречать- встречаться, особенно для рациональных, действительных и комплексных чисел. В остающейся части раздела (К, +, •, 0, 1) — произвольное поле. Иногда нам потребуется также расширение (|_, +, •, 0, 1) этого поля. Системы линейных уравнений. По теореме 5.24 мы знаем, что из f{lu ..., |ь)?К[&1, ..., lh] и deg/(|1? ..., ?ь) = 1 следует h_ f (gt, ..., |ft) = a0 + V afej для некоторых a0, ax, ..., ah ? К, при- 3=1 чем по меньшей мере одно а^фО для 1<^/<^й. Поэтому k f(xu ..., xft) = 0 тогда и только тогда, когда 3=1 Приходим, таким образом, к несколько видоизмененной системе уравнений, где слева стоят однородные линейные полиномы, а справа — постоянные. (Термин «линейный» происходит из анали- аналитической геометрии, так как множество всех решений (х, у) урав- уравнения atx + а^у = Ь, в котором хотя бы одно из чисел av аг не равно нулю, образует прямую линию.) 6.17. Определение. Пусть k, m?P; для каждого i = = 1, ..., т пусть (ati, ..., aik) и (bt, ..., bm) — соответственно k-членные и т-членная последовательности в К и, наконец, пусть ъ ft (?i» • • •, Sfe)= zl ai&i- Элементы последовательностей называются
218 гл- 6- РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ коэффициентами системы f,(Ь, ¦ ¦ ., Ik) = bt т линейных уравнений с k неизвестными. Последовательность (xit . . ., xh) в К называется решением этой системы, если ft (хи . . ., xh) = bt, т. е. h 3=i для каждого i. Здесь, чтобы не усложнять формулировку, случай ац = О для всех / = 1, . . ., k не исключается; в нашу систему входят тогда уравнения вида 0 = bt. Очевидно, если bi при этом отлично от нуля, то исходная система не имеет решений, а если bt = О, то решения не зависят от наличия этого уравнения в системе. Мы хотим доказать прежде всего, что при решении линейной системы мы не можем ничего выиграть, переходя от поля К к какому- либо его расширению 1_. Именно, мы покажем, что из существования решения такой системы в L следует существование ее решения и в К. Конечно, в L может быть больше решений, чем в К, но если в К решение единственно, то оно единственно и в |_. Поскольку этот последний случай вызывает наибольший интерес, часто говорят, что в некотором смысле любое поле К полно по отношению к решению систем линейных уравнений. (Если бы нашей конечной целью было изучение систем линейных уравнений, то все изучение числовых систем можно было бы закончить на рациональных числах.) 6.18. Теорема. Пусть К — подполе поля L и пусть ац 6 К, bi 6 К для всех i ¦< /п, / -< k. Если система уравнений и '; ; имеет решение {xit . . ., xh) с xit . . ., xh ? L, то она имеет реше- решение {х[, . . ., Хи) с х[, . . ., х'ъ 6 К. Кроме того, если система имеет единственное решение (х[, . . ., х'и) в К, то (х[, . . ., x'h) также будет единственным решением и в 1_. Доказательство. Главной идеей доказательства являет- является исключение переменных. Применим индукцию по т. (Столь же успешно можно доказывать и индукцией по k.) Изучим вначале отдельно случай k = 1. Пусть, действительно, нам задано решение Xi 6 L нашей системы уравнений, т. е. A) й\\Ху = bi, а-цХ^ = t>2> • • •> ^ml-^l = Ьт. Если все ац = 0, то и все bt = 0, следовательно, любое х[ 6 L и, в частности, любое х[ ? К является решением этой системы. Очевидно, что в этом случае в К нет единственности решения. Предположим теперь, что некоторые ац ф 0; для простоты пред-
6.3. РЕШЕНИЯ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В ПОЛЯХ 219 положим, что йн ф 0. Тогда любое решение х[ должно удовлетво- удовлетворять условию х[ = bjan. В частности, мы заключаем из A), что имеется единственное решение х\ 6 L; однако ху ? К как частное двух элементов из К- Теперь ясно, что ху является единственным решением и в К, и в L. Заметим, что утверждение «система имеет по меньшей мере одно решение» эквивалентно B) ctii—- — bi для каждого г = 2, ..., т. Теперь мы можем предположить, что k > 1. Чтобы начать нашу индукцию по т, рассмотрим случай т = 1: C) ctuXi + ai2x2 + ¦• + aihxh = b{. Мы снова предполагаем, что имеется хотя бы одно решение хи . . ., xh ? L. Если все ai} = 0, то должно быть и by = 0. Но тогда любые х[, х'2, . . ., Xh 6 L являются решением и, в частности, любые элементы К тоже. Очевидно, что в этом случае нет единствен- единственности решения. Предположим теперь, что некоторые а^фО, скажем, ап Ф 0. Тогда любое решение х[, . . ., х'ь. 6 L удовлетво- удовлетворяет условию D) х[ = u'l [bi Наоборот, если мы определим х\, как в D), то, вне зависимо- зависимости от выбора х'г, . . ., х'ъ ? L, (х[, . . ., хь) будет решением урав- уравнения C). В частности, мы можем выбрать х'2, . . ., 4 6К- Тогда х[, связанное с ними формулой D), также должно быть в К. И снова очевидно, что здесь нет единственности решения. Итак, теорема доказана для случая т = 1. Предположим теперь, что теорема выполняется для систем из т уравнений, и покажем, что она выполняется для систем с т + 1 уравнением. (По-прежнему предполагаем &> 1.) Таким образом, допустим, что мы имеем решение хь . . ., xh ? L системы E) йа*1 + aizxz + • • • + aikxk = bi для /=1,2, . . ., m+1. Разберем отдельно те же случаи, что и в C). Если все коэффициенты ац = 0, то должно быть bi = 0. Но тогда любое решение (x'lt . . . . . ., x'h) остающихся т уравнений является решением всей системы. Отсюда, по индукции, имеется по меньшей мере одно решение, полностью принадлежащее К. Очевидно, что единственное решение в К, если таковое имеется, является в то же самое время единствен- единственным и в L- Теперь допустим, что некоторые из ац ф 0, скажем, снова ац Ф 0. Тогда любое решение х[, . . ., х'и должно удовлетво- удовлетворять D). Оно должно также удовлетворять F) aHall [bt — (alzx'2 + ... + alhx'h)] + aizx'2 + ... ...+ aikx'k = bi для { = 2, ..., m-\-1.
220 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ Определим G) си^ац — ана^аи для i = 2, ..., m+ I, / = 2, ..., k и di — bi — aiicqlbi для i = 2, ..., т -f-1. Тогда F) принимает вид (8) ci2x'2 + • • • + Cihx'h = dt для t = 2, .... m + 1. Другими словами, F) [или, что то же самое, (8)] является системой т уравнений от k — 1 неизвестного. Обратно, мы видим, что если (х'2, . . ., х'ь) является любым решением системы (8) и мы опреде- определяем х[ через х'г, . . ., x'k при помощи D), то {х[, . . ., х'ь,) является решением E). Теперь система (8) имеет по меньшей мере одно реше- решение, а именно (х2, . . ., xk). Отсюда, по индуктивной гипотезе, мы можем найти решение (х'г, . . ., x'h) со всеми х\ 6 К. Но тогда х[, определяемо^ формулой D), также принадлежит К. Остается дока- доказать, что если некоторое (х[, . . ., х^) является единственным реше- решением в К, то оно является и единственным решением в L- Оставляем это доказательство читателю в качестве самостоятельного упраж- упражнения. Заметим, что приведенное выше доказательство дает нам нечто большее, чем это сформулировано в условии теоремы. Просмотр доказательства показывает, что мы получили алгоритм для решения по коэффициентам системы вопроса о том, имеет ли данная система линейных уравнений хотя бы одно решение в поле К, и алгоритм для определения всех решений системы, если такие имеются. [В простей- простейшем случае k = 1 он задается условиями B).] Линейная алгебра частично посвящена изучению таких алгоритмов в более конкрет- конкретной форме при помощи использования определителей и матриц. Мы не будем следовать далее в этом направлении, полагая, что читатель сможет самостоятельно обратиться к любому из несколь- нескольких великолепных учебников по этому вопросу. В чисто иллюстра- иллюстративных целях рассмотрим несколько простых примеров. Простейший нетривиальный случай включает две переменные k = 2. Пусть, кроме того, т = 2, т. е. система имеет вид F.3.1) anxl + al2xz = bit Для простоты предположим, что а41 Ф 0 и или a2i ф 0, или а22 Ф 0. Следуя ходу доказательства, если мы хотим получить решение *i> *2 € К, переписываем F.3.2) *i = «u(&i = К
6.3. РЕШЕНИЯ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В ПОЛЯХ 221 Второе из этих уравнений можно переписать в виде F.3.3) (а22 — a2ya\~{ai2) x2 = b2 или, эквивалентно, F.3.3)' a2iai2) х2 = b2an Но F.3.3)' имеет решение тогда и только тогда, когда или а22ац — — #2i#i2 = 0 = 62Яц — a2ibi, или а22ап — a2iai2 # 0. В первом случае решением F.3.3) будет любое х2 и Ху, определенное через х2 при помощи F.3.2); тем самым находим решения (Ху, х2) систе- системы F.3.1). Во втором случае имеется единственное решение урав- уравнения F.3.3)' и отсюда, вследствие F.3.2), единственное решение (х1; х2) системы F.3.1). Именно, F.3.4) х2 — Mil а22а11 *~" °21а12 что в символах определителей обычно записывается как F.3.4)' х, = Ьу пу2 Ь2 022 ап ai2 а21 Й22 Х2 = аи а12 Тот факт, что это представление решений, с которым мы ознако- ознакомились для случая поля рациональных или действительных чисел, сохраняется и в любом поле, например в 1Р для простого р, может служить свидетельством силы абстрактного понятия поля. Разберем, например, вопрос о существовании целых чисел, для которых F.3.5) Зг/j + 4г/2 = 0 (mod 5), 4г/! + г/2 = 3 (mod 5). Другими словами, требуется решить в 16 систему F.3.5)' [3] х, +5 [4] х2 = [0], [4] ху +5 х2 = [3]. Если мы применим метод, описанный выше, разрешая как наи- наиболее простое второе уравнение относительно х2, то получим х2 = = [3] —5 [4] Ху = [3] +6 Xi. Тогда [3] Ху +6 [4] ([3] +6 xt) = [0] или [7] Ху +5 [12] = [0], [2] ху = [—12] = [3]. Но в I5 [2] = [3]. Отсюда Ху = [3] [2]-1 = [9] = [4] и поэтому х2 = [7] = [2]. Так как {[4], [2]) является единственным решением F.3.5)' в 16, то D, 2) является решением F.3.5). Конечно, последнее единственно лишь с точностью до эквивалентности E=(mod 5). Например, другим решением системы F.3.5) будет A4, —3>.
222 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ Заметим, что для системы F.3.6) 3yt + 4у2 == 0 (mod 5), 4yt + 2г/2 = 3 (mod 5) мы не получили бы никакого решения: это необходимо вытекает из рассмотрения знаменателя й22йц — а21а12 в F.3.4). Он должен быть фО, в противном случае должно быть Ь2ап — a2ib1 = 0. В данном же случае мы имеем Ь2аи — а2 А = [3] • [3] -5 [4] ¦ [0] = [9] Ф [0], «22011 — 021012 = t2] [3] —6 [4] [4] = [-10] = [0]. С другой стороны, взяв пример, где и Ьгап — а2А = 0, например, такой: F.3.7) 3yt + 4г/2 = 1 (mod 5), 4г/! + 2у2 = 3 (mod 5), мы сможем найти для каждого значения xt значение х2 так, чтобы (xt, x2) удовлетворяло данным уравнениям. Линейные уравнения в областях целостности. Рассмотрение одного уравнения с двумя переменными или двух уравнений с тремя переменными интересно, когда мы имеем дело с областью целостно- целостности, не являющейся полем, например с областью I. Чтобы изучить такие системы, мы можем обратиться к полям частных — в данном примере к Ra. Используя метод исключения переменных, можно сначала найти все решения в этом поле, если такие имеются, а затем постараться выделить из них принадлежащие исходной области. Заметим, что теорема 6.18 здесь не применяется. Вполне может оказаться, что в поле частных будет решение, а в исходной области целостности — нет. Например, таков случай уравнения F.3.8) 2xi + 4х2 = 7, не разрешимого в целых числах. Действительно, если бы мы имели решение хи х2 ? I, то левая часть F.3.8) делилась бы на 2, а правая нет. С другой стороны, в рациональных числах это уравнение имеет бесконечно много решений, задаваемых формулой х± = = у —2х2. Снова очевидно, что ни одна из этих пар (х1( х2) не имеет х1 и х2, одновременно принадлежащих I. Необходимым и достаточным условием того, чтобы F.3.9) atXi + а2х2 = b имело решение хи х2 в I, если аи а2, Ь 6 I и at Ф 0, а2 Ф 0, является F.3.10) {аиа2)\Ъ,
6.3. РЕШЕНИЯ АЛГЕБРАИЧЕСКИХ УРАВНЕНИЙ В ПОЛЯХ 22& т. е. что Ь делится на н. о. д. ау и а2. То, что это необходимо, доказы- доказывается аналогично приведенному выше. С другой стороны, если d = (аи а2) и d \ Ь, т. е. а^ = a[d, а2 = a'2d, b = b'd, то мы видим, что F.3.9) эквивалентно F.3.11) а'хху + а'2х2 = Ъ', где теперь (а[, а2) = 1. Тогда (согласно 4.44) существуют s, t ? I, для которых F.3.12) a[s + a'2t= I, откуда а[ {sb') + а2 {tb') = b'. Умножение обеих частей на d показывает, что (Xi,x2) = (sb', tb') является одним из решений F.3.9), конечно, никоим образом не единственным (в предположении, что F.3.10) выполняется). Если (х[, х2) — любое решение, то для yt = х[ — хи у2 = х2 — х2 получаем F.3.13) а^ + а2у2 = 0. Наши предыдущие рассуждения показывают, что F.3.13) имеет решения, так как (а1( а2) | 0, но F.3.12) дает нам только одно решение @, 0), для которого х[ = xlt х'г = х2. Однако здесь имеется и много других, а именно все те уи у2 ? I, для которых F.3.14) 01=_-21у2=_|.0г. Поскольку (а[, а'2) = \, F.3.14) имеет решение уи у2 6 I тогда и только тогда, когда а[ | у2, т. е. уг — a[k для некоторого k ? I; в этом случае у^ = —a'2k. Очевидно, любой выбор k Ф 0 дает новое решение (х[, х'2) уравнения F.3.9) в I. Итак, F.3.15) Если {аи а2) \ Ь, то а^х^ + а2х2 = Ь, где хи х2 6 I, тогда и только тогда, когда для некоторого k ? I Xi = sb' — a'2k, Xo = tb' — a[k, где d= (a1( a2), ax = a[d, a2 = a'2d, b = b'd и a[s + a'2t — 1. Пример: все целые решения уравнения 2хх + 6х2 = 8 должны иметь вид *! = 16 — 3k, х2 = —4 + k при выборе s = 4, t — —1 в урав- уравнении 1 «s + 3 • г1 = 1. (Конечно, могут быть использованы любые другие частные решения s, t; ответы будут различаться лишь фор- формой записи.) Полиномиальные уравнения в рациональных числах. Пока мы еще не можем сделать никаких общих утверждений об одном уравнении от одной переменной степени выше чем 1. Вместо этого закончим раздел очень полезным результатом частного характера о полино- полиномах над рациональными числами, разобрав один интересный
224 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ специальный случай. Рассмотрим полином вида /(?) = -?—г""?~~S~f~ • • •-r"Tj~lni где все ai, bi?l, bi=f=O. Мы видим, что с является корнем / (!) тогда и только тогда, когда оно является корнем полинома (bobi ... bn) f (!) уже с целыми коэффициентами. Таким образом, можно ограничиться только таки- такими полиномами. п 6.19. Теорема. Предположим, что /(?)— ^ а^', где ai?L /i>0u ап^=0. Предположим также, чтоЬ, с?1, с=ФО и(Ь, с)-— I. Если Ыс является корнем /(!), tno b\ag и с\ап. п Доказательство. Из 2 a,i(blc)x = 0 мы, умножая обе г=0 п части на с™, заключаем, что 2' сцсп~гЬг — 0. Перепишем это урав- г=0 нение в двух формах: и B) anbn= —(aocn + aicn-1b+ .. . +an-1cbn~1). Из A) и B) получаем, что соответственно C) Ъ | аосп и с | anbn. Из ф, с) = 1 повторным применением 4.46 мы и получаем желаемый результат. 71 6.20. Следствие. Предположим, что f (!) = 2 й«?г — i=0 приведенный нормированный полином (ап = 1) с целыми коэффи- коэффициентами at. Тогда любой рациональный корень f (|) будет целым. 6.21. Следствие. Предположим, что я>1,а?1, | а | > 1 и что | а | = pji . . . рг™ является единственным разложением \ а \ на простые множители, и р1<Срг < . . . < />т. Предположим, что п Jf it для некоторого t. Тогда полином |™ — а не имеет рацио- рациональных корней. Доказательство. В противном случае мы, в соответ- соответствии с 6.20, имели бы х 6 I и хп = а, поэтому | х |" = | а |. Возь- Возьмем Ь = | х |, 6 ? Р. Каждая степень в разложении Ь" на простые множители делится на п, что противоречит единственности пред- представления для | а |. (Это — обобщение классического доказатель- доказательства иррациональности ]^2, что теперь записалось бы как «не суще- существует х 6 Ra, для которого х2 = 2».)
6.4. ПОЛИНОМЫ НАД ПРОИЗВОЛЬНЫМ ПОЛЕМ 225 Таким образом, рациональные числа не замкнуты относительно операции извлечения корня n-й степени или, как говорят, не являют- являются алгебраически замкнутыми. Попытка «исправить» эту неполноту введением чисел новых видов предпринимается в следующей главе с помощью действительных чисел. Но перед этим мы должны рассмотреть некоторые основные свойства деления полиномов над любым полем, которые неоднократно нам понадобятся. Упражнения 1. Закончить доказательство теоремы 6.18. 2. Найти пример allt а12, a2i, а22, bt, b2 6 U Для которых пара кон- груенций + «12*2 = bi (mod 7), + ^22*2 = b2 (mod 7) с х\., хг ? I, 0 < х^ < 7, 0 <! хг < 7 имеет (а) ни одного решения, (б) строго одно решение, (в) более одного решения. 3. Найти все неконгруентные решения пары конгруенций *i — х2 + 2х3 = 1 (mod 5), 2xi + хг — хъ = 2 (mod 5). 4. Рассмотрим два уравнения + 012*2 + . . . + аЛхк = 6,, + . . ¦ + a2hxh = b2, от k переменных (k ~^- 2), где все atj, 6г g К. Найти простые необходимые и достаточные условия того, что существует по меньшей мере одно решение <*i, х2, . . ., xk) в К. 5. Найти необходимые и достаточные условия для существования по меньшей мере одного решения (х(, х2, xs) в I для системы из упражнения 4, когда k = 3 и все ац, bi ? I. 6. Найти рациональные корни (если такие существуют) следующих полиномов в Ra [?]: (а) I3 - 5g + 3, (б) 2I3 - 3g2 - 2? + 3. 6.4. Полиномы над произвольным полем Изучение умножения и деления целых чисел (отличных от 0) сильно упрощается разложением каждого такого числа на «кирпи- «кирпичики», именно разложением в произведение простых чисел. Роль такого разложения зависит в основном от его единственности, гаран- гарантированной теоремой 4.50. Естественно попытаться подобным обра- образом разложить на простые полиномы и произвольные полиномы, имея в виду, конечно, последующее доказательство единственности такого разложения. И действительно, это можно проделать метода- методами, весьма близкими к использованным в п. 4.4, особенно в теоре- теоремах 4.37—4.51 для I. Итак, в этом разделе (К, +, •, О, I) —
226 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ произвольное поле; основным понятием будет отношение делимо- делимости | полиномов над К, сформулированное в определении 5.12. Сначала может возникнуть желание назвать, по аналогии с 4.40, полином / (?) простым, если / (?) Ф 0, / (?) Ф ±1 и для любого поли- полинома g (?) из g (?) |/ (?) следует g (?) = ±1 или g (?) = / (?). Однако роль элементов ±1 в этом отношении специфична для целых чисел и вытекает из того, что ±1 —единственные делители 1 в I D.39). В более же общей ситуации, например в К (I), это не так: делителем 1 является любое а Ф 0 — ведь 1 = а» — . Мы вскоре покажем, что других делителей 1 в К нет. Поэтому, если пытаться следовать духу определения делимости для целых чисел, следует говорить, что / (?) — простой полином, если из g (?) | / (?) следует, что g (?) постоянная или g (?) равен произведению постоянной на f (?). Тем самым выделение постоянной из полинома в качестве сомножителя мы считаем «тривиальным» разложением полинома и считаем два полинома, отличающиеся постоянным множителем, одинаковыми* с точки зрения вопросов делимости полиномов. Эти рассуждения показывают, в частности, преимущества рас- рассмотрения полиномов именно над полями, а не над областями цело- целостности, как в главе 5. Практически все результаты, которые мы сейчас получим, могут быть перенесены и на случай полиномов над областями целостности, но формулировки потеряют свою прозрач- прозрачность: ведь в таком случае делимость на постоянную перестает быть тривиальностью. С другой стороны, часто можно прямо при- применять полученные результаты к полиномам над областями цело- целостности, рассматривая их как полиномы над соответствующим полем частных. Основные свойства делимости 6.22. Оп ре де л ен и е. Пусть f (|), g (?) 6 К [?]. Будем писать f (I) ~ g (?) тогда и только тогда, когда / (?) \ g (?) и g (?) |/(|), и f (?) г^ g (?) в противном случае. Следующая теорема устанавливает основные свойства | и ~ в К [?], многие из которых обобщают свойства из теоремы 4.39. 6.23. Теорема. Предположим, 4mof (?),g(?), h (?), fi (?), . . . • • ¦, fn (?) в К [?]. Тогда (О / (?) I 0; (ii) 0 | f (?) тогда и только тогда, когда f (?) = 0; (iii) если а ?К и аф 0, то a \f (?); (iv) если h{l) \g(l) и g(l) |f(?), mo h (?) | f (?); (v) если g (?) | fi (?) для каждого i, mo hit);
6.4. ПОЛИНОМЫ НАД ПРОИЗВОЛЬНЫМ ПОЛЕМ 227 (vi) если g (?) | ft (|) для некоторого i, то (vii) f (Н) | 1 тогда и только тогда, когда f (?) <¦—- 1; (viii) / (?) | 1 тогда и только тогда, когда f (|) = а для неко- некоторого а ? К, а ф 0; (ix) — является отношением эквивалентности между элемен- элементами К; (х) f (I) — g (I) тогда и только тогда, когда f (?) = ag (!) для некоторого а 6 К, а Ф 0; (xi) ^ / (I) Ф 0, deg (g (!)) = deg (f A)) «г©|/ A), /no Я Ш - / A); (xii) если f (?), g (^) нормированные, то f (%) ~ g (Q тогда и только тогда, когда f (I) = g (I); (xiii) если / (|) # 0, mo существуют единственное а 6 К, a =^ О, ц единственный нормированный полином g (%) 6 К такие, что f (%) = ag (I); следовательно, существует единственный нормиро- нормированный полином g (I) 6 К, для которого f (I) ~ g (I). Доказательство. Все доказательства совершенно эле- элементарны. По существу единственные новые моменты имеются в (viii) — (xi). Сначала рассмотрим (viii). Как мы уже видели, если а ? К, а Ф 0, то а | 1. Предположим, что / (|) | 1. Тогда, очевидно, / (|) ф 0. Если мы покажем, что deg (f (|)) = 0, то этого будет доста- достаточно. Предположим обратное, скажем, deg (/ (g)) = n > 0 для некоторого п. Тогда в силу / (?) | 1 существует g (|), для которого 1 = / (Ю g (Ю- Конечно, g (|) Ф 0. Отсюда, согласно 5.11 (ii), 0 = deg A) = deg (/ (?)) + deg (g (?)) > n > 0, что невозможно. (ix) следует непосредственно из (iv) и определения 6.22. Чтобы доказать первую половину (х), предположим, что f (?) — g (|). Если один из полиномов f (I) или g (|) равен 0: f (|) = 0 или g (?) = 0, то и другой тоже равен 0. В этом случае / ({•) = g(Q. Пусть теперь f (I)Ф0, g A)Ф0. По определению ~, для некоторых КЦ), ЛаA) имеем f (I) = М?) Я ф. ЯШ = ^(Ю/Ш, т.е. / (|) = ft, (|) g (|) = A, (|) fta (|) / A). Так как f (l) Ф 0, то отсюда вытекает 1 = /ц (|) /i2 (i). Следователь- Следовательно, At A) | 1, т. е., согласно (viii), существует a 6 К, для которого афО и Aj(i) = a, т.е. / (|) = ag ф. Доказательство второй половины (х) и (xi) — (xiii) предостав- предоставляем читателю.
228 гл- 6- РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ Простые полиномы. 6.24. Определение. Мы говорим, что полином Р E) F К Ш) является простым в К Ш, или неприво- неприводимым над К, если р (?) # О, р (?,) ^ 1 и если для лю- любого f (?.) 6 К (I) из f (?) | р (?) следцет или f Cg) ~ 1, илн Это и есть «настоящая» аналогия понятия простого целого числа. Заметим, что, согласно 6.23 (xiii), с каждым простым р (?.) связан единственный нормированный полином q (Н) такой, что р (|) ~ q A). Из 6.23 (ix) следует, что q (|) также простой. Далее, для простого q (?), если / (?) | <7 Ш и / Ш нормированный, то f (I) = q (!) или /(с) = 1. Таким образом, нормированные простые полиномы обе- обеспечивают единственность представления произвольных простых полиномов в том же смысле, в каком положительные простые числа обеспечивают единственность представления произвольных про- простых чисел. Заметим также, что, согласно 6.23 (viii), / (Н) =^0, f (?) /+- 1 эквивалентно, deg (/ (|)) > 0. 6.25. Теорема. Если f &) е К Ш, deg (f (|)) > 0 и f (I) не прост в К t?J, mo существуют такие g(|), /г (?), что / (|) = = gf (I) Л (Ю- причем 0 < deg fe (|)) < deg (f (|)) u 0 < deg (/г (g))< < deg (/ (E)). Доказательство. Так как полином / (I) не прост, существует полином g (?,), для которого g(?)|/(i), но g(|) ^ 1, gf (l)'T-'f (!)¦ Показываем от противного, что разложение f (|) = =g(e) /i(l) — искомое. Действительно, если, например, deg(g(?.))=O, то g (?) = а € К и g (?.) ~ 1, что противоречит непростоте f (|). Аналогично разбираются три оставшихся случая: deg (g (^)) = - deg(/ (?)), deg (h (I)) = 0, deg (h A)) = deg (/ (?)). Теорема 6.25 является аналогом теоремы 4.41. Понятие степени связывает с каждым полиномом неотрицательное целое число, при- причем каждое нетривиальнее разложение ведет к меньшим неотрица- неотрицательным целым числам в качестве множителей. Мы можем теперь использовать полную упорядоченность неотрицательных целых чисел для того, чтобы показать, что конечным числом шагов можно разложить f (?) на простые множители. Тем самым будет доказана теорема существования разложения. Чтобы получить теорему един- единственности, необходим аналог утверждения 4.47 (iii), т. е. нужно показать, что неприводимый полином, делящий произведение, делит и хотя бы один из сомножителей. Доказательство 4.47 (iii) основывалось на изучении свойств н. о. д., которые, в свою очередь, выводились из алгоритма деления 4.37. Приступая к поискам аналога деления с остатком для полино- полиномов, естественно предположить, что (используя упорядоченность степеней полиномов) остаток должен иметь степень, меньшую степени делителя (конечно, если только случай нетривиален,
6.4. ПОЛИНОМЫ НАД ПРОИЗВОЛЬНЫМ ПОЛЕМ ¦ 229 т. е. степень делителя #0). Это и послужит нам идеей точной фор- формулировки. С другой стороны, само построение алгоритма деления полиномов будет прямо следовать известному алгоритму деления полиномов с действительными коэффициентами, изучающемуся в школьном курсе алгебры. Рассмотрим, например, деление полинома / A) = = 51* + I2 — 1 на полином h A) = I2 — 2Н + 2 (над полем Ra). Обычная процедура выглядит так: F.4.1) 5-1*+ 0-13+ 1-12+ 0-1- 1 5 • Е4 — 10 - а3 +10 - ?2 + 0.Е+ 0 10 10 •I3 - 9-1* —20-12 + о + 20 •5 — •! + 1 0 11 -S2 — 22-I;+ 22 2-^-23 или, в несколько другой форме*), F.4.1)' 5?2 + 10? +11 0 11^-201- 1 11|2-221 + 22 2| — 23 Таким образом, F.4.2) E?« + g2 - 1) = = (Е2 — 21 + 2) E|2 + 101 + 11) + BН — 23), т.е. частное равно 5?2 + 101+ И, а остаток равен 21 — 23. Вся процедура словами описывается так: мы начинаем с полиномов / A) =g1" +a'V*+ ..., h(l)^blm + b'lm-l+ ..., где, скажем, т^.п. Берем «пробное» частное высшей степени, (а/ЬIп-т. Затем умножаем его на &A), сравниваем результат *) В оригинале приводится только вторая форма F.4.1)', первая является стандартной для советских школ.— Прим. перев.
230 гл- 6- РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ с f(!) и образуем разность: F.4.3) f(l)-^ln-mh{l) = ~-tn-1 Результатом является полином fj(!) степени <^n—I, fi(!) = = el71'14- . .., где с = а' — (ab'/b), причем F.4.4) fa) = jtn-mh(t) + h(t)- Если т>п—\, то на этом дело заканчивается. В противном случае повторяем процесс с Д(!). Если сфО, то получаем на следующем шаге F.4.5) Ы6) = уБ(п-1)-тЛF)+Л!(?), где fz (!) имеет степень ^п — 2. Повторяя эту процедуру, мы в кон- конце концов достигнем представления f (!) в виде суммы членов, каж- каждый из которых имеет h (!) в качестве множителя, и остатка степени <deg(A(|)). Алгоритм деления для полиномов 6.26. Теорема. Предположим, что f (!), /i (!) 6 К [!1, где deg (/i (I)) > 0. Тогда существуют q (!), r (!) ? К Ш такие, что f{l) = h (!) ?Ш + г(9«0< deg (г A)) < deg (Л A)). Далее, если V' A), г' (I) 6 К Ц], f(l) = h (I) q (I) + г' (!) и 0 < deg (r (g)) < < deg (Л (!)), /по </' (I) =q(l) и г (I) = /¦(!). Доказательство. Пусть ft (!) = 2 ^^г> ГДе ^ >• 0 и Ьт Ф 0; для краткости пусть Ь = Ьт. Сперва мы докажем индук- индукцией по степени п полинома / (?) существование, т. е. возможность искомого представления для всех f (?) степени <л. Заметим сразу, что если deg (/ (!)) < т, то такое представление существует: g (I) = 0, г (?) = / (|). В частности, оно выполняется и для п = 0. Теперь мы покажем, что если оно выполняется для я — 1^-0, то оно выполняется и для п. Согласно замечанию, достаточно рас- п смотреть лишь / (!) с deg (f (I)) = л > т. Пусть / (!) = 2 йг^ г=0 с ап =7^ 0, причем для краткости обозначим а = ап. Положим Л (!) = f (!) — (a/ft) !n~m Л (!). Как мы уже видели, deg (Д (?)) < <^ п—1. Согласно индуктивной гипотезе, должны существовать такие qt Ц), г4 (!), что Д (!) = Л (!) qt Ц) + г4 (!) и 0 < deg (r, (|)) < < /п. Таким образом, находим </ (!) = (a/b) ln~m + qt (!) и rj (!) = = г (!).
6.4. ПОЛИНОМЫ НАД ПРОИЗВОЛЬНЫМ ПОЛЕМ 231 Чтобы доказать единственность, предположим, что ц' (?), г' (?) также удовлетворяют данным условиям. Тогда h (?) (q (?) — — q (I)) = г (?) — г' (?). Если q (?) =? <7 (!)» то степень левой части ^-deg (h (?)) согласно 5.11 (ii), тогда как по 5.11 (i) степень пра- правой части <max (deg (г A)), deg (г' (?))) < deg (/г A)). Поэтому q (?) = <7 (?) и г' (?) = г (?). Заметим, что теорема 6.26 содержит теорему 5.13 в виде частного случая. Действительно, предположим, что / (?)\ Ф О, а ? К и / (с) = = 0. Существуют такие <7 (?), /* (?)> что / (?) = (? — a) q (?) + г (I) и 0< deg (r(l))< deg (? — а), т.е. deg (г A)) = 0 и г (I) = Ь для некоторого 6 ? К- Но тогда 0 = / (а) = 6, т. е. (| — а) | f (^). Теорема 6.26 также дает следующее полезное свойство полноты: если / (I), h (I) 6 К Ю и f (I) делится на h (\) в каком-нибудь поле, большем, чем К, то оно делится на А (Е) и в К [?]. Это мы сейчас докажем. 6.27. Теорема. Предположим, что К — подполе поля |_. Предположим также, что f (|), Л E) 6 К 1^1. ?слц h (%) | / (I) б LIU, mo /i(S) |/A) б КЦ]. Доказательство. Особый случай, deg (h A)) = 0, три- тривиален. В остальных же случаях существуют такие q (H) 6 L 111, что / A) = Л (I) q (I), и такие q (I), г Ц) 6 К A), что / (?) = = А (!) <7 (!) + г (!) и 0 < deg (г (!)) < deg (h (I)). По свойству единственности из теоремы 6.26, примененной к L Ю, имеем q (?) = = ?(!), г(!) = о. Таким образом, мы можем теперь говорить о h (?) | / (?) без уточ- уточнения, в каком именно поле частных эта делимость имеет место. Не стоит, однако, торопиться с заключениями о других аналогично звучащих утверждениях. Например, если р (?) неприводим в К, то это еще не значит, что он неприводим и в |_, где KcL (Почему?) Наибольшие общие делители 6.28. Определение. Предположим, что f (%), g (%), d (?) € 6 К [?]. Мы назовем d (!) наибольшим общим дели- делителем (н. о. д.) / (?) и g (?) б К [?], если (i) d (?) | f (?) и d (?) | g (?); (ii) из h (?) 6 К [|] и h (?) |f (?), h (?) | g (?) слфяя Л (!) | d (?). Метод доказательства существования и единственности н. о. д. (с точностью до ~) для полиномов копирует метод, примененный к целым числам. 6.29. Теорема. Предположим, что S s К Ш и что (i) S содержит хотя бы один ненулевой полином; (ii) если s (?) 6 S и h (?) 6 К [?], то s (?) h (?) 6 S; (iii) еаш s Ш, / (?) ES,fflos (?) + /(?)€ S-
232 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ Тогда существует такой полином d (!) ? К Ш, что d (Е) Ф 0 и (iv) для всех /г A) 6 К [?], /г (Е) 6 S тогда и только тогда, когда d{l)\h (Е). [Отсюда, в частности, d(E) 6 SJ Далее, если d{ (H) — любой другой полином, удовлетворяющий условию (iv), /no d (Е) ~ d4 (Е.), так что существует единственный нормированный полином d (?,), удовлетво- удовлетворяющий условию (iv). Доказательство. Рассмотрим S* = {т: т ^ 0 и, для некоторого s ({•) 6 S, s(^0h deg (s (I)) = m). Мы знаем, что S* ф 0 и S* s Po = Р U {0}- Поэтому, как под- ыножество вполне упорядоченного множества Ро D.25), S* имеет наименьший элемент; назовем его п. Тогда мы можем найти неко- некоторое d (Н) 613 с d (?) Ф 0 и deg (d (Е)) = п. Покажем, что (iv) выполняется для любого такого d (Е). Если я = 0, т. е. d (%) = = d ? К, то также 1 = d»\/d 6 S- Но тогда h (?) 6 S для всех h (Е) согласно (ii). С другой стороны, d \ h (Q для всех h (?). Итак, слу- случай л = 0 разобран. Пусть теперь я > 0. Если d (E) | /i (E), то /i (Е) = d (l)»q (I), где q (E) 6 К [Е]; отсюда h (E) 6 S согласно (ii). Предположим, наоборот, что /г (Е) 6 S- Тогда, согласно алгоритму деления 6.26, существуют такие q (|), г (Е), что h (|) = d (?) G (Е) + + г (Е) и 0<; deg (г (Е)) < я. Если г (Е) = 0, то все доказано. Если же г (Е) ^= 0, то из (ii) и (iii) мы видим, что г (I) g S. Если deg (r (EJ) = т, то т 6 S* и т < я. Но это противоречит выбору л как наименьшего в S*. Что касается единственности, то если dt (E) является любым другим полиномом, удовлетворяющим условию (iv), то d(E) 6 S и d, (?) ? S; таким образом, применение (iv) к d и di дает d Ц) \ di (E) и dt (E) | d (Е), т. е. d (Е) ~ ^ (Е). Теорема 6.29 доказана. 6.30. Теорема. Если / (Е), g (Е) 6 К Ш и f Ц) Ф 0 нл« g- (^) =^=0, то / (Е) и g (|) имеют единственный нормированный н. о. д. d (Е) в К [?]. Кроме того, существуют такие s (|), ^ (Е) 6 6 К A), что d A) = / (I) s(l) + g (Е) ^ (Е). Доказательство. Пусть S состоит из всех полиномов вида / (Е.) s (Е) + g (I) t (EV Конечно, / (Е), g (E) 6 S и S удовлетво- удовлетворяет условиям 6.29 (i) — iii). Если мы выберем нормированный d(l), удовлетворяющий 6.2У (iv), то d(Q\f(l) и d(Q\g(?). Далее, если h (Е) | / (I) и /i (|) | g (E), то из определения множе- множества S следует, что каждый элемент из S делится на h (E). В частно- частности, h (?) | d (E). Следовательно, d (E) является нормированным н. о. д. Очевидно, если dx (E) — любой другой нормированный н. о. д., то d (E) ^ di (Е). Но тогда d (Е) = dt (l) согласно 6.23 (xii).
6.4. ПОЛИНОМЫ НАД ПРОИЗВОЛЬНЫМ ПОЛЕМ 233 6.31. С л е д с т в и е. Предположим, что f (Е), g(%), d (i) 6 6 К IV, f(l)?=0 или g (EJ Ф 0, di (|) 6 L [EJ, причел d (E), d, (E) — нормированные н. о. д. f (?) « g (Е) в К [|], L (?) соответственно. Тогда d (g) = dj (|). Таким образом, н. о. д. сохраняется в любом расширении поля. 6.32. Определение. Определим (f (Е), g (?)) для всех f (Е), g (?) 6 К [?J с f (E) =^ 0 или g (%) Ф 0 как единственный нормиро- нормированный н. о. д. d (|) полиномов / (|) Hg (|). Полиномы, f (i) « g (E) называются взаимно простыми, если (/ (?), ^ (|)) = 1. Несмотря на то, что доказательство теоремы 6.30 еще не дает нам в явном виде алгоритма для отыскания (f (I), g(D), такой алгоритм построить нетрудно. Здесь может быть применена та же самая формальная процедура, что и в 4.42, т. е. аналогичная алго- алгоритму Евклида для целых чисел. Мы предоставляем читателю найти такие примеры в упражнениях. Следующие две теоремы являются прямыми аналогиями 4.40— 4.48. Вторая элементарно выводится из первой и предыдущих результатов. 6.33. Теорема. Предположим, что f (I), g {I), h (!) 6 К 1|]. Тогда @ если (f (I), h &)) = 1 и h(l)\f(l)g (I), то h (I) \ g (E); (и) если (f(Q, g(t)) = h f(l)\h(l) и gG)\h(t), то f(t)g№ I MI)- Доказательство, (i). Если (/ (E), h (E)) = 1, то по тео- теореме 6.30 существуют такие s (E), t (E) 6 К Ш, что / (|) s (E) -j- + h (I) t (E) = 1 и потому f (E) g?) s(l) + h (E) g (g) t A) = g (E). Ho h (l) делит левую часть, следовательно, h (|) [ g (E), что и тре- требовалось. (П) видно непосредственно: надо написать h (Е) = / (Е) q (E) и применить часть (i) к g (Е) | / (|) q (I). 6.34. Теорема. Предположим, что f (E), g (E), /j (Е), . . . • • •. fn (I) € К [EJ и что р (Е) прост в К [|]. Тогда (О если p(l) U (Е), то (f (Е), р (Е)) = 1; (п) если p(l)\f (E) g (I), то р (Е) | / (I) или р (I) \ g (E); п (Hi) если рA)\ П ft(l), то p(l)\fi(l) для некоторого i. t=i Доказательство предоставляется читателю. Теорема об однозначной разложимости полиномов. Теперь мы можем получить главный результат. 6.35. Теорема. Предположим, что / (Е) 6 К [EJ, cleg (f (E)) > > 0. Тогда (i) существует последовательность (pi (|), . . ., рп (EJ) поли- полиномов, простых в К (Е), такая, что /(Е) = Pi (?)... ph (Е), ц
234 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ (п) если (qx (!), . . ., <7г(!))— любая другая последователь- последовательность полиномов, простых в К Ш, такая, что f (!) = q{ (!) ... . . . qt (!), то k — I и, для некоторой перестановки F в {1, . . ., k), qi (!) ~ pF(i) (!) для всех i < k. Доказательство проводится аналогично доказатель- доказательству теоремы 4.50 возвратной индукцией типа 4.49 по степени полинома / (|). Итак, мы полагаем A) А = {п: п > 0<и для всех f (!) 6 К Щ с deg (/ (!)) = п выполняются (i) и (п)}. Индукция состоит в том, чтобы из B) т 6 А для всех 0 < т < п вывести C) я 6 Л. Предположим, что нам задан / (§) 6 К Ш с deg (f (?)) = я. Для доказательства того, что (i) выполняется для f (E), мы рассмотрим две возможности. Если / (I) прост, то мы правы. В противном слу- случае, как мы знаем из 6.25, D) существуют такие g(Q, h (I) 6 К Ш, что f (I) = = g (!) А (!), 0 < deg (g (!)) < п и 0 < deg (A (!)) < п. Отсюда, согласно A) и B), g (!) и h (!) могут быть разложены в про- произведения простых полиномов; тем самым (i) выполняется и для Чтобы доказать, что для f (!) выполняется (п), предположим, что мы имеем E) f (!) = Pi (!)... ^ (!) = qi (!)... ^ (!). В силу простоты множителей в обеих частях равенства, из k = 1 следует / = 1; аналогично если I — 1, то k = 1 и все очевидно. Пусть теперь /г > 1 и / > 1. Согласно 6.34 (ш), р4 (!) | ^- (!) для некоторого /. Но р^ (!)-+¦ 1, следовательно, по определению про- простоты q} (!), pi (!) ~ q} (!), <7;- (!) = api (!) для некоторого а ф 0. Отсюда F) р2 (!)... pfe (!) = aqt (I) ... qj-i (!) qJ+i (!)... ^г (!). В левой части стоит полином степени т, 0 < /п < я. Полином а^ (!) простой в силу простоты <7i (!)¦ Теперь, по индуктивному предположению B), k— 1 = /— 1 и полиномы из правой части равенства F) после перестановки соответственно эквивалентны полиномам из левой части. Эта перестановка элементарно продол- продолжается до искомой перестановки в E).
6.4. ПОЛИНОМЫ НАД ПРОИЗВОЛЬНЫМ ПОЛЕМ 235 Доказанную теорему можно записать и в следующей форме: 6.36. Теорема. Предположим, что f (?) 6 К Ш, deg / (?) > > 0. Тогда (i) существуют такое й 6 К с аф 0 и последовательность (/?! (?), . . ., pk (?)) нормированных полиномов, простых в К [?], что f (?) = ар, (I) ¦¦¦ ph (?); (ii) если Ь 6 К, ft # 0, ц (^ (?), . . ., qt (?)) — любая другая последовательность нормированных полиномов, простых в К Ш, такая, что f (?) = bqt (I) ... q, (?), mo k = /, a = b и, для некоторой перестановки F в {1, . . ., k), qi A) = pF(i) (l) для всех i < k. Доказательство предоставляется читателю. Применение доказанных теорем в общей ситуации пока еще невозможно — ведь для этого при данном поле К нужно знать, какие именно полиномы неприводимы над К- В противоположность ситуации для целых чисел, для произвольного поля К этот вопрос достаточно труден. Можно показать, что алгоритм, позволяющий по коэффициентам полинома узнать, приводим ли он над Ra, суще- существует, но практически пользоваться таким алгоритмом очень труд- трудно. Поэтому чаще исследуют отдельные специальные классы поли- полиномов. Сейчас мы приведем только один подобный результат, касаю- касающийся полиномов степени не выше 3 над произвольным полем. 6.37. Теорема. Предположим, что / (?) 6 К 1?1 и п = = deg (/ A)). Тогда (i) если п = 1, то f (|) прост в К Ш; (ii) если п = 2 или п = 3, то полином f (|) прост в К Ш тогда и только тогда, когда f (?) не имеет корней в К- Доказательство, (i) очевидно. Рассмотрим (ii). Если / (?) имеет корень а в К, то (| — а) | / (?) согласно 5.13. Очевидно, (? — а) <±> 1 и ? — a <-f- / (|) и потому f (?) не прост. Обратно, если f A) не имеет корней в К Ш, но / (I) не прост, т.е. может быть разложен: / (?) = g A) /i (?), то deg (g- (?)) = 1 или deg (h (?)) = 1. (Здесь мы использовали усло- условие п = 2 или я = 3.) Следовательно, один из g (?), /i (?) имеет вид ail + а0, гДе Gi =7^ 0. Но тогда —й0М будет корнем / (t). Теорема доказана. В частности, если / (I) 6 Ra Ц] имеет степень 2 или 3, то мы можем установить, является ли / (?) простым над Ra, путем уничто- уничтожения дробей, т. е. получения эквивалентного полинома с целыми коэффициентами, и последующего применения 6.19. То, что в Ra требуется рассмотреть конечное число дробей, дает нам в этом слу- случае простой алгоритм. Однако зачастую лучше применять 6.20
236 гл- 6- РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ или 6.21. Между прочим, 6.21 показывает, что имеется бесконечно много простых полиномов степеней 2 и 3. Если К — конечное поле — скажем, одно из полей вычетов по модулю простого целого числа,— то любая задача (в частности, вопрос о полноте), очевидно, решается конечным перебором. Для степеней п ;> 4 доказанная теорема просто неверна. Например, ?2 — 2 не имеет рациональных корней; следовательно, их не имеет и / (|) = (|2 — 2J. Однако этот полином уже не являет- является простым в Ra [?]. С другой стороны, можно показать, что в Ra [!} для каждого я > 3 существует бесконечно много простых полиномов степени п. Ситуация радикально меняется, если мы переходим к другим полям. Среди основных результатов, которые мы полу- получим, будет и тот, что каждый простой полином в поле действитель- действительных чисел имеет степень 1 или 2, тогда как в поле комплексных чисел он обязательно имеет степень 1. Используя теорему разложимости, мы в обоих случаях получим, таким образом, полную картину строения всех полиномов. Закончим эту главу общим результатом, в котором используется н. о. д. полиномов. Как мы увидим, этот результат будет полезен при отыскании корней полиномов. Предположим, что с ? К и что / (с) = 0, где / (!) (Е К [|] и / (!) Ф 0. Может случиться, что не толь- только (I — с) | / (|), но и A — cf | / (?). С другой стороны, сущест- существует наибольшее положительное целое число т такое, что (? — — с)т \f(%) (пг существует и т <; deg (f (!)) по теореме 5.11). Сфор- Сформулируем общее определение. 6.38. Определение. Предположим, что f (!) 6 К Ш, f (I) Ф 0 и что f (с) = 0, где с 6 К- (i) Под порядком или кратностью с в / (Е) мы пони- понимаем наибольшее положительное целое число т такое, что (г -cr\f a). (ii) Мы называем с простым корнем полинома f (I), если его порядок в f (\) равен 1; в противном случае мы называем с кратным корнем /(!). Предположим, что с— корень / (?) порядка т (т > 1). Тогда F.4.6) f(l) = (l-c)mg(Z), где g (с) Ф 0, ибо в противном случае (? — c)m+1 | / (?). По теоре- теореме 5.17 F.4.7) /' (|) = m (I — с) g (I) + (t - c)m g' (|), где m = ml. Пусть F.4.8) d (I) = (f (I), f (I)) и h (I) = / {Did (I). Может случиться, что d (!) ~ / (!) (при /' (!) = 0) и тогда ft (!) — постоянная. Например, так обстоит дело в поле 1Р с полиномом
6.4. ПОЛИНОМЫ НАД ПРОИЗВОЛЬНЫМ ПОЛЕМ 237 f (!) — \v — а- Однако мы утверждаем, что F.4.9) если m Ф 0, то ft (с) = 0 и с является простым корнем h ф. Действительно, из F.4.7) нам известно, что (! — с) | /' (!) и, следовательно, (! — с)™ \ d (!). Если (! — с)т ] d (Q, то также (! — с)т | / '(I). Отсюда следует, что (i — e) | mg (!). Но m ф О и (| — с) /j' m. Следовательно, (! — с) \ g (!). Это, в свою очередь, ведет к противоречию: g (с) = 0. Таким образом, с в d (!) имеет порядок m — 1, т. е. мы можем написать d (!) = (! — с) /г (!), где /г (с) =^= 0. Тогда необходимо & (!) | g (!), g (!) = /г (!) gi (!) и Д (|) = (Е — с) gi (|). Отсюда, поскольку g (с) =^= 0, имеем gi (с) Ф 0, и F.4.9) доказано. Таким образом, доказана следующая 6.39. Теорема. Предположим, что т\ Ф 0 для каждого теР- Пусть f (|) 6 К [?], / (?) ^ 0, d (I) = (f (I), f (D) « /i (I) = = f(l)/d(l). Тогда (i) Д (!) имеет те же самые корни в К> что и f (E); (ii) Д (!) имеет в К только простые корни. Заметим, что предположение ml ф 0 выполняется в любом упо- упорядоченном поле и что выбор fx (!) не зависит от К, так как /' (!) и d (!) не зависят от К: и н. о. д., и Д (S) могут быть найдены при помощи алгоритма Евклида и алгоритма, деления. Если d (!) = 1, то / (!) = Д (!) и поэтому / (!) имеет только простые корни в любом поле К, содержащем его коэффициенты (так как т\ Ф 0 для всех т 6 Р)- Обратное верно только для слу- случая, когда все полиномы, простые в К, имеют степени 1; в этом слу- случае, если / (!) имеет в К только простые корни, то d (!) = 1. Это доказывается индукцией по степени полинома / (!) с использованием F.4.6) и F.4.7). Дополнительное условие относительно К существен- существенно. Например, полином / (!) = (!а — 2J в Ra [!] имеет в поле Ra только простые корни (ведь он совсем не имеет корней в Ra), но Упражнения 1. Доказать теорему 6.23 (xi) — (xiii). 2. Доказать следствие 6.31. 3. Доказать теорему 6.36. 4. Найти н. о. д. (/ (|), g (I)) для следующих полиномов в Ra [|]: (а) / (Е) = Е« _ 1, g(E) = 6»-l; (б) / (|) = 2|з - 2, g ® = g* + Р + I2 + I + 1; (в) me) = i% + г + 1. g ® = i4 + ia + 1. 5. Найти н. о. д. (f (|), g (I)), где / (i), g (?) заданы, как в упражнении 4 <в), но рассматриваются как полиномы в 12 [|]. 6. Какие из следующих полиномов просты в Ra [|]? Доказать ваше утверждение. (а) Еа+ 5-1; (б) 12+ 3g —4; (в) ?> - 12; (г) Е» + 5 - 2.
238 ГЛ. 6. РАЦИОНАЛЬНЫЕ ЧИСЛА И ПОЛЯ 7. Разложить полином / (?) = |б — i на полиномы, простые в Ra [|]. Доказать, что ваш ответ верен. 8. Найти все полиномы степени <3, простые в 13 [|]. 9. Пусть К — любое поле, в котором все простые полиномы имеют степень 1. Предположим, что / E) 6 К [|] и / (!) Ф 0. Показать, что если / (!) не имеет кратных корней в К, то (/ (g), /' (%)) = 1. 10. Предположим, что полином р (!) прост в К [?]. Для любых / (i), g (I) е К Ш положим f(l)=g (I) (mod p (Q) при р Ц) \ (/ (?) - g (?)) и / (|) ф g (|) (mod p (I)) в противном случае. Показать, что если / (б) Ф ф 0 (mod р &)), то существует такое /4 (|) g К Ш, что / (|) /( (g) = 1 (mod p (I)). Из какой идеи это следует? 11. Показать, что любые / (|), g (!) ? К Ш имеют наименьшее общее кратное (н. о. к), т. е. полином т (|) такой, что / (!) I т (|), g (?) | m (|) и из f(l)\h (I), g(l)\h (I) следует m(l)\h (I). 12. Рассмотрим элементы р поля К (!) рациональных форм над К. (а) Показать, что если g (!), h (I) 6 К Ш, g (|) =/= 0, Л (!) =? 0 и (g (%)r h (!)) = 1, то существуют такие s (i), < (I) ? К [|], что 1 = s (!) , < (!) г F) а F) г F) "*" л (Б) ' (б) Показать, что любой р ? К (!) может быть представлен как сумма некоторого числа членов, первый из которых принадлежит К [|], а остальные имеют вид г (Ъ)/(р (I))* для некоторых г (|), р (%) ? К [|], где р (|) прост в К Ш, i > 0 и deg (г (!)) < deg (р (|)). (Эта часть называется разложением р над К в сумму простых дробей.)
ГЛАВА 7 ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 7.1. К расширению системы рациональных чисел Алгебраические мотивировки. В начале предыдущей главы мы сформулировали алгебраические и геометрические мотивировки для введения рациональных чисел. Первая мотивировка, выражен- выраженная на языке полиномов, состоит в том, что даже линейное уравне- уравнение а\ — Ь = О с целыми коэффициентами не всегда разрешимо в целых числах. При этом сама идея построения расширения К системы I, в котором такие уравнения были бы всегда разрешимы (конечно, в случае, когда мы вообще можем надеяться на существо- существование решения, т. е. при а Ф 0), непосредственно основывалась на этом алгебраическом подходе. Получив таким путем общее понятие поля, мы заодно убедились, что именно поля являются естественной областью коэффициентов для систем линейных уравнений. С дру- другой стороны, для уравнений степени л^>2 такой теоремы сущест- существования ни для поля рациональных чисел, ни для других полей мы не нашли. Так, по теореме 6.21 для любого п>1 и любого а ? I, отличного от л-й степени положительного числа, полином |и — а не имеет рациональных корней. Более того, не очень ясно, имеем ли мы право считать, что любой полином / (?) 6 Ra [?] степени п > 1 вообще «где-нибудь» имеет корень. Так, если мы принимаем геометрическую точку зрения, т. е. представляем себе числа как меры длины, то все системы, которые мы можем рассматривать, должны быть упорядоченными. Но в любом упорядоченном поле К, содержащем Ra, мы имеем х2 ^ 0 для любого х 6 К и потому х1 + 1 > 0, так что уравнение |2 + 1 = 0 не имеет решений ни в каком упорядоченном поле, содержащем Ra. С другой стороны, есть полное основание считать, что полином ?2 — 2 имеет корень в подходящем упорядоченном поле К, являющемся расширением Ra, т. е. х2 = 2 для некоторого х 6 К- Действительно, используя ту же геометрическую интерпре- интерпретацию чисел как длин, по теореме Пифагора получаем, что длиной гипотенузы прямоугольного треугольника с равными катетами дли- длины 1 должно быть как раз такое х, что х% = 2. Теперь перед нами два пути. С одной стороны, можно, используя теорему Пифагора, провести строгое построение нужного расшире- расширения поля геометрически. С другой стороны, желая сохранить общую
240 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА схему и стиль книги, можно попытаться получить построение алгебраически. Предпочтем второй путь. Пусть, действительно, (К, +, •, -<, 0, 1) — некоторое упорядоченное поле, содержащее Ra в качестве подполя, и пусть в К полином ?2— 2 имеет хотя бы один корень, скажем s, т. е. s2 = 2. Положим G.1.1) S = {а + bs: a, b e Ra} Очевидно, Ra s SL^ К- Покажем, что G.1.2) S образует упорядоченное поле относительно операций в К, ограниченных на S. Во-первых, S замкнут! относительно операций -J-, —, а также относительно умножения. Например, последнее следует из (ао+ Ъф) (^ + b1s) = аоау + (Mi + aQbi) s + Ь0Ь^ = = (aoai + 2babi) + (Mi + «o^i) s. Заметим, далее, что для любых а0, b0, au bt ? Ra G.1.3) а0 + bos = а4 + b,s тогда и только тогда, когда а0 == = ах и Ьо = bi. Действительно, тогда (Ьо — bt) s — at — а0, так что если Ьо — bt Ф фО, то s = (й1 — ао)/(Ьо — b^ e Ra, что невозможно. Отсюда следует, что а -\- bs = 0 тогда и только тогда, когда а = b = 0; в частности, если а + bs Ф 0, то и а — bs Ф Ф 0. Теперь видно, что S замкнуто относительно деления на ненуле- ненулевые элементы: 1 _ 1 (а—6s) _ a—bs a — bs a + bs ~ a + bs (a — bs) ~~ a2 —62s2 ~a2 —2b2 ' (Здесь a2 — 2b2 Ф 0 как произведение ненулевых элементов a + bs и a — bs; это видно и непосредственно, поскольку Z2 — 2 не имеет рациональных корней.) Таким образом, l/(a + bs) = а + ЬУ, где; а = а1{аг — 2?>2), Ь' =—b/(a2 — 2b2) и, следовательно, \1(а + bs) ? S. Утверждение G.1.2) тем самым доказано. Итак, по любому упорядоченному полю /С, содержащему квад- квадратный корень s из 2, мы можем построить некоторое минимальное подполе S, содержащее этот корень. Будем говорить, что s порож- порождает S (над Ra). Утверждение G.1.3) и наше доказательство замкнутости показы- показывают, как построить поле S непосредственно без ссылок на К- Сперва мы построим систему S такую, что S = 5: G.1.4) S состоит из всех пар (а, Ь), где о, & 6 Ra. Для (а0, Ьо), (ai, b^ мы определяем (ао, bo) + (ait bi) = (a0 + au b0 + b±)
7.1. К РАСШИРЕНИЮ СИСТЕМЫ РАЦИОНАЛЬНЫХ ЧИСЕЛ 241 U (а0, bo)»(au bi) = (аоа,, + 2bob1, aobi + аф0). Наконец, мы полагаем а = (а, 0) для каждого а 6 Ra и s = @, 1). Можно показать, что построенная система (S, +, •, 0, 1) пред- представляет собой поле, в котором множество Ra всех элементов а таких, что а 6 Ra, образует подполе, изоморфное Ra. Наконец, s2 = 2 в S- При желании можно также определить соответствующее отношение порядка <, относительно которого S является упорядо- упорядоченным полем. Мы покажем позднее, что вся эта схема может быть проведена и в общем случае. Именно, для произвольного нетривиального полинома / (?) ? Ra [?] с рациональными коэффициентами, мы можем, предполагая существование поля К, содержащего некото- некоторый корень s полинома / (?), изучить в этом поле соответствующее множество S, порожденное s. На основе этого изучения, как и выше, мы сможем найти не зависящее от К. прямое построение S как поля. Тем самым будет сделан первый шаг к построению общей теории полиномиальных уравнений с рациональными коэффициентами. Именно только первый шаг, потому что наше построение неудовле- неудовлетворительно с многих точек зрения. Во-первых, мы хотели бы иметь упорядоченное поле, конечно, тогда, когда это возможно (пример полинома |2 + 1 показывает, что такая возможность есть не всегда). Далее, поле, полученное по полиному / (|), содержит, вообще гово- говоря, только один его корень, мы же хотели бы, конечно, иметь поле, содержащее, так сказать, «все» корни. Наконец, общая теория поли- полиномиальных уравнений предполагает возможность совместного изу- изучения нескольких уравнений, т. е. совместного рассмотрения нескольких полиномов и их корней. Но для этого необходимо единственное поле, пригодное если не для всех полиномов сразу, то для какого-то их класса. Мы же, следуя нашей схеме, строим отдельное поле для всякого полинома и его корня, и не ясно, почему эти поля должны быть одинаковыми или хотя бы изоморфными. В главе 9 такое единое поле будет построено. Можно предпола- предполагать, что построение достаточно сложно и включает бесконечное число шагов, на каждом из которых рассматривается некоторый один полином. Геометрические мотивировки. По сравнению с изложенным алге- алгебраическим планом геометрические мотивировки для расширения системы рациональных чисел и геометрический подход к самому построению нужного расширения выглядят существенно проще, по крайней мере на первых порах. Далее, такой подход содержит новую полезную идею, находящую широкое применение в других областях математики, в частности в анализе и теоретико-множествен- теоретико-множественной топологии. Наконец, геометрический подход вместе с одним
242 гл- 7- ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА чисто алгебраическим соображением, касающимся комплексных чисел, даст нам удобный аппарат для изучения множества описан- описанных выше расширений. Тем не менее геометрические идеи, часто в дальнейшем рассма- рассматривающиеся, по-прежнему будут для нас играть вспомогательную роль, обычно эвристического характера, а все определения и теоре- теоремы будут основываться на чисто теоретико-множественных и алгеб- алгебраических понятиях. Причина этого состоит не в том, что мы в какой- то степени не доверяем геометрическим понятиям, а в том, что мы, желая сохранить стиль книги, не хотим вводить новые математиче- математические объекты, в данном случае геометрического характера, форму- формулировать точные предположения о них и т. д. Процесс измерения длин прямолинейных отрезков опирается на сравнение длин. Исходным шагом к любой попытке приписать отрез- отрезкам определенные числа в качестве длин является выбор единич- единичного отрезка. Рассмотрим часть бесконечной прямой, ограниченную О / Z J Р 4 5 Рис. 25. слева, т. е. луч (рис. 25). Поместим наш единичный отрезок так, чтобы один его конец совпал с крайней левой точкой луча (обозна- (обозначим эту точку символом 0), тогда другой конец отрезка попадет в некоторую другую точку луча (которую обозначим 1). Теперь, если нам нужно измерить некоторый отрезок, перенесем его также на луч, совместив один конец с точкой 0; другой конец пусть попадет в точку Р. Будем далее откладывать единичный отрезок вправо, обозначая последовательно его концы 2, 3, 4, . . .; здесь имеются две возможности. Или, отложив в л-й раз единичный отрезок, мы увидим, что его конец попал в точку Р; тогда мы будем считать п длиной отрезка 0Р и (считая заранее, что Р — длина отрезка 0Р) писать п — Р (для этого, собственно, мы и выбирали для точек числовые обозначения). Или, отложив единичный отрезок в л-й раз, мы обнаружим, что Р лежит между точками л — 1 и и (на рис. 25 изображена такая ситуация при л = 4). Естественно считать, что тогда л — 1 < Р < п C < /> < 4 на рис. 25). Мы уже знаем, что уточнить результат измерения можно, выбирая меньший единичный отрезок. Этот выбор удобно производить так, чтобы новый единич- единичный отрезок получался делением старого на равное число частей. Так, если единицей длины был дюйм *), то естественно в дальней- дальнейшем делить отрезок каждый раз пополам, а если исходной единицей был метр — то каждый раз на десять частей. Заметим, что такое *) Единица длины, применяемая в США, Англии и некоторых других странах: 1 дюйм = 2,54 см.— Прим. перев.
7.1. К РАСШИРЕНИЮ СИСТЕМЫ РАЦИОНАЛЬНЫХ ЧИСЕЛ 243 деление данного отрезка на произвольное число Ъ частей с помощью циркуля и линейки не представляет труда. На рис. 26, например, такое деление изображено для случая Ъ = 5. В общем случае про- процесс описывается так. Проведем через точку 0 любой другой луч и отложим на нем произвольный отрезок OPi Ь раз, обозначая точки деления Ри Р2, . . ., Ръ. Соединив точки Рь и 1 отрезком Рь\, проведем через каждую из точек Pt прямую, параллельную РЬ1. Точки пересс ения Qit Q2, ¦ ¦ ¦, Qb прямых с лучом и будут иско- искомыми точками деления отрезка 01 на Ъ равных частей. Выбор обо- обозначения для концов новой единицы измерения OQi диктуется теперь о ± А 1 1 5 5 5 5 Q, Q? Рис. 26. желанием сохранить выбранное соответствие между целыми положи- положительными числами и точками луча. Именно, конец Qx единичного отрезка OQi будем обозначать -г , а результат откладывания отрез- отрезка 0-т- а раз — через -г- . Тогда для точек 1, 2, 3, . . ., в соответ- соответствии с нашим выбором единичного отрезка, мы получим обозначе- 12 3 ния -т-, -г , -г , . . ., что и требовалось. Таким образом, всякой неотрицательной дроби -г со знаменателем Ъ мы поставили в соответ- соответствие некоторую точку луча—точку, обозначаемую -г-. Это соответст- соответствие можно продолжить до соответствия между всеми рациональными числами и некоторыми точками всей прямой. Действительно, если нам дана прямая, то выбираем на ней произвольным образом точку 0, откладываем вправо от 0 наш первоначальный единичный отрезок и, как выше, выделяем на правой полупрямой рациональные точки. Если теперь нам дано любое отрицательное рациональное число -т-, то ему ставим в соответствие точку, симметричную относительно 0 точке г-(ведь ^- — положительное рациональное число) (рис. 27). Заметим, что при таких обозначениях неравенство г± <С г2
244 гл. 7. Действительные числа имеет место тогда и только тогда, когда точка г^ лежит левее точ- точки гг. Свойство плотности рациональных чисел может теперь быть записано так: между любыми двумя рациональными точками г, s на прямой существует третья (например, -4—) • На первый взгляд свойство плотности означает, что на прямой нет других 5 U 2 3 Z Рис. 27. точек, кроме рациональных, т. е. что прямая «заполнена» рациональ- рациональными точками. Однако теорема Пифагора утверждает, что это не так: конец Р гипотенузы прямоугольного треугольника с равными кате- катетами длины 1, отложенной от точки 0, не может быть рациональной точкой, поскольку Р2 = 2. Если представить себе прямую как нить, то удаление точки Р (Р2 = 2, Р > 0) из нити должно разбить ее на два отдельных куска, причем все рациональные точки прямой сохранятся. Нетрудно показать, что между любыми рациональными точками прямой найдется иррациональная точка (почему?). Поэтому удаление всех иррациональных точек нити привело бы к полному распадению последней! Верхние и нижние классы сечений, непрерывно упорядоченные системы. Итак, мы видим, что точки прямой обладают несколько более сильным свойством, чем свойство плотности рациональных чисел. Сформулируем сейчас это свойство в чисто теоретико-множе- теоретико-множественных терминах. Рассмотрим, например, утверждение, что в упорядочении рациональных чисел есть «дырка», на месте которой «должно быть число V^2». Пусть А = {г. г ?Ra, r>0 и г2>2}, В = {г: г 6 Ra, г < 0 или г2 < 2}, т. е. А состоит из всех рациональных чисел, находящихся правее, или выше Yi, a В — из чисел, находящихся левее, или ниже У~2. Интуитивно ясно, что А и В обладают следующими свойствами (где S = Ra): G.1.5) (i) АФ0 и ВФ0\ (и) A[)B = S; (iii) если г ? В и s 6 А, то г < s; (iv) если г 6 В и г' < г, то г' 6 В; (v) если s 6 А и s < s', то s' 6 А; (vi) если г ? В, то существует г' 6 В с г < г'; (vii) если s ? А, то существует s' 6 А с s' < s.
7.1, К РАСШИРЕНИЮ СИСТЕМЫ РАЦИОНАЛЬНЫХ ЧИСЕЛ 245 Такую пару А, В, удовлетворяющую первым пяти условиям G.1.5), мы будем называть сечением в множестве S, а сами множества В, А — соответственно нижним и верхним классом сечения. Усло- Условимся нижний класс сечения обозначать -н, если он удовлетворяет условию G.1.5) (vi), т. е. не содержит наибольшего элемента, и обозначать его ¦«—i в противном случае. Аналогично, верхний класс будем обозначать н», если он удовлетворяет условию G.1.5) (vii). т. е. не содержит наименьшего элемента, и у-*- в противном случае. В нашем конкрет- (а)~* К *~ ном примере рациональных чисел возможны /^^ ц ^ три случая взаимоотношений верхнего и нижнего классов сечений (рис. 28). Чет- (в)~* X *" вертый случай, когда и верхний, и ниж- нижний классы имеют соответственно каимень- ший и наибольший элементы, т. е. *—(}—*¦, невозможен в силу плотности рациональных чисел. Интуитивно ясна теперь разница между множеством всех точек прямой и мно- множеством рациональных точек прямой: в первом случае возможны се- сечения только типов (а), (б), а во втором — всех трех типов: ведь сечение, с которого мы начали, как раз типа (в). Таким образом, исходя из геометрического понятия измерения, мы обнаружили такой «дефект» множества рациональных чисел, который допускает простое истолкование в терминах свойств упо- упорядочения. Заметим еще, что для упрощения рассуждений мы можем отка- отказаться от рассмотрения нижних классов сечений — ведь их можно определить как дополнения к верхним классам. Кроме того, если мы рассматриваем только верхние классы сечений, то можно огра- ограничиться теми, у которых нет наименьшего элемента, как в слу- случаях (а), (в): если такой класс есть, то всегда можно рассмотреть новое сечение, получающееся из данного переносом наименьшего элемента в нижний класс. 7.1. Определение. Пусть (S, <) — линейно упорядочен- упорядоченная система. (i) Под верхним классом в (S, <) мы понимаем мно- множество А е S, удовлетворяющее следующим условиям: (а) А Ф® и S — А Ф0; (б) если х 6 А и х < х', то х 6 А; (в) если х ? А, то существует х < х такое, что х' ? А. Мы обозначаем через U (S) совокупность всех верхних классов в S. (ii) Система (S, <) называется непрерывно упоря- упорядоченной, если (S, <) плотно упорядочена, не содержит первого или последнего элемента и, для каждого А 6 U(S), S — Л содержит наибольший элемент. Напомним определение 3.28 наибольшего элемента: для В — — S — А элемент у является наибольшим в В, если у ? В и у' ¦< у
246 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА для всех у' 6 В. Легко видеть, что если А — верхний класс в линей- линейно упорядоченной системе (S, <) и В = S — А, то A) если у ? В и х 6 А, то у <. х, так как в противном случае х <[ у и t/ 6 А соглас- согласно (б) из 7.1 (i); B) если у ? В я у' <: у, то у' ? В, так как в про- противном случае у' ? Л и тогда г/ 6 Л опять согласно (б) из 7.1 (i). Отсюда, если в дополнение к этому В не имеет наибольшего элемента, то мы видим, что условия G.1.5) выполнены; в этом случае система не будет непрерывно упорядоченной. В теореме 7.3 содержится доказательство того, что мы не поте- потеряли ни одной из наших первоначальных идей, касающихся и верх- верхнего и нижнего классов. 7.2. Определение. Пусть (S, <) — линейно упорядочен- упорядоченная система. Под нижним классом сечения в (S, <) мы понимаем множество В ^ S, удовлетворяющее следующим условиям: (а) В ф 0 и S — В ф 0; (б) если у 6 В и у' <с у, то у' ? В; (в) для любого у ? В существует такое у', что у < у' и у' 6 В. Обозначим через L (S) совокупность всех нижних классов в S. 7.3. Теорема. Если (S, <) — непрерывно упорядоченная система и В 6 L (S), то S — В содержит наименьший элемент. Доказательство. Предположим, что S — Б не содержит наименьшего элемента. Пусть А = S — В. Тогда А 6 U (S). Дей- Действительно, согласно 7.2 (а), и S — А (=В), и А непусты. Далее, если х 6 А, то у < х для всех у 6 В (в противном случае мы будем иметь х 6 В согласно 7.2 (б)). Отсюда, если х < х', то также у < х' для всех у 6 В, так что х' $ В, т. е. х 6 А. Наконец, если х ? А, то существует такое х' < х, что х' ? А: в противном случае х будет наименьшим элементом в А, что противоречит гипотезе. Таким обра- образом, все условия для А 6 U (S) выполнены. Отсюда, согласно 7.1 (и), В — S — А содержит наибольший элемент. Но это про- противоречит 7.2 (в). 7.4. Теорема. (Ra, <) не является непрерывно упорядочен- упорядоченной системой. Доказательство предоставляется читателю. Существование непрерывно упорядоченных систем. Интуитивно ясно, что множество всех точек на прямой линии образует непрерыв- непрерывно упорядоченную систему. Сейчас мы хотим дать строгое теоретико- множественное доказательство существования такой системы. И это доказательство, и весь круг идей, касающихся классов сечений, принадлежат Дедекинду. (Исторически эти идеи могут быть просле- прослежены в рассмотрении несоизмеримых величин греческим геометром Евдоксом, включенном в знаменитые «Элементы» Евклида.) Позднее мы дадим другое доказательство, основанное на идеях Коши. 7.5. Теорема. Пусть (S, <) — плотно упорядоченная, си- система, не содержащая ни первого, ни последнего элемента. Для
7.1. К РАСШИРЕНИЮ СИСТЕМЫ РАЦИОНАЛЬНЫХ ЧИСЕЛ 247 любых X,YeU (S) положим X < Y, если ГеХ и Y Ф X. Тогда: (i) (U (S), <Q — непрерывно упорядоченная система, которая содержит подсистему, изоморфную (S, <); (п) если система (S, <;) сама непрерывно упорядочена, то (и (S), <) с* (S, <). Доказательство. Интуитивно ясное определение отно- отношения <[ (X <^ Y) можно изобразить графически в виде рис. 29. Очевидно, что X <( X не выполняется ни для какого X и что отно- отношение << транзитивно. Чтобы за- закончить проверку утверждения A) система {U (S), <) ^ линейно упорядочена, нужно только для любых X X, Y?U(S) установить одно из трех р ?q соотношений: X < Y, X = Y, Г< <Х. Но если X ф Y, то X — Y или Y — X непусто, т. е. существует и ? X — F или существует у ? F — X. Покажем, что в первом случае X -< У. Действительно, в силу линейной упорядоченности E, <) для любого у ? Y либо t/ < и, либо ы < у. Но из t/ -< и по 7.1 (б) следовало бы ы ? F, что противоречит выбору и 6 X — К. Следовательно, и < г/ и г/ 6 X по 7.1 (б). Но это и значит F s X, откуда X -< F ввиду X =^ F. Второй случай трактуется симметрично. Прежде чем закончить доказательство непрерывной упорядочен- упорядоченности (U (S), <0, докажем вторую часть (i). По каждому а ? S естественным образом определяется множество B) Са = {х: х ? S и а < х} такое, что C) если a^S, то Са? U (S). Действительно, а в S — Са и, в силу отсутствия в S наибольшего элемента, существует х 6 S, для которого а < х, т. е. х 6 Са. Таким образом, 7.1 (а) удовлетворяется. Очевидно, удовлетворяется и 7.1 (б). Наконец, если х 6 Са, т. е. а<х, то ввиду плотности упорядочения 5 существует такое х 6 S, что а: < х' < х, откуда л'' 6 Са. Далее, D) если a, b 6 5 и a<b, то Са~^ Сь. Действительно, для a<Cb включения Сь е Са и Ь 6 Са — Сь очевидны, откуда Са -< Сь. Из D) следует, что отображение, ста- ставящее каждому a d S элемент Са из U (S), взаимно однозначно. Далее, если Са <^ Сь, то а < Ъ, так как в противном случае Ь <; а,
248 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА откуда Сь Ц Са по D), что противоречит A). Следовательно, E) ({Са: а е S}, <) ~ (S, <). Возвратимся теперь к системе U (S). F) Если а 6 5 и X ? U (S), то X < Са тогда м только тогда, когда а ? X. Действительно, если а 6 X и а < х, то х 6 X, откуда Со s X. Если Са = X, то мы будем иметь а <С х для всех х ? X, в частности, а<. а. Тогда Са с: X и, следовательно, X -< Са. Обратно, пред- предположим, что X <[ Са. Если а ($ X, то, как мы уже видели, а < х для всех х ? X. Другими словами, ХеС,иС„сХ, что невоз- невозможно. Отсюда а ? X. Теперь мы можем доказать G) (U (S), <Q — плотно упорядоченная система, не содержа- содержащая ни первого, ни последнего элемента. Для доказательства предположим, что X, Y ? U (S) и X -< Y. Тогда Y cz X, X Ф Y, X — Y Ф 0, и мы можем найти некоторое У Ь ? X — Y. Выберем такое a?X, что а<.Ь; тогда также , а ? X — У". Мы покажем, что "* е— i - X < Са и Со, < F (рис. 30). 4 V- ¦— (Естественное желание огра- X ничиться рассмотрением Сь Рис. 30. не проходит, так как может случиться, что Y — Сь', вот почему мы выбрали a<Z.b.), Теперь X < Са следует непосредственно из F). Из F) также следует, что Y ^ Са, так как а ($ Y, но, конечно, Са Ф Y (в противном случае Ъ 6 Y). Итак, X << Са <С, Y, что и требовалось. То, что в U (S) нет ни первого, ни последнего элемента, очевидно в силу F). Следовательно, G) установлено. Для завершения доказательства части (i) нашей теоремы нужно проверить непрерывность порядка в U (S). Итак, рассматриваем сечения (точнее, верхние классы сечений) в (U (S), -<Q. Положим (8) А е U (U (S)), если Ast/ (S), и (а) АФ0 и U (S) — АФ0; (б) если X ? А и X < X', то X' € А; (в) если X ? А, то существует такое X' 6 А, что X' <^ X. Такие «сверхклассы» можно представить себе, например, так (рис. 31). Согласно определению 7.1, чтобы доказать непрерывность поряд- порядка в системе (U (S), <0> нужно показать, что для верхнего класса А любого сечения в множестве U (S) множество U (S) — А обладает
7.1. К РАСШИРЕНИЮ СИСТЕМЫ РАЦИОНАЛЬНЫХ ЧИСЕЛ 249 наибольшим элементом. Но для любого такого А существует эле- элемент а ? 5 такой, что а < х для любого х 6 X, X 6 А (ведь U (S) — — А ф 0, т. е. существует Y 6 ?/ (S) — А и за а можно взять любой элемент а 6 S — Г; такой элемент а изображен на рис. 31). Это наводит на мысль, что искомым наибольшим элементом в множе- множестве U (S) — А будет сечение в 5, верхний класс которого Z состоит из всех элементов х, принадлежащих хотя бы одному классу из А, т. е. (9) Z = U X [X б А]. Итак, если мы покажем, что A0) Z 6 U (S) и Z — наибольший элемент в U (S) — А, то тем самым A1) система (U (S), <Э непрерывно упорядочена. Прежде всего Z непусто как непустое объединение непустых мно- множеств. Далее, S — Z Ф 0, поскольку а ? S — Z, где элемент а описан ранее. Если x?Zux<.x', то, в силу определения Z, х 6 X -« •—(«(((((( ( ( ( *¦ для некоторого X 6 А и тогда а х' 6 X и тем самым х 6 Z. Нако- % нец, если х 6 Z, т. е. х ? X для о некоторого X 6 А, то существует ' ис" такое х 6 X, что х < х и тем са- самым существует таксе х' ? Z, что х < х. Следовательно, Z 6 U (S). Очевидно также, что X ^ Z для любого X 6 А, поэтому если бы Z ? А, то Z6buio бы наименьшим элементом в А, что противоречит определению (8)(а) множества А- Итак, Z$ А и Z ? (У E) — А. Нуж- Нужно доказать, что Z — наибольший элемент в V (S) — А, т. е. что из Y с U (S) — А следует Z ^ Y. Но в силу определения верхнего класса X s F для всех X 6 А и тем самым Z = U X [X ? Al ^ V- Доказательство части (и) нашей теоремы предоставляем чита- читателю. Наибольшие нижние и наименьшие верхние грани. Свойство непре- непрерывности упорядочения системы может быть описано и без исполь- использования сечений, в терминах так называемых наибольших нижних и наименьших верхних граней, причем на практике чаще исполь- используется именно такое описание. 7.6. Определение. Пусть (S, <) — линейно упорядочен- упорядоченная система, и предположим, что А ^ S и А Ф 0. (i) Если Ь ? S и Ь <; хдля всех х 6 А, то говорят, что Ъ являет- является нижней гранью множества А. Если А имеет по меньшей мере одну нижнюю грань, то говорят, что А ограничено снизу (в S).
250 ГЛ. 7- ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА (П) Если а — нижняя грань множества А и Ь ^ а для каждой нижней грани Ь множества А, то говорят, что а — наиболь- наибольшая нижняя грань А (в S). (ш) Если b 6 S и х -< Ь для всех х 6 А, то говорят, что Ъ — верхняя грань множества А; если А имеет хотя бы одну верхнюю грань, то говорят, что А ограничено сверху (в S). (iv) Если а — верхняя грань А и а ^ Ъ для каждой верхней гра- грани Ь множества А, то говорят, что а — наименьшая верх- верхняя грань А (в S). Тривиально доказывается 7.7. Лемма. Предположим, что (S, ¦<) — линейно упорядо- упорядоченная система и А ^ S. Тогда (i) существует самое большее одно а ? S такое, что а является наибольшей нижней гранью А; (и) существует самое большее одно b в S такое, что b является наименьшей верхней гранью А. 7.8. О п*р е деление. Предположим, что (S, <) — линейно упорядоченная система и А ^ S. Тогда (i) если А имеет наибольшую нижнюю грань а ? S, то мы назы- называем этот единственный элемент а точной нижней гранью А {в S) и пишем а — inf А, а также говорим, что суще- существует inf А (в S); (и) если А имеет наименьшую верхнюю грань а 6 S, то мы назы- называем этот единственный элемент а точной верхней гранью А (в S) и пишем а == sup А, а также говорим, что суще- существует sup А (в S). Заметим, что inf А существует и inf A 6 А тогда и только тогда, когда А имеет наименьший элемент, а именно inf Л; аналогично для sup А и наибольшего элемента. Строго говоря, следует писать «infs А» и «sups Л». Например, если Л = {х: х ? Ra, 0 < х и х2 > 2}, то infRa не существует (при обычном упорядочении Ra), несмотря на то что Л ограничено снизу в Ra. С другой стороны, когда мы определим действительные числа и расширим (Ra, <) до (Re, <), infRe А будет существовать, именно infRe Л = 1^2. Поэтому, где это необходимо, мы будем писать «infs Л» или «inf Л в S». Часто пишут также «inf^ (x 6 А)» вместо inf Л и «supj. (х ? Л)» вместо sup Л. 7.9. Теорема. Предположим, что (S, <) — непрерывно упо- упорядоченная система, А ? 5 и А Ф 0. Тогда (i) если А ограничено снизу, то существует inf Л; (ii) если А ограничено сверху, то существует sup Л. Доказательство, (i) Если множество Л содержит наи- наименьший элемент а, то inf Л = а. Пусть теперь Л ограничено снизу и не содержит наименьшего элемента. Рассмотрим множество Л' = {х: у <; х для некоторого у 6 Л}. Покажем, что Л' 6 U (S),
7.1. К РАСШИРЕНИЮ СИСТЕМЫ РАЦИОНАЛЬНЫХ ЧИСЕЛ 251 т. е. что А' ф 0; S — А' Ф 0; из х 6 А', х > х следует х' 6 Л'; для любого х ? А' существует такое х ? Л', что х' < х. Первое следует из того, что Л Ф 0 и Л' э Л. Далее, ограниченность снизу множества А означает существование такого b ? S, что b -^ у для всех t/ 6 Л; но тогда b <; t/ и для всех у ? А' и, кроме того, b <С у, у 6 Л', так как в противном случае Ь было бы наименьшим элементом для Л' и, следовательно, для Л (из b ? А' следует b ^ x для неко- некоторого х?Л, откуда b = х 6 Л), что противоречит сделанному относительно Л предположению. Итак, Ь 6 5 — Л', т. е. S — А' Ф ф 0. Пусть теперь х ? А' и х' > х. Тогда х' 6 Л' по самому опре- определению Л'. Наконец, если для некоторого х 6 Л' не существует такого х' 6 Л', что х' < х, то х — наименьший элемент Л', и тогда, как мы уже показывали, х — наименьший элемент в Л, что про- противоречит допущению относительно Л. Итак, А' ? U (S). Но тогда из предположения непрерывной упорядоченности (U (S), <Q сле- следует, что в множестве S — Л' есть наибольший элемент, скажем а. Покажем, что a='mlA. По определению точной нижней грани, нужно показать, что а — нижняя грань для Л (что очевидно) и что а — наибольшая среди нижних граней. Пусть, действительно, b — другая нижняя грань для Л. Тогда Ь$ Л, ибо в противном случае b — наименьший элемент в Л. Но тогда bQ А' по определению Л', т. е. b ? S — Л'. Элемент а — наибольший среди элементов S — А', откуда а^- Ь. Доказательство (i) закончено. (И) Утверждение (п) можно доказать симметричным образом. Однако мы предпочтем прямо вывести (ii) из (i) с помощью некото- некоторых общих соображений. Как мы уже знаем (см. п. 2.3), каждому бинарному отношению W можно поставить в соответствие обратное отношение W: (х, у) ? W тогда и только тогда, когда (у, х) ? W. Обозначим через <;' отношение, обратное отношению <, так что х <' у тогда и только тогда, когда у < х; в этом случае <z! также является бинарным отношением в 5. Рассмотрим (S, <')• Легко видеть, что {S, <) будет линейно упорядоченной системой в том и только в том случае, когда система (S, <') линейно упорядочена; то же самое имеет место для плотности или непрерывности упорядо- упорядочения. Если мы представим себе (S, <) в виде упорядочения на неко- некоторой горизонтальной прямой, нарисованной на кусочке стекла так, что х < у, если х находится левее у, то мы можем представить (S, <') как ту же прямую, но рассматриваемую с другой стороны стекла. Каждому понятию, касающемуся (S, <), соответствует двой- двойственное понятие, касающееся E, <'). Так, например, х является наименьшим элементом в (S, <) тогда и только тогда, когда он является наибольшим в (S, <'). Также если Л ^ S, Аф0, то b является нижней гранью Л в (S, <) тогда и только тогда, когда Ъ является верхней гранью для Л в (S, <.'). Далее, если а = inf Л в (S, <), то а — sup Л в (S, <') и т. д. Мы видим, что (ii) можно вывести из (i), показав, что (S, <') непрерывно упорядочена, если
252 гл- 7- ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА такова и (S, <). В самом деле, из 7.1 и 7.2 видно, что если BsS, то В — верхний класс в (S, <') в том и только в том случае, когда В является нижним классом сечения в (S, <), т. е. S — В содержит наибольший элемент в (S, <')• Следовательно, последняя система непрерывно упорядочена. [«Прямое» доказательство теоремы 7.9 (ii) будет неявно следовать этой же идее.] Заметим, что утверждение 7.9 (i), примененное к А ? U (S}, показывает, что inf А есть наибольший элемент в S — А. Действи- Действительно, А не имеет наименьшего элемента и inf A $ А; с другой стороны, если b ? S — А, то Ь < х для всех х 6 А и b является нижней гранью А, откуда b -^ inf А (согласно определению). Следо- Следовательно, любая плотно упорядоченная система (S, <), не содержа- содержащая ни первого, ни последнего элемента и удовлетворяющая 7.9 (i) для всех A s S, необходимо непрерывно упорядочена. Аналогичное утверждение справедливо и для 7.9 (ii). Конечно, несколько изменив определение непрерывной упорядо- упорядоченности, можно сделать возможным рассмотрение исключенных случаев, когда S содержит наименьший или наибольший элемен- элементы, и таким путем доказать соответствующий вариант теоремы существования 7.5. Мы этого делать не будем, поскольку в дан- данном случае интересуемся только построением действительных чисел. Хотя мы доказали таким путем существование непрерывно упо- упорядоченного расширения системы (Ra, <), построение действитель- действительных чисел считать законченным еще никак нельзя: не ясно, сможем ли мы для любого такого расширения определить соответствующие алгебраические операции, и не ясно, как обстоит дело с единствен- единственностью, т. е. характеризуются ли действительные числа свойством непрерывной упорядоченности. В действительности это не так: можно построить несколько расширений системы (Ra, <), являю- являющихся непрерывно упорядоченными, не изоморфными между собой. Мы не будем проводить этого построения, хотя оно и несложно, поскольку для этого потребуется изучение некоторых специальных свойств упорядочений, не используемых нами в остальной части книги. В следующем разделе, с другой стороны, будет показано, что действительные числа полностью характеризуются свой- свойством непрерывной упорядоченности и их алгебраическим строением. Упражнения 1. Доказать теорему 7.4 (ср. упражнение 2 к п. 6.2). 2. Доказать теорему 7.5 (ii). 3. Показать, что если А 6 0 (Ra), г ? Ra и г > 0, то существуют такие х 6 А, у ? Ra — А, что х — у <! г. (Другими словами, для «сколь угодно малого» г существуют элементы из Л и Ra — А, расстояние между которыми меньше г.)
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 253 7.2. Непрерывно упорядоченные поля Используя идеи, содержащиеся в конце предыдущего раздела, вводим следующее 7.10. Определение. Система (К, +, ¦, <., 0, 1) называется непрерывно упорядоченным полем, если она является упорядоченным полем, для которого (К, <) — непрерывно упорядоченная система. Мы сохранили в этом определении для операций и отношения те же обозначения, что и в Ra, пользуясь тем, что всякое упорядо- упорядоченное поле содержит в качестве подполя подсистему, изоморфную Ra. Если потребуется рассмотрение одновременно нескольких непрерывно упорядоченных полей, то мы, естественно, будем упо- употреблять и другие обозначения. Нашей главной задачей на ближайшее время является доказа- доказательство изоморфизма любых двух непрерывно упорядоченных полей. В остающейся части этого раздела (К, +, •, «С, 0, 1) — любая непрерывно упорядоченная система, содержащая Ra в каче- качестве подполя. Мы покажем, что структура поля К вполне определена структурой Ra. Согласно теореме 7.5, мы имеем стандартное рас- расширение (U (Ra), <Э системы (Ra, <)• Докажем прежде всего, что обязательно существует взаимно однозначное соответствие между элементами систем К и U (Ra). Такого рода естественное соответ- соответствие между элементами Ra и сечениями мы уже видели в доказатель- доказательстве теоремы 7.5 (и). 7.11. Определение. Для любого а ? К положим Са = = {х: х 6 Ra и а<.х). (Это — обобщение Са из доказательства 7.5.) Свойство Архимеда. Как и ранее, мы рассчитываем, что Са 6 € U (Ra). Для доказательства этого факта необходимо прежде всего доказать непустоту Са для любого а 6 К- Заметим, что это нетри- нетривиальный факт — в некотором упорядоченном поле К может ока- оказаться Са= 0. Так, поле частных Ra (|) кольца Ra [?] можно упо- упорядочить таким образом, что х < ? для всех х 6 Ra (ср. упражне- упражнение 6 к п. 5.1). Легко понять, что непустота Са для любого а ? К эквивалентна существованию для любого а ? К такого п 6 Р, что а < п. 7.12. Т е о р е м a. (i) Для любого а?К существует такое п 6 Р, что а<.п; (ii) для любого а 6 К, а > 0 существует такое п 6 Р, что (iii) для любых а, Ъ 6 К, а <С b существует такое х ? Ra, что а<Сх <СЬ. Доказательство, (i) Пусть, для некоторого а 6 К, п^Са для всех п 6 Р. Тогда а — верхняя грань для Р и по теоре- теореме 7.9 существует точная верхняя грань Р в К- Обозначим ее Ь,
254 ГЛ. 7, ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА b = sup Р. Но из п ^ Ь для всех п ? Р следует п + 1 <1 Ь, и тогда и -< Ь — 1 для всех л 6 Р. Поэтому Ь — 1 — также верхняя грань Р в К., что противоречит выбору Ь = sup Р. (и) следует из (i) — доста- достаточно найти такое п ? Р, что —< п. (iii) выводится из (i) и (И). Выберем такое п ? Р, чтобы — < Ь — а. Далее, множество Л = = j m: m 6 I и а: < — J- непусто, поскольку существует такое k ? Р, что а ¦< &, т. е. а < — . Множество Л является отрезком в I, так как для любого т 6 Л из т > /и, очевидно, следует т' 6 -^> и существует такое целое число, которое не принадлежит Л,— ведь для —а существует такое / ? Р, что (—а) < /, а тогда (—/) < а и (—1)п({А. По теореме 4.25 отрезок в I—вполне упорядоченное множество и потому Л содержит наименьший элемент, скажем т. Тогда ^- ¦< а < ^-. Но, прибавляя по] — к обеим частям пер- первого неравенства и используя — < Ь — а, получаем искомое — < Ь. Стоит отметить, что в приведенном доказательстве суще- существенно используется характерная для упорядоченных полей связь между порядком и операциями; для произвольной непрерывно упо- упорядоченной системы, содержащей Ra, доказать (iii) мы не сможем. Можно и несколько по-другому сформулировать свойство 7.12 (i): для любых Ь, с 6 К, 0 < Ь < с, существует такое п 6 Р, что с < пЪ. Упорядочение, обладающее таким свойством, называется обычно архимедовым упорядочением, а само свойство — свойством Архимеда. Несложно показать эквивалентность свойства 7.12 (i) и свойства Архимеда. Действительно, если 7.12 (i) выполнено и 0 < Ь < с, то достаточно выбрать такое п ? Р, что а = -у < п, тогда и с < nb. Наоборот, если К обладает свойством Архимеда и а 6 К, то либо а <; 1, либо 1 < а. В первом случае а < 2, во втором случае в силу свойства Архимеда существует такое п 6 Р. что а<л-1 = п. Свойство Архимеда можно интерпретировать и так: любой отрезок может быть измерен с помощью сколь угодно малой единицы длины Ь, т. е. для любого с > 0 можно найти такое п 6 Р. что (п — 1) Ь <; с < nb, таким образом, местоположение точки с может быть установлено, если Ь отложить достаточное число раз. 7.13. Теорема, (i) Если а? К, то Сае U (Ra). (ii) Если а, Ь 6 К и а<С Ь, то Са <^ Сь. (iii) Если А € U (Ra), то А = Са для единственного а 6 К- Доказательство, (i) Саф0 согласно 7.12 (i); Ra — — Са Ф 0 согласно 7.12 (iii): существует такое х 6 Ra, . что а — 1 < х < а. Очевидно, что из х 6 Са и х < х', х' 6 Ra следует х' 6 Са- Если х 6 Са, то а<.х и, согласно 7.12 (iii), существует
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 255 х € Ra, для которого а <. х <; х; но тогда х' ? Со. Следовательно, Са? U (Ra). (ii) следует непосредственно из 7.12 (iii) и свойств верхних клас- классов сечений. Чтобы доказать (iii), рассмотрим произвольное А ? U (Ra). Тогда А Ф 0 и А ограничено в К снизу. Пусть а = inf А в К; а$А, так как в противном случае класс А содержал бы наимень- наименьший элемент. Следовательно, если х ? А, то а < х, т. е. Л ^ Са. Покажем теперь, что Са <= А. Пусть а<С х, х ? Ra. Если для всех х' ? А мы имеем х <; х', то а ^ inf А. Следовательно, существует х' ? А, для которого х < х, но тогда х ? Л, так как А ? U (Ra). Поэтому А = {х: х ? Ra и а < х} = Со. Единственность а сле- следует из (ii). Таким образом, функция, сопоставляющая каждому а ? /С мно- множество Са 6 U (Ra), является взаимно однозначным, сохраняющим порядок соответствием между К и U (Ra). Это соответствие инду- индуцирует определенные операции «сложения» и «умножения» на t/ (Ra). 7.14. Определение. Предположим, что А, В ? U (Ra). Пусть a, b — единственные элементы К такие, что А = Са, В = Съ\ положим (i) Л © В = Са+Ъ; (ii) 0 Л = С_а; (iii) А ® В = Са.ъ- Эти определения операций ф, <8> зависят от /С- Чтобы пока- показать, что структура К полностью определяется Ra, нужно пока- показать возможность задания операций ф, <8> в терминах Ra. Здесь мы увидим также причину для обособления операции Э. Заметим, что если а 6 Ra, то Са вполне определяется независимо от К- В частности, Со, С\ соответствуют 0 и 1. 7.15. Теорема. Предположим, что Л, 5 6 ?/(Ra). Тогда (О Л Ф В = {и: и 6 Ra и х + у = и для некоторых х 6 Л и #€?}; (ii) 0 А = {ы: и ? Ra ц, для некоторого z ? Ra, г < w ы —х < г для всех х 6 Л }; (iii) если Л << Со, то Со < Э А; (iv) еслы Со =г? Л, Со =<; В, то А <8> В = {«: « 6 Ra и х-у = ы для некоторых х?А ы у ? В); (v) если Л < Со, Со =< В, то А <8> В =0 [@Л) ® В]; (vi) если Со ^ Л, 5 < Со, то Л <8> 5 = 0[Л ® (ЭВ)]; (vii) если А < Со, В < Со, то Л <8> 5 = @Л) ® (ФВ). Доказательство, (i) Используя 7.14 (i) и определение Са, мы должны показать для любых а, Ь ? К и любого и ? Ra, что A) а + b < и тогда и только тогда, когда существуют х, у 6 Ra такие, что а<.х, b <у и х + У = и.
256 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Очевидно, если выполняется правая часть утверждения A), то выполняется и левая. Если же выполнена левая часть, то сначала мы найдемх? Ra такое, что а <С хи х -{- b <i и, т. е. а <С х <С и — Ъ (это возможно согласно 7.12 (iii)). Положив у = и — х, получаем Ь < у и х + у = и. Прежде чем доказывать (и), рассмотрим интуитивную картину, скажем, для Со-< А (рис. 32). Здесь А' = {—х: х 6 А}. В качестве QA естественно рассматривать а' а совокупность всех тех и 6 Ra, " ч q ¦—* • которые больше любого элемента ¦* х 1 ( *- из А'. В случае, когда inf A § Ra, v можно так и поступить. Выбор qa же в формулировке (и) нового элемента г обусловлен именно Рис- 32- случаем inf A ? Ra. Ведь тогда в множестве всех и 6 Ra, больших всех элементов из А', есть наименьший элемент —(inf Л), что противоречит определению верхнего класса. Поэтому мы требуем существования г<кс тем же свойством. Аналогичной картинкой для А =^ Со мы можем показать, что и в этом случае (И) всегда дает правильнее определение QA. Привести строгие доказательства (ii) и (iii) на основе геометрической иллю- иллюстрации мы предоставляем читателю. (Заметим, что QA не следует смешивать с разностью множеств Ra — А.) В противоположность (i), условие (iv) не будет корректно опре- определять А <8> В, если не наложить ограничения Со =<[ А, Со =^ В- Например, рассмотрим D = {и: и ? Ra и х-у = и для некоторых х>—1 и г/>2}, которое можно было бы рассматривать как C-i-C2 = С-2. На самом же деле, определенное таким образом мно- множество D состоит из всех рациональных чисел: действительно, если пбР и п>1, то мы имеем 2п > 2 и — у >—1, откуда — т>-Bи) = ¦—n?D. Следовательно, все и 6 Ra, для которых п <; и, также находятся в D, т. е. D = Ra. Именно по этой причине мы должны разбивать определение операции <8> на отдельные случаи, используя операцию QA для сведения прочих случа- случаев к (iv). Докажем теперь (iv). Положим А = Са, В = Сь, где а, Ъ 6 К- Согласно предположению и 7.13 (ii), имеем 0 <; а и 0 ^ Ь. Мы должны показать, что для любого и 6 Ra имеет место B) аЪ < и тогда и только тогда, когда существуют х, у ? 6 Ra такие, что а<Сх, b < у и х-у = и. Если выполняется правая часть, то ab < ху и потому ab < и, т. е. выполняется и левая часть. Предположим теперь, что ab < и.
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 257 Если Ъ = 0, то нам нужно лишь найти х 6 Ra с а < х, что возможно ввиду 7.12 (i). Действительно, если мы возьмем у = и/х, то 0 < у, так как их, ии положительны, а ху = и. Предположим, что О < Ь. Тогда, согласно 7.12 (ш), имеется х 6 Ra такое, что а < х и хЬ < «, т. е. х < ы/Ь. Поэтому, если мы снова возьмем у = и/х, то будем иметь ху = и> xb, и из х > О заключаем, что у>Ь. Доказательство остающихся частей теперь тривиально. Напри- Например, в (v), записав А = Са, В = Сь, мы имеем по определению А ® В = СоЬ, 0Л = С-„, (вЛ) ® 5 = С(_О)Ь и 0[@Л) ® В) = = С_((-О)Ь) = СаЬ. Аналогично поступаем для (vi) и (vii). Изоморфизм непрерывно упорядоченных полей 7.16. Те о рема. (К, +, •, <, 0, 1) <* (?/ (Ra), Ф, ®, <, Со, С). Доказательство. Мы уже видели, что функция F (а) = = Са — взаимно однозначное сохраняющее порядок отображение К на U (Ra). Поэтому нам нужно лишь показать, что F (а + Ь) = = F (а) ф F (b), F (а-b) = F (а) ® F (Ь) для всех а, Ь ? К- Но это простая перефразировка определения 7.14 (i) и (ш). 7.17. Теорема. Любые два непрерывно упорядоченных поля изоморфны. Доказательство. Согласно 6.12, мы без потери общно- общности можем предположить, что оба поля содержат Ra в качестве подполя. Обозначим одно поле (К, +, •, <, 0, 1), другое — (К, +, •, <, 0, 1). Но оба они изоморфны полю (U (Ra), Ф , ® , <^, Со, С4) согласно 7.16. Здесь мы используем одно и то же поле в обоих случаях; это объясняется тем, что 7.15 показывает, как можно определить Л ф В и Л <8> В для всех А, В ? U (Ra) только в терминах Ra. Действительно, как мы знаем, U (Ra) линейно упо- упорядочивается отношением <^ и для любого А 6 U (Ra) имеем Со =< А или Л -< Со. Мы достигли одной из наших главных целей и теперь обращаемся к другой,— к доказательству существования по меньшей мере одного непрерывно упорядоченного поля. Учитывая предшествующие выкладки, это можно сделать очень просто. Действительно, мы уже доказали в 7.5 (i), что (U (Ra), -<) — непрерывно упорядоченная система. Следовательно, надо показать лишь, что если принять 7.15 (i), (ii), (iv) — (vii) за определения Ф, ©, ® на U (Ra), то (U (Ra), ф, ®, -<, Со, Ci) — упорядоченное поле. Отметим, что до сих пор мы этого не доказывали. Для данного непрерывно упорядо- упорядоченного поля (К, +, •,<, 0, 1) мы доказали лишь изоморфизм (К, +, •, <, 0, 1) системе (U (Ra), Ф, ®, <, Со, Q) и отсюда, т. е. из существования непрерывно упорядоченного поля К и нали- наличия изоморфизма, заключили, что (U (Ra), Ф, <8>, <^, Со, Ci) сама есть непрерывно упорядоченное поле. Так что для доказательства теоремы существования непрерывно упорядоченного поля нам при- придется непосредственно, пользуясь 7.15 как определением операций,
258 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА проверять все условия определения 7.10. Это длинная и малоинте- малоинтересная работа, к тому же не приводящая к сколько-нибудь цен- ценным попутным результатам. Поэтому мы предпочтем дать другое доказательство, основанное на совсем новых идеях — идеях Коши. Пределы. До сих пор мы рассматривали действительные числа как точные нижние грани некоторых множеств рациональных чисел, в частности, верхних классов сечений или, двойственным образом, как точные верхние грани нижних классов сечений. Но столь же естественно, как мы показали в п. 7.1, искать действительные числа в виде пределов последовательностей (а0, at, . . ., ak, . . .) рацио- рациональных чисел. Действительно, с интуитивной точки зрения, если даже заданная длина иррациональна, то мы можем приблизить ее «сколь угодно близко» рациональными длинами путем все более мелкого разбиения единицы длины. Десятичное представление действительного числа такое, как ]/~2 = 1,4142. . ., означает, что члены последовательности 1; 1,4; 1,41; 1,414; 1,4142; ... в этом смысле приближают ]/~2. Конечно, это ни в коем случае не един- единственная последовательность, обладающая подобным свойством: данная конкретная последовательность получена путем приближе- приближения числа снизу при помощи последовательного деления на десять. Мы можем также рассмотреть последовательности, которые при- приближают число сверху, или которые ограничивают число сверху и снизу, или которые получены другими способами разбиения и т. д. Таким образом, мы начнем с того, что будем рассматривать действительные числа как пределы произвольных видов последова- последовательностей рациональных чисел и лишь позднее будем интересо- интересоваться, какие специальные виды последовательностей дают все действительные числа. Нам нужно будет ответить на два основных вопроса: во-первых, каково необходимое и достаточное условие того, чтобы последовательности рациональных чисел можно было приписать в качестве предела вещественное число, и, во-вторых, каково необходимое и достаточное условие того, что две последова- последовательности эквивалентны в том смысле, что они имеют один и тот же предел? Для построения действительных чисел тогда нам нужно будет лишь отождествить их с классами эквивалентности таких последовательностей. Как это обычно принято в анализе, мы используем такие буквы, как е, S, в утверждениях, касающихся приближений все меньшими и меньшими числами. Мы по-прежнему предполагаем, что (К, +, ¦, <, 0, 1) — любое непрерывно упорядоченное поле, являющееся расширением поля рациональных чисел. Прежде чем переходить к понятиям, связанным с пределами последовательностей, пере- перепишем условия того, что число а является inf А или а является sup А, «на языке приближений».
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 259 7.18. Лемм а. Предположим, что A s К, А ф 0 и а 6 К- Тогда: (i) a = inf А тогда и только тогда, когда а является нижней гранью А и для каждого е > 0 (е ? Ra) существует такое х б А, что х — а < е. (ii) a = sup Л тогда и только тогда, когда а — верхняя грань А и для каждого е > 0 (е 6 Ra) существует такое х 6 А, что а — .т<е. Доказательство, (i) Предположим, что а = inf A и в > 0. Если не существует х ? А с х — а < е, или, что то же самое, х < а -\- е, то для всех х 6 А имеем а -\- е ^ х и а-\-г— ~* I "+ *"" нижняя грань Л. Но в силу а<С а < а + е это противоречит утвер- Рис. 33. ждению о том, что а — наиболь- наибольшая нижняя грань А. Теперь мы должны доказать, что если а удовлетворяет данному условию и Ь —нижняя грань А, то Ь <С а. Предположим обратное: Ь — некоторая нижняя грань А са<6. Пусть в = Ь ¦— а. Тогда г > 0 и существует х ? А с х — я<е, откуда х< а + е = Ъ. Это противоречит предположению, что Ь — нижняя грань Л. (ii) доказывается аналогично. Лемма 7.18 остается справедливой и в том случае, если мы нало- наложим на е более слабое ограничение, чем даже е ? Ra (по крайней мере более слабое для доказательства того, что а = inf Л или а = sup Л). Действительно, из 7.12 (ii) мы знаем, что для каждого е > 0 имеется п 6 Р с — < е. Следовательно, утверждение о том, что для любого е > 0 существует х ? А с х — а<е, эквивалентно утверждению о том, что для каждого п 6 Р существует л: 6 Л с х — Л <— • Поэтому на самом деле в (i) мы можем считать, что е ? Ra или принадлежит любому другому множеству рациональ- рациональных чисел, имеющему 0 в качестве точной нижней грани. То же самое рассуждение, конечно, проходит и для (ii). В соответствии с нашими интуитивными геометрическими поня- понятиями, если а и b представляют точки на прямой па <_Ь,чоЬ — а — расстояние между двумя точками (рис. 33). Это геометрически оче- очевидно для а ^ 0, а для произвольных а, Ь становится ясным при рассмотрении их знаков. В общем случае, если отношение неравен- неравенства понимается в обычном смысле, мы используем запись \Ь — а \ для измерения расстояния. Именно, \Ь — а \ = b — а, если а<&, и | b — а | = — (Ь — а) = а— Ъ, если b < а. В 4.19 мы определили эту функцию «абсолютное значение», f (х) = | х | для любой упорядоченной области целостности и проверили ее свой- свойства в 4.20; в частности, она определена и для нашего поля К,. 7.19. Определение. Предположим, что (Xk)h^o = = {х0, . . ., Xk, ¦ ¦ .) — последовательность элементов из К- Xk 6 К
260 гл- 7- ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА для всех k ^ 0; предположим, что а ? К.- Мы говорим, что а является пределом этой последовательности (при неограниченно воз- возрастающем k), если для каждого е > 0 (е ? Ra) существует такое т, что I Xk — а \ <L& для всех k ^ т. Как уже было замечено ранее, понятие предела не зависит от того, выбрано ли е в /С или в Ra — е даже может иметь вид 1/и, п 6 Р. 7.20. Лемма. Предположим, что х^^К для всех k^O. Тогда последовательность (Xk)h^o имеет самое большее один предел в К- Доказательство. Предположим, что а, Ь — пределы последовательности (Xk)k^o- Для любого е> 0 существуют такие ть т2, что | xh — а | < е для k ^ mi и | xh — b | <е для k ^ т2. Пусть й ^ max (mi, m2). Тогда | а _ b | = | (a — xft) + (xft — b) \ ^ I a — xA | + |xft — b |<2e. Если а фЪ, то выбор e == -^- j а — & J приводит к противоречию. Значит, а = b. 7.21. Определение. Предположим, что xh ? К для всех 60 (i) Мы говорим, что {xk )и^о сходится или что предел этой последовательности существует, если существует такое а ? /С, что а — предел этой последовательности. (п) ?Ъш (х&)л>о сходится и а — ее единственный предел, то мы пишем lim Xh = a. ft-юо Рассматривая предел последовательности (xk)k^i — (Xk+i)k^o, мы можем рассмотреть также и последовательность (Xk)h^o, произ- произвольно задавая члены х0, xit . . ., X;_t. Очевидно, что для любого / последовательность (Xk)k^i сходится в том и только в том случае, когда сходится (ха>а>о> и если эти последовательности сходятся, то они имеют один и тот же предел. Другими словами, для любого данного / мы можем произвольно изменить первые / членов последовательности, не изменяя ее сходи- сходимости или предела, если такой существует. Несколько примеров использования понятий сходимости и пре- предела: G.2.1) @ Последовательность A + 1/&)as>i сходится и lim A+Ш)=1. ft—уоо (и) Последовательность A + (—l)h \lk)h-^i сходится и, lim h
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 261 (iil) Последовательность ((—\)h (I -j- \lk))k-5,i не схо- сходится. (iv) Последовательность (k)k^o не сходится. Например, чтобы доказать (и), заметим, что для каждого п если k > п; отсюда для е = \1п мы можем взять т = п + 1 в 7.19. Доказательства (iii) и (iv) достаточно трудоемки, если пользоваться определением 7.19, так как мы должны показать, что ни для какого а не имеет места lim Xk = а для заданной последо- ft=0O вательности (Xk)k^o- Вместо этого удобнее воспользоваться другим определением сходимости, не опирающимся на знание самого пре- предела. С интуитивной точки зрения, причиной расходимости последо- последовательностей в (iii) и (iv) является то, что даже далекие члены последовательностей «недостаточно близки» между собой. Для краткости в дальнейшем, если нет оснований бояться дву- двусмысленности, вместо {Xk)k^-o будем писать Осд). Фундаментальные последовательности. Сформулировать точно, что значит «достаточная близость» далеких элементов последова- последовательности, можно следующим образом. 7.22. Определение. Предположим, что A s К- Последо- Последовательность {xk) называется фундаментальной после- последовательностью в А, символически (хи) € Fd (А), если xk 6 А для k ^ 0 и если для любого г > 0 (е ? Ra) существует такое т, что | xh — хг | < е для всех k, I ^ т. Очень часто вместо термина «фундаментальная последователь- последовательность» используют термин «последовательность Коши». Очевидно, что если (xk) 6 Fd {К), то (xk) 6 Fd (Л) для любого множества А, содержащего все xh. Как и ранее, можно ограничиться случаем е 6 Ra. 7.23. Теорема. Если (хь) сходится, то (xh) 6 Fd (К)- Доказательство. Действительно, если lim xh = a, k=oo а ? К, то для любого заданного е > 0 мы можем выбрать т так, что | Xk -- а | < е/2 для всех k ^ т. Тогда, если k, / ^ т, то Следовательно, (хь) — фундаментальная последовательность. Возвращаясь к примерам (iii), (iv) в G.2.1), мы видим, что обе последовательности не сходятся и ни одна из них не является фундаментальной последовательностью в К.- Действительно, в обоих случаях мы можем найти е > 0, а именно е = 1, такое, что для каждого т существуют k, I ^ т с | xh — хг \ ^ е (например,
262 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА k = т, I = т + 1). Заметим, что имеются сходящиеся подпосле- подпоследовательности последовательности /(—l)Ml +-r)/ а^ь напри- например последовательность A -|- \!2k)h^u с другой стороны, ни одна из^подпоследовательностей {k)h-^o не сходится. Придадим интуи- интуитивно ясному понятию подпоследовательности точный смысл. 7.24. Определение. Предположим, что (xh), (yk)—' последовательности в К- Тогда говорят, что (г/д) — подпосле- подпоследовательность последовательности (х^), если для опреде- определенной последовательности (jn) целых чисел 0 ^ /0 -< /i < • • • • ¦ • <C/ft <• • • мы имеем yh — Xjh для каждого k^O. В частности, (xh)h^i является подпоследовательностью после- последовательности (Xh)k^o- Отмеченное различие между последова- последовательностями G.2.1) (Hi) и (iv) находит свое выражение в следующем определении. 7.25. Определение. Последовательность {xh) в К назы- называется ограниченной, если множество {х0, . . ., xk, . . .} ограничено* сверху и снизу. Эквивалентное определение: последова- последовательность ограничена, если для некоторого Ь ? К мы имеем \ х& \ =?С ^ b для всех k. Теорема Больцано — Вейерштрасса 7.26. Теорема. Каждая ограниченная последовательность (xk) в /С содержит по меньшей мере одну сходящуюся подпоследо- подпоследовательность. Доказательство. Выберем такие Ьо, с0, что A) b0 ^ Xk ^ с0 для всех k. Мы представляем себе последовательность (хь'/ь^и как «группирую- «группирующуюся» вокруг различных точек между Ьо и с0, т. е. вокруг точек d таких, что для каждого е > 0 имеется бесконечно много k с xh, расстояние которых от d меньше е, т. е. | xh — d \ < е. Сейчас мы опишем процедуру «выделения» одной из таких точек. Ниже мы используем обозначение B) [Ь, с] = {х: хеК и Ьё^х^с} и называем \Ь, с] {замкнутым) интервалом. Серединой этого интер- интервала, в геометрических терминах, является (Ь + с) 12. Поскольку из b ^ с следует b =?С (Ь + сI2 ^ с, очевидно следующее. C) Пусть для интервала [Ь, с] существует бесконечно много таких k, что х& 6 [Ь, с]. Тогда по меньшей мере для одного из интервалов \b, —~ | и \—к- , с\ справед- справедливо то же утверждение. Процедура улавливания точки, к которой сходится некоторая-под- некоторая-подпоследовательность нашей последовательности {х&), состоит из
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 263 последовательного деления отрезка [Ьо, с0] пополам с последующим выбором той из половин, которая «содержит бесконечно много членов последовательности». Иначе говоря, мы проводим рекурсив- рекурсивное построение интервалов \Ъп, с„], начиная с \Ъ0, с0]. D) Пусть Ьп, сп уже выбраны. Положим bn+1 = bn и Cn+i— П"ГС" , если существует бесконечно много таких k, что xk ? \bn,  ' и положим Ъп+1 — = " д п и сп+1 = сп в противном случае. Такое определение оправдывается теоремой 3.4, утверждающей возможность рекурсивных определений по Р; в нашем случае ищется функция F, для которой F (и) = (bn_lt cn_i), 3 (F) = Р, со зна- значениями з /С X К, т. е. в множестве упорядоченных пар с элемен- элементами из /(. F A) = (Ьо, с0) задано, и G (F (п — 1)) = F (л) для п > 1, где G выбирается так, чтобы выполнялось условие D). Следующие свойства построенной последовательности интерва- интервалов [Ьп, сп\ легко проверяются индукцией по п: E) (i) bn^cn; (ii) bn<bn+i и с„+1<сга; (iii) cn — bn = 2z(cQ — b0); (iv) существует бесконечно много таких k, что Xk?[bn, Сп]. Отсюда легко следует F) Пусть В = {Ьй, . . ., bk, . . .}, С = {с0, . . ., ck, . . .}. Тогда каждое ck есть верхняя грань множества В, а каж- каждое bk — нижняя грань множества С. Действительно, в силу E) (ii) из п^.т следует bn^.bm и ст^п Поэтому для любого т, используя E) (i), мы имеем bn ^ bm ^ ст, если п ^ т, и Ьп ^ сп ^ ст, если п ^ т. Таким образом, в любом случае для данного т имеем Ьп ^ ст для всех п, т. е. ст — верхняя грань для В. Второе утверждение доказывается аналогично. Из F) и теоремы 7.9 следует, что существуют sup В и inf С. На самом же деле в силу того, что длины интервалов [Ьп, сп] «стремятся к нулю», G) sup В = inf С. Для строгого доказательства G) положим b = sup В, с = inf С. Тогда b ^.сп для всех п согласно F) и определению sup. Но в этом случае b ^ с по определению inf. Значит, bn ^ b ^ с ^ сп для
264 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА любого п и потому О^с — Ь^.сп — bn = w-(c0 — b0). Если b0 = с0, то, очевидно, Ь = с. Если же Ьо Ф с0, то (с — Ь)/(с0 — Ьо)^. ^ 1/2" для всех п. Но если b Ф с, то (с — Ь)/(с0 — 60) > 0 и по свойству Архимеда [7.12 (i)] существовало бы такое п, что 1/2" <с < (с — &)/(с0 — Ьо). Следовательно, b = с. Число, определенное в G), является естественным кандидатом на роль предела подпоследовательности последовательности (xk). Одну из таких подпоследовательностей, сходящихся к sup В = = inf С, можно определить следующим образом. (8) Пусть /о = 0. Для данного /„ положим /n+i равным наи- наименьшему такому k, что jn <Zk и х\ ? [bn+i» Cn+J- Положим уп = Xjn для есех n ^ 0. Возможность выбора нужного k вытекает из E) (iv), поэтому (8) — корректное рекурсивное определение. Согласно выбору /„, имеем L <1п+1,для всех п и (9) (ук) — подпоследовательность последовательности Наконец, положим A0) а = sup В. Тогда (И) Действительно, предположим, что нам дано е > 0. По 7.18 (i) существует такое ть что а — bmj < е. Но bm ^.bn^.a для всех п ^ nil и потому а — Ьп < е для всех п^-т^. Аналогично, суще- существует такое т2, что сп — а -< е для всех п^ т2 (используем а = inf С и 7.18 (И)). Взяв т = max (/гаь т2), мы находим, что для всех п^т и всех х'?[Ьп?с„] выполняется | л; — а | < е. Теперь, согласно (8), каждое Xjn 6 t^n. cn] s [^m, cm] для п ^ т и I Уп — a | <e для любого п~^ т. Этим доказывается A1) и закан- заканчивается доказательство нашей теоремы. Этот важный результат часто называют теоремой Больцано — Вейерштрасса. Он помогает нам доказать теорему, обратную 7.23. 7.27. Теорема. Если (Xk) 6 Fd (К), то (xh) сходится. Доказательство. Сначала мы покажем, что A) {xk) ограничена. Действительно, возьмем е = 1. Тогда для некоторого т имеем I Xk — Xi | < 1 для всех k, I ^ т. Но | xh \ ^ | xk — xt | + | xt \ (по неравенству треугольника, примененному к | х\ \ = | (хь — — хг) + Хг \), откуда | xh | < 1 + | хг \ для всех k, I > т. В част- частности, | Xk | < 1 -f- \ хт \. Тогда если мы возьмем b = max (I + + \хт\, \х0 I, • ¦ ., I xm-i )), то \xh | < b для всех k.
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 265 Теперь, согласно теореме Больцано — Вейерштрасса, мы можем найти такую последовательность jk целых чисел и такое а 6 К, что B) /0 </,<...< /ft < ... и lim xj = a. А-+0О Я Рассмотрим теперь любое е > 0. Из B) следует, что существует mt такое, что \ xj. — а | < е/2 для k^ mi. Но существует также такое т2, что | хг — Х/ I < е/2 для всех /, / ^ т2- Пусть т = = max (ть т2). Тогда в силу /т ^ т имеем при / ^ т \xi — a\ = \(xi — Xj )+(xj —a)\*C\xi — Xi \+\xj —a|<e. Важность теорем 7.27 и 7.23 состоит в том, что мы получаем новое определение сходимости последовательности. Свойство поля К, указанное в 7.27, часто называют свойством топологической полноты. В современном анализе изучается большое разнообразие различ- различных множеств, на которых может быть определено понятие расстоя- расстояния или метрики между двумя точками х, у, соответствующее наше- нашему | х — у | и по отношению к которому могут быть введены поня- понятия предела и фундаментальной последовательности. Для широкого класса таких множеств могут быть доказаны различные вариан- варианты теоремы Больцано — Вейерштрасса и теоремы о полноте. Для комплексных чисел, например, мы все это проделаем в следующей главе. В топологии понятие предела и полноты обобщаются еще далее ценой отказа от рассмотрения и расстояний, и каких-либо операций на множествах. Любому а 6 К можно сопоставить множество всех сходящихся к а последовательностей в /С. причем такое множество, очевидно, непусто: последовательность {хи), Xh = а для всех k, сходится, конечно, к а. Скоро мы покажем также, что к каждому а 6 К схо- сходится по меньшей мере одна последовательность из рациональных чисел, что соответствует нашей исходной идее приближения действи- действительных чисел рациональными. Сначала, однако, введем на множе- множестве последовательностей операции и отношения, аналогичные операциям и отношениям на множестве чисел, к которым данные последовательности сходятся. 7.28. Определение, (i) Для любых (хи), (г/л), а 6 К мы полагаем (i) a = (xh), где xh = а для всех k ^ 0; (п) <*ft> + <«/ft) = <*ft+«/ft>; (iii) (iv) (v) (Xh)/(yk) = {Xh/yh), если yh?=0 для всех k; (vi) (yk)<(Xh), если для некоторых т и е>0 имеем yh для всех
266 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 7.29. Теорема. Предположим, что А<=К и что А —под- —подполе /С- (i) Если (xh), (yk)?Fd(A), то Если упф§ для всех k и \im укфО, то также ft-voo (ii) Если \\mxh = a, limj/ft = b, то \\m{xk ± г/ь) = а± Ь, h—*OQ Й—>-ОО k—*OO lim (Xk*ун) =fl*&, и если каждое уиф0 и Ь^=0, то и Mm (XkfУн) = = alb. (iii) то эквивалентно lim(xft — yh) =0, m. e. 5ля любого e>0(e?Ra) существует такое h—i-oo m, что \хи—Ук\<в для всех &>m. (iv) Если \\m.Xh — a, limr/A = 6, mo {yh)<(xh) в том и только й-voo &->оо в том случае, когда a<Cb. Доказательство, (i) По определению, для любого et^>0 \ \ мы можем найти т такое, что \xk — Хг|<е1 и k 1 Д 0 Для \ |1 \y y\i всех k, 1~^>т. Для данного е>0 возьмем ej = e/2 и т, опреде- определяемое этим 8j. Тогда для й, />./п I (xh 4- r/ft) — (хг + yi) \ = | (xft — хг) + хк — — г// ] < у + у = Также \(Xk — yh)—(xi—yi)\ = \(xk — Xi)—(yh—yi)\*C\xk — Xi\ -f |г/й—г/г|<е. Что касается умножения, то сначала заметим, что для любых k, I | *а«/а — хгуг I = I (xftr/ft — Xiyh) -I- (хгг/А — *г#г) | < < I xk — xi \ | Ук | + | yh — г/г 11 хг\ . Согласно A) доказательства 7.26, любая фундаментальная после- последовательность ограничена. Следовательно, мы можем найти такое | 2 О 0, что yt |-<с для всех /. Поэтому, выбрав е1 = е/2с, | | | y | мы получим требуемое т. Наконец, рассматривая деление, сначала заметим, что для любых k, I — xiyi) — (xiyh — Ук У1 УкУ1 УкУ1 1 \Ук\\У1\
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 267 Снова выберем с>-0 такое, что |x;|-<c, |i/i|-<c для всех I. Далее, поскольку Нтг/^О и все УифО, должно существовать такое d>0, что | yk\^>d для всех k. Действительно, если 0=?Ь — Й-+0О = lim yk, то существует такое т, что \уъ |>-~¦ для всех и потому за с! можно взять min (\уй\, ..., |#m-i|, -Ц-Ц > 0. На- конец, по 6! = -^- выберем такое т, что \xh — xl\<c&i и I № — Уг | < е4 для всех &, 1> т. Тогда для всех k,l~>m Ук У1 (ii) Доказательство проводится по той же самой схеме. В силу предположения, для любого е1>0 существует такое т, что \Xk — я|<е1 и Ij/ft — bl^ej для всех k^m. Для доказательства, например, равенства lim (xhyh) = ab пишем, как и ранее, ft-*-oo \ xkyh — ab[\ =\(xhyh — ayh) + (ayh — ab)\*C\xh — a\ \yk\ + \a\ \yk — b , и, используя существование такого с>0, что |г/й|<:с для всех k и |а|<;с, получаем нужное неравенство, если &\ = к- • Короче говоря, мы просто заменили в доказательстве соответствующего утверждения из (i) элементы xi, yi на a, b соответственно. В точности так же можно доказать и (Ш), (iv); предоставим это читателю. 7.30. Теорема. Для каждого а?К существует (to)eFd(Ra) с lim Xk = a. ft—юо Доказательство. Пусть Ьй = а + ^рт для каждого k^O. Согласно 7.12 (ш), мы можем для каждого k найти такое Xk?Ra, что a<Cxh<.h. Тогда \xk — a\<.l/(k+l). Построение непрерывно упорядоченного поля. Объединим полу- полученные результаты следующим образом. Для каждой фундамен- фундаментальной последовательности (xk) 6 Fd (Ra) положим G ((хь)) = = lim Xk- Согласно теореме 7.26, функция G тем самым определена и в силу 7.29 обладает следующими свойствами: G (ixh) + {yk)) = G ((xk)) + G (iyk)), и (xk) < (ун) тогда и только тогда, когда G ({xh)) <G((«/U».
268 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Далее, согласно предыдущей теореме, для каждого а ? К. суще- существует такая (Xk) 6 Fd (Ra), что G ({xu)) = а. Следовательно, функция G гомоморфно отображает систему (Fd (Ra), +,*,<, 0,I) на (К, +> •, <, 0, 1)- Из наших общих теорем о гомоморфизмах в п. 4.6 следует, что поле К, изоморфно системе классов эквивалент- эквивалентности [(xu)] из Fd (Ra) по эквивалентности (xft> = (r/й), определен- определенной равенством G ((Xh)) = G ({уи))> т. е. lim х\ = lim уи- Послед- fe->co h-+oo нее равенство, согласно 7.29 (iii), формулируется в терминах Ra и не зависит в этом смысле от К- На этой основе можно доказать изо- изоморфизм произвольных двух непрерывно упорядоченных полей и существование непрерывно упорядоченного поля. Первое мы уже сделали в теореме 7.17, переходим ко второму. 7.31. Теорема. Существуют непрерывно упорядоченные поля. Доказательство. При сделанном уже предположении е 6 Ra операции +, —, #, / и отношение < для последовательно- последовательностей (хц), (#ft) 6 Fd (Ra) определены без всяких предположений о поле К и также определена запись lim Xk = а, если а ? Ra. ft-—>-О0 Нам сейчас потребуется один частный случай обращения послед- последнего утверждения, точнее, утверждение lim Хи Ф 0. Под ним мы к—>оо будем просто понимать, что lim X\ = 0 не выполняется; заметим, что это не эквивалентно высказыванию, что последовательность {xh) имеет предел в Ra и этот предел не равен 0. Тогда, сохраняя обозначение а для постоянной последовательности (xk >, хи = а для всех k, получаем A) Fd (Ra) содержит а для каждого а 6 Ra u замкнута отно- относительно операций +, —, #, /, если под последней опера- операцией понимать деление только на такие последователь- последовательности (yk), что yk Ф 0 для всех k и lim г/А =^= 0 е изложен- ном выше смысле. Доказательство A) легко следует из теоремы 7.29, формулировка которой при А — Ra вообще не зависит от свойств поля /<". Далее, B) (Fd (Ra), +. •> 0. 1) — коммутативное кольцо с единицей. Доказательство B) состоит в прямой проверке всех соотношений определения 4.1 на основе определения 7.28 самих операций. Про- Проверим, например, дистрибутивность: (xh)»({yk) + {zk » = (xk)»(yk + 2Й> = {xk-(yh + zft)> = ((Xk-Ук) + (Xk-Zk)) = (Xh-Ук) + (Xh-Zk) = (Oca >•<?*»
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 269 Существование противоположного элемента: если — (xh) = 0— (xh) = (—xk), то (xh) + (— (хн)) = 0. Система Fd (Ra) обладает также,следующим свойством: C) Если (Xk) 6 Fd (Ra), Xk ф 0 для всех & ы lim xh Ф 0, для некоторой последовательности (г/д) 6 Fd (Ra) (л* >• (yh) = 1. Именно, возьмем (г/А) = A/хд) = l/(.Xk)\ следовательно, ? Fd (Ra) согласно A). Система Fd (Ra) не образует области целостности. Например, если мы положим Хи = 0 для четных k, Xk = \l{k -\- 1) для нечет- нечетных k и tjk = i/(k -\- 1) для четных k, уи = 0 для нечетных &, то <^л>, (г/ft) 6 Fd (Ra), но (Xk)»(yh) = 0. Однако теперь мы получим из Fd (Ra) область целостности, даже поле, взяв некоторый его гомоморфный образ. D) Положим {xk) = {yh), если lim (xh — у и) = 0. Й-+-00 Тогда E) ^ является отношением конгруентности в системе (Fd(Ra), +, ., 0, Т). Действительно, симметричность и рефлексивность = очевидны. Если {хк) = (Ук> и <yh) = {zk), то Y\m(xk — yh) = \\m{yh — zk). h h h*oo h+oo Но тогда, согласно 7.29 (ii), которое может применяться, когда рассматриваемые пределы принадлежат Ra, lim (xh — zk) = lim ((xh — Ун) + {Уъ — zh)) = 0 + 0 = 0. Следовательно, (xft} = Bft), и мы видим, что отношение = транзи- тивно, т. е. ^ представляет собой отношение эквивалентности. Предположим теперь, что (хц) = {x'h), {уь) = (у'к)- Тогда {Xh) + {Ук) = {xk -Ь Уь), {x'h) + {у'ь) = {x'h + y'h) и lim {{xk + yh) — {x'h + y'h)) = lim ((xk — x'h) + (yh — y'h)) = 0, fe->oo ft-»-oo поскольку lim(xh — Xh) = lim(«/ft—«/h) = 0. Следовательно, (Xh)+ -f {ук) = {хк) + {ук)- Также (A;ft> • <«/ft) = (x'k) • {yk) и (x'h)»{yk) = ~ (x'h)» {y'h), откуда {Xh)»(yh) = {x'h)»{y'h)- Чтобы показать первое из них, рассмотрим l\m{xhyh — *?#») = lim(л:й — Д)г/й- Мы не можем прямо применить 7.28 (ii), так как limyh может не существовать
270 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА в Ra. Однако, поскольку (г/д) ограничена, т. е. |г/й|<с?Ка для всех k, равенство Пт(д:^ — x'k)yh = ^> можно показать непо- h—?-с» р средственно: для любого е>0 найдем такое т, чтобы \Xk — х>,\ < — для всех k~> т, тогда |#а —*ii |-|#й |<е для всех k>m. Исполь- Используя коммутативность операции •, доказываем затем остальные утверждения теоремы 4.1. F) Для каждой последовательности (xA) ? Fd (Ra) пусть l(xk)] — класс эквивалентности по ==, к которому при- принадлежит (xh). Через Fd* (Ra) обозначим совокупность всех таких классов эквивалентности. Далее, для любых (Xh), (r/ftNFd(Ra) полагаем (а) \(xh)\® \(yk)} = l(xh}+ {уh)}, (б) [{xh)\® Hyh)] = [(xk)*(yh)] и (в) а* = [а] для каждого а 6 Ra. Согласно E), операции ф, ® определены корректно. G) Система (Fd* (Ra), ф, ®, 0*, 1*) — коммутативное кольцо с единицей. Действительно, функция G ((xh)) = l(xh)l, согласно E) и общему результату из п. 4.6, является гомоморфным отображением Fd (Ra) на Fd* (Ra). Согласно 4.55, для проверки G) достаточно показать, что 1* Ф 0*, т. е. [Г] Ф [0], или что 1 =? 0. Но последнее следует непосредственно из lim A —0) = 1. Чтобы уточнить утвержде- fe—юо ние G), нам понадобится следующая лемма: (8) Если X 6 Fd* (Ra) и ХфО*, то существует такая последовательность (хи) 6 Fd (Ra), что х^фО для всех k, lim xh Ф 0 и X = \(xh}]. Действительно, по предположению, X = [<«?)], где {иь)ф.0, т. е. lim Uu Ф 0. Следовательно, существует такое / > 0, что для любого т найдется такое k > т, что \ ии I ^ /. Далее, поскольку (uk) g Fd (Ra), мы можем найти т такое, что | «ft — ип | < 1/2 для всех k, и ^ т. Но тогда | ип | ^ //2 для всех /г ^ т, так как ^ ^ т и | ufe | > /. Теперь положим х& = 112, если 4 <ш, и^ = = ии, если k^-т. Тогда (Xh) ^ ("ft), поскольку xk — uk = 0 для всех k^ т. Поэтому | xh \ ^ 112 > 0 для всех & и (xft) — иско- искомый представитель X. Теперь мы можем доказать, что (9) система (Fd* (Ra), ф, ®, 0*, 1*) — поле.
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 271 Достаточно показать, что для каждого X 6 Fd* (Ra) с X ф О* мы можем найти Z 6 Fd* (Ra) с X <8> Z = 1*. Используя (8), нахо- находим (xh), удовлетворяющее C) для X = [(xh)]. Отсюда для неко- некоторой (zu) имеем (Xk)»(Zh) — 1- Следовательно, и для Z = l(zk)] получаем X <8> Z = l(xk)»(zk)] = [1] = 1*. Остается проверить свойства упорядочения в Fd* (Ra). Заметим для начала, что A0) = представляет собой отношение конгруентности отно- относительно < в Fd (Ra). Отношение < здесь определено, как в 7.28 (vi): (yh) < (xk) тогда и только тогда, когда для некоторого е > 0 и т имеем е ^ х& — Уи для всех k~^m. Итак, нужно показать, что для (а'й)= (хЬ), (уh) == (уIt) имеет место (yh) < (xh) в том и только в том случае, когда {y'h) < {х'и). Доказательство предоставляем читателю. На основе утверждения A0) в Fd* (Ra) вводится отношение порядка: A1) Для (xk), (yh) 6 Fd (Ra) мы полагаем l(yk)\ <* [{xk}], если {yh) < ixk). Тогда A2) Fd* (Ra) — упорядоченное поле относительно <*. Установить A2) можно проверкой условий 4.17 (i) — (ii) для упоря- упорядоченной области целостности, причем в нашем случае Pos состоит из всех X с 0* <* X. Этого достаточно: [(г/й>! <* [(xh)] тогда и только тогда, когда 0* -<* [(Xft) — (yk)h что, в свою очередь, следует непосредственно из A1) и определения <. Предположим, что 0* <* l{xh)], 0* <* [(#?>], т. е. для некоторых et > 0, е2 > 0 и некоторых mi, т2 имеем е4 ^ xh для всех k ^ mi, e2 ^ уи для всех k ^ т2. Тогда е4 + е2 ^ xh -\- уи и г^ -е2 ^ xh-yh для всех k >max (mlf т2), откуда 0* <* \{xh)] Ф [(r/ft)] и 0* <* [(xft>] ® ® [(г/ft)]; 4.17 (i) установлено. Теперь для того, чтобы установить 4.17 (ii), рассмотрим любое [(л*)] =^ 0*, т. е. lim xk ф 0. Для неко- ft—VOO торого 1>0и всех т существуют k ^ т с | xft | ^ /. Как мы уже несколько раз указывали ранее, это означает существование такого mi, что | хп | ^ //2 для всех и ^ mi. Положим d = //2. Покажем существование т такого, что d ^ хй для всех k~^ т или xft ^ —d для всех ? ^ т; тогда в первом случае мы будем иметь 0 < (хи), во втором 0* < —{хи)- Предположим, что данное утвержде- утверждение ложно, т. е. что для любого т существуют k, n~^m cxk<.d и —d^xn. Согласно предыдущему, если т^ть то мы должны иметь \xk\^d и \xn\^d для таких k, n; отсюда, естественно, xh ^—d и d^Zxn. Но тогда | xh — xn |^2d = /. Короче, если предположение неверно, то для любого т^тх существуют k, n^m с | xk — хп | ^ /. Это, очевидно, противоречит (xh) 6 Fd (Ra).
272 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА В доказательстве A2) нам осталось лишь показать, что для ? 6 Fd* (Ra) невозможно одновременное выполнение двух случаев О* <* [{xk)\ и 0* <* [<mm{xk)\. Это легко проверяется по A1). Из 6.13 мы знаем, что любое упорядоченное поле содержит подполе, изоморфное полю рациональных чисел. В данном случае подполе состоит из множества A3) Ra* = {а*: а 6 Ra}. То, что отображение F (а) = а* является изоморфным отображе- отображением Ra на Ra*, т. е. что A4) для a, b 6 Ra имеем (а + Ь)* = а* ф Ь*, (а-b)* = = а* ® Ь* и а <с_Ь тогда и только тогда, когда а* <*&*, с очевидностью следует из a -f- b = а + Ь, а-Ь = amb и того, что a <ib в том и только в том случае, когда а < Ъ. Докажем также следующее специальное свойство: A5) * Если X, Y 6 Fd* (Ra) и Y <* X, то существует а ? Ra с Y <* а* <* X. Действительно, пусть X = \{xk)], Y = l(yk)], где (xh), iyh) в 6 Fd (Ra), и для некоторого s > 0 и некоторого т выполняется е ^ Xk — Уи для всех k ^ т. Выберем т настолько большим, что | хк — хт | < е/4 и \ yk — ут | < е/4 для любого k^ т, и зафиксируем m xm — yh = {хт — Ут) + (г/т — г/*) > е + (г/т — Ун) > Зе/4 для любого k^ т. Аналогично xk — ут > Зе/4 для k^ т. Пусть а = (хт + ут)/2. Тогда _ ,, __ Хт-\-ут — tyh _ Xm — yk к Ут — уп ^ 3s , Ут — УЪ. ^ е а —Ун— 2 2 "*¦ 2^ ^"8~ ' 2 ^ 4 для всех k ^ т. Аналогично ха — а > е/4 для всех k ^ т. Это и показывает, что У •<* а* <;* X. Понятие фундаментальной последовательности может быть при- применено и к Ra*, что дает множество Fd (Ra*); отметим разницу меж- между ним и Fd* (Ra). Членами первого множества являются фун- фундаментальные последовательности элементов из Ra*, а членами второго — классы эквивалентности фундаментальных последователь- последовательностей из Ra. Однако между Fd (Ra) и Fd (Ra*) легко устанавливает- устанавливается следующая связь: A6) Если (Xk)—последовательность элементов из Ra, то (Хй) 6 Fd (Ra) тогда и только тогда, когда (х%) 6 в Fd (Ra*). Действительно, согласно A4), в Fd* (Ra) разность между двумя .любыми элементами х% и х* по модулю есть как раз (| х& — Xi I)*.
7.2. НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 273 Поэтому (х%) 6 Fd (Ra*) означает, что для любого е* в Ra* с 0* <* е* существует т такое, что (| xh — хг |)* <;* е* для всех k,l^m. В силу A4) это эквивалентно {xk) 6 Fd (Ra). Мы уже знаем, что в непрерывно упорядоченном поле всякая фундаментальная последовательность сходится. Убедимся, что это верно и для Fd* (Ra): A7) Для каждой (х%) 6 Fd (Ra*) в Fd* (Ra) существует lim x%, равный [(*&>]. h-+oo Пусть X = [{xu)\. Нужно, таким образом, показать следующее: для любого е* g Ra*, 0* <* е*, существует т такое, что разность между х* и X по абсолютной величине <* е* для всех I ^ т; эквивалентным образом, для любого е ? Ra с 0 <е существует т такое, что | xi — •— (xk) I < е для всех / ^ т. Так как | {уи> I = (I Уъ. I) для любой последовательности, то мы имеем \xi— (xh) | = (|хг — х^ |)й^0 для каждого данного /. Таким образом, согласно определению <, мы должны доказать следующее утверждение: для данного е > О существует т такое, что для любого 1~^ т существуют е4 > О и mi с е4 ^ s — | Xi — Xk\ (т. е. | Хи — Xi\ ^ е — et) для всех k ^ mt. На самом деле, так как (xft) G Fd (Ra) согласно A6), мы можем найти т такое, что | xk — Х\ \ < е/2 для всех k, 1~^ т; следовательно, по е4 = е/2 можно выбрать и нужное т. Согласно общему результату B.4.9), мы можем теперь найти множество /С, определить на нем операции -f-, -и отношение <, а также функцию F так, чтобы удовлетворялись следующие условия: A8) (а) (/С. +. •> <, 0. 1) содержит Ra e качестве подполя; (б) F изоморфно отображает (/С. +,*,<, 0, 1) на (Fd* (Ra), ф, ®, <*, 0*, 1*); (в) F (а) = а* для каждого а 6 Ra. Тогда из A2) — A7) следует также, что A9) (а) (К, +, •, ¦<> 0, 1) — упорядоченное поле; (б) для любых и, v g /С. если ы < и, ото существует flgRa с и <Са <cv; (в) еслы (xft) 6 Fd (Ra), mo существует и ? К с lim яд = ы. Из этих свойств мы сейчас выведем нашу теорему, показав, что B0) (/("> <0 — непрерывно упорядоченная система. Действительно, предположим, что А — верхний класс некоторого сечения в К, Л ? U (Ю- Выберем и ? А и v ? К — А. Применяя A9) (б) сначала к и, ы+ 1, а затем к у— 1, v, мы можем найти а, Ь 6 6 Ra такие, что абД Ь6К — А и, следовательно, b <.а. Для
274 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА любого k ^ О рассмотрим конечную последовательность элементов o(gb) S^L 2{ab) b+ 2ft , ...,0-1- Положим ги,т = Ь-\-т{а— 0)/2ft. Тогда, если Zk,m?A и m<m'<;2k, то также Z&, m'? Л, так как zh,m<.Zb, m>. Ho 2a, o$ A. Следовательно, если tnu — наименьшее т такое, что Zh,m(zA, ТО Ша>0 И Zk,mh-l^.A. ПОЭТОМУ еСЛИ МЫ ПОЛОЖИМ Xh = Zk,mh-l и Ук = гк>тк для каждого k, то xh$A, yh?A и t/ft — хн= 1/2'' для всех &. Далее, поскольку мы производим последовательные деле- деления пополам, видим, что если &>/, то Хг^Хь и Уи-^yi- Поэтому (Xk) GFd(Ra). Действительно, во-первых, каждое Xh^Ra, поскольку мы выбирали a, b?Ra. Далее, для любого е>0 можно выбрать такое т, что 1/2™ <е. Тогда если k,l>m, скажем, fe>/, то аналогично для /^ k. Но в таком случае, согласно A9) (в), существу- существует w 6 /С с lim хи = до. Мы покажем, что w = inf А и отсюда сможем заключить, что w — наибольший элемент в К — А, поскольку А не имеет наименьшего элемента; тогда, в соответствии с нашим определением 7.1 (и), B0) будет доказано. Для доказательства того, что w = inf А, удобно применить критерий 7.18 (i) точной нижней грани (который зависит только от упорядоченности поля К)- Во-пер- Во-первых, {xh) — возрастающая последовательность и поэтому ни для какого I не может быть w <.xi (в противном случае lim xk Ф w), fc~>oo так что xh ^ w для всех k. Если w ? А, то существует w' 6 А с до' <до. Пусть е = w — да'. Все х& ^ до'', так как все х& $ А. Отсюда w — Xk^ w — ay' = e для всех k, что противоречит lim Xk = w. Следовательно, w $ А и w — нижняя грань для А. ft-юо В частности, w <Суи для всех к. Теперь рассмотрим любое е > 0. Мы можем найти некоторое k с l/2ft < е. Тогда г/д — w <.yk — xk= = l/2ft < е и до = inf Л согласно 7.18 (i). Теорема доказана. В анализе и топологии подобная конструкция применяется для построения топологически полного в смысле 7.27 расширения про- произвольного множества, между элементами которого определено расстояние. Приведенная нами конструкция даже несколько слож- сложнее вследствие необходимости определения соответствующих опера- операций и отношения упорядочения. Имея теперь теорему существования и единственности, мы можем точно сформулировать, что же мы понимаем под действительным числом.
7.2, НЕПРЕРЫВНО УПОРЯДОЧЕННЫЕ ПОЛЯ 275 7.32. Соглашение. В остающейся части этой книги мы понимаем под (Re, +, •, <, 0, 1) некоторое фиксированное непрерыв- непрерывно упорядоченное поле, содержащее рациональные числа в качестве подполя. Мы называем Re множеством действительных чисел. Конечно, с этого момента мы можем применять к действительным числам все наши предшествующие результаты, касающиеся про- произвольных непрерывно упорядоченных систем. Упражнения 1. Доказать теорему 7.15 (п), (Hi). 2. Доказать теорему 7.29 (Hi), (iv). 3. Провести доказательство пункта A0) в доказательстве 7.31. 4. Предположим, что (К, +, •, <, 0, 1) — упорядоченное поле и L — его подполе, удовлетворяющее следующим условиям: (а) для любых и, и 6 /С с и < ч существует такое а ? L, что и < а < v; (б) для любой (хь) 6 Fd (L) существует и 6 К с lim xk = и. k—>оо Показать, что любая (х^) 6 Fd (/С) сходится в К- [Ср. A9) в доказатель- доказательстве 7.31.] 5. Является ли любое упорядоченное поле К., удовлетворяющее Dа, б), непрерывно упорядоченным? Объяснить ответ. 6. Предположим, что (х^) — ограниченная последовательность действи- действительных чисел. Пусть ц ? Л тогда и только тогда, когда существует подпосле- подпоследовательность (у() = (xh), для которой lim j/j = и. Показать, что А огра- i i-юо ничено сверху и снизу. Определим верхний и нижний пределы последовательности (х^) как lim sup Xk = sup A, lim Ш x^—inf A. Вычислить lim sup x^ и lim in! x^ для хь = ( — l)h [1 + l/(fe-j-l)]. k—>oo h-+oo 7. Доказать, что для любой ограниченной последовательности действитель- действительных чисел {Xk) (i) если для каждого fe>0 имеем Zft-=sup {xf. (>fe}, то limzfc существует и lim Zk= lim sup x^. (ii) lim sup ;tfc = a тогда и только тогда, когда (а) для каждого е ^> 0 существует такое т, что *k<a4~e для всех k~^-m\ (б) для любых е>0 и m существует ?>т такое, что х^>а—е. Сформулировать соответствующие результаты для lim inf x^. 8. Доказать, что если (хь) — ограниченная последовательность действитель- действительных чисел, то lim хь существует тогда и только тогда, когда limsupjjk=> fc->oo ft~>oo ¦= lim inf Xh- h—*-oo 9. Доказать, что если (Хь) — ограниченная неубывающая последователь- последовательность действительных чисел (хь^Схь+i для всех k), то существует limjjfc. ft->oo 10. Показать, что для каждого d ? Re, d ]> 0 существует такое a f Re, что a2 = d. (Указание: рассмотреть sup Л, где Л={х: х ? Re и 2^d
276 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 7.3. Бесконечные ряды и разложения действительных чисел Мы уже упоминали по разным поводам десятичное разложение действительного числа. Такое разложение можно рассматривать как специального вида фундаментальную последовательность рацио- рациональных чисел, сходящуюся к данному числу. Элементы этой последовательности наиболее естественно рассматривать как конеч- конечные суммы, при этом каждый последующий член получается при- прибавлением некоторой, с каждым разом все меньшей, величины к предыдущему. Действительное число, таким образом, можно рас- рассматривать как сумму бесконечного ряда, т. е. как предел сумм конечных отрезков этого ряда. 7.33. Определение. Сопоставим любой последователь- k ности (xt) действительных чисел последовательность (s^), Sk= 2*г для всех k, и назовем (su) последовательностью частич- ных сумм ряда 2 xi- Ряд 2 xi называем сходящимся, г=0 г=0 если (sft) сходится, и расходящимся, если (sk) расходится. оо Если limSfe = a, то пишем ^Xi = a и называем а суммой ОО ряда 2 xt- i=0 Аналогичное определение можно дать и для ряда 2 xi ПРИ г=п любом п>0. Используя определение предела последовательности, сформулируем прямое определение сходимости ряда и некоторые его свойства. 7.34. Теорема. Пусть Xfc?Re для всех k. оо (i) 2 xi сходится тогда и только тогда, когда для любого г=0 е>0 существует такое п, что для всех I, k>n выполнено i \ 2 xt\<e. оо (ii) Если 2 xt сходится, то \imxi = 0. г=0 г^-оо ОО ОО (iii) Если 2 xt сходится и п>0, то 2 xt также сходится г=0 г=п П— 1 оо оо U 2 Х1+%Х,= %Х1. г=0 г=п г=0 оо оо (iv) Если 2 I хг I сходится, то 2 xi также сходится. ' г=0 i=0
7.3. БЕСКОНЕЧНЫЕ РЯДЫ 277 В анализе ряды, в частности вопросы их сходимости и расходи- расходимости, играют очень большую роль и исследуются детально. Мы же никакой общей теории рядов здесь излагать не собираемся, а выве- выведем только некоторые их специальные свойства, которые нам пона- понадобятся. Позиционные обозначения для действительных чисел. Десятичное разложение а = mo,mim2m3 . . . действительного числа а > О задается последовательностью целых чисел (тг }, где т0 ^ О и 0 ^ mi <C 10 для любого i > 0. Мы подразумеваем при этом, что г=0 г=0 Аналогично, используя представление 4.53 действительного числа в системе счисления с произвольным основанием Ь > 1, можно счи- считать, что каждое действительное число а > 0 можно представить оо в виде а = 2 гпФ~1, где т* — целые числа, /п0 ^ 0 и 0 ^ тг < Ь г=0 для всех t > 0. Конечно, само т0 также, вообще говоря, можно раз- разложить по степеням Ь, на этот раз положительным, но для нас глав- главной частью проблемы является изучение разности а — т0, величина которой находится между 0 и 1. Возможность однозначного опре- определения т0, обладающего таким свойством, мы сейчас и установим. 7.35. Лемма. Пусть а > 0 и а 6 Re. Тогда существует единственное такое т G I, что 0^/п<а^/п + 1. Доказательство. Поскольку упорядочение действи- действительных чисел обладает свойством Архимеда, существует такое п ? Р, что а ^.п. Среди всех целых чисел, обладающих таким свойством, выберем наименьшее, пусть им будет т + 1. Тогда т <а <; т + 1. Если, же еще и т' <а ^ т' + 1 для т' ? I, то т + 1 ^ т' + 1 по определению т, и /л ^ т'. Если «г <Цп', то m + I ^m' <й, что противоречит а ^ т + 1. Следователь- Следовательно, т — т'. 7.36. Теорема. Пусть &?Р, Ь>1. Для любого a?Re, a>0, существует такая последовательность (mt) целых чисел, что /n0>-0, a Q^mi<.b для всех i и а= ^тф'1. i=0 Доказательство. В качестве метода построения последова- последовательности (nit) выберем приближение к а слева. Если, например, Ь=10, то в качестве т0 выбираем наибольшее такое т, что т<с; затем в качестве ту—наибольшее среди таких целых чисел т, что -Г7Г<# — то\ в качестве /п2 — наибольшее среди таких целых
278 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА чисел т, что щ<а— [то+-^-) , и т. д. Иначе говоря, ш2<102[а-(ш0+|-)]<ш2+1ит.д. В общем случае, для любого заданного Ъ> 1, мы рекурсивно определим последовательность (mi) таким образом, что для любого k0 A) ^тф г=0 Последовательность задается следующим образом: B) т0 — единственное целое число такое, что то<а-</ио+1 и C) * для данных т0, ..., т^ число ntk+i — единственное целое число такое, что k mk+1 < bh+1 (а — 2 /ni6-i)<mft+1 + 1. i=0 Что такая последовательность существует, можно показать индук- индуктивно, причем одновременно показывается, что всегда выполняется A). Во-первых, B) следует непосредственно из 7.35. Тогда A) также выполняется для & = 0. Предположим, что мы имеем h т0, mh, удовлетворяющие A). Тогда а—^тьЬ~г><) i=0 и bh+1(a— 2 тф~1)> 0. Отсюда по 7.35 должно существовать t=0 единственное /Пг,+1, удовлетворяющее неравенствам C). Тогда A) также выполняется для k + 1, поскольку по C) 1=0 Этим индукция заканчивается. Но A) выполняется для всех k, и по 7.35 также D) /Пг^О для всех i. Теперь мы хотим показать, что E) тг<Ь, если i>0. Для этого сначала заметим, что, согласно C), для любого ft-i (а— 2 i0
7.3. БЕСКОНЕЧНЫЕ РЯДЫ 279 Отсюда h F) (а— 2 Wib~i)<b~h для любого k. i=0 (Согласно B), это выполняется и для k = 0.) Снова по C) полу- h— 1 чаем тф~к<^а— 2 гпФ'1 для любого &>0; но тогда, применяя F) 1=0 к k—1, получим тф <СЬ~1 1} и т.п-<.Ь. Этим доказывается E). оо Чтобы доказать равенство а= 2 пгФ~г, нужно еще показать, что 1=0 G) для любого е > 0 существует п такое, что h (а- 1=0 По свойству Архимеда достаточно доказать это для е = 1/<7, где <7 6 Р- Далее, по F), достаточно найти такое п, что \lbn <\lq, т. е. q < Ь™. Но показать существование такого я можно, доказав, что множество Л = {т: т 6 Р и Ь" = т} не является ограничен- ограниченным. Действительно, если А ограничено, то оно имеет точную верх- верхнюю грань d, причем, по определению точной верхней грани, для любого в > 0 существует такое л, что bn > d — е. Следовательно, d — целое число, и d = bno для некоторого п0 6 Р. Но тогда bn»+1 = = bn<>b > d, что противоречит выбору d = sup А. Теорема до- доказана. В частности, при b = 2 теорема утверждает возможность двоич- двоичного разложения любого положительного действительного числа а: оо а — S 2T > гДе Для каждого i > 0 имеем /лг = 0 или /пг = 1. Конечно, сказать, какое действительное число представляет запись т0, т^т-г, . . ., можно, только зная основание счисления. Так, 0,101010... в двоичной системе представляет число 2/3, а в десятич- десятичной — число 10/99. Убедиться в этом можно, отыскивая соответ- соответственно двоичное и десятичное разложения чисел 2/3 и 10/99. В п. 4.5 при изучении позиционных систем обозначений целых чисел была показана единственность разложения. Для позиционной записи действительных чисел, без определенных оговорок, на это надеяться нельзя, ведь нам известно, например, что 1/8 = = 0,1250000... = 0,1249999... Мы покажем, что такая неоднознач- неоднозначность может встречаться, только если а имеет вид eld, где с, d 6 1, (с, d) = 1 и b делится на каждое простое число, которое делит d. То же утверждение в более простой форме: а = е/Ьк для некото- некоторых е, k 6 1- Чтобы подготовить почву для доказательства, нам понадобятся еще два результата о бесконечных рядах, представляющие интерес
280 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА и сами по себе. Первый из них — естественное обобщение геометри- геометрической прогрессии на бесконечные ряды. Его доказательство мы предоставляем читателю. оо 7.37. Теорема, (i) Если х?Re, Ix|>-1, то 2 х% расходится. i=0 оо оо (и) Если x?Re, \х\ <1, то 2** сходится и 2*i = 1/A—л;). t=0 i=0 7.38. Теорема. Если O-^yt-^Xi для всех t>0, где xt, yt — действительные числа, и если 2 xi сходится, то 2 Уь сходится г=0 i=Q <2 h h Доказательство. Пусть sk= 2 *ь 4= 2 ^/г- По предпо- г=0 г=0 ложениго, limsfe = a для некоторого a?Re. Поскольку все Sft>0, оо оо то и а>0. По 7.34 (iii) 2 x* сходится и 2 #г = я — 5ft. i=k-\-l г=й-{-1 со Аналогичные соображения для ряда 2 *« показывают, что и i=ft+l ОО 2 *<>0, откуда sft<a для всех к. Очевидные неравенства i=h+i 0^.th*Csh теперь показывают ограниченность последовательности D): 0<4<я для всех к. Как всякая ограниченная неубывающая D<4+i) последовательность (см. упражнение 9 к предыдущему разделу) D) сходится, и в силу 7.29 (И) lim sh — lira 4 = lim(sft —4)>0. h—>oo k—^oo 7.39. Теорема. Предположим, что b?P, b>\, a^Re, a>0 и афс/Ьк для всех с, k?l. Тогда существует единствен- единственная последовательность (тй, удовлетворяющая условиям тео- теоремы 7.36. оо Доказательство. Предположим, что a=2m^~l = г=0 оо = 2 т'ф~г, где (mi) и (ml) удовлетворяют условиям теоремы 7.36. г~° (iii) а- 2/И|6"*= 2 i=0 i=ft+l
7.3. БЕСКОНЕЧНЫЕ РЯДЫ 281 для любого k^-О. С другой стороны, 0<;«гг<;Ь—1 для каждого i>0, откуда, используя утверждения 7.37, 7.38, получаем 2 2 () () fj fc+l ift+l i=0 j_feh 6 (На каком основании мы вынесли (b—lOr(fe+1) за знак суммы?) k Таким образом, а— 2 пцЬ~1 *Cb~h для любого &;>0. (Заметим, что мы уже доказывали подобное утверждение в теореме 7.36F), но только для рассматривавшейся там конкретной последователь- последовательности.) В последнем неравенстве < не может быть заменено на равенство ни для какого k, ведь тогда а оказалось бы рациональным к числом вида c/bk. Итак, а— 2 tn%b~x <Cb~h для любого k. Конечно, г=0 k аналогичное утверждение верно и для т\: а — 2 т'ф~г <с b~h. Пред- г=0 положим теперь, что т.ъ.фт'ъ. для некоторого k. Пусть п будет наименьшим таким k, т. е. mi = m'i для i<^n п п и тпфгпп, скажем т'п<.тп. Тогда 2 т'ф~г <1 2 пцЬ'1 <а и г=0 г=0 (т„-/п;)&-п= 2тг&-{- 2 /л-Ь<а- 2 т^<Ь-п. г=0 t=0 i=0 А тогда 0 </л„ — т'п <1; но ведь/л„ и/л„—целые числа и такое неравенство невозможно. Мы предоставляем самому читателю про- проверить, что существует ровно два представления типа 7.36 для каждого а вида clbk. Читатель, вероятно, знаком с тем, что в десятичной системе рациональные числа записываются периодическими разложениями. То же самое будет, конечно, и в любой другой системе. Выражаясь со точнее, для любого аб Re и 6> 1, i f Р, если а = 2 nitb~l — i=0 разложение, полученное на основе 7.36, то а рационально тогда и только тогда, когда существуют такие п и q, что mi+q = nit для всех i ^ п. Проведение доказательства этого факта, нами в даль- дальнейшем не используемого, предоставляется читателю. Имеются и другие виды представлений действительных чисел, которые также представляют интерес. Одно из них — представление в виде непрерывных дробей. Это представления действительных
282 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА чисел как пределов последовательностей т0, то + — , то-\ р, то-\ или, как еще иногда пишут, i 1 , 1 1 i 1 1 1 т0, то-\ , Щ-\—qr —, то-\—х—+—+ ! • • •; тогда предел этой последовательности, если он существует, обо- обозначается 7n°~t~ m} m+ mi ¦¦¦ т+ ¦¦¦ Найдем, например, такое представление для положительного кор- корня У .уравнения х2 — 5 = 0. Перепишем уравнение в виде х2 — 4 = 1, откуда х—2 = = 1/B4-х), х= 2+ 1/B + х). Затем, последовательно подставляя это выражение вместо х, получаем у о J у 9J ! x-z. , j , x—t-Y ] , • •• ^2 + х Конечно, это едва ли можно считать доказательством того, что в приведенном выше смысле, но утверждение, разумеется, верно. В упражнениях мы дадим читателю возможность познакомиться с некоторыми первоначальными идеями из теории непрерывных дробей. Затронутая в этой главе теория представлений действительных чисел не принадлежит к числу основных направлений в алгебре или анализе, хотя, например, непрерывные дроби весьма полезны в теории чисел, особенно при решении некоторых квадратных урав- уравнений в целых числах. В курсах элементарной математики операции над действительными числами — такие, как сложение или вычита- вычитание,— выполняются фактически над некоторыми начальными отрез- отрезками десятичных разложений этих чисел. Конечно, для оценки точ- точности таких вычислений требуется дальнейшее изучение теории представлений действительных чисел. Но вне такого рода вычисли- вычислительных задач основную роль играют общие факты, касадощиеся характеристики системы действительных чисел как непрерывно упорядоченного поля, факты типа того, что всякое действительное
7.3. БЕСКОНЕЧНЫЕ РЯДЫ 283 число является пределом некоторой последовательности рациональ- рациональных чисел. Степенные ряды. Роль, которую играют ряды в алгебре и анализе, объясняется, в частности, тем, что ряды — очень удобный инстру- инструмент для изучения функций достаточно широкого класса. Алгебраи- Алгебраически простейшей функцией одной переменной, с которой приходит- приходится встречаться, является полиномиальная функция E.1, 5.9). Естественным обобщением такой функции в области действитель- оо ных чисел следует считать функцию вида F (х) — 2 о,-х*, или, как t=0 обычно ее называют, степенной ряд. Однако, в противоположность полиномиальным функциям, такая функция определена уже не для всех х, а только для тех, для которых ряд сходится. Так, в 7.37 мы видели, например, что степенной ряд 2 х% сходится тогда {=0 и только тогда, когда | х | < 1, причем, если он сходится, то его сумма равна 1/A — х), т. е. равна значению функции F (х) = = 1/A — х). Но для других значений х поведение ряда и функции совершенно различно: при | х | > 1 ряд расходится, а функция при таком значении х принимает вполне определенные значения. (Напом- (Напомним также сделанные в главе 1 замечания о некритическом исполь- использовании связей между функциями и рядами.) В следующей теореме приводится некоторый критерий сходимо- сходимости и расходимости степенных рядов, достаточный для наших целей, хотя и далеко не самый сильный (один из более сильных критериев формулируется в упражнениях). 7.40. Теорема. Предположим, что (bk)— последователь- последовательность ненулевых действительных чисел такая, что существует lim I bu+Jbk \ = c. Тогда (i) 2 bi сходится, если с<1; 1=0 оо (ii) 2 bt расходится, если с>\. 1=0 Доказательство, (i) Очевидно, 0<с. Выберем такое d, что c<Cd<<l, и положим e = d — с. По предположению, сущест- существует т такое, что ||&fe+1/&fe| — с|<е для всех й>/и; отсюда \bk+i/bh\-<d для всех &>/и. Тогда \bk+1\<d\bk\ для всех та- таких k, откуда \bm+1\<:d\bm\, \bm+2\<.d\bm+1\<:d2\bm\ и в об- общем случае индукцией по i выводим A) \bm
284 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА По 7.37 ряд 2 d% сходится, так как |d|<l. Следовательно, схо- оо оо оо дится и \Ьт\ 2 dl = 2 \bm\d\ Из 7.38 следует, что 2 \bt\~ i=0 i=0 i=m оо оо = 2 I frm+i I также сходится, а потому сходится 2 I &i I и в силу i=0 i=0 oo 7.34 (iv) сходится 2 bt. i=0 Чтобы доказать (ii), найдем такое /п, что |&ft+1/bfe|>-l для всех k~^>m. Но тогда видно, что |&т+г|>1^т| Для всех '• Таким образом, положив г = \Ьт\, мы имеем е>0 и |&fe|^e для всех оо . Но по 7.34 (ii), если ряд 2 bi сходится, то limbfe = 0. По- лученное противоречие и доказывает (ii). Нетрудно заметить, что при с<1 верно даже более сильное оо утверждение: сходится ряд 2 I ^« I • Справедливость его вытекает 1=0 из тривиального равенства 1 bk+i \ \bh\ bft+l bk Заметим также, что в случае с — 1 критерий не дает никакого ответа. Однако ряды, обладающие таким свойством, существуют и среди таких есть сходящиеся и расходящиеся. Например, ряд оо со 1 2 1, конечно, расходится, ряд ]У — также расходится (хотя это г=0 г=1 СО 1 и не столь очевидно), а ряд Jk т сходится. Во всех трех слу- чаях с= lim —~ h-*oo bk 7.41. Следствие. Предположим, что (ak) — последователь- последовательность ненулевых действительных чисел такая, что существует lira | аь+1/аь. |. Обозначим этот предел через d. Тогда ft—УОО оо (i) если d = 0, то 2 а&х сходится для каждого x?Re; i=0 оо (ii) если йфО, и r-=\/d, то 2 aix% сходится для >\х\<.г г=0 и расходится для \х\> г.
7.3. БЕСКОНЕЧНЫЕ РЯДЫ 285 Доказательство. Зафиксируем х и применим к ряду оо 2 bt, где bi = aixl, теорему 7.40. Соответствующий предел суще- i=0 ствует: lim \bh+i/bh | = \х\ lim fe h =\x\d, так что ряд сходится ah при \x\d<l и расходится при |*|d>l, откуда и следуют оба утверждения следствия. Число г в формулировке следствия обычно называется радиусом сходимости степенного ряда; при d = 0 также говорят, что ряд имеет бесконечный радиус сходимости, г = оо. В граничном случае | х | = г ситуация та же, что в самой теоре- теореме при с = 1: нельзя утверждать ни сходимости, ни расходимости ряда; читатель сам приведет примеры сходящихся и расходящихся рядов для случая х = ±г, аналогичные примерам, приведенным в теореме 7.40. Читатель, вероятно, знаком из анализа со степенными рядами оо вида 2 (#;/i!) хг и, в частности, с «тейлоровскими разложениями» функций типа еж, sin x, cos x в степенной ряд. Однако трактовка таких разложений предполагает (иногда неявно) знание основных свойств таких функций. Например, для функции ех, являющейся обобщением на действительные числа степенной функции ух, тре- требуется свойство ех^еХ2 = еХ1+Х2. Но мы, не имея пока определения, конечно, не можем проверить и свойств. Сможем же мы это сделать в конце следующего раздела, когда перенесем на действительные числа известные нам функции, определенные на множестве рацио- рациональных чисел, и изучим построенные функции. Еще большие затруднения возникают при трактовке тригоно- тригонометрических функций. Стандартное их определение опирается на геометрическое понятие угла и использует много различных пред- предположений об этом понятии, редко явно формулируемых не только в элементарных, но и в более серьезных курсах анализа. Без привле- привлечения новых понятий точно сформулировать понятие тригонометри- тригонометрической функции и описать ее свойства можно, по-видимому, только на основе некоторых сведений из дифференциального и интеграль- интегрального исчислений. Такой подход будет изложен в приложении 2, а некоторые следствия будут выведены в главе 8. Экспоненциальная функция. Рядом преимуществ обладает совсем другой, хотя и более софистический, подход к определению логариф- логарифмической, экспоненциальной, тригонометрических функций: опре- определение функций их степенными разложениями, причем сами ряды отыскиваются по тем свойствам, которыми должны обладать эти функции. Мы закончим настоящий раздел подобным введением функции ег\ «ожидаемым» рядом является 2а 7Г- г=0
286 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 7.42. Лемма. Ряд У)(хг/Н) сходится для каждого действи- i=0 тельного х. Доказательство. lim \(k\ Таким образом, мы можем применить 7.41 (i); ряд сходится. 7.43. Определение. Зададим функцию Е с областью оо определения Re равенством Е (х) = 2 (х%Ц\) для всех х и положим 1=0 е = Е{\). Если Е — нужная нам функция, то E(x1)-E(x2) = E(xiJrx2) для всех хи x2?Re. Для проверки этого надо так перемножить со оо ряды 2 С*!/'0 и 2 (xi/ii), чтобы получить ряд по степеням 1=0 i=0 х1-\-хг* Зная, формулу перемножения полиномов, можно предпо- предполагать, что г=0 1=0 г=0 3=0 Но в формуле 5.4 (п), формально совпадающей с только что напи- написанной, последовательности (at) и (bt) предполагались по суще- существу конечными, т. е. для некоторого т мы имели at = bt — 0 для всех i ^ m и, конечно, никаких вопросов о «сходимости» не возникало. Можно показать, что в нашем общем случае подобное равенство суще- существовать не может — из сходимости рядов в левой части равенства сходимость ряда в правой части, вообще говоря, не следует. Однако имеет место оо оо 7.44. Теорема. Предположим, что ряды 2laHu 2 ^i г=о 1=0 оо оо сходятся. Тогда ряд 2B afii-j) также сходится и 1=0 з=0 B)BJBА;) г=0 г=0 1=0 э'=0 h к Доказательство. Пусть Sh~ 2 йг> th= 2 bi, uk = 1=0 1=0 hi oo оо = 2B ajbi-i)- Далее, положим а= 2 |я«1. а= 2 ai (здесь г=0 j=0 1=0 1=0 оо используем 7.34 (iv)) и Ь=-- 2 bi. Мы можем считать о>0, 1=0
7.3. БЕСКОНЕЧНЫЕ РЯДЫ 28? поскольку в противном случае at = О для всех i и результат оче- очевиден. Теперь утверждение теоремы можно переписать в виде A) • lim Uk = ab. fc-*oo Для доказательства перепишем uk в следующем виде: "ft = aobo + iaob^ ajbo)+ (афг + аф^ a2b0)+ ... ...+ (ctobh+ciibk-i + ... -f a,,b0) = = aotk + a^ft-i + ¦ • • + aht0. Отсюда, полагая dh = b — tk, т. e. tu = b — dh, получаем B) uk = shb — (aodk + ciidk-i + • • • + akd0). Так как lim sh= а, то для доказательства A) теперь достаточно показать, что C) lim (aodh + atdh-i + • • • + Mo) = О- ft->oo Утверждение C) мы докажем непосредственно, исходя из lim dh — 0 к-+оо h _ и lim ( 2 | cii |) = а. Предположим, что нам задано е> 0. Мы знаем, h-кх i=0 что последовательность | dk \ ограничена, скажем | dfe | <d для всех k, где d>0. Выберем т таким, что |dft|<e/2a для всех k^m к и что yjlail<e/2d для всех ^>/>/п. Тогда для любого i=i km k i=0 i=0 i=m+i m h ° г=0 i=m+l 8 — , e e . e "о^'й ' d~ == " '"= 8- Утверждение (З), а вместе с ним и теорема доказаны. 7.45. Теорема. Предположим, что х, у 6 Re. ~ (О Е @) = 1; (И) Е (х) -Е (у) = Е (х + у); (iv) ес^ги х <у, то Е (х) <Е (у); (v) 0 <r E (хУ (vi) E (n) — еп для любого п 6 1-
288 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Доказательство, (i) очевидно из определения Е. Поскольку ряд, определяющий Е (х), сходится для всех х, в частно- частности для любого | х |, мы можем применить 7.44 в доказательстве (ii). Таким образом, 7^) 777y i=0 3=0 i=0 j=0 Но по биномиальному разложению 4.36 и по 4.35 7=0 и правая часть есть просто Е (х + у)- Доказать остальные части теоремы мы предоставляем самому читателю. Упражнения 1. Показать, что для а, 6, где а ? Re, а > 0 и d ? Р, 6 > 1, эквивалентны следующие два условия: (i) a = eld для некоторых с, d ? I с (с, d) = 1 таких, что если р простое и р | d, то р \Ь\ (ii) а = e/bh для некоторых е, k 6 I 2. Доказать, что каждое действительное число вида c/feh, с, k ? I, имеет ровно два представления вида 7.36. 3. Доказать теорему 7.37. оо 4. (i) Показать, что если разложение а= ^ тф'1 действительного числа а г=0 по основанию 6 периодично, т. е. для некоторого g ? Р имеем пц+д = пц для всех г, то а ? Ra. (Указание: Рассмотреть Ь?а — а.) (ii) Обратно, чтобы показать, что разложение по любому основанию 6 каждого положительного рационального числа а = eld (с, d ? Р) периодично, положим с = mod + г0, 0 -< r0 < d, 6/-0 = mid + ri, 0 -< ri < rf, и в общем случае для любого i > 0 Тогда а= 2 /я;Ь~* периодично. (Сравните эту процедуру с обычным г=0 делением.) 5. Если а — действительное число, а > 0 и а <ё Р, то существуют един- единственные такие т0 ?Р и а0 ? Re, что а0 > 1 и а = то + A/а0). (Почему?) Если а иррационально, то и а0 также иррационально. Если а рационально, а = eld, с, d ? Р и с = qd + Л 0 < г < d, то m0 = q и а0 = dlr. Использо- Использовать эти факты, чтобы доказать, что каждое рациональное число может быть представлено в виде конечной непрерывной дроби 11 I а — то-\ т т-... .
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 289 Как доказать, что каждое иррациональное число а может быть представлено в виде бесконечной непрерывной дроби Показать, что существует вещественное число, представимое в таком виде для т0 = 2, т, = 4 для i > 0. 6. Доказать условия (iii) — (vi) теоремы 7.45. 7.4. Полиномы и непрерывные функции в области действительных чисел Теперь можно вернуться к алгебраической проблеме, которую мы рассматривали в качестве одной из мотивировок введения дей- действительных чисел,— проблеме существования (или несуществова- несуществования) корней полинома f (?) с рациональными коэффициентами. Мы скоро увидим, что такие полиномы «гораздо чаще» имеют действительные корни, чем ра- рациональные. Мы также рас- рассмотрим и случай произвольного Вопросы существования кор- корней полинома могут быть изучены и без привлечения большого коли- количества идей из анализа. Нампона- р „. добится лишь тот факт, что любая полиномиальная функция с дей- действительными коэффициентами является непрерывной. Интуитивно это означает, что ее график, рассматриваемый как множество точек вида (х, f (х)) в Re х Re, представляет собой «неразрывную кри- кривую» (рис. 34). В частности, если в одной точке такая кривая про- проходит выше горизонтальной оси, а в другой — ниже, то в некоторой точке она пересекает эту ось. Точнее говоря, если f (а) > 0 и / (Ь) < •< 0, то между аи b должна существовать такая точка с, что / (с) = = 0. На первый взгляд, может показаться, что подобное утвержде- утверждение мы уже встречали для Ra, рассматривая графики функций в Ra X Ra, но в действительности, несмотря на плотность Ra, «дырки» в Ra могут попасть как раз на месте встречи кривой с осью. В Re же такие дырки заполнены, ведь Re — непрерывно упорядо- упорядоченная система. Перейдем к строгому определению непрерывности и проверке изложенных фактов. 7.46. Определение. Предположим, что F — унарная функция с 3) (F) = Re, № (F) s Re, и предположим, что а 6 Re. (i) Мы говорим, что F непрерывна в точке а, если для любого г > 0 существует такое б > 0, что из \ х — а | < б следует \ F (х) — F (а) | < е.
290 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА (п) Мы говорим, что F непрерывна (на Re), если F непрерывна в каждой точке а 6 Re. В анализе используется более общее определение непрерывно- непрерывности, однако для наших целей и для большинства целей в алгебре достаточно определения, приведенного выше. Мы начнем с выявле- выявления некоторых свойств, выполняющихся для всех непрерывных функций. Определяющее условие (i) весьма напоминает определяющее условие 7.21 для предела последовательности. Действительно, их можно свести вместе в следующей лемме, доказательство которой предоставляется читателю. 7.47. Л е м м а. Предположим, что F непрерывна и что {xk} — сходящаяся последовательность действительных чисел, для которой lim xh = а. Тогда {F (xh) > — также сходящаяся последователь- fe->oo ность и lim F (xk) = F (a). fc-э-оо Теорема Вейерштрасса об обращении в нуль. Основной теоремой, применяемой "для получения корней полиномов, является следую- следующая, известная под названием теоремы Вейерштрасса *) об обраще- обращении в нуль («теорема о нулях»). 7.48. Теорема. Предположим, что F — непрерывная функ- функция и a, b — действительные числа. Если F (а) < 0 и F (Ь) > 0, то существует по крайней мере одно действительное число с меж- между а и Ь такое, что F (с)—0. Доказательство. Пред- положим, что a <cb. (Доказа- (Доказательство при а > Ъ проводится Рис. 35. аналогично данному или выво- выводится из него, если рассмотреть непрерывную функцию G (х) = —F (х).) Представим себе график F (рис. 35). Не исключено, конечно, что F имеет несколько корней между а и Ъ. Мы докажем существование самого правого корня. Определим А = {х: а < х < Ь и F(x)^0} и положим с = sup А. Тогда sup А определена, поскольку а ? А и потому АФ0, а Ь, очевидно, есть верхняя грань для А. Следовательно, as^cs^ Ь. Если F (с) = 0, то все доказано. Пред- Предположим теперь, что F (с) > 0. Положим е = F (с). Тогда, посколь- поскольку F непрерывна в точке с, мы можем найти б > 0 такое, что если | х — с | <б, то \ F (х) — F (с) | < в. Так как с = sup А, то по 7.18 (и) существует хотя бы одно х Е А с | х — с | <б. Для такого *) Во многих курсах эта теорема называется теоремой Коши или первой теоремой Коши.— Прим. перев.
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 291 х будет F (х)< 0 и | /=" (х) — F (с) \ = F (с) — F (х) > F (с) = е, что противоречит выбору 6. Предположим, наконец, что F (с) <0. Положим е = | F (с) |. Снова мы можем найти б>0 такое, что I F (х) — F (с) | <С е при \ х — с \ <С 6. В данном случае рассмо- рассмотрим любое х с с <сх <с + й- Тогда х $ Л, так как с = sup A. Следовательно, F (х) > 0. Но тогда | F (х) - F (с) | = F (х) + | F (с) | > | F (с) | = 8, что снова дает противоречие. Таким образом, возможно лишь F (с) = 0. Действуя в духе этой теоремы, мы можем получить для непрерыв- непрерывных функций общий результат (теорема 7.50), касающийся суще- существования максимума и минимума. Аналогичный результат для функций комплексного переменного будет играть важную роль в следующей главе. Докажем предварительно одну теорему. 7.49. Т е о р е м а. Предположим, что F непрерывна и a, b — действительные числа, а ^С Ъ. Пусть А = {F (х): а ^ х ^ Ь}\ другими словами, А — область значений функции F, ограниченной на {х: а ^ х ^ Ь). Тогда А ограничено сверху и снизу. Другими сло- словами, функция, непрерывная на отрезке [а, Ь], ограничена на нем. Доказательство. Предположим, что А не ограничено сверху. Тогда для каждого п 6 Р существует элемент из А, больший, чем п, т. е. существует хса^х^б и л <f (x). Для каждого п мы можем выбрать определенное хп такое, что а ^ хп ^ b и п < <.F (xn) (используя аксиому выбора, чего, однако, можно избежать несколько более тонкими рассуждениями). Тогда (хп) — ограничен- ограниченная последовательность и, по теореме Больцано — Вейерштрас- са 7.26, содержит сходящуюся подпоследовательность {yh) = (хп), «о < «i < • • • < nk < • • ¦ Тогда, по 7.47, (F (yh) > — сходящаяся последовательность. Однако, как легко видеть, это противоречит тому, что nh <CF ((/ft) для всех k. Таким образом, А ограничено сверху. Аналогично доказывается, что А ограничено снизу. 7.50. Теорема. Предположим, что F — непрерывная функ- функция и что a, b — действительные числа, а ^.Ь. Тогда (i) существует по меньшей мере одно число с такое, что а ^.с ^ Ъ и F (х) ^ F (с) для всех х, а ^ х ^ Ь; (и) существует по меньшей мере одно число с такое, что а ^ с ^ ^ Ь и F (с) ^ F (х) для всех х, а ^ х ^ Ь. Доказательство, (i) Пусть А = {F (х): а ^ х ^ Ь}. По предыдущей теореме, А ограничено сверху, и потому имеет точную верхнюю грань; назовем ее d Тогда, по 7.18 (и), для каждого п 6: Р мы можем найти хп такое, что а ^ хп ^ Ь и d — F (хп) << — . Мы снова применим теорему Больцано — Вейерштрасса, чтобы найти сходящуюся подпоследовательность (г/&) = (xnfe) ,n0 <«i < • • • <«й <• • •, последовательности (хп). Пусть lim yk = с. fc-юо
292 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Тогда, по 7.47, lira F (г/д) = F (с). Очевидно, что а ^ с ^ Ъ. ft—>оо Остается показать, что d = F (с). Для любого данного е > О мы можем найти п 6 Р с \ln ^ е/2 согласно свойству Архиме- Архимеда 7.12 (И). Тогда, если k — любое целое число с n^.nk, то \d — F (yh) | = | d — F (xnh) | < \lnk < \ln < e/2. Так как lim Z7 (г/й) = F (с), то мы знаем, что существует т 6 Р такое, что ft-»oo I F (yh) — F (с) \ <. в/2 для всех k ^ /п. Отсюда, выбирая & доста- достаточно большим, мы получаем \d-F{c)\^\d-F Ы | + | F Ы - F (с) | < е. Так как это неравенство выполняется для любого е > 0, то d = f (с) и, следовательно, Z7 (с) = sup A. Доказательство (и) проводится аналогично. В (i) мы говорим, что F достигает на интервале а ^ х ^ Ъ своего абсолютного максимума в точке с. Аналогично, в (и) мы говорим, что на этом интервале F достигает своего абсолютного минимума в точке с. Заметим, что теоремы 7.48 и 7.50 являются чистыми теоремами существования: ни формулировки, ни даже доказательства их не содержат никакого способа нахождения числа с. Далее в данном разделе мы еще коснемся этого вопроса. Действительные полиномы и их корни. Применим полученные результаты к полиномам. Это можно сделать с помощью соответствующих функций, которые, как мы покажем в следующей теореме, непрерывны. Это утверждение и его доказательство свя- связаны с 7.29. 7.51. Теорема. Предположим, что c?Re и что G, Н — непрерывные функции. Тогда функция F, определенная для всех х ? Re любым из следующих условий, непрерывна: @ F (х) = с; (и) F (х) = х; (iii) F(x) = G (x) + Н (х); (iv) F(x) = G(x)-H(x). Доказательство, (i) и (ii) тривиальны, (iii). Зафикси- Зафиксируем некоторое а 6 Re- Для любого е > 0 существуют такие б4 > 0, б2 > 0, что если \х — a|<6j, то \G(x) — G{a)\ <.— ; если \х — а\ <б2, то \Н(х) — Н(а)\ <-j' Пусть б будет наименьшим из 6Ь б2- Тогда из \F(x)-F(a)\=\(G (х) - G (a)) + (Я (х) - Н (a)) | < . < | G (х) — G (а) +\Н(х)-Н (а) |
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 293 мы заключаем, что | F (х) — F (а) | < е, как только | х — а | < б. (iv). Для любого фиксированного а ? Re имеем \F(x)-F(a)\=\G(x)H (х) - G (а) Н (а)\ = = | (О (х) - О (a)) H(x) + G (а) (Н (х) - Н (а))\ < <| G (х) - G (a)\ I H{x)\ +| G (а)\ \ Н (х) - Н (а)\. Пусть Mi = max (| G (а) |, 1). Тогда Mi > 0. Мы можем найти б2 > 0 такое, что если \х — а|<82, то \Н(х) — Н(а)\ < В силу 7.49 значения Н (х) при | я — а | ^ б2 ограничены сверху и снизу, поэтому мы можем найти Л42 такое, что если \х — а | <б2, ото |Я(д:)|<М2. Теперь мы можем найти б4 такое, что если \х-а\<8и то \G(x)-G(a)\<-~. Пусть б будет наименьшим из Si, б2. Тогда как только \х — а \ < б, будет также | Н (х) | <.М% и, следовательно, получаем | G (х)—G (а) \Н(х) | <в/2, а также | G (а) \ \ Н {х)—Н (а) | < е/2, откуда, наконец, | Z7 (х) — i7 (a) | < е. Мы могли бы также доказать непрерывность функции F (х) = = G (х)/Н (х), если Н (х) Ф 0 для всех х. Однако, нам это не пона- понадобится. п 7.52. Следствие. Если /(?NRe[?], т.е. !{1)=^а&\ i=0 где каждое аг действительное, то полиномиальная функция f (x) = п = 2 atx%, соответствующая /(g), непрерывна. г=0 Доказательство. Исходя из 7.51 (и), (iv), индукцией по i можно показать, что каждая из функций gt (х) = хг непрерыв- непрерывна; тогда, пс 7.51 (i), (iv), непрерывны и /, (х) = а^х*. Но тогда п непрерывность / (х) — 2 сцх% доказывается индукцией по п на i=0 основании 7.51 (ш). Из теоремы 7.51 можно также вывести, что непрерывными будут и функции, определяемые степенными рядами, т. е. функции оо F (х) = S aix% (во всех точках, в которых они определены). i=0 Однако для получения этого результата теорему 7.51 прямо при- применять нельзя и требуются некоторые дополнительные соображе- соображения; соответствующие утверждения выносятся в упражнения (см.
294 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА упражнения 3 и 4 к п. 7.4). В частности, как мы увидим, функ- функция Е, определенная в 7.43, непрерывна. Чтобы применить 7.48 и 7.52, докажем следующие неравенства. 7.53. Теорема. Предположим, что /(?)?Re[|], /(?) = п — 2 аг|\ где л>0 и ап=\. Пусть М будет наибольшим из 1, п-1 2 \a-i\- Тогда: г=0 (i) если х> М, то /(*)>• О, иеслих< — М, то ( — 1)п/(х) >0; (ii) если f(x) = O, то \х\<^.М; (iii) если п нечетно и х<С — М, то /(х)<;0. Доказательство, (i). Используя неравенство а>-—|а|, мы видим, что для любого х>-0 верно A) Теперь'если х>М, то, очевидно, х> 1 и л:г<л:г+1 для любого i. Отсюда если х> М и 0 ^л <С]'^.п, то хг<л:3. Следовательно, если л; > УИ, то <( I «о I +1 fli I + • • • +1 Cn-i I) лг" таким образом, получаем B) если х>тИ, mo /(x)>xn —Mxn-1 = xn-IU —М)>0; первая часть (i) доказана. Чтобы доказать вторую часть, напишем (-i)n/W= 2 (-1)п-'а((_^= S ь^, г=0 г=0 где &г = (— 1)п~гаг и у=—х. Как и в A), из |?>г| = |аг| мы получаем C) (-\f f {X)>yn-(\ao\ + \ai\y + .. . + \ап^\у^) для у— —х. Теперь, если х <¦—М, то у > М, и мы, как и ранее, видим, что I ао I -И d I 0 + • • • + I On-i I ^z" < Myn-\ откуда D) mm х < — М, то (—1)п / (х) > г/п — тИг/" > О йля г/ = —х. (i) доказано полностью, (ii) и (iii) следуют непосредственно из (i). В качестве примеров рассмотрим полиномы /0 (I) = ?4 — 3? -г- 2, /i (I) = ?5 + З^4 — 2. Из теоремы 7.53 следует, что для х > 5
!А. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 295 имеем /0 (х) > 0 и /4 (х) > 0; для х < —5 имеем /0 W > 0. но /i (^) < 0. Из теоремы 7.48 следует также, что /ч (|) имеет по край- крайней мере один действительный корень между —5 и 5; единственное же заключение, которое мы пока можем сделать относительно /о (i)i — если он имеет действительный корень х, то —5 <; х ^ 5. Чтобы применить 7.53 к произвольному полиному / (|), мы сначала делим / A) на коэффициент при старшем члене (т. е. на ап). Тогда знак ап определяет поведение / (х) для | х | > М, где М — наи- п-1 большее из чисел 1 и 2 I a^fln I- 1=0 7.54. Следствие. Предположим, что полином f(?)(;Re[?] имеет нечетную степень п. Тогда f (|) имеет по крайней мере п один действительный корень. Точнее, если /(!)= 2 а*?г> г^е г=0 п-1 йп ^= 0 и М —наибольшее из чисел 1, 2 |fli/#n|, «о f(x) = O для г=0 некоторого х, \х\^.М. 7.55. Теорема. Предположим, что п Е Р гл а >¦ 0. Тогда существует единственное действительное число х > 0 такое, что хп = а. Доказательство. Рассмотрим полином / (|) = |п — а. Тогда / @) <0 и / (&) > 0 для любого Ь ^= а + 1. Следовательно, имеется по меньшей мере одно х > 0, для которого я'п — а = 0. Докажем теперь единственность решения. Предположим, что хп = а и уп = а, где 0 <*, 0 <1у. Если х <г/, то (по 4.15) х™ <г/п, что невозможно. Аналогично, не может быть у <С.х, поэтому х = у. В общем случае можно видеть, что для а > 0 уравнение хп = а имеет ровно два действительных решения, если п четно, и ровно одно действительное решение, если п нечетно. Если а = 0, то существует лишь одно решение х = 0. Если а <0, то решений нет, если и четно, и есть ровно одно, если п нечетно. Из сравнения полученных результатов с теоремами 6.20 и 6.21 непосредственно видны преимущества, которые обеспечивает нам возможность рассмотрения действительных чисел при изучении существования корней полиномов. Однако основная наша цель по-прежкему еще не достигнута — мы не знаем, какие бывают простые полиномы и не можем доказать теорему разложения, аналогичную теореме 6.35, для полиномов с действительными коэф- коэффициентами. Для этих целей нам потребуются некоторые сведения о комплексных числах, поэтому мы оставим рассмотрение общего случая до следующей главы. Сейчас же мы полностью изучим случай полиномов второй и третьей степени. Мы можем это сделать, посколь- поскольку, в силу теоремы 6.37, описание простых полиномов сводится к вопросу о существовании действительных корней полиномов для случаев л = 2, 3. Так, сопоставление теорем 7.54 и 6.37 показывает,
296 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА что простых полиномов третьей степени не существует, так как каждый такой полином имеет хотя бы один действительный корень. Для полиномов же второй степени, как читателю хорошо известно, существует простая формула, позволяющая вычислять корни, а значит, и судить о наличии корней и, следовательно, о простоте полинома. Прежде чем выводить эту формулу, на основе 7.55 введем символ квадратного корня и вообще корня п-й степени. 7.56. Определение. Предположим, что а>0 и п?Р. Под ^У а или aifn мы понимаем единственное х>0, для которого хп — а. Мы называем его {неотрицательным) корнем n-й сте- степени из а. В конце этого раздела мы скажем несколько больше о связи этого [вида степеней с рассматривавшимися до сих пор. Обычно мы пишем \^а вместо у^а. Заметим, что, как только п четное, а™;>0 вне зависимости от знака а и поэтому ^а11 для четного п всегда определен; именно, у/~ап = \а\ (п = 2т, т?Р). 7.5/. Теорема. Предположим, что а, Ь, с ? Re, а Ф 0. Тогда (i) полином я?2 + bl + с имеет действительный корень тогда и только тогда, когда Ь2 — 4ас ^0 н, следовательно, он прост в Re [?] тогда и только тогда, когда Ъ2— Аас <0; (ii) если Ъ2 — \ас = 0, то а?2 + Ъ\ + с имеет единственный корень х = —Ы2а и а?2 + Ъ\ + с = а (| — хJ; (ш) если Ь2 — 4ас > 0, то al2 + Ъ% + с имеет два корня F Re): Доказательство. Будем следовать обычному методу «дополнения до полного квадрата». Для любого х уравнение ах2 + Ьх + с = О эквивалентно уравнению х2 4- ibla) х = —(с/а) и, следовательно, уравнению 62 с ~ 4а2 а ' ' • "" V~ ' 2а / 4а2 ' Так как (х + Ь/2аJ > 0 и 4а2 > 0, то для существования корней полинома обязательно Ь2 — 4ас ^ 0. Обратно, если Ъ2 — 4ас ^ 0, то мы можем найти корни такие, как в (ii) и (iii). Как мы увидим при изучении комплексных чисел, единственны- единственными простыми полиномами в области действительных чисел являются линейные полиномы а\ + Ь и квадратичные полиномы а%2 4- Ь% + с, для которых Ъ2 — 4ас <0. Однако доказательство этого утвержде- утверждения потребует некоторых глубоких рассуждений.
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 297 Вычисление корней. Даже в частных случаях 7.54 или 7.55, когда мы имеем дело с полиномами, для которых существование корней гарантировано, мы пока не имеем достаточной информации о том, как «найти» эти корни. Под «найти» мы здесь понимаем систе- систематический метод, позволяющий по заданным коэффициентам полинома найти члены такой фундаментальной последовательности (хп), что х = lim хп — один из корней полинома. Мы могли бы П-юо надеяться даже на большее, а именно, найти метод, который ука- указанным образом давал бы нам все действительные корни полинома, если таковые имеются. На первый взгляд может показаться, что формулы 7.57 (ii), (iii) дают ответ на эти вопросы для полиномов степени 2. На деле же в 7.57 говорится только о числе действительных корней такого поли- полинома, а вопрос отыскания его корней сводится к теореме их суще- существования G.55). Оставляя на время в стороне вопросы простоты и эффективности метода нахождения корней, укажем один метод, применимый не только к полиномам, но и к любой непрерывной функции F (х), если только мы умеем для любого (достаточно рационального) х вычислить значение F (х) и если, для некоторых а0, b0, F (а0) и F (Ьо) имеют различные знаки, например F (а0) <0, F (Ьо) > 0. Из непрерывности F (х) тогда легко следует, что мы также можем найти и рациональные а0, Ьо, удовлетворяющие указанным требова- требованиям. Итак, пусть указаны а0, Ьо 6 Ra и предположим, например, что а0 <cb0. Рассмотрим с = (а0 + Ь0)/2; по предположению мы можем вычислить F (с). Если F (с) = 0, то процесс окончен. Если F (с) > 0, то по 7.48 мы знаем, что между at и &4 имеется некоторый корень, где аг = а0, Ь^ = с. Если F (с) <0, то мы знаем, что между «1 и bi имеется корень, где на этот раз а^ = с, bi = b0. Повторим эту процедуру с а1; bi вместо а0, Ьо и таким образом построим две последовательности (ап), (Ьп) рациональных чисел. На любой ста- стадии мы или получаем (ап + ЬпI2 в качестве корня F, или продол- продолжаем процесс дальше, чтобы получить ап+\, bn+i, для которых знаки / различны. При этом всегда Ьп — ап = A/2™) -(^о — ао)- Отсюда видно (ср. доказательство теоремы Больцано — Вейер- штрасса 7.26), что если процесс никогда не оборвется на корне, то lim ап = lim bn = с; в силу непрерывности F имеем F (с) = П->оо п-+оо = F (lim ап) = lim F (ап) < 0 и F (с) = F (lim bn) = lim F {bn) > ^ 0; поэтому F (с) = О. Следовательно, любая из последовательно- последовательностей (ап), (bn) является фундаментальной последовательностью, сходящейся к корню с. Если же а0, Ьо выбраны целыми, то, как легко видеть, описанный процесс дает нам представление с по осно- основанию 2 G.35). Очевидным образом этот метод может быть моди- модифицирован так, чтобы получалось представление с и по любому
298 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА (Xk,F(Xk)l другому основанию, например, по основанию 10. В частности, при применении этого метода к полиномам в 7.54, 7.55 в первом случае мы можем взять а0 = —М, Ьо = М, где М определено в 7.54, а во втором случае а0 = 0, Ьо = а -\- 1. Для вычисления корней уравнений в алгебре и анализе разра- разработано большое число методов, с точки зрения практики более подходящих, чем описанный. Основными критериями здесь являют- являются, во-первых, «скорость сходимости» приближений и, во-вторых, простота задаваемого алгоритма. Сейчас мы хотим изучить лишь один случай, а именно, отыскание по заданному а > 0 такого х > 0, что хп = а. Рассматриваемый процесс известен под названием метода Ньютона; он основан на идеях элементарного анализа, с которыми мы здесь постоянно встречаемся. (Не- (Несмотря на то что идея метода проста, точная формулировка всех условий, при которых он дает верный ответ для произвольной исходной функции, слишком сложна, чтобы ее стоило здесь приводить.) Итак, рассмотрим график функции F (х) = хп — а для х ^ 0 (рис. 36). Мы будем строить по- последовательность хк, начинающуюся с произвольного х0, большего У а, на- например с хо = а~\-\. Для построен- построенного xh находим касательную к графику в точке (xh, F (xh))- Как мы знаем из дифференциального исчисления, уравнением этой прямой будет у — F (xh) = F' (xh) (x — xh), где F' — производная функции F (понятие производной было введено в 5.16, 5.17 в качестве формальной операции на полино- полиномах). В частности, для f (I) = t,n — а мы имеем/' (g) = ntJ1'1 — результат, хорошо известный. В случае, с которым мы имеем дело, уравнение прямой будет у — {х\ — а) — пхи~х (х — xh). Определяем xft+i как координату точки пересечения этой прямой с осью х. Другими словами, —(xf — а) = пх\~х (xh+\ — xh), откуда Рис. 36. nXn -xk- Таким образом, строим последовательность (xk) = x0, Из рис. 36 непосредственно видно, что lim Хи = П->оо чертеж и доказательство — совершенно разные вещи. Однако
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 299 Продемонстрируем доказательство на примере п = 2. В этом случае xh+i = (xk/2)-\-(a/2xh). Тогда 1/— 1 / л/—\ Л/а . а Используя этот результат, индукцией по k докажем, что Y Действительно для k = 0 неравенство следует из выбора х0. Пред- Предположим, что оно верно для k. Тогда (х& — Yof 12хи>^, откуда i — ]/'а>0, что и требовалось. Поэтому, для всех k, Xh Полагая 6 = 2} a, получаем a \2 b ^ \ b Индукцией по k устанавливаем, что Xh— v о. I л'о— у а ^ " b "^ V b T. e. )'• b2¦ -1 Используя 1 — |/а/д;([<1, получаем несколько более слабее, по сравнению с предыдущим, неравенство, показывающее, что I/— хи — Т/'а •/— хо — Л/а — уа<с г, — и, следовательно, xh — / п -^ v tiq"" г, и, следовательно, xh — Y & < —-—г 2 2 уже достаточно, чтобы установить li ft—vco Доказательство общего случая предоставляется читателю в ка- качестве упражнения. Проделаем, например, первые три шага вычисления ]^2, начи- начиная с хо = 2: х1= 1,500..., х2= 1,4166 ... и х3= 1,4142 ... Используя и предполагая xt — ]/г2<0,1, мы видим, что х3 — ]/^2<<@,1M = = 0,00001.
300 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Этот метод столь же хорош, как и обычный «школьный» алгоритм вычисления квадратных корней, но имеет то преимущество, что обобщается на вычисление корней любой целой степени, чего нельзя сказать о школьном алгоритме. Кроме того, в ходе вычислений согласно последнему алгоритму неудобно проводить процедуру «проб и ошибок». Метод Ньютона (как и любой практический метод) вполне пригоден для вычислений с помощью машин. Локализация всех корней; теорема Штурма. Вернемся теперь к описанной ранее процедуре вычисления по крайней мере одного корня непрерывной функции F, для которой существуют такие а, Ь, что F (а)"<0, F (Ь)>0. На первый взгляд можно представить себе, что, рассматривая знаки F на концах всех подынтерва- подынтервалов, получающихся из первоначального после- последовательным делением Рис. 37. на 2, мы можем получить все решения уравнения F (х) = 0. Однако, изображенная на рис. 37 функция служит контр- контрпримером к такому рассуждению. Если на этом рисунке с2 ирра- иррационально, то такого рода вычислениями мы никогда не обнаружим, что у F (х) между а и Ъ имеются решения х, отличные от с4, так как знак F на концах любого подынтервала, содержащего с2 и не со- содержащего Си будет положительным. Ситуация, показанная на рис. 37, невозможна, если м-ы имеем дело с полиномиальной функцией /, имеющей только простые корни в смысле 6.38. Действительно, если с — любой простой действи- действительный корень / (I), то / (?) = (I — с) g (I), где g (I) 6 Re [?} и g (с) Ф 0. Пусть, скажем, g (с) >¦ 0. Тогда в силу непрерывности g мы можем найти е > 0 такое, что g (х) > 0, как только | х — с | < <С е. Следовательно, / (х) имеет тот же знак, что их — с, если с — e<x<c4-e и отсюда / (х) < 0, если с — е < х < с, и / (х) > 0, если с <ix <ic + е. Аналогично, в случае g (с) <0 / (х) имеет в достаточно малой окрестности с тот же знак, что и — (х — с). Следовательно, получаем алгоритм выделения всех действитель- действительных корней произвольного полинома / (\) 6 Re Ц]. Действительно, в силу 6.39, если мы найдем d (?) = (/ (?), /' (I)) и положим /4 (?) = = / (|)/d (I), то полином /ч (I) имеет в точности те же корни, что и / (|), причем все корни /4 (?) простые. Далее, вследствие 7.53 (ii) мы можем найти an b, между которыми лежат все корни / (?). Таким образом, согласно замечаниям предыдущего параграфа, описанная выше процедура может быть с успехом применена к fu давая иско- искомый результат и для f.
7.4, ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 301 Даже если непрерывная функция F имеет корни типа изобра- изображенных на рис. 37, мы можем применять метод выделения корней, если, во-первых, F имеет конечное число корней, и, во-вто- во-вторых, имеется некий алгоритм, который позволяет узнать, сколько именно корней имеет F на заданном интервале. Для произ- произвольной полиномиальной функции / такой алгоритм может быть найден при соответствующем использовании алгоритма Евклида для вычисления н. о. д. / (?) и /' (?). Весь этот алгоритм нахождения числа корней полинома известен под названием теоремы Штурма. В нашей дальнейшей работе она нам не понадобится и приводится только ввиду ее большого значения в алгебре действительных чисел. Прежде чем доказывать теорему, введем два новых понятия, играющих в ней важную роль. 7.58. Определение, (i) Предположим, что (х0, . . . . . ., Хн-\) — k-членная последовательность действительных чисел {где k, возможно, равно нулю; в этом случае последовательность пустая). Мы говорим, что последовательность является приве- приведенной, если xt Ф 0 для каждого i. По любой последователь- последовательности (х0, . . ., xk_i) мы определяем приведенную последователь- последовательность (у0, . . ., yi-i) следующими рекурсивными условиями: если k = 0, то полагаем I = 0; пусть для (х0, ¦ ¦ ., xk-i) приведенная последовательность (у0, . . ., yi-i) уже построена, тогда для (х0, . . ., xk-i, Xh) строим ту же последовательность, если xk = 0, и строим последовательность (у0, . . ., t/i-u xh), если х^фО. (П) Под числом перемен знака приведенной после- последовательности (уо, ¦ ¦ •, Hi-i), которое обозначаем V ((у0, ... . . ., г/z-i)), мы понимаем число, определяемое следующими рекурсив- рекурсивными условиями: если 1 = 0 или I = 1, то V ({уо, . ¦ ., t/i-i)) = 0. Пусть при I ^ 1 V {{уй, ¦ ¦ ., г/;-1» уже определено; тогда полагаем V ((г/о У 1-й Уг» = V ((у0, . . ., г/г-i», если V ((г/о, . • ., у 1-й г/г» = V ({у0, ¦ ¦ ¦, г/г-i» + 1, если Числом перемен знака произвольной последовательности (х0, ... . . ., xk-i) мы называем V ((г/0, . . ., г/г_1», где (у0, . . ., уг_х) — приведенная последовательность, соответствующая последователь- последовательности {х0, ¦ ¦ ., Xk-i)', это число мы также обозначаем V ({х0, . . ., Xk-i))- Условие г/г_1 -г/г > 0 просто означает, что г/г_4 и г/г имеют одина- одинаковые знаки, т. е. или г/г_! > 0 и г/( > 0, или г/г_1 <0 и г/г <0. Условие г/г_1-г/г<0 означает, что они имеют противоположные знаки, т. е. или г/г-1>0 и г/г <0, или yi_t <0 и г/г > 0.
302 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА В качестве примера рассмотрим вычисление V (@, 2, 0, 1)). Соответ- Соответствующей приведенной последовательностью будет B,1) и V(<2, I» = V(<2» = 0. Другой пример: V ({2, —1, 0, 0, 3, 1, 0, 2, —2, —5» = = V (<2, -1, 3, 1, 2, -2, -5» = V (B, -1, 3, 1, 2, -2» = = 1/(<2, —1, 3, 1,2» + 1 = V(B, —1, 3, 1)) + 1 = = V (B, —1, 3» + 1 = 1/(B, —1» + 2 = У (B)) + 3 = 3. Таким образом, игнорируя нулевые значения в первоначальной последовательности, мы имеем три перемены знака, а именно от 2 к —1, от —1 к 3 и от 2 к —2. Один из способов нахождения наибольшего общего делителя d (?) полиномов / (?), /' (?) состоит в повторяющемся использовании алгоритма деления 6.26 в точности так же, как алгоритм Евклида для нахождения н. о. д. двух целых чисел состоит в повторном использовании деления (что мы уже обсуждали в 4.42). Точнее гово- говоря, мы пишем / (?) = g0 (?) /' (?) + г. (?), где deg (п (?)) < < deg (/' (?)), затем применяем алгоритм деления к f (?), rd (?) и т. д. В данном случае rt (?) удобнее определять условием / (?) = = go (?) /' (?) — /"i (?). Таким образом, Г (?) = gi (?) Г4 (?) - Г2 (?), ri (?) = gz (?) г2 (?) - г, (?), . . ., /-*_! (?) = ?, (?) гг (?) - гг+1 (?), где 0 < deg (ri+l (?)) <deg (rt (?)). Эту процедуру мы продолжаем до тех пор, пока не достигнем первого т с deg (rm+i (?)) = 0. Если rm+l (?) = 0, то rm_j (?) = gm (?) rm (?) и rm (?) — искомый н. о. д. В противном случае rm+1 (?) =rm+i — постоянная, rm+i Ф 0 и гт (?) = = gm+i (?) ¦>'m+i, поскольку любая постоянная делит любой поли- полином. В этом случае н. о. д. будет любая ненулевая постоянная, в частности 1. Конечно, может случиться, что уже deg (rt (?)) = 0; в этом случае или /' (?) |/(?), или (/(?), f (?)) = 1. 7.59. Определение. Пусть f (?) G Re [?], deg (f (?)) > 0. Под последовательностю Штурма, определяемой полиномом f (?), мы понимаем последовательность {f0 (?), f\ (?), . . . . . ., /m(?))> определяемую следующими рекурсивными условиями: (о fo(\) = f(i), пт = гаг, (ii) для каждого i, 0 <г <m, имеем /,_i (?) = gt (?) /j (?) — - fi+l (?), где 0 < deg (/i+1 (?)) < deg (/; (?)) и fi+l (?) ^ 0; (Hi) fm-l (?) = gm Ш /m (?)• Для любого действительного числа с полагаем Vf(c) = V«fo(c), ft (С), ¦ ¦ ; fm(c))). В качестве примера вычисления последовательности Штурма рассмотрим полином / (?) = /0 (?) = ?4 - 2?3 + 2?2 — 2? + L
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 303 Тогда /' (?) = /4 (Е) = 4^3 - б?2 + 41 - 2, /2 (?) = - 1 !2 + ? -А и последним членом последовательности будет f3 (?) = —32! + + 32. Тогда, например, Vt @) = У (<^1, — 2, — i- , +32)>) = 2; аналогичное вычисление показывает, что Vf B) = 1. Заметим, что в данном случае полином / (!) = (? — IJ (!2 + 1) имеет в точности один действительный корень с = 1. Итак, формулируем теорему Штурма. 7.60. Теорема. Предположим, что / (?) ? Re [?], deg (f (I)) > 0. Предположим также, что а •< Ь u f (а) Ф 0, / F) Ф Ф 0. Тогда число различных действительных корней с полинома f (?) таких, что а <с <Ь, равно У/ (а) — V/(&). Доказательство. Пусть </„ (|), ^ (Н), . . ., fm (|)) — последовательность Штурма для f (H). Тогда для каждого i fm(l) \fi(l) и fm(l) — H. о. д. ИЮ и f(g). Положим A) A (g) = А ф//т (Е) при /т (!) | /I (!). Таким образом, /т (!) = 1. Из 5.17 следует, что если с — корень /(!) кратности k, то f (!) = (! - с)" g (!), где g (с) Ф 0, Г (!) = k(l- сL-1 g (!) + (! - c)k g' (!). Следовательно, для полинома fm (?) корень с имеет кратность k — 1 и fm (!) = (! - с)"" s (!), где s (!) | g (!) и s (!) |V (!)• Отсюда мы заключаем, что B) если f (с) = 0, то существуют k > 0 и g (?) такие, что /о (!) = (! - с) g4 (?), 7i Ш = ^i (I) + (I - с) ё2 (!), где gl (!) = ^ (!)/s (!), g2 (!) = g' (!)/s (!) « ffl(c) Ф 0. Заметим также, что C) если / (х) =т^= 0, то fm (x) Ф 0 и Vf(x) = V«fo(x), h(x), . . ., fn{x))). В самом деле, fm (?) не имеет действительных корней, отличных от корней f (!). Тогда для любого такого х деление каждого члена последовательности (f0 (х), Д (х), . . ., fm (x)) на ненулевую постоянную fm (x) не меняет в ней числа перемен знака (хотя если fm (x) отрицательно, то оно меняет индивидуальные знаки членов последовательности). Для каждого х мы полагаем D) V-f (X) = V «Го (X), h (X), ¦ ¦ ., fm (X))).
304 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Равенство Vj(x) = Vf (x), вообще говоря, не будет выполняться при f (х) = 0, однако V-f (a) = Vf (а) и Vj (b) = Vf (b) соглас- согласно C). Теперь представим себе, что х изменяется от а до Ь. Основным моментом нашего доказательства будет утверждение, что Vj (x) может изменяться, только когда х проходит через значение с такое, что / (с) = 0,— точнее, что в этом случае Vj (x) уменьшается на 1. Рассмотрим совокупность S всех корней всех полиномов, по- построенных по полиномам данной последовательности Штурма (вне связи с заданным интервалом [а, Ь])\ E) S = {х: ft {х) — 0 для некоторого i <Ст}. Так как каждый полином имеет лишь конечное число корней, то мы можем написать F) S = {di, d2, . . ., dt}, где dx <d2 <. . . <dt. Произвольно выберем d0, dt+i так, чтобы d0 <.dt и dt Тогда G) если i<.m и 0</<:^+ 1, mo ft (x) имеет один и тот же знак для всех х, для которых dj-i<Cx<Cdj, т. е. для всех таких х одновременно или ft (x) > 0, или ft(x)<0. Далее, если fi(dj)=?O, то для всех таких х полином ft(x) имеет тот же знак, что и ft(dj). Чтобы показать первую часть, предположим, что между d/_j и dj имеются xt, x2 с fi(Xi)>0 и fi(x2)<i0. Тогда по теореме Вейерштрасса 7.48 между хх и х2 существует х такое, что fi(x)=O. Это противоречит E) и F). Доказательство второй части тривиально. Следовательно, (8) если 0</<* +1 и dj-! <xu xz<.d}, то Vj{xt) = Vj(x2). Таким образом, нам лишь нужно установить, как изменяется Vj (x) при переходе через dj. Заметим, что (9) не существует i и х таких, что 0<ii^.tn и fi_i(x) = = 0=Ъ(х). Действительно, если i = m, то ft (?) = fm (?) = 1. С другой стороны, если i<.m и fi-1(x) = O = fi(x), то из A0) 7*-i (Е) == ЙГ* (S) 7i (?)—Гм-i (S) мы заключаем, что также /*+1 (х) = 0, откуда fi+2 (x) = 0, ..'. и мы в конце концов получаем fm(x) = O, что невозможно.
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 305 Теперь мы утверждаем, что A1) если 0</<^+1 и <1)-1<.х<й), то V7(x), если T(d})^=0, и = V7(x)-l, если J(dj) = 0. Для краткости будем писать с вместо dj. Чтобы доказать A1), сравним знаки последовательностей (То(с), Ш, .... Ti-i(c), Ti(c), fi+1(c), ..., fm(c)), (To (*), 7i (x), ..., Д-1 (x), Ъ (x), Ji+i (x), ...,Jm (x)}. Если для данного i, 0<i<m, выполнено fi(c) = O, то в силу (9) fi-i(c)^O и в силу A0) fi_1(c)= —fi+i(c). Следовательно, для 1 = св этой точке имеем одну перемену знака. Снова, ввиду G), fi-i(x) имеет тот же знак, что и /^(с), a fi+1(x) — тот же знак, что и fi+l(c) для dj-1<cx<Cdj. Таким образом, вне зависимости от значения ft (x) в этой точке имеет место только одна перемена знака. Поэтому Vj (x) может быть отлично от VT (с) только в слу- случае /0(с) = 0. В силу B) в этом случае существуют такие k>0 и g(l), что 7o(x) = (x — c)gi(xy, Ti(x) = kgi(x) + (x — c)g2(x) для всех х, где ё1(с)=?0. Отсюда /0(с) = 0, f1(c) = feg'1(c). С другой стороны, если dj-.t<ix<Cdj — c, то gi(x)=^=0 и вследствие G) мы видим, что gj(x) имеет тот же знак, что gi(c), fi(x) — Tor же знак, что и fi(c), т. е. тот же знак, что и gi(c). Но для х<_с fo{x) имеет знак, противоположный gi(x); отсюда fo(x) и f{{x) имеют противоположные знаки при ^_1<x<;d;. Другими слова- словами, когда мы проходим через х = с, в этой точке последователь- последовательности мы теряем одну перемену знака. Вполне может случиться, в частности и в этом случае, что существует такое i > 1, что /г(с) = О. Но те же соображения, что и ранее рассмотренные, показывают, что это не сказывается на перемене знака в данной точке последовательности. Следовательно, A1) доказано. Теперь, если даны a, b, a<ib, f (а)Ф 0, f (b)Ф0, то мы можем выбрать d0, dtJri такими, чтобы do<a, b<.dt+i. Существует^ един- единственное l^.t-\-1 такое, что di-l-^.a<cdi. Ввиду B), корни / в точ- точности те же, что и корни /, поэтому мы можем применить A1) для доказательства индукцией по / того, что если /</, то Vj(a)— — Vj(dj) равно числу таких корней с полинома f(Q, что а< В частности, A2) Vj (a) — Vj (d<+i) равно числу различных корней с поли- полинома f(l) таких, что а<сс.
306 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Те же соображения применимы и к Ь, поэтому Vj(b) — Vj(dt+i) — число различных корней с таких, что Ь<,с. Отсюда A3) Vj(a) — Vj(b) —число различных действительных кор- корней с полинома f{\) таких, что а<с<6. Этим теорема доказана, если принять во внимание C). Чтобы определить с помощью конечного числа шагов, сколько действительных корней имеет данный полином /(|) с действи- действительными коэффициентами, мы можем объединить теорему Штурма с 7.53. Для этого в качестве а, Ъ надо выбрать числа — М—\, М + 1, где М определено в 7.53. Тогда общее число действитель- действительных корней полинома равно Vf(a)— Vf(b). Однако даже проще рассматривать а и Ь, выбранные так, чтобы между ними лежали все числа — Mi, Mi, соответствующие членам ft (g) последователь- последовательности Штурма для /(?) (и, следовательно, все корни этих fo (?))• Из 7.53 мы знаем, что если fi(l) = dn)il ' + ¦ ¦ ¦ имеет степень щ>*0 и коэффициент при старшем члене равен d^., то знак Д-(Ь) тот же, что и у (/??, а знак ft(a) такой же, как у dn\{ — \) *. Конечно, если /,• (|) имеет степень 0, то это постоянная и имеет постоянный знак. Чтобы проиллюстрировать вычисления, рассмотрим уже вычис- вычисленную последовательность Штурма полинома /(|) = /0(Е) = Е4~~ — 2|3 -)- 2?2 — 2g -\-1, которая, как мы знаем, есть -2, /2(?)= _?+g_JLt /3(|)= -321 + 32. Замечаем, что V/ (Ь) для достаточно больших значений b имеет по- последовательность знаков +, +. —. —i следовательно, Vf (b) == 1. С другой стороны, Vf (а) для достаточно малых (т. е. больших по модулю отрицательных) значений а имеет последовательность знаков +, —, —, +; отсюда Vf (а) = 2. Таким образом, / (I) имеет в точности один действительный корень с (который в данном случае мы уже знаем из разложения / (|) — (I — IJ (I2 + 1)). Теперь, когда мы знаем, сколько именно действительных корней имеет полином / (I), и знаем рациональный интервал а0, Ьо, в кото- котором все эти корни лежат, при помощи процедуры Штурма конечным числом шагов мы найдем непересекающиеся рациональные интер- интервалы at, hi, каждый из которых содержит в точности один корень ch a% <.ct <Ь,-. Затем для каждого такого корня мы можем найти фундаментальную последовательность рациональных чисел, при- приближаю цую его с любой желаемой степенью точности, способом, описанным ранее. Несмотря на то, что для вычислений «вручную» все это весьма утомительно, при найденной для данного полинома
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 307 последовательности Штурма процедура просто рутинна (она, например, вполне подходит для машинного вычисления). Известен и более общий алгоритм, который определяет не только количество и расположение корней, но и их кратность. Здесь мы его рассма- рассматривать не будем. Естественно возникает вопрос, нельзя ли, как это было сделано в случае теоремы Вейерштрасса, построить такого рода алгоритм, позволяющий для любой непрерывной функции F (х), значения которой вычисляются в каждой точке с помощью некоторой изве- известной процедуры, найти на отрезке [а, Ь] точку с, в которой F принимает максимальное (или минимальное) значение. Из математи- математического анализа хорошо известен частичный ответ на этот вопрос, именно, что такое построение возможно для функций, обладающих непрерывной производной. Для таких функций оказывается, что максимум может иметь место либо в точке а, либо в точке Ъ, либо в такой точке а < с << Ь, что F' (с) = 0. В первых двух случаях поиск закончен, а в третьем мы легко сводим дело к теореме Вейер- Вейерштрасса, точнее, к уже разобранной задаче поиска всех решений уравнения F' (х) = 0. Все сказанное применимо и к полиномиаль- полиномиальным функциям над действительными числами. Полная схема нуж- нужных рассуждений содержится в упражнениях. В самом общем случае, когда мы не можем предполагать наличие непрерывной производной, нужного алгоритма вообще не суще- существует, как уже отмечалось в п. 1.2. Конечно, чтобы доказать это утверждение, нужно прежде всего определить само понятие алго- алгоритма. Заметим, что мы уже много раз пользовались этим терми- термином, не определяя его, и тем не менее это не было ошибкой или неточ- неточностью. Каждый раз мы просто строили некоторую эффективную вычислительную процедуру и, называя ее алгоритмом, просто кон- констатировали факт, что мы хотим, чтобы под понятие алгоритма эта процедура подпадала. Когда же мы сталкиваемся с необходимостью доказать отсутствие алгоритма, становится необходимым и стро- строгое определение. Такое определение в математической логике было получено в последние десятилетия в нескольких различных вариан- вариантах, оказавшихся эквивалентными. Теория алгоритмов, или, как ее еще называют, теория рекурсивных функций, играет важную роль в алгебре и анализе, там, где мы встречаемся с теоремами существо- существования, в которых доказательство не содержит процедуры вычисле- вычисления. У нгс нет возможности в нашей книге вдаваться в эту теорию и мы упомянули проблематику только для того, чтобы читатель понял необходимость и естестЕенность накладываемых ограничений. Еще раз отметим, что отсутствие точного определения алгоритма не мешает нам применять этот термин к конкретным процедурам, таким, как алгоритм деления, алгоритм Евклида нахождения н. о. д., алгоритм отыскания хотя бы одного корня непрерывной функции в соответствии с теоремой Вейерштрасса, алгоритм Штурма
308 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА нахождения общего числа действительных корней полинома с дей- действительными коэффициентами. Рациональные и действительные степени действительных чисел. Этот раздел мы хотим закончить некоторыми замечаниями о введен- введенных в 7.56 для любого а^Ои любого nf P дробных степенях а^п. Зафиксируем некоторое а 6 Re. Случай а = 0 разбирается тривиаль- тривиально, поэтому пусть а > 0. Легко видеть, что если п, л4 ? Р, т, mi ? I и т/п = mjnu то (ai/n)m = (ai/ni)mi. Следовательно, мы без всякой двусмысленности можем для любого рационального х определить ах как (ai/n)m, если х= т/п, где п 6 Р и т ?1. Нетрудно проверить, что для так определенных рациональных показателей выпол- выполняются основные свойства возведения в степень, определенные нами в 4.12 для положительных целочисленных показателей и расширен- расширенные в 6.5 на произвольные целые показатели. Например, для любых х, у 6 Ra имеем ах+у = ах-ау и ax~v = (ах)у. Проверка этих фак- фактов предоставляется читателю. Дл^я любого действительного а > 0 рассмотрим функцию Ga (x) = ах с областью определения Ra. Можно показать, что если (xh > — любая фундаментальная последовательность рациональных чисел, то (Ga(Xk))~ (aXk) — фундаментальная последователь- последовательность действительных чисел. Далее, если (Xk), (Ук)— две такие фундаментальные последовательности, для которых \\тхи= lim Ук, то lim aXfe= lim а?к. Следовательно, для любого действительного fe-юо ft-+oo х мы можем корректно определить ах как lim aXk при х = lim Xk и всех xh 6 Ra- Тогда функция Fa (x) = ах имеет область определе- определения Re и является продолжением функции Ga, т. е. Fa (х) = Ga (x) для всех х 6 Ra- Из того, что основные свойства 4.12 и 6.5 выпол- выполняются для произвольных рациональных показателей, мы, взяв соответствующие пределы, можем показать, что они выполняются и для произвольных вещественных показателей. Теперь можно показать, что для любого а > 0 функция Fa непрерывна на Re. По существу нужно доказать только, что Fa непрерывна в точке 0. Действительно, если мы хотим показать, что Fa непрерывна в любой действительной точке Ь, то рассмотрим Fa (х) - Fa ф) = ах-аь = аь (ах-6 - 1). Тогда, вследствие непрерывности в точке 0, мы можем сделать | Fa (x) — Fa (b)\ сколь угодно малым, взяв | х—Ь \ столь близким к 0, чтобы | ах~ь— 1 | было достаточно мало. Далее, предположим, что Н — непрерывная функция на Re такая, что Н (x) = Ga (x) для всех рациональных х. Тогда если (xh) — любая фундаментальная последовательность рациональных чисел, то фундаментальна и
7.4. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 309 последовательность (Н (xh)), причем, ввиду 7.47, lim Н (хь) = А->оо = Н (lim xb). Следовательно, если х — любое вещественное число, &-ЮО то всегда, когда х = lim Xk, где все хь рациональны, имеем k—yao lim a*h — Н (х). Другими словами, Н (х) = Fa (x) для всех х 6 Re- Reft—«о Отсюда Fa — единственная непрерывная функция, являющаяся продолжением Ga на все действительные числа. Вспомним функцию Е, определенную при помощи степенного ряда в 7.43. В 7.45 (vi) мы показали, что Е (т) = ет для всех т 6 I, где е = Е A) (Е A) > 0). Из 7.45 (И) также легко следует, что Е A/л) = е1/п для любого п ? Р и тогда Е (т/п) = ет/п для всех п 6 Р, гп G I. Другими словами, ? (х) = ех для всех х 6 Ra. Кроме того, согласно упражнению 4 к п. 7.4, Е — функция, непрерывная на Re. Поэтому Е (х) = ех для всех действительных х. Все сказанное выше является частным случаем значительно более общей ситуации. Предположим, что нам задана функция G с областью определения Ra и областью значений s Re такая, что (i) если (xh) — фундаментальная последовательность рациональ- рациональных чисел, то (G (х^) — фундаментальная последовательность дей- действительных чисел и (ii) если (хи), {Уи)—две такие последователь- последовательности с lim хк — lim уь., то lim G (xh) = lim G (yh). Тогда мы можем для всех действительных чисел х корректно определить функ- функцию F формулой F (х) = \\т G (хъ) всегда, когда х=\\тхн, где все Xft?Ra. Тогда F — продолжение функции G на Re; F непре- непрерывна, если непрерывна исходная функция G. Такая непрерывная функция может быть только одна. Поэтому, с точки зрения ана- анализа, F является естественным продолжением G на Re (хотя, конечно, имеется бесконечно много не непрерывных продолжений). Во многих случаях, используя метод построения F, можно дока- доказать, что многие свойства, выполняющиеся для G в Ra, продол- продолжают выполняться и для F в Re. Возвратившись к возведению в степень, мы можем рассмотреть для любого действительного числа b функцию F(b\ определяемую формулой F(b) (x) = хь; она определена только для действительных чисел х ^ 0. Можно увидеть, что F^ непрерывна в любой действи- действительной точке а > 0. Действительно, рассмотрим разность Если мы положим x = a-\-h, то, обобщая биномиальное разложе- разложение 4.36, можно показать, что (а-\-п) — а -\-Ъа ~гН-\ тг-,— а. 2,1
310 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА которое в данном случае (для Ь$Р) является бесконечной суммой. Тогда \хь-аь\ = что близко к 0 для h, близкого к 0. Законность такого разложения и доказательство непрерывности F<b) (на ее области определения) даются в современных курсах дифференциального исчисления с по- помощью более глубокого использования степенных рядов. Упражнения 1. Доказать лемму 7.47. 2. Показать, что если G (х), Н (х) непрерывны и Н (х) ф 0 для всех х, то функция F, определяемая для всех х формулой F (х) — G (х)/Н (х), непре- непрерывна. 3. Предположим, что Fo, • . ¦, F^, . . .— последовательность функций с общей областью определения Re и F — функция на Re такая, что lim Fk (x) = F (х) для каждого действительного числа х; другими словами, k->oo * для каждого х и каждого 8 >> 0 существует т такое, что \ F (х) — F^ (х) | < s для всех k ^ т. Для данных а, Ь, где а < Ь, мы говорим, что на интервале (а, Ь) последовательность {F^} равномерно сходится к F, если т может быть выбрано независимым от х, а < х < Ь, т. е. для каждого 8 > 0 существует т такое, что \ F (х) — Fh (x) \ < е, как только ^>тиа<*<(>. Доказать, что если последовательность непрерывных на (а, Ь) функций F^ (x) сходится равномерно на (а, Ь) к функции F (х), то F (х) непрерывна на (а, Ь). (Можно привести примеры того, что предположение равномерности здесь опускать нельзя.) Следовательно, если F^ (x) для каждого k непрерывна на Re и (F& (х)) равномерно сходится к F (х) на каждом интервале (—а, а), то F (х) непрерыв- непрерывна на Re. оо 4. Предположим, что F (х) = 2 aixi определена для каждого х ? Re. Дока- зать, что F (х) непрерывна на Re. 5. Предположим, что / (|) ? Re [§], /(?)— 2 а&г< гДе п > ° i=o Пусть N будет суммой всех at, которые меньше нуля, или Af = O, если та- таких <ц не существует. Пусть М — наибольшее из чисел 1, \N\. Показать, что если х^>М, то f(x)^>0 (ср. 7.53 (i)). Какой будет соответствующая нижняя граница для корней ?(?)? 6. Показать, что уравнение хп — а имеет: а) в точности два действительных решения х, если п четно и а > 0; б) в точности одно действительное решение х, если п нечетно; в) не имеет действительных решений, если п четно и а < 0. _ 7. Даны п ? Р, a?Re, а > 0. Пусть х0—любое число такое, что -/о<л:0, и определим (х%) так: я— 1 , а хЛ я пх\ 1 Показать, что >/ а < х^ для всех л:^ (таким образом, из этого определения следует, что х^ ф 0 и х^ вполне определено для всех k) и что lim Xfl = y/a. h-rao
7.5. АЛГЕБРАИЧЕСКИЕ И ТРАНСЦЕНДЕНТНЫЕ ЧИСЛА 311 8. Сколько действительных корней имеет полином /;(?) = — ?з_ g2_|_j-_2? о 2, Найти наименьший интервал [a, b], a, b ? I, который содержал бы все эти корни. 9. Предположим, что / (!) 6 Re Ш имеет степень п > О и а < Ь. Дока- Доказать, что: а) Если / (а) = f (b) = 0, то f (?) имеет по крайней мере один корень с такой, что а < с < Ъ {теорема Ролля). [Указание. Сначала рассмотрите случай, когда / (?) не имеет корней между а и Ь, и используйте разложение / (I) = E - а)" F - b)lg (?), где ^ (а) ф О, ? F) ^ 0.] б) Независимо от f (a), f (b) существует с такое, что а < с < 6 и / (с) = = [/ (&) — / (а)]/(Ь — а) (теорема Лагранжа). в) Если /' (х) > 0 для всех х, а < х < Ь, то / (х) возрастает на [а, Ь], т. е. f (x) <f (у) всегда, когда а <! х < </ <! 6. Аналогично, если /' (х) < 0 для всех х, а < х < Ь, то / (х) убывает на [а, 6]. г) Если / (х) достигает на интервале [а, Ь] своего максимума в точке с, т. е. а <! с <! Ъ и / (х) <! / (с) всегда, когда а <! х <! 6, то или с = а, или с = Ъ, или /' (с) == 0. То же самое, если / (х) достигает на [а, Ь] в точке с своего минимума. 10. Определить свойства функций G (х) = ах (х (; Ra) и Fa (х) = а1 (х 6 Re), введенных в конце раздела. 7.5. Алгебраические и трансцендентные числа Алгебраически мы мотивировали введение действительных чисел необходимостью обеспечить определенную свободу действий при изучении полиномов с рациональными коэффициентами, в основном с точки зрения существования корней таких полиномов, а также при изучении некоторых других алгебраических проблем, касаю- касающихся рациональных чисел. Поставленных целей мы на этом пути частично уже достигли, часть будет достигнута в последних двух главах. С другой стороны, мы мотивировали введение действитель- действительных чисел желанием заполнить «дырки» в упорядочении рациональ- рациональных чисел. Мы провели построение, руководствуясь именно второй идеей, и естественно попытаться выяснить, пришли ли бы мы к тому же результату, отправляясь от первой идеи. Даже не слишком глу- глубокое изучение функций типа показательной приводит к мысли, что это не так, т. е. что мы построили не совсем то множество, которое нужно для рассмотрения решений полиномиальных уравнений с действительными коэффициентами. Точнее говоря, среди действи- действительных чисел много таких, которые не являются корнями никакого полинома с рациональными коэффициентами. Например, рассмо- рассмотрим уравнение 2х — а = 0, где а 6 Re, а > 1. Очевидно, а <2а для любого а > 1, а 2° = 1, поэтому в силу непрерывности функции 2х — а из теоремы Вейерштрасса следует существование такого х > 0, что 2х — а = 0, причем, поскольку 2х — возрастающая функция, такое х единственно (обычно х обозначается log2 а; функ- функция log2 а определена, таким образом, для любого а > 0). В частно- частности, существует, и притом только одно, решение уравнения 2х = 3. Однако не видно способа построения полинома с рациональными
312 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА коэффициентами, решением которого было бы такое х. Чтобы точно сформулировать возникший вопрос, нам потребуется следующее: 7.61. Определение. Действительное число х называется алгебраическим, если существует такой полином f (?) 6 6 Ra Ш положительной степени, что f (x) — 0. Числа, не являющие- являющиеся алгебраическими, называются трансцендентными. Обсуждавшийся вопрос можно теперь сформулировать так: существуют ли трансцендентные числа? В этом разделе на него будет дан положительный ответ. В нем мы увидим также свидетельства важности этого результата. Мы уже использовали слово «трансцендентный», когда вводили (определение 5.2) простые трансцендентные расширения D = К Ш поля К- Это не случайное совпадение: между обоими понятиями существует прямая связь. Пусть, действительно, х — некоторое трансцендентное число. Обозначим D = Ra Ы множество всех п действительных чисел вида 2 а1*1, где все at 6 Ra. Иначе говоря, ¦ г=0 Ra Ы = {/ (х): f (|) 6 Ra [Щ. Легко видеть, что Ra Ы — область целостности относительно операций в Re, удовлетворяющая опре- определению 5.2 (i) — (ii) простого расширения. Проверим, что это простое трансцендентное расширение, т. е. что условие 5.2 (ш) также выполнено. Действительно, если 1=0 1=0 то ввиду трансцендентности х, deg (/ (?)) = 0, / (?) = а0 и потому а0 = 0 и вообще аг = 0 для всех i ^ п. Из теоремы 5.6 следует, что Ra [?] =ё Ra Ы, причем изоморфизм осуществляется функцией F, для которой F (а) = а для всех а 6 Ra и F (I) = х. Когда существование трансцендентных чисел будет доказано, возникнет вопрос, как узнать, являются ли данные конкретные чис- числа — такие, каке, я, (]/)уГ2, log2 3,— трансцендентными? Ни один из предлагаемых ниже двух вариантов доказательства существова- существования трансцендентных чисел не даст нам алгоритма решения этой задачи; вопрос этот очень трудный, и мы к нему еще вернемся. Первое доказательство не даст нам даже сколько-нибудь приемлемого с практической точки зрения способа построения хотя бы одного трансцендентного числа. Приведенное в конце главы второе доказа- доказательство, наоборот, содержит простой и удобный метод построения такого числа. Метод Кантора. Первое доказательство принадлежит знамени- знаменитому математику Кантору, жившему во второй половине XIX века, с именем которого связано построение теории множеств. Мы имеем дело с двумя бесконечными множествами А, В {А — множество действительных, В — множество алгебраических чисел)
7.5, АЛГЕБРАИЧЕСКИЕ И ТРАНСЦЕНДЕНТНЫЕ ЧИСЛА 313 и хотим доказать, что А Ф В. Конечно, в силу В s А простейшее доказательство состояло бы просто в указании элемента из Л — В, Если же такое указание почему-либо затруднительно, как в нашем случае, то стоит попытаться показать, что А и В содержат в каком-то смысле разное количество элементов. Словам «разное количество» на основании определения B.4.4) мы можем придать строгий смысл. Напомним, что мы называли множества А, В (теоретико-множе- (теоретико-множественно) эквивалентными, если системы (А) и (В) были изоморфными. Введем для отношения эквивалентности специальный символ: 7.62. Определение. Будем писать A w В, если множе- множества А и В (теоретике-множественно) эквивалентны, т. е. если существует такая взаимно однозначная функция F, что ?В (F) = А и М (F) = В. Если А ж В не имеет места, то пишем А Ф В. Очевидно, отношение « удовлетворяет условиям рефлексивно- рефлексивности, симметричности, транзитивности, т.е. (i) A'« А; (и) если А « В, то В х- А; (ш) если А « В и В я; С, то А « С. Мы будем говорить, что А и В имеют одинаковое или неодинаковое число элементов в зависимости от того, имеет ли место А « В или А ф В. В B.4.5) мы уже использовали подобное истолкование интуитив- интуитивного понятия числа элементов для того, чтобы дать строгое опре- определение понятий конечных и бесконечных множеств: А конечно,, если условия А ж В и В s А всегда влекут В = А; А бесконечно, если оно не конечно, т. е. если существует множество В такое, что А ж В, В ^ А и В ф А. На первый взгляд, может показаться, что любые два бесконечных множества неразличимы в смысле количе- количества их элементов. Следующая важная теорема, принадлежащая Кантору, показывает, что это не так, ценность ее — в формулиров- формулировке, доказательство же несложно. 7.63. Теорема. Предположим, что А — любое множество и S — множество всех подмножеств А, т. е. S = {X: X s A}. Тогда (i) существует А ? S такое, что А « А, но (и) А Ф S; именно, не существует функции F такой, что 3S (F) = А и M(F) = S- Доказательство, (i) Мы полагаем X ? А, если X содер- содержит в точности один элемент, т. е. X = {х} для некоторого х 6 А. Тогда искомым взаимно однозначным отображением F множества А на А будет F (х) = {»}. (ii) Предположим противное, т. е. что существует функция F с 35 (F) = А, М (F) = S. Пусть В = {х: х е А н х $ F (х)}. Тем самым В 6 S и потому F (Ь) = В для некоторого b 6 А. Тогда или b ? В, или b (? В. В первом случае b $ F (b) согласно определению В, но тогда b $ В, что невозможно. Во втором случае b ^ F (b), откуда b является одним из элементов В, т. е. b 6 В, чего тоже не- неможет быть. Следовательно, предположение, что существует функ- функция F с указанными свойствами, ведет к противоречию.
314 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА В упражнении 5 к п. 4.4 мы видели, что если Л конечно, то и S конечно, а именно, если Л да {1, 2, . . ., п}, где п ? Р, то SI да да {1, 2, . . ., 2"}. Из утверждения (i) предыдущей теоремы интуи- интуитивно ясно, что если Л бесконечно, то и S бесконечно. Действи- Действительно, если мы можем найти В S Л, для которого В <^ А и В Ф А, то по (i) мы можем найти В ? А, для которого В да А и В ф А, и тогда, полагая Si = (S — A) U В, получаем Si s S, Si да S, но Si ф S- В соответствии с (i) мы должны говорить, что S имеет по крайней мере столько же элементов, сколько Л, но в соответ- соответствии с (ii) мы должны говорить, что S имеет больше элементов, чем Л. (Конечно, очевидно, что S содержит собственное подмно- подмножество А, определенное в доказательстве (i); не столь тривиально то, что не существует множества А, которое удовлетворяло бы (i) и было бы равно S-) Следовательно, если А бесконечно, то в некотором смысле S имеет больший порядок или мощность, или степень бесконечности, чем Л. Поскольку для любого множе- множества ^S мы можем образовать множество <?Р (S) — множество всех подмножеств S, то, исходя из любого бесконечного множе- множества Л, мы можем образовывать последовательно большие степени бесконечности, соответствующие Л, аР (Л), сГ1 (сГ1 (Л)), ... В нашей работе мы будем интересоваться только множеством & (Л). Счетные и несчетные множества. Простейшим бесконечным множеством, к которому мы можем применить теорему Кантора, является Л = Р. Рассмотрим любое подмножество X s P и пред- представим себе следующую процедуру. Мы по очереди рассматриваем каждое целое положительное число 1, 2, 3, ... и проверяем, при- принадлежит оно X или нет. Если нет, то мы пишем 0, если да, то пишем 1. Тем самым получаем бесконечную последовательность (mh), k = 1, 2, 3, . . ., из нулей и единиц, которой мы можем поставить в соответствие действительное число 0, т^гпг, ¦ ¦ ., записанное в системе с основанием 2 G.36). Другими словами, мы имеем дело с функцией F на множестве S всех подмножеств Р, для которой оо F (X) = 2 mi/2\ где т0 = 0 и для каждого k 6 Р г=0 1, если k?X, О, если k$X. Сразу возникает предположение, что ввиду этого Re имеет по мень- меньшей мере столько же элементов, сколько и S, а потому Re ^ Р. Как мы увидим, это так и есть, но имеется некоторое затруднение, которое нужно обойти. Определенная выше функция F не взаимно однозначна из-за того, что в определенных случаях нарушается единственность представления. Так, например, для множеств Xi= = {1} и Х2 = {2, 3, 4, . . .} имеем F (Xj) = F (Х2). Поняв, в чем дело, мы лишь немного изменим F для того, чтобы гарантировать
7.5. АЛГЕБРАИЧЕСКИЕ И ТРАНСЦЕНДЕНТНЫЕ ЧИСЛА 315 единственность представления. Положим, например, F (X) = оо = 2 т;/3\ где mh определено ранее. Чтобы показать, что если 1=0 F (Xi) = F (Х2), то Xi = Х2, мы в случае а Ф b/3h используем теорему единственности 7.39 и упражнение 2 к п. 7.3. Числа же вида b/3k имеют два представления: одно, у которого все члены начиная с некоторого равны 0, и другое, у которого все члены начи- начиная с некоторого равны 2; однако последний случай при данном выборе mt получиться не может. Таким образом, мы показали, что существует множество S sRe такое, что S ~ S. Отсюда легко заключить, что Р qbRe и что, как и в 7.63 (и), не существует функции F такой, что SB (F) = Р и М (F) = Re. Поскольку это отношение будет нам часто встре- встречаться, введем следующую терминологию. 7.64. Определение. Мы говорим, что множество А счетно, если или А пусто, или существует функция F такая, что 3 (F) = Р и М (F) = А; в противном случае мы говорим, что А несчетно. В соответствии с определением счетное множество может быть конечным, поскольку взаимная однозначность F не оговаривалась. Некоторые авторы ограничивают использование слова «счетный» только бесконечными множествами. Другие, использующие при- приведенное выше определение, выделяют бесконечные счетные множества словами «счетно-бесконечный». В любом случае слова «несчетный» применяются только к бесконечным множествам. Теперь мы можем сформулировать следствие из теоремы 7.63 (и) следующим образом: множество всех подмножеств Р несчетно. 7.65. Теорема. Предположим, что А, В — любые множе- множества. (i) Если А счетно и А та В, то В счетно. (и) Если А счетно и В s А, то В счетно. (ш) А счетно тогда и только тогда, когда А конечно или Р « А. Доказательство, (i) По данной функции F с 3 (F) = Р, ,JA (F) = А и взаимно однозначной функции G с 3 (G) = А, М (G) = В образуем сложную функцию F\: Fi (n) = G (F(n)) для всех п. Тогда 35 (Fi) = Р, М (Л) = В. (и) Пусть дана функция F с 3 (F) = Р, М (F) = А и В <= А; В Ф 0. Зафиксируем любой элемент Х\ 6 В и положим Г F{n), если F(n)?B, F, (п)= \ [ Xi в противном случае. Тогда 2> (Fi) = Р, М (Fi) = В. (Hi) Предположим, что А не конечно и что А счетно, т. е. суще- существует F с 3) (F) = Р и 3i (F) — А. Тогда для любого п?Р суще- существует х 6 А такое, что х$ {F A), . . ., F (п)}, поскольку все эти
316 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА множества конечны. Теперь мы построим взаимно однозначную функцию G с 3) (G) = Р, М (G) = Л простым исключением (возмож- (возможных) повторений в F. Функцию G рекурсивно определим следующим образом. Полагаем G A) = F A). Пусть уже заданы G A), . . . . . ., G (л) такие, что {G A), . . ., G (л)} = {F A), . . ., F (/л)} для некоторого т~^ п. Рассмотрим наименьшее k > m такое, что F (k) § {F A), . . ., F (т)}, и положим G (п + 1) = F (k). Тогда по индукции мы можем доказать, что существует m ^ л с {G A), . . . . . ., G (л)} = {F A), . . ., F (/я)} такое, что все значения G A), . . . . . ., G (л) различны. Поэтому G устанавливает отношение Р«/1. Обратно, если Р « Л, то из определения отношения « ясно, что Л счетно. Если Л конечно и непусто, то Л « {1 п} для некоторого л 6 Р. Но тогда вследствие (i) и (П) Л счетно. 7.66. Теорема. Re несчетно. Доказательство. Пусть S — множество всех подмно- подмножеств Р. Мы привели рассуждения (предшествовавшие 7.64), показывающие, что существует множество S?Re такое, что S ~ S. Но по теореме Кантора S несчетно, откуда и S несчетно в силу 7.65 (i). Но тогда, вследствие 7.65 (ii), Re не может быть счетным. Зачастую приводится более «конкретное» доказательство этой теоремы, выглядящее примерно следующим образом. Предположим, что Re счетно. Тогда таким же будет и его подмножество S, состоя- состоящее из всех чисел а, О ^ а < 1, таких, что в их разложении а = О, m.im.2 ... по основанию 3 каждое mt равно 0 или 1. Но тогда мы можем пронумеровать элементы множества S: где G.5.1) аA)--0, т?т?т™ ..., 'з Чтобы получить противоречие, мы образуем число a?S, которого нет в этом списке. Для любого числа т = 0 или /п= 1 положим I1' 10, если т = 0, ~~ п если т=\. G.5.2) а = 0, m™m?mf ... Представление числа а отличается от представления каждого члена списка G.5.1) хотя бы в одном месте, а именно, отличается от а(П) л-й цифрой. В силу единственности этих представлений а в спис- списке нет.
7.5. АЛГЕБРАИЧЕСКИЕ И ТРАНСЦЕНДЕНТНЫЕ ЧИСЛА 317 В этом доказательстве нет идей, которые не содержались бы в доказательстве 7.66 посредством теоремы Кантора 7.63 (ii). Одна- Однако из-за специфичности рассуждений основная техника приведен- приведенного доказательства (и доказательства теоремы 7.63 (ii)) часто назы- называется диагональным методом Кантора. Переходим к доказательству существования трансцендентных чисел. Мы попытаемся показать, что множество алгебраических действительных чисел счетно. Это мы сделаем с помощью ряда шагов, последовательно показав, что I, Ra, Ra [E] и, наконец, мно- множество всех корней полиномов из Ra [H] счетны. Докажем для этого следующие три общие теоремы. 7.67. Теорема. (i)PxP«P. (ii) Если А, В счетны, то и А у. В счетно. Доказательство, (i) Определим функцию F с Л) (F) = = PxPhJ(F)sP так: F (п, т) = 2n-3m для любых т, п 6 Р. Ввиду единственности разложения целых чисел на простые множи- множители, F взаимно однозначна. Следовательно, Р х Р « М (F). Поскольку М (F) s Р и М (F) бесконечно, то М (F) « Р вслед- вследствие 7.65 (ii), (Hi). Отсюда Р X Р«Рв силу транзитивности ж. Доказательство (ii) предоставляем читателю. В упражнении 2 (б) к этому разделу мы приведем другой метод доказательства. 7.68. Теорема. Предположим, что М — любой счетный класс множеств и что каждое X ? М счетно. Тогда \JX [X 6 М! счетно. Доказательство. Для доказательства мы без потери общности можем предположить, что М ф 0 и что каждое X 6 М непусто, поскольку пустое множество к рассматриваемому объеди- объединению ничего не добавляет. По предположению, существует функ- функция F с SB (F) = Р и М (F) = М- Если обозначить Xh = F (ft), то М = {Xi, Х2, ¦ ¦ ¦, Хи, • ¦ •}• По предположению, для каждого k существует функция Ct с J (Gh) = Р и М (Gk) = Xh- Если х ? \JX [X 6 Ml = \JXh [k 6 Р], то х 6 Xk для некоторого ft 6 Р и, следовательно, х 6 Gk (l) для некоторого / ? Р. Ввиду 7.67 (i), имеем Р ж Р X Р и существует функция Я с 3 (Я) = Р, М (Я) = Р X X Р. Отсюда для данного п ? Р существуют единственные k, I 6 Р такие, что Я (п) = (k, l). Следовательно, существуют две функции Ни Н2с3) (Hi) = 3 (Я2) =РиЯ(я) = (Hi (n), Я2 (л)) для каж- каждого п; они обладают тем свойством, что для любых k, I 6 Р мы можем найти я ?Р такое, что Hi (п) = k, Я2 (п) = I. Поэтому мы можем определить функцию G* с 3) (G*) = Р и М (G*) = = \JXh \k 6 Р], полагая G* (п) = Ghi(ti) (Я2 (п)) для каждого п. Заметим, что в этом доказательстве используется аксиома выбора, поскольку для каждого k мы должны выбрать одну из множества возможных функций G с 3 (G) — Р, М (G) = Xh- Однако в большинстве приложений теоремы можно явным образом задать заранее все функции Gh-
318 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Более «наглядное» доказательство теоремы 7.68 иногда дается в следующем виде. Занумеруем элементы множества Xk в виде {x[h\ xlh\ . . ., х\ \ . . .} (возможно, с повторениями). На при- приведенной ниже диаграмме последовательные стрелки показывают, как, начиная с х™, можно тогда занумеровать и \JXh Ik 6 PJ- G.5.3) х<» х<» тю v ' Л1 > -яг > хз > ¦ (г/ B1 а) 1 , -Е? X C1 2 В сущности мы используем здесь нумерацию Р X Р, задаваемую в упражнении 2 (б) к данному разделу, именно A, 1), A, 2), B, 1), A, 3), B, 2), C, 1), A, 4), B, 3), ... 7.69. Теорема. Предположим, что А счетно. Пусть S — множество, состоящее из всех конечных последовательностей (xi, . . ., хп) элементов А для любого п 6 Р- Тогда S счетно. Доказательство. Пусть Sn для каждого я 6 Р — мно- множество всех последовательностей (х±, ¦ . ., хп) длины п, xt ? А. Индукцией по п мы докажем, что каждое Sn счетно. Очевидно, А « Si. Далее, Sn+i « Sn x А, где соответствующее взаимно однозначное отображение задается функцией, которая каждой последовательно- последовательности (хи . . ., хп, хп+\) ставит в соответствие упорядоченную пару ({хи . . ., хп), xn+i). Отсюда, вследствие 7.67 (ii), если Sn счетно, то и Snii счетно. Теперь теорема следует из 7.68, поскольку S = us'tPi Существование трансцендентных действительных чисел 7.70. Теорема. Множество А всех алгебраических действи- действительных чисел счетно. Следовательно, существуют трансцендент- трансцендентные действительные числа. Доказательство. Из теоремы, конечно, следует, что каждое подмножество А также счетно. Однако, как мы уже заме- заметили, мы будем «добираться» до А последовательно через несколько его подмножеств. Сперва мы покажем, что A) I счетно. Действительно, I есть сумма трех счетных множеств: I = Р [} U {0} U {-п: п 6 Р}. B) Ra счетно.
7.5. АЛГЕБРАИЧЕСКИЕ И ТРАНСЦЕНДЕНТНЫЕ ЧИСЛА 319' Чтобы увидеть это, положим Ran = {mln: m ? 1} для каждого п 6 Р- Тогда I ?» Ran и отсюда ввиду A) каждое Ran счетно. Но каж- каждое рациональное число принадлежит по крайней мере одному Ran, Ra = U Ran In ? Р] и, в силу 7.68, Ra счетно. C) Ra [?] счетно. Действительно, пусть S — множество всех конечных последователь- последовательностей (а0, . • ., ап), где каждое а, 6 Ra и п — произвольное целое число, я ^ 0. Тогда, ввиду 7.69, S счетно и существует функция F с .25 (F) = Р, Si {F) = S. Мы можем определить функцию G с 35 (G) = S и J2 (G) = Ra [g] как G({a0, ..., а„»= S «гй1 Зля любой (а0, . .., an)?S. i=0 Тогда для композиции Я функций F и G имеем iZ5 (Я) = Р, J? (Я) =¦ - Ra[g]. D) А счетно. Каждому f (?) ? Ra [|] мы ставим в соответствие множество Х^ц —- = {х: х ^ Re и / (х) = 0} всех действительных корней / (?) (воз- (возможно, пустое). Пусть М — класс всех таких множеств: X 6 М тогда и только тогда, когда X = Х/,?, для некоторого / (?) g 6 Ra [g]. По определению, действительное число является алгебраи- алгебраическим тогда и только тогда, когда оно принадлежит некоторому члену М, А = U X IX 6 Ml. Но, вследствие C), М счетно, каждый же член Х^ф 6 М конечен. Следовательно, в силу 7.68, утвержде- утверждение D) доказано. Следуя идеям доказательства, можно попробовать фактически найти хотя бы одно трансцендентное число. Действительно, мы уже знаем, как можно занумеровать все рациональные числа. Теоре- Теорема 7.69 показывает, как после этого можно занумеровать все поли- полиномы / (|) 6 Ra [?] с рациональными коэффициентами. Алгоритм Штурма показывает, далее, как для любого полинома, / (?) зануме- занумеровать его корни (их конечное число) и тем самым занумеровать все корни всех таких полиномов, т. е. занумеровать все множество S алгебраических чисел: S = {аA), аB\ . . .}. Диагональный метод Кантора позволит теперь построить и трансцендентное число. Однако детально проводить это громоздкое рассуждение нет ника- никакой необходимости — сейчас мы изложим гораздо более простой метод нахождения трансцендентных чисел, принадлежащий Лиу- виллю. Достоинство метода Кантора состоит в его широкой применимо- применимости — ведь в нем совсем не используются алгебраические свойства действительных чисел. Метод же Лиувилля, использующий суще- существенно алгебраические свойства Re, более специфичен, сфера era
320 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА применения ограничена. Зато с его помощью можно значительно больше узнать об алгебраических и трансцендентных числах. Метод Лиувилля. Метод основан на следующем факте. Пусть X — произвольное иррациональное действительное число и т0 ? Р. Интуитивно ясно, что среди всех рациональных чисел kJm, у кото- которых т ^ /п0, k 6 I, m ? P, найдется наиболее близкое к х, скажем kilnii (почему это так?). Пусть х — ^— любых k, /таких, что k 6 I, / 6 Р, из — е > 0. Тогда для С е следует / > т0. Иначе говоря, для любого х ? Re — Ra и любого т 6 Р существует такое е > 0, что х у > е для любых k, I ? I, 1 ^ / ^ т. Нас интересует теперь, что можно сказать о зависимости е от чисел х и т. Оказывается, для алгебраического х мы можем найти такую зависимость, которая не имеет места для неалгебраического, т. е. трансцендентного х. Простейший вид такой зависимости, которую мы могли бы наде- надеяться найти, состоит в том, что для любого х существует такое М>0, X-j -j для любого k 6 I и I ? Р. Тогда, действительно, ¦полагая е = М/т, мы имели бы х г ^ -р s> — = е для всех А:, / 6 I и 1 ^ / ^ т. К сожалению, такое М найти, вообще говоря, нельзя. Другая достаточно простая идея — попытка по заданному х найти такое М > 0 и такое я б Р, что дс г ^ ^ М//п для любых / g Р, А; ? I; тогда можно положить е = М1тп. Мы сейчас покажем, что такие М, п можно найти по любому ирра- иррациональному алгебраическому числу х. Мы найдем М, п с помощью того полинома / (|) 6 Ra [|], для которого х является корнем. Пусть, например, полином f (I), для которого х — корень, имеет степень 2. Можно, конечно, считать, что коэффициенты полинома / (|) = <з|2 + Ь\ + с целые: а, Ь, с ? I, f (х) = 0. Тогда по теоре- теореме 7.57 Ь2 — 4ас >0и существует такое у, что f (Q = а (I — х) X X (? — у). Поскольку корни х, у полинома имеют вид (—b ¦+ ± Yb^ — 4ас)/2а и поскольку дс иррационально, то ционально. Рассмотрим любые k 6 I и / 6 Р- Тогда и, поскольку ak2 l + bkl + cl2\>-E: l, а корни 0. Следовательно, и у ирра- иррациональны, то 17.5.4)
7.5. АЛГЕБРАИЧЕСКИЕ И ТРАНСЦЕНДЕНТНЫЕ ЧИСЛА 321 Отсюда уже нетрудно вывести, что для данных х и квадратич- квадратичного полинома /(?), корнем которого является х, мы можем найти М> 0 такое, что k I М -j— х >тг для любых I. Действительно, пусть d = max.(\x\, \у\), откуда d>0. Тогда, если |&//|>2d, то \k/l — x\>d^-j? (ведь 1</). С другой стороны, если | А/i | <2d, то •л ввиду G.5.4) ; i yp^j i l \y\<3d —у 5>" 1 fe \T~X Г--М\а\ ' Объединяя оба случая, достаточно выбрать M = min(d, e/3d| й(). Обобщением приведенного рассуждения является теорема Лиувилля: 7.71. Теорема. Предположим, что /(i)?Ra[?], deg(/(§)) = — n> 1 « /(х) = 0, где x$Ra. Тогда мы можем найти такое действительное число М > 0, зависящее от f (Ъ) и х, что всегда, когда ^?1 « /?Р, х — in • Доказательство. Если / (?) имеет рациональный корень у, то / (I) = (| — у) g (I), причем deg (g (I)) = п — 1 и g- (x) = 0. Последовательно выделяя все рациональные корни, мы в конце концов получим полином ft (?) степени k <,п, не имеющий рацио- рациональных корней и такой, что /4 (х) = 0. Если утверждение будет доказано для таких полиномов, то из M/lh ^ М/1п будет следовать желаемый результат. Следовательно, мы можем предположить, что A) f(l) не имеет рациональных корней. п Пусть /('?)= 2 пГ, где ri = c;/df, умножая f(|) на do-d±-... -dn, i=0 получим полином с целыми коэффициентами, имеющий л; в
322 Гл- 7- ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА качестве корня и удовлетворяющий A). Итак, п B) /(?)= 2 а&, где все at?l и аяф0. 1=0 Мы утверждаем, что C) существует действительное число N, зависящее только от х и f (?), такое, что \ f (х) — f (у) \ ^ N | х — у \ всегда, когда \ х — у \ < 1. Проверить это можно различными способами. Например, используя упражнение 9 (б) к предыдущему разделу, для любых х, у можно найти такое и, что х < м <г/ и f(u). х—у ' v ' Но в силу 7.49 можно выбрать /V>0 такое, что \f'(u)\*?N всегда, когда \х — ы|<1. Тогда N удовлетворяет C). Дру- Другое доказательство предлагается в упражнениях к этому раз- разделу. Так как f(x)==O, то для N, удовлетворяющего C), мы имеем для всех и и 4 И4)| I, / ?Р таких, что х-Т х—- г=0 <1. Но, вследствие B), ввиду A). Отсюда Х~Т дП7Г всегда, когда k?l, х—т Поэтому, если взять Al = min М, -^ J, то получится искомый результат, поскольку из х — • __^ Т >1 следует
7.5. АЛГЕБРАИЧЕСКИЕ И ТРАНСЦЕНДЕНТНЫЕ ЧИСЛА 323 Чтобы использовать эту теорему для доказательства существо- существования трансцендентных чисел, нужно лишь найти числа х, про- противоречащие заключению 7.71 для каждого п, т. е. для каждых п и М > 0 должны быть k ? I, / 6 Р такие, что х у <СМ/1п. Тем самым мы подходим к следующей теореме, доказательство которой предоставляется читателю. 7.72. Теорема, (i) Предположим, что х — действительное иррациональное число такое, что для каждого п ? Р существуют k 6 I, I € Р такие, что | х — {kit) ] < \1пГ. Тогда х трансцендентно. оо (и) Предположим, что b?P, b>\ и х = 2 b~(i!). Тогда 1=0 х трансцендентно. Заметим, что вне зависимости от b представлением числа, ука- указанного в (и), по основанию b будет 0,11000100000000000000000100... Числа х, удовлетворяющие предположению (i), называются числами Лиувилля. Используя (и), можно привести много таких примеров. Однако далеко не каждое трансцендентное число является числом Лиувилля. Совсем другой (и, как правило, гораздо более трудный) вопрос — как показать, что определенное специфическое, «интересующее» нас число трансцендентно. Например, известно, что числа е, л и {У2)^2 трансцендентны*). С другой стороны, неизвестно, относит- относится ли это ке + я, ел. Даже доказательства того, что эти числа иррациональны, не всегда просты. Один пример такого доказа- доказательства предлагается в упражнениях. Может возникнуть вопрос, почему с алгебраической точки зре- зрения считается достаточным иметь дело с алгебраическими действи- действительными числами, а не с полной системой действительных чисел. Действительно, поскольку есть полиномы с рациональными коэф- коэффициентами, которые имеют действительные (а следовательно, и алгебраические) корни, но не имеют рациональных корней, то почему бы не быть полиномам с алгебраическими коэффициента- коэффициентами, которые имели бы действительные корни, но не имели алгебраи- алгебраических? Если бы это было так, то нам пришлось бы рассматривать действительные числа, являющиеся корнями таких полиномов. На первый взгляд кажется, что, последовательно расширяя множе- множество действительных чисел, представляющих в указанном смысле алгебраический интерес, мы в конце концов можем получить все действительные числа. *) Трансцендентность чисел вида а? при алгебраическом а, а Ф 0, 1, и р алгебраическом иррациональном была впервые доказана в 1934 г. А. О. Гель- фондом.— Прим. ред.
324 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА Точнее, предположим, что К — произвольное множество дей- действительных чисел, содержащее Ra. Пусть Al (К) будет множеством всех х 6 Re таких, что deg (f (?)) > 0 для некоторого f (I) в К Ш и / (х) = 0. Тогда индуктивно определим множества Ran следующим образом: Ra4 = Ra, Ram+1 = Al (Raj. По определению, Ra2 — множество всех алгебраических действи- действительных чисел. Пусть Ra* = URam [tn 6 PL Тогда Al (Ra*) = = Ra*. Действительно, если / (?) ? Ra* [g] и deg (/ (?•)) > 0, то / (?) 6 Ram Ш для некоторого т. Поэтому любой корень / (|) находится в Ram+i и, следовательно, в Ra*. Таким образом, Ra* обладает свойством алгебраической замкнутости. Теперь вопрос сводится к истинности утверждения Ra* = Re. Используя метод Кантора, на этот вопрос можно дать отрицательный ответ. Дей- Действительно, чтобы показать, что если К. счетно, то и Al (К.) счетно, можно применить рассуждения типа использовавшихся в доказательстве 7.70. Отсюда по индукции видно, что каждое Ram счет^Ю; следовательно, по 7.68 счетно и Ra*. Поэтому Ra* Ф Re. Остается открытым вопрос о том, что, может быть, шлея дело лишь с Ra2 (алгебраические числа) и Re — Ra2 (трансцендентные числа), мы слишком сузили область исследования. Это опровер- опровергается неожиданным результатом, что Al (Ra2) = Ra2, т. е. Ra* = = Ra2. Мы докажем это в конце следующей главы, когда будет подготовлена соответствующая почва для более глубокого проник- проникновения в вопросы поведения алгебраических чисел. Дополнительно мы покажем, что алгебраические числа образуют поле, т. е. что они замкнуты относительно всех изучавшихся здесь алгебраических операций. (Конечно, в свете результата Ra3 = Ra2, откуда Ram = = Ra2 для т ^ 2, приведенное рассуждение о замкнутости Ra* с помощью метода Кантора представляет лишь теоретический инте- интерес. Главной целью было показать, какие заключения можно сде- сделать о множестве Ra* на основе уже имеющейся информации.) Все рассуждения до сих пор относились к действительным кор- корням полиномов. Чтобы закончить картину, нам необходимо изучить системы, в которых мы можем найти корни полиномов, не имеющих действительных корней. Простейшим таким полиномом, как мы знаем, является ?2 + 1. Он и послужит отправной точкой для вве- введения в следующей главе комплексных чисел. Упражнения 1. Пусть А — множество всех действительных чисел дг, имеющих вид оо 2 /П(/3*, где каждое /nj = 0 или ггц = 2. t=0 (а) Счетно ли А? Докажите ваше утверждение. Это множество А (называемое канторовым совершенным множеством или канторовым дисконтинуумом) может быть изображено в виде пересечения
7.5. АЛГЕБРАИЧЕСКИЕ И ТРАНСЦЕНДЕНТНЫЕ ЧИСЛА 325 множеств Аи . . ., Ап, . . .. определенных следующим образом: А\ состоит из замкнутого интервала [0, 1], из которого удален открытый интервал () о j | л /12 л» состоит из Аи у которого удалены открытые интервалы 1-^-. — L _М и G 8\ /2,1 2 , 2 19 1 1*7 0 U 9 9 3 3 9 9 ' А3 снова получается из А2 удалением средних открытых третей его интер- интервалов. Показать, что А = (\Ап (п ? Р). (б) Если мы назовем длиной Ап сумму всех длин интервалов Ап, то дли- длина А) равна -^-, длина А2 равна -g-, длина А3 равна — и т. д. Какова длина /^ множества Л„? Чему равен lim /„? (Этот предел естественно назвать «длиной» п—юо или «мерой» Л.) 2. (а) Доказать теорему 7.67 (и), (б) Пусть Показать, что F — взаимно однозначная функция и 3(F) = PXP, Ы (F) = Р. [Указание. Рассмотреть функцию G (/) = B — 2) (/ — 1)/2; показать, что для каждого й ? Р существует единственное целое / > 2 такое, что G (/) < < /г < G (/ + 1). Тогда k = F (п, т) с п = k — G (/), m = / — п.] 3. Пусть S = {X: ХдРиХ конечно или Р — X конечно}. Счетно ли S? Доказать утверждение. 4. Доказать, что если х ? Re и т ? Р, то существуют k, I ?1 такие, что 1 </<т и а; ^- < 1// (т + 1), следующим образом. Для любого действительного числа у пусть [у] — единственное целое число q такое, что q < у < q + 1 G.35). Рассмотрим /л + 1 чисел jx — [jx] для / = 0, 1,2, ... . . ., т. Показать, что если эти числа расположить в возрастающую последо- последовательность у0 ^ ух <;...<; ут, то по крайней мере одна разность из Vi — Уо, Уг — Уи ¦ ¦ -, Ут ~ Ут-и A - Ут) + У* бУД?Т меньше \1(т + 1). Рассмотрев разности, получить желаемое заключение. Что дает этот резуль- результат в смысле возможного улучшения теоремы Лиувилля 7.71?
326 ГЛ. 7. ДЕЙСТВИТЕЛЬНЫЕ ЧИСЛА 5. Показать, что если х ? Re—Ra, то существует бесконечно много k, I k с API, I РР и / 6. (а) Показать, что если х ? Re и » — неотрицательное целое число, то существует N > 0 такое, что | лс* — у* I -^ # I * — У I. как только |jk — у | < 1. (б) Используя (а), дать прямое доказательство C) в теореме 7.71. 7. (а) Доказать теорему 7.72 (i), (ii). (б) Привести другой пример числа Лиувилля. оо 8. (а) Предположим, что существует а = ^ (—1)* а/> гДе каждое г=0 flj > 0. Показать, что п 0< |й— 2 (-| г=0 (б) Показать, используя г=0 из 7.45, что е*1 и, следовательно, е иррациональны. Указание. Рас- оо е'1— V ——гр—1 . Обобщая это рассуждение, можно показать, г=0 что e~h и, следовательно, eh иррациональны для каждого k 6 Р.
ГЛАВА 8 КОМПЛЕКСНЫЕ ЧИСЛА 8.1. Основные свойства Характеристика комплексных чисел. Для начала посмотрим, что можно сказать о поле (/С, +, •, 0, 1), подполем которого является поле действительных чисел и которое содержит некоторый корень и полинома f (?) = ?2 + 1, т. е. элемент и такой, что и2 — —1. Очевидно, не существует отношения <, которое превращало бы /С в упорядоченное поле, поскольку в любом упорядоченном поле —1 <0 и х2 ^ О для всех х. 8.1. Теорема. Предположим, что (/(, +, •. 0. 1) — поле, которое содержит Re б качестве подполя и содержит элемент и такой, что и2 = —1. Тогда для любых х, у, xit г/i 6 Re (i) x + иу = Xi + Щ\ тогда и только тогда, когда х — Xi и у = уп (ii) (х + иу) + (xi + uyi) = (x + х^ + и (у + г/0; (Hi) — (х + иу) = (—х) + и (—у); (iv) (х + иу) -{xi + иуд = (xxi — уух) + и (xyi + xiy); (v) (x + uy) -(x — uy) = x2 + y2; (vi) если x + uy ф 0, mo x2 + г/2 > 0 и * | ц / У \ . ) ' (vii) множество D всех элементов х + uy в К, где х, у 6 Re, образует подполе поля /(. Доказательство. Доказательство теоремы очень просто. В (i), если х + иу = Xi -\- иуи то (х — Xi) = и (t/i — у); отсюда (х — х^2 — —(г/i — уJ. Поскольку (х — XiJ ^ 0 и — (yt — уJ ^ 0, должно быть (х — XiJ — (у — У\J = 0, а тогда х — jq = у — г/i = = 0. Части (ii) — (v) тогда очевидны; в (iv) и (v) вновь используется м2 = —1. В (vi), если х + иу Ф 0, то х + иу ф 0 + и -0, откуда ввиду (i) или х Ф 0, или у Ф 0. В обоих случаях х2 -\- у2 > 0 и тогда (vi) следует непосредственно из (v). (ii) — (vi) показывают, что множество D, определенное в (vii), замкнуто относительно операций +, —, • и "х из /С и, очевидно, содержит каждый элемент из Re: х — х + и -0; в частности, оно содержит 0 и 1. Следовательно, D удовлетворяет всем условиям поля и является подполем К- В частности, если мы хотим доказать существование поля К, содержащего элемент и, удовлетворяющий предположениям 8.1,
328 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА то согласно (vii) получаем даже метод его построения: все элементы г 6 К имеют вид г — х + иу, где х, у 6 Re. Далее, 8.1 (i) показы- показывает, что в этом случае функция F (х, у) = х + иу будет взаимно однозначным отображением Re x Re на К- Тем самым мы подхо- подходим к доказательству следующей теоремы. 8.2. Теорема. Существует поле (К,, +, •, 0, 1) и элемент и ? К,, удовлетворяющие следующим условиям'. (i) Re s К и Re — подполе поля (К, +, ¦, О, 1); (и) «• = —1; (ш) для каждого х 6 К существуют х, у ? Re такие, что г = — х -f мг/. Доказательство. Сперва построим поле (К, +, •, О, Г), которое было бы изоморфно искомому полю. Полагаем A) К = Re X Re и B) 0 = @, 0), 1 = A, 0) и и = @,1). Каждый элемент из К единственным образом представим в виде (х, у) для некоторых х, у ? Re, причем (х, у) = 0 тогда и только тогда, когда х = у — 0. Далее, определяем C) (а) (*, у) + (хи у у) = (х + хи У + Уд; (б) —(х,у) = (—х, —у); (в) (х, у)т(хи У\) = (xxi — yyu xyi + xty); (г) (х, у)-* = (^j^, -^^г) при (х, у) ф 0. Легко видеть, что D) и2 = -1, поскольку @, 1).@, 1) = (—1, 0) = —A, 0). Теперь, используя C) (а) — (в), можно непосредственно про- проверить, что E) (К, +, •- 0, 1) - поле. Из утверждений, подлежащих проверке согласно определе- определениям 4.1, 4.13 и 6.1, мы просмотрим лишь несколько. Например, из определения 4.1 коммутативного кольца с единицей проверим дистрибутивность: хи У\) + (х2, = (х, y)m(xi + х2, г/1 + у2) = = (х (xi + х2) — у (yi -|- уг), х (г/i + у2) + (хг + х2) у) = — г/г/О + (хх2 — УУ2), {xyi + х$) + (ху2+х2у)) = — yyu хух + xiy) + (хх2 — уу2, ху2 + х2у) = = 1(х, у)»(хи г/i)] + 1(х, у)»(х2, у2))-
8.1. ОСНОВНЫЕ СВОЙСТВА 329 Проверим далее, что К — область целостности. Воспользуемся критерием 4.14. Пусть, действительно, (х, у) (xit z/i) = О, т. е. {xxi — ууи xtji + Xiy) — @, 0). Тогда хх± — yyi = xyi + х$= = 0. Из первого уравнения хх^уу^ = у2у\ ^ 0, а из второго xx.yyi — = —х\у2 ^ 0. Поэтому xx$yi — 0, откуда или ху = 0, или xtyi = = 0. Предположим первое, т. е. что х = 0 или у = 0. Пусть, ска- скажем, х = 0; если также у = 0, то (х, у) = 0 и все доказано. В про- противном случае из xxi = yyi и —xr/i = XiZ/ видно, что yyt — 0 = a.j2/; отсюда Xi = г/i = 0 и (дсь г/4) = 0. В остальных случаях рассужде- рассуждения аналогичны. Для проверки того, что К — поле, достаточно показать, что если (х, у) Ф 0, то (х, г/)*(х, у}'1 = 1. Поскольку или х Ф 0, или у Ф 0, очевидно, х2 + у2 > 0 и (х, у)'1 вполне определено в C) (г). Условие (х, г/)*(х, г/) = 1 элементарно проверяется теперь с по- помощью C) (в). Поэтому считаем E) установленным. Для любого х ? Re положим F) G (х) = (х, 0). Тогда непосредственно из C) (а, в) мы видим, что G) (а) 3) (G) = Re, M (G) S К и G взаимно однозначна; (б) G@) = 0 ы G(l) = 1; (в) для любых х, г/ ? Re имеем G (х -\- у) = G (х) + G (У) и G(x-y) = G(x)mG(y); (г) для любого г ? К существуют (единственные) х, у 6 € Re с г = G (х) + (u»G (г/)). Согласно общему результату B.4.9), доказательство теоремы закан- заканчивается расширением Re до множества /С, находящегося во взаим- взаимно однозначном соответствии с К, при помощи продолжения // функции G и определения операций +, • на Д" так, чтобы G была изоморфизмом. Тогда, если и 6 К, выбрано так, что G (и) = и, то, ввиду D), имеем м2 = —1 и г = х + иу, где Н(г) = Н (х) + (и*Я (у)) = G(x) + (u*G (у)) для каждого z ? К- 8.3. Теорема. Если (К, +, •, 0, 1) и (К, +, •, 0, 1) — два поля, удовлетворяющие условиям 8.2 (i) — (Hi) для некоторых и ? К,, и 6 К соответственно, то (/(, +. •, 0, 1) ^ (К, +, в, 0, 1). Одной из функций F сЗ (F) = /<", J^ (F) = К, задающих этот изоморфизм, будет функция, единственным образом определяемая условиями F (х) = х (Зля всех х ? Re и F (и) = и. Доказательство. Если Z7 — искомый изоморфизм, то F (х + иу) = F (х) + F (u)»F (у) = х + и*у для всех х, у ? Re. Определим F с помощью этого равенства. F (г) определено для всех
330 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА г ? К- Действительно, ввиду 8.2 (iii), для любого г 6 К имеем z = х + иу для некоторых х, у ? Re, которые по 8.1 (i) единствен- единственным образом определяются этим г. Применение 8.1 (i) к К показы- показывает также, что F взаимно однозначна и, вследствие предположе- предположения 8.2 (iii), для К получаем ffi (F) = К. Наконец, 8.1 (и), (iv) показывают, что элементы (х + и -у) ? Д" складываются и перемно- перемножаются совершенно так же, как и соответствующие им элементы (х + и*у) 6 К, т. е. F (Zl + z2) = F (Zl) + Z7 (z2), F (zt -z2) = = F (Zi)»F (z2) для любых Zi, г2 6 Д- Этим теорема и доказывается. Мы доказали, таким образом, существование и единственность с точностью до изоморфизма поля /(, удовлетворяющего усло- условиям 8.2 (i) — (iii) по отношению к некоторому элементу и. 8.4. Соглашение. В остающейся части книги мы понимаем под (С, +,' •, 0, 1) некоторое фиксированное поле и под \ — фикси- фиксированный элемент С, удовлетворяющие условиям 8.2 (i) — (iii), т. е. (i) Re ? С и Re образует подполе (С, +, •, 0, 1); (Ц) Iя = -1; (iii) для каждого г ? С существуют (единственные) х, у 6 Re такие, что z = х -\- \у. Мы называем С множеством комплексных чисел, ai — главным квадратным корнем из —1 в С, «ли мнимой единицей. Мнимые и комплексные числа используются сотни лет, начиная с их применения в решении полиномиальных уравнений. Эти приложения, однако, были «формальными» и имели место задолго до введения геометрической интерпретации этих чисел или опера- операций над ними. В таких формальных приложениях неявно предпола- предполагалось, что к комплексным числам применимы те же «законы алгеб- алгебры», что и к рациональным и действительным числам. Теорема существования 8.2 строго показывает, в каком смысле это возможно, а теорема единственности 8.3,— что в алгебраических целях нам достаточно трех условий 8.2 (i) — (iii) для успешного использова- использования комплексных чисел. То, что не существует отношения <, превращающего С в упорядоченное поле, показывает, какие ограни- ограничения налагаются на продолжение «законов алгебры». Комплексная сопряженность. Заметим, что в С квадратным кор- корнем из —1 является также —i, ведь (—iJ = i2 = —1 и i Ф —i (в противном случае i = 0, но О2 Ф —1). В С это — единственные квадратные корни из —1, так как они и только они являются корнями §'2+1. Этот факт допускает следующее истолкование. Каждый элемент г ? С может быть представлен в виде г = х\ + + (—0 Уи где хи г/i 6 Re, а именно, хг = х, уу = —у, если г = = х + \у. Отсюда ввиду 8.3 получаем 8.5. Следствие. Функция F, ?fi(F) = ffl (F) = C, F (х+\у) = = х — \у для всех х, у d Re, является изоморфным отображением комплексных чисел на себя.
8.1. ОСНОВНЫЕ СВОЙСТВА 331 8.6. Определение. Для каждого г ? С, z = х + \у, где х, у € Re, мы полагаем z = х — \у. Число г называется (комплексно) сопряженным г. 8.7. Следствие. Для любых z, Z\ 6 С (i) г + Zi = г + 2ь (ii) Zj^ = z-?; (iii) Г=г; (iv) z = z тогда и только тогда, когда z ? Re; (v) если z = x + \y, mo zz = x2 + г/2 u, если г Ф 0, то zz> 0. Части (i) и (ii) выводим из 8.5, полагая F (г) = г. Части (iii) — (iv) следуют непосредственно из определения 8.6. (Конечно, (i) и (ii) также можно проверить непосредственно.) Получаем следую- следующий общий результат относительно комплексных корней действи- действительных и комплексных полиномов. п 8.8. Теорема. Предположим, что /Ч1)=2аг!*1 f и zfC. Тогда г~~ (i) 2 г=0 (ii) если f(l)GRe[l], то f(z) = f(z); (ui) если f (\) 6 Re [|] и г — корень f (I), то и z — корень f (I). Доказательство. Часть (i) выводится по индукции из 8.7 (i), (ii) сначала для полиномов |г, а затем и для произвольных полиномов, (ii) следует из 8.7 (iv). Поэтому, если / (!) ? Re Ш и f (г) = 0, то и / (z) = 0, откуда / (г) = 0. Тем самым (ш) доказано. Квадратные корни из комплексных чисел- Мы называли квадрат- квадратным корнем из числа d такое г, что га = d. Легко видеть, что в поле комплексных чисел существует квадратный корень из любого дей- действительного числа. Действительно, если d = 0, то z = 0 — един- единственный корень аз da мы пишем ]/ = 0. Если d> 0, то корн ями как мы знаем, будут Y~d и —]/~d. Если же d <0, т. е. —d > 0,, то корнями будут i У—d и —i ]/"—d. Обозначим эти корни так, как мы обозначали действительные корни: ]/"с!и —Yd соответствен- соответственно. Тем самым задана некоторая функция У~й с областью определе- определения Re. Используя ее, можно теорему 7.57 уточнить так, чтобы каждый полином а\2 + Ь\ + с с действительными коэффициентами а, Ь, с и а ф 0 имел единственный (действительный) корень —Ы2а в случае Ь2 — 4ас = 0 и два различных комплексных корня (—Ъ ± Yb2 — 4ас)'/2а при Ъ2 — 4ас Ф 0 (действительных, если Ь2 —4ас> 0). Имея в виду получение аналогичной теоремы и для полиномов с комплексными коэффициентами, определим вначале понятие корня
332 ГЛ. 8 КОМПЛЕКСНЫЕ ЧИСЛА из комплексного числа. Пусть, например, d = s + it (s, t ? Re). Если комплексное число г = х + \у, х, у ? Re, удовлетворяет урав- уравнению г2 = d, то х2 — г/2 = s и 2хг/ = Л Если / = 0, то d действи- действительное, и мы квадратный корень из d находить умеем. Если же t Ф О, то и хф 0, и у Ф 0, а поэтому, полагая г/ = ^/2.t и х2—t2/4x2— = s, получаем 4лг* — 4sx2 — t% = 0. Но из этого уравнения мы легко находим все действительные решения х, а тем самым и пары (х, у). т. е. решения г = х + iz/ уравнения г2 = rf. Получаем следующую теорему, детальное доказательство которой предоставляется чита- читателю. 8.9. Теорема. Предположим, что d = s -\- \t, где s, t — дей- действительные. Пусть еде Знаки -4- или — берутся в зависимости от того, будет ли t ^ 0 или t < 0. Тогда z0 и —гс являются единственными комплексными числами г, удовлетворяющими уравнению г2 = d. 8.10. Определение. Для любого d 6 С мы обозначаем d1!2 или Yd число г0, определенное, как в 8.9. Оно называется глав- главным квадратным корнем из d. В дальнейшем использование термина «главный» будет отчасти расширено. Теперь из тех же соображений, что и в 7.57, формула решения квадратного уравнения может быть обобщена: 8.11. Теорема. Предположим, что а, Ъ, с?С и афО. Тогда единственными комплексными корнями zt, z2 полинома al+bl-rc будут =^-| , причем at,2-JrblJrc = = 0F-20F-22). Конечно, 2! = z2, если Ъг — Аас = 0 и г^Ф г2 в противном случае. Теперь мы хотим найти решения полиномиальных уравне- уравнений высших степеней. В качестве следующего шага мы рассмотрим кубические уравнения, в частности, уравнение г3 = d. Вопрос несколько упростится, если заметить, что любое z = x -j- \y (где х, у действительные и г Ф 0) можно записать в виде Пусть г = Vx2 + у2, и = х/r, и = г//г; тогда г > 0, ы2 + и2 = 1 и г = г (и + if)- Это представление единственно, т. е. если г = = f\ («I + ifi), Где Г! > 0 И U\ + О* = 1, ТО Г = /Ч, U =_«i И W = l»i. Действительно, для любого такого представления гг = (ri«iJ + + (О2 = г\, откуда г2 = г* и г = г4. Тогда единственность следует
8.1. ОСНОВНЫЕ СВОЙСТВА 333 из и + iv = Mi + \Vi. Мы покажем, что соответствующим пред- представлением г2 будет г2 (и + ifJ, 23 = г3 (ы -j- \vK и т. д. Поэтому если d = т-1 (si + tfi), где d =^= 0, т. е. г > 0 и s* + /? = 1, то реше- решение 23 = d в силу единственности эквивалентно решению г3 = г4 и (и + \vK = Si + tfi. Первое уравнение решается тривиально: для данного rj имеем г = г01/3. Однако второе уравнение приводит к двум уравнениям третьей степени относительно и и и, которые должны быть решены одновременно. Это можно сделать прямыми алгебраическими преобразованиями, однако такая работа весьма скучна и не слишком полезна. Более того, про- D.x делать ее можно лишь для простейшего куби- ' '* ческого уравнения. Для настоящего проник- проникновения в природу решений этих уравнений и уравнений высших степеней необходимо об- обратиться к геометрической интерпретации комплексных чисел и основных операций — над ними. ° Геометрическая интерпретация. Посколь- Поскольку мы доказали существование поля, состоя- Рис- 38- щего из элементов Re X Re и изоморфного С, то такое представление естественно рассматривать на плоскости, Каждому г ? С мы ставим в соответствие единственную «точку» (х, у) такую, что х, у 6 Re и г = х + \у, мы будем обозначать ее Р, а иногда просто z (рис. 38). Тогда величина Ухг + гД с которой мы уже несколько раз встречались, будет расстоянием от Р до нача- начала О. Далее, в представлении величины х/Ух2 + у2, \ji\f х2 + у2 будут соответственно отношения- отношениями ОА/ОР и АР/OP основания и высоты прямоугольного треуголь- треугольника к его гипотенузе. В тригонометрии эти отношения называются соответственно cos 8 и sin 8, где 8 — угол между положительным направлением оси х и гипотенузой ОР, отсчитываемый в направле- направлении, противоположном вращению часовой стрелки. Тогда г = — г (cos 0 + i sin 0), где г = |/ х2 + у2. Иногда также пишут г = \г\. Конечно, рассуждения, приведенные здесь, существенно исполь- используют не определенное строго понятие «угля; отсчитываемого в дан- -ном направлении». Точное определение этого понятия вовсе не эле- элементарно, и позднее мы к нему еще вернемся. Сейчас же будем предполагать, что обычные сведения из геометрии и тригонометрии, (Касающиеся понятия угла, нам известны. Изобразим на чертеже точки, соответствующие числам г± = == Xi + \уи гг = х2 + \уг и их сумме Zi + гг = (ху + х2) +
334 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА Рис 39. Л- i (i/i + У2) (рис. 39). Геометрически сумма г4 + г2 получается по так называемому «правилу параллелограмма» сложения векторов (или сложения сил). Легко видеть, что эт0 Правило не зависит от знаков хь уи х2, у2- Согласно нашим предыдущим замечаниям OPi = I zt |, ОР2 = I z2 | и ОР = | Zl + z2 |. Но ОР2 = PiP, а дли- длина одной стороны треугольника всегда меньше или равна сумме длин двух дру- других его сторон. Отсюда мы заключаем, что OP < OPi + 0Р2, т. е. | zi + 22 К ^ | Zi | + | г2 | для любых Zi, z2. Опре- Определение | z | и проверка таких его свойств, как только что доказанное (так называе- называемое неравенство треугольника), может быть полностью проведено без помощи геометрии, т. е. в строго определенных терминах. Абсолютная величина. Из 8.7 (v) мы знаем, что если г = х + \у, где х, у действительные, то zz = х2 + у2 ^ 0. 8.12. Определение. Для любого г ? С полагаем \ z \ — = Vzz; | z | называется абсолютной величиной, или модулем г. 8.13. Теорема. Для любых z, w 6 С (i) I z I ^ 0; I z I = 0 тогда и только тогда, когда г = 0; (и) если z действительное, то \ z \, определенный в 8.12, и \ г \, определенный в 4.19, совпадают; (Hi) | zw | = | z |-| w |; (iv) если гфО, то | г | = | г I; (v) |г + ш|<|г|+|ш|; (vi) \z — w |> \\г \ — \w ||. Доказательство. Части (i), (ii) очевидны а из 8.7(ii) мы получаем, что ввиду 8.7, zw |2 = (zw) (zw) = (zz) (ww) = = |г|2|ш|2, и (iii) следует из (i). Часть (iv) получается примене- применением (Hi) к w = z~1. Чтобы доказать (v), рассмотрим сперва част- частный случай w=\. Тогда Мы хотим показать, что ¦z+_l<(|z|+l)a = |z|2+2|2|+l. Для этого нужно показать, что z+z-<2|z|. Если z = x+iy, где х, у действительные, то, очевидно, z -f- z = 2x<;2 ]fx2jrу2, т. е. (v) доказано для случая о>=1. В общем же случае, если w = 0, то результат очевиден, а если ш^=0, то | z-\-w\ = \(zw~l-\- l)w\ = \zw~1+ 1 | |да|<;( IzDy!-)- 1I^1 =
8.1. ОСНОВНЫЕ СВОЙСТВА 335 (v) доказано. Вследствие (v), \z\ = откуда \z\ — \w\^C\z — w\. Если |z|> — w\ =\w\ — \z w\, то это дает (vi). Если w — z\ = \z — w\. (vi) дока- |, то ||z зано полностью. Таким образом, несмотря на то, что С не может быть упорядоче- упорядочено, мы можем ввести функцию «абсолютное значение», являющуюся продолжением функции, определенной на действительных числах, и наследующую ее основные свойства. Перейдем теперь к геометрической интерпретации операции умножения комплексных чисел. Формально, если Z\ = r4 (cos 9t -)- + i sin 9j) и z2 = r2 (cos 92 -j- i sin 82), rl — | z4 |, r2 = | z2 |, то ZiZ2 = пгг [(cos 9i cos 92 — sin 94 sin 92) + i (sin 9t cos 92 + + cos 9i sin 92)]. Если положить z = ZiZ2 = r (cos 9 + i sin 9), то Г = | Z | = | Zj | | Z2 | = /-J -Г2 И cos 9 = cos 9j cos 92 — sin 9j sin 92 = cos (Q± -f 92), sin 9 = sin 9i cos 02 + cos 94 sin 02 = sin @t + 02), если воспользоваться известными из элементарной тригонометрии равенствами cos @! + 02) = cos 9i cos 92 — sin 9X sin 92, sin @i + 92) = sin cos cos 9d sin 92. Р(х, у) Исследуем теперь более тщательно понятие угла и определения три- тригонометрических функций углов. В математическом анализе для измерения углов чаще всего применяется система, в которой единицей служит радиан. Если рассмотреть единичный круг с центром в начале L координат и радиусом 1, то длина его окружности равна 2я. Длина дуги, стягивающей любой цен- центральный угол 0, нахо- находится в том же отноше- отношении к 2я, в каком 9 на- находится к полному углу. Иными словами, в ра- дианной системе измере- измерения каждому центральному углу соответствует число радиан, равное числу единиц в стягивающей его дуге. На рис. 40 ОР = ОА = 1 и значение 0 в радианах равно длине дуги АР. В тригонометрии cos 9 и sin 9 определяются для всех веществен- вещественных 9: сначала геометрически для 0^9 <2я (для точки (х, у) на единичном круге cos 0 = х и sin 9 = у), а затем и для всех дру- других 0 при помощи свойства периодичности: cos @ -f n -2я) = cos 0^ Рис. 40.
336 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА sin (9 -1- п -2л) = sin 9 для всех п ? I. Что касается вычисления г = г^ -г2, то мы видим, что если 0 ^ 0Ь 02 < 2л, то 0 = 04 + 02 при 0 < 0! + 02 <2я и 0 = 0Х + 02 — 2л при 2л < 0! + 02. Это иллюстрирует рис. 41. В качестве примера запишем некоторые комплексные числа в тригонометрической форме: 1 = 1 -!- i -0 = cos 0 + i sin 0; i = 0 + I • 1 = cos ^- + i s'm y ; —1 = —1 -|- i -0 = cos я + i sin я; — i -= 0 + i -(—I) = cos g-11 sin у ; и т, д. Таким образом, для записи комплексных чисел в тригонометри- тригонометрической форме нами используются (не всегда, может быть, явным 1 ?-1 s-Э Рис. 41. образом) две основные идеи. Во-первых, каждому комплексному числу 2 = х + \у такому, что | 2 ! = 1, т. е. х2 + у2 = 1, ставится в соответствие определенное действительное число 0, называемое углом или аргументом числа z и временно нами обозначаемое Arg (г). Ссылаясь на рис. 40, мы определяем это число или как длину дуги АР* или как половину площади сектора АОР. Экви- Эквивалентность обоих определений вытекает из известного геометриче- геометрического факта, что отношение длины дуги АР к общей длине 2я единичной окружности равно отношению площади сектора АОР к площади л круга, ограниченного этой окружностью. Конечно, любое из этих определений угла 0 (в частности, числа л) опирается на неэлементарное понятие длины дуги кривой или площади плоской фигуры, точное определение которых требует применения аналити- аналитического понятия интегрирования. Во-вторых, предполагается существование таких функций С и 5 с областью определения Re, что для 0, однозначно определенного
8.1. ОСНОВНЫЕ СВОЙСТВА 337 числом г = х -{- \у, имеет место С (9) = х и S (9) = у. Кроме того, функции С и S должны обладать рядом специфических свойств таких, как С@)=1; 5@) = 0; С(л)=—1; 5(я) = 0; С@ + 2шт) = С(9); S(8+2/m) = S(9); С @, + 02) = С (90 С @2) - 5 @0 5 @2); S@1 + 92) = 5F1)C@2)+C@1M@2) и т. д. Доказательство существования нужных трех функций Arg, С, S можно провести, используя некоторые идеи анализа, в рамках построенной в предыдущей главе системы действительных чисел. Это доказательство, однако, лежит далеко в стороне от наших основ- основных целей, и поэтому мы вынесли его в добавление II. Точнее говоря, там будет приведена лишь схема доказательства сформулированной ниже теоремы, проведение же детального доказательства предостав- предоставляется читателю. Заметим, что для наших целей знание точного значения числа зх совсем не обязательно,— любое из утверждений мы можем закончить словами «где зх — некоторое фиксированное действительное число». Основные свойства тригонометрических функций 8.14. Теорема. На Re существуют две непрерывные функ- функции С и S, удовлетворяющие следующим условиям: (i) C@)=l, S@) = 0; Oi) С (-5-) =0,S (¦=-) = !; (iii) если О<0<я/2, то О<С@)<1 и 0<S(9)<l; (iv) C2(9) + 52(9)=l для любого 0; (v) C(9i + 02) = C(91)C(92) —5F1MF2) для любых 6l5 02; (vi) -5@1-f02) = S@1)C(92) + C@1M(92) для любых Qi: 02. Считая теорему 8.14 доказанной, можно вывести и другие свойства функций С, 5. 8.15. Теорема. Предположим, что С, S — любые две функ- функции, удовлетворяющие условиям 8.14. Тогда для любого действитель- действительного числа 0 и п 6 I имеют место (i) _1 < С (9) < 1, — 1 < S @) < 1; (И) С @ + л/2) = —5 @) и S @ + л/2) = С (9); (iii) С (—0) = С @) и S (—9) = —S (9); (iv) С(9+2шг) = С(9) и
338 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА (v) С B0) = С2 @) — 52 (Э) == 2С2 @) — 1 = 1 — 252 @); (vi) 5 B0) = 25 @) С @); Доказательство. Часть (i) следует непосредственно из 8.14 (iv), a (ii), очевидно, следует из 8.14 (И), (v), (vi). В доказатель- доказательстве (iii) мы используем 8.14 (v), (vi), полагая 0t =0, 92 = —8. Тогда A) 1 = С (9) С (—0) — 5 (9) 5 (-9) О = 5 (9) С (—9) + С @M (-6). Умножая первое уравнение на С (9), второе — на 5 (9) и решая их одновременно относительно С (—9), получаем С @) = С2 @) С (—0) + 52 @) С (-9) = С (—0) в силу 8.14 (iv). Аналогично видим, что 5 (—0) = —5 @). Повтор- Повторным применением (ii) получаем также С @ + 2л) = С @) и 5 @ + 2зт) = 5 @); следовательно, (iv) выполняется для п ^ 0. Но, вследствие 8.14 (v) и (iii), B) С @! - 02) = С F0 С @2) + S @0 5 @2) 5 @! - 02) = 5 @0 С @2) - С @0 5 @2). Итак, видим, что С @ — ¦?) = 5 @) и 5 (9 — у) =—Сф), откуда получаем С @ — 2я) = С @) и 5 (9 — 2зх) = S @). Следо- Следовательно, (iv) доказано в общем случае. Части (v) и (vi) следуют непосредственно из 8.14 (v), (vi), а часть (vii) получается из (v) подстановкой 0/2 вместо 0. Из (vii) получаем Чтобы определить, какие именно знаки следует брать здесь, мы должны знать положение 0/2. В общем случае знаки С (9), S @) для 0^9 < 2я (и, следовательно, в силу 8.15 (iv) выше для всех 0) определяются с помощью 8.14 (i) — (iii) и повторного применения 8.15 (ii). Мы рассмотрим значения С @), 5@) в точках 0 = 0, л Зя - 2~ , я, -к- и в промежуточных областях, так называемых четвертях:
.8.1. ОСНОВНЫЕ СВОЙСТВА 339 AH <8 <я/2, (II) л/2 <8 <л, (III) л <8 < Зл/2 и (IV) Зл/2 < <8 <2я. Каждое 8 из области (II) равно у + 9ь где01 принадле- принадлежит области (I), и т. д. Поэтому С F) = 0 тогда и только тогда, когда 6 = л/2 или 6 = Зя/2 (соответствен- (соответственно, 5 (8) = 1 или 5 (8) = —1) и 5 (8) = 0 тогда и только тогда, когда 6 = 0 или 6 = я (соответственно С (8) = 1 или С (8) = —1). Для 8 из области (I) С (8) > 0, 5 (8) > 0; для 8 из области (II) С F) <0, S (8) > 0; для 8 из области (III) С(8)<0, S (8) <0 и для 8 из области (IV) С (8) > 0, 5 (8) < 0. Эти утвержде- утверждения проиллюстрированы ниже (рис. 0 < 8 < я, то 0 < 8/2 < зх/2 и (-,4 Н,0) (-,-) 42). Так, например, если 5 [^) = а если л<8<2л, то -2- Si — 1-С (9) _-,/ 1 —С F) ~У 2 • 8.16. Теорема. Существует единственная пара непрерыв- непрерывных функций С, S, удовлетворяющих условиям 8.14. Доказательство. Предположим, что С, 5 и Cit Si — две такие пары функций. Тогда обе они также удовлетворяют усло- условиям 8.15. Ввиду 8.14 (i), (ii) и 8.15 (И), как и в предыдущих рас- рассуждениях, достаточно показать, что A) если 0<Q<j, то С (8) = С± (8) и S (8) = St (8). Сперва в силу 8.15 (vii) заметим, что B) если &?Р, то С (-^-я 1 =Cj затем C) если 6 — любое действительное число, т ? Р, С (8) = d (8) и S (8) = Si (8), то С (тв) = С, (тв) и S (тв) = Sl (тв).
340 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА C) доказывается индукцией по т с использованием законов сложе- сложения 8.14 (v), (vi). Комбинация B) и C) показывает, что D) для любых k, m?P имеем С (-^---f-) =Ci (-fr'Tr) " c/m я \ с ( m я\ 5 [-WY)-^1 \WT)' Рассмотрим теперь любое 9, 0<9<-^-. Тогда Q = a~, где 0<;а<1- Вследствие теоремы 7.36 о представлении действи- действительных чисел в системе по основанию 2, можно записать со а= 2 (mi/21), где каждое mt равно 0 или 1. Для любого б>0 мы можем найти т, k?P такие, что | а — (т/2к) | <б; именно, п m/2k = 2 (/"г/2г) для достаточно большого п. Применим теперь непрерывность функций С, Ct. В силу непрерывности для любого дан- данного е > 0 мы можем найти б > 0 такое, что 0<а — 6<a-f6<;l и E) если \а — Ь|<б, то Для данного е>0 и соответствующего ему б выберем tn, k, как это сделано выше, и положим b = m/2k. Тогда вследствие D) Отсюда Поскольку это верно для любого е>0, то Аналогично с помощью непрерывности доказывается, что для любого а, 0<а<1, Следовательно, A) доказано.
8.1. ОСНОВНЫЕ СВОЙСТВА 341 8.17. Определение. Для любого действительного числа9 обозначаем С (9) = cos 9 и S (9) = sin 9, где С, S\— единственные функции, удовлетворяющие условиям 8.14. Тригонометрическая форма, теорема Муавра. Теперь мы можем доказать единственность представления комплексных чисел в три- тригонометрической форме. 8.18. Теорема. Для любого г ? С, г Ф 0 существуют един- единственные действительные числа г и 9 такие, что 0 < г, 0 ^ 9<;2я и г = г (cos 9 + i sin 9). Доказательство. Очевидно, в любом таком представле- представлении | г |2 = г2 (cos2 9 + sin2 9) = г2 и потому г — | г |. Поэтому г определяется числом г однозначно. Чтобы доказать существование и единственность 9, достаточно рассмотреть случай такого 2 = = х + \у, х, у 6 Re, что | 2 [ = 1, т. е. х2 + у2 — 1. Тогда | * | ^ ^ 1, | у | ^ 1. В соответствии со знаками х, у любое возможное представление х = cos 9, у = sin 9 полностью определяет величи- величину 9 в смысле рис. 42. Если или х = 0 или у = 0, то существование и единственность очевидны. В противном случае достаточно рассмо- рассмотреть существование и единственность для 0 <я < 1, 0 <у> 1. / 1 Т/3 (Например, если мы найдем 9 с cos 9 = -^ и sin 9 = -^, то ^^ cos(9 + ji)+isin(e + rt) и т. д. С другой стороны, чтобы найти тригонометрическую форму числа (—1/2)-)-i(^3/2), надо сперва отыскать <р такое, что coscp = = (-1/2), япф = КЗ/2.) Итак, рассматриваем любые фиксированные х, у такие, что х2- + у2 = 1, 0 <х < 1, 0 <у < 1. Пусть /? (9) = cos 9 — х для любого 9. Когда х фиксировано, F — непрерывная функция 9. Так как F @) = 1 — х> 0 и F (я/2) = —х < 0, то по теореме Вейерштрасса должно существовать такое 9, 0 <9 <л/2, что F (9) = 0, т. е. cos 9 = х. Тогда также sin2 9 = у2, поскольку cos2 9 + sin2 9 = 1; но sin 9 и у положительны, поэтому sin 9 = у. Существование 9 доказано. Предположим, что также cos ф = х, sin ф = у. Тогда по правилу знаков 0 <с ф < я/2. Предположим, например, что ф ^ 9. Тогда sin (9 — ф) = sin 9 cos ф — cos 9 sin ф = = ух — ху = 0. Но 0^9 — ф < я/2. Поэтому sin (9. — ф) = 0 может быть лишь в случае 9 — ф = 0. Теорема доказана. Представление комплексных чисел в виде 8.18 мы будем назы- называть тригонометрической формой z. Идея данного представления независимо возникла у нескольких математиков около 1800 г. Наиболее четкой она была у Гаусса, и поэтому часто говорят
342 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА о гауссовой плоскости. Основную диаграмму на рис. 38 часто назы- называют диаграммой Аргана по имени другого исследователя. Для на- наших целей тригонометрическая форма комплексного числа важна главным образом потому, что дает возможность использовать усло- условие (ii) нижеследующей теоремы Муавра 8.19. Сама теорема следует непосредственно из законов сложения функций cos и sin. Например, с помощью формул cos 20 = cos2 9 — sin2 9, sin 20 = 2 sin 9 cos 9 можно получить равенство cos 20 + i sin 20 = (cos 9 + j sin 0J. 8.19. Теорем a. (i) Если zt = rt (cos 0t -f j sin 0t) и z2 — = r2 (cos 02 + i sin 02), где 0Ь 02, rt, r2 — любые действительные числа и г и г2>-0, то zyz2 = /y2 [cos @! + 02) + | sin @! + 02)]. (ii) Для любых действительных г, 0 и п 6 Р, /">-0, [г-(cos 0 + i sin 0)]n = rn [cos я0 + i sin я0]. Доказательство предоставляется читателю. Корни п-й степени из комплексных чисел. Подставляя в 8.19 (ii) 6/я вместо 0 и г1/™ вместо г, получаем решение уравнения гп = = г (cos 9 + j sin 9). Точнее, 8.20. Теорема. Предположим, что d ? С, d Ф 0 и я ? Р. Тогда существует ровно п различных комплексных чисел z таких, что zn = d. Если d = | d \ (cos 0 + i sin 9), где 0 ^ 0 < 2я, то этими числами будут для k = 0, 1 я — 1. Доказательство. Согласно 8.19 (ii) для каждого k z\= \d\ [cos (9 + 2kn) + i sin @ + 2kn)] =\d\ (cos0 + i sin 0) = d. Далее, все числа zk различны. Действительно, 0^9 <2я и для 0<6<л—1 0 < 0 + 2kn < 2я + 2 (я — 1) я = 2язт, откуда 0 ^ @ + 2kn)/n < 2я для каждого такого k. Из теоремы единственности 8.18 следует, что если zh = zh где 0 ^ k, I ^ п — 1, то k = /. Наконец, каждое zh является корнем полинома |п —• d. Поскольку полином п-й степени может иметь самое большее п раз- различных корней, других решений уравнения zn = d нет. Таким образом, тригонометрическая форма дает нам в очень элегантном виде общую теорему существования корней, которую мы ранее получили лишь для случая п = 2 (8.9) и нашли алгебраи- алгебраически трудноразрешимой для п = 3.
8.1. ОСНОВНЫЕ СВОЙСТВА 343 Сравним полученные для п = 2 решения. Пусть для d Ф О Чтобы найти в соответствии с 8.20 квадратные корни из d, мы должны вычислить cos @/2), sin (9/2) и cos F/2 +я), sin (8/2 +л) для единственного 0 такого, что О<[0<2я и cos В = s/Vs2 +1*, sin 0 = t/Ys2 +• t2. Это может быть сделано в соответствии с 8.15 (И), (vii). Детали вычисления оставляем читателю. В результате полу- получится, что главный квадратный корень из d, определенный в 8.10, равен числу ]/"|d| (cos6/2+ i sin 9/2), т. е. числу z0 из предыдущей теоремы. Это позволяет нам расширить определение 8.10 сле- следующим образом: 8.21. Определение. Предположим, что п 6 Р- Мы пола- полагаем Qi/n — р^О = 0. Для любого d ? С, d Ф 0 мы обозначаем dyin или у/d число z0, определенное, как в 8.20. Оно называется глав- главным корнем п-й степени из d. Все числа zk из 8.20 называются корнями n-й степени из d. Заметим, что для действительного d, d ^ 0, приведенное опре- определение согласуется и с определением 7.56. Таким образом, практическое вычисление корней n-й степени из комплексного числа d состоит из двух отдельных шагов. Во-пер- Во-первых, нужно вычислить корень n-й степени ^/~ \ z \ из действитель- действительного числа | z |; алгоритм решения этой задачи мы знаем. Во-вто- Во-вторых, нужно вычислить значения cos @ + 2kn)ln и sin @ + 2kn)/n. Эта задача, вообще говоря, решается с помощью представления cos 0 и sin 0 в виде рядов (см. добавление II). Практически же с боль- большой степенью точности эти значения мы можем найти в специальных таблицах функций cos 9 и sin 0, которые составлены ввиду важности этих функций для самых различных задач. Для некоторых конкретных значений п применима и другая процедура вычисления корней n-й степени. Если, например, п = = 2т-пи где 2 Jf nit то вопрос нахождения корней n-й степени сводится к нахождению корней п4-й степени либо с помощью триго- тригонометрической формы и формул половинного угла 8.15 (vii), либо алгебраически по формулам 8.9. Если же п нечетно, то можно попы- попытаться применить теорему Муавра в обратном направлении, ста- Q ft раясь найти cos —и sin — через cos 0 и sin 0. Для п = 3, например, (8.1.1) cos3|--3cos-|-sin2|. = или (8.1.2) 4cos3-|-3cos-|- =
344 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА А А Полагая x = cos^-, у —sin —, можно попытаться найти х, у О о по данному значению cosG из уравнений (8.1.3) 4x3-3x = cos0, хг+у2=1, используя определение знаков х, у в соответствии с расположе- расположением 9/3. Например, для 9 = п имеем х>0, г/>0 и \хъ — Зх — 1 =0. Решить это уравнение не представляет труда —один корень х— — 1; разделив нал:+1, получаем уравнение 4л:2 — 4лг+ 1 =0, которое имеет единственный корень л: =1/2. Тогда У2 = -т и г/= |//2. г-т Л 1 . Л Т/3 Поэтому cos -г- = -5-, sm-7j- = -^—, что соответствует результатам школьной тригонометрии. Для нахождения функций угла ~ мы можем применить формулы половинных углов или снова (8.1.3), поскольку в данном случае получается простое уравнение 4х3 — Зх = 0, где x = cos-^-. Такой алгебраический подход не всегда ведет к простому алгеб- алгебраическому представлению корней л-й степени даже в случае п = 3. Например, для зх/9 мы должны решить уравнение Ах? — Зх = -=¦, что не так уж просто (детальнее это будет обсуждаться в конце гла- главы). Далее, чем больше п, тем сложнее уравнение, которое придется решать. Мы предоставляем читателю в упражнениях исследовать случай п = 5. Теорема 8.20 представляет особый интерес при d = 1; в этом случае мы имеем дело с так называемыми корнями п-й степени из единицы. 8.22. Теорема. Для данного п 6 Р положим w — cos — + + i sin —. Тогда n (i) числа wh для k = 0, 1, . . ., n — 1 являются различными решениями уравнения zn = 1; (ii) если d — любое комплексное число, d Ф 0 и если z0 = y то числа zk = zowh для k = 0, . . ., п — 1 являются различными решениями уравнения zn = d. Доказательство предоставляется читателю. Согласно геометрической интерпретации произведения и сте- степени (рис. 41 и теорема 8.19), числа wh для k = 0 п — 1 являются вершинами правильного п-угольника. Так, например, нахождение чисел cos -^ и sin -? соответствует построению пра- О О вильного пятиугольника (рис. 43). Вопрос о возможности построе-
8.1. ОСНОВНЫЕ СВОЙСТВА 345 ш' ш иг* Рис. 43. ния таких правильных многоугольников с помощью определенных инструментов является классической проблемой геометрии на пло- плоскости. То же самое касается трисекции любого данного угла: в тригонометрии этот вопрос формулируется как нахождение о в cos-j и sin-j для заданных cos 9 и sin 9, в алгебре же ставится вопрос о нахождении корней определенных уравнений третьей степени. Одним из поразительных прило- приложений алгебры является исследование воз- возможности различных геометрических по- построений на основе чисто алгебраических рассмотрений. Такого рода проблематику мы будем рассматривать в следующей главе. Ближайший же раздел мы посвятим завершению изучения корней полиномов с комплекс- комплексными коэффициентами. Пока мы изучили только полиномы ?n — dr где d 6 С. Упражнения 1. Доказать теорему 8.9. 2. Найти для данного г ? С числа (г + г)/2, (г — z)/2i, г/| г |2 (для гф 0). 3. Если даны действительное число а > 0 и комплексное число г1; то какова геометрическая интерпретация каждого из следующих условий: \z\ = а, \ г — Zi | = а, | г | < а, \ г — г4 | < а> 4. Существуют ли комплексные корни г полинома ?3 — I2 + I + 4 такие, что | г | <; 1? 5. (а) Доказать теорему 8.19 (i), (ii). (б) Выполняется ли 8.19 (ii) для любого п ? I? Обосновать ответ. 6. Если тригонометрической формой г является г (cos 9 + i sin 9), где г Ф 0 и 0^9< 2я, то какова тригонометрическая форма г? 7. Показать, что 8.9 может быть выведено из 8.20, а 8.10 и 8.21 совпадают в случае п = 2. 8. Выразить в алгебраической форме (т. е. с помощью i и корней n-й сте- степени из действительных чисел) все числа z такие, что (а) г3 = _i; (б) z« = —i; (В) гз = _2 — 2i; (г) г4 = (-1/2) - i (У 3/2). 9. Для данного cos 9 найти полиномиальное уравнение, определяющее 6 х = cos -=- . О 2it 10. Доказать теорему 8.22 (i), (ii). 11. (а) Показать, что если w = cos -=- + i Sln"r- . то w* + w3 + w2 + w + 1 = 0. (б) Пусть и = w + IIw. Показать, что и2 + и = 1. (в) Используя (а), (б), выразить w алгебраически. 12. Предположим, что п ? Р. Пусть да = cos (- i sin — я /г Мы я /г назовем г ? С примитивным корнем п-й степени из единицы, если для А = 0, 1, . . ., п — 1 числа гй являются всеми решениями уравнения ип = 1.
346 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА Покажите, что г является примитивным корнем л-й степени из единицы тогда и только тогда, когда для некоторого т 6 Р, 1 ^ т < п, имеем z = wm, тде т взаимно просто с п. 13. Пусть ? — функция из 7.45. Записываем ее в виде Е (х) = ех. Функция Е продолжается на комплексные числа следующим образом: Е (г) = = ех (cos у + i sin у) при г = х + it/, где х, у 6 Re. (Сохраним обозначение ? (г) = ег.) Показать, что (а) eZl+2z-= eneZz для любых Zi, гг 6 С; (б) ehz = (ez)h для любых г? С, ?? I; (в) е2пя'=:1 для любого rt g I. Заметим, что е<-2Л1'п'1 является другим представлением примитивного корня 2 2 п-й степени из единицы е^Я|/п) __ COs — + i sin — п п 8.2. Полиномы и непрерывные функции в области комплексных чисел Используя соответствующее понятие «расстояния» между комп- комплексными числами, можно распространить на них понятия предела и непрерывности. Как мы уже видели, рас- расстояние между действительными числами х и d определяется абсолютной величиной их раз- разности \ х — d |. Естественно рассматривать \ г — d \ для комплексных чисел в качестве расстояния между г и d. Такое определение согласуется с геометрической интерпретацией, как можно видеть из рис. 44. Ведь, согласно общему определению, | г — d | — расстояние числа г — d от начала координат и по пра- правилу параллелограмма \г — d \ будет также ис' ' расстоянием между z и d. С другой стороны, наше определение согласуется и с теоремой Пифагора: если г = х + \у, d = s + \t, х, у, s, t ? Re, то i г - d | = V(x- sJ + (y - t)\ В определениях предела и непрерывности мы сталкиваемся с условиями типа «для всех г таких, что \г — d | <п>, где под г подразумевается г ? Re, г > 0. Геометрически такое условие в слу- случае действительных чисел выделяло открытый интервал длины 2г с центром в d. Для комплексных чисел это условие выделяет множе- множество точек, лежащих внутри окружности | г — d | = г с центром в d радиуса г (рис. 45). Используя введенное понятие расстояния, мы в этом разделе не только сможем определить предел последовательности комплекс- комплексных чисел, но и непрерывность функции, и ряд других понятий, аналогичных рассмотренным для действительных чисел. Для нас это не будет самоцелью — прежде всего мы будем иметь в виду изу- изучение полиномов с комплексными коэффициентами, которые,
8.2. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 347 согласно нашей общей схеме, должны порождать соответствующую функцию. Конечно, далеко не все понятия прямо переносятся на случай комплексных чисел. Например, нельзя говорить о макси- максимальном или минимальном значении функции / (г), поскольку С не упорядочено. Однако, как мы увидим, в этом отношении удобна функция | / (г) |, принимающая только дейст- действительные неотрицательные значения, причем z-d\=r корни / (г) и \ f (г) | одинаковы. Основной идеей отыскания корня комплексного полино- полинома / (г) ? С [?] для нас и будет доказательство того, что |/(г) | принимает минимальное зна- значение и что это минимальное значение равно 0. Практически критерием отбора материала в данной главе будет степень его необходимости для точного проведения этого доказательства. Поэтому мы затрагиваем лишь очень неболь- небольшую часть того, что может быть названо комп- Риг 44 лексным анализом. • * • Просмотр доказательств теорем типа 7.50 о значениях функций показывает, что в основе большинства из них лежит теорема Больцано — Вейерштрасса, согласно которой всякая ограниченная последовательность содержит сходящуюся подпо- подпоследовательность. Мы начнем поэтому с ее обобщения. Пределы и обобщенная теорема Больцано — Вейерштрасса 8.23. Определение. Пусть (zh) = (z0, . . ., zh, . . .) — бесконечная последовательность комплексных чисел zh. (i) Если d ? С, то мы говорим, что d является пределом (zft), и пишем \\mzk = d, если для каждого действительного е > 0 существует т такое, что \zk — d | < е для всех k ^ т. (ii) Мы говорим, что (zh) сходится, если существует некоторое d 6 С, являющееся пределом {zk). (Hi) Мы говорим, что (zk) ограничена, если \ zh | ^ М для некоторого действительного числа М и всех k. (iv) Мы говорим, что {wu) — подпоследователь- подпоследовательность последовательности (zh), если для некоторой последова- последовательности положительных чисел (jh), /0 </i < . . . </ft < . . . , мы имеем wh = Zjh для каждого k. Как и в теореме 7.20, легко видеть, что каждая последователь- последовательность (гй) имеет самое большее один предел; следовательно, когда такой предел существует, мы можем писать lim zh = d. Теорема /t-+oo Больцано — Вейерштрасса для С в этих обозначениях выглядит точно так же, как и 7.26.
348 ГЛ. 8, КОМПЛЕКСНЫЕ ЧИСЛА 8.24. Теорема. Всякая ограниченная последовательность (zh) комплексных чисел содержит по крайней мере одну сходящуюся под- подпоследовательность . Основная идея доказательства теоремы 7.26 состояла в последо- последовательном делении пополам замкнутого интервала, содержащего бесконечное количество элементов по- последовательности. На каждом шаге один из двух полученных интервалов обладал тем же свойством и мы могли продол- продолжить процесс дальше. Проведем для до- доказательства нашей теоремы то же по- построение, но используем вместо интерва- интервалов прямоугольники, деля их каждый раз на четыре равных прямоугольника. Под (замкнутым) прямоугольником мы будем понимать [Ь, с] X W, с'] = {(х, у): Рис. 46. й < * < с и Ь' < I/ < с'}. Слегка из- изменим определение так, чтобы иметь дело прямо с комплексными числами. Именно, определяем A) [Ь, с] © W, с'] = {х + \у: и Ь' < у < с'} для любых Ь, с, Ь', с' ? Re. Для каждого k пусть B) zk = xh + \yk, где xk, yk ? Re. Поскольку (zh) ограничена, существует такое действительное число М, что Vх\-\- у1 = | zh \^СМ для каждого k. Но | xh j, | yk |<! ¦^.Ух% + у%. Следовательно, можно выбрать Ьо, с0 так, чтобы 60<с0 и C) zk ? [b0, с0] @[b0, c0] для каждого k. Но для любых действительных Ь, с, Ь' с' для которых Ь^с, Ь'<С, D) если имеется бесконечно много k таких, что zk ? [b, с] © @[b',c'], то это же самое можно сказать по край- крайней мере об одном из множеств • «']¦ Эти множества мы будем обозначать соответственно St(b,c, b', с'), i = l, 2, 3, 4. Построение хорошо видно из рис. 46. Если с — Ь = с' — Ь', то исходное множество [Ь, с] © \Ь', с'] и каждое из его подмно-
8.2. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 349 жеств St(b, c,b', с') будут квадратами. Определим рекурсивно последовательности Ь„, сп, Ь'п, с'п следующим образом. E) Ьо, с0 определяем, как в C), и b'0 = b0, c'0 = cQ. Если bn, cn, b'n, с'п уже найдены, то мы выбираем. bn+i, с„+1, b'n+i, c'n+i так, чтобы [й„+1, сп+1] © [bn+i, c'n+i] = = Si(bn, cn, b'n, с'п) для первого i( = l, 2, 3, 4) такого, что zk?Si(bn, cn, b'n, с'п) для бесконечного числа номе- номеров k. Так, например, если первое такое i равно 2, то ,, _ Ь'п-{-сп , _ Индукцией по п легко доказываются следующие свойства пост- построенных последовательностей: F) (i) bn<cn и (И) 66 (iii) сп — Ъп = с'п — Ь'п = -^{сй — Ьй)\ (iv) существует бесконечно много k таких, что Zk?[bn, Сп] @ [Ь'п, С'п]. Дальше поступаем, как и в доказательстве 7.26. G) Пусть B = {V ..-,bn, ...}, С={с0, ...,сп, ...}, B' = {b'o, ...,b'n, ...} и С' = {с'о, ...,с'п, ...}. Тогда каждое сп (соответственно с'п) является верхней гранью для В (соответственно В'), а каждое Ьп (соответст- (соответственно Ь'п) является нижней гранью для С (соответст- (соответственно С). Следовательно, в силу 7.9, существуют sup Б, sup В', infC, infC" и мы можем доказать почти так же, как и в 7.26, что (8) Будем считать (8) доказанным. Положим (9) Мы хотим показать, что d является пределом соответствующим образом выбранной подпоследовательности последовательности (zh). Одна из таких подпоследовательностей находится так: A0) Положим /о = 0. Для данного /„ пусть /п+1 будет наименьшим k таким, что jn<k и zh?[bn+i, cn+l] @ @[bn+i, Cn+i]. Положим wn = zjn для всех п>0.
350 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА Тогда мы видим, что A1) (wh) —подпоследовательность (zk) и wn?[bn, cn]@ © [К, с'п] для всех п. Поскольку также d? [bn, cn] © Wn, с'п] для всех п, для доказа- доказательства A2) \imwn = d достаточно показать, что A3) для любого действительного г > 0 мы можем найти т такое, что \w — ы|<е, как только до, u?[bn, cn]@ © [b'n, Cn] и Для любых п и w, u?[bn, cn] © [b'n, c'n] утверждение A3) дока- доказывается вычислением абсолютного значения [до— и\2: если W = Wi-\-\W2, U = Ut + lUz, ТО | w - и |2 = (да, - Uif + (w2 - иа)* < (сп -Ьп)'+ (с'п - b'nf < (последнее неравенство следует из F) (iii)). Отсюда Для данного е>0 выберем т так, чтобы У2(СО — Ьо) 2?п е Отсюда следует A3). Доказательство теоремы закончено. Все, что до сих пор говорилось, относится по существу не к комп- комплексным числам, а к множеству точек плоскости, точнее, к множе- множеству упорядоченных пар Re x Re. Абсолютно так же мы могли бы определить последовательности, их пределы и доказать теорему Больцано — Вейерштрасса для трехмерного евклидова простран- пространства Re х Re X Re и вообще для евклидова пространства любой размерности (дальнейшие обобщения этих понятий, как мы уже говорили, относятся к предмету общей топологии). Аналогичным образом можно обобщить понятие фундаментальной последователь- последовательности и доказать критерий Коши сходимости последовательности также и в произвольном евклидовом пространстве. Нам, однако, эти обобщения не потребуются, и мы оставим их читателю, если они его заинтересуют. Обобщение понятия непрерывности. 8.25. Определение. Предположим, что F — унарная функция, S(f)=C, j?(F)cC « dec
8.2. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 351 (i) Мы говорим, что F непрерывна в точке d, если для каждого {действительного) е > 0 существует б > 0 такое > что как только |z —d|<fi, то \F (г) — F (d) | < е. (ii) Мы говорим, что F непрерывна на С, если F непре- непрерывна в каждой точке d ? С. Как и в 7.47, легко доказывается 8.26. Лемма. Предположим, что F непрерывна на С и что- (zh) — сходящаяся последовательность комплексных чисел такая, что lim zk = d. Тогда (F(zh)} также сходится и lim F (гй) =F(d). Доказательство следующего обобщения теоремы 7.51 также предоставляется читателю. 8.27. Теорема. Предположим, что с — комплексное числа и что G, Н — непрерывные функции на С. Тогда функция F, опре- определенная для всех г ? С одним из следующих условий, также непре- непрерывна на С: (О F (г) = с; (ii) F (г) = г; (Hi) F(z) = G (г) + Я (г); (iv) F(z) = G(z).H(z); (v) F(z)=\G (г) |. Теперь мы можем доказать обобщение утверждения 7.50 (ii) для непрерывных функций вида | F (г) |. Часть (i) может быть обоб- обобщена тем же способом, но нам она не понадобится. 8.28. Теорема. Предположим, что функция F непрерывна на С. Для любого действительного числа г ^ 0 существует по мень- меньшей мере одно комплексное число d такое, что \ d \ <; г и \ F (d) \ ^ ^ | F (г) | для всех г таких, что \ z | ^ г. Доказательство. Оно очень похоже на доказатель- доказательство 7.50. Пусть A={\F(z)\: \г |< г}. Тогда А ограничено снизу числом 0. Пусть a = inf А. По 7.18 (i) для каждого п?Р мы можем найти некоторое гп?С с ^„lO и | F (гп) \ — а< — • Согласно теореме Больцано — Вейерштрасса для С, последовательность (гп) содержит сходящуюся подпоследо- подпоследовательность (wh) = (Znh), где no<inl<i ... < «л < .. . Пусть limwu = d. Тогда из того, что lajftl^r, видно, что |d|.<r. В силу 8.26 и 8.27(v), lim \F(wh)\= \F(d)\. Чтобы закончить доказа- тельство, мы покажем, что a = \F{d)\. Действительно, для любого 1 Е е>0 существует такое п?Р, что — <9~. и потому для всех
352 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА настолько больших k, что п<;яь, получаем |1/;'(ад4)| — а\ = = \F(znh) \ — a < — <~2"- С другой стороны, для всех достаточно больших k имеем || F (d) | — \F (Wh) || < 4- • Следовательно, и | а — — | /*" (d) || <;|| F (wjt) | — а | -J-|| F (d) | — \F (Wk) || < в для достаточно больших &. Ввиду произвольности е > 0 это возможно лишь при a = |F(d)|. Полиномиальные функции; рост и минимум их модулей. Дока- Доказанная теорема утверждает, что модуль всякой непрерывной на С функции на любом круге достигает своего минимума. Чтобы приме- применить эту теорему к полиномиальным функциям, нужно убедиться в непрерывности таких функций. 8.29. .Теорема. Для любого полинома /(?)?С[|], /(?) = п п = 2 а&г, <2«?C, полиномиальная функция f(z) = 2 aizZ непре- г=0 г=0 рывна. Доказательство с очевидностью следует из теоремы 8.27. Поэтому модуль всякой полиномиальной функции также дости- достигает минимума на любом заданном круге. Однако для полиномиаль- полиномиальных функций справедливо и более сильное утверждение — что модуль такой функции достигает абсолютного минимума во всей комплексной плоскости. Мы выведем это утверждение из того, что модуль полиномиальной функции | f (г) | с ростом | z | в определен- определенном смысле растет. 8.30. Теорема. Пусть f Ц) б С [?], /(?)= 2 а& и deg(f(g)) = г=0 = я>0. Для любого действительного числа УИ>0 существует такое действительное число г>0, что 1/BI^^1, как только \z\>r. Доказательство. Вследствие 8.13 (v), (vi) n-l n-l I (Z)\^ anZ — I 2j aiz I <?¦ anz I — ZJ \ °iZ i=0 i=0 Используя 8.13 (iii), отсюда получим A) если | г | >¦ 1, то n-l Пусть n-l O\ r — "S1 la' I
8.2, ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 353 Тогда мы видим, что C) если |z|>max(l,2r1), то |/(z)|>|c" !2|г|ге. Чтобы доказать теорему, достаточно выбрать г>0 так, что 2М D) r>max(l, 2rt) и /•">¦ ап\ что, очевидно, возможно. 8.31. Теорема. Предположим, что / (?) 6 С [?] и deg (/ E)) > > 0. Тогда существует по меньшей мере одно комплексное число d с I / (d) |< | f (г) | для всех г ? С. Доказательство. В силу 8.28 мы можем найти такое di 6 С, что | di | < 1 и | / (dj) К | / (г) | для всех | z|< 1. Пусть М = | f (di) |. По 8.30 существует такое г ^= 1, что I f (г) \ ^ М, как только | г | ^ л Если теперь снова применить 8.28, то можно найти d 6 С с I / (d) | < | / (г) | для всех г таких, что | г | ^ г. Это d удовлетворяет заключению теоремы, так как если \ г | > г, то I / (г) | > | / (dO | > | / (d) | - ведь | di | < г. Следующая теорема дает нам другое важное свойство полиномов. В комбинации с 8.31 она непосредственно подводит нас к основной теореме. 8.32. Теорема. Предположим, что f (|) 6 С Ш и deg (/ (?)) > > 0. Тогда для каждого d ? С с f (d) Ф 0 существует такое г 6 С, что I / (z) | < | / (d) |. Доказательство. Пусть с = / (d) # 0 и л = = deg (/ (I)) > 0. Исследуем поведение / (г) вблизи d, что экви- эквивалентно исследованию поведения / (d + г) для | г |, близких к 0. Пусть ?Г(?) = .ШЛ. Тогда g A) (i) g(z)= /:(d+2) для всех z?C; С +..-+*an, где все 6,€G, Ьп^=0. Действительно, если /(?) = 2 atV> T0 1=0 i=0 г=0 и Ьп = ап/с. Также g @) = / (d)/c = 1, откуда 60=1. Если B) существует такое г ? С, «то | ^ (г) | < 1, то теорема доказана, поскольку в этом случае \f (d+z)| <;jc| = = |/(d)|. Пусть C) ga) = l+bhlh+...+bnln, где
354 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА Вследствие 8.18 мы можем написать D) &а = | &ft | (cos p -j- i sin P), z = r (cos0 4-isin0), где p, 0 —действительные числа и 0-<г. Числа \bk\ и р фиксиро- фиксированы, но мы можем свободно выбирать г, 0. По теореме Муавра E) bkzh = \bk\rh [cos (р + Щ +1 sin (p + Щ]. Наша дальнейшая стратегия состоит в выборе 9 таким образом, чтобы bkzh было отрицательным действительным числом и г настоль- настолько малым, чтобы 11 4- bhZh \ < 1; затем, если необходимо, еще уменьшим г так, чтобы результат от сложения | bk+izh+i 4- ... 4- bnzn j и ( 1 —|— ?»AZfe ( оставался меньше 1. Итак, полагаем F) . e = -==i. Ft Тогда р + /гв = л и G) бА2*=-|Йк|Г*. Переходим к выбору г. Если k = n, то мы можем выбрать г= l/-J/~\bh\; тогда ^(г) = 0 и B) выполнено. (В случае n = k поли- полином g(|) имеет вид g (|) = й„|п 4-1, корнем которого, очевидно, п / р является I/ — именно его мы и берем.) Пусть теперь Если мы выберем г^1, то .. +Ьпгп| = г*+* |bft+j4-... (8) B«&p«i r <min Тогда Этим доказано B) и тем самым вся теорема. Основная теорема алгебры комплексных чисел. Комбинируя полученные результаты, приходим к доказательству нашей основ- основной теоремы. п 8.33. Теорема. Предположим, что /(?)€C[g], f (|)= 2 а$ и deg(/(l)) = n>0. Тогда (i) существует по крайней мере один комплексный корень f (|), т. е. некоторое г?С такое, что f(z) = O; {Y\)f{l) = an{l — zi)...{l-Zn) для некоторых ги .... гп^С.
8.2. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 355 Доказательство, (i). По 8.31 мы можем найти d 6 С с | / (d) | ^ | / (г) | для всех z 6 С. Тогда / (d) = 0, так как в против- противном случае в силу 8.32 мы можем найти некоторое z 6 С с | / (г) | < < | / (к) |. (И) доказываем индукцией по п с использованием 5.13. Эта теорема — один из блестящих вкладов Гаусса в математику (так же как в физику и астрономию). Сам Гаусс дал пять ее различ- различных доказательств, много других доказательств было предложено позже. Основным моментом в приведенном доказательстве является теорема 8.32 — частный случай общей теоремы комплексного анали- анализа, принадлежащей Вейерштрассу. Иногда можно услышать, что основная теорема алгебры не является ни «основной», ни «теоремой алгебры». Возможно, в этих замечаниях есть доля истины. Чем большее число важных результа- результатов следует из теоремы, тем больше оснований считать ее основной. С точки зрения современной алгебры нельзя сказать, что 8.33 более фундаментальна, чем другие результаты. Однако с точки зрения нашей работы ее значение первостепенно. Все наши усилия были связаны с попытками преодолеть алгебраическую неполноту число- числовых систем Р, I, Ra и Re, с каждой из которых мы успешно работали и каждая из которых в этом смысле давала нам некоторые преимуще- преимущества по сравнению с предыдущей. Теорема 8.33 в сущности может быть переформулирована следующим образом: в смысле рассмотре- рассмотрения корней полиномиальных уравнений С алгебраически полно. В этом смысле наша работа закончена и построение любой числовой систе- системы, более широкой, чем С, должно основываться на других сооб- соображениях. (Существует много таких расширений, представляющих интерес, однако они не попадают в рамки этой книги из-за природы соображений, по которым они вводятся.) С другой стороны, мы уви- увидим, что если нас интересует именно свойство алгебраической полно- полноты или замкнутости, то подходящим является уже определенное подполе С, именно поле Alg алгебраических комплексных чисел. Это понятие будет определено в следующем разделе путем очевидного обобщения 7.61. Построение С из Re алгебраично по своему духу, в то время кай построение Re из Ra — нет. О первом можно сказать, что оно про- производится формальным присоединением корня полинома ?2 + 1 к Re (смысл этой фразы будет точно определен в следующей главе). Однако построение Re из Ra включает в себя некоторые по суще- существу неалгебраические концепции: или использование сечений Дедекинда в Ra, или использование фундаментальных последова- последовательностей в Ra; а основной идеей является геометрически-аналити- геометрически-аналитическое понятие непрерывности. Более уточненное (по сравнению с нашим интуитивным представлением Re и С) рассмотрение позво- позволяет установить, что указанного понятия можно избежать, если ограничиться рассмотрением Alg. Такое утонченное рассмотрение достигается посредством общего исследования процесса формаль-
356 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА ного присоединения корней полинома к данным полям. Подобный процесс имеет первостепенное значение в современной алгебре, и мы обратимся к нему в следующей главе. Когда говорят, что основная теорема алгебры в действительности не является теоремой алгебры, подразумевают, в частности, что она относится к конкретному полю С и что ее доказательство не алге- алгебраическое. С этой точки зрения можно справедливо заметить, что она является «настоящей» теоремой комплексного анализа или даже «настоящей» теоремой топологии. Это не означает, что нельзя дать алгебраического доказательства этой теоремы. Одно из доказа- доказательств Гаусса, например, выдержано в духе современной алгебры. Доказательство, которое мы здесь привели, использует минимум сведений из анализа. Путем различных небольших изменений можно использовать их еще меньше, в частности, можно обойтись без использования тригонометрических функций. Однако это затруд- затрудняет доказательство, а к тому же отказ от тригонометрической формы означал бы также отказ от многих полезных результатов таких, как 8.20, 8.22 о корнях полинома g" — d. С другой стороны, мы хотим отметить, что дает нам более полное использование комплексного анализа. Как и в случае действитель- действительных чисел, естественно рассматривать функции F, определенные сю на С степенными рядами F (г) = У\ а^, где at 6 С. Вопросы схо- i=0 димости таких рядов в основном решаются так же, как в 7.41 для действительных степенных рядов. Так, если lim | ah+Jak \ = d ft-* 00 ОО существует, то 2 aiz% сходится для всех г, если d = 0, и сходится i=0 для всех z с | г | < lid, если d Ф 0. В последнем случае множество {г: | г | <г}, где г = lid, называется кругом сходимости; в первом случае говорят, что кругом сходимости является вся комплексная плоскость. Функции, определяемые степенными рядами, сходящи- сходящимися для всех z, называются целыми функциями; в частности, любая полиномиальная функция является целой. Функции, опре- - деляемые степенными рядами внутри их кругов сходимости, имеют много замечательных свойств, среди которых наиболее важные — непрерывность и существование всех производных. Такие функции называются аналитическими или голоморфными внутри их обла- областей определения. Примером целой функции является естественное продолжение ОО функции Е из 7.43 на С, задаваемое формулой Е (г) = 2 zhlk\. ^J ft=0 Сохраняя наши обозначения, будем по-прежнему писать ez вместо Е (z). В С продолжают выполняться многие свойства 7.45 функции Е для действительных чисел, например, е^-е*2 = ezi+z* для любых
8.2. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 357 i, z2 6 С. Далее, Zl A! ft=O Наконец, как будет показано в добавлении II, для любого дей- действительного у ft=O ft=O откуда e'w = cos у -\- \ sin у. Тогда ex+'y = ex -e'v = ex (cos у + + i sin у) (см. упражнение 13 к предыдущему разделу). Заметим, что из приведенных степенных разложений cos у и sin у свой- свойства 8.14 тригонометрических функций можно вывести с помощью самых элементарных фактов комплексного анализа. Возвратимся к нашей главной тематике. Назовем функцию F на С постоянной, если для некоторого комплексного числа с имеем F (г) = с для всех г. Тогда общая теорема Вейерштрасса, которую мы уже упоминали в связи с 8.32, будет выглядеть так: если F — целая функция, но не постоянная, и если F (d) ф 0, то существует г 6 С с | F (г) | < | F (d) |. Существует также г 6 С с | F (z) | > > | F (d) |, причем в обоих случаях г можно выбрать как угодно близко к d. Тесно связана с этим утверждением теорема Лиувилля, утверждающая, что ограниченная целая функция (| F (г) | ^ М для некоторого М и всех г) должна быть постоянной. На эти утверж- утверждения опирается другое доказательство основной теоремы алгебры: можно показать, что если f (|) не имеет корней, то функция \lf (г) целая; используя 8.30, можно доказать, что \lf (г) ограничена. Функция Е (г) = ez целая и не постоянная; отсюда по теореме Лиувилля ez не ограничена. Далее, ez = 0 не имеет решений, так как | ez | = | ex+iv | = ех Ф 0 вследствие 7.45. Спрашивается, поче- почему мы не можем вывести теорему типа 8.33 для целых функций, в частности, доказать, что ez = 0 для некоторого г ? С, поскольку 8.32 обобщается на любые целые функции? Причина лежит в раз- различии характера роста | F (г) | для полиномиальных функций и целых функций типа ez. В силу 8.30, если F (г) — полиномиальная функция, то | F (г) | должен расти без ограничения во всех направ- направлениях с возрастанием \ г \; модуль же | ez \ = е* возрастает без ограничения в некоторых направлениях, именно, для х возрастаю- возрастающего, но убывает в других, именно для х убывающего (и отрица- отрицательного). В общем, хотя для каждого конкретного г мы можем заключить из 8.28, что целая функция F достигает минимума при I z | ^ г, но без некоторого условия на характер роста \ F (z) | типа 8.30, мы не можем заключить, что F достигает абсолютного минимума, как это было сделано для полиномов в 8.31. А без такого
358 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА заключения невозможно использовать 8.32 для получения более общей теоремы о существовании нулей целых функций. О вычислении корней комплексных полиномов. Займемся вычисли- вычислительным аспектом основной теоремы алгебры. Как и в случае дей- действительных полиномов, естественно задаться вопросом, существует ли систематический метод вычисления с любой желаемой степенью точности хотя бы одного корня г полинома / (г) ? С [?]? Под этим мы понимаем вычисление с любой желаемой степенью точности неко- некоторых действительных чисел х, у таких, что х + \у является корнем f (?). Далее, существует ли аналог теоремы Штурма 7.60, который позволил бы нам определять точное число корней полинома f (?) на любом заданном куске комплексной плоскости и, следовательно, определять все корни с любой заданной степенью точности? Конеч- Конечно, достаточно иметь дело с весьма простыми кусками плоскости вроде квадратов или кругов. Доказательство нашей теоремы в этом смысле ближе к доказа- доказательству теоремы 7.50 существования минимума действительных функций,' чем к теореме Вейерштрасса об обращении в нуль. Дока- Доказательство последней дает нам метод прямого вычисления по край- крайней мере одного корня действительной функции, которая положи- положительна в одной точке и отрицательна в другой. С другой стороны, как мы уже замечали, в общем случае нет метода нахождения точки, в которой действительная функция достигает минимума на данном интервале la, b]. Однако, для полиномиальных функций f (x) такой метод существует. Действительно, в соответствии с упражнением 9 к п. 7.4, если f (х) принимает на интервале [а, Ь] минимальное зна- значение в точке х = с, то или f (с) = 0, или с — а, или с = Ь. Все корни с полинома f (?) определяются последовательным приме- применением теоремы Штурма, а тогда минимум может быть найден сравнением f (a), f (b) и различных значений / (с). К сожалению, нет простых путей распространения этого метода на комплексные числа. Можно было бы надеяться, что каждый полином f (I) с действительными или комплексными коэффициента- коэффициентами удастся разбить на действительную и комплексную части и затем как-то исследовать. Такое представление возможно: f (х + \у) = = ё (х> У) + \h (x, у), где g, h — некоторые полиномы от двух переменных с действительными коэффициентами. Задачу нахожде- нахождения корня f (|) можно рассматривать либо как 1) задачу нахожде- нахождения пары (х, у), для которой I f (х + \у) | или, эквивалентно, \ f (х + \у) |2 = g2 (х, у) + /г2 (х, у) достигает минимума, либо как 2) задачу нахождения пары (х, у) такой, что^ (х, у) — 0 и h (x, у) = = 0. В каждом случае мы имеем, однако, значительно более слож- сложную ситуацию, чем для действительных полиномов от одной пере- переменной. Существует алгоритм вычисления с любой степенью точности всех корней полинома / A) ? С Ц], коэффициенты которого сами
8.2. ПОЛИНОМЫ И НЕПРЕРЫВНЫЕ ФУНКЦИИ 359 могут быть вычислены с любой степенью точности; этот алгоритм выводится из весьма тонких результатов анализа. Он основывается на понятии комплексного интегрирования и на следующей теореме: если 5 — простая замкнутая кривая, то A/2яО I (f(z)lf(z)) dz равно числу корней f (x) внутри S, причем каждый из корней счи- считается столько раз, какова его кратность; при этом кривая S должна быть такой, что / (г) Ф О для всех z на S. В общем случае, чтобы обеспечить применение алгоритма, необходимо интегрирование заменить приближенным интегрированием. Одна из трудностей при этом методе состоит в следующем. Если deg (J (г)) = п и / (I) имеет п различных корней, то вычислительная процедура позво- позволяет их все в конце концов выделить. Однако, если имеются кратные корни, то данная процедура этого нам не покажет и на любой ста- стадии процесса мы не можем быть уверены, имеем ли дело с кратным корнем или с двумя корнями, очень близкими друг к другу. Поэтому предпочтительно вместо f (?) иметь дело с /ч (?), определенным в 6.39, который имеет те же корни, что и / (?), но все корни fx (?) просты. С другой стороны, с помощью тонкого алгебраического анализа Тарский показал, что метод Штурма распространяется на полиномы с действительными коэффициентами от нескольких переменных. В частности, если g Ци |2), h (?ь ?2) — два таких полинома, Тар- Тарский строит эффективную процедуру вычисления точного числа пар (х, у), удовлетворяющих условиям g (х, у) = 0, h (x, у) = О, a <i х ^ Ь, а! ^ у ^ Ь', состоящую в определенных вычислениях над а, Ъ, а', Ь' и коэффициентами полиномов g (?ь |2) и h (?ь |2)- Эти вычисления могут с успехом производиться, если все эти числа рациональные или даже алгебраические. Поэтому метод Тарского позволяет нам определить, сколько корней (и какой кратности) имеет данный полином f (?) с алгебраическими коэффи- коэффициентами внутри данной (алгебраически определенной) области комплексной плоскости, и затем вычислить эти корни с любой желае- желаемой степенью точности. В обоих случаях не только теоретическое обоснование, но и сами процедуры крайне сложны и поэтому в рамках этой книги нет возможности описать их. Разложение действительных полиномов. Теперь возвратимся к основной линии нашего исследования и рассмотрим алгебраиче- алгебраические следствия основной теоремы. Они будут занимать наше внима- внимание в следующем разделе и в следующей главе. Этот раздел мы закончим прямым следствием, полностью разрешающим вопрос о строении полиномов с действительными коэффициентами. Дока- Доказательство мы предоставляем читателю. 8.34. Теорема. Предположим, что f E) ? Re [Ц и deg (/ {I)) = п, п > 0. Тогда
360 ГЛ. 8, КОМПЛЕКСНЫЕ ЧИСЛА (i) существуют k, I (Е I с 0 ^ I ^ n, 2k + / = п и a, bit ... . . ., bh, Си . . ., ch, di, . . ., dt ? Re такие, что для каждого i = 1, . . ., k имеем b\ — 4сг < 0 и f® = a (V + Ь? + й) • • • (I2 + bhl + ch) (I - rf.) •••(?- rfO; (ii) / (|) является простым в Re [^] тогда и только тогда, когда п = 1 или п = 2 и f (%) не имеет действительных корней; (Hi) представление (i) единственно с точностью до порядка сомножителей. Доказанная теорема очень полезна в интегральном исчислении. На ней основано, например, интегрирование рациональных функ- функций, т. е. отношений полиномиальных функций. Первым шагом для интегрирования таких функций является разложение на множите- множители (i) обоих полиномов — числителя и знаменателя. Дальнейшее приведение (метод «элементарных дробей») в общем виде было опи- описано в упражнении 12 к п. 6.4. Если такой метод применить к кон- конкретному случаю рациональных форм р в Re [\], то получим, что каждое такое р может быть выражено суммой полинома в Re [?l и членов одного из двух видов: (Oil + а2)/(? + Ы + с)т или al{l — d)m, где все коэффициенты действительные. Интегрирование же соответ- соответствующих функций затруднений не представляет. Упражнения 1. Обобщить понятие фундаментальной последовательности G.22) на комплексные числа и доказать обобщения теорем 7.23, 7.27, выражающих кри- критерий Коши сходимости последовательности. 2. Доказать 8.27 (v). 3. Является ли любая из функций F, определенных следующими усло- условиями, непрерывной на С? Докажите ваше утверждение. (а) F (г) = х, где z = х + \у\ (б) F @) = 0 и если г^О, то F (г) = 6, где z = r (cos 6 + i sin 0), г > 0, 0 < 9 < 2зт^ (в) F (г) = Уг. 4. Доказать теорему 8.34 (i) — (Hi). 5. (а) Найти все комплексные корни полинома ?4 — ?2 + 1. Найти его разложение над Re, как в 8.34 (i). 7 (б) Проделать то же самое с полиномом / (В) = ^ ?'¦ [Указание. г=о Корнями / (?) будут корни восьмой степени из единицы, отличные от 1.] 6. Найти разложение 1/(|4 — I2 + 1) в Re [?], как это описано в конце раздела. 8.3. Корни комплексных полиномов Корни полиномов над подполем. Рассмотрим более общую ситуа- ситуацию. Пусть К будет подполем поля С. Мы хотим найти условия, при которых каждый полином над {( имеет корень в /С (и, следова- следовательно, как и в 8.33, полностью разлагается на линейные полиномы
8.3. КОРНИ КОМПЛЕКСНЫХ ПОЛИНОМОВ 361 над К)- С этой целью любому К ставим в соответствие множество всех корней полиномов над К- 8.35. Определение. Предположим, что К — подполе С. (i) Если г g С, то мы говорим,\ что г алгебраическое над К, если для некоторого f (?) ? К Ш мы имеем f (!) ф О и f (г) = 0. Множество всех элементов, алгебраических над К, обо- обозначаем Alg (К)- В частности, мы полагаем' Alg = Alg (Ra) и гово- говорим, что z алгебраическое, если z?Alg. (ii) Мы говорим, что К алгебраически замкну- т о, если для каждого f (I) ? К Ш с deg (/ (?)) > 0 мы имеем / (г) = 0 для некоторого г ? К- Заметим, что множество алгебраических действительных чисел, определенное в 7.61, есть просто множество Alg f| Re. Следующая теорема является другой формулировкой части (i) основной тео- теоремы 8.33. Следующая за ней теорема 8.37 перечисляет элемен- элементарные следствия предыдущего определения. 8.36. Теорема. С алгебраически замкнуто. 8.37. Теорема. Предположим, что К — любое подполе С Тогда: (i) К S Alg (К) = С; п (ii) если К алгебраически замкнуто и /(?)= 2 atV €/C[?]> г=0 где deg (/(?)) = «> 0, то /(?) = an(| — zt) ... (? — zn) «Зля некото- некоторых Zj, ..., zn ? /С; (iii) /С алгебраически замкнуто тогда и только тогда, когда Alg (К) <= К- Доказательство мы предоставляем читателю; заметим, что алгеб- алгебраическая замкнутость С существенна только в доказательстве (iii). Можно показать, что если /С счетно, то и Alg (К) счетно; доказы- доказывается это в точности так же, как и в 7.70. В общем случае можно показать, что К ~ Alg (К). Алгебраически замкнутые подполя. Мы уже неоднократно заме- замечали, что множество алгебраических чисел удовлетворяет всем желаемым свойствам поля комплексных чисел. Это точно сформули- сформулировано в следующей важной общей теореме. 8.38. Теорема. Предположим, что К. — любое подполе С. Тогда: (i) Alg (К) — также подполе С; (ii) Alg (К) алгебраически замкнуто. Доказательство. Пусть А = Alg (К). Как мы видели в п. 6.1, для доказательства того, что А — подполе С, достаточно показать, что 1 ? А и A) если z, w ? А, то z + w?A, z-w^A и г^ Л, если
362 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА Для данных z, w мы можем найти полиномы f (?), g (?) 6 К Ш такие, что deg (/ (?)) = п > 0, deg (g (Q) = т > 0 и /(z) = 0, () 0 g() Проще всего доказать, что z~x^A, если гфО. Пусть /(?) = =flo + fltg + ... + ап?", где все at ? /С; тогда ao + axz+ ...+ anzn=0, откуда а0(z 1)n -f- ах(г)™ + ... +ап = 0 и z'1 является корнем п полинома 2 an-iV- »=о Теперь докажем, что z + w ? А. Без потери общности, можно предположить, что старшие коэффициенты у f (^), ,§¦(?) равны 1. Отсюда, вследствие 8.33 (и), мы можем найти гь . . ., гп, wit . . . . ., wm ? С такие, что B) .г = ги w = wu f {%) = (I - г,) • • • A - zn) и g Ш = = {I — Wi) •••(!— юга). Нам нужен полином с коэффициентами в К, у которого есть корень Zi -)* Ш). Вообще, мы можем надеяться построить полином с коэф- коэффициентами в /С такой, что для i = 1, . . ., п, j = 1, . . ., т каждое г, + Щ являлось бы его корнем. Простейшим таким поли- полиномом является n m C) A(g)=JI ПК-(г« + ^I- t=i j=i Мы хотим показать, что h (I) ? /С [?]. Сначала заметим, что для любого i т т П [?-Bi + «v)]= П [E-zi)-^J = «(S-Zi). j=i 3=1 Отсюда D) Mi)= EU(t-*.). i=l Очевидно, любое изменение порядка г2 не оказывает влияние на значение h (?). Это напоминает основную теорему 5.29 о симметри- симметрических полиномах. Чтобы сделать возможным применение 5.29, рассматриваем полиномы в п + 1-кратном трансцендентном рас- расширении К II, ?ь • • •, ?J поля К- Мы хотим рассматривать п элемент {[ g (I — 10 из К И, ii. • • •, U как полином от |ъ ... i=i . . ., 1п с коэффициентами в /С Ш. В силу 5.19 это возможно. Пола- Полагаем D = КШ и тогда D Ци . . ., %п] = К И, It, ¦ ¦ ¦, U- В D Hi, . . ., ln] существует полином р (§t, . . ., |„) такой, что E)
8.3. КОРНИ КОМПЛЕКСНЫХ ПОЛИНОМОВ 363 Очевидно, F) р (?ь . • ., ?п) симметричен относительно gt, . . ., ?„ над D = К Ш- Отсюда вследствие 5.29 можно найти q (gi, . . ., Ъ,п) ? D [g1( . . . . . ., %п] такой, что G) р (g1( . . ., ln) = q (oi (g1( . . ., ln), . . ., an (gt !„)), где ot (gb . . ., Z,n)> i — h • • •> ti,— элементарные симметри- симметрические полиномы от п переменных. Поэтому, возвратившись к /<"[?, ii, • . ., %nh можно найти полином г, для которого (8) г а, ъ,..., у е к и, Еь..., и, р (Si, • •., и = = г (|, at (|ь . . ., ?п), . . ., ап Aи . . ., У). Теперь вследствие D), E), G), (8) имеем h{t) — р (гь . • ., zn) и тогда (9) h (I) = г (I, 04 (zi, . . ., zn) ап (zb . . ., zn)). Вспоминая связь между корнями, коэффициентами и ait указанную в 5.28 (i), имеем, с другой стороны, ftt)=a-zi)...a-zn)=j](-i)n-ion-i(z1,...,zn)ti. Поскольку f (I) ? К Ш, получаем A0) at (Zi zn) 6 К для каждого i = 1, . . ., п. Пусть at (zi, . . ., zn) = ct\ тогда мы видим, что h (?) = г (?, й, • • ., О» откуда A1) А(Е)€/С[Е1. Возвращаясь к C), видим, что z + w ? А, поскольку h (z + w) = 0. Доказательство того, что z—w?A, получается небольшим изме- изменением предыдущего или из того, что если z?A, то —z?A, п п поскольку 2 (— l)laf(—г)г = 0 всегда, когда ^aiZl = 0. i=0 i=0 Доказательство z -w G А мы предоставляем читателю. Этим доказательство A) закончено, и мы теперь знаем, что А образует подполе С. Для доказательства алгебраической замкнутости А достаточно, ввиду 8.37 (ш), показать, что Alg(A)^A, т.е. что A2) если f(%)€A [g], / (g) Ф 0 и f (z) = 0, то г ? А. ¦сть / (|) = w0 + Wil + • • • + wnln, где wn ф 0, п > 0, кал 6 Л. Для каждого t = 0 п существует полином A3) g, Ш = /С Ig], deg (gt (g)) = тг > 0, ft (да,) = 0,
364 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА причем можно считать, что все gt нормированы. В силу основной теоремы алгебры для каждого i = 0, . . ., п существуют такие числа wit 1, . . ., wt, т., что A4) wt,ц..., Wi,mi(iС, Wi = Wi,i и gi(l) = (l — witl)... Мы хотим найти полином h (?) 6 ^С Ш, для которого 2 является корнем; подойдет, например, любой полином h (Q ? /С [?], для которого / (i) I ft (?). Рассмотрение симметрических полиномов под- подсказывает идею поиска h (i) в виде произведения полиномов вида f (i), где коэффициенты заменены всевозможными комбинациями wt, j, т. е. т0 mi mn АF)= П П ... [] (wOth + wlihl+...+wn,jnln). io=l ii=i jn=--l доказать симметричность построенного полинома. Рас- Рассмотрим (mp-mj-...-т„)-кратное трансцендентное расширение, которое получается, если положить ZJ = Z)j [|4> !, . . . , |iF mi]» • • •» Dn+i = Dn [^n, i, • • -,<in, mn]- В Dn+1 существует элемент A6) P(?o,i> •••. in,mn) = mo mi m« = 11 П • • • II do. iO+li, hl+ ¦¦¦ + S». Э„Г). 30=1 jl=l jn=l Тогда A7) h(l) = p(wo,1, ..., wn>mn). Воспользуемся теперь основной теоремой о симметрических поли- полиномах. Рассматривая р Aд, t, . .., |„, тп) как элемент Dn [|„, 1; ... • ••>in,7nn]> B силу A6) видим, что р симметричен относительно in,I» •••»in,mn- Следовательно, он может быть выражен как полином над Dn от элементарных симметрических полиномов <*i(ln,i, ¦¦¦Лп.тп) степени тп. Но значения <r*(a>n>1, ...,wn,mn) принадлежат К, поскольку сами полиномы в силу 5.28 (i) опре- определяются коэффициентами полиномов gn (i). Отсюда р (|Oi l5 ... .. ., in-i, mn-i, ьуп, i, • • •, оУп, mn) G^n- Теперь мы рассматриваем его как элемент Dn_x Цп-и1, ..., in-i, mn-il и снова вследствие A6) видим, что он симметричен относительно |n-i,ц • • •» in-i, mn-i- Отсюда из тех же соображений, что и прежде, p(gOil, ...,
8.3. КОРНИ КОМПЛЕКСНЫХ ПОЛИНОМОВ 365 • • •, gn-2, mn-2,wn-i,i, ¦ ¦ -, Wn-1, mn-n wn, 1, . ..,Wn, mn)(:Aw ПОВТО- ряя эту процедуру еще п — 1 раз, видим, что р (w0,1? ...,wn mn) ? € А, = /П?]. Отсюда A(g)G/C[g] в силу A7). Для иллюстрации первой части доказательства покажем, напри- например, что У 3 + ^2 ? Alg. Мы знаем, что Уз, у^2 ? Alg, поскольку они являются соответственно корнями полиномов ga— 3, g3 — 2. Мы можем написать g2 — 3 = (g — z^g — z2), где г1 — У'3,г2=—Уз и |3 —_2 = (g — шО (| — ш2) (| — ш3), где wx = Y2, aJ = $/2?, w3 = l^2t,2, a ? = cos2jt/3-f- i sin2jt/3 (8.22). Следуя первой части доказательства предыдущей теоремы, полагаем h (Б) = (? - (Zl + a,t)) (I - (z, 4- а^)) (I - (Zl + и»3)) X X {I - (г2 + юО) (S - (za + w2)) (| - (za = [(?-z1K-2][(?-z2K-2] = = (| - 2lK (S - г2K - 2 [(g - zt)» + (g - Za)»l + 4. Ho (I - г,K (| - zzf = [(I - Zl) (g - Za)]» = (|2 - 3K, a (g - z,f + (g - г2K = 2|3 - 3^2 (Zl + z2) + 31 (zl + zl) - поскольку Zi~\-z2 = 0 и г\-{-г\ = зУз — 3]/"з = 0. Согласно общей теореме, полином h(l) = (|2 — ЗK — 2[2|3+ 18|] + 4 = |в — 9|4 — — 4|3+27|2 — 36| —23 должен иметь корнем У3-^-^2, что может быть проверено и прямым вычислением. Заметим, что если мы применим доказательство к нахождению полинома для %/~2-\- Уз, то результат получится тот же, но вычисления будут сложнее, поскольку нам придется иметь дело с симметрическими функциями от трех переменных. Для иллюстрации второй части доказательства рассмотрим процесс нахождения ненулевого полинома ft(?)?Ra[|], имеющего общий корень с полиномом / (g) = |2 + ]/~2 g + УЪ. Фактически найденное в доказательстве h (g) удовлетворяет условию / (g) | h (g) т/2 _(_ У о 4 Т/з и потому h (g) имеет корнями —:=-7> v-—, т. е. оба корня полинома /(g). Следуя доказательству теоремы, сначала находим полиномы gt (g) на Ra, корнями которых являются коэффициенты ¦шо = Уз, w± = y2 и ш2= 1. Такими полиномами будут go(g) = = g2 —3, gi(g) = g2 — 2 и g2(g) = g —1. В обозначениях, принятых в доказательстве теоремы, то — 2, ttit — 2, m2 = l и w0<, = j/,
366 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА ^о,2=— V, ш)и1 = У2, wU2= —У2, ш2>1=1. Тогда = (I4 - 2|2J- З!2 [(! - /2J + (| + /2J] + 9 = Полином /г(!) имеет восемь корней, задаваемых всеми возможными комбинациями знаков в (± У2 ± У2 ± 4 V^)^. К более интенсивному изучению алгебраически замкнутого поля Alg и его подполей мы возвратимся в следующей главе. Кратные корни, дискриминанты. В качестве второго результа- результата, касающегося корней комплексных полиномов, мы хотим по- построить алгоритм, позволяющий определить, имеет ли данный полином / (!) ? С [|] кратные корни, т. е. существует ли z ? С такое, что (| — гJ \ f (!). Один такой алгоритм предлагается теоре- теоремой 6.39. Если d (!) = (f (I), f (l)) и Л (g) = f (l)ld (l), то мы знаем, что ft (!) имеет те же самые комплексные корни, что и / (?), причем все его корни простые. Из того, что старший коэффициент d (I) выбран равным 1, a f (!) и d (!) по основной теореме алгебры полностью разлагаются на линейные множители, мы видим, что / имеет простые корни тогда и только тогда, когда f (!) = ft (!), т. е. d (!) = 1. Отсюда (непостоянный) полином f (!) имеет кратный корень тогда и только тогда, когда (/(!), /'(!)) Ф 1. Алгоритм Евклида поэтому дает нам метод вычисления этого н. о. д. по коэф- коэффициентам / (!) конечным числом шагов с использованием только основных рациональных операций. Следовательно, он дает нам искомый метод определения, имеет ли / (!) кратные корни или не имеет. Мы хотим построить другой алгоритм, основанный на рассмо- рассмотрении симметрических полиномов. Мы видим, что данный норми- нормированный многочлен / (!) степени п с комплексными корнями zit . . ., гп имеет кратные корни в том и только в том случае, когда [J (zt — Zj) = 0. Это произведение не инвариантно относи- ?i<i? тельно всех перестановок, но инвариантен его квадрат. 8.39. Определение. Предположим, что /(!)! deg(/F)) = «>0 и fF) = №-*i) ••• (S-zn). Под дискрими- дискриминантом полинома /(!), обозначаемым Dis(/(!)), мы пони- понимаем ЧиСЛО [J i S<7? 8.40. Теорема. Для каждого «>0 существует полином i, ..., !n)€I [!i, •••,!n] от п переменных с целыми коэффи-
8.3. КОРНИ КОМПЛЕКСНЫХ ПОЛИНОМОВ 367 циентами такой, что для любого нормированного f п «з f(l)= ^Ьп-?(Ь0=1) следует Dis(/(g)) = rf(&1> ...,bn). i=0 Доказательство. Полином g(?,u ..., gn) = П (i« —i^)* с целыми коэффициентами, очевидно, симметричен относительно Zi, ..., in- В силу основной теоремы 5.29 о симметрических поли- полиномах мы можем найти полином  \Si> • • •» ёп/ fci'Si. •••» SnJ такой, что g (ii. • • •, D = di (oi (ii, • • •, sj, • • •, orn (gj gj). Тогда вследствие 5.28 (i) Dis (f (g)) = ? (Zl zj = = di (cti (zi zn), . . ., on (zu . . ., zn)) = = di (-bu b2, . . ., (~\Tbn). Поэтому получим желаемый результат, если Поскольку доказательство 5.29 дает нам алгоритм построения полинома d (|1? . . ., in), предыдущая теорема дает нам алгоритм вычисления дискриминанта полинома через его коэффициенты и, следовательно, отвечает на вопрос, имеет ли он кратные корни. Если d (g) — нормированный полином второй степени, f (g) = = (i — zi) (i — z2) = i2 + bi% + b2, то bi = —(zi + z2), b2 = = Z!22 И Dis (/ (g)) = (Zl — z2f = z\ + z\ — 2z4z2 = = (zi + z2y — 4ZiZ2 = b\ — 4&2. В общем случае для определения кратности корней / (?).= а|2 + + bg + с (а Ф 0) мы вычисляем дискриминант полинома /i (|) = = ia + (bid) i + с/а, который по предыдущему равен (Ь2 — 4ас)/а2. Это согласуется с прямым вычислением 8.11 корней /(?): Вспомним, что согласно 8.8 (ш), если а, Ь, с — действительные числа, то или оба корня zu z2 полинома / (i) действительны в случае Dis (/ (I)) ^ 0 или корни Zi, z2 — комплексно сопряженные, скажем zi = х + \у, z2 = х — \у, у Ф 0, в случае Dis (/ (?)) <0. Поэтому, вычисляя дискриминант, мы также можем сказать, что данный действительный полином второй степени имеет два различных действительных корня, один кратный корень или два различ- различных комплексных (сопряженных) корня, если соответственно Dis (f (g)) > 0, Dis (/ (g)) = 0 или Dis (/ (g)) <0.
368 ГЛ. 8, КОМПЛЕКСНЫЕ ЧИСЛА Если / (?) — кубический полином, / ш = а - zt) а - га) а - ч) = 1з + ь& + ь2г + ь3, то bi = —(Zj + Z2 + Z3), 62 = ZiZ2 ¦+¦ ZiZ3 + Z2Z3, b3 = — ZiZ2Z3. Уже в этом случае вычисление дискриминанта становится несколь- несколько затруднительным. Обращаясь к упражнению 7 (п. 5.2), мы нахо- находим, что (?i - У2 (Si - Ы2 Aг - Ы2 = ojo* - 4а82 - 4ojtr8 - 27аа3 + 18а,а2а3, откуда Для полиномов четвертой и более степеней вычисления становятся еще более сложными. Иногда полезна в этом смысле следующая тейрема, доказательство которой предоставляется читателю. 8.41. Теорема. Предположим, что я>2, /(S)?C[|], /(?) = п = 2 Ьп-?г и Ьо—1. Тогда, для некоторых с2, ..., сп, i=0 п-2 i=0 Если мы положим то Dis (/ (I)) = Dis (g (I)). Последнее утверждение выполняется потому, что f (|) имеет корень z в том и только в том случае, когда z + (bjn) является кор- корнем g (^) = f (I — bjn). Поэтому нам достаточно ограничиться рассмотрением полиномов / (^) вида ln + c2ln~2 + • • • + сп. Из сказанного выше немедленно получается 8.42. Теорема. Для f Ц) = I3 + pi + q 6 С [|] илеел Dis (/ (g)) = -4р3 - 27^. Естественно предположить, что, как и в случае квадратичных полиномов, дискриминант кубического полинома дает нам информа- информацию относительно того, действительны ли его корни или нет. Эта информация объединена в следующей теореме. 8.43. Теорема. Предположим, что f (?) 6 Re [?] — норми- нормированный полином третьей степени, f (?) = (| — zt) (? — z2) (I—zs), и пусть d = Dis (/ (l)). Тогда d действительно и
8.3. КОРНИ КОМПЛЕКСНЫХ ПОЛИНОМОВ 369 (i) d > 0 тогда и только тогда, когда zit z2, z3 действительны и все различны; (ii) d — О тогда и только тогда, когда zit z2, z3 действительны, но не все различны; (iii) d <0 тогда и только тогда, когда один из zit z2, z3 действи- действителен, а оставшиеся два комплексно сопряжены. Д о к а з а т е л ь с т в о. Из того, что d = (zt — z2J {z\ — z3J X X (z2 — z3J, мы видим, что d = 0 в том и только в том случае, когда два корня полинома равны; отсюда следует (ii). Предположим, что d =/= 0. Поскольку коэффициенты / (|) действительны, f (fe) вместе с каждым корнем z содержит и корень г; г = z в том и только в том случае, когда корень z действителен. Предположим, что / (?) имеет комплексный корень, скажем г4 = х + i#> у ф 0. Тогда z должен быть каким-то другим его корнем, скажем z2 = х — \у. Но, согласно общей теореме 7.54 о корнях полиномов нечетной степени, полином f (X) должен иметь по крайней мере один действительный корень. Поэтому г3 действителен. (Это можно показать также с помощью разложения 8.34). Поэтому в данном случае d - B\уJ 1(х - z3) + \у? 1(х - z8) - iyV = Очевидно, если d Ф 0 и zb z2, z3 действительные, то d > 0. Из этих фактов мы можем установить эквивалентности (i) — (iii). Даже после упрощения, даваемого теоремой 8.41, вычисление Dis (/ (I)) для полинома f (|) четвертой степени, f (?) = I4 + р%2 + -f- q% + '', остается очень сложным. В этом случае мы получаем Dis (/ (I)) = 16pV — 4/?У — 128/rV2 + 144WV — 27^ + 256г3. Приводить здесь детальную проверку этого результата нам нет смысла. Для действительных полиномов четвертой степени также может быть установлена теорема, аналогичная 8.43. Однако здесь в каждом из случаев возможностей для корней будет больше. В 8.11 мы получили общее представление комплексных кор- корней произвольного полинома второй степени через его коэффициенты и могли бы надеяться получить для полиномов третьей и более степеней представления их корней такого же вида. Далее, как и в случае формулы решения квадратного уравнения, мы могли бы надеяться, что такие представления могут быть заданы с помощью рациональных операций +, —, •, -1 и операций извлечения корней п-й степени из комплексных чисел для различных п ? I. Если мы можем найти такое представление хотя бы для одного корня f (?), то говорят, что уравнение f (z) = 0 разрешимо в радикалах. Эта проблема описания корней уравнений высших степеней занимала умы лучших математиков с начала XVI века. Метод решения квадратных уравнений (по крайней мере в геометрическом
370 ГЛ- 8. КОМПЛЕКСНЫЕ ЧИСЛА виде) был известен еще из работ ранних индийских и грече- греческих математиков. Интересен раздел истории математики, касаю- касающийся открытия общего метода решения кубического уравнения. Сначала это сделал Ферро, который, как часто тогда делалось, дер- держал решение в секрете тридцать лет. Затем снова, независимо от него, решение было найдено Тарталья. Математик (и, между прочим, врач) Кардан узнал детали решения от Тарталья, пообещав хранить секрет. Но затем Кардан опубликовал решение в качестве своего собственного в его Ars Magna. Столь же неблагородно поступил он и с работой своего студента Феррари, который первым нашел решение общего уравнения четвертой степени в радикалах. Вот почему случилось так, что решения уравнений третьей и четвертой степени зачастую называют формулами Кардана. Справедливости ради следует отметить, и это в какой-то степени оправдывает увеко- увековечение его имени, что Кардан внес большой вклад в изучение кор- корней полиномиальных уравнений, в частности, в изучение связей между корнями и в вопрос об определении числа корней; он показал та"кже необходимость использования комплексных чисел даже при описании корней действительных полиномов. (Мы вернемся к исто- истории также в конце этого раздела.) Корни кубического уравнения. Теперь мы хотим описать решение в радикалах, найденное для общего кубического уравнения. Ввиду 8.41 для этого достаточно найти решение уравнения (8.3.1) f(z) = 0, где f (?) = ? + pi + q, p, q € С. Если /? = 0, то корнями z3 полинома \s-\-q будут три кубических корня из — q, именно y^ — q, ?,y^—q, Zfy^—q, где ? = = cos -^--)- i sin -^ (эти корни различны, если q=/=0). Предполо- О О жим теперь, что рфО. История изучения кубических уравнений показывает, что реше- решение должно быть найдено с помощью далеко не тривиального рас- рассуждения. И действительно, следующий шаг трудно предвидеть заранее: мы ищем корни уравнения (8.3.1) в таком виде: (8.3.2) Zz=w~?s ' где W^C Если / (z) = 0, то мы можем найти хотя бы одно такое w из уравне- уравнения хюг — zw — 4- = 0; далее, w Ф 0, поскольку в противном О случае р = 0. Для любого такого w прямой подстановкой в (8.3.1) получаем (8.3.3) w^—^ + q = 0, или, эквивалентно, (w3J + q (wa) — pa/27 = 0. Положим (8.3.4) и = w3.
8.3. КОРНИ КОМПЛЕКСНЫХ ПОЛИНОМОВ 371 Тогда (8.3.5) иа + <7«—g- = 0. Продолжая формальным образом, выписываем одно из решений последнего уравнения: 4 ] 27 ' где У в этом случае обозначает только один из двух квадратных корней. Тогда где у/~ обозначает один из трех кубических корней. Итак, мы доказали, что из /(z) = 0 следует, что существует такое w (определяемое формулой (8.3.6) при некотором выборе значений у и У), которое удовлетворяет (8.3.2). Убедимся теперь в обратном: что хотя бы одно из шести чисел w, опреде- определяемых формулой (8.3.6), является решением уравнения (8.3.1). Действительно, полагая u = w3, получаем «- -*+/?+&• т. е. и удовлетворяет (8.3.5) вне зависимости от выбора yf. Из р Ф О следует и ф О, а потому также w Ф 0. Тогда, согласно (8.3.3) и (8.3.5), получаем, что z = w — p/3w является корнем f (?). Дру- Другими словами, вне зависимости от выбора значений /и/в (8.3.6) мы получаем в силу (8.3.2) решение z уравнения (8.3.1) из (8.3.2) и (8.3.6). Следовательно, мы имеем полное описание всех возможных корней / (?). Теперь небольшое затруднение состоит в том, как по шести чис- числам, заданным в (8.3.6), нам выбрать три числа гь z2, z3 такие, что Этот вопрос решается следующим образом. Пусть ?+?. «'=-!-/?+ 27 где теперь VФ1^ + Р3/27 выбрано как главный квадратный корень в соответствии с 8.10 или 8.21. Тогда ии' = — ра/27. Теперь пусть у^и будет главным кубическим корнем из и. По 8.22 остальными кубическими корнями из и будут t,y~u и ?2 у^и, где ? = cos -5- + I sin-»—примитивный кубический корень из о О
372 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА единицы. Полагаем wi = y/ji, w2 = tiy/ru, хюъ—Ъ2^Ъ и w'1 = y w't = Zj/IT', w3 = t2y^W. Тогда {wvw[f = uu'= -р3/27. Из (— p/3K = —/r727 следует, что — p/3 равно или t^-^, или ?@^-0^), или ^2(ayrffi'i). Предположим первое. Тогда /> 1 pi,, 1 3 e'j За»!1 В этом случае также w2w's = (Z,w±) (^w[) = хю$в)'г = — p/3 и _p_ j_ p_ _l_ ,. аналогично w —?..±=—?..±.+11/ Другими словами, если мы положим г. = а). ?_ 2;=^__?_ ТО \zt, z2, z3/ = {zlt z2, z3j, причем, конечно, порядок соблюдается необязательно. Можно про- проверить, что это же заключение выполняется и тогда, когда р/3 равно ? fe'j, а^) или ?2 (wiw[). Мы видим, что г является корнем /(?) в том и только в том случае, когда оно равно одному из чисел гь z2, z3, z[, z'2, z'3; следовательно, z является корнем / (?) в том и только в том случае, когда оно равно одному из гь z2, zs или, что эквива- эквивалентно, одному из z[, z'2, z3. Вспомним, что в силу 8.42 дискриминант |3 + pi + Я есть —4р3 — 27<72 = —108 (q'/i + p3/27). Это позволяет нам объеди- объединить приведенные выше рассуждения в следующем виде. 8.44. Теорема. Предположим, что f (?) = |3 -j- p| + q, / (S) € С [1], рфО. Пусть, далее, d = Dis (f (t,)) = — 4p3 — 27g2 и и — одно из комплексных чисел —q/2 + 1^ — d/]08. Пусть, ¦г 2я , . . 2я з/- «. з/— ,-, з/- наконец, ? = cos-^—Ь i sm —=- и w^ — y и, щ = с,у и, Wn — c,2^/ и. Тогда и, а также все wt отличны от 0 и /(?) = (? — z{) (| — z2)x Х(| — z3), где zi^wt — pl3wt для t=l, 2, 3. Корни общего кубического полинома ?3 + Ь&2 + &2| -f- b3 могут быть найдены из этой теоремы с помощью преобразования 8.41. Рассмотрим частный случай, когда коэффициенты этого поли- полинома действительные. Тогда полином f (g) = g2 + р\ + q, опреде- определенный по нему в 8.41, также имеет действительные коэффициен- коэффициенты р, q. Из 8.43 мы знаем, как в этом случае классифицировать его корни в зависимости от d > 0, d = 0 или d <0. Приведенное выше
8.3 КОРНИ КОМПЛЕКСНЫХ ПОЛИНОМОВ 373 решение имеет удивительное свойство: даже в случае, когда / (!) имеет три различных действительных корня, мы имеем d > О и в представлении корней полинома используются кубические кор- корни из комплексных чисел —ql2 -f- У—d/108. В течение долгого времени это считалось недостатком метода решения. Однако даль- дальнейшие алгебраические исследования показали, что такая ситуа- ситуация неизбежна. Можно показать, что в общем случае невозможно представить любой из корней действительного кубического поли- полинома с положительным дискриминантом посредством рациональ- рациональных операций и операции извлечения действительных корней п-й сте- степени из действительных чисел для любого п. (Это и есть догадка Кардано, на которую мы указывали ранее). Точная формулировка и доказательство этого результата включают в себя некоторые более глубокие алгебраические рассмотрения, выходящие за рамки нашей книги. Корни уравнений четвертой степени. Дальнейшие рассуждения помогут яснее представить себе, что понимается под разрешимостью уравнения в радикалах (точное определение общего понятия будет дано в конце следующей главы). Посмотрим, не вдаваясь в детали, как может быть решено в радикалах произвольное полиномиальное уравнение четвертой степени над С. Снова достаточно рассмотреть уравнение (8.3.7) / (г) = 0, где f (!) = g« + р? + ql + г, р, q, r 6 С. Если г = 0, то корнями / (!) будут z = 0 и корни кубического поли- полинома !3 + /?! + q, который мы можем решить согласно 8.44. Поэто- Поэтому предполагаем, что г Ф 0. Если q = 0, то / (!) = I* + /?!2 + г можно рассматривать как квадратный полином от !2 и его корни легко находятся. Поэтому полагаем также, что q^^O.'B качестве промежуточного шага к нахождению корней ги г2, г3, z4 полинома / (!) найдем сначала разложение его на квадратные множители: / (!) = (|2 + а! + b) (!2 -j- a'l + b'). Корни первого множителя, скажем гь г2, удовлетворяют условию z^ + z2 = —а, а корни второго г3, 24 — условию г3 + г4 = —а'. Но поскольку у / (!) коэффициент при !3 равен 0, то z4 + z2 + г3 + Ч = 0 и, следова- следовательно, в любом таком разложении а' = —а. Так как имеется по крайней мере одно такое разложение, то мы видим, что (8.3.8) существуют а, Ь, с ? С такие, что Теперь вопрос состоит в том, как определить а, Ь, с по р, q, r, используя только рациональные операции и корни n-й степени. Прямое перемножение дает нам следующие отношения: (8.3.9) b + с — аг = р, a(c — b) = q, be = г.
374 ГЛ. 8. КОМПЛЕКСНЫЕ ЧИСЛА Поскольку мы предполагаем, что q ф 0, г Ф 0, очевидно, что каж- каждое из а, Ь, с отлично от 0. Поэтому с + b = а2 + р, с — b = = qla и (8.3.10) 2с = а2 + р + qla и 2Ь = а2 + р — q/a; также \г = 46с = [(а2 + р) + <//а] [(а2 + р) — qla] = (а2 + рJ — — 42/а2. Отсюда а2 (а2 + рJ — 4га2 — q2 = 0 и а6 + 2ра4 + + (р2 — 4г) а2 — д2 = 0. Поэтому если мы положим (8.3.11) н = а2, то (8.3.12) у3 + 2р«2 + (р2 — 4г) и — <72 = 0. Согласно 8.41 и 8.44, мы можем решить это уравнение относительно и в радикалах. В общем случае имеется три таких решения и, соглас- согласно (8.3.11), в качестве а мы можем взять один квадратный корень из одного из них; тогда Ь, с могут быть определены из а согласно (8$.10). Теперь вопрос в том, какое из шести возможных а надо взять? Проследив наш путь, можно сказать, что подходит любое. Другими словами, не играет роли, какой корень и мы возьмем в (8.3.12) и какой мы выберем квадратный корень а из и: если мы по (8.3.10) определим из такого а числа Ь, с, то будут выполняться соотношения (8.3.9) и, следовательно, будет иметь место разложе- разложение (8.3.8). (Если р, q, r — действительные, то мы можем выбрать а, Ь, с также действительными; это видно из 8.34 или непосредствен- непосредственно, поскольку в этом случае, очевидно, (8.3.12) имеет по крайней мере один действительный корень и > 0.) С помощью формулы реше- решения квадратного уравнения можно теперь найти корни каждого из множителей в (8.3.8) и мы получаем следующее заключение: общее полиномиальное уравнение четвертой степени над С разреши- разрешимо в радикалах. Фактически, используя радикалы У, yf, как в (8.3.6), можно через коэффициенты получить формулу, которая в зависимости от различных сочетаний значений радикалов давала бы все комплексные корни любого полинома четвертой степени. Об уравнениях высших степеней. Несмотря на очень частный характер некоторых из приведенных вычислений, в наших рассуж- рассуждениях об уравнениях второй, третьей и четвертой степеней имеются некоторые намеки на то, как надо подходить к общему уравнению п-й степени. Однако до конца XVIII и начала XIX веков суще- существенного продвижения в этой области не было. Первой была работа Лагранжа, который получил определенные полезные упрощения проблемы, но не смог получить искомые решения в радикалах. Гаусс рассматривал проблемы, связанные с различными геометри- геометрическими построениями. с помощью циркуля и линейки. Как мы увидим в следующей главе, они сводятся к изучению уравнений, решения которых содержат только квадратные корни. На этом
8.3. КОРНИ КОМПЛЕКСНЫХ ПОЛИНОМОВ 375 пути Гаусс смог дать положительный или отрицательный ответ в ряде знаменитых задач на построение, поставленных еще грече- греческими геометрами. Наличие отрицательного ответа, т. е. невозмож- невозможность тех или иных построений с помощью циркуля и линейки, не является неожиданным, поскольку (это будет показано в следую- следующей главе) такие построения эквивалентны решению уравнений с помощью рациональных операций и операции извлечения квадрат- квадратного корня. По-настоящему неожиданным и удивительным был результат, полученный Абелем: ни для одного п^Ъ не существует общей формулы, позволяющей по коэффициентам произвольного полиномиального уравнения найти его корни с помощью рациональ- рациональных операций и радикалов. Этот важный результат оставляет откры- открытым вопрос о возможности решения в радикалах каждого конкрет- конкретного уравнения, несмотря на то что по теореме Абеля общей формулы такого решения нет. Этот вопрос был окончательно решен Галуа и вся теория теперь так и называется теорией Галуа. В этой изящ- изящной теории все известные частичные результаты получили ясное истолкование. Далее, теория Галуа показала, как для каждого п ^ 5 построить конкретные уравнения степени п, неразрешимые в радикалах. Например, с ее помощью могут быть построены очень простые уравнения пятой степени с рациональными коэффициентами, обла- обладающие этим свойством. Современное изложение теории требует серьезного использования результатов двух направлений современ- современной алгебры: алгебраической теории полей и теории групп. В сле- следующей главе мы изложим основания первого из них, рассмотрев алгебраическую теорию подполеи комплексных чисел. Этого будет достаточно для того, чтобы изучить некоторые вопросы геометриче- геометрических построений. Упражнения 1. Доказать теорему 8.37 (i) — (Hi). 2. Закончить доказательство теоремы 8.38 (i), показав, что z-w ? Alg (К), как только г, а) ? Alg (К)- 3. Найти ЩёКа[?] такой, что I (|) ф 0 и /; (^ + i У2) = 0. (б) Найти I (?) g Ra [g] такой, что f. (g) ф О и (|2+ ig->/2) | f, (I). 4. Назовем z алгебраически целым числом, если / (г) = 0 для некоторого нормированного / (?) 6 I Ш> т- е. z является корнем нормированного полино- полинома с целыми коэффициентами. (а) Используя доказательство 8.38, показать, что множество алгебраиче- алгебраически целых чисел образует область целостности (относительно операций в С). (б) Показать, что множество алгебраически целых чисел не образует подполя С. (в) Показать, что если w ? Alg, то mw — алгебраически целое число для некоторого т 6 I, m ф 0. Поэтому Alg является полем отношений для области алгебраически целых чисел. 5. Предположим, что / (?), g (!) 6 С Ш — нормированные многочлены соответственно степеней п > 0, т > 0. Положим / E) = (| — г4) • . . . • • • 41 — Zn), g (.1) = (I — Щ)- ¦ ¦ ¦ -(I — wm). Результантом f (l) и g (I)
376 гл- й- КОМПЛЕКСНЫЕ ЧИСЛА мы называем число Следовательно, / (|), g A) имеют хотя бы один общий корень тогда и только тогда, когда Res (/ A), g (?)) = 0. (а) Сформулировать и доказать для результантов аналог теоремы 8.40. (б) Какова связь между Dis (/ (g)) и Res (/ (g), /' (!)/«) для п > 1? 6. Доказать теорему 8.41. 7. (а) В соответствии с 8.43 (i) — (Hi) классифицировать корни следую- следующих полиномов: (i) ?3-4g-(- I, (ii) 2|3-6?2- I. (б) Найти необходимое и достаточное условие на b ? Re, чтобы полином 2g3 -f- 6? + 1 имел в точности три действительных корня. 8. Найти все корни следующих полиномов: (а) 7? + 91 - 6, (б) В -Ь 3ig + A + i), (в) Е* - 2|'- - 8К - - 3.
ГЛАВА 9 ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ 9.1. Порождение подполей Хотя, как мы видели в предыдущей главе, поле комплексных чисел дает нам большое количество информации о решениях различ- различных алгебраических задач, получение более подробной информа- информации о природе самих решений часто приводит к необходимости рас- рассматривать некоторые подполя поля С. Так обстоит дело, например, если нас интересует вопрос, можно ли построить корни данного полинома / (?) 6 С Ш классическими геометрическими средствами или же записать их через коэффициенты с помощью операций и ради- радикалов. В такой проблематике можно сформулировать следующую общую идею. Коэффициенты данного нам полинома / (?) принадле- принадлежат некоторому подполю К поля С, причем можно показать, что можно найти наименьшее такое подполе; будем называть его полем, порожденным коэффициентами полинома /(|). Далее:, корни поли- полинома / (|) принадлежат некоторому другому подполю L поля С, и снова можно найти наименьшее такое подполе; назовем его полем, порожденным корнями полинома f (!) над /С, или просто корневым полем f (?). Идея состоит в том, что природа корней полинома / (?) сказывается во взаимоотношениях полей /С и L, В этой главе мы изучим такое взаимоотношение в одном (очень полезном) случае. Описанное выше построение двух подполей поля С является весьма специальным случаем общей процедуры отыскания по любо- любому заданному множеству Z s С поля, порожденного элементами Z. Вспомним необходимые и достаточные условия 6.1 и 6.2 того, чтобы множество К было подполем поля С: (9.1.1) 16 К и (9.1.2) из z, w 6 К следует z + w 6 К., z — w^K, zw 6 К и, если еще шфО, то и z/w 6 К- Из этих условий прямо вытекает 9.1. Лемма. Пусть М—любая непустая совокупность под- подполей L поля С. Тогда f\L [L 6 Ml — также подполе поля С.
378 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ Доказательство. Полагая /С = П L [L 6 Ml, прове- проверяем, что К. удовлетворяет условиям (9.1.1) и (9.1.2), если только им удовлетворяют все L 6 М. 9.2. Определение. Для любого множества ZsC положим Gen (Z) = fl L [L — подполе поля С и Z s L\. Gen (Z) называем подполем поля С, порожденным Z. 9.3. Теорема. Для любого ZsC (i) Gen (Z) — подполе поля С; (ii) Z = Gen (Z); (iii) еслы L — подполе поля С u Z s L, то Gen (Z) s L; (iv) еслы Zi = Z U {1} и Zn+i для каждого п 6 Р состоит из всех элементов вида z, г + w, z — w, z-w, z/w (при w Ф 0), где z,we Zn, mo Gen (Z) = U Zn In ? P]. Доказательство, (i) следует непосредственно из лем- леммы 9.1, поскольку само С, конечно, содержит Z и потому совокуп- совокупность М подполей L поля С, для которых Z s L, непуста, (ii) и (iii) следуют прямо из определения 9.2. Докажем (iv). Очевидно, Zn s Zm при п ^. т. Положим /С = U Zn in 6 PI- Тогда 1 ? /С- Если z, w ? К, то для некоторых n, m имеем z ? Zn и да ? Zm. Но тогда z, w ? Zk для некоторого & (/г — наибольшее из т, п). Следовательно, г + w, z-w, z — w, z/w (если w Ф 0) принадлежит Zft+i, а потому и К- Итак Gen (Z) s /С- Чтобы доказать обрат- обратное включение К Е Gen (Z), можно индукцией по /г показать, что каждое Zn s Gen (Z). Условие (i) доказанной теоремы обосновывает наше определе- определение 9.2, условия (ii) — (iii) позволяют называть Gen (Z) наимень- наименьшим подполем поля С, содержащим Z. Условие (iv) дает нам новый способ построения поля Gen (Z); это построение согласуется с интуи- интуитивным представлением, что Gen (Z) можно получить, отправляясь от 1 и элементов Z, повторным применением рациональных опе- операций. Конечно, все сказанное до сих пор не зависит ни от каких спе- специфических свойств С, т. е. мы могли бы ввести соответствующее определение подполя, порожденного данным множеством в любом поле, и получить ту же теорему 9.3. Более того, аналогичную кон- конструкцию можно провести для любой области целостности и вообще для любой алгебраической системы, если соответствующим образом изменить формулировку теоремы 9.3. И в дальнейшем большинство получаемых результатов будет легко обобщаться на другие системы. 9.4. Теорема, (i) Gen@)=Ra; (ii) если К — подполе поля С, то Gen (К) = К', (iii) Gen (Gen (Z)) = Gen (Z) для любого ZsC; (iv) если W s Z <= C, mo Gen (W) S Gen (Z);
9.1. ПОРОЖДЕНИЕ ПОДПОЛЕЙ 379 (v) если Z s С и z 6 Gen (Z), то г 6 Gen A17) для некоторого конечного подмножества W s Z (короче говоря, Gen (Z) = = U Gen (U7) [W ? L и U7 конечно]). Доказательство предоставляется читателю. Также предоставим читателю привести примеры, показывающие, что из 2 = С, Z' ? С, вообще говоря, не следует Gen (Z) U Gen (Z') = Gen (Z (J Z'), хотя Gen (Z) U Gen (Z') <= Gen (Z U 2'). Общий процесс расширения. Рассмотрим теперь построение, исходя из любого заданного подполя К и множества элементов Z, подполя L, порожденного Z над /<\ На самом деле при этом нам даже не потребуется предположение, что К — подполе. 9.5. Определение. Для любых /( ? С u ZsC положим К (Z) = Gen (К I) Z). Если Z конечно и непусто, скажем Z = = {ги . . ., гп}, то пишем К (гь . . ., гп) вместо К ({zi, . . ., zn}). По аналогии с теоремами 9.3 и 9.4 получается 9.6. Теорема. Для любых К s С, ZsC, Z'sC (i) К (Z) — подполе поля С; (и) /С ?= /С B) и ^ = /С (Z); (iii) еслы L — подполе поля С и К s L, Z s L, mo /C (Z) s L; (iv) /C (/C (Z)) = /C (Z); (v) если Г = Z, mo К (W) = /C (Z); (vi) /C (Z) = U /С (Г) [Г = Z, W конечно]; (vii) /С (Z U Z') = (К (Z)) (Г). Доказательство. Первые шесть утверждений — оче- очевидные следствия определения 9.5 и теорем 9.3—9.4. Докажем (vii). В силу (v), имеем К (Z) s К (Z U Z'), а в силу (ii) Z' <= (Z (J Z') s S/((ZU 2')- Поскольку К (Z [j Z') — подполе поля С, из (iii) следует, что (К (Z)) (Z') s /С (Z U Z')- С другой стороны, ввиду (ii) получаем /С U Z = /С (Z) = (К (Z)) (Z') и 2' = (/С (Z)) (Z'). Сле- Следовательно, /С U Z U Z' = (/С (Z)) (Z'). Согласно (i) (/С (Z)) (Z') — подполе поля С, поэтому, применяя 9.3 (iii), получаем Gen {К U Z U ^') s (/С (Z)) (Z'), откуда К (Z U 2') = (/С (Z)) (Z') ввиду 9.5. В случае, когда К — подполе поля С, тривиально доказывается 9.7. Теорема. Пусть К — подполе поля С и Z s С. Тогда К (Z) = К тогда и только тогда, когда Z <= К- В частности, если К — подполе, то К @) = К- Простые расширения. На основании 9.6 (vi) изучение структуры К (Z) сводится к изучению К (Z) для конечного Z. В последнем случае, если Z Ф 0, скажем Z = {zu . . ., zn}, на основании 9.6 (vii) изучение К (Z) упрощается далее. Записывая для
380 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ краткости К (Z) {Z') вместо (К (Z)) (Z'), получаем К BЬ . . ., Zn) = К ({2Ь . . ., 2n}) = К ({2Ь . . ., Zn_i} U Ы) = = К ({Zi, . . ., Zn_i}) ({2n}) = /С (Zi, . . ., Zn_j) Bn). Повторяя такое рассуждение, получаем /С (гь . . ., zn) = == /С (zi) (г2) ••¦(zn). Следовательно, все сводится к изучению простого расширения L (г) для различных L и г. Поскольку каждое подполе замкнуто относительно операций сложения и умножения, то для любого полинома / (?) с коэффициен- коэффициентами в К выполнено / (г) ? К (г). Далее, если g (t) t К Ш и g (z) =^ =^= 0, то также / (z)/g (г) ? К, (z). Тем самым приходим к идее изуче- изучения К (z) на основе изучения связи между К (г), областью /С [?] и полем рациональных форм /((?). 9.8. Теорема. Пусть /С — подполе поля С г; г ? С. Определим функцию G с областью определения К [?] формулой G (f (?)) — / (г) для любого f (?) 6 /С [?] а пусть D = М (G). Тогда ,(i) G (а) = а для любого а Е К, пгак что /С ^ D; (ii) G (?) = г, так что z ? D; (iii) D <= К (z); (iv) D — подобласть области К (г); (v) G — гомоморфизм К Ш на D. Доказательство. Утверждения (i) — (iii) очевидны, в частности, G @) = 0, G A) = 1. Столь же ясно, что D замкнуто относительно операций + и • : G (/ч (?) + /г (?)) = /i (z) + /2 (г), G (/ч (?) -/2 (?)) = h (z) -/г (г) и потому справедливы (iv) и (v). Простые трансцендентные расширения. Конечно, продолжить отображение G до отображения G' из /С (?) в /С (г), просто полагая G' (А (?)//2 (?)) = /i (z)//2 (z), нельзя, поскольку возможно /2 (г) = 0 даже при /2 (?) Ф 0. Однако, если г не есть корень никакого полино- полинома над /С, то такое продолжение возможно, как показывает сле- следующая 9.9. Теорема. Пусть К — подполе поля С, z g С м г (J (J Alg (/С). Тогда функция G, определенная в теореме 9.8, может быть продолжена до изоморфизма К (?) = К (z). Доказательство. Естественное продолжение функции G на К (?) в этом случае существует, поскольку из f2 (?) ф 0, согласно предположению, следует f2 (z) ^= 0. Докажем, что продолженное отображение взаимно однозначно. Предположим, что где /2 (?) ^ 0 и ?2 (?) ^ 0. Положим h (?) = Д (?) ^2 (?) - — h (?) ffi (?)• Тогда h B) = 0, а потому h (?) = 0 и gi A) fail) 82A) *
9,1. ПОРОЖДЕНИЕ ПОДПОЛЕЙ 381 Очевидно, что продолженное отображение G' также оставляет эле- элементы К неизменными и сохраняет операции +, •, —, ~*. Поэтому остается только доказать, что К (г) = М (G'). Пусть L = М (G'). Тогда К ^ L, z ? L и L — подполе поля С. Следовательно, К (г) Е sLb силу 9.6 (ш). Обратное же включение L s К (z) прямо выте- вытекает из замкнутости f( (г) относительно деления. В доказанной теореме главной посылкой является утверждение, что г не есть алгебраическое число над К, т. е. что К (г) (совпадаю- (совпадающее с областью значений D функции G) — простое трансцендентное расширение поля /(. По теореме единственности тогда К Ш = = /С fz]. Но в этом случае и соответствующие поля частных К Ш> К (г) по теореме 6.12 также изоморфны, К (?) = К (г). Тем самым структура простого трансцендентного расширения К (г) в С, т. е. расширения, в котором г не является алгебраическим над К, полностью изучена: каждое такое расширение изоморфно К A), и потому любые два таких расширения изоморфны между собой. Так, например, я и е алгебраически неразличимы над Ra, т. е. Ra (я) ^ Ra (e). Простые алгебраические расширения. Конечно, наиболее инте- интересным для нас является как раз исключенный случай алгебраиче- алгебраического z над К, поскольку нас интересуют в основном поведение кор- корней полиноглов. К (z) и в этом случае состоит из всех элементов h (z)/f2 (z), для которых Д (|), /2 (I) 6 К Ш и f2 (z) Ф 0. Однако, как мы уже видели, прямой путь для установления связи между К (I) и К (г) для нас блокирован. Первым шагом к рассмотрению алгебраического над К числа z является изучение множества тех полиномов / (?) над К, для кото- которых z — корень. 9.10. Теорема. Пусть К — подполе поля С, z ? Alg (К) и 1% — наименыиее такое положительное целое число, что существует полином g (%) в К Ю степени п, для которого z — корень. Тогда (i) существует единственный нормированный полином р (|) степени п такой, что р (z) = 0; (ii) для любого полинома f (|) ? К Ш, /(г) = 0 в том и только в том случае, когда р (!) | / (?); (ш) полином р (|) простой в К Ш; (iv) если q (z) = 0 и полином q (?) нормированный и простой в К [?], то q Ш = р (I). Доказательство. Из предположения z 6 Alg (К) сле- следует существование хотя бы одного нормированного полинома Р (I) € К Ш степени п, для которого р (г) = 0. Если f (Q ? К Ш — любой полином, f (i) ф 0, то согласно алгоритму деления 6.26 существуют единственные такие полиномы h (?), г (Ю € К Ш> что A) / (Е) = А (I) р Ш + г (Е) и 0 < deg (г (|)) < п.
382 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ Тогда B) /(*) = /- (г), поскольку р (г) = 0. Если теперь / (г) = 0, то г (г) = 0 и вслед- вследствие выбора п получим deg (г (?)) = 0. Поэтому г (?) = 0 и р (I) I / (?). Наоборот, если р (|) | / (?), то, конечно, / (г) = 0. Итак, независимо от выбора р (?) условие (ii) доказано. В частности, если pi (!¦) — другой такой нормированный полином, то pt (?) | р (?) и, в силу нормированности, pi (?) = р (?) вследствие 6.23 (xi), (xii). Тем самым (i) доказано. Утверждения (iii) и (iv) с очевидностью следуют из (i) — (ii). Используя (iii), (iv), полином р (?) можно определить как един- единственный нормированный полином q (|), неприводимый над К, для котйрого q (z) = 0; число п тогда можно определить как степень этого полинома. Вернемся теперь к гомоморфному отображению G области KJW в К (z), определенному в 9.8: G (f (?)) = / B). В п. 4.6 мы виде- видели, что всякий гомоморфизм порождает некоторое отношение кон- груентности = такое, что образ при гомоморфизме изоморфен систе- системе классов эквивалентности по этому отношению. В нашем случае /4 (I) == f2 (?) в том и только в том случае, когда G (/ч (g)) = G (/2 (?)), т. е. в том и только в том случае, когда /4 (г) = /2 (г). Но /4 (г) — — /2 (г) = 0 тогда и только тогда, когда р (?) | (/t (|) — f2 (Ю), где р (?) — полином, однозначно определенный теоремой 9.10. С другой стороны, по любому полиному р (I) ? К Ш можно опреде- определить соответствующее отношение эквивалентности. 9.11. Определение. Для любого р (?) ? К Ш и любых А (?)» /2 (Ю 6 /С til полагаем /4 (g) s /2 (I) (mod p (g)) тогда и толь- только тогда, когда р (?)| (Д (^) — /2 (I)). Введенное отношение очень похоже на сравнение целых чисел по целому модулю. Теоремы 4.60 и 6.9 показывали нам, что система целых чисел, сравнимых mod p, образует поле, когда р простое. Аналогия приводит нас к следующей теореме. 9.12. Теорема. Пусть К — поле и полином р (?) простой в К Ш- Тогда (i) отношение == (mod р (I)) есть конгруенция в (К Ш, +, •, 0, 1); (ii) система классов эквивалентности [f (?)] по отношению = (mod p (I)) с естественно определенными операциями образует поле; (iii) для любого f (?) ? К Ш существует такой единственный полином г (?) 6 К Ш, что} (k) = г (?) (mod р (?)) и 0 < deg (r (?))< <deg(p(g)). Доказательство. Ясно, что = (mod p (|)) — отношение эквивалентности. Далее, если /ч (?) ^ /2 (|) (mod p (|)), то /4 (|) +
9.1. ПОРОЖДЕНИЕ ПОДПОЛЕЙ 383 + g(l) = fz (I) + g (g) (mod p (?)) и h (g) -g (g) = h (?) g A) (mod p (g)) для любого g (g). Поэтому (i) выполняется. Из теоре- теоремы 4.55 мы знаем, что система классов эквивалентности [/ (g)] с операциями A) Щ EI Ф Г/г EI = I/i (?) + /2 (?)], [/1 (I)] ® 1/2 AI = l/i (?) -/2 (I)] образует коммутативное кольцо с единицей, если только [0] Ф [1]. Но в нашем случае последнее условие сразу следует из простоты р (g) в /С [g]. Остается поэтому доказать, что B) если f Ш ф 0 (mod р (?)), mo / (g) -g (g) = 1 (mod р (g)) Зля некоторого g (g) ? /С U1- Действительно, если B) справедливо, то любой ненулевой класс [/ (?)] имеет обратный класс [g A)], [/ (?)] ® [g- (|)] = [1]. Докажем B). По предположению р (I) Jf f (I) и в силу простоты р (?) имеем 0° (?)» / Ш) = 1- По теореме 6.30 существуют такие полиномы h (I), g (?) € /С [?], что 1 = ft Ш р Ш + / (g) д (g). Но это - в точ- точности вывод утверждения B). (ii) доказано, (iii) же является простой переформулировкой алгоритма деления на р (g). Применим полученные результаты для описания простых алгеб- алгебраических расширений. 9.13. Теорема. Пусть К — подполе поля С, z ? Alg (К) и р (g) — единственный нормированный простой полином в К Ig], йля которого р (г) = 0. Пусть, наконец, G — гомоморфное отображе- отображение К Ш в К (г), определенное формулой G (/ (g)) = / (z) для всех f(l) 6 К fgl. Тогда (i) ^? (G) = ./С (г) и /С (г) изоморфно' полю классов эквивалентно- эквивалентности по (mod p (g)) из теоремы 9.12 (ii); (ii) для любого w ? /С (г) существует единственное такое г (g) ? € /С [gl, что 0 < deg (г (?)) < deg (p (|)) и w = r (г). Доказательство. Пусть D = М (G). По определению, G (/i (g)) = G (f2 (g)) в том и только в том случае, когда Д (g) ^ = /2 (g) (mod p (g)). По общей теореме о гомоморфизмах D изо- изоморфно системе классов эквивалентности по отношению = (mod p (g)). Но эта система — поле, и потому D — тоже поле. Далее, К s D и 2 6 D ввиду 9.8 (i), (ii), так что /С B) s D в силу 9.6 (iii). Но мы уже знаем, что D S К (г). Итак, D = К (z). Следо- Следовательно, для любого w ? К. (z) существует такой полином / (g) ? 6 /С tgl. чт0 w = G (f (g)), а потому и такой полином г (g) ? /С [g], что w = G (r (g)), 0 < deg (г (%)) < deg (p (g)) (согласно 9.12 (iii)). Другими словами, w = г (г) для некоторого такого r(g). Если, кроме того, ш = Г! (г), то г (g) = rt (g), так как в противном случае г (g) — rt (g) — ненулевой полином, имеющий корень г, причем степень г (g) — ri (g) меньше степени р (g). Теорема доказана.
384 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ 9.14. Следствие. Пусть К — подполе поля С, р (?) — про- простой полином в К Ш и р (zt) = р (г2) = 0. Тогда К (г4) ^ К (z«), причем отображение, осуществляющее изоморфизм, можно выбрать так, чтобы оно оставляло элементы а ? К на месте, a zt перево- переводило в г2. Теоремы 9.12 и 9.13 играют весьма важную роль во всей алгебраи- алгебраической теории полей, и мы хотим поэтому проиллюстрировать их на нескольких конкретных примерах. Пусть /С = Ra и г = У 2. Очевидно, единственным нормирован- нормированным простым полиномом в Ra [?], обладающим корнем У 2, является |2 — 2 = р (|). Согласно 9.13 (и), каждый элемент w 6 Ra (У 2) единственным образом представим з виде w = r(]/2), где г (?) 6 6 Ra [§] — полином степени < 2. Иначе говоря, каждый элемент w 6 Ra (УТ) представим в виде да = а + b V~2, где а, Ь ? Ra. Утверждение (i) теоремы 9.13 показывает, что множество элементов такого вида образует подполе С. Можно установить это и непосред- непосредственно, проверив замкнутость этого множества относительно опе- операций + , —, •, ~1. Для операций +, — проверка тривиальна: (а 4 b У2) ± (а, + Ь, ]/~2) = (а ± а,) + (& ± 6,) У2. Для произведения же имеем (а + 61/2) (а!+&!/2) = аа1+(а61 +6а,)/2-f 6 Остается проверить наличие обратного элемента. Пусть а-\-Ь У2Ф ^0, т. е. а и b не равны 0 одновременно. Ищем такие at, fr^Ra, что aai-\-2bbi=\, аЬ,-^Ьах=^0. Эти уравнения несложно решить относительно а и Ь. Проще, впрочем, воспользоваться равенством (а4-6У2)(а-ЬУ2) = е2-262. Тогда а ь лгъ Здесь, конечно, а2 — 262 Ф 0, поскольку в противном случае либо а -\- b У~2 = 0, либо а — 6 У2 = 0; в обоих случаях У2 — число рациональное, что неверно. Проделанные вычисления оправдывают содержащееся в п. 7.1 высказывание о том, что одним из путей построения поля, содержа- содержащего Ra и хотя бы один корень полинома I2 — 2, является рассмо- рассмотрение множества упорядоченных пар (а, Ь) 6 Ra x Ran определе- определение операций (а, Ь) ф (аи 60 = (а + аи 6 4- 60, (а, 6) ® (аь 60 = (a«i 4- 266Ь о64 4- 6а4).
9,1. ПОРОЖДЕНИЕ ПОДПОЛЕЙ 385 В построенное таким образом поле само поле Ra изоморфно вклады- вкладывается отображением, переводящим а в (а, 0). То же самое поле можно построить и по-другому: из Ra [|1 на основании теоремы 9.12. В качестве представителей классов экви- эквивалентности можно выбрать полиномы а -\- b\, a, b ? Ra. Чтобы найти представителя класса эквивалентности, содержащего про- произведение (а + Ы) (а, + Ь&) = сип + (abt + Ь<ц) I + bb&, нужно привести это произведение по mod (|2 — 2). Но ?2 = = 2 (mod (|2 — 2)). Поэтому bbiV = 2bh (mod (|2 — 2)) и (а + bl) (a, + b& = (аа, + 2bh) + (ah + ba,) I (mod (?2 - 2)). Таким образом, в множестве классов эквивалентности [а + Ы\ ® [at + hi] = [(aat + 2bbi) + (ah + bcti) SI. В силу 9.14 Ra (У^2) ^ Ra (— V2). Опять-таки мы это можем усмотреть и непосредственно, определяя отображение F на рацио- рациональных числах формулой F (а) = а и полагая F (У2) = — ]/ 2. Этого и нужно было ожидать, поскольку в проделанных выше вычис- вычислениях под 1^2 понимался любой корень полинома ?2 — 2. Аналогично можно поступить с Re (i), что является, конечно, просто другим обозначением для С. В этом случае нормированный простой полином р (I) есть ?2 + 1. Каждый элемент w 6 Re (i) однозначно представим в виде w = а + b\, a, b 6 Re. По необходи- необходимости формальные операции суммы и произведения выгля- выглядят так: (а + Ь\) + (а, + bj) = (a + а,) + (b + bt) i, (а + bi) -(ai + bt\) = сиг,. + (abt + ba^ i + bbtf = = (aai — bbj + (ah + ba,) \. Если рассматривать это с точки зрения полиномов по mod (?2 + 1), то произведение записывается в виде (а + bi) -(а± + bj) = аа^ + + (ah + bad I + bbi? и (a + bt) -(a, + hi) = (oat - bh) + (ah + ftfli) I (mod (I2 + 1)), поскольку I2 = —1 (mod (|2 + 1)). Эти вычисления лежали, по существу, в основе нашего построения системы комплексных чисел в п. 8.1. Теорема 9.14 в этом случае снова приводит к известному уже результату Re (i) ^ Re (—i); осуществляющее изоморфизм отображение оставляет элементы Re неизменными и переводит i в —i. Присоединение корней к произвольным полям. Теоремы 9.12 и 9.13 показывают, что если К — подполе поля С, р (|) — простой
386 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ полином в /С Ш и г — корень полинома р (?), то система классов эквивалентности mod (р (?)) изоморфна полю /С (z). С алгебраиче- алгебраической точки зрения в этом рассуждении поле С само не участвует: мы можем непосредственно проверить, что полином р (?) (точнее, полином с соответствующими коэффициентами из системы классов эквивалентности) в системе классов эквивалентности имеет корень. Приходим к следующей теореме, в той или другой форме уже упо- упоминавшейся ранее: 9.15. Теорема. Пусть (К, +, •, 0, 1) — любое поле и f (?) ? 6 К [?] — полином положительной степени т > 0. (i) Можно построить расширение (|_, +, •, 0, 1) поля К, в кото- котором полином f (?) содержит хотя бы один корень х 6 L, / (х) = 0. (ii) Можно построить такое расширение (|_, +, •, 0, 1) поля К, что, для некоторых хи . . ., хт 6 L, / (I) = (t — *i)* ••••(? — хт) в L Ш, т. е. такое расширение, в котором f (?) полностью разложим. Доказательство. Пусть р (?) — любой такой простой полином в К Ш, что р (|) | / (?). Определим, как в 9.11, отношение эквивалентности == (mod p (?)). Доказательство теоремы 9.12, про- проведенное для любого подполя поля С, как легко видеть, остается в силе вообще для любого поля, поэтому и в нашем случае можно заключить, что поле К изоморфно вкладывается в поле Е классов эквивалентности с операциями ф, ® (mod p (?)) с помощью ото- отображения а -»- [а], а 6 К- Исходному полиному р E) = а0 -\- + fli? + • • • + Q-rX71 соответствует при этом в области Е 1ц\ поли- полином pi (л\) = [а0] © [aj т) ф • • • ф [ап] т]п. Тогда [g] — корень полинома pi (т)) в Е (т)), т. е. [flol © (Ш ® [g]) Ф • • • Ф ([an] ® [g]n) = [0], поскольку слева стоит просто [а0 + ail + ••• + «n^™! = tp (ЮЬ а р (|) = 0 (mod p (g)). Поскольку поле Е содержит изоморфный образ К, мы можем, применяя стандартное рассуждение, найти и расширение L поля К, изоморфное Е, которое содержит корень полинома р (|) и, следовательно, полинома / (?). (i) доказано, (ii) доказывается индукцией по числу т. Построив в соответствии с 9.15 (ii) по данным полю К и полино- полиному f (I) степени т > 0 поле L, мы можем найти подполе поля |_, порожденное корнями хи . . ., хт полинома / (?). Можно показать, что полученное поле определяется полем К и полиномом / (g) одно- однозначно с точностью до изоморфизма и может быть названо поэтому корневым полем полинома f (g) над К- Чтобы проиллюстрировать доказанную теорему, рассмотрим поле (Ь, +, •, 0, 1) вычетов по (mod 2) (см. 4.59, 4.60, 6.9). Построим, пользуясь общей теорией, расширение L этого поля, содержащее корень х полинома р (?) = |2 + ? + 1. Полином р (?) прост над 12 в силу 6.37, поскольку ни 0, ни 1 его корнями не являются/Следуя
9.1. ПОРОЖДЕНИЕ ПОДПОЛЕЙ 387 доказательству теорем 9.15 и 9.12, мы должны строить L как сово- совокупность элементов а + Ьх, а, Ь ? 12, где х2 + х + 1 = 0. Сумма и произведение в этом множестве определяются так: (а + Ьх) + (а, + biX) = {а + а,) + (Ь + Ъ,) х и (а + Ьх)»{а^ + bix) = aai + (ай4 + bai) x + bb^x*. Но х3 = —х — 1 = х + I, поэтому (а + bx)»(ai + biX) = (aai + bbi) + (abi + bai + bbi) x. Эти условия непосредственно и определяют искомое поле L- Эле- Элементами L являются 0, 1, х, 1 + х, и условия переписываются в виде таблицы • 0 1 X l+x 0 0 0 0 0 1 0 1 X l+x X 0 X l + x I I 1 + 0 + 1 X X X Полином |2 + I + 1 в L разлагается полностью, поскольку содер- содержит, очевидно, два корня х и 1 + х. Аналогично, чтобы построить поле L, содержащее 16 и корень полинома I3 + I + I, простого, как легко видеть, над 15, нужно рассматривать совокупность элементов вида а + Ьх + сх2, а, Ь, с ? 6 1б> и определять операцию произведения, используя у? = —х— 1 = = 4х + 4. Это поле содержит 53 = 125 элементов. Повторяя процедуру 9.15 «достаточно много раз», можно пока- показать, что существует такое расширение L поля К, что любой полином / (?) 6 К Ш полностью разложим в |_ Ш- Более того, |_ можно выбрать таким, чтобы и любой полином f A) 6 L Ш был полностью разложим в L [?]. Другими словами, каждое поле К имеет алгебраи- алгебраически замкнутое расширение |_- Этот факт мы и имели в виду при обсуждении основной теоремы алгебры в п. 8.2. С алгебраической точки зрения С есть в этом отношении просто одно из многих алгеб- алгебраических замкнутых расширений Ra. Конечно, уже из 8.38 мы знали, что существует много других таких полей. То новое, что мы сейчас узнали,— это метод построения таких расширений, чисто алгебраический, не опирающийся на аналитическое понятие преде- предела (что нисколько не умаляет значение того замечательного факта, что естественное поле применения классического анализа — комп- комплексные числа — является алгебраически замкнутым). Изучив, таким образом, структуру простого алгебраического расширения К (z) в С, в следующем разделе мы перейдем к изучению итераций К (zi, . . ., zn) таких расширений.
388 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ Упражнения 1. Доказать теорему 9.4. 2. Привести пример таких множеств Zi gC, Z2 = С, что Gen (Zj) U Gen (Z2) Ф Gen (Zt \J Z2). 3. Пусть Zi, гг, Wi, w2 — трансцендентные числа. Верно ли, что Ra (zi, z2) s Ra (wu ay2)? Доказать ваше утверждение. 4. Доказать утверждение (И) теоремы 9.15. 5. (а) Описать элементы поля Ra (У2) в соответствии с 9.13 (и) и пока- показать, как вычисляется произведение его элементов. (б) То же самое проделать для поля Ra (f7 2) (Q, где ,. 2л . . 2я g=COS -g- + l Sin —. (в) Найти обратный элемент к 2+ У~2 в (а). 6. (а) Показать, что р (?,) = ?3 + S + 1 — простой полином в Ra Ц]. Предполагая, что z — корень полинома р (%), в соответствии с 9.13 (п) опи- описать элементы поля Ra (г) и произведения элементов в Ra (г). Найти обратный элемент к 1 + г. (б) Проделать (а), рассматривая р (^) как полином над полем 12 вычетов по mod 2. 7. Пусть (К, +, •, 0, 1) — такое поле, что К счетно. (а) Доказать, что К Ш счетно. (б) Доказать, что существует такое расширение (L, + , •, 0, 1) поля К, что в L полностью разложим любой нетривиальный полином из К [%], т. е. если / A) 6 К [?] — полином степени т > 0, то существуют такие Xi, ... . . ., xm в L, что f (I) = (Е— *0« . . . •(? - хт). 8. Предположим, что для любого (счетного или несчетного) поля К существует расширение L, удовлетворяющее условиям упражнения 7 (б). Показать, что тогда любое поле имеет алгебраически замкнутое расширение. 9.2. Алгебраические расширения Во всем этом разделе предполагается, что К, L, М — произволь- произвольные подполя поля С. Мы хотим изучить теперь расширение L = = К (zit . ¦ ., 2Й), где все z1 zk алгебраические над К или каждое 2, алгебраическое над К (zu . . ., 2,_i), i = 1, . . ., k. Мы уже знаем, что такое изучение сводится к изучению простых алгебраических расширений, и знаем, согласно 9.13, основные фак- факты о последних: каждое алгебраическое над К, число zt однозначно определяет некоторый нормированный неприводимый над К. поли- полином pi (I) положительной степени пи для которого zt — корень; для любого w 6 К (zO существуют единственные такие а0, аи . . . ¦ ¦ ., Onj-l € К, ЧТО (9.2.1) w = а0 ^ так что К. (zt) = /С при tii = 1 и наоборот.
9.2. АЛГЕБРАИЧЕСКИЕ РАСШИРЕНИЯ 389 Аналогично, если z2 алгебраическое над К\ = К (zi), то по z2 одно- однозначно определяется нормированный неприводимый над /G полином р2 (?) положительной степени п2, имеющий г2 корнем, и для любого и 6 К (zi, z2) существуют единственные такие w0, . . ., a>n_i 6 Ки что (9.2.2) u = wo + w,zz + ... + и«п2- iZ22~ *• Согласно (9.2.1) для каждого из wj получаем единственные ao,j, ¦ ¦ ¦, «щ-1,3 такие, что Wj = ao,j-±a1jz1 + ... + «ni-i,jz~~ для всех / = 0, ..., п2 — 1; поэтому (9.2.3) и = а0, о + 01,02! + aOtiz2 + a2,oZ\ + aUiz& + + оо, ^1 + ... + аП1_!, П2_ lZ?- ^2"J = m—i яг— i i=0 j=0 Продолжая рассуждение дальше, получим представление элемен- элементов расширения К (zi, z%, г3) и т. д. Иначе говоря, можно сформули- сформулировать теорему, аналогичную 9.13, которая описывала бы расшире- расширение К (zi, . . ., zh) в терминах области К [?ь • • •» Ы полиномов от k переменных. Теперь из такого представления мы хотим вывести соотношение между К и L = К (zi, . . ., 2ft), которое не зависело бы от выбора гь . . ., Zft. Перепишем для этого утверждения (9.2.1) и (9.2.3), расставляя акценты по-новому: каждый элемент w 6 К (zi) пред- представим в виде линейной комбинации ri\ элементов 1, zu . . ., zj11 с коэффициентами из К, каждый элемент и 6 К (zi, z2) представим в виде линейной комбинации щп2 элементов с коэффициентами в К и т. д.; более того, каждое из этих представ- представлений единственно. Приходим, таким образом, к рассмотрению расширений L = = К* (vit . . ., vm), в которых каждый элемент из L есть линейная комбинация элементов vit . . ., vm с коэффициентами в К- В нашем частном случае К (zi) можно рассматривать как /С*A, 2Ь ... . . ., 2ji-*),a/C(Zi, z2) —как/С*A,гь z2, . . ., z\z\, . . ., z^-^-i). Первое, что мы хотим в этом направлении показать,— что если мож- можно для данного L э К найти какие-то Vu . . ., vm такие, что L = К* (Vi vm), то число т от этого выбора не зависит, т. е. т зависит только от К и L. Для читателя, знакомого с линей- линейной алгеброй, этот факт хорошо известен. Ведь L можно рассматри- рассматривать как векторное пространство над К., рассматривая в L сложение элементов из L и умножение их на элемент из К- Если в L суще-
390 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ ствуют такие Vi, . . ., vm, что любой элемент из L есть их линейная комбинация (с коэффициентами из К,, конечно), то L — конечномер- конечномерное векторное пространство над К, а система vy vm, согласно общей теории векторных пространств, называется системой образую- образующих в L. Далее, если каждый элемент из L единственным образом представим в виде линейной комбинации Di vm, то vu . . ., vm называются линейно независимыми и говорят, что уь . . ., vm — база в L. В той же теории векторных пространств доказывается, что любые две базы содержат одинаковое количество элементов. Линейно порожденные расширения; базы и размерность. Для читателей, не знакомых с основами векторных пространств, приве- приведем в нашей конкретной ситуации необходимые понятия и рассуж- рассуждения, тем более что это не составит особого труда. 9.16. Определение. Пусть V ^ С. (i) Если F = 0, то полагаем K*(V) = {0}. Если Уф0, то полагаем K*{V) = {w: w = a%vi + • • • + ар, для некоторых ct\, . . ., аг 6 /С и vit . . ., vt 6 V}. Элементы множества К* {V) называются (линейно) зависящими от V над К (или (линейными) формами от V над К). Если V конечно, V = {vi, . . ., vm}, то пишем К* (У) = К* (vи . . . • ¦ ; Vm). (ii) Множество V называется (линейно) независи- независимым над К, если v ($ K*{V — {v}) для любого v ? V. Выбор К* @) = {0} удобен с точки зрения единства обозначе- обозначений. Очевидно, К* (У) s/C(V), но, вообще говоря, конечно К.*(V)=j?=K(V). Например, Ra*(K2) состоит только из чисел вида а]/2, a?Ra, тогда как Ra(j/^2) = Ra* (l, V2), как мы знаем из 9.13. Для непустого V можно определить К* (V) тем же способом, что и К (V), на основе 9.2. К*(У) есть наименьшее множество элемен- элементов из С, содержащее V и замкнутое относительно сложения и умно- умножения на элементы из К (в теории векторных пространств К* (V) называется подпространством, порожденным V или натянутым на V). Множество К* (У) обладает рядом свойств, некоторые из которых собраны в следующей теореме, в формулировке которой U, V, W — произвольные подмножества множества С. 9.17. Теорема, (i) V = K*(V); (ii) если U = V, то К* (U) <= К* (V); (ш) К* (К* (V)) = К* (V); (iv) K*(V) = UK* (WO IW <= V и W конечно]. (v) V независимо над К, тогда и только тогда, когда независимо любое конечное подмножество W ? V- Следующие три теоремы содержат описание свойств операции K*(V) уже только для конечных V.
9.2. АЛГЕБРАИЧЕСКИЕ РАСШИРЕНИЯ 391 9.18. Т еор ем a. (i) Если w е К* (V [} {и}) и w$K*(V), то и 6K*(V{J H); (ii) если U конечно, то К* (V) = К* (U) для некоторого V s U, независимого над К', (iii) множество V = {vit . . ., vm}, т ^ 1, независимо над К тогда и только тогда, когда для любого w 6 К* (V) существуют и единственны такие аь . . ., ат ? К,, что w = ал + • • • + amvm. Доказательство, (i). Пусть w = flifi + • • • + a-iVi + + bu, где Vi, . . ., Vt ? V и ai, . . ., a,, b ? К- ЪфО, поскольку в противном случае было бы w 6 К* (V); поэтому и = = (—6-4) Vi + •¦¦ + (—b^ai) vt + b~xw, так что и 6 К* (VUM). (ii) Очевидно, 0 s G и 0 независимо над /С. Поскольку ?/ конечно, существует максимальное число т такое, что в U есть /n-элементное независимое над К подмножество V. Докажем, что К* (V) = К ((/)• Но К* (V) = /С* (U) согласно 9.17 (ii). Следова- Следовательно, если /С* (У) =7^= К* (U), то существует такое и ? U, что и $ /С* (V). Тогда и м $ У ввиду 9.17 (i). Если мы теперь покажем, что множество Vi = V [} {«} независимо над К, то искомое противо- противоречие будет найдено (в U не может быть более т независимых эле- элементов). Итак, мы должны показать, что v^K*{Vi — {v}) для любого v ? Vi- Если и = v, то это прямо следует из определения К* (V). Если ифу и v б /С* (Vi — {о», т. е. о 6 /С* ((У — {у}) (J U {и}), то, согласно (i), и 6 /С* ((У — {о}) U {о}) = К* (У), что невозможно. Доказательство (iii) представляется читателю. Утверждение (i), часто называемое условием замены, играет важную роль не только в доказательстве (ii), но и в доказательстве следующих двух теорем. 9.19. Теорема. Пусть U, V — независимые подмножества над К, К* (V) s К* (U) и V содержит ровно т элементов. Тогда U содержит по меньшей мере т элементов. Доказательство. Мы докажем даже несколько более сильное утверждение. Именно, индукцией по т>0 мы покажем, что при наложенных на U, V ограничениях в U содержится такое m-элементное подмножество W, что К* (U) = К* (V {] (U— W)). Другими словами, мы можем, не изменяя К.* (U), заменить неко- некоторые элементы из U на элементы из У. Для т = 0 утверждение тривиально. Пусть оно доказано для т — 1, ш>0 и пусть U, V удовлетворяют условиям теоремы для т; в частности, У = {t>i, . . . . . ., vm). Положим Vi = {Vi ym_i} = У — {vm}. Согласно индуктивному предположению, существует такое Wi s U, что Wi содержит т — 1 элементов и К* (U) = K*(Vi U (U — Wi)). Поскольку vm 6 К* (V) s К* (U), существует такое конечное под- подмножество Ui s (U — Wi), для которого vm 6 К* (Vi U Ui). Среди всех этих Ui найдем такое, которое содержит наименьшее количе- количество элементов; обозначим Ui именно его. Ui = 0 невозможно,
392 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ так как в противном случае vm 6 К* (V%) = К* (V— {vm}), что противоречило бы предположению о независимости V. Итак, Ui Ф 0 и мы можем выбрать и ? Ui. Поскольку Ui — {«} имеет меньше элементов, чем Uu то vm$K*(Vi U (Ui-{u})). Согласно условию замены, и е К* (Fi U (Ui - {и}) U К» = К* (V U (Ut - {и})). Теперь пусть W = Wi [) {и}. Поскольку и $ Wu W содержит ров- ровно т элементов. Докажем, что W удовлетворяет всем нашим требо- требованиям, и тем самым закончим индукцию. Итак, нам нужно показать, что К* (У) = К* (У U (U— W)). Поскольку V = К* (U) и U — W = К* (U), то V U (U — W) = = К* (U) и потому К* (V U (U — W)) S К* (К* (U)) = К* (U). Заметим также, что . и е к* (v и (и± - {и})) c=k*(V{j ((и - wo - {и})) = и, следовательно, Vilj (U- W,) = Vi U (U - W) U M s=K*(V[}(U- W)), и потому K*(U) = K*(Vi [)(U— WO) ? K*(K*(V U (U - IF))) = = /c*(v и (и - w)). Индукция, а вместе с тем и доказательство, закончены. Из теоремы 9.19 немедленно следует следующая 9.20. Теорема. Пусть U, V — конечные независимые над К множества и К* (V) = К* (U). Тогда V « U, т. е. V и U содержат одинаковое количество элементов. С помощью трансфинитной индукции (и аксиомы выбора для несчетных множеств) утверждения 9.18 (П) и 9.20 можно обобщить и на случай, когда множества бесконечны. Аналогичные результаты можно также получить для произвольной операции G (V) вместо К* (V), если правильно определить понятие независимости и если G (V) удовлетворяет условиям 9.17 (i) — (iv) и условию замены 9.18 (i). Соответствующий пример рассматривается ниже в упраж- упражнении 8. Согласно теореме 9.18, если множество S совпадает с К* (U) для некоторого конечного U, то S = К* (V) для некоторого конеч- конечного независимого над К множества V. Более того, количество эле- элементов в таком V зависит только от S и К- Это дает нам возможность определить специальную функцию от 5 и К- 9.21. Определение. Пусть U конечно. Под размер- размерностью множества К* (U) над К. понимается (однозначно опре-
9.2. АЛГЕБРАИЧЕСКИЕ РАСШИРЕНИЯ 393 деленное) число элементов т независимого над К множества V, для которого К* (V) = К* (U); это число т обозначается IK* (U) '¦ Ю- Конечные расширения полей. Применим полученные результаты, как мы и собирались, к расширениям полей. 9.22. Определение. Для любых двух подполей К и L поля С поле L называется конечным расширением поля К, если L = К* (V) для некоторого конечного множества V. Если мно- множество V при этом независимо, то V называется (линейной) базой поля L над К- Для размерности (в смысле определения 9.21) конечных расши- расширений мы будем использовать также символ [L : К]- Доказательство следующей леммы предоставляется читателю. 9.23. Лемма. Пусть L — конечное расширение К- Тогда (i) \L:K\>\\ (И) К = L; (iii) [L : К] = 1 тогда и только тогда, когда L = К- Если L — конечное расширение К, L = K*(V), то также L = К (V). Действительно, согласно (и), К ? L, а из V s К* (V) следует также V ? L. Следовательно К (V) ? L. Но, очевидно, К* (V) ? К (V), так что L = К (V). Обратное утверждение, одна- однако, неверно: из того, что V конечно и L = К (V), вовсе не следует, что L — конечное расширение К- Из следующей теоремы, в частно- частности, вытекает, что соответствующим контрпримером могут служить L = Ra (я) и К = Ra. 9.24. Теорема. L s Alg (К) для любого конечного расшире- расширения L поля К- Точнее, если [L : К] = т и z 6 L, то существует такой полином f (?) 6 К Ш, что deg f (I) ^ т и f (г) = 0. Доказательство. Теорема очевидна для z = 0. Пусть 2=^0; положим Z = {1, г, . . ., zm}. Поскольку Z содержит т + 1 элементов и /С* B) s L = К* (V) для некоторого незави- независимого над К m-элементного множества V, Z не может быть незави- независимым над К вследствие 9.19. Поэтому какой-то из элементов Z,, скажем г1, есть линейная комбинация остальных, т. е. z т = S 50 fc 0, При i > 0 получаем полином, для которого z — корень; это поли- полином над К степени т, 1 ^ k ^ т. Если же i = 0, то не все из а? равны 0, и опять мы получили полином над К степени ^т, для кото- которого z — корень. Справедливо частичное обращение доказанной теоремы. 9.25. Теорема. Если г алгебраическое над К, то К (г) — конеч- конечное расширение К,- Точнее, если р (?) — единственный простой нор- нормированный полином в К Ш, для которого р (z) = 0 и deg (p (|)) = = я, то {1, z, . . ., z"-1} — база для К (г) над К и [К (г) : К\ = п.
394 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ Доказательство. Пусть Z — {1, г, . . ., г"}. Соглас- Согласно 9.13 (и), К (г) — К* (Z). Более того, по той же теореме каждое w 6 К (г) единственным образом представимо в виде w = а0 + + fliz + • •• + an-iz", где а0, . . ., an_t ? iC- Следовательно, в силу 9.18 (iii), Z независимо над К- Если г 6 /С, то р (?) = % — z и п = 1, так что Z = {1} содержит один элемент. Если z $ К, то я > 0 и Z содержит ровно п различных элементов, поэтому IK* (Z) : К\ = п. Повторные конечные расширения. По доказанному, если zt алгебраическое над К, а 22 алгебраическое над L — К (zi), то М = К (z\, 22) — конечное расширение L, а L — конечное расшире- расширение К- Помогает завершить построение цепочки следующая важная теорема. 9.26. Теорема. Пусть М — конечное расширение L, a L — конечное расширение К- Тогда М — конечное расширение К, и Ш : Ю = Ш : U-IL : Ю- Доказательство. Пусть М = L* (щ, . . ., ит), где {uf, ¦ . ., ит} независимо над /С, и пусть L = К* (vi, ¦ ¦ ¦, vn), где {v\, . . ., vn} независимо над К- Тогда [М : L] — т и [L : /С1=п- Для любого w?M можно найти такие bt, ..., bm?L, что т A) w = ^btut. Далее, для каждого из bi, i = 1, ..., т, можно найти такие at, и • ••. at,n?K, что П B) bi^^atjvj. Следовательно, т п C) W = У) У\ ui jUiVj. г=1 ,= 1 Это показывает, что множество W всех чисел UtVj, где t = l, ... ...,т, /=1, ...,«, порождает уИ над К, т.е. М = /С*(№). Поэтому М — конечное расширение К- Если мы покажем, что элементы UiVj различны для различных пар (г, /) и что W неза- независимо над К, то тем самым получим [М : К]=тп. Следующее рассуждение доказывает оба утверждения. Пусть aitj, a\tj^K и т п т п г=1 з=1 ' 3 г=1 з=1 Для каждого t = 1, ..., п пусть п, п E) bi = ^j Я; ^У» U 6i = ^j 3=1 j=l
9.2. АЛГЕБРАИЧЕСКИЕ РАСШИРЕНИЯ 395 Тогда в силу D) m m F) SM*=S*>i«!. i=l i=l Следовательно, в силу 9.18 (iii), Ьг = Ь'х для всех i= 1, ..., m, т. е. п п G) 2 а* jVj = 2 а* зуу для бСел; » = 1» .. ., т, 3=1 з=1 ' и снова в силу 9.18 (iii) (8) ai,j = ^'i,j для всех i = 1, ..., т и /= 1, ..., п. Заметим, что если М — конечное расширение К и М э L э К, то М — конечное расширение L, поскольку из М — К* (V) сле- следует М = L* (V). С помощью этого замечания из 9.26 легко выво- выводятся два следствия, первое из которых уточняет теорему 9.24, а второе обобщает теорему 9.25. 9.27. Следствие. Если L — конечное расширение К и z 6 L, то [К (г) : Ю | [L : К\- 9.28. Следствие. Для заданных К, zu . . ., zq положим Ki = К, Kt+i = Ki (zt) для i = 1, . . ., q и L = Kq+i = = К (zu ¦ . ., zq). Если каждое zt алгебраическое над Ki, то L — конечное расширение К, причем [L : /С] = П\ • ¦ ¦ nq, где nt = = iKi (zd : Kt]. Итак, мы получили тот результат, с векторной формулировки которого мы начали раздел: для любого повторного расширения L = К (zt, . . ., Zq) число [L : К\ не зависит от выбора чисел Z\, . . ., zq или от их порядка. В качестве примера вычислений, связанных с применением след- следствия 9.28, найдем размерность корневого поля L полинома ?3 — 2 HaflRa, т. е. найдем число [L : Ra], где! = Ra (^2, ? ^2, ^У) и v 2it . . . 2it ? — cos — -f i sin -g-. Сначала заметим, что L = Ra (y/^2, ?) = Ra (y/2) (?) = Ra (?) (У~2). Нормированными полиномами, неприводимыми над Ra, для которых У2 и ? соответственно являются корнями, будут ?3— 2 и |2 + ? + 1. Поэтому [Ra (У2): Ra] = 3 и [Ra(?):Ra] = 2. Чтобы найти [L:Ra], например, как [Ra (У2) (?): Ra (У2)] ¦ [Ra (У2), Ra], необходимо найти такой нормированный неприводимый над Ra (У полином, для которого С — корень. Таким полиномом, конечно,
396 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ будет снова ?2 + i + 1, поскольку ни один из его комплексных кор- корней ?. ?? не может принадлежать Ra (-^2), содержащему только действительные числа. Следовательно, [L : Ra] = 6. Тот же резуль- результат можно получить аналогичными рассуждениями, если записать [L: Ra] = [Ra (Q (У2): Ra (?)] • [Ra (?): Ra]. Базу для L над Ra можно найти, используя теорему 9.25 и дока- доказательство теоремы 9.26. Действительно, базой для Ra(^/2) над Ra служит [\,у2, (у^2J}, а для Ra(^2)(?) над Ra(^/2) база {1, ?}. Следовательно, {1, j/2, у/4, ?, ?^2, ?у/3} —база для L над Ra. Следствие 9.28 можно также использовать для нового доказа- доказательства теоремы 8.38 об алгебраической замкнутости Alg (К) для любого подполя К поля С. На основе развитой в настоящей гла- главе техники это совсем просто. Пусть, действительно, 21; z2 6 Alg (К)- Тогда 22 алгебраическое над К (Zi). Далее, по доказанному К.(%\, г2) — конечное расширение /С- Но тогда каждый элемент К (zb 22) в силу 9.24 алгебраический над К- В частности, это верно для zt + г2> г±— г2, г^ -z2 и — в случае 22=т^ О—для zjz2- Чтобы доказать алгебраи- алгебраическую замкнутость, предположим, что z ? Alg (Alg (К)), т. е. что для некоторых ш0, . . ., wm ? Alg (/(), wm Ф 0, имеем ВУ0 + WiZ + ••• + WmZm = 0. Тогда 2 алгебраическое над К (ш0, . . ., шт), и потому L = /( (ШО, ¦ • ., Wm, 2) является конечным расширением К вследствие 9.28. Но z ? L, так что (ввиду 9.24) z алгебраическое и над К- Упражнения 1. Доказать утверждения (Hi), (v) теоремы 9.17. 2. Доказать утверждение (Hi) из 9.18. 3. Пусть W конечно и К* (U) ? К* (№). Показать, что существует такое конечное V s U, что К* (U) = К* (V). 4. Доказать лемму 9.23. 5. Пусть [L : К] = 2, полином р (|) прост в К. [?], гб! и р (г) = 0. Показать, что любой корень полинома р (?) принадлежит L и что L = К (г), если deg (р (?)) > 1. Верны ли те же утверждения при [L : /С! = 3? 6. Пусть L — корневое поле полинома |4 — 1 над Ra, т. е. L — поле, порожденное четырьмя корнями из 1 над Ra. Вычислить [L : Ra]. Проделать то же для полинома ?6 — 1. 7. (а) Верно ли, что Ra(l-\-f"i) = Ra(f2)l (б) Верно ли, что Ra(V2 + V3) = Ra(V2, Т/з)? 8. Для любых К, V положим К+ (V) = Alg (К {V))- Мы говорим, что w алгебраически зависит от V над К, если w 6 К+ (V). Показать, что 9.17 (i) — (iv) и 9.18 (i) продолжают выполняться при замене в их формулировках K*(V) на K+(V).
9.3, ПРИЛОЖЕНИЯ К ЗАДАЧАМ НА ПОСТРОЕНИЕ 397 9.3. Приложения к задачам о геометрических построениях Основные геометрические понятия. Завершая работу, мы хотим теперь показать, как полученные результаты применяются в зада- задачах на построение с помощью циркуля и линейки (с прямым краем) в евклидовой плоскости. Провести строгое и полное изучение всего вопроса не представляется возможным, поскольку в таком случае пришлось бы изложить, в частности, аксиоматику Евклида плоской геометрии. Эта аксиоматика в современном изложении формулирует- формулируется как совокупность условий на математическую систему объектов, называемых «точками», «прямыми», «окружностями», связанных между собой определенными отношениями: отношением инциденции типа «точка Р лежит на прямой X», «точка Р лежит на окружно- окружности %», отношением промежуточности типа «точка Р лежит между точками Qt и Q2 на прямой, проходящей через Qi и Q2» и отноше- отношением равноудаленности типа «расстояние между точками Л и Р2 равно расстоянию между точками Qt и Q2» (это только указание, какого типа базисные понятия могут потребоваться,— тем же целям могут служить и другие системы и отношения). В намеченной систе- системе определить углы и отношения равенства между углами можно следующим образом. Любую тройку (Ри Р2, Р3) попарно различных точек рассматриваем как определяющую угол с вершиной Р2, причем углы, определяемые тройками (Pi, Р2, Р3) и (Qi, Q2, Qe)> считаются равными, если существуют такие точки Р[, Р'3, Q[, Q3, лежащие соответственно между точками Pt и Р2, Р% и Р3, Qi и Q2, Q2 и Q3, что в тройках (Р[, Р2, Р'3) и (Q[, Q2, Q'3) соответствующие попарные расстояния между точками равны. На этом основании можно говорить о бисекции данного угла, т. е. делении угла на две равные части, о трисекции угла и т. д. точно так же, как говорят о делении отрезка в данном отношении. Заметим, что само понятие расстояния как действительнознач- действительнозначной функции, определенной на парах точек, а также понятие вели- величины угла для нас запретны — мы ограничиваемся только поня- понятием равновеликости длин и углов. Это ограничение основывается на самой задаче построения с помощью циркуля и линейки: мы рассматриваем линейку без масштабных делений и не могущую потому служить измерительным инструментом. Реализация в декартовой плоскости. Известно, что, при подходя- подходящем выборе понятий и аксиом геометрии, любые две системы объектов, удовлетворяющих этой системе аксиом, изоморфны. Более того, по крайней мере одна такая система реализуется в декар- декартовой плоскости (т. е. в произведении Re X Re). Используя это, мы в дальнейшем будем понимать под точкой элемент (х, у) 6 6 Re X Re и называть х и у координатами этой точки; под прямой— множество всех точек (х, у), координаты которых удовлетворяют
398 ГЛ. 9- ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ уравнению (9.3.1) ах + by = с, где а, Ь, с ? Re и а Ф 0 или b Ф 0. Аналогично, под окружностью будем понимать множество всех точек (х, у), координаты которых удовлетворяют уравнению (9.3.2) (х - af + (y- bf = с\ где а, Ь, с ? Re, с > 0,— некоторые фиксированные числа, и назы- называть точку (а, Ь) центром окружности (9.3.2), ас — ее радиусом. Будем, далее, говорить, что точка (х, у) лежит на прямой X, опре- определенной уравнением (9.3.1), если (х, у) удовлетворяет уравне- уравнению (9.3.1), и аналогично определять принадлежность точки окруж- окружности (9.3.2). Легко проверить, что для любой пары прямых Хи Хг выполнено одно из трех: либо эти прямые не имеют общих точек: %i П <^2 = 0 (другими словами, Xi параллельна Х2), либо они совпадают, т. е. Х\ = Х2, либо они имеют единственную общую точ- точку,^, у), т. е. Xtf) Х2 — {{х, у)}. В последнем случае мы говорим, что Xi и Х2 пересекаются в точке (х, у). Точно так же можно говорить о точках пересечения (если такие есть) прямой и окружности или двух окружностей. Найти точки пересечения алгебраически можно следующим образом. Пусть Xi = {(х, у): atx + Ьгг/ = сг}, i = 1, 2. Легко видеть, что Х\ — Xz тогда и только тогда, когда существует такое h > 0, что а2 = hau b2 = hb\, c2 = Лс4. Аналогично, Xi ft X2 = 0 тогда и только тогда, когда существует такое h > 0, что а2 = ha\ ий2 = hbu но с2 ф hci. Если же Х±фХ2 и Xi П Хг ф 0, то суще- существует единственное решение (х, у) системы (9.3.3) aix + biy = си а2х + Ь2у = с2, которое дается формулами (ср. 6.18) (9.3.4) cfo-cdi а1Сг-агЧ (из Xi фХ2, Xi (] Х2ф 0 следует aja2 Ф bjb2 и потому афг — — a2bi ф 0). Итак, координаты точки пересечения двух прямых могут быть найдены через коэффициенты определяющих эти прямые уравнений с помощью рациональных операций. Подобным же образом, для нахождения точек пересечения пря- прямой X = {(х, у): diX -\- biy = Ci} и окружности % = {(х, у): (х — а2J + (у — &гJ = с|} решаем одновременно уравнения (9.3.5) ахх + hy = d, (х — a2f + (у — b2f = с\. Например, если Ьх Ф 0, то у = —(ajbi) х — cjbi = dx + e и для отыскания х нужно решить квадратное уравнение (х — а2J -J-
9.3. ПРИЛОЖЕНИЯ К ЗАДАЧАМ НА ПОСТРОЕНИЕ 399 + (dx -+- е — Ь2J = с\. Существует не более двух решений этого последнего уравнения и, следовательно, не более двух точек пере- пересечения прямой и окружности (у определяется по х из линейного уравнения прямой X однозначно). Итак, координаты точек пере- пересечения (если такие существуют) прямой и окружности могут быть найдены через коэффициенты определяющих эти линии уравнений с полющью рациональных операций и операции извлечения квадрат- квадратного корня из неотрицательного действительного числа. Наконец, чтобы найти точки пересечения двух окружностей, решаем одновременно уравнения вида (9.3.6) (х - а,У + (у- Ь,Г = с\, (х - a2f + (y- b2f = 4 Вычитанием одного уравнения из другого получаем линейное уравнение Bа, - 2а2) х + Bbt - 2b2) у = (с\ - с?) + (о? - а$ + (Ь\ - 6|), так что совместно нужно решить это последнее уравнение и любое из уравнений (9.3.6). Если окружности имеют общий центр, то они либо совпадают, либо их пересечение пусто. Если же центры не совпадают, т. е. (аи bi) Ф (а2, Ь2), то мы опять видим, что суще- существует не более двух точек пересечения двух окружностей с различ- различными центрами, причем координаты точек пересечения могут быть найдены через коэффициенты определяющих эти окружности урав- уравнений с помощью рациональных операций и операции извлечения квадратного корня из неотрицательного действительного числа. Построения с помощью циркуля и линейки. Построения с по- помощью циркуля и линейки проводятся, отправляясь от некоторого конечного множества исходных данных — точек, прямых, окружно- окружностей. Построение должно состоять из конечного числа шагов, на каждом из которых проводятся новые прямые и окружности, нахо- находятся новые точки. Точнее говоря, на каждом из шагов мы можем выполнить одно из следующих действий: (9.3.7) (а) По двум данным различным точкам Р\, Рг провести (единственную) прямую, проходящую через них. (б) По данным трем точкам Pi, Qi, Q2, из которых последние две различны, провести окружность с цен- центром в точке Ри каждая точка которой удалена от Р, на расстояние, равное расстоянию между Qi и q2. - ттт (в) По двум данным прямым ХиХ2 построить их точку пересечения. (г) По данным прямой Х± и окружности % построить их точки пересечения (если такие есть). (д) По данным двум окружностям %, и %2 построить их точки пересечения (если такие есть).
400 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ Рассматривая построения в декартовой плоскости Re x Re, естественно считать, что исходные данные задаются координата- координатами х, у каждой точки, коэффициентами а, Ь, с уравнения (9.3.1) прямой, координатами a, b центра и радиусом с уравнения (9.3.2) окружности. На каждом этапе построения координаты точек, коэффициенты уравнений линий находятся применением только рациональных операций и операции извлечения квадратного корня из неотрицательного действительного числа. В самом деле, для построений (9.3.7) (в), (г), (д) мы уже это видели. Рассмотрим построе- построение (9.3.7) (а). Пусть заданы любые Х\, уи х2, Уг 6 Re такие, что (хи г/0 ф (хг, у2)- Нам нужно найти уравнение прямой, проходящей через эти точки. Как известно, при x4 = x2 искомое уравнение есть х = хи а при х2 ф Xi им будет (у — у^Цх — х{) = (у2 — #i)/(*2—*i)- В обоих случаях уравнение приводится к виду ах + by = с, где а, Ь, с выражаются через хи уи х2, y'z с помощью только рациональ- рациональных операций. Рассмотрим построение (9.3.7) (б). Очевидно, по заданным а, Ъ, *i> yi, х2, у г нужное уравнение пишется так: (х — аJ + (у — ЬJ = = с2, где с = V(х2 — XiJ -\- (у2 — #iJ, и опять использованы толь- только рациональные операции и операция извлечения квадратного корня. Из сказанного, в частности, вытекает (9.3.8) Пусть координаты исходных точек, коэффициенты исход- исходных прямых и окружностей принадлежат некоторому множеству А и пусть К — Gen (А). Если точка (х, у) может быть построена с помощью циркуля и линейки, исходя из данного множества, то существует такая последовательность К\ ^ Кг ^ • • • ? Kq+i = L под- полей поля действительных чисел Re, что (i) Ki = К; 00 Kj+i = Kj (Vuj) для всех j = 1, . . ., q, где Uj?Kj и Uj> 0; (iii) x,yeL. Оказывается, верно и обратное утверждение. (9.3.9) Если х, у 6 L для такого расширения L поля К, как в (9.3.8), то точка (х, у) может быть построена с по- помощью циркуля и линейки, исходя из некоторого конечного множества точек с координатами в К- Для доказательства заметим прежде всего, что достаточно уметь строить точки вида (х, 0) и @, у) для любых х, у ^ L, поскольку точка (х, у) может быть построена как пересечение двух прямых — горизонтальной и вертикальной, проходящих соответственно через @, у) и (х, 0). Приведем, например, доказательство возможности построения (х, 0) (для точек вида @, у) доказательство ничем не
9.3. ПРИЛОЖЕНИЯ К ЗАДАЧАМ НА ПОСТРОЕНИЕ 401 Рис. 47. отличается). Фактически, нам нужно доказать, что множество точек вида (х, 0), х ? L, которые могут быть построены, замкнуто относи- относительно операций +, —, •, ~г и содержит К- Последнее утверждение, так же как и замкнутость относительно операций + и —, не вызы- вызывает сомнений. Метод построения точки (xt -x2, 0) (в случае xit х2 > 0) виден из рис. 47. Здесь О = @, 0), Pt = (хи 0), Х± — про- произвольная прямая, проходящая через О, отличная от оси х; точка Qt отстоит от О на расстояние, равное расстоянию от A, 0) до О, a Q2 от- отстоит от Qi на то же расстояние, что и (х2, 0) от О. Прямая Х2 проведена параллельно отрезку QiPi стандарт- стандартным школьным методом, Р2 — пере- пересечение прямой Х2 с осью л;. Хорошо 0\ известно, что \lx\ = x2/w, так что до = #i -х2 и замкнутость относительно умножения доказана. Меняя в этом рассуждении местами х2 и w, получаем построение xjx2 и потому замкнутость относительно операции -1 (заметим, что таким способом могут быть построены точки (х, 0) для любого рационального х — это уже указывалось в п. 7.1). Метод построения Ух виден из рис. 48. Здесь Р — точка (х, 0), А — точка, расстояние кото- которой от Р равно расстоянию между A,0) и О, Q — середина от- отрезка О А, % —• окружность с центром в Q, проходящая через А, ВР — перпендикуляр, опущенный из В на О А. По построению треугольник ОБА прямоугольный, так что треугольники ОРВ и ВРА подобны, и x/w = до/1, откуда w** = х и w = Ух. Строя на оси х точку В', отстоящую от О на расстояние, равное расстоянию между В и Р, получаем искомую точку (Ух, 0). Алгебраический эквивалент за- задач на построение. Поскольку точ- точного определения геометрии дано не было, все рассуждения по не- необходимости приходится считать лишь схемой, наброском. Однако, имея в виду утверждения (9.3.8) — (9.3.9), можно надеяться, что читатель согласится принять в качестве эквивалента понятия построения с помощью циркуля и линейки следующее уже чисто алгебраическое определение: 9.29. Определение. Предположим, что А ^ Re и х, у 6 6 Re. Будем говорить, что точка (х, у) конструируема из А, если существуют такие конечные последовательности В О Кг, • • ., а чисел, что подполей поля Re и «i, u2, иа действительных
402 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ (i) Ki = Gen (А); (ii) uj 6 Kj и Uj>0 для всех } = 1, . . ., q; (iii) Kj+i = Kj (Vu,j) для всех / = 1, . . ., q; (iv) x, у е Kq+i- Будем говорить, что (х, у) конструируема, если (х, у) конструируема из пустого множества. Отождествляя точки (х, у) декартовой плоскости и комплексные числа х + \у, получаем следующее формальное обобщение опреде- определения 9.29. 9.30. Определение. Предположим, что В s С и w ? С. Будем говорить, что w С-к онструируемо из В, если существуют такие конечные последовательности К\, Kz> • • ¦> подполей поля С и ги (i) Ki = Gen (В); , (ii) z) 6 Kj для всех / = 1, . . ., q; (iii) Kj+i. = ^ {Z}) для всех j = 1, . . ., (iv) a> 6 Будем говорить, что w С-конструируемо, если оно С-кон- струируемо из пустого множества. Геометрическим рассуждением, подобным приведенным при доказательстве утверждений (9.3.8) — (9.3.9), можно показать, что определение 9.30 фактически не шире определения 9.29; мы сейчас дадим этому прямое алгебраическое доказательство. 9.31. Теорема. Предположим, что BsC, w = х + \у, где х, у 6 Re, и что А состоит из всех таких а ? Re, что а + \Ь 6 В или Ъ + а\ ? В для некоторого Ь. Число w С-конструируемо из В тогда и только тогда, когда (х, у) конструируемо из А. Доказательство. Если (х, у) конструируемо из А, то существуют последовательности Ki, • • •, Kq+i', «1, . • ., uq, удов- удовлетворяющие условиям 9.29; в частности, Ki = Gen (А). Пусть z0 = i, Zj — У~п} Для всех / = 1, . . ., q и К'о = Gen (В), K'j+i = = K'j (Zj) для всех / = 0, . . ., q. Очевидно, последовательность К'о, К[, ¦ ¦ •> K'q+i удовлетворяет условиям 9.30 (i) — (iii), причем Kj s K'j для всех / = 1, . . ., q. Следовательно, х, у, \ 6 K'q+u так что w 6 K'q+\ и w С-конструируемо из В. Обратно, если w С-конструируемо из В, то найдем последователь- последовательности Ки ¦ ¦ -, Kq+й Zi zq, удовлетворяющие условиям 9.30. Пусть A) z^Sj + itj при j=l, Тогда в силу 8.9
9.3, ПРИЛОЖЕНИЯ К ЗАДАЧАМ НА ПОСТРОЕНИЕ 403 B) Zj или —Zj есть одно из чисел \dz) 2 г I2 Положим C) Lt = Gen (A), Lz = Lt (\/~2) и для любого /=1,2, ..., q = l3J = L3j+i Каждое Ki, 1=1, ..., q+l, можно рассматривать как Gen(B\J [}{zt. ..., zj-i}). Пусть M+iy?5U{zi, •• •, zM}; из A) —C) и опре- определения множества А следует, что и, y?L3<j-i)+2 или, согласно 9.3 (iv), D) если u-\-\v принадлежит то и, v?^з</-1>+2 для всех 1—1, ..., q-{-l. В частности, для каждого у = 1, ..., q, из г) ? Kj следует Sj, tj€L3o-i)+2 и потому E) Но тогда также F) для каждого / = 1, .. ., q 3J и В силу очевидных неравенств из E) — F) следует, что для последовательности подполей Lj, ..., L3q+2 выполняются соотношения Lt — Gen (А) и Lb+1 = — Lft (Кгь), й= 1, ..., 3^+ 1, где rh?Lh и гь>0. Удаляя из этой последовательности все повторения с Гй = 0, получаем последова- последовательность, удовлетворяющую условиям 9.29 (i) — (Hi). Но в силу D) из w = x-{-\y^Kq+i заключаем, что х, y?L3q+2 и потому (х, у) конструируема из А. С алгебраической точки зрения обычно удобнее иметь дело с С-конструируемостью числа w = х + \у, чем с конструируемо-
404 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ стью «точки» (х, у). Сейчас мы продемонстрируем простой алгебраи- алгебраический критерий С-конструируемое™, который и послужит главным инструментом при изучении классических задач на построение. Заметим, прежде всего, что С-конструируемость из В идентична с С-конструируемостью из Gen (В), так что можно ограничиться рассмотрением С-конструируемости из подполей С. 9.32. Теорема. Пусть К. — подполе поля С и w ? С. Если w С-конструируемо из К, mow алгебраическое над К и [К (и>): Ю = 2" для некоторого п ^ 0, п 6 I. Доказательство. Найдем по w последовательности Ki, ¦ ¦ ¦, Kq+i подполей поля Сиг,,..,, г, комплексных чисел, удовлетворяющие условиям 9.30 (в нашем случае Ki = Ю- Полагая dj = z) для каждого / = 1, . . ., q, убеждаемся, что z,- —¦ корень нормированного полинома ?2—dj ? Kj Ш- Если этот полином прост в К; Ш, то [/0+1 : К А = 1К} (г}) : К}\ = 2. Если же ?2 — dj не прост, то он содержит линейный множитель ? — zf, в этом случае zj 6 Kj и iKj+i '¦ Kj] = 1. Согласно 9.28, Kq+i есть поэтому конеч- конечное расширение поля К, причем [Kq+i '¦ К\ — 2т для некоторого т ^ 0. Но w 6 Kq+u так что, вследствие 9.24 и 9.27, w алгебраиче- алгебраическое над К и \К (w) : Ю I 2m, что и требовалось доказать. При некоторых дополнительных ограничениях на К (z) верно обращение теоремы 9.32, однако его доказательство требует достаточно тонких рассмотрений и выходит за рамки нашей книги (частный случай этой теоремы предложен в упражнениях к этому разделу). Сами же теоремы 9.31 и 9.32 могут быть использованы для доказательств неразрешимости некоторых задач на построение с помощью циркуля и линейки. Некоторые классические задачи на построение. Проблема удвое- удвоения куба состоит в построении по данному отрезку PiP2 такого отрезка Q1Q2, чтобы куб с ребром QiQ2 имел вдвое больший объем, чем куб с ребром Р\Р%. Если такое построение возможно, то возмож- возможно, исходя из пары точек @, 0) и A, 0), построить точку (х, 0), для которой Xs = 2, т. е. в таком случае число у^2 было бы С-конструи- С-конструируемо из Ra. Но единственным нормированным полиномом р (?) ? ? Ra Ш, неприводимым над Ra и имеющим у 2 в качестве корня, является р (I) = 13 — 2. Следовательно, [Ra (У2) : Ra] = 3. Поэто- Поэтому в силу теоремы 9.32 проблема удвоения куба с помощью циркуля и линейки неразрешима. Начальные данные для задачи о трисекции угла состоят из двух пересекающихся прямых или трех различных точек. Предположим, что у нас есть метод трисекции любого угла 6 с помощью циркуля и линейки. Тогда возможна и трисекция любого острого угла 9, заданного точками Рх = A, 0), Р2 = @, 0) и Рэ = (х, у) на единич- единичной окружности; в этом случае х = cos 9, у = sin 9 (рис. 49). Пусть данный угол в радианной мере равен 6. Тогда конечный этап
9.3. ПРИЛОЖЕНИЯ К ЗАДАЧАМ НА ПОСТРОЕНИЕ 405 построения представим в следующем виде (рис. 50). Если задача (й Ч COS -g" , Oj , опуская из Р'3 перпендикуляр на ось х. Начальные данные при этом состоят из рациональных чисел и cos 6, поскольку sin Э = = У\ — cos2 Э конструируемо из Ra и cos Э. Пусть w =cos -^- о Из (8.1.3) мы знаем, что w — корень полинома / (?) = ?3 —j- Ъ, — — -j- cos 6 и, следовательно, полинома 4?3— 3?— cos Э. Пусть К = Ra (cos 6). Если / (?) не имеет корней в К., то / (?) неприводим Pj(cos&,sin0/ [cos 8,0) pt(i,o) Рис. 49. Рис. 50. над /С и \К (w) : /С] = 3. В противном случае [К (w) : Ю = 1 или [К (w) : Ю = 2. Если [/С (w) : Ю = 1, то ш 6 /<" и потому w конструируемо из К, если же [К (w) : Ю = 2, то а» — корень полинома второй степени, неприводимого над К, следовательно, может быть получен присоединением к К квадратного корня и пото- потому w опять-таки конструируемо из К- Итак, при начальных данных, изображенных на рис. 49, угол с радианной мерой Э допускает три- трисекцию с помощью циркуля и линейки тогда и только тогда, когда 3 1 полином / (?) = ?3 — -j i — ~j cos 6 имеет корень в Ra (cos 0). Но нетрудно найти много различных углов 0, для которых / (|) не имеет корней в Ra (cos 6). Например, для Э = я/3 = 60° имеем cos Э = — и Ra (cos 0) = Ra. Но в силу 6.19 любой рациональный 3 1 корень blc (н. о. д. (Ь, с) = 1) полинома Is — -^ I — -g-, а по- потому и полинома / (?) = 8?3 — 6? — 1 удовлетворяет условиям Ъ \ 1 и с | 8. Итак, корнями могут быть только ±1, ± yii -г и ± "я" • Прямая проверка показывает, что среди этих чисел корней нет (ср. упражнение 2, где-намечено более короткое доказатель- доказательство). Итак, задача трисекции угла, вообще говоря, неразрешима с помощью циркуля и линейки.
406 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ Правильные многоугольники; решение Гаусса. Мы закончим рас- рассмотрение этой группы задач обсуждением следующего вопроса: для каких значений п ? Р, п ^ 3 возможно построение правильного п-угольниш? Прежде всего, легко заметить, что если для некото- некоторого п такое построение возможно, то можно построить также центр описанной вокруг этого многоугольника окружности, а затем правильный n-угольник, вписан- вписанный в окружность радиуса 1. (cos —, sin —/ Поэтому возможно построение п правильного «-угольника, впи- вписанного в окружность единичного радиуса с центром в @, 0) (рис. 51). Но тогда по теореме 9.32 должен быть С-конструируе- мым первообразный корень п-й степени из 1, с,п = c°s г Рис. 51. 2я п % + i sin —. Пусть qn (|) — един- единственный нормированный простой полином в Ra [|], для которого t,n является корнем. Для вычисления [Ra (?n) : Ra] = ф (п) нам нужно найти этот полином и его степень. Можно показать, что ф (п) равно количеству целых чисел т, 1 ^ т < п, взаимно простых с п, (т, п) — 1. Общее вычисление ф (п) (функцию ф (п) часто называют функцией Эйлера) производится через разложение числа п на про- простые множители: (9.3.10) Если n = 2m°p™i ... p™j (где членов p™s возможно, вообще нет), каждое mi+l>0, числа рх, ..., р} — раз- различные нечетные простые, то отсюда исключается 2m*~x, если т0 = 0). Поэтому [Ra (t,n) '¦ является степенью числа 2 тогда и только тогда, когда п предста- вимо в виде п = 2m°pt • . . . -ph где ри • • •, pj — различные нечет- нечетные простые числа, для каждого из которых pt — 1 есть степень числа 2. Приходим, таким образом, к рассмотрению простых чисел вида р = 21 + 1. Но, если / имеет хотя бы один нечетный делитель, скажем т, то р = 21 + 1 = 2тз + 1 — число, делящееся на 2s + 1 (см. упражнение 6) и потому не простое. Следовательно, / = 2k и р = 22h + 1. При k = 0, 1, 2, 3, 4 получаем числа 3, 5, 17, 257, 65537, каждое из которых, как можно проверить, просто. Однако уже при к = 5 соответствующее число, т. е. 22' + 1, не просто (и неизвестно,
9.3. ПРИЛОЖЕНИЯ К ЗАДАЧАМ НА ПОСТРОЕНИЕ 407 существует ли бесконечно много простых чисел вида 22 +1, называемых простыми числами Ферма). Общий результат теперь можно сформулировать так: Если п не представимо в виде 2"V • • • -Pi (m^O, 1^0), где pi, . . ., р; — простые числа Ферма, то задача построения пра- правильного п-угольника с помощью циркуля и линейки неразрешима. В частности, для п = 7, 9, 11, 13, 14, 18, 19, ... построить правильный n-угольник невозможно. С другой стороны, со времен греческих геометров известно, как построить правильные треуголь- треугольник (п = 3), пятиугольник (п — 5), 15-угольник, а потому и n-угольники для любых п вида 2т -3, 2т -5 и 2т -3 -5, где т любое. В частности, можно построить правильные «-угольники для п = 3, 4, 5, 6, 8, 10, 12, 15, 16. Однако до Гаусса оставалось неизвестным, возможно ли построение правильного 17-угольника. Гаусс не толь- только доказал возможность этого, но и показал, что приведенное выше описание полно: если п = 2mpi • . . . -рь (т ^ 0, / ^ 0), где ри ... ¦ • •, Pi — простые числа Ферма, то с помощью циркуля и линейки задача построения правильного п-угольника разрешима. Полное доказательство обоих утверждений выходит далеко за рамки этой книги, мы же ограничимся указанием, как они могут быть получены в частном случае, когда п простое (мы будем его обо- обозначать в дальнейшем р)..Детали доказательства намечены в упраж- упражнениях к этому разделу. Итак, для данного простого числа р, р ^ 3, и числа ? = 2л ... 2л = cos— -+- I sin — прежде всего нужно найти единственный нор- нормированный полином q (|), простой в Ra [|], для которого ? — корень. Мы знаем, что ? — корень полинома |р-1 + ?р~2 + ••• • • • + 1; можно доказать (см. упражнение 5), что это и есть нужный полином. Тогда [Ra (?) : Ra] = р — 1, и, конечно, р — 1 равно числу таких т, что 0 ^ т < р и т взаимно просто с р. Итак, в силу теорем 9.31 и 9.32, если р простое и правильный р-угольник можно построить с помощью циркуля и линейки, то р = 21 + 1 и, как говорилось выше, р = 22h + 1, т.е. р — простое число Ферма. Чтобы доказать обратное утверждение, используем следующий результат (см. упражнение 8): Пусть К. — подполе поля С, Zi — корень полинома q (%) ? К Ш, другими корнями которого являются г2, ¦ ¦ ., гп. Пусть, далее, К (z,) = К (zj) для всех i, / и IK (zO : Ю = = 2т для некоторого т ^ 0. Тогда zt С-конструируемо из К.. (Это, конечно, частичное обращение теоремы 9.32.) В нашем случае корнями полинома q (|) = \р~х + ?р~2 + • • • + 1 являются ?, ?2 ^v~1. Известно (упражнение'12 к п. 8.1), что Ra (?l) = = Ra (?) для всех i = 1, . . ., р — 1. Следовательно, сформули.
408 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ рованное утверждение применимо, и прямо получаем: если р — простое число Ферма, то можно построить правильный р-угольник с помощью циркуля и линейки. Анализируя приведенное доказательство, можно в принципе извлечь и способ построения правильного р-угольника для простого числа Ферма р. На практике это не так просто. Хотя Гаусс развил систематическую процедуру для требуемого построения, при больших р она остается достаточно трудной; для первого нетривиального же случая р = 17 она тем не менее успешно используется. Гораздо более простой случай р = 5 разбирается следующим образом. Из 1 = ?5, где ? = cos -=- -J- i sin ¦=-, получаем t,'1 — S4 и t,'2 = ?3, и потому 0 = ? + Is + ?2 + ? + 1 = (Г2 + ?2) + (Z~l + 0 + 1. Полагая w = tr1 +1, получаем w2 = ?~2 + 2 +?2, т. е. ш2+ w— 1 = 0. Корнями этого полинома являются (—1±}/Л5)/2. Поскольку w%=2cos2jr- (из r1 = cos-^--isin-^-) , точка (cos-^-.O), / 2я . 2я \ с. а потому и точка I cos-?-, sin—^-1 , соответствующая ?, могут быть построены. Понятие С-конструируемости из поля К является частным слу- случаем общего понятия конструируемости из поля К. посредством рациональных операций и извлечения корня п-й степени. Точнее, будем говорить, что комплексное число w конструируемо, если суще- существуют такие конечные последовательности К и Кг, ¦ ¦ ¦, Kq+i подполеи поля С, zb г2, . . ., zg комплексных чисел и лъ . . ., nq положительных целых чисел, что (9.3.11) (I) Ki = K, (ii) zn.i 6 Kj для всех j == 1, . . ., q, (iii) Kj+i = Kj (Zj) для всех j = 1, . . ., q, (iv) W 6 Kq + i- Будем говорить далее, что уравнение / (w) = 0 разрешимо в ради- радикалах над К, где / (?) ? К Ш, если существует по меньшей мере один корень этого уравнения w, конструируемый из К в нашем смысле. Как и в 9.32, если такое решение существует, то К (w) обладает некоторыми специфическими свойствами, которыми не обладает произвольное простое алгебраическое расширение. Однако теперь эти свойства выражаются не только через размерность [К (w) : К], а требуют для формулировки описания возможных подполеи поля К (w) и их связей. Такое описание, дающееся в теории Галуа, ведет к результатам о разрешимости и неразрешимости уравнений в радикалах, как это описывалось в конце предыдущей главы.
9.4 ЗАКЛЮЧЕНИЕ 409 Упражнения 1. Проблема квадратуры круга состоит в отыскании стороны квадрата, равного по площади заданному кругу. Почему эта проблема неразрешима с помощью циркуля и линейки? 2. Пусть р (I) = 4|3 - 31 + у. Показать, что 1р A/2) = 1» - 31 + 1„ Использовать последнее для короткого доказательства неприводимости р (?)• над Ra (ср. доказательство невозможности трисекции угла я/3 с помощью циркуля и линейки). 3. Пусть 0 = 2я/7. Показать, что cos 0 есть корень полинома I3 + I2 — — 21 — 1. (Указание. Показать вначале, что cos 49 = cos 39, и затем использовать уравнения для отыскания cos 39 и cos 49 через cos 9.) Дать теперь прямое доказательство невозможности построения правильного семи- семиугольника с помощью циркуля и линейки. 4. Доказать следующее утверждение (теорема Эйзенштейна). Пусть. р — простое число и / A) = ап\п + a^-il11 + • ¦ ¦ + ао, п > 0, at 6 I. Если ап ф 0 (mod p), at = 0 (mod р) для всех i = 0 п — 1, но «о$0 (mod р2), то полином /A) прост в Ra [1]. [Метод. Рассмо- Рассмотреть Ш = (V 1"Ч Ь b0) (ck I* H Ко), где все Ьи а 6 I. Тогда одно и только одно из Ьо, с0 делится на р. Пусть, например, Ьа ф 0 (mod p), ?о = О (mod p). С другой стороны, с^ ф 0 (mod p). Рассмотреть единственное i > 0 с с; Ф 0 (mod р), но с0, cj, ¦ • -,c,_i = 0 (mod p) и исследовать at (mod p).. Показать, что i = и]. 5. Пусть р простое и <? A) = lp-1 + 1Р~2 + • • • + 1 + 1- Показать, что полином q A) неприводим над Ra, применив теорему Эйзенштейна к поли- полиному q A + 1). (Указание: </(?) = A? - 1)/A - 1).) 6. (i) Показать, что если / = т-п и т нечетно, то 2П + 1 делит 21 + 1. (П) Показать, что если р = 21 + 1 простое, то / = 2к для некоторого k. 7. Пусть К, — подполе поля С, Zi алгебраическое над К, но t\ (| i<T и пусть 9 A) — единственный нормированный полином, неприводимый над К, для которого Zi является корнем. Пусть, далее, 9 A) = A — г4)- . . . •(! — г„\ и К. (г^ — К (zj) для всех /; положим w = Q (гг — г^), так что w2 — дискриминант полинома q A). Показать, что (a) w* е К, (б) w $ К, (в) [К И : /С] = 2. Для доказательства (б) предположить да 6 К и воспользоваться теоремой 9.14. 8. Пусть К, Zi и q A) удовлетворяют предположениям предыдущего' упражнения. Предполагая \К. (zi) : К] — 2т для некоторого т > 0, пока- показать, что Zi С-конструируемо из К- 9.4. Заключение Даже если бы построение и развитие различных числовых систем,, изложенное в книге, исходило только из эстетических соображе- соображений — желания посмотреть на предмет с единой, общей точки зре- зрения,— полученный результат следовало бы считать поразительным интеллектуальным достижением. Еще более замечательным является, то, что для анализа проблем, вполне элементарных по своей фор- формулировке, оказывается необходимым столь сильно развитый аппа- аппарат. Мы уже сталкивались с этим при рассмотрении задач на построе- построение с помощью циркуля и линейки: даже построение правильного»
410 ГЛ. 9. ПОЛЯ АЛГЕБРАИЧЕСКИХ ЧИСЕЛ И РАСШИРЕНИЯ ПОЛЕЙ ¦семнадцатиугольника требует применения различных нетривиаль- нетривиальных идей из алгебры комплексных чисел. Существует также много проблем, касающихся положительных целых чисел, требующих для своего изучения глубокого развития •отдельных ветвей теории, в частности, теории полей алгебраиче- алгебраических чисел и специальных подобластей этих полей, больших раз- разделов комплексного анализа. Областями математики, в которых такая техника играет особую роль, являются алгебраическая теория чисел и аналитическая теория чисел. К первой из этих областей относится так называемая чвгликаяь или «последняя» теорема Ферма, согласно которой уравнение хп + Уп — 2п неразрешимо в положительных целых числах при п > 2. Сам Ферма на полях одной из книг написал, что он нашел доказательство этой теоремы, но до сих пор никто такого доказа- доказательства представить еще не смог (что делает вполне вероятным предположение, что и в рассуждении Ферма была ошибка). Для некоторых частных значений п теорема Ферма доказана. Впервые важные результаты в этом направлении были получены Куммером, использовавшим теорию идеалов алгебраических чисел (в конечных расширениях рациональных чисел), построенную Дедекиндом и Кронекером. Теорема о распределении простых чисел для своего доказатель- доказательства потребовала существенного использования комплексного ана- анализа. Согласно этой теореме, количество положительных простых чисел, не превосходящих данного п (обозначается к (п)), асимпто- асимптотически близко к n/log n, т. е. (логарифм берется по основанию е). В виде гипотезы эта теорема была высказана Гауссом, а.впервые доказана лишь в конце XIX сто- столетия в работах Адамара и Балле Пуссена *). В последнее время такие теоремы в некоторых случаях были заново доказаны уже элементарными методами. Для распределения простых чисел, например, это было сделано Эрдешем и Зильбергом с помощью весьма сложных рассуждений. Однако методы аналити- аналитической теории чисел остаются основными при рассмотрении многих теоретико-числовых проблем, формулировки которых вполне эле- элементарны. Таким образом, изучение расширений основных числовых полей оправдывается не только желанием совершенствовать теорию, *) Первый, кто после Евклида пошел верным путем в вопросе о простых ¦числах и достиг важных результатов, был П. Л. Чебышев. Чебышев показал, что число простых чисел, не больших данной величины х, приближенно равно jc/log х.— Прим. ред.
9.4. ЗАКЛЮЧЕНИЕ 411 но и многочисленными практическими приложениями. К необходи- необходимости расширения полей приводят решения различных конкретных математических проблем. Как это уже было в свое время с аксиоматикой евклидовой гео- геометрии, изложенная в книге теория возникла при обобщении и систематизации большого числа известных фактов. Возникшая теория находила неожиданное применение, порождала новые теории и стимулировала развитие других. Это развитие укладывалось в рамки новой точки зрения, появив- появившейся в последнем столетии, согласно которой математика пред- представляет собой единое целое. Читателю следует рассматривать теорию числовых систем не только как завершение начатой систематизации, но также как начало нового этапа в развитии математики, приводящего к изу- изучению чрезвычайно интересных взаимоотношений между различ- различными областями математики — взаимоотношений, раскрытие кото- которых стало возможным только благодаря этой новой точке зрения.
ДОБАВЛЕНИЕ I НЕКОТОРЫЕ АКСИОМЫ ТЕОРИИ МНОЖЕСТВ Как мы видели в п. 2.1, неограниченное использование понятия «произвольного» множества может вести к противоречиям, например к парадоксу Рассела. Цель аксиоматической теории множеств — сделать явными различные утверждения о множествах, которые могли бы быть приемлемыми и в то же время не вели бы к противо- противоречиям. Эти утверждения должны быть достаточно сильными, чтобы позволить построить основания для всех математических понятий и конструкций, по крайней мере для тех, которые использованы в*этой книге. В различных местах главы 2 мы уже указали ряд принципов, которые вместе с допущением 3.2 (о существовании хотя бы одной системы Пеано) оказались удовлетворяющими всем высказанным условиям. Цель этого добавления — собрать вместе все эти разнообразные принципы и придать им такую форму, в кото- которой их проще изучить. Первые подходящие предложения о системе аксиом для теории множеств были сделаны Цермело в 1908 г. Его система достаточна, чтобы служить базисом для всей работы, проведенной в этой книге, так же как и для работ во всей классической алгебре, анализе и гео- геометрии. Более сильные системы нужны для развития математиче- математической теории множеств, канторовой теории кардинальных и орди- ординальных чисел и для новейших математических построений, бази- базирующихся на указанных теориях. Несколько таких систем было предложено Френкелем, фон Нейманом, Бернайсом, Гёделем и Куайном. Мы удовлетворимся здесь описанием одной системы, по существу столь же сильной, что и система Цермело. Сначала мы могли бы подумать, что нам надо иметь дело с объек- объектами двух родов: сначала с объектами, называемыми индивидуалами, и затем с некоторыми объектами, называемыми множествами, кото- которые будут каким-то образом последовательно строиться из индиви- индивидуалов — например как множества индивидуалов, множества мно- множеств индивидуалов и т. п. В частности, мы могли бы представлять себе положительные натуральные числа как некоторую базисную совокупность индивидуалов и затем строить из них при помощи понятия множества все остальные математические объекты вроде целых чисел, рациональных чисел, вещественных или комплексных чисел. Однако оказывается, что как только у нас есть понятие пустого множества и основные принципы существования множеств,
НЕКОТОРЫЕ АКСИОМЫ ТЕОРИИ МНОЖЕСТВ 413 мы уже в состоянии доказать существование множества Р, элемен- элемента 1 и операции Sc на Р таких, что (Р, Sc, 1) будет системой Пеано. Поэтому допущение существования особых «индивидуалов» излишне и мы теперь примем, что все рассматриваемые основные объекты суть «множества». Мы будем также полагать, что областью изме- изменения всех переменных х, у, г, А, В, С, М, S и т. д. является со- совокупность всех множеств. Так, например, выражение «для каж- каждого х имеет место Jk (x)» будет значить то же самое, что и «для каждого множества х имеет место Л (х)», а выражение «сущест- «существует S такое, что <Р (S)» будет значить то же, что и выражение «существует такое множество S, что & (S)». Основными понятиями нашей теории будут два отношения между множествами, именно, отношение тождества, или равенства = и отношение ? быть элементом. Как обычно, отношение неравен- неравенства и отношение не являться элементом будем обозначать через ф и ({. Основными аксиомами об отношениях = и 6 являются следующие: Аксиома 1. Для любого х имеем х = х. Аксиома 2. Для любых х, у, если х = у, то у = х. Аксиома 3. Для любых х, у, г, если х = у и у = г, то X = Z. Аксиома 4. Для любых х, у, если х = у, то х ? z для любого z тогда и только тогда, когда у ? г, и w ? х для любого w тогда и только тогда, когда w ? у. Аксиома 5. Для любых А, В, если для каждого х отношение х 6 А равносильно х 6 В, то А = В. Первые четыре аксиомы выражают логические аспекты отно- отношения равенства и для него соответствующие утверждения прини- принимаются в качестве справедливых в любом математическом контек- контексте. Аксиома 5, однако, является специфически теоретико-множе- теоретико-множественной. Она называется аксиомой экстенсиональности *) и пока- показывает, что каждое множество вполне определяется своими элемен- элементами [ср. B.1.23)]. Мы теперь хотим дать несколько аксиом существования множеств. В качестве начальной возьмем аксиому, гарантирующую существо- существование хотя бы одного множества. (В большинстве логических систем такая аксиома является выводимым утверждением.) Простейшее множество — это пустое множество. Аксиома 6. Существует такое А, что х $ А для каждого х. Согласно экстенсиональности любые два множества, обладающие этим свойством, равны. Поэтому мы можем ввести следующий объект B.1.33). Определение 1.0 есть единственное А такое, что х $ А 'для каждого х. *) Иногда ее называют аксиомой объемности.— Прим. ред.
414 ДОБАВЛЕНИЕ I В общем случае понятие «единственное х, такое, что Л (л;)» заведомо может быть введено, если Л (х) является условием, для которого уже доказано, что (i) существует х, для которого Л (х)\ (и) для любых х, у, если Л (х) и Л (у), то х — у. Теперь мы примем аксиому, позволяющую строить неупорядо- неупорядоченные пары. Аксиома 7. Для любых a, b существует такое А, что х ? А для каждого х тогда и только тогда, когда х = а или х = Ъ. Снова согласно экстенсиональности для каждых а, Ъ мы имеем лишь одно множество А, удовлетворяющее указанным условиям. Определение 2. Для любых a, b символом {а, Ь) будет обозначаться единственное А, удовлетворяющее условиям аксиомы 7. Полагаем {а} = {а, а) для любого а. Как замечено в упражнении 1 к п. 2.3, нет необходимости вво- вводить упорядоченные пары как новые неопределимые понятия. 'Определение 3. Для любых а, Ъ полагаем (а, Ъ) = = ««I- {«> Ь}}. Так же как и в упомянутом упражнении, мы можем доказать утверждение из B.3.5), что если (а, Ъ) = (с, d), то а = с и b = й, и как прежде определить (а, Ь, с) как ((а, Ь), с) и аналогично для (а, Ь, с, й) и т. д. Чтобы доказать существование множеств вида {а, Ъ, с}г {а, Ъ, с, d) и т. д., мы могли бы ввести специальные аксиомы, ана- аналогичные аксиоме 7. Однако это не необходимо, если мы можем обра- образовывать объединения множеств. Аксиома 8. Для каждого М существует такое S, что х 6 5 для любого х тогда и только тогда, когда для некоторого X ? М имеем х 6 X. Единственность снова имеет место. Определение 4. Для любого М выражение U X [X 6 Ml обозначает единственное S, удовлетворяющее условиям аксиомы 8. В частности, полагаем A U В = UX [X 6 {А, В}}. Теперь мы можем последовательно определить {а, Ь, с} = = {fl. b} U {с}, {а, Ъ, с, d) = {а, Ь, с} [} {d} и т. д. Может пока- показаться, что надо также принять аксиому, гарантирующую существо- существование пересечений и относительных дополнений. Однако мы увидим, что эти утверждения выводимы из дальнейших аксиом. Определение 5. Для любых А, В полагаем В ^ А, если для" каждого х из х 6 В вытекает х ? А. Следующая аксиома касается множества всех подмножеств. Аксиома 9. Для любого А существует такое S, что для каждого X отношение X 6 5 равносильно X s A.
НЕКОТОРЫЕ АКСИОМЫ ТЕОРИИ МНОЖЕСТВ 415 Определение 6. Для любого А через ИР (А) обозначаем, единственное S, удовлетворяющее условиям аксиомы 9. Главный принцип существования множеств — это принцип абстракции или ограниченного образования множеств B.1.39). Под условием Jk (х) мы здесь будем понимать условие специального- вида, которое можно формулировать целиком в терминах = и 6. используя при этом лишь логические связки «нет», «и», «или», «влечет», «для каждого у», «существует такое у, что» (или другую- переменную вместо у), где все переменные относятся к множествам. В следующей аксиоме Jb (х) — произвольное условие указанного- вида, не содержащее А в качестве свободной переменной, но, быть может, содержащее иные свободные переменные. Аксиома 10. Для любого S существует такое А, что для каждого х х 6 А тогда и только тогда, когда х ? S и Jk {x). Так как единственность здесь снова имеет место, то можно ввести следующее Определение 7. Для любого S обозначаем, через {х: х ? S и Jk (л;)} единственное множество А, удовлетворяющее условиям аксиомы 10. Кратко наметим, как, исходя из этих аксиом, можно дока- доказать существование пересечения, разности и декартова произ- произведения. Во-первых, заметим, что если мы можем опреде- определить п X [X ? М] и если М ф 0, то для любого S 6 М будет П X [X 6 М] s 5. Это побуждает нас ввести Определение 8. Если М = 0, то полагаем (]Х [X ? М] = = 0. Если Мф 0 uS еМ, то полагаем f] X [X ? М] = {х: х 6 5 и для любого X ? М имеем х 6 X}. В частности, полагаем А (] В = с\Х IX е {А, В}]. Нетрудно видеть, что это определение [}Х [X ? М] не зависит от выбора S ? М, когда М ф 0. Однако, чтобы применить аксио- аксиому 10, мы нуждаемся хотя бы в одном таком S. Определение 9. Для любых S и А полагаем J(S) = s — А = {х: xeS и х $ А). Снова это возможно в силу аксиомы 10. Чтобы доказать существование А х В B.3.9), принимая опре- определение 3 для упорядоченных пар, заметим, что для любых а ? А, Ъ 6 В мы имеем {а} 6 ® (А [} В) и {а, Ь) 6 ® (А [} В), откуда {{а}, {а, Ь} 6 & (& (A U В)). Поэтому вводим Определение 10. Для любых А, В полагаем А х В = = {х: х ? <^ (Ф (A U В)) и для некоторых а 6 А и Ь 6 В имеем х = (а, Ь)}. В этом определении используются аксиомы 7—9, а также аксио- аксиома 10 при S = Ф (if* {A U В)). После этого легко доказать, что для любых а 6 А и Ь ? В имеем (а, Ь) 6 А X В. Выясним еще, каким
416 ДОБАВЛЕНИЕ I образом может быть установлено существование областей определе- определения и значений B.3.15), B.3.16). Каждый элемент а области 2) (W) есть элемент некоторого {а, Ь), которое представляет собой, в свою очередь, элемент множества (а, Ь), являющегося элементом W. Иными словами, полагая Wi = \JX IX 6 W] и S = \JY [Y ? Wi\, мы должны иметь 3 (W) S S и аналогично № (W) S S. Поэто- Поэтому, если мы положим 3 (W) = {х: х ? U Y [Y e U X [X ? Ш и (х, у) 6 W для некоторого у}, то существование 3 (W) будет гарантировано аксиомами 7, 8, 10, после чего легко обнаружить, что х ? 3 (W) тогда и только тогда, когда (х, у) 6 W для некото- некоторого у. Аналогично поступаем и для областей значений. После этого так же, как было сделано в п. 2.3, можно ввести различные базис- базисные понятия, связанные с отношениями и функциями. Установив существование какого-нибудь множества S, мы можем из аксиомы 10 вывести и существование пустого множества просто как множества {х: х ? S и х Ф х]. Если из формулировки аксио- аксиомы 10 убрать ограничение на множество S, то из нее можно прямо вывести и аксиомы существования 7—9. Однако парадокс Рассела локазывает, что такая неограниченная форма аксиомы 10 ведет к противоречию и, следовательно, из нее можно тривиально вывести любое утверждение. Из приведенной выше ограниченной формы аксиомы 10, по-видимому, нельзя вывести аксиомы 7—9 и потому они должны формулироваться отдельно. Пока мы не можем доказать существование бесконечного множе- множества, хотя нетрудно доказать ряд утверждений, гарантирующих существование бесконечной совокупности различных множеств. Мы имеем в виду утверждения, что любые два из множеств 0, {0}, {{0}}, {{{0}}}> ¦ ¦ ¦ различны. Действительно, заметим сначала, что {х} Ф 0 для любого х, так как х ? {х}. Заметим также, что из {х} = {у} вытекает х = у, так как х 6 {х} в силу определе- определения 2 и потому из аксиомы 4 следует, что {х} = {у} влечет х 6 {у}, откуда, в силу того же определения 2, х = у. Итак, {{0}} Ф {0}, поскольку в противном случае согласно предыдущему мы имели бы {0} = 0. Аналогичными рассуждениями устанавливаем, что {{{0}}} Ф {0}. {{{0}}} =^= {{0}) и т. д. Существование множе- множества, содержащего все указанные множества в качестве своих эле- элементов, не может быть выведено из предыдущих аксиом. Существо- Существование его мы введем в качестве нового допущения, называемого обычно аксиомой бесконечности. Аксиома 11. Существует такое множество S, что @065м (и) для каждого x,x?S влечет {х} 6 S. Определение- 11. Пусть S — какое-либо множество, удовлетворяющее условиям (i), (ii) аксиомы И, и пусть М обозначает
НЕКОТОРЫЕ АКСИОМЫ ТЕОРИИ МНОЖЕСТВ 417 множество (X: X 6 & (S) и 0 ? X и, для любого х, х 6 X влечет {х} ? X}. Полагаем Нетрудно показать, что множество Р не зависит от выбора 5, и естественно думать о Р как о наименьшем множестве, удовлетво- удовлетворяющем требованиям (i), (ii) аксиомы 11. Теорема. Полагая Sc (х) = {х} для каждого х ? Р, имеем (О 0 е Р; (ii) если х 6 Р, то Sc (х) ? Р; (Hi) Sc (х) ф 0 для любого х ? Р; (iv) для любых х, у ? Р из Sc (x) = Sc (у) следует х = у; (v) если X ?Р и 0 ? X и для любого х из х ? X следует Sc (x) ? ? X, то X = Р. Иными словами, система (Р, Sc, 0) является системой Пеано. Другой обычный способ введения системы Пеано в теории мно- множеств состоит в том, что вместо Sc (х) = {х} полагают Sc (x) = = х U {х} и затем допускают существование множества, содержа- содержащего 0 и вместе с любым своим элементом х содержащего Sc (x). Наименьшее такое множество состоит из 0, {0}, {0, {0}}, {0, {0}, {0, {0}}} , . . ., т. е. если мы обозначим указанные мно- множества через 0, 1, 2, 3 из 0, 1 = {0}, 2 = {0, 1}, 3 = = {0, 1, 2}, ... Для некоторых теорий этот способ имеет преимуще- преимущества перед принятыми выше определениями. Из основных теоретико-множественных принципов, упомянутых в главе 2, теперь остается только один, который мы здесь еще не ввели, именно, аксиома выбора. В соответствии с B.2.16) мы ее сфор- сформулируем в следующем виде. Аксиома 12. Допустим, что М таково, что для любого Х?М,Хф0 и для любых X,Y 6 М из ХфУ следует X П Y = 0. Тогда существует такое А, что для каждого X ? М существует у, удовлетворяющее требованию A f\ X = {у}. Говоря обычным языком: каково бы ни было множество М попарно не пересекающихся непустых множеств, существует множе- множество А, имеющее в точности по одному общему элементу с каждым множеством из М. Содержание этой аксиомы довольно сложно. Некоторые более простые утверждения, эквивалентные аксиоме выбора, формулируются при помощи понятия функции. Напомним, что функция, согласно определению,— это множество F упорядочен- упорядоченных пар (х, у) такое, что для каждого х ?3 {F) существует един- единственный у, для которого (х, у) 6 F. Этот единственный у обозна- обозначается через F (х). Аксиома 12'. Предположим, что М таково, что для каж- каждого X 6 М имеем Хф0 и для любых X, Y ? М изХфУ следует
418 ДОБАВЛЕНИЕ I К П Y = 0. Тогда существует функция F, для которой 3) (F) = — Ми для каждого X ? М имеем F (X) ? X. Аксиома 12". Для каждого М существует такая функция G, что 3 (G) = {X: X ? М и X ф 0} и для любого X 6 3) (G) имеем G (X) € X. Чтобы убедиться, что аксиомы 12, 12', 12" эквивалентны при выполнении предыдущих аксиом (фактически при выполнении лишь аксиом 1—10), предположим сначала, что аксиома 12 истинна. Каждое М, удовлетворяющее условиям аксиомы 12', удовлетво- удовлетворяет и условиям аксиомы 12. Поэтому мы можем найти множество А, удовлетворяющее заключению аксиомы 12. Теперь полагаем F = = {(X, у): X в М и у ? A f\ X}. Существование F вытекает из аксиомы 10, так как F есть подмножество множества М X А, а мы уже видели, как может быть доказано существование послед- последнего множества. Ясно, что F является искомой функцией, удовле- удовлетворяющей заключению аксиомы 12'. Теперь предположим, что истинна аксиома 12'. Рассмотрим М, удовлетворяющее предполо- предположениям аксиомы 12". Элементы М не обязаны быть непересекаю- непересекающимися или непустыми. Пусть Mi = {X: X ? М и ХФ0}. Mi существует в силу аксиомы 10. Далее «разделяем» элементы Mi, полагая Мг — {X X {X}: X 6 Mi}. Существование М2 следует из Mi s Mi X ^ (Mi). Mi удовлетворяет предположениям аксио- аксиомы 12'. Беря теперь F, удовлетворяющую заключению аксиомы 12% видим, что для каждого X ? М и X ф 0 вытекает, что F (X X X {X}) = (у, X) для подходящего у € X. Пусть G = {(X, у): X ? Mi и F (X X {X}) = (у, X)}. Ясно, что G удовлетворяет тре- требованиям аксиомы 12". Наконец, легко убедиться, что аксиома 12" влечет аксиому 12. Известно большое число других предложений, эквивалентных аксиоме выбора и в отдельных случаях более удобных. Интересно вкратце проследить, как приведенные выше аксиомы входят в различные конструкции этой книги. Многие из них вклю- включают аксиому 9 существования множества всех подмножеств и аксио- аксиому 10 построения множеств. Как мы уже видели, из них в частно- частности вытекает существование декартовых произведений. В доказа- доказательстве предложения 4.21 о существовании упорядоченной области целостности D, расширяющей Р, в качестве элементов D мы взяли множества эквивалентных пар (п, т) для п, т ? Р относительно некоторой эквивалентности в Р х Р. Поэтому D ? & (Р X Р). В доказательстве теоремы 5.7 о существовании простого транс- трансцендентного расширения Е = D f|] произвольной области D мы взяли сначала множество всех псевдобесконечных последователь- последовательностей (а0, , . ., ап, . . .) элементов D. Каждая такая последо- последовательность является функцией F с 3> (F) = {п: п ? I и п^О} и Si (F) s D, откуда Fsl x D и F 6 & (I X D)- Таким образом, построенное множество есть подмножество & (I x D). При построе-
НЕКОТОРЫЕ АКСИОМЫ ТЕОРИИ МНОЖЕСТВ 419 нии поля частных для данной области целостности D E.11) исполь- используется подмножество множества &> (D X D). Однако можно обнару- обнаружить, что ни в этом случае, ни в случае построения I аксиома 9 не используется в полную силу, так как легко показать, что ни в одном из них мы не повышаем мощностей множеств, с которыми имеем дело (для D бесконечной), а из 7.63 мы знаем, что мощность &" (А) всегда больше мощности А. Единственный случай, когда указанная аксиома работает в полную силу,— это построение множества Re, безразлично, с помощью дедекиндовых сечений (как подмножества Ra) или при помощи фундаментальных последова- последовательностей. Как мы видели в 7.66, & (Р) эквивалентно (в смысле мощности) подмножеству множества Re. На самом деле, можно показать, что оР (Р) « Re. Отличие от конструкции D Ш состоит в том, что в последней использование псевдобесконечных последо- последовательностей (а0, . . ., ап, . . .) является лишь упрощающим тех- техническим приемом. С таким же успехом можно было бы воспользо- воспользоваться и множеством всех конечных последовательностей (а0, ... . . ., ап) произвольной длины п. Как мы видели в 7.69, если D счетно, то счетно и указанное множество. Вообще, если D бесконеч- бесконечно, то его мощность равна мощности указанного множества конеч- конечных последовательностей. Аксиома 8 объединений очень существенно используется в дока- доказательстве основного свойства действительных чисел: непрерывно- непрерывности их упорядочения. Лучше всего это видно из доказательства предложения 7.5, согласно которому, если (S, <;) — плотная упоря- упорядоченная система без первого или последнего элемента, то система (U (S), <0 верхних дедекиндовых сечений (описанных там) являет- является непрерывно упорядоченной. Главный шаг (9) в доказательстве должен был показать, что если А — какой-нибудь верхний класс лю- любого сечения в U (S), то U (S) — А имеет наибольший элемент Z; мы берем Z = U X [X 6 AI. (Похожее рассмотрение, но более трудное для логического выделения, содержится в доказательстве теоремы 7.31 о существовании непрерывно упорядоченного поля; главным шагом там является A7): надо показать, что каждая фундаментальная последовательность из класса Fd* (Ra) множеств эквивалентных фундаментальных последовательностей из Ra имеет предел в Fd* (Ra).) Аксиома выбора использовалась в этой книге весьма редко и во всех случаях, где она встречалась, можно было бы обойтись и без нее. Рассмотрим, например, доказательство 7.49, что если F непре- непрерывна на Re и А = {F (х): а ^ х ^ Ь), то множество А ограничено сверху. Часть рассуждений, опирающаяся на аксиому выбора, протекает так: если А не ограничено сверху, то для каждого п?Р существует х, удовлетворяющее соотношениям а ^ х ^ Ъ и п < F (х). Для каждого п € Р полагаем Н (п) = Хп = {х: а ^ х ^ Ъ и я <.F (х)} и пусть М = {Хп: п ? Р}. Следовательно, каждое
420 ДОБАВЛЕНИЕ Хп ф 0 и в силу аксиомы выбора мы можем выделить определен- определенное хп ? Хп для каждого п. Точнее, применяя аксиому 12", получим функцию G с областью определения М, причем G (X) 6 X для каж- каждого X € М. После этого полагаем хп = G (Я {п)) для каждого п. Во всем этом рассуждении можно обойтись без аксиомы выбора следующим образом. Замечаем сначала, что поскольку функция F непрерывна, то для каждого п ? Р существует у ? Ra, удовлетво- удовлетворяющий требованиям а ^ у ^ Ъ и п <zF (у). Действительно, если мы возьмем вещественное х, для которого п <cF (x), то каждое достаточно близкое к х рациональное число у из указанного интер- интервала также будет удовлетворять соотношению п <c.F (у). Полагаем теперь Yn = {у: а ^ у ^ Ь, у ? Ra и п <c.F (у)} для каждого п. Следовательно, У„ Ф 0 и К„дХ„ для каждого п. Из 7.70 мы знаем, что множество рациональных чисел счетно. Более того, сле- следуя доказательству этого результата, нетрудно найти вполне опре- определенную функцию Е с областью определения Р и областью значе- значений Ra, для которой Ra = {rm: т 6 Р}, где гт = Е (т). Поэтому для каждого п 6 Р существует т ? Р с гт ? Yn. Для каждого п 6 Р обозначаем через L (п) наименьшее из этих т (существующее ввиду вполне упорядоченности Р). Теперь, если мы положим уп = Гцп) для каждого п, то получим уп ? Yn и, следовательно, уп € Хп для каждого п, как нам и требовалось. Итак, в рассмотренном слу- случае мы смогли дать явное описание функции, осуществляющей выбор. (Не следует смешивать это с эффективным описанием — мы можем не иметь никакого способа для вычисления при любом п значения L (п), хотя и в состоянии, зная L (п), вычислить rLln) = Е (L (п)).) Вообще, если S — какое-то счетное множество и М — счетная сово- совокупность его подмножеств, например М = {Х„: п 6 Р}, то функ- функция выбора G с G (Хп) ? Хп для каждого непустого Хп может быть определена явно и потому существование ее может быть уста- установлено без аксиомы выбора. Интересующийся читатель мог бы найти другие места этой книги, в которых используется аксиома выбора, и посмотреть, как обойтись без нее в каждом из этих мест. Естественно спросить, зачем мы упоминали и использовали в этой книге аксиому выбора, если мы могли обойтись без нее. Причина в том, что очень легко не заметить, что аксиома выбора неявно входит в те или иные рассуждения. И на самом деле, то обстоятельство, что аксиома выбора была необходима для многих обычных доказательств в анализе, никем явно не отмечалось до начала 1900-х годов, когда это было сделано Цермело. Узнав однажды об этой необходимости, мы приобретаем привычку выделять роль аксиомы выбора в рассуждениях и пытаться обходиться без нее там, где возможно, при помощи иных доказательств. К сожале- сожалению, сделать это в анализе удается не повсюду. Аксиома выбора занимает в современной математике спорное положение. В противоположность остальным аксиомам существо-
НЕКОТОРЫЕ АКСИОМЫ ТЕОРИИ МНОЖЕСТВ 421 вания множеств она не описывает явно (с помощью условий, которым должны удовлетворять элементы) того множества, существование которого утверждает. Поэтому аксиома выбора основывается на другом виде интуитивной очевидности, чем остальные аксиомы. Именно по этой причине в современной математической литературе встречаются постоянные ссылки на аксиому выбора даже и там, где остальные теоретико-множественные предпосылки проводимых рас- рассуждений явно не приводятся. Как мы ранее упоминали, существуют системы аксиом для тео- теории множеств, более сильные, чем указанная выше, и употребляю- употребляющиеся в настоящее время в качестве базиса для всех известных мате- математических разработок. С другой стороны, естественно пытаться выделить минимальные теоретико-множественные предпосылки, нужные для какой-то ограниченной части математики, например классического анализа или алгебры. С этой точки зрения указанная здесь система аксиом значительно сильнее, чем необходимо. Изуче- Изучение более слабых систем и альтернативных формулировок состав- составляет предмет текущих исследований по основаниям анализа. Надлежащее понимание их требует знания некоторых предпосылок из метаматематики (логическое изучение систем математических рас- рассуждений). Такие исследования оснований математики составляют часть непрерывных усилий (ведущихся в течение всей истории мате- математики) по выяснению основных математических понятий, методов и взаимозависимостей между ними.
ДОБАВЛЕНИЕ II АНАЛИТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ТРИГОНОМЕТРИЧЕСКИХ ФУНКЦИЙ В этом приложении мы наметим два подхода к аналитическому определению тригонометрических функций cos и sin и проверке их основных свойств 8.14@ —(vi). Оба подхода предполагают известными некоторые сведения из анализа, для получения кото- которых достаточно сведений о числах, содержащихся в первых семи главах этой книги. Реализация обоих подходов по существу тре- требует только так называемой «фундаментальной теоремы анализа» о связи интеграла и производной и основных фактов о связи между знаком производной и поведением (воз- (возрастанием или убыванием) функции. Первый подход состоит в прямом аналитическом описании необходимых геометрических понятий, начиная с по- понятия угла. Мы следуем при этом учеб- учебнику Морри «Университетский курс анализа и аналитической геометрии»*). Рассмотрим на единичной окружности точку (х, у), для которой у ^ 0. Тогда х* + у2 = 1 и у = У\ — х2. Мы хотим придать точ- точный смысл словам «точке (х, У\ —х2) соответствует угол А (х)» (рис. 52). Измеренный в радианах угол /- NOP должен быть числен- численно равен удвоенной площади сектора NOP, т. е. сумме удвоенной площади треугольника OQP, где Q — точка (х, 0), и удвоенной площади, ограниченной кривой PN и отрезками PQ и QN. Тем самым мы пришли к аналитическому определению угла как функции А с областью определения {х: —1 ^ х ^ 1}, заданной формулой Q NA,0) Рис. 52. A) А(х) = 2[±-хУ~Т^+ j KT=7»S] для - X Для 0<!л:-<1 естественность такого определения ^геометрически 1 очевидна. При — 1<л;<0 величина I Vl — t2dt есть вся пло- *) С. В. М о г г е у, Jr., University Calculus with Analytic Geometry Reading, Mass., Addison-Wesley Publishing Co. ,1962, стр. 214—228, 271—274.
АНАЛИТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ТРИГОНОМЕТРИЧЕСКИХ ФУНКЦИЯ 423 щадь под окружностью между точками Q и N оси л:, в то время как -у-ху\—л:2 есть площадь треугольника OQP, взятая со зна- знаком минус, так что А(х) по-прежнему равно половине площади сектора NOP (рис. 53). Исходя из формулы A), можно доказать B) (а) для любого х, —1<*<1, существует производ- производная А'(х), причем А' (х) = — l/j/"l — x2; (б) функция А непрерывна и убывает при — (в) = 0 и — 1) = я, где я = 2 J V~l-t2dt; (г) (д) А(-х) = п — А(х) и А@) = п/2; для любого 9, О<0<я, существует единственное такое х, — 1-<л:<: 1, что A(x) = Q; если при этом 0<:9<!я/2, то соответствующее х удовлетворяет неравенствам 0 <; х <! 1. Непрерывность функции А, ее дифференцируемость и нужная формула производной легко выводятся из равенства . +1 _ * J J если воспользоваться фундаментальной теоремой анализа для вычис- х — х2 функции I ]/l — t2 dt. Тем самым (а) ления производной Л и первая часть (б) доказаны. В силу (а), А' (х) <0 при —1 <С+1 и потому А (х) убывает при — 1 ^ х ^ +1. (в), (г) проверяются не- Pfa, vi-з посредственно. Для доказательства (д) нужно воспользоваться теоремой Вейерштрасса 7.48 о нулях функций, чтобы показать существование по мень- меньшей мере одной точки х, —1 ^ х ^ 1, для которой А (х) = 9, если 0^0^ <1 я; единственность такой точки сле- следует тогда из монотонности функ- функции А. Рассуждения в случае 0 ^ 0 ^ я/2 полностью аналогичны. Следующий шаг состоит в определении на основе свойства B) (д) функций С и 5: C) (а) С(9) = * и S@) = /U^2 npu о<0<я, где х — единственное такое, что —1 ^ х <1 +1 и А (х) = 0;
424 ДОБАВЛЕНИЕ II (б) С (—8) = С (9) и S (—9) = —S (9) при —я <9<0; (в) С (9 + 2пп) = С (9) и S (9 + 2ля) = S (8) для любых 9 и гс ? I. Поскольку для любого 9 существует единственное такое п 6 I, что —я <9 + 2ля ^ п, эти условия определяют функции С (9), S (9) для любого 9 ? Re. На основании свойств B) (в), (г) и определения C) нетрудно показать, что D) (а) С@)=1 и 5@) = 0; «k0<S(8)<l; F) C(«) = (в) (г) 0<9<у, /псГ0<С(9) C2(9) + S2(9)=l 5л я любого 9. Другими словами, мы получили свойства 8.14 (i) — (iv) как следствия определения C). Осталось показать, что С (9) и S (9) — непрерывные функции на Re и что выполнены свойства 8.14 (v) — (vi): Рассмотрим вначале последние. Ввиду равенств С (—9) = С (8), S (—9) = —S (9) достаточно показать, что для любых 9t, 9г выпол- выполняется E) (а) С.(91-92)-С(91)С(92)+5(91M(92); (б) S (в, - 92) = S (8,) С (Эг) - 5 (92) С (9,). Эти свойства проверить несколько легче, чем свойства 8.14 (v), (vi), но прямая аналитическая проверка, без обращения к интуитивным Рис. 54. (t,0) Рис. 55. геометрическим рассмотрениям, все еще затруднительна. Мы при- прибегнем поэтому к рассмотрению углов треугольников. Треугольник определяется тремя различными точками М, N, Q (рис. 54). Чтобы определить, например, угол Z. NMQ, пользуясь нашим определением угла, нам требуется понятие жесткого движе- движения плоскости. Если такое понятие есть, то мы должны движением плоскости совместить точку М с началом О, а точку N — с неко- некоторой точкой W на положительной полуоси х; при этом Q перейдет в некоторую точку Q' (рис. 55). Величиной угла /_ NMQ тогда сле- следует считать величину угла 9, определенного точкой Р (х, у) пере-
АНАЛИТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ТРИГОНОМЕТРИЧЕСКИХ ФУНКЦИЙ 425 сечения луча 0Q' с единичной окружностью. Строгоговоря, жесткое движение есть функция F, осуществляющая взаимно однозначное отображение плоскости Re x Re на себя, сохраняющая расстояния между точками, т. е. если F (х, у) = (G (х, у), Н (х, у)) для любых х, у, то должно быть 2, у2)-Н{хи для любых (х\, г/i), (х2, Уг) *). Для наших целей необходимо, чтобы для любой пары различных точек М (хм, ум) и N (xN, yN) можно N'lO, I) Рис. 56. было найти такое жесткое движение F плоскости, что F (хм, Ум) = = @, 0) и F (лгдг, Ум) = (d, 0), где d > 0. Будем считать, что это уже доказано. Рассмотрим частный случай, когда М лежит в начале О, а точ- точки N и Q — на единичной окружности, причем xN > Xq. Приведен- Приведенный выше чертеж показывает треугольник в исходном положении и после движения (рис. 56). Поскольку длины отрезков OQ и ON равны 1, образами точек N и Q будут соответственно N' @, 1) и Р (х, у). Пусть. 0i = A (xN), 92 = A (xQ) и пусть 0 — угол /_NOQ, определенный с помощью движения; тогда 0 = А (х). В наших обозначениях xN — С @4), yN = S @^, xQ — С @2), Усг — S @2), х = С @), у = S @). Можно показать, что жесткие движения сохра- сохраняют также площади, поэтому площадь сектора ONQ равна площади сектора ON'P, т. е. ~ @2 — 60 = у 0, откуда 0 = 02 — 04. С дру- другой стороны, равны расстояния между точками N' и Р, N и Q, поскольку жесткие движения сохраняют расстояния. Следовательно, (х - ОJ + (у - 1 f = (xQ - xNf + (yQ - yNf = = (xq +УЬ)+ (xn + У%) — 2 (xQxN - yQyN) = = 2-2 (С @2) C(Qt)+S @2) S @,)). *) Обычно от жесткого движения требуется также сохранение ориента- ориентации плоскости — в противном случае положение точки Q' определяется неод- неоднозначно.— Прим. перев.
426 ДОБАВЛЕНИЕ II Таким образом, сравнивая оба результата, мы получили свой- свойство E) (а) С @2 - 00 = С (92) С (90 + S F2) S (90, правда, для частного выбора 9] и 92. В общем случае равенство E) (а) и равенство E) (б) можно полу- Р(СШ Slh)) чить отсюда, используя свойства / B) —D). Непрерывность функций СF) и S (9) проще всего доказать, ис- используя теорему из анализа, со- /у7Гд/ гласно которой дифференцируемая M/CfhW) ' функция обязательно непрерывна. Следовательно, достаточно пока- Рис. 57. зать, что для произвольного 9 F) С F) = —S (9) и S' F) = С (в). Например, чтобы показать существование () j используем равенство S(Q + h) = S(Q)C(h) Желаемая вторая часть F) (и аналогично первая часть) следует тогда из утверждений G) lim^=l и IтЩ=± = 0. Утверждения G) легче всего доказать, исходя из неравенств между площадями (рис. 57). h численно равно удвоенной площади секто- сектора ONP, а последняя больше площади треугольника ОМР и мень- меньше площади треугольника ONQ, т. е. Поэтому C(h)<h/S(h)<l/C(h) и из limC(A) = l следует h h-yoo lim A/S (А) = 1. Отсюда легко выводится и вторая часть G): Л->0 1— С (h) (\-C(h)){\+C(h)) S*(h) _S(h) S(h) h h(l+C(h)) ~~ h(l+C(h)) ~~ h ' Ho lim^-=l и lim , f^... =0. G) доказано. ho h ho l+cW
АНАЛИТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ТРИГОНОМЕТРИЧЕСКИХ ФУНКЦИЙ 427 На этом изложение первого подхода к аналитическому опреде- определению тригонометрических функций мы заканчиваем, а читателя, интересующегося деталями, отсылаем к цитированному учебнику Морри. Отметим, что аналогичное построение можно было прове- провести, отправляясь от понятия длины дуги вместо площади; мы не будем на этом останавливаться. Второй подход к определению тригонометрических функций более формален, но тем не менее проверка основных свойств функ- функций проходит достаточно гладко. Этот подход основан на представ- представлении функций степенными рядами. Мы следуем при изложении книге Рудина «Основы математического анализа» *). Аналитической основой определения на этот раз является тот факт, что любая функция F на Re, имеющая п-ю производную F<n) для любого п (где F<0> = F), пред ставима в виде n=0 (В действительности требуются и еще некоторые условия, но сейчас сам факт разложимости нам нужен только для мотивировки опре- определения, поэтому точные условия не нужны.) Далее, если функции С и S найдены и удовлетворяют условиям 8.14 (i) — (vi), то, как было выше показано, С" @) = —S @), 5' @) = С @) и, следова- следовательно, СB) @) = —С @), С<3) @) = S @), С<4> @) = С @), и вооб- вообще С(П+4) @) = С<П) @); аналогичные рассуждения применимы и к 5 @). Это показывает, что СBп+1) @) = 0 и СBП) @) = (—1)п, в то время как СB"+1) (Г)) __ / 1 \П СBП)^П\ = Л для любого п.. Имея в виду эти соотношения, принимаем сле- следующие определения функций С и S: п=0 п=0 Используя 7.41, легко показать, что эти функции определены для любого 0. Далее, прямо из определения видно, что С@) = 1, S@) = 0, С(-0) = С(9) и S( —9)= -5@) для любого 0.. оо В анализе доказывается, что функция F(x)= 2 апХп, опре- п=0 деленная для всех x?Re, непрерывна на Re, дифференцируема *) Walter R u d i n, Principles of Mathematical Analysis, New York, Me Graw-Hill, 1953, стр. 202—204 [русский перевод: У. Р у д и н, Основы математического анализа, «Мир», 1966].
428 ДОБАВЛЕНИЕ II на Re и что n=0 n=k для всех х (и потому ah = F(h) @)/k\). В частности, из (8) сле- следует, что С, S непрерывны на Re, что С (8), S'@) определены для всех 0 и что 2J C2л— Bn)l (-1)nе2"-1 - у (~1)п C2л—1I BлI ° ~ 2j Bл-1I п=1 п—1 с (в) = n=0 аналогично показывается и равенство 5' @) = С @). Рассмотрим теперь произвольное ф ? Re и положим (9) G @) = С (в + Ф) - С (9) С (ф) + S @) S (Ф), Я @) = S @ + ф) — S @) С (ф) - S (ф) С @), F @) = G2 @) + Я2 @). Тогда G' @) = — S @ + ф) + S @) С (<р) + С @) S (<р) = —Я @) и также Я' @) = G @). Следовательно, F' @) = 2G @) G' @) + + 2Я @) Я' @) = 0. Но тогда F @) — постоянная функция, F @) = = F @); в силу G @) = С (ф) — С (ф) = 0 и Я @) = S (<р) — — 5 (ф) = 0 получаем F @) = 0 для всех 0. В силу очевидных неравенств G2 @) ^ 0, Я2 @) ^ 0, отсюда следует G @) = 0 и Я @) = 0 для всех 0, т. е. С @ + <р) = С @) С (<р) — S @) 5 (<р) и S @ + ф) = S (в) С (ф) + S (ф) С @), так что 8.14 (v), (vi) проверены. Полагая ф = —0, получаем С @) = С @) С (—9) — — S @) S (—0), поэтому 1 = С2 @) + 52 @) (ведь С @) = 1) и 8.14 (iv) проверено. Заметим, что еще более простое доказательство формул суммы можно провести, основываясь на комплексных степенных рядах, оо замечая, что С @) + i5 @) = Е (i0), где Е (z) = 2 ^п/п\ (исполь- 71=0 зуя формулу сложения Е (х -j- у) — Е (х)- Е {у) из 7.45, упражне- упражнение 13 к п. 8.1 и замечания о функции Е (z), следующие за 8.32). Единственное, что остается проверить,— свойства 8.14 (ii), (Hi), .т. е. что С (у) = О, S (у) = 1, О <С (9)< 1 и 0 <5 @) < 1 для 0 <0 <-о-« Число я требует здесь нового определения, так как воспользоваться геометрическим определением B) (в) невоз-
АНАЛИТИЧЕСКОЕ ОПРЕДЕЛЕНИЕ ТРИГОНОМЕТРИЧЕСКИХ ФУНКЦИЙ 429 можно. Мы теперь определим -=- как наименьшее положительное решение 04 уравнения С @) = 0; нужно показать, прежде всего, что такое 04 существует. Для того чтобы воспользоваться теоремой Вейерштрасса о нулях функции, нужно найти такое© > 0, для кото- которого С @) ^ 0,— ведь С @) = 1, как мы уже знаем. Предположим противное, т. е. что С @) > 0 для всех 0. Значит S' @) = С @) > 0 для всех 0 и S @) — строго возрастающая функция при 0 > 0 (как следует из соответствующей теоремы анализа). Но S @) = 0, поэтому S @) > 0 для всех 0 > 0 и потому С @) = — S @) < 0 для всех 0 > 0, так что С @) — строго убывающая функция при 0>ОиО<С@)<1 для всех 0 > 0. Зафиксируем 0О > 0 и рас- е смотрим / @) = I S @ dt при 0> 0О. По фундаментальной теореме во анализа / @) = — С @) + С @О) и / @) < 1. С другой стороны, в {• по простейшему свойству интеграла I S (f) dt он больше длины DO интервала 0 — 0О, умноженного на S @О), т. е. / @) > > S @О) @ — 0О) (так как S @) возрастает). Поскольку S @О) > О, 0 можно выбрать, настолько большим, чтобы было / @) > 1. Полу- Получили противоречие. Следовательно, существует по меньшей мере одно такое 0! > 0, что С @0 = 0. Если среди таких Qt нет наимень- наименьшего, то существует последовательность @П), для которой 0П > 0, lim 0„ = 0 и С @П) = 0, но тогда вследствие непрерывности G.47) п-юо мы получили бы С @) = 0, что невозможно. Таким образом, суще- существование нужного 0i доказано и -д- определено. По самому опре- определению С 1^) = ° и 0 <С @) < 1 для всех 0 <0 <у- Используя опять равенство 5' @) = С @), видим, что S @) —строго возрастающая функция при 0 <0 <-о- и поэтому 0 <5 @) при 0 <;0 <"о"> откуда, используя непрерывность и возрастание функции S, получаем 0 <5 (у). Но S2 (-J) + С2 (-J) = 1, так что S (-?-) = 1. Доказательство завершено.
СПИСОК КНИГ ДЛЯ ДАЛЬНЕЙШЕГО ЧТЕНИЯ Логика 1. X. К а р р и, Основания математической логики, «Мир», 1969. 2. А. И. Мальцев, Алгебраические системы, «Наука», 1970. 3. А. И. Мальцев, Алгоритмы и рекурсивные функции, «Наука», 1965. 4. А. А. Марков, Теория алгорифмов, Труды матем. ин-та АН СССР им. В. А. Стеклова, XLII, Изд-во АН СССР, 1954. 5. А. А. М а р к о в, О логике конструктивной математики, Вестник МГУ, № 2 G0), A970), 7—30. 6. Э. Мендельсон, Введение в математическую логику, «Наука», 1971. 7. П. С. Новиков, Элементы математической логики, Физматгиз, 1959. Теория множеств 1. П. С. Александров, Введение в общую теорию множеств и функ- функций, Гостехиздат, 1948. 2. К- Куратовский, А. Мостовский, Теория множеств, «Мир», 1970. 3. Н. Н. Лузин, Введение в теорию функций, Учпедгиз, 1948. 4. Ф. X а у с д о р ф, Теория множеств, ОНТИ, 1937. Алгебра 1. О. Зарисский, П. Самюэль, Коммутативная алгебра, тт. 1, 2, ИЛ, 1963. 2. П. Ко н, Универсальная алгебра, «Мир», 1968. 3. А. Г. К у р о ш, Курс высшей алгебры, «Наука», 1968. 4. С. Л е н г, Алгебра, «Мир», 1968. 5. А. И. Мальцев, Основы линейной алгебры, «Наука», 1970. 6. А. И. Мальцев, Алгебраические системы, «Наука», 1970. Теория чисел 1. 3. И. Б о р е в и ч, И. Р. Ш а ф а р е в и ч, Теория чисел, «Наука», 1964. 2. И. М. Виноградов, Основы теории чисел, «Наука», 1965. 3. Г. Д э в е н п о р т, Высшая арифметика (Введение в теорию чисел), «Наука», 1965. 4. Б. Н. Д е л о н е, Петербургская школа теории чисел, Изд-во АН СССР, 1947. 5. А. Я- X и н ч и н, Великая теорема Ферма, Гостехиздат, 1934. 6. А. Я- X и н ч и н, Три жемчужины теории чисел, Гостехиздат, 1948. Анализ 1. А. В. Б и ц а д з е, Основы теории аналитических функций, «Наука», 1969. 2. У. Р у д и н, Основы математического анализа, «Мир», 1966. 3. Г. М. Ф и х т е н г о л ь ц, Основы математического анализа, «Наука», 1968.
ИМЕННОЙ УКАЗАТЕЛЬ Абель 375 Адамар 410 Арган 342 Архимед 253 Бернайс 412 Больцано 264, 347 Валле-Пуссен 410 Вейерштрасс 264, 290, 347, 355 Венн 37 Галуа 375, 408 Гаусс 355, 374, 406, 408, 410 Гельфонд 323 Гёдель 412 Гольдбах 15, 55 Дедекинд 78, 246, 410 Декарт 50, 397, 415 Днофант 168 Евдокс 246 Евклид 150, 233, 246, 350, 397 Знльберг 410 Кантор 312, 317, 412 Кардан 370, 373 Кошн 258, 261 Кронекер 4 10 Куайн 412 Куммер 410 Лагранж 311, 374 Лейбниц 32 Лнндон 163 Лиувилль 319, 323 Мальцев 8, 163 Морган де 46 Моррн 422 Муавр 342 Нейман фон 412 Ньютон 298 Паскаль 142 Пеано 78, 412 Пифагор 169, 239. 346 Рассел 34, 412 Риман 62 Робинсон 164 Ролль 311 Руднн 427 Тарскнй 359 Тарталья 370 Тейлор 285 Ферма 33, 407, 410 Феррарн 370 Ферро 370 Френкель 412 Фурье 12 Цермело 412, 420 Чебышев 410 Штурм 301, 302, 358 Эйзенштейн 409 Эйлер 406 Эрдеш 410
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолютная величина 126, 334 Аксиома 14 — абстракции 415 — бесконечности 78, 416 — выбора 30, 46, 113, 417 — объемности 413 — ограниченного образования 415 множеств — систем Пеано 78 — существования множеств 413 — экстенсиональности 413 Аксиомы Пеано 79 Алгебра булева 44 — линейная 220 — множеств 37, 41 Алгоритм 20, 220, 307 — деления 146, 229 — Евклида 150, 233 Антецедент 22 Антирефлексивность 56 Антисимметричность 45, 56, 95 Аргумент 336 Ассоциативность 45, 89, 93, 106, 118, 139 База 390 — линейная 393 Включение множеств 31 Возведение в степень 93, 121, 141, 204, 308 Вычисление корней 297, 358 Вычитание 118 Геометрические проблемы построений 397 Геометрия аналитическая 202 —• синтетическая 202 Гомоморфизм 162 Грань верхняя 250 — — наименьшая 250 —¦ —• точная 250 — нижняя 250 — — наибольшая 250 — — точная 250 Группа 384 Движение жесткое 424 Двойственность утверждений 45, 119 Делимость полиномов 183 Делитель 147 — общий наибольший 149, 231 Диаграмма Аргана 342 — Венна 37 Дискриминант полинома 366 Дистрибутивность 45, 91, 118, 138 Доказательство от противного 23 — по индукции 79, 153 Дополнение множества 38, 415 Дробь непрерывная 281 Единица 118 — мнимая 330- Единственность разложения на простые множители 153, 233 Зависимость алгебраическая 396 — линейная 390 Задача Диофанта 168 Задачи на построение классические 404 Заключение 22 Закон сокращения 90, 93 — трихотомии 90, 95 Законы Де Моргана 46 Идеал 167, 410 Измерение длин 200, 242 Изоморфизм 68, 162 —¦ непрерывно упорядоченных полей 257 — полей частных 213 — простых трансцендентных расширений 176 — систем Пеано 84 — упорядоченных областей целостности 134 — А-кратных трансцендентных расшире- расширений 187 Импликация 22 Инверсия отношения 53 — функции 65 Индивидуал 412 Индукция 79 — возвратная 153 Интеграл 422 Интервал 47 — замкнутый 262 Интуиционизм 20 Квадратура круга 409 Класс 25 — конгруентностн 166 — сечения верхний 245 — — нижний 246 — эквивалентности 58 — mod т. 166 — mod p (%) 382 Кольцо коммутативное с единицей 11S — целых чисел 136 Комбинация линейная 151, 390 Коммутативность 45, 89, 92, 106 Композиция отношений 56 — функций 66 Консеквент 22 Константа 15 Конструируемость 401, 408 Координаты 397 Корень квадратный 330, 332 главный 330, 332 — полинома 183 — — кратный 236 простой 236 — уравнения 3-й степени 370 — — 4-й степени 373 — функции 182
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Корень п-й степени 296, 343 — — — главный 343 Косинус 333, 341, 422 Коэффициент полинома старший 182 Коэффициенты полинома 182 — полиномиальной функции 173 — системы линейных уравнений 218 Кратное 120 КРУГ единичный 335, 422 — сходимости 356 Логика 15 — символическая (=формальная = матема- математическая) 15 Максимум абсолютный 20, 292 Матрица 220 Метаматематика 421 Метод Кантора 312, 317 — Лиувилля 319, 320 — Ньютона 298 Метрика 265 Минимум абсолютный 292 Многоугольник правильный 406 Множества попарно непересекающиеся 41 Множество 25, 412 — бесконечное 27, 70 — вполне упорядоченное 97 — всех подмножеств 31, 36, 313, 414 — замкнутое относительно операции 63 — канторово совершенное 324 — конечное 27, 70, 104 — линейно упорядоченное 95 — непрерывно упорядоченное 245, 253 — несчетное 315 — ограниченное 250 — — сверху 249 — — снизу 250 — плотно упорядоченное 205 — пустое 33 — счетное 315 Модуль 126, 334, 352 Мощность множества 70 Независимость линейная 390 Непересекающиеся множества 70 Неравенство треугольника 126, 334 Несоизмеримость 23 Нуль функции 182, 290 Область значений 52 — определения 52 — целостности 122 — — конечная 206 — — упорядоченная 124 — — характеристики п 171 Образ гомоморфный 162 — изоморфный 162 Объединение множеств 38, 46, 414 Окружность 397 Операция 62 — бинарная 63 — возведения в степень 93 — вычитания 118 — над отношениями 55 — рекурсивно определенная 88 — сложения 88 — умножения 91 — унарная 63 Определение примитивно рекурсивное 88 — рекурсивное 88 -Определитель 220 Остаток 145 Отношение 47, 51, 416 — антирефлексивное 56 — антисимметричное 56 Отношение бинарное 55 — делимости 147, 183, 199, 226 — конгруентности 64 — — в поле 207 — целых числах 161 — <— mod m 166 mod p (|) 382 — линейной упорядоченности 95 — рефлексивное 56 — симметричное 56 — тернарное 55 — тождества 56 — транзитивное 56 — эквивалентности 57 — я-арное 55 Отображение гомоморфное 162 — изоморфное 162 Пара упорядоченная 49, 414 Парадокс Рассела 34, 412 Параметр 18 Переменная 15 — свободная 25 — связанная 25 Пересечение множеств 38, 46, 417 Перестановка 139 Плоскость 341 — Гаусса 341 — Декарта 397 — Евклида 397 Площадь 336, 422 Поверхность Рнмана 62 Подмножество 31 Подобласть 122 — упорядоченная 124 Подполе 202 — упорядоченное 202 Подпоследовательность 262, 347 Подсистема 72 Позиционные обозначения 156, 277" Поле 202 — алгебраически замкнутое 361 — — полное 355 — алгебраических чисел 377 — комплексных чисел 330 — конечное 206 — корневое 377, 386 —, порожденное коэффициентами 377" —, — множеством 377 — рациональных форм 215 — — чисел 214 — упорядоченное 202 — частных 214 Полином 172, 225 — линейный 190 — неприводимый 228 — нормированный 182 —, нули 182 ¦— однородный 190 — от нескольких переменных 187 — постоянный 183 — простой 228 — симметрический 191 элементарный 192 Полиномы взаимно простые 233 Полнота алгебраическая 355 — топологическая 265 Порождение подполей- 377 Порядок корня 236 Последовательность бесконечная 104» 137 — конечная 104, 137 — Коши 261 — ограниченная 262, 347 — приведенная 301 — псевдобесконечная 174
434 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Последовательность пустая 137 — сходящаяся 259, 347 — — равномерно 310 — фундаментальная 261 — Штурма 301, 302, 358 Построение с помощью циркуля и лннейкн 399 Постулат 14 Посылка 22 Правило знаков 120 — параллелограмма 334 Предел последовательности 259, 347 — — верхний 275 — — нижний 275 Предложение 15 Предположение 22 Принцип абстракции 415 Присоединение корней 385 Проблема Гольдбаха 55 Прогрессия геометрическая 141 Произведение декартово 50, 415 Производная полинома формальная 184 — функции 422 Пространство векторное 390 — — конечномерное 390 — евклидово 350 Прямая 397 Равенство истинное 164 — множеств 31 Равночнсленность множеств 70 Раднан 265 Радиус сходимости ряда 285 Разбиение 58 Разложение биномиальное 141, 309 — в непрерывную дробь 281 — двоичное 279 — десятичное 277 — на простые множители целого числа 153 — — — — полинома 359 — периодическое 281 — Тейлора 285 Размерность 392 Разрешимость в радикалах 369, 408 Распределение простых чисел 410 Расстояние 265, 397 Рассуждение логическое 14 Расширение области целостности кратное 187 — — — простое 174 — — — — трансцендентное 174 — поля алгебраическое 377, 388 — — конечное 393 — — кратное трансцендентное 187 — — линейно порожденное 390 — — простое 379 — — — алгебраическое 380 — — — трансцендентное 174, 312, 374, 380 — системы 72 Результант 375 Рекурсия примитивная 88 Рефлексивность 32, S6, 95 Решение задачи Диофанта 169 — — — примитивное 169 — системы линейных уравнений 218 Ряд 276 — бесконечный 276 — расходящийся 276 — степенной 283 — сходящийся 276 Свободная переменная 25 Свойство Архимеда 254 -Связанная переменная 25 Связка логическая 21 Связность 95 Сегмент 85 Сектор 336 Сечение 85 — Дедекинда 246 Симметрия 32, 46 Синус 333, 422 Система 68 — алгебраическая 68 — алгебраически полная 355 — вполне упорядоченная 97, 136, 153 — линейно упорядоченная 95 — линейных уравнений 217 — математическая 68 — непрерывно упорядоченная 245, 253 — образующих 390 — Пеано 78, 417 Системы однотипные 68 Сложение 88 Совокупность 25 Соответствие 66 Степень полинома 182 — полиномиальной функции 173 Суждение декларативное 15 — утвердительное 15 Сумма множеств 38, 45, 46, 414 — ряда частичная 276 Теорема алгебры основная 354, 423 — анализа фундаментальная 423 — Больцано — Вейерштрасса 264, 347 — Вейерштрасса о нулях 290 — Лиувилля 321 — Муавра 342 — Пифагора 169, 239, 346 — Ролля 288, 311 — существования непрерывно упорядо- упорядоченных полей 268 — — — — систем 246 — — полей частных 207 — — упорядоченных областей целостно- целостности 128 — Ферма 33, 410 — Эйзенштейна 409 Теория алгоритмов 307 — множеств аксиоматическая 35, 412 — рекурсивных функций 307 — чисел алгебраическая 410 — — аналитическая 410 — Штурма 302 Тождество 31, 56 — неразличимых 32 Топология общая 350 Точка 397 Транзитивность 32, 56, 95 Транспозиция 144 Треугольник Паскаля 142 Трисекция угла 404 Угол 333, 337, 422 Удвоение куба 404 Умножение 91 Упорядочение архимедово 254 — линейное (= простое = тотальное) 95 — непрерывное 245, 253 — плотное 205 Упорядоченная область целостности 124 — пара 49 -— тройка 54 — четверка 55 •— п-ка 55 Упорядоченность полная 97 Уравнение алгебраическое 216 — квадратное 296. 332 ¦—¦ кубическое 370 — полиномиальное 223
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 435 Уравнение степени выше четвертой 374 ¦— четвертой степени 373 Условие 15 — замены 391 — необходимое н достаточное 23 — с несколькими свободными переменны- переменными 26, 47 — с одной свободной переменной 26 Утверждение математическое 15 — метаматематическое 44 Форма линейная 390 — полиномиальная 173 — рациональная 215 — тригонометрическая 341 Формула Эйлера 406 Функция 59 — аналитическая 356 — бинарная 63 — взаимно однозначная 66 — голоморфная 356 ¦— многозначная 62 — непрерывная 289, 351 ¦— неявная 60 — обратная 65 ¦— однозначная 62 — одно-однозначная 66 ¦— показательная 285, 346 ¦— полиномиальная 173, 182 — постоянная 183, 357 — следования 77 — степенная 93, 120 — тригонометрическая 337, 422 — •—, аналитическое определение 422 — целая 356 — частичная подходящая 86 — Эйлера 406 — экспоненциальная 285, 346 Цикл 144 Частное 145, 203 Числа взаимно простые 152 Чис-™/ положительные целые 11, 78. Число 11 — алгебраически зависимое 396 — — целое 375 — алгебраическое 312, 361 — действительное 239, 275 — иррациональное 11, 224 — кардинальное 71 — комплексное 11, 326, 330 — —, аргумент 336 — —, геометрическое представление 333 , модуль 334 ¦ , тригонометрическая форма 341 — комплексно сопряженное 331 — конструируемое 401 — Лнувнлля 323 — мнимое 11, 330 — нечетное 96, 147 — перемен знака 301 — простое 18, 148 — рациональное 11, 214 - трансцендентное 312 — Ферма 407 — — простое 407 — целое 11, 136 — — алгебраическое 375 — — положительное 85 — четное 96, 147 Член множества 27 Эквивалентность логическая 23 •— теоретико-множественная 70, 313 Экспонента 309 Элемент 27 — непосредственно предшествующий 99 — — следующий 99 — обратный по сложению 119 — — — умножению 203 — первый 97 — последний 97 Эффективная вычислительная процедура 307
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ Р — совокупность положительных целых чисел 11 I —-совокупность целых чисел 11 Ra —совокупность рациональных чисел И Re — совокупность действительных чисел 11 С — совокупность комплексных чисел 1! <Ж (х) — условие с одной свободной перемен- переменной 26 •^ (х, у) — условие с двумя свободными перемен- переменными 26 {х' <si (х)} — множество всех х, для которых >&(х) 26 х ? S — х принадлежит 5 27 х ? S — х не принадлежит S 27 А = В — А равно В.. 31 В С А — В лежит в Л 31 0 — пустое множество 33 А П В — пересечение множеств А я В 38 A U В — сумма (объединение) множеств^ и В 38 л(^' —дополнение к множеству А (в S) 38 А — дополнение к множеству А 38 А — В — разность множеств Л и В 39 ИХ [X ? М] — сумма множеств, принадлежащих М 46 Г\Х [Х 6 Ml — пересечение множеств, принадлежа- принадлежащих М 46 (о, Ъ) — упорядоченная пара 49 А X В — декартово произведение множеств А и В 50 Sj (W) — область определения отношения W 52 31 (W) — область значений отношения W 52 W — инверсия отношения W 53 О — совокупность нечетных простых чи- чисел 55 Ее ¦— совокупность четных чисел, больших или равных 6 55 = — отношение тождества 57 W°W — композиция отношений W и W 57 Wа ¦— класс эквивалентности элемента а относительно эквивалентности W 57 [о] — класс эквивалентности элемента а 58 F~l — обратная к F функция 65 ГсО — композиция функций F и G 66 Re' — совокупность положительных действи- действительных чисел 68 \S, F\, . . ., Fm, Wi, . . ., Wl, Oi an} — система; здесь S — множество, Fi, . . ., Fm — операции на нем. Wi, . . ., Wl — отношения иа ием„ Oj, . .., an—выделенные элементы в S 68
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ 437 . . .} 2 <S', . . . } — системы {S, . . .} и {S't . . .} изо- изоморфны 69 Sc (a) ¦— непосредственно следующий элемент 77, 417 (Р, Sc, 1)—система Пеано 78 [1, х\ — сегмент в системе Пеано 85 -| сложение в системе Пеаио 88 • — умножение в системе Пеаио 91 ж" — бинарная функция в системе Пеано 93 д.! — функция в системе Пеано 94 < — отношение «меньше» в системе Пеано 94 > — отношение «больше» в системе Пеаио 94 SS — отношение «меньше или равно» в си- системе Пеано 95 5= — отношение «больше или равно» в си- системе Пеано 95 (S, -<) — упорядоченная система 95 -< — отношение порядка 95, 247 — конечная последовательность 104 '— бесконечная последовательность 104 ь — обобщенная сумма, порожденная опе- операцией + 106 п J[j_ Хь — обобщенное произведение, порожден ное операцией* 106 (D, +, •, 0, О — коммутативное кольцо с единицей 118 вычитание (обратная операция к -+-) 119 (D. +¦ •. <, 0, I) — упорядоченная область целостности. 124 D+ — совокупность положительных элемен- элементов области целостности (D, +, •. <, 0, 1) 124 Pos 125. 212 1*1 — абсолютная величина х 126 W (n, m) I Un. m)] > [л, т\ ) ¦ класс эквивалентности пары (я, т) 130 (I, -f, •. <i 0, 1) — система целых чисел 133 Ра — сегмент {х ? I : х ^ а} системы це- целых чисел 136 я! 143 С^ — биномиальные коэффициенты 143 Ь | а — Ь делит а 147 Ь { а — Ь не делит а 147 и. о. д. — наибольший общий делитель 149 (а, Ь) — наибольший общий делитель а н Ь 152 «— So — луч {дт: х ? S н дг-<а> в упорядо- упорядоченной системе (S, -С) 153 \т)} ~ т Делит х ~ У Ш- [х]т — класс эквивалентности х 166 + т — сложение классов эквивалентности 167
438 УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ • m — умножение классов эквивалентности 167 х + у (mod т) — класс эквивалентности х -\- у 168 ху (mod m) — класс эквивалентности х-у 168 Um, + т> ¦ т, LOlm, [llm)— кольцо вычетов mod m 168 п Ms) = 2 afil — полиномиальная форма 173 п f (х) = ^ а-** — полиномиальная функция 173 D [|] — простое расширение области целостно- целостности D 174 (D Li], +, •, 0, 1) — простое трансцендентное расширение- области целостности (D, +, •, 0, 1) 181 ! A) — полином 182 deg (/ (?))— степень полинома / (|) 182 g (i) I / (I) — полином g (|) делнт полином / (|) 18* Mii. ¦ • •, 1ь_)— полином от нескольких переменных 185. D Lsi, . . ., tjj — Л-кратное трансцендентное расшире- расширение области целостности D 187 (D [|i, . . ., gjj], +, #, О, I) — fc-кратиое трансцендентное расшире- расширение области целостности (D, +, •, О, 1) 187 deg(/(|, |^)) — степень полинома Mli. • • •. 1/j) ISO" On (li |^) — элементарный симметрический поли- полином 192 — частное 200 alb — частное 203 о-1 — обратный элемент 203 (Ra, -}-- ¦, <С, 0, 1) — множество рациональных чисел 21* D (|i |^) — поле рациональных форм 215 п 'S] а^.х. — система линейных уравнений 21S 3=1 Ms) - g (i) — / (s) делит g A) н g (I) делнт / (s) 226 / (s) '7-' g (?) — илн f (?) не делит g (?), или g (%) не де- делнт f (I) 226 (/ (I), g (i)) — нормированный наибольший общий делитель Ms) н g (i) 233 U (S) — совокупность верхних классов сече- сечений системы (S, <) 245 L (S) — совокупность нижних классов сечений системы (S, <) 246 Са — верхний класс {х1. х ? S и а < х} системы (S, <) 247 inf А — точная нижняя грань множества А 250 sup А — точная верхняя грань множества А 250 lim хп — предел последовательности <дгп> 260 л-юо Fd (Л) — совокупность фундаментальных после- последовательностей в А 261 lb, cl — замкнутый интервал {х: х ? К, Ь ^ ;? X г= с} 262
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ 439 <xh> + <i/ft> — сумма последовательиостей <X]J> и <!/?> 265 —разность последовательиостей (х^У » <-Ук> 265 — произведение последовательностей <х^> и <i/ft> 265 > — частное от деления последовательно- последовательностей <.*ft> и <t/ft> 265 265 а — постоянная последовательность с эле- элементом а 268 <x!l> = <yh> — разность последовательностей <xk> и <i/ft> стремится к нулю 269 Fd* (Л)—соеокупиость классов эквивалентно- эквивалентности Fd (Л) по коигруеитиости = 270' [<х^>] — класс эквивалентности последователь- последовательности <*?> по конгруеитности = 270 <х^у! Ф [<у^>] — класс эквивалентности суммы последо- последовательиостей <*?> и <#?> 270 [<аг^>] ® [<(/?>] — класс эквивалентности произведения последовательиостей <•*?> и <У^> 270» а" —класс эквивалентности последователь- последовательности а 270 < * 271 (Re, +, •, <, 0, 1) — множество действительных чисел 275. [lim inf Xi — нижний предел 275 k-*oo lim sup xh — верхний предел 275 s^ — частичная сумма ряда 276 2 xt — ряд 276 i=0 2j x. — ряд 276 ? (x) 286 e 286 у корень л-й степени 296, 332, 343 а*/я J VUf/t, . • ., {/;>) — число перемен знака последователь- последовательности 301 </о (I), ft (I), . ¦ ., fm A)> — последовательность Штурма 302 Vf (с) 302 ах — степень 308 А ^: В — теоретикомиожествениая эквивалент- эквивалентность 313 А1 (К) 323 (С, 4-. -.0, 1) — множество комплексных чисел 330 | — мнимая единица 330 г — комплексно сопряженное с г число^331 | г | — модуль г ЗзЗ cos в 333 sin в 333 АР — дуга 335
440 УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ Arg (г) — аргумент 336 С (в) 337 S F) 337 е2 346 A!g (К) — совокупность алгебраических над Л. чисел 361 Alg = Alg(Ra) 361 Dis (/ E)) — дискриминант полинома f (|) 366 Res (f (|), g (D) — результант НЕ) и s (g) 375 Gen (Z) — подполе поля С, порожденное Z 378 К (Z) = Gen (K U Z) 379 К (г, zn) = /<({?. гп}) 379 ft (i) ^ /г (|) (mod p (i)) — эквивалентность по модулю многочле- многочлена 382 К* (V) — совокупность линейных форм над К 390 \.К* (иу.Ю —размерность 393 K+(V) = Alg (К* (С/)) 396 Ф (п) — функция Эйлера 406 (Р, Sc, 0) — система Пеано 417 я (п) — количество простых чисел, не превосхо- превосходящих п 410 к Е- +, у), — дополнительные символы суммирова- суммирования @, ' ¦— дополнительные символы умножения 0 — дополнительный символ вычитания -1 — дополнительный символ обратного эле- элемента
СОДЕРЖАНИЕ Предисловие редактора 7 Предисловие 9 Глава 1 Логические предпосылки 11 1.1. Введение И Математический метод A3). 1.2. Логика 15 Математические утверждения и их строение A5). Существова- Существование A8). Логические связки B1). Глава 2 Теоретико-множественные предпосылки 25 2.1. Множества 25 Множества как абстракции от условий B5). Расширение поня- понятия множества B8). Тождество и включение C1). Некоторые особенные множества C3). 2.2. Алгебра множеств 37 Пересечение, объединение и дополнение C7). Основные законы алгебры множеств D1). Расширение понятий пересечения и объединения D5). 2.3. Отношения и функции 47 Отношения как абстракции от условий D7). Упорядоченные пары и декартовы произведения D9). Область определения, область значений, инверсия E1). Тернарные (н т. д.) отноше- отношения E4). Операции над отношениями, композиция E5). Специальные виды отношений E6). Отношения эквивалент- эквивалентности и разбиения E7). Функции E8). Отношения конгруенг- ности F3). Инверсия функции и композиция функций F5). 2.4. Математические системы отношений и функций 67 Изоморфизм F8). Теоретико-множественная эквивалентность G0). Подсистемы G 1). Глава 3 Положительные целые числа 77 3.1. Основные свойства 77 Системы Пеано н доказательства по индукции G8). Функции на системах Пеано (80). Изоморфизм систем Пеано (84). 3.2. Арифметика положительных целых чисел 86 Рекурсивные определения (86). Сложение положительных це- целых чисел (88). Умножение положительных целых чисел (9 1). Возведение в степень и другие операции (93).
СОДЕРЖАНИЕ 3.3. Порядок 94 Линейно упорядоченные системы (95). Вполне упорядоченные системы (97). Упорядочение и арифметические операции A01). 3.4. Последовательности, суммы и произведения 103 Конечные и бесконечные последовательности A03). Обобщен- Обобщенные суммы и произведения A05). Обобщенные законы ассоциа- ассоциативности и коммутативности A06). Некоторые специальные суммы и произведения A10). Глава 4 Целые числа и области целостности ! 114 4.1. Расширение области натуральных чисел 114 Практические мотивировки A14). Алгебраические мотивиров- мотивировки A16). Коммутативные кольца с единицей A18). 4.2. Области целостности 122 Упорядоченные области целостности A23). Абсолютные ве- лнчнны A26). 4.3. Построение и характеристика целых чисел 127 Теорема существования A28). Однозначность характеристики A34). 4.4. Целые числа как система индексов 136 Более общие законы ассоциативности и коммутативности A39). Геометрическая прогрессия, биномиальное разложение A4 1). 4.5. Математические свойства целых чисел 145 Алгоритм деления A45). Отношение делимости и простые чис- числа A47). Наибольшие общие делители A49). Разложение целых чисел иа простые множители A53). Позиционные системы обозначений целых чисел A56). 4.6. Отношения конгруентности в области целых чисел . . . 161 Гомоморфизмы A62). Свойства, сохраняющиеся при гомоморфиз- гомоморфизмах A63). Отношение конгруентностн по модулю целого числа A66). Приложения к задаче Диофанта A68). Глава 5 Полиномы 172 5.1. Полиномиальные функции и полиномиальные формы . . . 172 Существование и едииствеииость простых трансцендентных рас- расширений A74). Делимость и корнн полиномов A83). Фор- Формальные производные A84). 5.2. Полиномы от нескольких переменных 185 fc-кратные трансцендентные расширения A86). Симметрические полиномы A91). Основная теорема о симметрических полино- полиномах A94). Глава 6 Рациональные числа и поля 199 6.1. К расширению областей целостности 199 Алгебраические мотивировки A99). Геометрические мотивиров- мотивировки B00). Поля B02). Упорядоченные поля; плотные упоря- упорядочения B05). Некоторые конечные поля B06). 6.2. Поля частных 207 Теорема существования B07). Изоморфизм полей частных B13). Рациональные числа; поля рациональных форм B14).
СОДЕРЖАНИЕ 5 6.3. Решения алгебраических уравнений в полях 216 Системы линейных уравнений B17). Линейные уравнения в областях целостности B22). Полиномиальные уравнения в рациональных числах B23). 6.4. Полиномы над произвольным полем 225 Основные свойства делимости B26). Простые полиномы B28). Алгоритм деления для полиномов B30). Наибольшие общие делители B31). Теорема об однозначной разложимости поли- полиномов B33). Глава 7 Действительные числа 239 7.1. К расширению системы рациональных чисел 239 Алгебраические мотивировки B39). Геометрические мотиви- мотивировки B41). Верхние н нижние классы сеченнн, непрерывно упорядоченные системы B44). Существование непрерывно упо- упорядоченных систем B46). Наибольшие нижние и наименьшие верхние грани B49). 7.2. Непрерывно упорядоченные поля 253 Свойство Архимеда B53). Изоморфизм непрерывно упорядо- упорядоченных полей B57). Пределы B58). Фундаментальные после- последовательности B61). Теорема Больцано — Вейерштрасса B62). Построение непрерывно упорядоченного поля B67). 7.3. Бесконечные ряды и разложения действительных чисел 276 Позиционные обозначения для действительных чисел B77). Степенные ряды B83). Экспоненциальная функция B85). 7.4. Полиномы и непрерывные функции в области действитель- действительных чисел 289 Теорема Вейерштрасса об обращении н нуль B90). Действи- Действительные полиномы и их корни B92). Вычисление корней B97). Локализация всех корней; теорема Штурма C00). Рациональ- Рациональные и действительные степени действительных чисел C08). 7.5. Алгебраические и трансцендентные числа 311 Метод Каитора C12). Счетные и несчетные множества C14). Существование трансцендентных действительных чисел C18). Метод Лиувнлля C20). Глава 8 Комплексные числа 327 8.1. Основные свойства 327 Характеристика комплексных чисел C27). Комплексная сопря- сопряженность C30). Квадратные корни из комплексных чисел C31). Геометрическая интерпретация C33). Абсолютная величина C34). Основные свойства TpHronoMeTpH4ecKHXi функций^C37). Тригонометрическая форма, теорема Муавра C41). Корни п-Я степени нз комплексных чисел C42). 8.2. Полиномы и непрерывные функции в области комплексных чисел 346 Пределы н обобщенная теорема Больцано — Вейерштрасса C47). Обобщение понятия непрерывности C50). Полиномиальные функции; рост н минимум их модулей C52). Основная теорема алгебры комплексных чисел C54). О вычислении корней ком- комплексных полиномов C58). Разложение действительных поли- полиномов C59). 8.3. Корни комплексных полиномов 360 Корин полиномов над подполем C60). Алгебраически замк- замкнутые подполя C61). Кратные корни, дискриминанты C66).
6 СОДЕРЖАНИЕ Корни кубического уравнения C70). Корин уравнений четвер- четвертой степени C73). Об уравнениях высших степеней C74). Глава 9 Поля алгебраических чисел и расширения полей 377 9.1. Порождение подполей 377 Общий процесс расширения C79). Простые расширения C79). Простые трансцендентные расширения C80). Простые алгебраи- алгебраические расширения C81). Присоединение корней к произволь- произвольным полям C85). 9.2. Алгебраические расширения 388 Линейно порожденные расширения; базы и размерность C90). Конечные расширения полей C93). Повторные конечные рас- расширения C94). 9.3. Приложения к задачам о геометрических построениях 397 Основные геометрические понятия C97). Реализация в декарто- декартовой плоскости C97). Построения с помощью циркуля и линей- линейки C99). Алгебраический эквивалент задач на построение D01). Некоторые классические задачи иа построение D04). Пра- Правильные многоугольники; решение Гаусса D06). 9.4. Заключение 409 Добавление I Некоторые аксиомы теории множеств 412 Добавление II Аналитическое определение тригонометрических функций 422 Список книг для дальнейшего чтения 430 Именной указатель 431 Предметный указатель 432 Указатель обозначений 436