Текст
                    A. H. КОЛМОГОРОВ, С. В. ФОМИН
ЭЛЕМЕНТЫ
ТЕОРИИ ФУНКЦИЙ И ФУНКЦИОНАЛЬНОГО
АНАЛИЗА
ИЗДАНИЕ ЧЕТВЕРТОЕ, ПЕРЕРАБОТАННОЕ
Допущено Министерством высшего и среднего специального образования СССР в качестве учебника для студентов математических специальностей университетов
ИЗДАТЕЛЬСТВО «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
Москва 1976
К 60 517.2 УДК 517.5(075.8)
Элементы теории функций и функционального анализа, А. Н. Колмогоров, С. В. Фомин. Главная редакция физико-математической литературы изд-ва «Наука», М., 1976 г.
Книга представляет собой учебник, соответствующий в основном той программе курса «Анализ III», которая принята в МГУ и в ряде других университетов. Предназначена в первую очередь для студентов механико-математических и физико-математических факультетов университетов. Для ее чтения требуется владение основами математического анализа и линейной алгебры. Первая часть содержит основные теоретико-множественные понятия. В главах II—IV изложена теория линейных пространств, включающая элементы теории обобщенных функций. Эти главы, а также примыкающая к ним глава X, посвященная некоторым вопросам нелинейнего функционального анализа, не предполагают знакомства с понятием меры и лебеговой теорией интегрирования. Теория меры, измеримые функции, интеграл Лебега, а также лебегова теория дифференцирования и основные свойства линейных пространств суммируемых функций излагаются в главах V—VII. Глава VIII содержит ряды Фурье и интеграл Фурье. В главе IX изложены основные факты из теории интегральных уравнений. Помещенное в конце книги Дополнение содержит краткое изложение основных сведений о банаховых алгебрах и некоторых их применениях.
Илл. 24, библ. 57 назв.
TZ 20203-062 , 7fi
К 053(02)-76
© Главная редакция физико-математической литературы издательства «Наука», 1976, с изменениями.
ОГЛАВЛЕН ИЕ
Предисловие к четвертому изданию.................................. 9
Из предисловия ко второму изданию..................................10
Предисловие к третьему изданию.....................................12
Глава I
Элементы теории множеств
§ 1.	Понятие множества. Операции над множествами..................13
1.	Основные определения (13). 2. Операции над множествами (13).
§ 2.	Отображения. Разбиения на классы.............................16
1.	Отображение множеств. Общее понятие функции (16). 2. Разбиение на классы. Отношения эквивалентности (18).
§ 3.	Эквивалентность множеств. Понятие мощности множества.........21
1.	Конечные и бесконечные множества (21). 2. Счетные множества (22). 3. Эквивалентность множеств (24). 4. Несчетность множества действительных чисел (26). 5. Теорема Кантора — Бернштейна (28). 6. Понятие мощности множества (28).
§ 4.	Упорядоченные множества. Трансфинитные числа.................31
1.	Частично упорядоченные множества (31). 2. Отображения, сохраняющие порядок (32). 3. Порядковые типы. Упорядоченные множества (33). 4. Упорядоченная сумма упорядоченных множеств (34).
5. Вполне упорядоченные множества. Трансфинитные числа (34).
6. Сравнение порядковых чисел (36). 7. Аксиома выбора, теорема Цермело и другие эквивалентные им утверждения (38). 8. Траис-финитная индукция (40).
§ 5. Системы множеств.............................................41
1. Кольцо множеств (41). 2. Полукольцо множеств (42). 3. Кольцо, порожденное полукольцом (44). 4. а-алгебры (45). 5. Системы множеств и отображения (46).
Глава II
Метрические и топологические пространства
§ 1.	Понятие метрического пространства............................48
1.	Определение и основные примеры (48). 2. Непрерывные отображения метрических пространств. Изометрия (55).
§ 2.	Сходимость. Открытые и замкнутые множества...................56
1.	Предельные точки. Замыкание (56). 2. Сходимость (58). 3. Плотные подмножества (59). 4. Открытые и замкнутые множества (60).
5.	Открытые и замкнутые множества на прямой (62).
§ 3.	Полные метрические пространства..............................66
1.	Определение и примеры полных метрических пространств (66).
2.	Теорема о вложенных шарах (69). 3. Теорема Бэра (70). 4. Пополнение пространства (71).
4
§ 4.
§ 5.
§ 6.
§ 7.
§ 8.
§ 1.
§ 2.
§ 3.
§ 4.
§ 5.
ОГЛАВЛЕНИЕ
Принцип сжимающих отображений и его применения..................74
1. Принцип сжимающих отображений (74). 2. Простейшие применения принципа сжимающих отображений (75). 3. Теоремы существования и единственности для дифференциальных уравнений (78).
4. Применение принципа сжимающих отображений к интегральным уравнениям (81).
Топологические пространства ................................... 83
1. Определение и примеры топологических пространств (83).
2. Сравнение топологий (85). 3. Определяющие системы окрестностей. База. Аксиомы счетности (86). 4. Сходящиеся последовательности в Т (90). 5. Непрерывные отображения. Гомеоморфизм (91).
6. Аксиомы отделимости (94). 7. Различные способы задания топологии в пространстве. Метризуемость (97).
Компактность....................................................98
1. Понятие компактности (98). 2. Непрерывные отображения компактных пространств (101). 3. Непрерывные и полунепрерывные функции на компактных пространствах (101). 4. Счетная компактность (103). 5. Предкомпактные множества (105).
Компактность в метрических пространствах.......................106
1. Полная ограниченность (106). 2. Компактность и полная ограниченность (107). 3. Предкомпактные подмножества в метрических пространствах (109). 4. Теорема Арцела (109). 5. Теорема Пеано (111).
6. Равномерная непрерывность. Непрерывные отображения метрических компактов (113). 7. Обобщенная теорема Арцела (114).
Непрерывные кривые в метрических пространствах.................115
Глава III
Нормированные и топологические линейные пространства
Линейные пространства..........................................119
1. Определение и примеры линейных пространств (119). 2. Линейная зависимость (121). 3. Подпространства (122). 4. Фактор-простран-ства (123). 5. Линейные функционалы (124). 6. Геометрический смысл линейного функционала (126).
Выпуклые множества и выпуклые функционалы. Теорема Хана — Банаха..................................................128
1. Выпуклые множества и выпуклые тела (128). 2. Однородно-выпуклые функционалы (130). 3. Функционал Минковского (132).
4. Теорема Хана — Банаха (134). 5. Отделимость выпуклых множеств в линейном пространстве (137).
Нормированные пространства.....................................138
1.	Определение и примеры нормированных пространств (139).
2.	Подпространства нормированного пространства (140). 3. Фактор-пространства нормированного пространства (141).
Евклидовы пространства........................................143
1. Определение евклидовых пространств (143). 2. Примеры (145).
3.	Существование ортогональных базисов, ортогонализация (147).
4.	Неравенство Бесселя. Замкнутые ортогональные системы (149).
5.	Полные евклидовы пространства. Теорема Рисса — Фишера (152).
6.	Гильбертово пространство. Теорема об изоморфизме (155).
7.	Подпространства, ортогональные дополнения, прямая сумма (158).
8.	Характеристическое свойство евклидовых пространств (161).
9.	Комплексные евклидовы пространства (164).
Топологические линейные пространства...........................167
1. Определение и примеры (167). 2. Локальная выпуклость (169).
3. Счетно-нормированные пространства (170).
ОГЛАВЛЕНИЕ
5
Глава IV
Линейные функционалы и линейные операторы
л 1. Непрерывные линейные функционалы..........................174
]. Непрерывные линейные функционалы в топологических линейных пространствах (174). 2. Линейные функционалы на нормированных пространствах (175). 3. Теорема Хана — Банаха в нормированном пространстве (179). 4. Линейные функционалы в счетно-нормиро-ваниом пространстве (181).
« 2. Сопряженное пространство..................................182
1. Определение сопряженного пространства (182). 2. Сильная топология в сопряженном пространстве (182). 3. Примеры сопряженных пространств (185). 4. Второе сопряженное пространство (190).
§ 3.	Слабая топология и слабая сходимость .................... 192
1.	Слабая топология и слабая сходимость в линейном топологическом пространстве (192). 2. Слабая сходимость в нормированных пространствах (194). 3. Слабая топология и слабая сходимость в сопряженном пространстве (197). 4. Ограниченные множества в сопряженном пространстве (199).
§ 4.	Обобщенные функции .......................................203
1.	Расширение понятия функции (203). 2. Пространство основных функций (204). 3. Обобщенные функции (205). 4. Действия над обобщенными функциями (207). 5. Достаточность запаса основных функций (210). 6. Восстановление функции по производной. Дифференциальные уравнения в классе обобщенных функций (211). 7. Некоторые обобщения (214).
§ 5.	Линейные операторы........................................218
1.	Определение и примеры линейных операторов (218). 2. Непрерывность и ограниченность (222). 3. Сумма и произведение операторов (223). 4. Обратный оператор, обратимость (224). 5. Сопряженные операторы (230). 6. Сопряженный оператор в евклидовом пространстве. Самосопряженные операторы (232). 7. Спектр оператора. Резольвента (234).
§ 6.	Компактные операторы..................................... 237
1.	Определение и примеры компактных операторов (237), 2. Основные свойства компактных операторов (241). 3. Собственные значения компактного оператора (244). 4. Компактные операторы в гильбертовом пространстве (245). 5. Самосопряженные компактные операторы в И (246).
Глава V
Мера, измеримые функции, интеграл
§ 1. Мера плоских множеств........................................251
1. Мера элементарных множеств (251). 2. Лебегова мера плоских множеств (256). 3. Некоторые дополнения и обобщения (262).
§ 2. Общее понятие меры. Продолжение меры с полукольца на кольцо. Аддитивность и а-аддитивность ............................... 265
1.	Определение меры (265). 2. Продолжение меры с полукольца на порожденное им кольцо (266). 3. а-аддитивность (268).
§ 3.	Лебегово продолжение меры....................................271
1.	Лебегово продолжение меры, определенной на полукольце
с единицей (271). 2. Продолжение меры, заданной на полукольце без единицы (274). 3. Расширение понятия измеримости в случае о-конечной меры (276). 4. Продолжение меры по Жордану (279). 5. Однозначность продолжения меры (280). .
6
ОГЛАВЛЕНИЕ
§ 4.	Измеримые функции............................................282
1.	Определение и основные свойства измеримых функций (282).
2.	Действия над измеримыми функциями (283). 3. Эквивалентность (285). 4. Сходимость почти всюду (286). 5. Теорема Егорова (287). 6. Сходимость по мере (288). 7. Теорема Лузина. С-свой-ство (291).
§ 5.	Интеграл Лебега..............................................291
1.	Простые функции (292). 2. Интеграл Лебега для простых функций (292). 3. Общее определение интеграла Лебега иа множестве конечной меры (294). 4. о-аддитивность и абсолютная непрерывность интеграла Лебега (298). 5. Предельный переход под знаком интеграла Лебега (302). 6. Интеграл Лебега по множеству бесконечной меры (306). 7. Сравнение интеграла Лебега с интегралом Римана (307).
§ 6.	Прямые произведения систем множеств и мер. Теорема Фубини 310 1. Произведения систем множеств (310). 2. Произведения мер (312).
3. Выражение плоской меры через интеграл линейной меры сечений и геометрическое определение интеграла Лебега (314). 4. Теорема Фубини (316).
Глава VI
Неопределенный интеграл Лебега. Теория дифференцирования
§ 1.	Монотонные функции. Дифференцируемость интеграла по верхнему пределу..............................................ь..........321
1.	Основные свойства монотонных функций (321). 2. Дифференцируемость монотонной функции (324). 3. Производная интеграла по верхнему пределу (331).
§ 2.	Функции с ограниченным изменением..............,. .,.......332
§ 3.	Производная неопределенного интеграла Лебега............. 337“
§ 4.	Восстановление функции по ее производной. Абсолютно непрерывные функции................................................... 339'
§ 5.	Интеграл Лебега как функция множества. Теорема Радона—Никодима 349> 1. Заряды. Разложение Хана и разложение Жордана (349). 2. Основные типы зарядов (352). 3. Абсолютно непрерывные заряды. Теорема Радона — Никодима (353).
§ 6.	Интеграл Стилтьеса.........................................35&
1.	Меры Стилтьеса (356). 2. Интеграл Лебега — Стилтьеса (358).
3. Некоторые применения интеграла Лебега — Стилтьеса в теории вероятностей (360). 4. Интеграл Римана — Стилтьеса (362). 5. Предельный переход под знаком интеграла Стилтьеса (366). 6. Общий вид линейных непрерывных функционалов в пространстве непрерывных функций (369).
Глава VII
Пространства суммируемых функций
§ 1. Пространство Lt............................................... 375
1. Определение и основные свойства пространства Li (375). 2. Всюду плотные множества в Lt (377).
§ 2. Пространство L2..............................................  380
1. Определение и основные свойства (380). 2. Случай бесконечной меры (384). 3. Всюду плотные множества в L2. Теорема об изоморфизме (385). 4. Комплексное пространство L2 (387). 5. Сходимость
в среднем квадратичном н ее связь с другими типами сходимости функциональных последовательностей (387).
ОГЛАВЛЕНИЕ
7
3. Ортогональные системы функций в L2. Ряды по ортогональным системам........................................................389
1. Тригонометрическая система. Тригонометрический ряд Фурье (390).
2. Тригонометрические системы иа отрезке (0, л] (393). 3. Ряд Фурье в комплексной форме (394). 4. Многочлены Лежандра (395).
5. Ортогональные системы в произведениях. Кратные ряды Фурье (397). 6. Многочлены, ортогональные относительно данного веса (399). 7. Ортогональный базис в пространствах £2 (—оо, оо) и L2(0, оо). (401). 8. Ортогональные многочлены с дискретным весом (402). 9. Системы Хаара и Радемахера — Уолша (404).
Глава VIII
Тригонометрические ряды. Преобразование Фурье
§ 1. Условия сходимости ряда Фурье................................406
1. Достаточные условия сходимости ряда Фурье в точке (406).
2. Условия равномерной сходимости ряда Фурье (412).
$ 2. Теорема Фейера...............................................415
1. Теорема Фейера (415). 2. Полнота тригонометрической системы. Теорема Вейерштрасса (418). 3. Теорема Фейера для пространства Lt (419).
$ 3. Интеграл Фурье...............................................419
1. Основная теорема (419). 2. Интеграл Фурье в комплексной форме (422).
$ 4. Преобразование Фурье, свойства и применения..................423
1.	Преобразование Фурье и формула обращения (423). 2. Основные свойства преобразования Фурье (427). 3. Полнота функций Эрмита и Лагерра (431). 4. Преобразование Фурье быстро убывающих бесконечно дифференцируемых функций (431). 5. Преобразование Фурье и свертка функций (432). 6. Применение преобразования Фурье к решению уравнения теплопроводности (433). 7. Преобразование Фурье функций нескольких переменных (435).
§ 5. Преобразование Фурье в пространстве Т2 (—оо, оо)..........  438
1.	Теорема Планшереля (438). 2. Функции Эрмита (442).
§ 6. Преобразование Лапласа.....................................445
1. Определение и основные свойства преобразования Лапласа (445).
2. Применение преобразования Лапласа к решению дифференциальных уравнений (операторный метод) (446).
§7. Преобразование Фурье — Стилтьеса.............................448
1. Определение преобразования Фурье — Стилтьеса (448). 2. Применения преобразования Фурье — Стилтьеса в теории вероятностей (450).
$ 8. Преобразование Фурье обобщенных функций.....................452
Глава IX
Линейные интегральные уравнения
$ 1. Основные определения. Некоторые задачи, приводящие к интегральным уравнениям . , , ...................................456
1. Типы интегральных уравнений (456). 2. Примеры задач, приводящих к интегральным уравнениям (457).
$ 2. Интегральные уравнения Фредгольма...........................460
1. Интегральный оператор Фредгольма (460). 2. Уравнения с симметрическим ядром (463). 3. Теоремы Фредгольма. Случай вырожденных ядер (465). 4. Теоремы Фредгольма для уравнений с произвольными ядрами (467). 5. Уравнения Вольтерра (472). 6. Интегральные уравнения первого рода (473).
8
ОГЛАВЛЕНИЕ
§ 3. Интегральные уравнения, содержащие параметр. Метод Фредгольма .........................................................474
1. Спектр компактного оператора в Н (474). 2. Отыскание решения в виде ряда по степеням Л. Детерминанты Фредгольма (475).
Глава X
Элементы дифференциального исчисления в линейных пространствах
§ 1. Дифференцирование в линейных пространствах................480
1. Сильный дифференциал (дифференциал Фреше) (489). 2. Слабый дифференциал (дифференциал Гато) (482). 3. Формула конечных приращений (482). 4. Связь между слабой и сильной дифференцируемостью (483). 5. Дифференцируемые функционалы (485). 6. Абстрактные функции (485). 7. Интеграл (485). 8. Производные высших порядков (488). 9. Дифференциалы высших порядков (491). 10. Формула Тейлора (491).
§ 2. Теорема о неявной функции и некоторые ее применения.......492
1. Теорема о неявной функции (492). 2. Теорема о зависимости решения дифференциального уравнения от начальных данных (495).
3.	Касательные многообразия. Теорема Люстерника (496).
§ 3.	Экстремальные задачи......................................499
1.	Необходимое условие экстремума (500). 2. Второй дифференциал. Достаточные условия экстремума функционала (593). 3. Экстремальные задачи с ограничениями (506).
§ 4.	Метод Ньютона.............................................508
Дополнение Банаховы алгебры
§ 1.	Определение и примеры банаховых алгебр....................518
1.	Банаховы алгебры, изоморфизмы банаховых алгебр (513). 2. Примеры банаховых алгебр (514). 3. Максимальные идеалы (515).
§ 2.	Спектр и резольвента.....................................516.
1.	Определения и примеры (516). 2. Свойства спектра (517). 3. Теорема о спектральном радиусе (519).
§ 3.	Некоторые вспомогательные результаты......................529
1.	Теорема о фактор-алгебре (520). 2. Три леммы (521).
§ 4.	Основные теоремы........................................  521
1.	Линейные непрерывные мультипликативные функционалы и максимальные идеалы (521). 2. Топология во множестве Л. Основные теоремы (523). 3. Теорема Винера; упражнения (525).
Литература.....................................................529
Распределение литературы по	главам ............................539
Предметный указатель...........................................531
ПРЕДИСЛОВИЕ К ЧЕТВЕРТОМУ ИЗДАНИЮ
Это издание выходит уже после смерти Сергея Васильевича Фомина. Он успел, однако, проделать всю основную работу по усовершенствованию книги. Существенно переработана десятая глава. В ней добавлен параграф, посвященный теореме о неявной функции и изменен параграф «Экстремальные задачи». Эти изменения повлекли за собой необходимость изменений в четвертой главе (следствия из теоремы Хана — Банаха и теоремы Банаха об обратном операторе).
Текст книги был просмотрен В. М. Алексеевым и В. М. Тихомировым, которым я выражаю искреннюю благодарность.
А. Колмогоров
ИЗ ПРЕДИСЛОВИЯ КО ВТОРОМУ ИЗДАНИЮ
Первое издание «Элементов теории функций и функционального анализа» вышло двумя отдельными выпусками в 1954 к 1960 годах. Появление этих выпусков было связано с включением в конце 40-х годов в программу механико-математического факультета МГУ курса «Анализ III», объединявшего элементы теории меры и теории функций, интегральные уравнения, сведения из функционального анализа, а позже и вариационное исчисление. Этот курс, читавшийся в МГУ сперва А. Н. Колмогоровым, а потом и другими лекторами, в том числе С. В. Фоминым, вошел в дальнейшем в программы и других университетов.
В свое время замена в МГУ отдельных курсов теории функций действительного переменного, интегральных уравнений и вариационного исчисления единым курсом «Анализ III» вызвала большие споры. Перед курсом была поставлена задача приучить студентов к двойному зрению: с одной стороны, следить за внутренней логикой развития теории множеств, общей теории непрерывных отображений метрических и топологических пространств,, линейных пространств и функционалов и операторов на них, чистой теории меры и интегрирования в общих «пространствах с мерой», с другой, —не упускать из виду обслуживаемую этими более абстрактными областями математики проблематику классического и даже прикладного анализа.
При решении этой задачи мы в планировке книги отдаем-предпочтение абстрактной линии построения курса. От общей теории множеств (глава I) можно перейти к метрическим и топологическим пространствам и их непрерывным отображениям-(глава II) либо непосредственно к пространствам с мерой (без топологии) и интегрированию в них (глава V). В главах III и IV изучаются линейные пространства и линейные функционалы и операторы в них. От этих глав возможен прямой переход к главе X (нелинейные дифференцируемые операторы и функционалы). В главе VII изучаются линейные пространства суммируемых функций. Лишь в главах VI и VIII внимание, по существу, сосредоточено на функциях действительного переменного.
ИЗ ПРЕДИСЛОВИЯ КО ВТОРОМУ ИЗДАНИЮ
11
Хотя в первую очередь в нашей книге излагаются общие понятия теории функций и функционального анализа, внимание к примыкающей сюда классической проблематике читатель может проследить почти во всех главах. Включение в книгу глав VI (теория дифференцирования), VIII (тригонометрические ряды и пнтеграл Фурье) и IX (линейные интегральные уравнения) приводит к тому, что сейчас наша книга охватывает всю программу принятого в МГУ курса «Анализ III», кроме вариационного исчисления. Мы не включили этот раздел в нашу книгу, ограничившись лишь изложением в главе X самых первых представлений о нелинейном функциональном анализе.
В новом издании, как и в первоначальном, значительное место занимает-общая теория меры. В последнее время появилось довольно много изложений теории интегрирования, основанной на схеме Даниеля, не использующей аппарата теории меры. Мы полагаем, однако, что теория меры достаточно важна и сама по себе, независимо от введения понятия интеграла, и заслуживает включения в университетский курс.
Включение новых глав заметно увеличило объем книги. Старые главы тоже существенно переработаны и в них включены новые параграфы (например, о порядковых типах и трансфинитных числах, топологических пространствах, обобщенных функциях и др.).
Перерабатывая нашу книгу и включая в нее новые разделы, мы старались, однако, сохранить в ней тот сравнительно элементарный стиль изложения, который был выдержан, как нам кажется, в первом издании. Мы надеемся, что она найдет свое естественное место в университетском преподавании наряду с другими руководствами, в частности, с книгой Г. Е. Шилова «Математический анализ, специальный курс», в которой более подчеркнута аналитическая сторона дела, а интерес к метрическим и топологическим пространствам, мерам и т. д. как самостоятельным объектам культивируется в меньшей степени.
А. Колмогоров С. Фомин
ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ
При подготовке нового издания мы сохранили общий план книги и постарались не увеличивать ее объем. Вместе с тем весь текст книги был заново просмотрен и отредактирован. Большую помощь в этой работе нам оказал Ф. В. Широков. В главах I и IV сделаны некоторые перестановки и изменения, облегчающие,, на наш взгляд, переход от более простых понятий к более сложным (например, от банаховых пространств к более общим в гл. IV). Довольно существенно переработано изложение теории меры (гл. V).
В последние годы в курс «Анализ III» часто включаются элементы теории банаховых алгебр и спектрального анализа. Поэтому мы сочли целесообразным включить в нашу книгу написанное В. М. Тихомировым дополнение, посвященное этим вопросам.
А. Колмогоров
С. Фомин
ГЛАВА I
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
§ 1. Понятие множества. Операции над множествами
1. Основные определения. В математике встречаются самые разнообразные множества. Можно говорить о множестве граней многогранника, точек на прямой, множестве натуральных чисел и т. д. Понятие множества настолько общее, что трудно дать ему какое-либо определение, которое не сводилось бы просто к замене слова «множество» его синонимами: совокупность, собрание элементов и т. п.
Роль, которую понятие множества играет в современной математике, определяется не только тем, что сама теория множеств стала в настоящее время весьма обширной и содержательной дисциплиной, но главным образом тем влиянием, которое теория множеств, возникшая в конце прошлого столетия, оказывала и оказывает на всю математику в целом. Не ставя своей задачей сколько-нибудь полное изложение этой теории, мы здесь лишь введем основные обозначения и приведем первоначальные теоретико-множественные понятия, используемые в дальнейшем.
Множества мы будем обозначать прописными буквами А, В, ..., а их элементы — малыми а, Ь, ... Утверждение «элемент а принадлежит множеству А» символически записывается так: а е А (или А э а); запись а ф А (или А а) означает, что элемент а не принадлежит А. Если все элементы, из которых состоит А, входят и в В (причем случай А — В не исключается), то мы называем А подмножеством множества В и пишем А с В. Например, целые числа образуют подмножество в множестве всех действительных чисел.
Иногда мы не знаем заранее, содержит ли некое множество (например, множество корней данного уравнения) хотя бы один элемент. Поэтому целесообразно ввести понятие пустого множества, т. е. множества, не содержащего ни одного элемента. Мы будем обозначать его символом 0. Любое множество содержит 0 в качестве подмножества. Подмножества некоторого множества, отличные от него самого и от 0, называются собственными.
2. Операции над множествами. Пусть А и В — произвольные Множества; их суммой, или объединением С — A U В называется
14
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. I
множество, состоящее из всех элементов, принадлежащих хотя бы одному из множеств А и В (рис. 1).
Аналогично определяется сумма любого (конечного или бесконечного) числа множеств: если Аа — произвольные множества, то их сумма (J Аа есть совокупность элементов, каждый а
из которых принадлежит хотя бы одному из множеств Аа.
Назовем пересечением С = А П В множеств Л и В множество, состоящее из всех элементов, принадлежащих как А, так
Рис. 1.
А В
£=А"В
Рис. 2.
и В (рис. 2). Например, пересечение множества всех четных чисел и множества всех чисел, делящихся на три, состоит из всех целых чисел, делящихся без остатка на шесть. Пересечением любого (конечного или бесконечного) числа множеств Аа называется совокупность П Аа элементов, принадлежащих ка-а
ждому из множеств Аа.
Операции сложения и пересечения множеств по самому своему определению коммутативны и ассоциативны, т. е.
AUB = BUA, G4-UB)UC = AU (В UС), АПВ = ВПА, (АПВ) ПС = Af) (В П С).
Кроме того, они взаимно дистрибутивны:
(АиВ)ПС = (АПС)и(ВПС),	(1)
(А п в) и С = (А и с) п (В и с).	(2)
Действительно, проверим, например, первое из этих равенств1). Пусть элемент х принадлежит множеству, стоящему в левой части равенства (1), т. е. х е (A U В) Г) С. Это означает, что х входит в С и, кроме того, по крайней мере в одно из множеств А или В. Но тогда х принадлежит хотя бы одному из множеств А П С или В П С, т. е. входит в правую часть рассматриваемого равенства. Обратно, пусть хе(Л П С) U (В П С). Тогда
’) Равенство двух множеств А = В понимается как тождественное равенство, т. е. оно означает, что каждый элемент множества А принадлежит В, и наоборот. Иначе говоря, равенство А = В равносильно тому, что выполнены оба включения: А с. В и В с. А.
I 1]	ПОНЯТИЕ МНОЖЕСТВА ОПЕРАЦИИ НАД МНОЖЕСТВАМИ	15
хеД П С или хеВРС. Следовательно, хеС и, кроме того, X входит в А или В, т. е. xe,4UB. Таким образом, хе(Я U В) П С. Равенство (1) доказано. Аналогично проверяется равенство (2).
Определим для множеств операцию вычитания. Мы назовем разностью С = А \ В множеств А и В совокупность тех элементов из А, которые не содержатся в В (рис. 3). При этом, вообще
Рис. 3.
Рис. 4.
говоря, не предполагается, что А В. Вместо А \ В иногда пишут А — В.
Иногда (например, в теории меры) удобно рассматривать так называемую симметрическую разность двух множеств А и В, которая определяется как сумма разностей А \ В и В \ А (рис. 4). Симметрическую разность С множеств А и В мы будем обозначать символом А Л В. Таким образом, по определению,
АДВ = (А\В)и(В\А).
Упражнение. Показать, что
А А В = (A (J В) \ (А П В).
Часто приходится рассматривать тот или иной запас множеств, являющихся подмножествами некоторого основного множества S, например, различные множества точек на числовой прямой. В этом случае разность S \ А называют дополнением множества А и обозначают СА или А'.
В теории множеств и ее приложениях весьма важную роль играет так называемый принцип двойственности, который основан на следующих двух соотношениях:
1. Дополнение суммы равно пересечению дополнений
s\U Aa=A(s\4).	(3)
a	a
2. Дополнение пересечения равно сумме дополнений
S\AAe=U(S\Aa).	(4)
a	a
16
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
(ГЛ. I
Принцип двойственности состоит в том, что из любого равенства, относящегося к системе подмножеств фиксированного множества S, совершенно автоматически может быть получено другое — двойственное — равенство путем замены всех рассматриваемых множеств их дополнениями, сумм множеств — пересечениями, а пересечений — суммами. Примером использования этого принципа может служить вывод теоремы 3' из теоремы 3 § 2 гл. II.
Приведем доказательство соотношения (3).
Пусть х е S \ U Аа. Это означает, что х не входит в объеди-а
пение U а> т- е- не входит ни в одно из множеств Аа. Следова-а
тельно, х принадлежит каждому из дополнений-S \ Аа и потому х i= Р| (S \ Аа). Обратно, пусть х е П (S \ Аа), т. е. х входит а	а
в каждое S \ Аа; тогда х не входит ни в одно из множеств Аа, т. е. не принадлежит их сумме U Аа, а тогда х е S\U4- Ра-а	а
венство (3) доказано. Соотношение (4) доказывается аналогично. (Проведите доказательство.)
Название «симметрическая разность» для операции Л Д В не совсем удачно; эта операция во многом аналогична операции взятия суммы множеств ЛОВ. Действительно, ЛОВ означает, что мы связываем неисключающим «или» два утверждения: «элемент принадлежит Л» и «элемент принадлежит В», а Л Д В означает, что те же самые два утверждения связываются исключающим «или»: элемент х принадлежит Л Д В тогда и только тогда, когда он принадлежит либо только А, либо только В. Множество Л Д В можно было бы назвать «суммой по модулю два» множеств Л и В (берется объединение этих двух множеств, но элементы, которые при этом встречаются дважды, выбрасываются).
§ 2. Отображения. Разбиения на классы
I. Отображение множеств. Общее понятие функции. В анализе понятие функции вводится следующим образом. Пусть X — некоторое множество на числовой прямой. Говорят, что на этом множестве определена функция f, если каждому числу х^Х поставлено в соответствие определенное число y — f(x). При этом X называется областью определения данной функции, а У — совокупность всех значений, принимаемых этой функцией, — ее областью значений.
Если же вместо числовых рассматривать множества какой угодно природы, то мы придем к самому общему понятию функции. Пусть М и W— два произвольных множества. Говорят, что на М определена функция f, принимающая значения из IV, если каждому элементу х е М поставлен в соответствие один и только один элемент у из N. Для множеств произвольной природы (как, впрочем, и в случае числовых множеств) вместо термина
J 2)	ОТОБРАЖЕНИЯ. РАЗБИЕНИЯ НА КЛАССЫ	17
«функция» часто пользуются термином «отображение», говоря об отображении одного множества в другое. При специализации природы множеств М и N возникают специальные типы функций, которые носят особые названия «вектор-функция», «мера», «функционал», «оператор» и т. д. Мы столкнемся с ними в дальнейшем.
Для обозначения функции (отображения) из М в N мы будем часто пользоваться записью f: М -> N.
Если а — элемент из М, то отвечающий ему элемент b—f(a) из N называется его образом (при отображении f). Совокупность всех тех элементов а из М, образом которых является данный элемент b е N, .называется прообразом (или, точнее полным прообразом) элемента b и обозначается f~l(b).
Пусть А — некоторое множество из Л1; совокупность У(а):аеА} всех элементов вида f(a), где ае<4, называется образом А и обозначается f(A). В свою очередь для каждого множества В из N определяется его (полный!) прообраз f~'(B), а именно: f~'(B) есть совокупность всех тех элементов из М, образы которых принадлежат В. Может оказаться, что ни один элемент b из В не имеет непустого прообраза, тогда и прообраз /-1(В) будет пустым множеством.
Здесь мы ограничимся рассмотрением самых общих свойств отображений.
Введем следующую терминологию. Мы будем говорить, что f есть отображение множества М «на» множество N, если f(M) — = N-, такое отображение называют также сюръекцией. В общем случае, т. е. когда f(M)cs N, говорят, что f есть отображение М «в» N.
Если для любых двух различных элементов Х| и х? из М их образы у\ = f(xj) и z/2 = [(хг) также различны, то f называется инъекцией. Отображение f : М -> N, которое одновременно является сюръекцией и инъекцией, называется биекцией или взаимно однозначным соответствием между М и N.
Установим основные свойства отображений.
Теорема 1. Прообраз суммы двух множеств равен сумме их прообразов:
Г1 (А и в) = г' (А) и Г1 (В).
Доказательство. Пусть элемент х принадлежит множеству f~l (A U В). Это означает, что f(x)e A U В, т. е. f(x)e.4 или f(x)^B. Но тогда х принадлежит по крайней мере одному из множеств f-1(А) или /-1(В),т. е. xef-1(A)U f-1 (В). Обратно, если xef-1(A) и /-1(В), то х принадлежит по крайней мере одному из множеств f~l(A) и f~'(B), т. е. f(x) принадлежит хотя бы одному из множеств А или В, следовательно, f(x)^A (J В, но тогда xef-1(A U В).
18
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. Г
Теорема 2. Прообраз пересечения двух множеств равен пересечению их прообразов:
Г1(АПВ) = Г1(А)ПГ1(В).
Доказательство. Если х е f~l (A Q В), то f (х) е А (] Вг т. е. f (х) sA и f (х) е В, следовательно, х е /-1 (А) и хе f (В), т. е. хе/-’(А)ПГ'(В).
Обратно, если хе f 1 (А) П f '(В), т. е.хе/ '(А)ихе/ 1 (В), то /(х)еА и f (х) е В. Иначе говоря, f (х) е А (] В. Следовательно, хе/-1(АГ|В).
Теоремы 1 и 2 остаются в силе для сумм и пересечений любого (конечного или бесконечного) числа множеств так же, как и следующая теорема.
Теорема 3. Образ суммы двух множеств равен сумме их образов:
/(AUB) = /(A)U/(B).
Доказательство. Если у е f (A U В), то это означает, что y = f(x), где х принадлежит по крайней мере одному из множеств А и В. Следовательно, у = f (х)е f (A) U f(B). Обратно, если у е /(A) U f (В), то у — f(x), где х принадлежит по крайней мере одному из множеств А и В, т. е. х е A U В и, следовательно, у = f(x)e= f(A U В).
Заметим, что образ пересечения двух множеств, вообще говоря, не совпадает с пересечением их образов. Например, пусть рассматриваемое отображение представляет собой проектирование плоскости на ось х. Тогда отрезки
О <^х «С 1, у — О,
О^Сх^С 1, у= 1
не пересекаются, а в то же время их образы совпадают.
Упражнение. Докажите, что прообраз дополнения равен дополнению прообраза. Верно ли аналогичное утверждение для образа дополнения?
2. Разбиение на классы. Отношения эквивалентности. В самых различных вопросах встречаются разбиения тех или иных множеств на попарно непересекающиеся подмножества. Например, плоскость (рассматриваемую как множество точек) можно разбить на прямые, параллельные оси х, трехмерное пространство можно представить как объединение концентрических сфер различных радиусов (начиная с г = 0), жителей данного города можно разбить на группы по их году рождения и т. п.
Каждый раз, когда некоторое множество М представлено тем или иным способом как сумма своих попарно непересекающихся подмножеств, мы говорим о разбиении множества М на классы.
«2]
ОТОБРАЖЕНИЯ. РАЗБИЕНИЯ НА КЛАССЫ
19
Обычно приходится иметь дело с разбиениями, построенными на базе того или иного признака, по которому элементы множества М объединяются в классы. Например, множество всех треугольников на плоскости можно разбить на классы равных между собой или на классы равновеликих треугольников, все функции от х можно разбить на классы, собирая в один класс функции, принимающие в данной точке одинаковые значения, и т. д.
Признаки, по которым элементы множества разбиваются на классы, могут быть самыми разнообразными. Но все же такой признак не вполне произволен. Предположим, например, что мы захотели бы разбить все действительные числа на классы, включая число b в тот же класс, что и число а, в том и только в том случае, когда b > а. Ясно, что никакого разбиения действительных чисел на классы таким путем получить нельзя, так как если b > а, т. е. если b следует зачислить в тот же класс, что и а, то л < Ь, т. е. число а нельзя включить в тот же класс, что и Ь. Кроме того, так как .«не больше, чем само а, то а не должно попасть в один класс' с самим собой! Другой пример. Попробуем разбить точки плоскости на классы, относя две точки к одному классу в том и только том случае, когда расстояние между ними меньше 1. Ясно, что добиться этого нельзя, так как если расстояние от а до b меньше 1 и расстояние от b до с меньше 1, то это вовсе не означает, что расстояние от а до с меньше 1. Таким образом, зачисляя а в один класс с b, а b в один класс с с, мы получим, что в один и тот же класс могут попасть две точки, расстояние между которыми больше 1.
Приведенные примеры подсказывают условия, при которых тот или иной признак действительно позволяет разбить элементы некоторого множества на классы.
Пусть М — некоторое множество и пусть некоторые из пар (а, Ь) элементов этого множества являются «отмеченными»1). Дели (а, Ь)— «отмеченная» пара, то мы будем говорить, что элемент а связан с b отношением ср, и обозначать это символом а^Ь. Например, если имеется в виду разбиение треугольников на классы равновеликих, то а^Ь означает «треугольник а имеет ту же площадь, что и треугольник Ь». Данное отношение <р называется отношением эквивалентности, если оно обладает следующими свойствами:
1.	Рефлексивность: а~а для любого элемента а е М.
2.	Симметричность: если а ~Ь, то Ь~а.
3.	Транзитивность: если а^Ь и Ь^с, то а.~с.
’) При этом элементы а и b берутся в определенном порядке, т. е. (а, Ь) и (Ь, а) — две, вообще говоря, различные пары.
20
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. [
Эти условия необходимы и достаточны для того, чтобы отношение ф (признак!) позволяло разбить множество М на классы. В самом деле, всякое разбиение данного множества на классы определяет между элементами этого множества некоторое отношение эквивалентности. Действительно, если а ~b означает «а находится в том же классе, что и Ь», то отношение ф будет, как легко проверить, рефлексивным, симметричным и транзитивным.
Обратно, пусть ф — некоторое отношение эквивалентности между элементами множества М и Ка— класс элементов х из М, эквивалентных данному элементу а: х~а. В силу свойства рефлексивности элемент а сам принадлежит классу Ка- Покажем, что два класса Ка и Кь либо совпадают, либо не пересекаются. Пусть некоторый элемент с принадлежит одновременно и Ка и Кь, т. е. с а и с~Ь. Тогда в силу симметричности а ~ с и в силу транзитивности
«т6-	(0
Если теперь х — произвольный элемент из Ка, т. е. х ~ а, то в силу (1) и свойства транзитивности х~Ь, т. е. х е Кь-
Точно так же доказывается, что всякий элемент у е Кь входит в Ка- Таким образом, два класса Ка и Кь, имеющих хотя бы один общий элемент, совпадают между собой. Мы получили разбиение множества М на классы по заданному отношению эквивалентности.
Понятие разбиения множества на классы тесно связано с рассмотренным в предыдущем пункте понятием отображения.
Пусть f — отображение множества А в множество В. Собрав в один класс все те элементы из А, образы которых в В совпадают, мы получим, очевидно, некоторое разбиение множества А. Обратно, рассмотрим произвольное множество А и некоторое его разбиение на классы. Пусть В — совокупность тех классов, на которые разбито множество А. Ставя в соответствие каждому элементу а^А тот класс (т. е. тот элемент из В), к которому а. принадлежит, мы получим отображение множества А на множество В.	i
Примеры. 1. Спроектируем плоскость ху на ось х. Прообразы точек оси х — вертикальные прямые. Следовательно, этому отображению отвечает разбиение плоскости на параллельные прямые.
2. Разобьем все точки трехмерного пространства на классы, объединив в один класс точки, равноудаленные от начала координат. Каждый класс представляет собой сферу некоторого радиуса. Совокупность всех этих классов можно отождествить с множеством всех точек, лежащих на луче [0, оо). Итак, разбие
$ 3]	ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ. ПОНЯТИЕ МОЩНОСТИ	2f
нию трехмерного пространства на концентрические сферы отвечает отображение этого пространства на полупрямую.
3. Объединим в один класс все действительные числа с одинаковой дробной частью. Этому разбиению отвечает отображение прямой линии на окружность единичной длины.
Понятие эквивалентности является частным случаем более общего понятия бинарного отношения. Пусть М — произвольное множество. Обозначим через М X М или М2 совокупность всех упорядоченных пар (а, Ь), где а, Ь^М. Говорят, что в М задано бинарное отношение <р, если в М2 выделено произвольное подмножество /?ц>. Точнее говоря, мы скажем, что элемент а находится в отношении <р к элементу b — обозначение acpft — в том и только том случае, когда пара (а, Ь) принадлежит /?.т. Примером бинарного отношения может служить отношение тождества е; именно, aeb в том и только том случае, если а — Ь; иначе говоря, это — отношение, задаваемое диагональю А в М X М, т. е. подмножеством пар вида (а, а). Ясно, что всякое отношение эквивалентности <р в некотором множестве М есть бинарное отношение, подчиненное следующим условиям:
1)	Диагональ А принадлежит Rv (рефлексивность).
2)	Если (а, 6)е/?ф, то и (b,a')^R,f (симметричность).
3)	Если (а, Ь) е и (Ь, с) е /?<(, то и (а, с) е R$ (транзитивность) .
Итак; эквивалентность — это бинарное отношение, удовлетворяющее условиям рефлексивности, транзитивности и симметричности. В § 4 мы рассмотрим другой важный частный случай бинарного отношения — частичную упорядоченность.
§ 3. Эквивалентность множеств. Понятие мощности множества
1.	Конечные и бесконечные множества. Рассматривая различные множества, мы замечаем, что иногда можно, если не фактически, то хотя бы примерно, указать число элементов в данном множестве. Таковы, например, множество всех вершин некоторого многогранника, множество всех простых чисел, не превосходящих данного числа, множество всех молекул воды на Земле и т. д. Каждое из этих множеств содержит конечное, хотя, быть может, и неизвестное нам число элементов. С другой стороны, существуют множества, состоящие из бесконечного числа элементов. Таково, например, множество всех натуральных чисел, множество всех точек на прямой, всех кругов на плоскости, всех многочленов с рациональными коэффициентами и т. д. При этом, говоря, что множество бесконечно, мы имеем в виду, что из него можно извлечь один элемент, два элемента и т. д., причем после каждого такого шага в этом множестве еще останутся элементы.
22
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. I
Два конечных множества мы можем сравнивать по числу элементов и судить, одинаково это число или же в одном из множеств элементов больше, чем в другом. Спрашивается, можно ли подобным же образом сравнивать бесконечные множества? Иначе говоря, имеет ли смысл, например, вопрос о том, чего больше: кругов на плоскости или рациональных точек на прямой, функций, определенных на отрезке [0, 1], или прямых в пространстве, и т. д.?
Посмотрим, как мы сравниваем между собой два конечных множества. Можно, например, сосчитать число элементов в каждом из них и, таким образом, эти два множества сравнить. Но можно поступить и иначе, именно, попытаться установить биекцию, т. е. взаимно однозначное соответствие между элементами этих множеств, иначе говоря, такое соответствие, при котором каждому элементу одного множества отвечает один и только один элемент другого, и наоборот. Ясно, что взаимно однозначное соответствие между двумя конечными множествами можно установить тогда и только тогда, когда число элементов в них одинаково. Например, чтобы проверить, одинаково ли число студентов в группе и стульев в аудитории, можно, не пересчитывая ни тех, ни других, посадить каждого студента на определенный стул. Если мест хватит всем и не останется ни одного лишнего стула, т. е. если будет установлена биекция между этими двумя множествами, то это и будет означать, что число элементов в них одинаково.
Заметим теперь, что если первый способ (подсчет числа элементов) годится лишь для сравнения конечных множеств, второй (установление взаимно однозначного соответствия) пригоден и для бесконечных.
2.	Счетные множества. Простейшим среди бесконечных множеств является множество натуральных чисел. Назовем счетным множеством всякое множество, элементы которого можно биективно сопоставить со всеми натуральными числами. Иначе говоря, счетное множество — это такое множество, элементы которого можно занумеровать в бесконечную последовательность: •сц, а2, ..., ап, ... Приведем примеры счетных множеств.
1.	Множество всех целых чисел. Установим соответствие между всеми целыми и всеми натуральными числами по следующей схеме:
0-1 1 -22...,
1	23	45...,
вообще, неотрицательному числу п 0 сопоставим нечетное число 2п+1, а отрицательному п < 0 — четное число 2|п|:
n«->2n-|- 1 при п^О, п *-> 2 \ п | при п < 0.
«3]
ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ. ПОНЯТИЕ МОЩНОСТИ
2J
2.	Множество всех четных положительных чисел. Соответствие очевидно: п -«-> 2п.
3.	Множество 2, 4, 8, . .., 2П, ... степеней числа 2. Здесь соответствие также очевидно. Каждому числу 2П сопоставляется число п.
4.	Рассмотрим более сложный пример, а именно,- покажем,, что множество всех рациональных чисел счетно. Каждое рацио- х нальное число однозначно записывается в виде несократимой дроби <x — plq, > 0. Назовем сумму |р| + q высотой рационального числа а. Ясно, что число дробей с данной высотой п конечно. Например, высоту 1 имеет только число 0/1, высоту 2 — числа 1/1 и —1/1, высоту 3 — числа 2/1, 1/2, —2/1 и —1/2 и т. д. Будем нумеровать все рациональные числа по возрастанию высоты, т. е. сперва выпишем числа высоты 1, потом — числа высоты 2 и т. д. При этом всякое рациональное число получит некоторый номер, т. е. будет установлено взаимно однозначное соответствие между всеми натуральными и всеми рациональными числами.
Бесконечное множество, не являющееся счетным, называется несчетным множеством.
Установим некоторые общие свойства счетных множеств.
1.	Всякое подмножество счетного множества конечно или счетно.
Доказательство. Пусть А—счетное множество, а В — его подмножество. Занумеруем элементы множества A: aIt а2, ... ..., ап ... Пусть аЛ1, аП2, ... — те из них, которые входят в В. Если среди чисел пь п2, ... есть наибольшее, то В конечно, в. противном случае В счетно, поскольку его члены аП1, ап„.. . занумерованы числами 1,2,...
2.	Сумма любого конечного или счетного множества счетных множеств есть снова счетное множество.
Доказательство. Пусть Ль Л2, ... — счетные множества. Мы можем считать, что они попарно не пересекаются, так как иначе мы рассмотрели бы вместо них множества Ль Л2\Ль Лз\(Л1 U Л2), ... — каждое из которых не более чем счетно,— имеющие ту же самую сумму, что и множества Ль Л2, ... Все элементы множеств Ль Л2, ... можно записать в виде следующей бесконечной таблицы:
Ян	с12	а13	й|4	...
a2i	Пи	а23	а24	...
а31	а32	а33	°34	•	•	•
Й41	Й42	Щ3	«44	.	.	.
24
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. I
где в первой строке стоят элементы множества Alt во второй — элементы множества А2 и т. д. Занумеруем теперь все эти элементы «по диагоналям», т. е. за первый элемент примем а1Ь за второй Я12, за третий a2i и т. д., двигаясь в порядке, указанном стрелками на следующей таблице:
«II —>
«12
а13~* «14
«21
I «31
«22 «а
«32 «33
«24 •
£2’4	•
«41	«42 «43	«44 • • •
Ясно, что при этом каждый элемент каждого из множеств получит определенный номер, т. е. будет установлено взаимно однозначное соответствие между всеми элементами всех множеств Ay, А2, ... и всеми натуральными числами. Наше утверждение доказано.
Упражнения. Доказать, что множество всех многочленов с рациональными коэффициентами счетно.
2.	Число £ называется алгебраическим, если оно является корнем некоторого многочлена с рациональными коэффициентами. Доказать, что множество всех алгебраических чисел счетно.
3.	Доказать, что множество всех рациональных интервалов (т. е. интервалов с рациональными концами) на прямой счетно.
4.	Доказать, что множество всех точек плоскости, имеющих рациональные координаты, счетно.
Указание. Воспользоваться свойством 2.
3. Всякое бесконечное множество содержит счетное подмножество.
Доказательство. Пусть М — бесконечное множество. Выберем в нем произвольный элемент а\. Поскольку М бесконечно, в нем найдется элемент а2, отличный от «|, затем найдется элемент «3, отличный от «1 и от а2 и т. д. Продолжая этот процесс (который не может оборваться из-за «нехватки» элементов, ибо М бесконечно), мы получаем счетное подмножество
А = {а1; а2, ..., ап, ...}
множества М. Предложение доказано.
Это предложение показывает, что среди бесконечных множеств счетные являются «самыми маленькими». Ниже мы выясним, существуют ли несчетные бесконечные множества.
3. Эквивалентность множеств. Сравнивая те или иные бесконечные множества с натуральным рядом, мы пришли к понятию счетного множества. Ясно, что множества можно сравнивать не только с множеством натуральных чисел; установление взаимно
5 3]
ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ. ПОНЯТИЕ МОЩНОСТИ
25
однозначного соответствия (биекции) позволяет сравнивать между собой любые два множества. Введем следующее опреде
ление.
Определение. Два множества, М и N, называются эквивалентными (обозначение М ~ N), если между их элементами можно установить взаимно однозначное соответствие.
Понятие эквивалентности применимо к любым множествам, как конечным, так и бесконечным. Два конечных множества эквивалентны между собой тогда (и только тогда), когда число элементов у них одинаково. Определение счетного множества можно теперь сформулировать следующим образом: множество называется счетным, если оно эквивалентно множеству натуральных чисел. Ясно, что два множества, эквивалентные третьему, эквивалентны между собой; в частности, любые два счетных множества эквивалентны между собой.
Примеры. 1. Множества точек на любых двух отрезках [а, 6] и [с, d] эквивалентны между собой. Из рис. 5 ясно, как
установить между ними биекцию. Именно, точки р и q соответствуют друг другу, если они являются проекциями одной и той же точки г вспомогательного отрезка ef.
Рис. 6.
2.	Множество всех точек на расширенной комплексной плоскости эквивалентно множеству всех точек на сфере. Биекцию а »-> z можно установить, например, с помощью стереографической проекции (рис. 6).
3.	Множество всех чисел в интервале (0, 1) эквивалентно множеству всех точек на прямой. Соответствие можно установить, например, с помощью функции
«/=4агс‘ех+т-
Рассматривая примеры, приведенные здесь и в п. 2, можно заметить, что иногда бесконечное множество оказывается экви-
26
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
(ГЛ. I
^валентным своей истинной части. Например, натуральных чисел оказывается «столько же», сколько и всех целых или даже всех рациональных; на интервале (0, 1) «столько же» точек, сколько и на всей прямой, и т. д. Это явление характерно для бесконечных множеств. Действительно, в п. 2 (свойство 3) мы показали, что из всякого бесконечного множества М можно выбрать счетное подмножество; пусть A=[at,a2, ..., ап, ...} такое подмножество.
Разобьем его на два счетных подмножества
А, = {аь «з, а5, ...} и А2 = {с2,	а6, •••)
и установим между А и At взаимно однозначное соответствие. Это соответствие можно затем продолжить до взаимно однозначного соответствия между множествами AU(A4\A) = A4 и Ai U (М \ А) = М \ А2, отнеся каждому элементу из М \ А сам этот элемент. Между тем множество М \ А2 не совпадает с М, т. е. является собственным подмножеством для М. Мы получаем, таким образом, следующее предложение:
Всякое бесконечное множество эквивалентно некоторому своему собственному подмножеству.
Это свойство можно принять за определение бесконечного множества.
Упражнение. Доказать, что если М — произвольное бесконечное множество и А счетно, то М ~ М U А.
4.	Несчетность множества действительных чисел. В п. 2 мы привели примеры счетных множеств. Число этих примеров можно было бы увеличить. Кроме того, как мы показали, сумма конечного или счетного числа счетных множеств снова есть счетное множество.
Естественно возникает вопрос: а существуют ли вообще несчетные множества? Положительный ответ на него дает следующая теорема.
Теорема 1. Множество действительных чисел, заключенных между нулем и единицей, несчетно.
Доказательство. Предположим, что дано какое-то счетное множество (всех или только некоторых) действительных чисел а, лежащих на отрезке [0, 1]:
(Zj —0,	Я. 1а12а13	•	•	•	а1п	•	•	•>
Ct2 = О,	fl2^22^23	•	•	•	®2а	•	•	•>
а3 = 0,	а31а33а33	...	а3ге	•	•	•, [
ап == 0,	яП|С1а2(1п3	...	апп	...,
(О
»3]
ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ. ПОНЯТИЕ МОЩНОСТИ
27
Здесь aih — k-я десятичная цифра числа ai. Построим дробь
0 = 0, Ь,Ь2 ... bn ...
диагональной процедурой Кантора, а именно: за bi примем произвольную цифру, не совпадающую с ап, за Ь2— произвольную Цифру, не совпадающую с а22, и т. д.; вообще, за Ьп примем произвольную цифру, не совпадающую с апп. Эта десятичная дробь не может совпасть ни с одной дробью, содержащейся в перечне (1). Действительно, от oci дробь 0 отличается по крайней мере первой цифрой, от аг — второй цифрой и т. д.; вообще, так как Ьп =# а.пп для всех п, то дробь 0 отлична от любой из дробей а,-, входящих в перечень (1). Таким образом, никакое счетное множество действительных чисел, лежащих на отрезке [0, 1], не исчерпывает этого отрезка.
Приведенное доказательство содержит небольшой «обман». Дело в том, что некоторые числа (а именно, числа вида р/10«) могут быть записаны в виде десятичной дроби двумя способами: с бесконечным числом нулей или с бесконечным числом девяток; например,
у = -^- = 0,5000 ... =0,4999 ...
Таким образом, несовпадение двух десятичных дробей еще не гарантирует различия изображаемых ими чисел.
Однако если дробь 0 строить осторожнее, так, чтобы она не содержала ни нулей, ни девяток, полагая, например, Ьп — 2, если апп — 1, и Ьп = 1, если апп =/= 1, то доказательство становится вполне корректным.
Упражнение. Показать, что числа, обладающие двумя различными десятичными разложениями, образуют счетное множество.
Итак, отрезок [0, 1] дает пример несчетного множества. Приведем некоторые примеры множеств, эквивалентных отрезку [0,1].
1.	Множество всех точек любого отрезка [а, Ь] или интервала (а, Ь).
2.	Множество всех точек на прямой.
3.	Множество всех точек плоскости, пространства, поверхности сферы, трчек, лежащих внутри сферы, и т. д.
4.	Множество всех прямых на плоскости.
5.	Множество всех непрерывных функций одного или нескольких переменных.
В случаях 1 и 2 доказательство не представляет труда (см. примеры 1 и 3 п. 3). В остальных случаях непосредственное доказательство довольно сложно.
Упражнение. Используя результаты этого пункта и упражнение 2 п. 2, доказать существование трансцендентных чисел, т. е. чисел, не являю-чцмгся алгебраическими.
28
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. I
5. Теорема Кантора—Бернштейна. Следующая теорема является одной из основных в теории множеств.
Теорема 2 (Кантор — Бернштейн). Пусть А и В — два произвольных множества. Если существуют взаимно однозначное отображение f множества А на подмножество В1 множества В и взаимно однозначное отображение g множества В на подмножество А[ множество А, то А и В эквивалентны.
Доказательство. Не ограничивая общности, можно считать, что А и В не пересекаются. Пусть х — произвольный элемент из А. Положим х = Хо и определим последовательность элементов {хп} следующим образом. Пусть элемент хп уже определен. Тогда, если п четно, то за xn+i примем элемент из В, удовлетворяющий условию g(xn+i) = Xn (если такой элемент существует), а если п нечетно, то хп-н — элемент из А, удовлетворяющий условию f(xn+i) = хп (если он существует). Возможны два случая.
1°. При некотором п элемента xn+i, удовлетворяющего указанным условиям, не существует. Число п называется порядком элемента х.
2°. Последовательность {хп} бесконечна '). Тогда х называется элементом бесконечного порядка.
Разобьем теперь А на три множества: Дв, состоящее из элементов четного порядка, Ао — множество элементов нечетного порядка и А] — множество всех элементов бесконечного порядка. Разбив аналогичным образом множество В, заметим, что f отображает Ае на Во и А/ на BIt a g~l отображает Ао на ВЕ. Итак, взаимно однозначное отображение т|>, совпадающее с f на Ае U А] и с g~l на Ао, есть взаимно однозначное отображение всего А на все В.
6. Понятие мощности множества. Если эквивалентны два конечных множества, то они состоят из одного и того же числа элементов. Если же эквивалентные между собой множества М и N произвольны, то говорят, что М и N имеют одинаковую мощность. Таким образом, мощность — это то общее, что есть у любых двух эквивалентных между собой множеств. Для конечных множеств понятие мощности совпадает с привычным понятием числа элементов множества. Мощность множества натуральных чисел (т. е. любого счетного множества) обозначается символом «о (читается: «алеф нуль»). Про множества, эквивалентные множеству всех действительных чисел отрезка [0, 1], говорят, что они имеют мощность континуума. Эта мощность обозначается символом с (или символом К).
’) При этом число различных элементов х„ может быть и конечно: они могут «зацикливаться», образуя бесконечную последовательность, содержащую лишь конечное число попарно различных элементов.
»3]
ЭКВИВАЛЕНТНОСТЬ МНОЖЕСТВ ПОНЯТИЕ МОЩНОСТИ
29
Весьма глубокий вопрос о существовании мощностей, промежуточных между Ко и с, будет затронут ниже в § 4. Как правило, бесконечные множества, встречающиеся в анализе, или счетны, или имеют мощность континуума.
Для мощностей конечных множеств, т. е. для натуральных чисел кроме понятия равенства имеются также понятия «больше» и «меньше». Попытаемся распространить эти последние на бесконечные мощности.
Пусть А и В— два произвольных множества, а т(А) и т(В)— их мощности. Тогда логически возможны следующие случаи:
1.	А эквивалентно некоторой части множества В, а В эквивалентно некоторой части множества А.
2.	А содержит некоторую часть, эквивалентную В, но в В нет части, эквивалентной А.
3.	В содержит некоторую часть, эквивалентную Л, но в Л нет части, эквивалентной В.
4.	Ни в одном из этих двух множеств нет части, эквивалентной другому.
В первом случае множества Л и В в силу теоремы Кантора — Бернштейна эквивалентны между собой, т. е. т(А) — т(В). Во втором случае естественно считать, что т(А)>т(В), а в третьем, что /п(Л)< т(В). Наконец, в четвертом случае нам пришлось бы считать, что мощности множеств А и В несравнимы между собой. Но на самом деле этот случай невозможен! Это следует из теоремы Цермело, о которой речь будет идти в § 4.
Итак, любые два множества А и В либо эквивалентны между собой (и тогда пг(А) — пг(В)), либо удовлетворяют одному из двух соотношений: пг(А) < пг(В) или пг(А) > пг(В).
Мы отметили выше, что счетные множества — это «самые маленькие» из бесконечных множеств, а затем показали, что существуют и бесконечные множества, бесконечность которых имеет более «высокий порядок»,—это множества мощности континуума. А существуют ли бесконечные мощности, превосходящие мощность континуума? Вообще, существует ли какая-то «Наивысшая» мощность или нет? Оказывается, верна следующая теорема.
Теорема 3. Пусть М — некоторое множество и пусть 9И — множество, элементами которого являются всевозможные подмножества множества М. Тогда имеет мощность большую, чем мощность исходного множества М.
Доказательство. Легко видеть, что мощность m множества не может быть меньше мощности пг исходного множества М\ действительно, «одноэлементные» подмножества из М образуют в SDI часть, эквивалентную множеству М. Остается доказать, что мощности ш и пг не совпадают. Пусть между элементами и, Ь, ... множества М и какими-то элементами А, В, ... множе
30
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. I
ства 9И (т. е. какими-то подмножествами из А4) установлено взаимно однозначное соответствие
а *-> А, b *-+ В, .. .
Покажем, что оно наверняка не исчерпывает всего 9И. Именно, сконструируем такое множество X cz М, которому не соответствует никакой элемент из М. Пусть X— совокупность элементов из М, не входящих в те подмножества, которые им соответствуют. Подробнее: если а *-*• А и ае<4, то элемент а мы не включаем в X, а если а иаф А, то мы включаем элемент а в X. Ясно, что X есть подмножество множества М, т. е. некоторый элемент из 9И. Покажем, что подмножеству X не может соответствовать никакой элемент из М. Допустим, что такой элемент х X существует; посмотрим, будет ли он содержаться в X или нет? Пусть х^Х; но ведь по определению в X входит всякий элемент, не содержащийся в подмножестве, которое ему соответствует, следовательно, элемент х должен быть включен в X. Обратно, предположив, что х содержится в X, мы получим, что хне может содержаться в X, так как в X включены только те элементы, которые не входят в соответствующие им подмножества. Итак, элемент х, отвечающий подмножеству X, должен одновременно и содержаться и не содержаться в X. Отсюда следует, что такого элемента вообще не существует, т. е. что взаимно однозначного соответствия между элементами множества М и всеми его подмножествами установить нельзя. Теорема доказана.
Итак, для любой мощности мы действительно можем построить множество большей мощности, затем еще большей и т. д., получая, таким образом, не ограниченную сверху шкалу мощностей.
Замечание. Мощность множества обозначают символом 2т, где т — мощность М. (Читатель легко поймет смысл этого обозначения, рассмотрев случай конечного М.) Таким образом, предыдущую теорему можно выразить неравенством т < 2т. В частности, при т = Ко получаем неравенство Ко < < 2s’. Покажем, что 2s’ — К, т. е. покажем, что мощность множества всех подмножеств натурального ряда равна мощности континуума.
Разобьем подмножества натурального ряда на два класса, и ®,— на те (класс 9|J), у которых дополнение бесконечно, и на те (класс ®), у которых оно конечно. К классу ® относится, в частности, сам натуральный ряд, ибо его дополнение пусто. Число подмножеств в классе ® счетно (доказать). Класс ® не влияет на мощность множества 9И = U ®.
Между подмножествами класса и действительными числами а из полусегмента [0, 1) можно установить взаимно одно-
4] УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА	31
лначное соответствие. Именно, сопоставим подмножеству А ее число а, 0 а < 1, с двоичным разложением
___ 61	| е2 |	| 6П | а = —-T-gT-r ••• -глрг-г
тде еп = 1 или 0 в зависимости от того, принадлежит ли п множества А или нет. Проверку деталей предоставляем'читателю.
Упражнение. Доказать, что совокупность всех числовых функций (или вообще функций, принимающих значения в множестве, содержащем не менее двух элементов), определенных на некотором множестве М, имеет мощность большую, чем мощность множества М.
Указание. Воспользоваться тем, что множество всех индикаторов, т. е. функций на М, принимающих только два значения, 0 и 1, эквивалентно множеству всех подмножеств из М.
§ 4. Упорядоченные множества. Трансфинитные числа
В этом параграфе изложен ряд понятий, связанных с идеей упорядоченности множеств. Мы ограничимся здесь самыми первоначальными сведениями; более подробное изложение можно найти в литературе, указанной в конце книги.
1.	Частично упорядоченные множества. Пусть М — произвольное множество и ср — некоторое бинарное отношение в нем (определяемое некоторым множеством с: /ИХ М). Мы назовем это отношение частичной упорядоченностью, если оно удовлетворяет условиям:
1)	рефлексивности: асра,
2)	транзитивности: если acpb и йсрс, то асрс,
3)	антисимметричности: если асрб и bqa, то а — Ь.
Частичную упорядоченность принято обозначать символом Таким образом, запись а b означает, что пара (а, Ь) принадлежит соответствующему множеству /?1р. Про элемент а при этом говорят, что он не превосходит b или что он подчинен Ь. Множество, в котором задана некоторая частичная упорядоченность, называется частично упорядоченным.
Приведем примеры частично упорядоченных множеств.
1.	Всякое множество можно тривиальным образом рассматривать как частично упорядоченное, если положить в том и только том случае, когда а — Ь. Иначе говоря, за частичную упорядоченность всегда можно принять бинарное отношение тождества е. Этот пример не представляет, конечно, большого интереса.
2.	Пусть М — множество всех непрерывных функций на отрезке [а, р]. Положив	g в том и только том случае, когда
I (/) g(t) для всех t, а t р, мы получим, очевидно, частичную упорядоченность.
32
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. I
3.	Множество всех подмножеств некоторого фиксированного множества частично упорядочено по включению: М, М2 означает, что М] с: М2.
4.	Множество всех натуральных чисел частично упорядочено, если а b означает «Ь делится без остатка на а».
Пусть М— произвольное частично упорядоченное множество. В случае, когда а b и а #= Ь, мы будем пользоваться символом <, т. е. писать а < b и говорить, что а меньше b или что а строго подчинено Ь. Наряду с записью а b мы будем пользоваться равносильной записью 6 а и говорить при этом, что b не меньше а (больше а, если b #= а) или что Ь следует за а. Элемент а называется максимальным, если из а b следует, что b — а. Элемент а называется минимальным, если из с<а следует, что с = а.
Частично упорядоченное множество, для любых двух точек а, Ь которого найдется следующая за ними точка с (а с, Ь с), называется направленным.
2.	Отображения, сохраняющие порядок. Пусть М и М' — два частично упорядоченных множества и пусть f есть отображение М в М'. Мы скажем, что это отображение сохраняет порядок, если из а гС Ь, где a, b ge М, следует, f(a) f(b) (в М'). Отображение f называется изоморфизмом частично упорядоченных множеств М и М', если оно биективно, а соотношение f (а) f(b) выполнено в том и только том случае, когда а Ь. Сами множества М и М' называются при этом изоморфными между собой.
Пусть, например, М есть множество натуральных чисел, частично упорядоченное по «делимости» (см. пример 4 п. 1), а М' — то же самое множество, но упорядоченное естественным образом, т. е. так, что b а, если b — а — положительное число. Тогда отображение М на М', ставящее в соответствие каждому числу п его само, сохраняет порядок (но не является изоморфизмом).
Отношение изоморфизма между частично упорядоченными множествами представляет собой, очевидно, отношение эквивалентности (оно симметрично, транзитивно и рефлексивно). Следовательно, если у нас имеется какой-то запас1) частично упорядоченных множеств, то все эти множества можно разбить на классы изоморфных между собой. Ясно, что если нас интересует не природа элементов множества, а только имеющаяся в нем частичная упорядоченность, то два изоморфных между собой ча-
') Мы воздерживаемся от понятий вроде «все частично упорядоченные множества», так как они, подобно понятию «множество всех множеств», по существу, внутренне противоречивы и не могут быть включены в четкие математические концепции,
«<]
УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА
33
стично упорядоченных множества можно рассматривать просто как тождественные.
3.	Порядковые типы. Упорядоченные множества. Про изоморфные между собой частично упорядоченные множества мы будем говорить, что они имеют один и тот же порядковый тип. Таким образом, порядковый тип — это то общее, что, присуще любым двум изоморфным между собой частично упорядоченным множествам, подобно тому как мощность — это то общее, что присуще эквивалентным между собой множествам (рассматриваемым независимо от какого бы то ни было отношения порядка в них).
Пусть а и b — элементы частично упорядоченного множества. Может оказаться, что ни одно из соотношений а b и b а не имеет места. В этом случае элементы а и b называются несравнимыми. Таким образом, отношение порядка определено лишь для некоторых пар элементов, поэтому мы и говорим о частичной упорядоченности. Если же в частично упорядоченном множестве М несравнимых элементов нет, то множество М называется упорядоченным (линейно упорядоченным, совершенно упорядоченным}. Итак, множество М упорядочено, если оно частично упорядочено и если для любых двух различных элементов a, b е М обязательно либо а < Ь, либо b < а.
Ясно, что всякое подмножество упорядоченного множества само упорядочено.
Множества, указанные в примерах 1—4 п. 1, являются лишь частично упорядоченными. Простейшими примерами линейно упорядоченных множеств могут служить натуральные числа, совокупность всех рациональных чисел, всех действительных чисел на отрезке [0, 1] и т. п. (с естественными отношениями «больше» и «меньше», которые в этих множествах имеются).
Поскольку упорядоченность есть частный случай частичной упорядоченности, к упорядоченным множествам применимо понятие отображения, сохраняющего порядок, и, в частности, понятие изоморфизма. Поэтому можно говорить о порядковом типе упорядоченного множества. Ряд натуральных чисел 1, 2, 3, ... с естественным отношением порядка между его элементами представляет собой простейший пример бесконечного упорядоченного множества. Его порядковый тип принято обозначать символом со.
Если два частично упорядоченных множества изоморфны ме-жДу собой, то они, конечно, имеют одинаковую мощность (изоморфизм— это биекция), поэтому можно говорить о мощности, отвечающей данному порядковому типу (например, типу ш отвечает мощность «о). Однако обратное неверно; множество данной мощности может быть упорядочено, вообще говоря, многими разными способами. Лишь порядковый тип линейно упорядоченного конечного множества однозначно определяется числом п
34
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. I
его элементов (и обозначается также через п). Уже для счетного множества натуральных чисел возможен, например, наряду с его «естественным» типом ш, такой тип:
1, 3, 5, .... 2, 4, 6, ...,
т. е. такой, когда любое четное число следует за любым нечетным, а нечетные и четные числа между собой упорядочены по возрастанию. Можно показать, что число различных порядковых типов, отвечающих мощности Ко, бесконечно и даже несчетно.
4.	Упорядоченная сумма упорядоченных множеств. Пусть TWj и М2— два непересекающихся упорядоченных множества с порядковыми типами 0! и 02. В объединении U Af2 множеств Mt и М2 можно ввести порядок, считая, что два элемента из М, упорядочены как в Mit два элемента из М2 упорядочены как в М2 и что всякий элемент из предшествует всякому элементу из М2. (Проверьте, что это действительно линейная упорядоченность!) Такое упорядоченное множество мы будем называть упорядоченной суммой множеств Мг и М2 и обозначать Мг М2. Подчеркнем, что здесь важен порядок слагаемых: сумма М2 + Mi не изоморфна, вообще говоря, сумме M1 + Af2. Порядковый тип суммы Mi + М2 мы будем называть упорядоченной суммой порядковых типов 0] и 02 и обозначать 01 + 02.
Это определение легко распространяется на произвольное конечное число слагаемых 0Ь 02...0т.
Пример. Рассмотрим порядковые типы шип. Легко видеть, что п + ш = ш; действительно, если мы к натуральному •ряду 1, 2, 3, ..., k, ... припишем слева конечное число членов, то мы получим тот же порядковый тип ш. В то же время порядковый тип ш + п, т. е. порядковый тип множества 1, 2, 3, ... ... k, ..., ai, а2, ..., ап, не равен, очевидно, ш.
5.	Вполне упорядоченные множества. Трансфинитные числа. Выше мы ввели понятия частичной упорядоченности и упорядоченности. Введем еще более узкое, но весьма важное понятие полной упорядоченности.
Определение. Упорядоченное множество называется вполне упорядоченным, если каждое его непустое подмножество содержит наименьший (т. е. предшествующий всем элементам этого подмножества) элемент.
Если упорядоченное множество конечно, то оно, очевидно, и вполне упорядочено. Примером упорядоченного, но не вполне упорядоченного множества может служить отрезок [0, 1]. Само это множество содержит наименьший элемент — число 0, но его подмножество, состоящее из положительных чисел, наименьшего элемента не содержит.
Ясно, что всякое (непустое) подмножество вполне упорядоченного множества само вполне упорядочено.
•j 4]	УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА	35
Порядковый тип вполне упорядоченного множества называют порядковым числом (трансфинитным порядковым числом или, короче трансфинитом, когда хотят подчеркнуть, что речь идет о бесконечном множестве).
Натуральный ряд (с естественным отношением порядка) представляет собой множество не только упорядоченное, но и вполне упорядоченное. Таким образом, его порядковый тип со есть порядковое число (трансфинит!). Порядковым числом будет и со 4- k, т. е. тип множества
1,2,... п, ..., alt а2, ..., ак.
Напротив, множество
.... — п, ..., — 3, — 2, - 1 ’	(1)
^упорядочено, но не вполне упорядочено. Здесь в каждом непустом подмножестве есть наибольший элемент (т. е. следующий "за всеми), но, вообще говоря, нет наименьшего (напоимер, наименьшего элемента нет во всем множестве (1)). Порядковый тип (не являющийся порядковым числом!) множества (1) принято обозначать символом оз*.
Докажем следующий простой, но важный факт.
Лемма 1. Упорядоченная сумма конечного числа вполне упорядоченных множеств есть вполне упорядоченное множество.
В самом деле, пусть М— произвольное подмножество упорядоченной суммы М\ + М2 + ... + Мп вполне упорядоченных множеств; рассмотрим первое из множеств Mi<, содержащее элементы из М. Пересечение М П М’> является подмножеством вполне упорядоченного множества М^ и, значит, имеет первый элемент. Этот элемент будет первым элементом и всего М.
Следствие. Упорядоченная сумма порядковых чисел является порядковым числом.
Мы можем, таким образом, отправляясь от некоторого запаса порядковых чисел, строить новые порядковые числа. Например, отправляясь от натуральных чисел (т. е. конечных порядковых чисел) и порядкового числа со, можно получить порядковые числа
со + п, со + со, со + со + п, со -ф со -ф со ит. д.
Читатель легко построит вполне упорядоченные множества, отвечающие этим трансфинитам.
Наряду с упорядоченной суммой порядковых типов можно ввести упорядоченное произведение. Пусть М\ и М2— множества, упорядоченные по типам 6, и 02. Возьмем много экземпляров множества Mi — по одному на каждый элемент М2—и заменим в множестве М2 его элементы этими экземплярами Mi. Полученное множество называется упорядоченным произведением AJi и
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. 1
-36
М2 и обозначается символом Afi-Af2. Формально Mi-M2 строится как множество пар (а, Ь), где а е Mt и b е М2, причем (аь 6,) < (а2, Ь2), если (ч < 6, (при любых аь а2), и (ab Ь) < (а2, Ь), если ю < а2.
Аналогично определяется упорядоченное произведение любого конечного числа сомножителей Л41-Л42 ... Мр. Порядковый тип 0 произведения М^-М, упорядоченных множеств называется произведением порядковых типов 0[ и 02:
0 = 0J02-
Как и упорядоченная сумма, упорядоченное произведение некоммутативно.
Лемма 2. Упорядоченное произведение двух вполне упорядоченных множеств есть вполне упорядоченное множество.
Доказательство. Пусть М — некоторое подмножество произведения Mi-M2; множество М есть множество пар (а, Ь). Рассмотрим все вторые элементы Ь пар, входящих в М. Они образуют некоторое подмножество в Л[2. В силу полной упорядоченности М2 это подмножество имеет первый элемент. Обозначим его 4>0.и рассмотрим все пары вида (а, Ьо), входящие в М. Их первые элементы а образуют некоторое подмножество в М|. В силу полной упорядоченности Mi среди них имеется первый элемент. Обозначим его а0. Тогда пара (во, Ьо), как легко видеть, и будет первым элементом М.
Следствие. Упорядоченное произведение порядковых чисел является порядковым числом.
Примеры. Легко видеть, что <о + <о = <о  2, а + <о = <о -3. Легко также построить множества, упорядоченные по типам ton, а2, а2п, со2, ... ..., <ор, ... Все эти множества будут иметь счетную мощность.
Можно определить и другие действия над порядковыми типами, например, возведение в степень, и ввести в рассмотрение такие порядковые числа, как, скажем, а“, а“Ш и т. д.
6.	Сравнение порядковых чисел. Если п.\ и п2 — два конечных порядковых числа, то они или совпадают, или одно из них больше другого. Распространим это отношение порядка на трансфинитные порядковые числа. Введем для этого следующие понятия. Всякий элемент а линейно упорядоченного множества М определяет начальный отрезок Р (совокупность элементов <а) и остаток Q (совокупность элементов ^а).
Пусть а и р — два порядковых числа, а М и W— множества, типа аир соответственно. Мы скажем, что а = р, если множества М и N изоморфны, что а < р, если М изоморфно какому-либо начальному отрезку множества N, и что а > р, если, обратно, W изоморфно начальному отрезку множества М.
Теорема 1. Любые два порядковых числа аир связаны между собой одним и только одним из соотношений:
а = р, а < р или а > р.
Для доказательства установим прежде всего следующую лемму.
Лемма 3. Если f — изоморфное отображение вполне упорядоченного множества А на какое-либо его подмножество В, то f(a)^ а для всех а ее А.
Действительно, если бы имелись такие элементы а ее А, что f(a)<Za, то среди них был бы первый (полная упорядочен
J 4]	УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА	37
ность!). Пусть это — элемент а0 и пусть Ьо = f(a0). Тогда Ьо < а0 и, поскольку f — изоморфизм, f(b0) < f(a0) = b0, т. е. а0 не был бы первым среди элементов с указанным свойством.
Из этой леммы сразу же вытекает, что вполне упорядоченное множество не может быть изоморфно своему отрезку. Если бы А было изоморфно отрезку, определяемому элементом а, то выполнялось бы соотношение f(a) < а. Поэтому соотношения а = ₽иа<[}не могут иметь места одновременно. Аналогично не может быть одновременно a = р и a > р. Точно так же несовместны соотношения a < р и а > р, так как иначе мы получили бы (транзитивность!), что а < а, а это, как мы видели, невозможно. Итак, мы показали, что наличие одного из соотношений а = р исключает два остальных. Покажем теперь, что одно из этих соотношений всегда имеет место, т. е. что любые два порядковых числа сравнимы.
Сначала для каждого порядкового числа а построим множество ^(а), служащее его «стандартным представителем». Именно, примем за №(а) множество всех порядковых чисел, меньших а. Числа, входящие в ^(а), все сравнимы между собой, а само множество №(а) (упорядоченное по величине порядковых чисел) имеет тип а. Действительно, если множество
А = {..., а, .... Ь, ...}
имеет тип а, то, по самому определению, порядковые числа, меньшие, чем а, взаимно однозначно отвечают начальным отрезкам множества А, а следовательно, и элементам этого множества. Иначе говоря, элементы множества, имеющего тип а, можно перенумеровать с помощью порядковых чисел, меньших а:
А = (а0, at, ..., ак, ...).
Пусть теперь а и р — два порядковых числа; тогда А — = №(а) и В — №(Р) —множества типов аир соответственно. Пусть, далее, С = А П В — пересечение множеств А и В, т. е. совокупность порядковых чисел, меньших аир одновременно. Множество С вполне упорядочено; обозначим его тип у. Покажем, что у а. Действительно, если С = А, то у = а, если же С =/= А, то С есть отрезок множества А и тогда
у < а.
В самом деле, при всех С, г] ge А \ С числа g и г] сравнимы, т. е. g г]. Но соотношение г] < | < а невозможно, так как тогда г] ge С. Итак, | < т], откуда и видно, что С есть отрезок множества А и у < а. Кроме того, у есть первый элемент множества А \ С. Итак,
у=С а и аналогично у si р.
38
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ Г
При этом случай у < а, у < р невозможен, так как тогда мы имели бы уеА\С, у ее В\С, т. е., с одной стороны, уф С, с другой стороны, у ее А П В = С. Следовательно, возможны лишь случаи
у — а, у = р, а = р, у = а, у < р, а < р, у < а, у =Р, а> р,
т. е. а и р сравнимы. Теорема полностью доказана.
Каждому порядковому числу отвечает определенная мощность, а из сравнимости порядковых чисел следует, очевидно, и сравнимость соответствующих мощностей. Поэтому:
Если А и В — два вполне упорядоченных множества, то либо они эквивалентны между собой (равномощны), либо же мощность одного из них больше, чем мощность другого (j. е. вполне упорядоченные множества не могут иметь несравнимых мощностей) .
Рассмотрим совокупность всех порядковых чисел, отвечающих конечной или счетной мощности. Они образуют вполне упорядоченное множество. Нетрудно убедиться в том, что само это множество уже несчетно. Действительно, обозначим, в соответствии с общепринятой символикой, через <0i порядковый тип множества всех счетных трансфинитов. Если бы отвечающая ему мощность была счетной, то счетным было бы и множество, имеющее порядковый тип + 1. Вместе с тем число <щ следует, очевидно, за всеми трансфинитами, отвечающими конечной или счетной мощности.
Обозначим мощность, отвечающую порядковому трансфини-ту ан, символом Нр Легко видеть, что никаких мощностей т, удовлетворяющих неравенству
К о < tn < Hi,
нет. Действительно, если бы такая мощность т существовала, то в множестве 1Е(«ц) всех порядковых трансфинитов, предшествующих <01, имелось бы подмножество мощности т. Это подмножество вполне упорядочено и несчетно. Но тогда его порядковый тип а предшествовал бы <щ и в то же время следовал за всеми счетными трансфинитами. Мы получили бы противоречие с определением <o(.
7.	Аксиома выбора, теорема Цермело и другие эквивалентные им утверждения. Сравнимость вполне упорядоченных множеств по мощности подсказывает следующую постановку вопроса: нельзя ли всякое множество вполне упорядочить каким-либо образом? Положительный ответ означал бы, в частности,
$4] УПОРЯДОЧЕННЫЕ МНОЖЕСТВА. ТРАНСФИНИТНЫЕ ЧИСЛА	39
что несравнимых мощностей вообще не существует. Такой ответ дал Цермело, доказав, что каждое множество может быть вполне упорядочено. Доказательство этой теоремы (мы не будем воспроизводить его здесь, см., например, [2]) существенно опирается на так называемую аксиому выбора, состоящую в следующем.
Пусть А — некоторое множество индексов а и пусть для каждого а задано некоторое произвольное множество Ма. Тогда, как утверждает аксиома выбора, можно построить функцию <р на А, относящую каждому аеЛ некоторый элемент пга из соответствующего множества Ма. Иными словами, можно составить некоторое множество, выбрав из каждого Ма по одному и только одному элементу.
Теория множеств в той форме, в которой мы ее излагаем, восходит к Кантору и Цермело и является «наивной» теорией множеств. Аксиома выбора, называемая также аксиомой Цермело, возникшая в рамках наивной теории множеств вместе с другими вопросами, такими, как континуум-гипотеза, т. е. вопрос о совпадении мощности континуума с первой несчетной мощностью К], привела к многочисленным спорам и к длинной серии работ по математической логике и основаниям математики. Были построены аксиоматические теории множеств Гёделя — Бернайса и Цермело — Френкеля. В рамках этих теорий была установлена непротиворечивость и независимость аксиомы выбора. Мы отсылаем читателя к специальным работам: А. Френкель и И. Бар-Хиллел, Основания теории множеств, «Мир», 1966; П. Дж. Коэн, Теория множеств и континуум-гипотеза, «Мир», 1969. Заметим, что отказ от аксиомы выбора существенно обедняет теоретико-множественные построения.
Вместе с тем критика наивной теории множеств и попытки обойтись без аксиомы выбора повели к созданию таких замечательных теорий, как теория рекурсивных функций, и таких понятий, как понятие вычислимого числа.
Сформулируем некоторые предложения, каждое из которых эквивалентно аксиоме выбора (т. е. каждое из них может быть доказано, если принять аксиому выбора, и обратно, аксиому вы- • бора можно доказать, допустив справедливость какого-либо из этих предложений). Прежде всего ясно, что таким предложением является сама теорема Цермело. Действительно, если предположить, что каждое из множеств Ма вполне упорядочено, то для построения функции ср, существование которой утверждается аксиомой выбора, достаточно в каждом Ма взять первый элемент.
Для формулировки других предложений, эквивалентных аксиоме выбора, введем следующие понятия. Пусть М — частично упорядоченное множество. Всякое его подмножество А, в котором любые два элемента сравнимы между собой (в смысле введенной в М частичной упорядоченности), будем называть цепью. Цепь называется максимальной, если она не содержится в качестве собственного подмножества ни в какой другой цепи, принадлежащей М. Далее, назовем в частично упорядоченном
40
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. Г
множестве М элемент а верхней гранью подмножества М' cz М, если любой элемент а' <= М' подчинен а.
Теорема Хаусдорфа. В частично упорядоченном множестве всякая цепь содержится в некоторой его максимальной цепи.
Следующее предложение представляет собой, пожалуй, наи-более удобную из всех формулировок, эквивалентных аксиоме выбора.
Лемма Цорна. Если всякая цепь в частично упорядоченном множестве М имеет верхнюю грань, то всякий элемент из М подчинен некоторому максимальному.
Доказательство равносильности всех приведенных утверждений (аксиома выбора, теорема Цермело, теорема Хаусдорфа,. лемма Цорна) имеется, например, в книге А. Г. Курош, Лекции по общей алгебре, Физматгиз, 1962; см. также [8]. Мы не будем его здесь воспроизводить.
Если множество верхних граней подмножества А имеет наименьший элемент а, то а называют точной верхней гранью подмножества Л; аналогично определяется точная нижняя грань. Частично упорядоченное множество, всякое непустое конечное подмножество которого обладает точной верхней гранью и точной нижней гранью, называется решеткой, или структурой.
8.	Трансфинитная индукция. Широко распространенный метод доказательства тех или иных утверждений — это метод математической индукции. Он, как известно, состоит в следующем. Пусть имеется некоторое утверждение Р(п), которое формулируется для каждого натурального числа п, и пусть известно, что:
1) утверждение Р(1) верно;
2) из того, что P(k) верно для всех k п, следует, что Р(п + 1) верно.
Тогда утверждение Р(п) верно для всех п= 1, 2, ... Действительно, в противном случае среди тех п, для которых Р(п) неверно, нашлось бы наименьшее число^ скажем, Пр Очевидно, что «1 > 1, т. е. — 1 тоже натуральное число, и мы приходим к противоречию с условием 2).
Аналогичный прием может быть использован с заменой натурального ряда любым вполне упорядоченным множеством. В этом случае он носит название трансфинитной индукции. Таким образом, метод трансфинитной индукции состоит в следующем. Пусть дано некоторое вполне упорядоченное множество А (если угодно, его можно считать множеством всех порядковых трансфинитов, меньших некоторого данного) и пусть Р(а)—некоторое утверждение, формулируемое для каждого ае/1и такое, что Р(а) верно для первого элемента из А и верно для а, если оно верно для всех элементов, предшествующих а. Тогда Р(а) верно для всех а е А. Действительно, если бы существовали элементы в А, для которых Р(а). не имеет
$5)
СИСТЕМЫ МНОЖЕСТВ
41
места, то в множестве таких элементов нашелся бы первый, скажем, а*, и мы пришли бы к противоречию, поскольку для всех а < а* утверждение Р(а) было бы верно.
Так как в силу теоремы Цермело всякое множество можно вполне упорядочить, трансфинитная индукция может быть, в принципе, применена к любому множеству. Однако практически бывает удобнее пользоваться заменяющей ее леммой Цорна, которая опирается лишь на наличие частично упорядоченности в рассматриваемом множестве. А некоторая частичная упорядоченность рассматриваемых объектов в задачах, требующих лрименения леммы Цорна, обычно возникает естественным образом, «сама собой».
§ 5.	Системы множеств ’)
1.	Кольцо множеств. Системой множеств называется всякое множество, элементы которого сами представляют собой какие-либо множества. Если не оговорено противное, мы будем рассматривать системы таких множеств, каждое из которых является подмножеством некоторого фиксированного множества X. Системы множеств мы будем обозначать прописными готическими буквами. Основной интерес для нас будут представлять системы множеств, удовлетворяющие (по отношению к введенным в § 1 операциям) некоторым определенным условиям замкнутости.
Определение 1. Непустая система множеств SR называется кольцом, если она обладает тем свойством, что из А е SR и В е SR следует Л АВ е Я и Л П В е Я.
Так как для любых А и В
AUВ = (АДВ)Д(АПВ) и А\В = АД(АЛВ),
то из Ае й и Вей вытекает также принадлежность к 9? множеств A U В и А \ В. Таким образом, кольцо множеств есть система множеств, замкнутая по отношению к взятию суммы и пересечения, вычитанию и образованию симметрической разности. Очевидно, что кольцо замкнуто и по отношению к образованию любых конечных сумм и пересечений вида
С = U Ль D = A Ak. k=l	fe=l
Любое кольцо содержит пустое множество 0, так как всегда А \ А = 0. Система, состоящая только из пустого множества, представляет собой наименьшее возможное кольцо множеств.
*) Рассматриваемые в этом параграфе понятия понадобятся нам в гл. V яри изложении общей теории меры. Поэтому чтение данного параграфа может быть отложено. Читатель, решивший ограничиться при изучении теории меры мерой на плоскости (§ 1 гл. V), может этот параграф пропустить совсем.
42
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
,[ГЛ. I
Множество Е называется единицей системы множеств <3, если оно принадлежит <3 и если для любого Ле® имеет место равенство
Xf|£ = X.
Таким образом, единица системы множеств © есть не что иное, как максимальное множество этой системы, содержащее все другие входящие в 3 множества.
Кольцо множеств с единицей называется алгеброй множеств.
Пр и меры. 1. Для любого множествах система 9Й(Х) всех его подмножеств представляет собой алгебру множеств с единицей Е = А.
2.	Для любого непустого множества А система {0, X}, состоящая из множества X и пустого множества 0, образует алгебру множеств с единицей Е = X.
3.	Система всех конечных подмножеств произвольного множества X представляет собой кольцо множеств. Это кольцо будет алгеброй в том и только том случае, когда множество X само конечно.
4.	Система всех ограниченных подмножеств числовой прямой является кольцом множеств, не содержащим единицы.
Из определения кольца множеств непосредственно вытекает Теорема 1. Пересечение SR = Q 9ta любого множества ко-а
лец есть кольцо.
Установим следующий простой, но важный для дальнейшего факт.
Теорема 2. Для любой непустой системы множеств 3 существует одно и только одно кольцо 9i(3), содержащее $ и содержащееся в любом кольце 9?, содержащем 3.
Доказательство. Легко видеть, что кольцо 9t(S) определяется системой $ однозначно. Для доказательства его существования рассмотрим объединение X = (J X всех мно-жеств X, входящих в 3, и кольцо 2R(X) всех подмножеств множества X. Пусть 2 — совокупность всех колец множеств, содержащихся в 2R(X) и содержащих 3. Пересечение $= Q 9? всех
9)	<= S этих колец и будет, очевидно, искомым кольцом 9i(3).
Действительно, каково бы ни было кольцо 9?*, содержащее <S>r пересечение 9? = 9ft* f] 2R (X) будет кольцом из 2 и, следовательно, <5 cz 9i cz 9fi‘, т. е. ф действительно удовлетворяет требованию минимальности. Это кольцо называется минимальным кольцом над 3 или кольцом, порожденным 3, и обозначается 9i((3).
2.	Полукольцо множеств. В ряде вопросов, например, в теории меры наряду с понятием кольца важную роль играет более общее понятие полукольца множеств.
СИСТЕМЫ МНОЖЕСТВ
43
>51
Определение 2. Система множеств <5 называется полукольцом, если она содержит пустое множество 0„ замкнута по отношению к образованию пересечений и обладает тем свойством, что из принадлежности к <5 множеств А и AiCzA выте-п
кает возможность представления А в виде А = J Ak, где Лл — fe=l
попарно непересекающиеся множества из <5, первое из которых есть заданное множество At.
В дальнейшем всякий набор попарно непересекающихся множеств 711, А2, ..., Ап, объединение которых есть заданное множество А, мы будем называть конечным разложением множества А.
Всякое кольцо множеств SR является полукольцом, так как если А и Ai cz. А входят в 9?, то имеет место разложение
А = Ai U Л2, где А2 = А \ А{ s 9t.
Примером полукольца, не являющегося кольцом множеств, может служить совокупность всех интервалов (а,Ь), отрезков [«,/?] и полуинтервалов [а, Ь) и (а, 6] на числовой прямой ’). Еще одним примером служит совокупность всех «полуоткрытых» прямоугольников а <х Ь, с < у d на плоскости или совокупность всех полуоткрытых параллелепипедов в пространстве.
Установим следующие свойства полуколец множеств.
Лемма 1. Пусть множества Ai, А2, ..., Ап, А принадлежат полукольцу <5, причем множества А, попарно не пересекаются и все содержатся в А. Тогда набор множеств А, (1 = 1, 2, ... ..., п) можно дополнить множествами /ln+i, ..., Ая<=& до конечного разложения
А = U А (« > п) 4=1
множества А.
Доказательство проведем по индукции. При п — 1 справедливость утверждения леммы вытекает из определения полукольца. Предположим, что это утверждение справедливо для п = m и рассмотрим m + 1 множеств Ah ..., Am, Am+h удовлетворяющих условиям леммы. По сделанному иредполо-жению,
Л = АиЛи ... иА^и^и ... USP,
где все множества Bq (q = \,2, ..., р) принадлежат ©. Положим Bqi — Am+i П Bq. По определению полукольца, имеется разложение Bq = Bqi U Bq2 U ... U B9r, где все Bqj принадлежат ©.
') При этом в число интервалов включается, конечно, «пустой» интервал (а, а), а в число отрезков — отрезок, состоящий из одной точки [а, а].
44
ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
[ГЛ. г
Легко видеть, что
Р Z
л = л,и ...	U (U вч1
?=1 \/=2
Таким образом, утверждение леммы доказано для п = т + 1, а следовательно, и вообще для всех п.
Лемма 2. Какова бы ни была конечная система множеств Ль ..., Ап, принадлежащих полукольцу ©, в ® найдется такая конечная система попарно непересекающихся множеств Вь ... ..., Bt, что каждое Аь может быть представлено в виде суммы
некоторых из множеств Ва.
Доказательство. При п = 1 лемма тривиальна, так как достаточно положить /=1, В1 = Ль Допустим, что она справедлива для п = пг, и рассмотрим в <5 некоторую систему множеств Ai, ..., Am, Am+i- Пусть Bi, В2, ..., Bt — множества из <г>, удовлетворяющие условиям леммы по отношению к А{, А2, ... ..., А Ш- Положим
В si — Дт+1 П Bs.
В силу леммы 1 имеет место разложение t	а
Am+l = U Bst и U В'„, Вр^&,	(1)
S=I	Р=1
а в силу самого определения полукольца имеет место разложение
=	... U Bsfs, Bsi^e.
Легко видеть, что
fs
Ak= U U Bs!, k = \, 2........пг,
s^Mk i-\
и что множества
Bsl, Bp
попарно не пересекаются. Таким образом, множества BSj, В'? удовлетворяют условиям леммы по отношению к Ai.......Am,
A m+l •
3.	Кольцо, порожденное полукольцом. Мы уже видели в п. 1, что для каждой системы множеств S существует единственное минимальное кольцо, содержащее S. Однако для произвольной системы S фактическое построение кольца 9?(<s) по <5 довольно сложно. Оно становится вполне обозримым в том важном случае, когда <5 представляет собой полукольцо. Это построение дается следующей теоремой.
СИСТЕМЫ МНОЖЕСТВ
45
$5]
Теорема 3. Если <г> — полукольцо, то 3?(<s) совпадает с системой 3 множеств А, допускающих конечные разложения
л = U л
*=i
на множества Ah<=&.
Доказательство. Покажем, что система 3 образует кольцо. Если А и В — два произвольных множества на 3> т0 имеют место разложения
п	m
А = и В = и Bh A, *= ®> Bj е S.
i=i	/=i
Так как © — полукольцо, то множества
= А( П В/
тоже входят в <s. В силу леммы 1 имеют место разложения
ч	sj
Л=усг/ийУ^; B/ = U CoUljC/b (2) где Dik, Eji е <г>. Из равенств (2) вытекает, что множества А П В и А АВ допускают разложения
лпв = ис,-/, лдв = и^ии^п
i.i	i.k i.i
и, следовательно, входят в 3- Таким образом, 3 действительно представляет собой кольцо; его минимальность среди всех колец, содержащих (ю, очевидна.
4.	о-алгебры. В различных вопросах, в частности, в теории меры, приходится рассматривать суммы и пересечения не только конечного, но и счетного числа множеств. Поэтому целесообразно, помимо понятия кольца множеств, ввести еще следующие понятия.
Определение 3. Кольцо множеств называется о-кольцом, если оно вместе с каждой последовательностью множеств Ль Л2, ..., Лп, ... содержит сумму
s=U4
п
Определение 4. Кольцо множеств называется б-кольцом, если оно вместе с каждой последовательностью множеств Ль А2, .... Лп, ... содержит пересечение
Р=Г14.
п
Естественно назвать о-алгеброй о-кольцо с единицей и 6-алгеброй б-кольцо с единицей. Легко, однако, видеть, что эти два
46
ЭЛЕМЕНТЫ ТЕОРИИ- МНОЖЕСТВ
[ГЛ. I
понятия совпадают: каждая о-алгебра является в то же время б-алгеброй, а каждая 6-алгебра — а-алгеброй. Это вытекает из соотношений двойственности (см. § 1)
и Л„ = Е\П(£\ЛД Плп = Е\и(^\лд
п	п	п	п
Простейшим примером о-алгебры является совокупность всех подмножеств некоторого множества А.
Если имеется некоторая система множеств S, то всегда существует хотя бы одна 0-алгебра, содержащая эту систему. Действительно, положим
Х = U А
Ле®
и рассмотрим систему 23 всех подмножеств множества X. Ясно, что 23 есть о-алгебра, содержащая <5. Если © — произвольная <т-алгебра1, содержащая <5 и X — ее единица, то каждое Л е З содержится в X и, следовательно, X — J -4czX. Назовем о-ал-Ле®	~
гебру © неприводимой (по отношению к системе <S), если X = = U А. Иначе говоря, неприводимая а-алгебра — это о-алгебра, Лед
не содержащая точек, не входящих ни в одно из А е®, Естественно в каждом случае рассмотрением только таких о-алгебр и ограничиваться.
Для неприводимых о-алгебр имеет место теорема, аналогичная теореме 2, доказанной выше для колец.
Теорема 4. Для любой непустой системы множеств существует неприводимая (по отношению к этой системе) о-алгеб-ра 23 (<s), содержащая <Е> и содержащаяся в любой о-алгебре, содержащей
Доказательство проводится в точности тем же методом, что и доказательство теоремы 2; а-алгебра 2Э(©) называется минимальной а-алгеброй над системой <S.
В анализе важную роль играют так называемые борелевские множества, или В-множества— множества на числовой прямой, принадлежащие минимальной о-алгебре над совокупностью всех сегментов [а, 6].
5.	Системы множеств и отображения. Отметим следующие -факты, которые нам понадобятся при изучении измеримых функций.
Пусть у — f(x) —функция, определенная на множестве М и принимающая значения из множества N, и пусть Ш1— некоторая система подмножеств множества М. Обозначим через f(SDf) систему всех образов f(A) множеств, принадлежащих 5R. Пусть, кроме того, — некоторая система множеств, содержащихся
*5]
СИСТЕМЫ МНОЖЕСТВ
47
в N, и —система всех прообразов /-1(Л) множеств, входящих в 5R. Справедливы следующие утверждения, проверка которых предоставляется читателю:
1)	Если 9? есть кольцо, то и f~l (97) есть кольцо.
2)	Если 97 есть алгебра, то и f~l (97) есть алгебра.
3)	Если 97 есть о-алгебра, то и f~l (97) есть о-алгёбра.
4)	й(г,(9г)) = г1(К(Ж
Останутся ли эти утверждения справедливыми, если f-1 заменить на f, а 97 — на Эй?
ГЛ A BA II МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
§ 1. Понятие метрического пространства
1. Определение и основные примеры. Одной из важнейших операций анализа является предельный переход. В основе этой операции лежит тот факт, что на числовой прямой определено расстояние от одной точки до другой. Многие фундаментальные факты анализа не связаны с алгебраической природой действительных чисел (т. е. с тем, что они образуют поле), а опираются лишь на понятие расстояния. Обобщая представление о действительных числах как о множестве, в котором введено расстояние между элементами, мы приходим к понятию метрического пространства — одному из важнейших понятий современной математики. Ниже мы изложим основные факты теории метрических пространств и их обобщения — топологических пространств. Результаты этой главы существенны для всего дальнейшего изложения.
Определение. Метрическим, пространством называется пара (X, р), состоящая из некоторого множества (пространства) X элементов (точек) и расстояния, т. е. однозначной, неотрицательной, действительной функции р(х, у), определенной для любых х и у из X и подчиненной следующим трем аксиомам:
1)	р(х, у) = 0 тогда и только тогда, когда х = у,
2)	р(я, У) = р(у, х) (аксиома симметрии),
3)	р(х, г) p(x, у) + р(у, z) (аксиома треугольника).
Само метрическое пространство, т. е. пару (X, р), мы будем обозначать, как правило, одной буквой:
R = (X, р).
В случаях, когда недоразумения исключены, мы будем зачастую обозначать метрическое пространство тем же символом, что и сам «запас точек» X.
Приведем примеры метрических пространств. Некоторые из этих пространств играют в анализе весьма важную роль.
1.	Положив для элементов произвольного множества ( 0, если х — у, р(х, у) = {	,
'	( 1, если х #= у,
§ 11
ПОНЯТИЕ МЕТРИЧЕСКОГО ПРОСТРАНСТВА
49
мы получим, очевидно, метрическое пространство. Его можно назвать пространством изолированных точек.
2.	Множество действительных чисел с расстоянием р(х, у) = | х — у\
образует метрическое пространство R*.
3.	Множество упорядоченных групп из п действительных чисел х = (%1, х2, ..., хп) с расстоянием
Р (х, у) TAyk — xk)2	(1)
’ k—l
называется п-мерным арифметическим евклидовым пространством R”. Справедливость аксиом 1) и 2) для R” очевидна. Покажем, что в R” выполнена и аксиома треугольника.
Пусть % = (%!, ..., хп), y = (yi, Уп) и z = (z(.....Zn);
тогда аксиома треугольника записывается в виде
V £ (Z* - xk)2 < А/ £ (уk- Хк)2 + А/ t(Zk- у к)2 . (2) v к=1	v ft=l	v
Полагая yk — хк = ah, гк — yk = bh, получаем Zh — Xit = ah + bk, а неравенство (2) принимает при этом вид
Vs (°*+w < Vx, • <=»
Но это неравенство сразу следует из известного неравенства Коши — Буняковского *) ап	\2 п п
<4>
Действительно, в силу этого неравенства имеем п	п	п	п
2,	(«. + =£ “«+2 2, “А +<
П	/ п	п	п	/	/ П	/ п \2
< 2, +2 V £ “* • £ "•+£ ** - ( у S. “*+V £ ч)  тем самым неравенство (3), а следовательно и (2), доказано.
’) Неравенство Коши — Буняковского вытекает из тождества ✓ п ч 2	п п	п п
/	t=i s=i	/=1 /=i
которое проверяется непосредственно.
50
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. 1Г
4.	Рассмотрим то же самое множество упорядоченных групп из п действительных чисел х = (хь ..., хп), но расстояние определим в нем формулой
п
Pi (х, у) = £ I xk — ук\.	(5>
ft=i
Справедливость аксиом 1)—3) здесь очевидна. Обозначим это метрическое пространство символом R".
5.	Возьмем снова то же самое множество, что и в примерах 3 и 4, и определим расстояние между его элементами формулой
РоЖ У) = max \yk — xk\.	(6>
1С k С п
Справедливость аксиом 1)—3) очевидна. Это пространство, которое мы рбозначим R^, во многих вопросах анализа не менее удобно, чем евклидово пространство R".
Последние три примера показывают, что иногда и в самом, деле важно иметь различные обозначения для самого метрического пространства и для множества его точек, так как один и тот же запас точек может быть по-разному метризован.
6.	Множество С [а, Ь] всех непрерывных действительных функций, определенных на сегменте [а, Ь], с расстоянием
p(f,g)= max — f(t)\	(7)
также образует метрическое пространство. Аксиомы 1)—3) проверяются непосредственно. Это пространство играет очень важную роль в анализе. Мы будем его обозначать тем же символом С [а, &], что и само множество точек этого пространства. Вместо С[0, 1] мы будем писать просто С.
7.	Обозначим через /2 метрическое пространство, точками которого служат всевозможные последовательности х = (хь х2, ... ..., хп,   •) действительных чисел, удовлетворяющие условию
а расстояние определяется формулой
Р (х, у) = А/ £ (</* — xtf .	(8)
“ й = 1
Из элементарного неравенства (xft ± у^2	2 (х| + у2} следует,
что функция р(х, у) имеет смысл для всех х, у е /2, т. е. ряд оо
У, (yk — xj2 сходится, если k=i 00	со
У X2 < ОО и У у2 < ОО.
ПОНЯТИЕ МЕТРИЧЕСКОГО ПРОСТРАНСТВА
51
4>]
Покажем теперь, что функция (8) удовлетворяет аксиомам метрического пространства. Аксиомы 1) и 2) очевидны, а аксиома треугольника принимает здесь вид
VOO	/ оо	/ оо
Е - xky < д/ Е - yky + у Е (yk -	. (9)
fe— I	fe — I	fe——-1
В силу сказанного выше каждый из трех написанных здесь ря-дов сходится. С другой стороны, при каждом п справедливо неравенство
д/1 - чу < д/е{Zk ~Ук)2 + л/Д~
(см. пример 4). Переходя здесь к пределу при п->оо, получаем (9), т. е. неравенство треугольника в /2-
8.	Рассмотрим, как и в примере 6, совокупность всех функций, непрерывных на отрезке [а, Ь], но расстояние определим иначе, а именно, положим
G?	х7»
I (*(0~ y(t))2dtj .	(10)
Такое метрическое пространство мы будем обозначать С2[а, Ь] и называть пространством непрерывных функций с квадратичной метрикой. Здесь аксиомы 1) и 2) метрического пространства опять-таки очевидны, а аксиома треугольника непосредственно вытекает из интегральной формы неравенства Коши — Буняковского’)
. Ь	.26	6
Н х (i) у (t) dt j х* 1 (t) dt • у2 (t) dt. \а	/а	а
9.	Рассмотрим множество всех ограниченных последовательностей х — (%1, Лг,  хп, ...) действительных чисел. Положив
р (х, у) = sup | yk — xk I,	(11)
k
мы получим метрическое пространство, которое обозначим пг. Справедливость аксиом 1)—3) очевидна.
*) Это неравенство может быть получено, например, из легко, проверяемого тождества
z ь	.26	ь	6 6
I	(О У (t)	= j х2 (0 dt j y2(t)dt — у j j [x (s) у (t) — у (s) x (OP ds di.
'a	'a	a	a a
52
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
10.	Множество упорядоченных групп из п действительных чисел с расстоянием
/ п	\1/р
Рр(М !/) = ( Е \Ук-Ч\Р] .	(12)
где р — любое фиксированное число ^1, представляет собой метрическое пространство, которое мы обозначим Rp. Справедливость аксиом 1) и 2) здесь опять-таки очевидна. Проверим аксиому 3). Пусть х = (.г1, ..., xn), y — {yi, - Уп), z = = (21,	2П)—три ТОЧКИ ИЗ R*. Положим yk~ Xk = akr
Zk — yk= bk, тогда неравенство
Рр (х, 2) < Рр (х, у) + Рр (у, 2),
справедливость которого мы должны установить, примет вид
/ п	\1/Р	/ п	\1/Р	/ п	\ 1/р
(£|aft + 6J₽) <(Elad₽ + ElM) •	(13}
\s=i	/	\*=i	/	\ft=i	/
Это — так называемое неравенство Минковского. При р= 1 неравенство Минковского очевидно (модуль суммы не превосходит суммы модулей), поэтому будем считать, что р > 1 ’).
Доказательство неравенства (13) при р >• 1 основано на так называемом неравенстве Гёльдера
п	/ п \1/Р / п \1/<7
Е I akbk |<( Е | ak И El bk\q) ,	(14)
где числа p > 1 и <? > 1 связаны условием
7 + 7=1’ т-е- q =	(15)
Заметим, что неравенство (14) однородно. Это значит, что если оно выполнено для каких-либо двух векторов а = (ai, ... ..., ап) и b = (bi, ..., bn), то оно выполнено и для векторов Ха и цб, где X и р.— произвольные числа. Поэтому неравенство (14) достаточно доказать для случая, когда
п	п
El^lP = gl/’d?=1-	(16)
Итак, пусть выполнено условие (16); докажем, что п
Е|«Л1<1-	(17)
А=1
’) При р <. 1 неравенство Минковского не имеет места. Иначе говоря, если бы мы захотели рассматривать пространство R” при р <. 1, то в таком пространстве не была бы выполнена аксиома треугольника.
fl]
ПОНЯТИЕ МЕТРИЧЕСКОГО ПРОСТРАНСТВА
53
Рассмотрим на плоскости (£, л) кривую, определяемую уравнением л — Вр-1 (£ > 0), или, что то же самое, уравнением £ = = Л9-1 (рис. 7). Из рисунка ясно, что при любом выборе положительных значений а и b будет Sj + S2 ab. Вычислим площади X, и Х2: а	ь
Sfp-1	ар	„	С	о-1 ,	Ьр
Г dt, = —~,	Х2= \ л <^1 = —-.
Р	J	ч
о	о
Таким образом, справедливо числовое неравенство
Заменив здесь о на | аь | и b на |&а| до п, получим, учитывая (15) и (16),
Е k=i
Неравенство (17), а следовательно, и общее неравенство (14) доказаны. При р = 2 неравенство Гельдера (14) переходит в неравенство Коши — Буняковского (4).
Перейдем теперь к доказательству неравенства Минковского. Для этого рассмотрим тождество
(I а | +1 N)₽ = (I а | +1 Ь |)₽“1 | а | + (| а | +1 Ь |)₽~1 | Ь |.
Заменяя в написанном тождестве а на аь и b на Ьь. и суммируя по k от 1 до п, получим
t (I ak\ + | bk\)p = E (I ak\ +1 bk |)р-* | ak\ + E (I ak |+| b t \)р~' | bk [. k=l	*=l	fe=l
Применяя теперь к каждой из двух сумм, стоящих справа, неравенство Гельдера и учитывая, что (/?— \)q = р, получим
2,(1
/ П	\Ч<1 /	Г п Т/РЧ
<( Е (|ad + l^l)₽) rElad₽l'/₽+ Eiw • \й=1	/ \Lfe=i J Lft=i J /
Деля обе части этого неравенства на ап	\ 1/?
L (I ak | +1 bk |)₽J ,
54
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. И
лолучим
an	\*/р	( п \!/р	/ “	\1/р
•откуда сразу следует неравенство (13). Тем самым установлена аксиома треугольника в пространстве R".
Рассмотренная в этом примере метрика рР превращается в евклидову метрику (пример 3) при р = 2 и в метрику примера 4 при р = 1. Можно показать, что метрика
Р„о (*, У) = max | yk — xk ],
I
•введенная в примере 5, является предельным случаем метрики _рР(х, у), именно:
/ П	\'/Р
Роо (*> у} = lim I Е I Уь — xklp) . д->оо \fe=l	Z
Из неравенства
, аР , ьч	/1.1	,х
оо --------- I-----------— 1 I,
Р <7	\ р Q	J
установленного выше, легко выводится и интегральное неравенство Гельдера
h	. Ь	,\!р.Ь	>1/0
J \x(t)y(t)]dt^\\ |х(/)|₽Л)	,
а	\а	/ \а	/
-справедливое для любых функций x(t) и y(t), для которых стоящие справа интегралы имеют смысл. Отсюда в свою очередь получается интегральное неравенство Минковского
,Ь	,1/р ,Ь	у\!р .Ь	. 1/р
Qix(o+f/(oip^j	+^if/(oipdj .
11. Укажем еще один интересный пример метрического про--странства. Его элементами являются всевозможные последовательности действительных чисел х = (хь х2, ..., хп, ...), такие, что
Z I xk\p < ОО,
*=1
где р 1 — некоторое фиксированное число, а расстояние определяется формулой
GOO	к 1/р
S I Ун — Xk Ij •	(18)
.Это метрическое пространство мы обозначим 1Р.
5 и	ПОНЯТИЕ МЕТРИЧЕСКОГО ПРОСТРАНСТВА	5(>
В силу неравенства Минковского (13) имеем при любом п-
0”	\'/Р	/ п	\ЧР / п	\1/р
L\yk-4\p) <(eiwJ	•
Так как, по предположению, ряды
Е 1^1₽ и Е \Ук\Р k=l	fe=l
сходятся, то, переходя к пределу при п->со, получим
Goo	\'/р	/ 00	\*/р	/ оо	\ 1/р
Llyk-Xkl")	+ (Е I Уь 1₽) < 00 (191-
Таким образом, доказано, что формула (18), определяющая расстояние в 1Р, действительно имеет смысл для любых х, у е /р.. Одновременно неравенство (19) показывает, что в 1Р выполнена аксиома треугольника. Остальные аксиомы очевидны.
Неограниченное количество дальнейших примеров дает следующий прием. Пусть R = (X, р) —метрическое пространство и М — любое подмножество в X. Тогда М с той же функцией р(х, у), которую мы считаем теперь определенной для х и у из М, тоже представляет собой метрическое пространство; оно' называется подпространством пространства R.
2. Непрерывные отображения метрических пространств. Изометрия. Пусть X и У — два метрических пространства и f — отображение пространства X в У. Таким образом, каждому х^Х ставится в соответствие некоторый элемент у — f(x) из У. Это-отображение называется непрерывным в точке х0 е X, если для. каждого е > 0 существует такое 6 > 0, что для всех х е X таких, что
р (х, х0) < 6, выполнено неравенство
Pi (f (х), f (х0)) < е
(здесь р — расстояние в X, a pi — расстояние в У). Если отображение f непрерывно во всех точках пространства X, то говорят, что f непрерывно на X. Если X и У — числовые множества, т. е. f — числовая функция, определенная на некотором подмножестве X числовой оси, то приведенное определение непрерывности отображения превращается в хорошо известное из элементарного анализа определение непрерывности функции.
Аналогично можно определить непрерывную функцию (отображение) f от нескольких переменных XjeXi, ..., хп Хп (где Xi, ..., Хп—метрические пространства) со значениями в-метрическом пространстве У.
56
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. П
Заметим, в этой связи, что само расстояние р(х, у), если рассматривать его как функцию переменных х и у из X, непрерывно. Это сразу же следует из неравенства
I Р (х, У} — Р (-«о, Уо} К Р (-«о, х) + р (уо, у), легко выводимого из неравенства треугольника.
Если отображение X -> Y взаимно однозначно, то существует обратное отображение х = f_| (у) пространства Y на пространство X. Если отображение f взаимно однозначно и взаимно непрерывно (т. е. f и f-1 — непрерывные отображения), то оно называется гомеоморфным отображением или гомеоморфизмом, а сами пространства X и Y, между которыми можно установить гомеоморфизм, называются гомеоморфными между собой. Примером гомеоморфных метрических пространств могут служить вся числовая прямая (—оо, сю) и интервал, например, интервал (—1, 1). В этом случае гомеоморфизм устанавливается формулой
2 L у = — arctg х.
Важным частным случаем гомеоморфизма является так называемое изометрическое отображение.
Говорят, что биекция f между метрическими пространствами R = (X, р) и R' — (У, р') является изометрией, если
р(М, x2) = p'(f (*i)> f(x2))
для любых Х\, x2<=R. Пространства R и R', между которыми можно установить изометрическое соответствие, называются изо-метричными.
Изометрия пространств R и R' означает, что метрические связи между их элементами одни и те же; различной может быть лишь природа их элементов, что с точки зрения теории метрических пространств несущественно. В дальнейшем изо-метричные между собой пространства мы будем рассматривать просто как тождественные.
К изложенным здесь понятиям (непрерывность, гомеоморфизм) мы вернемся, с более общей точки зрения, в конце § 5 этой главы.
§ 2.	Сходимость. Открытые и замкнутые множества
1.	Предельные точки. Замыкание. Мы введем здесь некоторые понятия теории метрических пространств. Эти понятия мы неоднократно используем в дальнейшем.
Открытым шаром В(х0,г) в метрическом пространстве R мы /Зудем называть совокупность точек x^R, удовлетворяющих
>2]
СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА
57
условию
р (х, х0) < г.
Точка х0 называется центром этого шара, а число г — его радиусом.
Замкнутым шаром В [х0, г] мы назовем совокупность точек хе R, удовлетворяющих условию
р (х, х0) < г.
Открытый шар радиуса е с центром хо мы будем называть также е-окрестностью точки хо и обозначать символом Ое(х0).
Упражнение. Привести пример метрического пространства и таких двух шаров В (х, р]), В (у, р2) в нем, что р[ > р;, и тем не менее В (х, р() с: '<= В (у, р2).
Множество Л1 ей называется ограниченным, если оно содержится целиком в некотором шаре.
Точка х е R называется точкой прикосновения множества М с R, если любая ее окрестность содержит хотя бы одну точку из М. Совокупность всех точек прикосновения множества М обозначается [Л4] и называется замыканием этого множества. Таким образом, мы определили для множеств метрического пространства операцию замыкания — переход от множества М к его замыканию [Л4].
Теорема 1. Операция замыкания обладает следующими свойствами-.
1)	М с [Л4],
2)	[[М]] = [М],
3)	если Mi cz М2, то [MJ с [М2],
4)	[М, U М2] = [М,] U [М2].
Доказательство. Первое утверждение очевидно, так как всякая точка, принадлежащая М, является для М точкой прикосновения. Докажем второе.
Пусть х е= [рМ]]. Тогда в любой окрестности Ое(х) этой точки найдется точка xi е [М]. Положим е — р(х, х1)= и рассмотрим шар Oe,(xi). Этот шар целиком лежит внутри шара ОЕ(х). Действительно, если zeOE:(Xi), то р(г, Xi)<ei, и так как р(х, Xj) = е — 61, то по аксиоме треугольника
p(z, х) <8, + (8 — 8!)== 8,
т.	е. геО8(х). Так как х{ s [Л4], то в O£1(Xi)найдется точка х2еМ. Но тогда х2еОе(х). Так как Ое(х) — произвольная окрестность точки х, то.хе[Л4]. Второе утверждение доказано.
Третье свойство очевидно. Докажем, наконец, четвертое свойство.
-•58
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. U
Если XEpMj U А42], то х содержится по крайней мере в одном из множеств [MJ или [М2], т. е.
Так как MiCzM] U М2 и M2czMl (J М2, то обратное включение •следует из свойства 3). Теорема доказана полностью.
Точка хе/? называется предельной точкой множества .М с: /?, если любая ее окрестность содержит бесконечно много точек из М.
Предельная точка может принадлежать, а может и не принадлежать М. Например, если М — множество рациональных чисел из отрезка [0, 1], то каждая точка этого отрезка — предельная для М.
Точка х, принадлежащая М, называется изолированной точкой этого множества, если в достаточно малой ее окрестности Ое(х) нет точек из М, отличных от х. Предлагаем читателю доказать в качестве упражнения следующее утверждение:
Всякая точка прикосновения множества М есть либо предельная, либо изолированная точка этого множества.
Отсюда можно заключить, что замыкание [М] состоит, вообще говоря, из точек трех типов:
1)	изолированные точки множества М;
2)	предельные точки множества М, принадлежащие М;
3)	предельные точки множества М, не принадлежащие М. Таким образом, замыкание [М] получается присоединением к М всех его предельных точек.
2. Сходимость. Пусть хь х2, ... — последовательность точек в метрическом пространстве R. Говорят, что эта последовательность сходится к точке х, если каждая окрестность 0е(*) точки х содержит все точки хп, начиная с некоторой, т. е. если для всякого е>0 найдется такое число Ne, что Ое(х) содержит все точки хп с п > 7Ve. Точка х называется пределом последовательности {Хп}.
Это определение можно, очевидно, сформулировать еще и •следующим образом: последовательность {хп} сходится к х, если
lim р (х, х„) = 0.
Ц-> оо
Непосредственно из определения предела вытекает, что 1) никакая последовательность не может иметь двух различных пределов, и что 2) если последовательность {хп} сходится к точке х, то и всякая ее подпоследовательность сходится к той же самой точке.
Следующая теорема устанавливает тесную связь между понятиями точки прикосновения и предела.
J 2]	СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА	59’
Теорема 2. Для того чтобы точка х была точкой прикосновения множества М, необходимо и достаточно, чтобы существовала последовательность {хп} точек из М, сходящаяся к х.
Доказательство. Условие необходимо, так как если х — точка прикосновения множества Л1, то в каждой ее окрестности Oi/п (х) содержится хотя бы одна точка хп е М. Эти точки образуют последовательность, сходящуюся к х. Достаточность очевидна.
Если х — предельная точка множества Л1, то точки хп е е О./„ (х) П М, отвечающие разным п, можно выбрать попарно различными. Таким образом, для того чтобы точка х была предельной для М, необходимо и достаточно, чтобы в М существовала последовательность попарно различных точек, сходящаяся к х.
Понятие непрерывности отображения метрического пространства X в метрическое пространство У, введенное в § 1, можно теперь сформулировать в терминах сходимости последовательностей. Именно, отображение у — f(x) непрерывно в точке х0, если для всякой последовательности {хп}, сходящейся к х0, последовательность {yn = f(xn)} сходится к y0 = f(x0). Доказательство равносильности этого определения приведенному в § 1 ничем не отличается от доказательства равносильности двух определений непрерывности («на языке е, 6» и «на языке последовательностей») функций числового аргумента и может быть предоставлено читателю.
3. Плотные подмножества. Пусть А и В — два множества в метрическом пространстве R. Множество А называется плотным в В, если [Л] во В. В частности, множество А называется всюду плотным (в пространстве /?), если его замыкание [.1] совпадает со всем пространством R. Например, множество рациональных чисел всюду плотно на числовой прямой. Множество А называется нигде не плотным, если оно не плотно ни в одном шаре, т. е. если в каждом шаре В с: R содержатся другой шар В', не имеющий с А пи одной общей точки.
Примеры пространств, и меющ их в сю д у плотное Счетное множество. Пространства, в которых имеется счетное всюду плотное множество, называют сепарабельными. Рассмотрим с этой точки зрения примеры, которые приведены в § 1.
1. «Дискретное» пространство, описанное в примере 1 § 1, содержит счетное всюду плотное в нем множество тогда и только тогда, когда оно само состоит лишь из счетного числа точек. Дело в том, что замыкание [М] любого множества М в этом пространстве совпадает с М.
Все пространства, перечисленные в примерах 2—8 § 1, содержат счетные всюду плотные множества. Укажем в каждом
60
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. и
из них по такому множеству, настоятельно рекомендуя читателю провести подробные доказательства.
2. На действительной оси R1— рациональные точки.
3—5. В n-мерном евклидовом пространстве R" и в пространствах R?, Ri — совокупность векторов с рациональными координатами.
6.	В пространстве С [а, 6] — совокупность всех многочленов с рациональными коэффициентами.
7.	В пространстве h — совокупность последовательностей, в каждой из которых все члены рациональны и лишь конечное (свое для каждой последовательности) число этих членов отлично от нуля.
8.	В пространстве С2[а, 6]— совокупность всех многочленов с рациональными коэффициентами.
Вместе с тем пространство ограниченных последовательностей пг (пример 9 § 1) несепарабельно.
Действительно, рассмотрим всевозможные последовательности, состоящие из нулей и единиц. Они образуют множество мощности континуума (так как между ними и подмножествами натурального ряда можно установить взаимно однозначное соответствие). Расстояние между двумя такими точками, определяемое формулой (11) § 1, равно 1. Окружим каждую из этих точек открытым шаром радиуса 1/2. Эти шары не пересекаются. Если некоторое множество всюду плотно в пг, то каждый из построенных шаров должен содержать хотя бы по одной точке из этого множества, и, следовательно, оно не может быть счетным.
4. Открытые и замкнутые множества. Рассмотрим важнейшие типы множеств в метрическом пространстве, а именно, открытые и замкнутые множества.
Множество М, лежащее в метрическом пространстве R, называется замкнутым, если оно совпадает со своим замыканием: [М] = М. Иначе говоря, множество называется замкнутым, если оно содержит все свои предельные точки.
В силу теоремы 1 замыкание любого множества М есть замкнутое множество. Из той же теоремы вытекает, что [М] есть наименьшее замкнутое множество, содержащее М. (Докажите это!)
Примеры. 1. Всякий отрезок [a, 6] числовой прямой есть замкнутое множество.
2.	Замкнутый шар представляет собой замкнутое множество. В частности, в пространстве С [а, 6] множество функций f, удовлетворяющих условию |f(Z) | К, замкнуто.
3.	Множество функций в С [а, 6], удовлетворяющих условию (открытый шар), не замкнуто; его замыкание есть совокупность функций, удовлетворяющих условию |/(/) |
$2]
СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА
61
4.	Каково бы ни было метрическое пространство 7?, пустое множество 0 и все В замкнуты.
5.	Всякое множество, состоящее из конечного числа точек, замкнуто.
Основные свойства замкнутых множеств можно сформулировать в виде следующей теоремы.
Теорема 3. Пересечение любого числа и сумма любого конечного числа замкнутых множеств суть замкнутые множества.
Доказательство. Пусть F = П Fa — пересечение замкнутых множеств Fa и пусть х— предельная точка для F. Это означает, что любая ее окрестность Ое(х) содержит бесконечно много точек из F. Но тогда тем более Ое (х) содержит бесконечно много точек из каждого Fa и, следовательно, так как все Fa замкнуты, точка х принадлежит каждому Fa; таким образом, X е F = П Fa, т. е. F замкнуто.
Пусть теперь F — сумма конечного числа замкнутых мно-п
жеств: F = (J В,-, и пусть точка х не принадлежит F. Покажем, 1=1
что х не может быть предельной для F. Действительно, х не принадлежит ни одному из замкнутых множеств В,-, следовательно, не является предельной ни для одного из них. Поэтому для каждого i можно найти такую окрестность О&1 (х) точки х, которая содержит не более чем конечное число точек из Fi. Взяв из окрестностей Ое,(х), ..., 06fi(x) наименьшую, мы получим окрестность Ое(х) точки х, содержащую не более чем конечное число точек из F.
Итак, если точка х не принадлежит F, то она не может быть предельной для F, т. е. F замкнуто. Теорема доказана.
Точка х называется внутренней точкой множества М, если существует окрестность Ое(х) этой точки, целиком содержащаяся в М.
Множество, все точки которого внутренние, называется открытым.
Примеры. 6. Интервал (а, Ь) числовой прямой R1 есть открытое множество; действительно, если а < а < Ь, то ОЕ(а), где e = min(a — а, b — а), целиком содержится в интервале (а, Ь).
7. Открытый шар В (а, г) в любом метрическом пространстве R есть открытое множество. Действительно, если хе еВ(а, г), то р(а, х)<г. Положим е = г — р(а, х). Тогда В(х, е)е В (а, г).
8. Множество непрерывных функций на [а, &], удовлетворяющих условию	где g(t)—некоторая фиксированная
Непрерывная функция, представляет собой открытое подмножество пространства С [а, &].
62
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
Теорема 4. Для того чтобы множество М было открыто необходимо и достаточно, чтобы его дополнение R\ М до всего-пространства R было замкнуто.
Доказательство. Если М открыто, то каждая точка х из М имеет окрестность, целиком принадлежащую М, т. е. не имеющую ни одной общей точки с R \ М. Таким образом, ни одна из точек, не принадлежащих не может быть точкой прикосновения для R\M, т. е. /?\А1 замкнуто. Обратно, если 7? \ М замкнуто, то любая точка из М имеет окрестность, целиком лежащую в М, т. е. М открыто.
Так как пустое множество и все R замкнуты и в то же время служат дополнениями друг друга, то пустое множество и все R открыты.
Из теоремы 3 и из принципа двойственности (пересечение дополнений равно дополнению суммы, сумма дополнений равна дополнению пересечения, см. стр. 15) вытекает следующая важная теорема, двойственная теореме 3.
Теорема 3'. Сумма любого (конечного или бесконечного) числа и пересечение любого конечного числа открытых множеств суть открытые множества.
Множества, принадлежащие о-алгебре, порожденной всеми открытыми и замкнутыми подмножествами пространства R, называются борелевскими множествами.
5. Открытые и замкнутые множества на прямой. Структура открытых и замкнутых множеств в том или ином метрическом пространстве может быть весьма сложной. Это относится к открытым и замкнутым множествам даже евклидова пространства двух или большего числа измерений. Однако в одномерном случае, т. е. на прямой, исчерпывающее описание всех открытых множеств (а следовательно, и всех замкнутых) не представляет труда. Оно дается следующей теоремой.
Теорема 5. Всякое открытое множество на числовой прямой представляет собой сумму конечного или счетного числа попарно непересекающихся интервалов').
Доказательство. Пусть G — открытое множество на прямой. Введем для точек из G отношение эквивалентности, считая, что х ~ у, если существует такой интервал (а, р), что х, г/е(а, p)czG. Очевидно, это отношение рефлексивно и симметрично, оно и транзитивно, так как если х ~ у и у ~ z, то существуют такие интервалы (а, р) и (у, 6), .что
« е (а, P)cG и у, z^ (у, б) с G.
Но тогда у < р и интервал (а, 6) лежит целиком в G и содержит точки х и z. Следовательно, G распадается на непересекаю-
') Множества вида (—оо, оо), (а, оо) и (—оо, р) мы при этом также включаем в число интервалов.
2]	СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА	63
щиеся классы Л эквивалентных между собой точек:
0 = иЛ-
Докажем, что каждое 1Х есть интервал (а, Ь), где а = inf 1Х, b = suplx. Включение Ix с (а, Ь) очевидно. С другой стороны, если х, у е 7Х, то по самому определению Д интервал (х, у) содержится в /т. В любой близости от а справа и в любой близости от b слева есть точки из 1Х. Поэтому 1Х содержит любой интервал (а',Ь'), концы которого принадлежат (а, Ь), откуда Jx = (a,b). Система таких непересекающихся интервалов /т не более чем счетна; действительно, выбрав в каждом из этих интервалов произвольным образом рациональную точку, мы установим взаимно однозначное соответствие между этими интервалами и некоторым подмножеством множества рациональных чисел. Теорема доказана/
Так как замкнутые множества—-это дополнения открытых, то отсюда следует, что всякое замкнутое множество на прямой получается выбрасыванием из прямой конечного или счетного числа интервалов.
Простейшие примеры замкнутых множеств — отрезки, отдельные точки и суммы конечного числа таких множеств. Рассмотрим более сложный пример замкнутого множества на прямой — так называемое канторово множество.
Пусть Го — отрезок [0, 1]. Выбросим из него интервал (‘/з, 2/з), а оставшееся замкнутое множество обозначим Ft. Затем выбросим из Fi интервалы ('/э, 2/э) и (7/э, 7э), а оставшееся замкнутое множество (состоящее из четырех отрезков) обозначим F2. В каждом из этих четырех отрезков выбросим средний интервал длины (*/з)3 и т. д. (рис. 8). Продолжая этот процесс, получим убывающую тых множеств Fn. Положим
О 1/з	______7 F
rt 0_ _/з_	%	1
Vg	7/э 8/g г
__ __	-- --Fs
............................t
Рис. 8. последовательность замкну-
оо F = A Fn.
F — замкнутое множество (как пересечение замкнутых). Оно получается из отрезка [О, I] выбрасыванием счетного числа интервалов.
Рассмотрим структуру множества F. Ему принадлежат, очевидно, точки
О, 1, 7з, 7з. 7э. %, 79, %,...	(1)
64	МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА	[ГЛ. Ц
— концы выбрасываемых интервалов. Однако множество F не исчерпывается этими точками. Действительно, те точки отрезка [О, 1], которые входят в множество F, можно охарактеризовать следующим образом. Запишем каждое из чисел х, 0 х 1 в троичной системе:
где числа ап могут принимать значения 0, 1 и 2. Как и в случае десятичных дробей, некоторые числа допускают двоякую запись. Например,
3 з т 3, т •   т з1! т • •  з "Г 32 -г Зз -г • • • -г Зп -Г • • .
Легко проверить, что множеству F принадлежат те и только те числа х, О^х^ 1, которые могут быть записаны хотя бы одним способом, в виде троичной дроби так, чтобы в последовательности ai, а2, ..., ап, ... ни разу не встретилась единица. Таким образом, каждой точке хе F можно поставить в соответствие последовательность
а2, . .., ап....	(2)
где ап равно 0 или 2. Совокупность таких последовательностей образует множество мощности континуума. В этом можно убедиться, поставив в соответствие каждой последовательности (2) последовательность
^1, b2, . •., Ьп, ...,	(2Л)
где Ьп = 0, если ап = 0, и bn = 1, если ап = 2. Последовательность (2') можно рассматривать как запись некоторого действительного числа у, 0 у 1, в виде двоичной дроби. Таким образом, мы получаем отображение множества F на весь отрезок [0,1]. Отсюда вытекает, что F имеет мощность континуума1). Так как множество точек (1) счетно, то эти точки не могут исчерпывать все F.
Упражнения. 1. Доказать непосредственно, что точка 1/4 принадлежит множеству F, не являясь концом ни одного из выбрасываемых интервалов.
Указание. Точка 1/4 делит отрезок [0, 1] в отношении 1 : 3. Отрезок [0, 1/3], остающийся после первого выбрасывания, она делит также в отношении 1 : 3 и т. д.
Точки (1) называются точками первого рода множества F, остальные его точки называются точками второго рода.
’) Установленное соответствие между F и отрезком [0, 1] однозначно, но не взаимно однозначно (из-за того, что одно и то же число иногда может изображаться различными дробями). Отсюда следует, что F имеет мощность не меньше, чем мощность континуума. Но F — часть отрезка [0, 1], следовательно, его мощность не может быть больше, чем мощность континуума.
«2]
СХОДИМОСТЬ. ОТКРЫТЫЕ И ЗАМКНУТЫЕ МНОЖЕСТВА
65
2. Доказать, что точки первого рода образуют в F всюду плотное множество.
3. Показать, что числа вида ti + где Л, /2 е F, заполняют весь отрезок [0, 2].
. Мы показали, что множество F имеет мощность континуума, т. е. содержит столько же точек, сколько и весь отрезок [0, 1].
С этим фактом интересно сопоставить следующий результат:
12	4
сумма длин у + -g- +	 всех выброшенных интерва-
лов составляет в точности единицу!
Дополнительные замечания.
(1)	Пусть М — некоторое множество в метрическом пространстве R и X — точка этого же пространства. Расстоянием от точки х до множества М называется число
р (х, М) = inf р (х, а).
as М.
Если х е М, то р(х, М) = 0, однако из того, что р(х, Л1) = 0, не следует, что х е М. Из определения точки прикосновения непосредственно получаем, что р(х, М) =0 в том и только том случае, когда х — точка прикосновения множества М. Таким образом, операцию замыкания можно определить как присоединение к множеству всех тех точек, расстояние которых до множества равно нулю.
(2)	Аналогично определяется расстояние между двумя множествами. Если А, В — два множества в метрическом пространстве R, то
р (А, В) = inf р (а, Ь).
а<=А
Если А П В =/= 0L то р(А,В) =0; обратное, вообще говоря, неверно.
(3)	Пусть Мк-— множество всех функций f из С [а, ЭД, удовлетворяющих условию Липшица; для всех /2 е [а, ЭД
If (h) - f (*2) КК| <2 - 6 I,
где К—некоторое фиксированное число. Множество Мд замкнуто. Оно совпадает с замыканием множества всех дифференцируемых на [а, ЭД функций таких, что | f'(t) | К.
(4)	Множество М = М^ всех функций, каждая из которых удовлетво-К
ряет условию Липшица при каком-либо К, не замкнуто. Его замыкание есть все С [а, ЭД.
(5)	Открытое множество G в n-мерном евклидовом пространстве называется связным, если любые две точки х, у е G могут быть соединены ломаной, целиком лежащей в G. Например, внутренность круга х2 + у2 < 1 — связное множество. Наоборот, сумма двух кругов
х2 + у2 < 1 и (х - 2)2 + у2 < 1
— не связное множество (хотя у этих кругов есть общая точка прикосновения!). Открытое подмножество Н открытого множества G называется компонентой множества G, если оно связано и не содержится нн в каком большем связном открытом подмножестве G. Введем в G отношение эквивалентности:
66
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
х •— у, если существует открытое связное подмножество Н из О, накрывающее хну:
х, yeHcQ.
Как и в случае прямой, легко проверяется транзитивность и поэтому G распадается на непересекающиеся классы: G = ш. Эти классы — открытые компоненты G. Число их не более чем счетно.
В случае п = 1, т. е. на прямой, всякое связное открытое множество есть интервал (в число интервалов включаются и бесконечные интервалы (—оо, а), (Ь, оо) и (—оо, оо)). Таким образом, теорема 5 о строении открытых множеств на прямой состоит из двух утверждений): а) всякое открытое множество на прямой есть сумма конечного или счетного числа компонент и б) связное открытое множество на прямой есть интервал. Первое из этих утверждений верно и для множеств в n-мерных евклидовых пространствах (и допускает дальнейшие обобщения), а второе относится именно к прямой.
§ 3.	Полные метрические пространства
1.	Определение и примеры полных метрических пространств. С первых шагов изучения математического анализа мы видим, сколь важную роль играет в анализе свойство полноты числовой прямой, т. е. тот факт, что всякая фундаментальная последовательность действительных чисел сходится к некоторому пределу. Числовая прямая служит простейшим примером так называемых полных метрических пространств, основные свойства которых мы рассмотрим в этом параграфе.
Последовательность {хп} точек метрического пространства R мы будем называть фундаментальной, если она удовлетворяет критерию Коши, т. е. если для любого 8 > О существует такое число Ne, что p(xrt', хп”) < е для всех п' > Ne, п" > NR.
Из аксиомы треугольника непосредственно следует, что всякая сходящаяся последовательность фундаментальна. Действительно, если {хп} сходится к х, то для данного 8 > 0 можно найти такое число NR, что р (хп, х) < е/2 для всех п > NR. Тогда Р (хп', Хп") Р (хп'> х) + Р Un"", х) < е для любых п' > NR и п" > NR.
Определение 1. Если в пространстве R любая фундаментальная последовательность сходится, то это пространство называется полным.
Примеры. Все пространства, рассмотренные в § 1, за исключением указанного в примере 8, полные. Действительно:
1.	В пространстве изолированных точек (пример 1 § 1) фундаментальны только стационарные последовательности, т. е. такие, в которых, начиная с некоторого номера, повторяется все время одна и та же точка. Всякая такая последовательность, конечно, сходится, т. е. это пространство полно.
2.	Полнота евклидова пространства R1 — совокупности действительных чисел — известна из анализа.
3.	Полнота евклидова пространства Rn непосредственно вытекает из полноты R1. В самом деле, пусть {х^)}—фундамен
S3]
ПОЛНЫЕ МЕТРИЧЕСКИЕ ПРОСТРАНСТВА
67
тальная последовательность точек из Rn; это означает, что для каждого е > О найдется такое N — Ne, что
Д (4й -	< «2
при всех р, q больших, чем N. Здесь х(р) = {х{р), ..., х<пр)}. Тогда для каждого k= 1, 2, ..., п получаем соответствующее неравенство для координаты xJp);
|Чр)-4?)|<в
для всех р, q > N, т. е. {x(fep)} — фундаментальная числовая последовательность. Положим
xfe= lim х^р) и х = (х1,х2, ..., х! р->оо
Тогда, очевидно, Нт х(₽) = х. Р —> оо
4—5. Полнота пространств R™ и R? доказывается совершенно аналогично.
6. Докажем полноту пространства С [а, Ь]. Пусть {хп(/)}— некоторая фундаментальная последовательность в С [а, &]. Это означает, что для каждого е > О существует такое N, что
I хп (0 — хт (/) | < е
при п, т> N для всех t, а t Ь. Отсюда вытекает, что последовательность {хп(Ш равномерно сходится. Как известно, в этом случае ее предел x(t) будет непрерывной функцией. Устремляя в предыдущем неравенстве т к бесконечности, получим
I хп (/) — х (t) К е
для всех t и для всех п > N, а это и означает, что {хп(0} сходится к x(t) в смысле метрики пространства С [а, &].
7. Пространство /г- Пусть {х<п>} — фундаментальная последовательность в /г- Это означает, что для любого е > 0 найдется такое N, что
р2(x(n), х(т)) =	(х^ —	< е при п, т> N. (1)
Здесь x(n) = (xjn), х<п), ..., х<.п), ...).Из (1) следует, что при любом k (х^ — х^)2 < е, т. е. при каждом k последовательность действительных чисел {х^} фундаментальна и потому сходится.
68
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
Положим xk = lim хф. Обозначим через х последовательность rt->oo
(Xi, х2, ..., хд, ...). Нужно показать, что:
оо
а)	У, х\ < о°, т. е. xeL
А=1
б)	lim р (х(п), х) = 0.
ft->OO
Сделаем это. Из неравенства (1) следует, что для любого фиксированного М м
В этой сумме теперь только конечное число слагаемых, и мы можем, зафиксировав п, перейти к пределу при т->оо. Получим
м
fcZ(4rt)-^)2<e.
Это равенство верно при любом Af. Восстановим бесконечный ряд, переходя к пределу при Af -> оо; получаем
£ (4П)-О2<е-	(2)
оо	оо
Из сходимости рядов У (x(fen))2 и У (xW — xfe)2 следует сходи-
оо
мость ряда У х2ь (в силу элементарного неравенства (a-f-6)2^: А=1
2(a2-f-62)), т. е. утверждение а) доказано. Далее, так как е произвольно мало, то неравенство (2) означает, что
VOO
У (х^ — xfe)2 = О, fe=l
т. е. х(п)->х в метрике /г- Утверждение б) доказано.
8. Легко убедиться в том, что пространство С2[а, 6] не полно. Рассмотрим, например, последовательность непрерывных функций
{ — 1 при —	1/п,
nt	при —
1 при 1/п</<1.
Она фундаментальна в С2[—1, 1], так как
1
J (фП (0 —Фт
2
min (п, т)
f 3]
ПОЛНЫЕ МЕТРИЧЕСКИЕ ПРОСТРАНСТВА
69
Однако она не сходится ни к какой функции из С2[—1, 1]. Действительно, пусть f — некоторая функция из С2[—1, 1] и ф— разрывная функция, равная —1 при t < 0 и +1 при t 0.
В силу интегрального неравенства Минковского (справедливого, очевидно, и для кусочно-непрерывных функций) имеем (1	\'/а
-1	'
(1 / 1
+( $(фп(0-Ф(0)2л) •
-1 ' '--1 '
В силу непрерывности функции f интеграл в левой части отличен от нуля. Далее, ясно, что
1
lim ((<р„(0 — ф(0)2Л = 0.
n->oo J — 1
I
Поэтому (/ (0 — фп (О)2 dt не может стремиться к нулю при -1
П —> оо.
Упражнение. Доказать, что пространство всех ограниченных последовательностей (пример 9 § 1) полно.
2.	Теорема о вложенных шарах. В анализе широко используется так называемая лемма о вложенных отрезках. В теории метрических пространств аналогичную роль играет следующая теорема, называемая теоремой о вложенных шарах.
Теорема 1. Для того чтобы метрическое пространство R было полным, необходимо и достаточно, чтобы в нем всякая последовательность вложенных друг в друга замкнутых шаров, радиусы которых стремятся к нулю, имела непустое пересечение.
Доказательство. Необходимость. Пусть пространство R полно и пусть Si, В %, 53, ... — последовательность вложенных друг в друга замкнутых шаров. Пусть гп — радиус, а хп — центр шара Вп. Последовательность центров {хп} фундаментальна, поскольку p(xn, хт) < г„ при пг > п, а гп -> 0 при п-> оо. Так как R полно, то lim хп существует. Положим х = п->оо
= lim х„; тогда xeQ Вп.Действительно, шар Вп содержит все П->0О	п
точки последовательности {хД, за исключением, быть может, точек Xi, х2, ..., хп—1- Таким образом, х является точкой прикосновения для каждого шара Вп. Но так как Вп — замкнутое множество, то х е Вп для всех п.
70
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. П
Достаточность. Пусть {хп}—фундаментальная последовательность. Докажем, что она имеет предел. В силу фундаментальности мы можем выбрать такую точку хП1 нашей последовательности, что р(хп, хП1) < 1/2 при всех п П\. Примем точку хп за центр замкнутого шара радиуса 1. Обозначим этот шар Вь Выберем затем хПг из {хп} так, чтобы было п2> Пу и р (хп, хП1) < < 1/22 при всех п п2. Примем точку хП1 за центр шара радиуса 1/2 и обозначим этот шар В2. Вообще, если точки хп^ хп , • • •, xnk уже выбраны (th < п2 < ... < Па), то выберем точку Xnk+x так, чтобы было nh+i > nh и р (хп, хП{!+1) < l/2fe+1 при всех п nk+i, и окружим ее замкнутым шаром Bh+i радиуса l/2ft. Продолжая это построение, получим последовательность замкнутых шаров Вл, вложенных друг в друга, причем шар By имеет радиус 1/2й-1. Эта последовательность шаров имеет, по предположению, общую точку; обозначим ее х. Ясно, что эта точка х служит пределом подпоследовательности {xnfe}- Но если фундаментальная последовательность содержит сходящуюся к х подпоследовательность, то она сама сходится к тому же пределу. Таким образом, х= Нт хп.
Упражнения. 1. Доказать, что пересечение замкнутых вложенных шаров в предыдущей теореме сводится к одной точке.
2.	Диаметром множества М в метрическом пространстве называется число
d (Л4) = sup р (х, у), х, у^М
Доказать, что в полном метрическом пространстве всякая последовательность, вложенных друг в друга непустых замкнутых множеств, диаметры которых стремятся к нулю, имеет непустое пересечение.
3.	Привести пример полного метрического пространства и последовательности вложенных друг в друга замкнутых шаров в нем, имеющей пустое пересечение.
4.	Доказать, что подпространство полного метрического пространства Д полно тогда и только тогда, когда оно замкнуто в R.
3. Теорема Бэра. В теории полных метрических пространств фундаментальную роль играет следующая теорема.
Теорема 2 (Бэр). Полное метрическое пространство R не может быть представлено в виде объединения счетного числа нигде не плотных множеств.
Доказательство. Предположим противное. Пусть R — ОО
«= U ЛТ„, где каждое из множеств Afn нигде не плотно. Пусть П=1
So — некоторый замкнутый шар радиуса 1. Поскольку множество All, будучи нигде не плотным, не плотно в So, существует замкнутый шар S] радиуса меньше 1/2, такой, что Si cz Sfl и
£ з]	ПОЛНЫЕ МЕТРИЧЕСКИЕ ПРОСТРАНСТВА	71
f] Afi = 0. Поскольку множество М2 не плотно в Sb по той же причине в шаре Si содержится замкнутый шар S2 радиуса меньше 1/3, для которого S2 П А12= 0 и т. д. Мы получаем последовательность вложенных друг в друга замкнутых шаров {Sn}, радиусы которых стремятся к нулю, причем Sn fl Мп = 0.
оо
В силу теоремы 1 пересечение П $п содержит некоторую точ-п=1
ку х. Эта точка по построению не принадлежит ни одному из множеств Мп, следовательно, х U Мп, т. е. R ф J Мп, в про-п	п
тиворечии с предположением.
В частности, всякое полное метрическое пространство без изолированных точек несчетно. Действительно, в таком пространстве каждое множество, содержащее лишь одну точку, нигде не плотно.
4. Пополнение пространства. Если пространство R не полно, то его всегда можно включить некоторым (и, по существу, единственным) способом в полное пространство.
Определение 2. Пусть R —• метрическое пространство. Полное метрическое пространство R* называется пополнением пространства R, если:
1) R является подпространством пространства R*;
2) R всюду плотно в R*, т. е. [Я] = R*.
(Здесь [7?] означает, естественно, замыкание пространства R в R*.)
Например, пространство всех действительных чисел является пополнением пространства рациональных чисел.
Теорема 3. Каждое метрическое пространство R имеет пополнение, и это пополнение единственно с точностью до изометрии, оставляющей неподвижными точки из R.
Доказательство. Начнем с единственности. Нам нужно доказать, что если R* и R** — два пополнения пространства R, то существует такое взаимно однозначное отображение <р пространства R* на R**, что
1) ф(х) = х для всех х е R-,
2) если х* •*-* х** и у* у**, то рДх*, у*) = р2(х**, у**), где pi — расстояние в R*, а р2 — расстояние в R**.
Отображение <р определяется следующим образом. Пусть х* — произвольная точка из R*. Тогда, по определению пополнения существует последовательность {хп} точек из R, сходящаяся к х*. Точки {хп} входят и в R**. Так как R** полно, то {хп} сходится в R** к некоторой точке х**. Ясно, что х** не зависит от выбора последовательности {хп}> сходящейся в точке х*. Положим <р(х*) = х**. Отображение <р и есть искомое изометрическое отображение.
72
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. И
Действительно, по лее, пусть
{х„}->х*
{yn}-*y*
построению ф(х) = х для всех хеR. Да-
в	R*	и	{хп} -> х**	в	R**,
в	R*	н	{уп}-»у**	в	R**;
тогда в силу непрерывности расстояния,
Pi« У*) = Нт Р1(хп, уп) = lim р(х„, уп) п->со
и, аналогично,
р2 (х**, у**) = lim р2 (х„, уп) = lim р (х„, уп). rt->oo
Следовательно,
Р1 (X*, /) = Р2 (X**, у**).
Докажем теперь существование пополнения. Идея этого доказательства та же, что и в канторовой теории действительных чисел. Положение здесь даже проще, чем в теории действительных чисел, так как там для вновь вводимых объектов — иррациональных чисел — требуется еще определить все арифметические операции.
Пусть R—произвольное метрическое пространство. Назовем две фундаментальные последовательности{хп} и {x'j из R эквивалентными (обозначение {хп}— {хп})> если Нт р (хп, х'} — 0.
Л-> СО
Название «эквивалентность» оправдано, поскольку это отношение рефлексивно, симметрично и транзитивно. Отсюда следует, что все фундаментальные последовательности, которые можно составить из точек пространства R, распадаются на классы эквивалентных между собой последовательностей. Определим теперь пространство R*. За его точки мы примем всевозможные классы эквивалентных между собой фундаментальных последовательностей, а расстояние между ними зададим следующим образом. Пусть х* и у* — два таких класса. Выберем в каждом из этих классов по одному представителю, т. е. по некоторой фундаментальной последовательности {хп} и {уп}- Положим ')
р(х*,/)= lim р(х„, i/„).	(3)
П->со
Докажем корректность этого определения расстояния, т. е. докажем, что предел (3) существует и не зависит от выбора представителей {хп} е х* и {z/n} е у*.
В силу неравенства
I Р (хп, уп) р (хт, Ут) | р (Хп, Хт) р (уп, Z/m) (4)
’) Чтобы не усложнять запись мы обозначаем расстояние, в R* тем же символом р, что и расстояние в исходном пространстве R.
$ 3]	ПОЛНЫЕ МЕТРИЧЕСКИЕ ПРОСТРАНСТВА	73
получаем, что для всех достаточно больших пит
I Р (хп, уп) — р (хт, ут) | < е, так как последовательности {хп} и {уп} фундаментальные.
Таким образом, последовательность действительных чисел sn = р(хп, уп) удовлетворяет критерию Коши и, следовательно, имеет предел.
Этот предел не зависит от выбора {хп} е х* и {z/n} е у*. Действительно, пусть
К}> и ОЛ’ {у'^у'-
Выкладка, в точности аналогичная (4), дает
IР (Л> Уп) ~ Р «> Уп) I < Р (А> хп) + Р (Уп> Уп)-
Поскольку {хп} ~{%'} и {уп}~{у'п}, отсюда следует, что Um р(х„, j/„)= lim р(х'п, y'J. П~^ ОО	Я“> О°
Докажем теперь, что в R* выполнены аксиомы метрического пространства.
Аксиома 1) непосредственно вытекает из определения эквивалентности фундаментальных последовательностей.
Аксиома 2) очевидна.
Проверим теперь аксиому треугольника. Так как в исходном пространстве R аксиома треугольника выполнена, то
Р (•'"п, 2-п) Р Уп) “Ь Р (Ут %п)-
Переходя к пределу при п->оо, получаем lim р (хп, zn) < lim р (хп, уп) + lim р (уп, zn), П-**>	n->°°
т. е.
р « Z*) < р « у*) + р (у*, Z*).
Докажем теперь, что R можно рассматривать как подпространство пространства R*.
Каждой точке хе R отвечает некоторый класс эквивалентных фундаментальных последовательностей, именно, совокупность всех последовательностей, сходящихся к точке х. Этот класс непуст, поскольку он содержит стационарную последовательность, все члены которой равны х. При этом, если х — lim хп и у — lim уп, то	п+°°
р (х, у) = lim р (х„, уп).
Следовательно, соотнеся каждой точке х е R класс х* сходящихся к ней фундаментальных последовательностей, мы изометрически отобразим R в пространство R*. В дальнейшем мы
74
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
можем не различать само пространство R и его образ в R* и рассматривать R как подпространство в R*.
Покажем теперь, что R всюду плотно в R*. Действительно, пусть х* — некоторая точка из R* и в > 0 произвольно. Выберем в х* представителя, т. е. некоторую фундаментальную последовательность {хп}. Пусть N таково, что p(xn, хт) <Z в для всех n,m>N. Тогда имеем
p(*n, х*)= Нт р(х„, хт)<е о©
при п > /V, т. е. произвольная окрестность точки х* содержит некоторую точку из R. Таким образом, замыкание 7? в R* есть все R*.
Остается доказать полноту R*. Заметим, прежде всего, что по построению R* любая фундаментальная последовательность Х[, Х2, .... хп, ... точек из R сходится в R* к некоторой точке, а именно, к точке х* е R*, определяемой самой этой последовательностью. Далее, так как R плотно в R*, то для любой фундаментальной последовательности х*, х*, . . ., х*, . . . точек из R* можно построить эквивалентную ей последовательность хь Хг, ... . . ., Хп, . • • точек из R. Для этого достаточно в качестве хп взять любую точку из R, такую, что р(хп, х*) < 1/га. Построенная последовательности {хп} фундаментальна в 7? и, по определению, сходится к некоторой точке х* е R*. Но тогда к х* сходится и последовательность {х*}.
§ 4. Принцип сжимающих отображений и его применения
1. Принцип сжимающих отображений. Ряд вопросов, связанных с существованием и единственностью решений уравнений того или иного типа (например, дифференциальных уравнений), можно сформулировать в виде вопроса о существовании и единственности неподвижной точки при некотором отображении соответствующего метрического пространства в себя. Среди различных критериев существования и единственности неподвижной точки при такого рода отображениях один из простейших и в то же время наиболее важных — так называемый принцип сжимающих отображений.
Пусть R — метрическое пространство. Отображение А пространства R в себя называется сжимающим отображением, или короче, сжатием, если существует такое число а < 1, что для любых двух точек х, у ^.R выполняется неравенство
р(Дх, Лг/)<ар(х, у).	(1)
Всякое сжимающее отображение непрерывно. Действительно, если Хп-*х, то в силу (1) и Ахп->Ах.
4] ПРИНЦИП СЖИМАЮЩИХ ОТОБРАЖЕНИИ И ЕГО ПРИМЕНЕНИЯ 75
Точка х называется неподвижной точкой отображения А, если Ах — х. Иначе говоря, неподвижные точки — это решения уравнения Ах = х.
Теорема 1 (Принцип сжимающих отображений). Всякое сжимающее отображение, определенное в полном метрическом пространстве R, имеет одну и только одну неподвижную точку.
Доказательство. Пусть Хо— произвольная точка в R. Положим X] = Ахо, х2 = Axi = А2х0 и т. д.; вообще, хп = = Лхп-i = Апх0.
Покажем, что последовательность {хп} фундаментальная. Действительно, считая для определенности m п, имеем
Р (Хп> %m) = Р С4 Хо, А Хо) р (Xq, Хт—п)
а" {р (х0, X]) + р (хь х2) + ... + р (хт_„_], хга_п)}
«С апр (х0, Х[) {1 + а + а2 + ... + ат-п~ < апр (х0, х^  j 2 а •
Так как а < 1, то при достаточно большом п эта величина сколь угодно мала. В силу полноты R последовательность {хп}, будучи фундаментальной, имеет предел. Положим
х= lim х„.
Тогда в силу непрерывности отображения А
Ах = А lim х„ = lim Ахп = lim хп+1 = х.
П->оо	П->оо	rt->oo
Итак, существование неподвижной точки доказано. Докажем ее единственность. Если
Лх = х, Ау — у,
то неравенство (1) принимает вид
р(х, г/)<ар(х, г/);
так как а <; 1, отсюда следует, что
р(х, г/) = 0, т. е. х — у.
Упражнение. Показать на примере, что отображение А, удовлетворяющее условию р(Дх, Ау) < р(х, у) для всех х У= у, может не иметь ни одной неподвижной точки.
2. Простейшие применения принципа сжимающих отображений. Принцип сжимающих отображений можно применять к доказательству теорем существования и единственности решений для уравнений различных типов. Помимо доказательства существования и единственности решения уравнения Ах = х, принцип
76
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. П
сжимающих отображений дает и фактический метод приближенного нахождения этого решения (метод последовательных приближений). Рассмотрим следующие простые примеры.
1. Пусть f — функция, которая определена на сегменте [а, &], удовлетворяет условию Липшица
I f (х2) — f (xi)-l < КI х2 — xt |,
с константой К <. 1 и отображает сегмент [а, fe] в себя. Тогда f есть сжимающее отображение и, согласно доказанной теореме, последовательность х0, x1 = f(x0), x2 = f(xi), ... сходится к единственному корню уравнения х = f(x).
В частности, условие сжимаемости выполнено, если функция имеет на сегменте [a, fe] производную f'(x), причем |f'(x)|^ </<< 1.
На рис. 9 и 10 изображен ход последовательных приближений в случае 0 < f'(x) < 1 и в случае —1 < f'(x) < 0-
Пусть теперь мы имеем дело с уравнением вида F(x) = 0, причем F(a) < 0, F(b) > 0 и 0 < К\ ?'(х) К2 на [а, &]. Введем функцию f(x) = x — XF(x) и будем искать решение уравнения x = f(x), равносильного уравнению F(x) = 0 при X =/= 0. Так KaKf'(x)=l—kF'(x), то 1—'/.К2 f' (х)	1—ХК, и не-
трудно подобрать число X так, чтобы можно было действовать методом последовательных приближений. Это — распространенный метод отыскания корня.
2. Рассмотрим отображение А га-мерного пространства в себя, задаваемое системой линейных уравнений
п
Vi = chjXj +
(i = 1, 2..............га).
| 4) ПРИНЦИП СЖИМАЮЩИХ ОТОБРАЖЕНИИ И ЕГО ПРИМЕНЕНИЯ 77
Если А есть сжатие, то мы можем применить метод последовательных приближений к решению уравнения х = Ах.
При каких же условиях отображение А будет сжатием? Ответ на этот вопрос зависит от выбора метрики в пространстве. Рассмотрим три варианта.
а)	Пространство R2,, т. е. р (х, у) = max | х{ —- yt |;
= (max £ | ац Q р (х', х"). Отсюда условие сжимаемости
£|а;/К<х<1, i=l, п.	(2)
/=|
п
б)	Пространство R7, т. е. р(х, у) = I xi ~ У1 h
Р (у', у") = Е I y'i — у" I = Е | Е (х' — х'') | <
< Е Е | atl 11 х' - х/ | < (max £ | a{j|) р (х', х").
Отсюда условие сжимаемости
Е|а0|<а<1, /=1, ..., п.	(3)
в)	Пространство R", т. е. р(х, у) — Е ~ У^2- На основании неравенства Коши — Буняковского имеем
Р2 (/,'/') = Е (Е «г/ (*j — x'j'lj2 < (Е Е а2,) Р2 (х', х").
Отсюда условие сжимаемости
ЕЕйЬ<“<1-	(4)
i /
Таким образом, если выполнено хотя бы одно из условий *) (2) — (4), то существует одна и только одна точка (хь х2,..., хп)
’) В частности, из любого из условий (2)—(4) вытекает, что
Оц — 1	012	• • •	Ощ
^21	О22	1	• • •	а2П	0.
ani	оП2	...	апп —	1
78
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
такая, что xt = У, ЯцХ/ + blt причем последовательные приближения к этому решению имеют вид
х<°> = ^(0), A.(0)j
х^ = (Х(1); Х(1>, .... Х(1));
Х^.....
где	„
х^^х?-»-^,
а в качестве х(0) = (х(10), ..х<^) можно взять любую точку из Rn.
Каждое из условий (2) — (4) достаточно для того, чтобы отображение у = Ах было сжатием. Относительно условий (2) и (3) можно было бы доказать, что они и необходимы для того, чтобы отображение у = Ах было сжатием (в смысле метрик а) или б) соответственно).
Ни одно из условий (2) — (4) не необходимо для применимости метода последовательных приближений.
Если |аг;|<1/п, то все три условия (2) — (4) выполнены и метод последовательных приближений заведомо применим.
Если | ац |	1/п, то ни одно из условий (2) — (4) не выпол-
нено.
3. Теоремы существования и единственности для дифференциальных уравнений. В предыдущем пункте были даны два простейших примера применения принципа сжимающих отображений в одномерном и в n-мерном пространствах. Однако наиболее существенны для анализа применения этого принципа в бесконечномерных функциональных пространствах. Сейчас мы покажем, как с его помощью можно получить теоремы существования и единственности решения для некоторых типов дифференциальных и интегральных уравнений.
1.	Задача Коши. Пусть дано дифференциальное уравнение
< =	(5)
с начальным условием
У(х0) = у0,	(6)
причем функция f определена и непрерывна в некоторой плоской области G, содержащей точку (х0, уо), и удовлетворяет в этой области условию Липшица по у.
I f (х, уд — f (х, у2) |< М | г/1 — г/21.
ПРИНЦИП СЖИМАЮЩИХ ОТОБРАЖЕНИИ И ЕГО ПРИМЕНЕНИЯ
79
Докажем, что тогда на некотором сегменте |х— x0|^d существует, и притом только одно, решение у = ф(х) уравнения (5), удовлетворяющее начальному условию (6) (теорема Пикара).
Уравнение (5) вместе с начальным условием (6) эквивалентно интегральному уравнению
X
ф (х) = У о + р (t, ф (/)) dt.	(7)
Хп
В силу непрерывности функции f имеем |f(x, у) | К в некоторой области G' cz G, содержащей точку (х0, Уо)- Подберем d > 0 так, чтобы выполнялись условия:
1) (х, у) е G', если | х — х01 d, | у — Уо | Kd;
2) Md < 1.
Обозначим через С* пространство непрерывных функций ф, определенных на сегменте |х— x0|^d и таких, что |ф(х)— — Уо | AV/, с метрикой р (фь ф2) = шах | ф! (х) — ф2 (х) |.
X
Пространство С* полно, так как оно является замкнутым подпространством полного пространства всех непрерывных функций на [х0 — d, Хо + d]. Рассмотрим отображение ф = Дф, определяемое формулой
X
Ф(х) = Уо+ j f(t, 4>(t))dt,
*0
где |х — х0|<Д Это отображение переводит полное простран* ство С* в себя и является в нем сжатием. Действительно, пусть Ф е С*, | х — Хо | d. Тогда
I Ф W — У о I =
f(t, ф(0)Л ^Kd
и, следовательно, Д(С*)сг С*. Кроме того,
X
I Ч>1 (х) — ф2 (х) к j I f (t, ф( (/)) — f (t, ф2(0) j dt <
Md max | qpj (x) — qp2 (x) |.
X
Так как Md < 1, то A — сжатие.
Отсюда вытекает, что уравнение ф — Дф (г. е. уравнение (7)) имеет одно и только одно решение в пространстве С*.
2. Задача Коши для системы уравнений. Пусть дана система дифференциальных уравнений
ф'Дх) = ?.(х, ф,(х), ..., Ф„(х)),	/ = 1, 2, ...,«	(8)
80
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. И
с начальными условиями
<Pi(Xo) = f/o,-, t=l, 2.....п,	(9)
причем функции fi определены и непрерывны в некоторой области G пространства R’H', содержащей точку (х0, с/01......Уоп),
и удовлетворяют условию Липшица
| ft (х, у\'\ ..., y<f>) - fi(x, .... у™) | < Af max | c/<'> — г/<2> |. 1 i ^.n 1
Докажем, что тогда на некотором сегменте |х— x0|^d существует одно и только одно решение начальной задачи (8), (9), т. е: одна и только одна система функций ср,, удовлетворяющих уравнениям (8) и начальный условиям (9).
Система (8) вместе с начальными условиями (9) эквивалентна системе интегральных уравнений
X
4i(x) = y0l +	.....qn(t))dt, i=l.........n. (10)
Xf,
В силу непрерывности функции fi ограничены в некоторой области G' с G, содержащей точку (х0, Уо\,  > Уоп), т. е. существует такое постоянное число К, что |fi(x, У\, ..., уп) | К.
Подберем d > 0 так, чтобы выполнялись условия:
1) (х, yi.....yn)^G', если |х —х0|^< |г/, — r/0»| Kd\
i = I, ..., п;
2) Md< 1.
Рассмотрим пространство Сп, элементами которого являются наборы ср = (qpi, • • •, фп) из п функций, определенных и непрерывных при |х — х0| d, и таких, что |ср<(х)—Определим метрику формулой
Р(ф, ф)= max| Ф( (х) — ф, (х) |.
X, i
Введенное пространство полно. Отображение ф = Дер, задаваемое системой равенств
X
Ф.- W = Ут + J fi (Л qpi (0..... (0) dt,
Хц
есть сжимающее отображение полного пространства С*п в себя. Действительно,
Ф'/Ч*) —
X
= 5 [fi (t, ф[>(0...Ф<*> (О) - fi ft, Ф(12> (0.Ф(„2> (t)y\dt
Xi
ПРИНЦИП СЖИМАЮЩИХ ОТОБРАЖЕНИЙ И ЕГО ПРИМЕНЕНИЯ
81
и, следовательно,
max |	(х) —	(х) | < Md max | ф<‘> (х) — ф^ (х)
Отображение А — сжимающее, поскольку Md <Z 1.
Отсюда вытекает, что операторное уравнение ф = Дф имеет одно и только одно решение в пространстве С*п.
4. Применение принципа сжимающих отображений к интегральным уравнениям.
1.	Уравнения Фредгольма. Применим теперь метод сжимающих отображений для доказательства существования и единственности решения неоднородного линейного интегрального уравнения Фредгольма второго рода, т. е. уравнения
ъ
/(х) = Л ^(х, г/)/(г/)сГг/4-ф(х),	(11)
а.
где К (так называемое ядро) и ф суть данные функции, f — искомая функция, а X — произвольный параметр.
Мы увидим, что наш метод применим лишь при достаточно малых значениях параметра X.
Предположим, что /((х, у) и ф(х) непрерывны при а х Ь, а у b и, следовательно, | /((х, у) | М. Рассмотрим отображение g = Af полного пространства С[а, 6] в себя, задаваемое формулой
ь
g(x) = Л J (х, у) f (у) dy + <P (*)• а
Имеем
p(gi, g2) = max|g1(x) — g2(x)|<|A,| М (b — а)тах\{{ (x) — f2 (х) |.
Следовательно, при Л < м отображение А — сжимающее.
Из принципа сжимающих отображений заключаем, что для всякого X с | Л | <	уравнение Фредгольма имеет един-
ственное непрерывное решение. Последовательные приближения к этому решению /о. fi....fn, .. имеют вид
ь
fn(x) = X^K (х, у) /„_! (у) dy 4- ф(х), а
где в качестве /о(х) можно взять любую непрерывную функцию.
82
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. П
2.	Нелинейные интегральные уравнения. Принцип сжимающих отображений можно применить и к нелиней-номуинтегральномууравнению вида
ь
f W = A j /((х, у, f(y))dy + <f(x),	(12)
а
где К и <р непрерывны и, кроме того, ядро К удовлетворяет условию Липшица по своему «функциональному» аргументу;
| К (х, у; z,) — К (х, у, z2) К М| zi — z21.
В этом случае для отображения g — Af полного пространства С [а, 6] в себя, заданного формулой
ь
g(x) = K^K(x,y,f(y))dy + <f(x),	(13)
а
имеет место неравенство
max | g, (х) — g2 (х) К | A |М (b — a) max | (х) — f2 (х)
где gi = Aflt g2 = Af2. Следовательно, при | А | < -м а) отображение А будет сжимающим.
3.	Уравнения Вольтерра. Рассмотрим, наконец, интегральное уравнение типа Вольтерра
X
f (х) = А j/С (х, y)f(y)dyA-<f(x).	(14)
а
Здесь, в отличие от уравнений Фредгольма, верхний предел в интеграле — переменная величина х. Формально это уравнение можно рассматривать как частный случай уравнения Фредгольма, доопределив функцию К равенством: 2((х, у) = 0 при у > х.
Однако в случае интегрального уравнения Фредгольма мы были вынуждены ограничиться малыми значениями параметра А, а к уравнениям Вольтерра принцип сжимающих отображений (и метод последовательных приближений) применим при всех значениях А. Точнее, речь идет о следующем обобщении принципа сжимающих отображений.
Пусть А — такое непрерывное отображение полного метрического пространства R в себя, что некоторая его степень В = Ап является сжатием-, тогда уравнение
Ах = х
имеет одно и только одно решение.
45]
ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
83
Действительно, пусть х— неподвижная точка отображения В, т. е. Вх = х. Имеем:
Ах = АВкх = Вк Ах = Вкх0 —> х (£->оо),
ибо отображение В — сжимающее, а потому последовательность Вхо, В2х0, В3х0, ... для любого х0 R сходится к неподвижной точке х отображения В. Следовательно,
Ах = х.
Эта неподвижная точка единственна, поскольку всякая точка, неподвижная относительно А, неподвижна и относительно сжимающего отображения Ап, для которого неподвижная точка может быть только одна.
Покажем теперь, что некоторая степень отображения
X
Af(x) = ?^K(x, y)f(y)dy + <p(x)
является сжатием. Пусть fi и /г — две непрерывные функции на
•отрезке [а, й]. Тогда
X
I Af1 (х) - Af2 (х) I = | X | $ Д' (х, у) (f, (у) - f2 (у)) dy а
< I X | М (х — a) max | fl (х) — f2 (х) |.
Здесь М = гпах| Д (х, у) |. Отсюда
| A2f! (х) — A2f2 (х) К | X |2 М2 (x~2ayi- max | (х) — f2 (х) |
и, вообще,
| Anft (х) - Anf2(х) К| X ГМп {х~а}П m < | X ГМпт (Ь~а)П-
где т = max | Л (х) — f2 (х) |.
При любом значении X число п можно выбрать настолько большим, что
^1пМп(Ь-а)п nl < •
Тогда отображение Ап будет сжатием. Итак, уравнение Воль-терра (14) при любом X имеет решение, и притом единственное.
§ 5. Топологические пространства
1. Определение и примеры топологических пространств. Основные понятия теории метрических пространств (предельная точка, точка прикосновения, замыкание множества и т. д.) мы вводили, опираясь на понятие окрестности или, что, по существу,
84
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. 1Г
то же самое, на понятие открытого множества. Эти последние понятия (окрестность, открытое множество) в свою очередь определялись с помощью метрики, заданной в рассматриваемом пространстве. Можно, однако, стать на другой путь и, не вводя в данном множестве /? метрику, непосредственно определить в /? систему открытых множеств посредством аксиом. Этот путь, обеспечивая значительно большую свободу действий, приводит нас к топологическим пространствам, по отношению к которым метрические пространства представляют собой хотя и весьма важный, но несколько специальный случай.
Определение. Пусть X — некоторое множество — пространство-носитель. Топологией в X называется любая система т его подмножеств G, удовлетворяющая двум требованиям:
1°. Само множество X и пустое множество 0 принадлежат т.
2°. Сумма [J Ga любого (конечного или бесконечного) и а
п
пересечение П G^ любого конечного числа множеств из т при-
надлежат т.
Множество X с заданной в нем топологией т, т. е. пара (X, г), называется топологическим пространством.
Множества, принадлежащие системе т, называются открытыми.
Так же как метрическое пространство есть совокупность множества точек—«носителя» и введенной в этом множестве метрики, топологическое пространство есть совокупность множества точек и введенной в 'нем топологйи. Таким образом, задать топологическое пространство — это значит задать некоторое множество X и задать в нем топологию т, т. е. указать те подмножества, которые считаются в X открытыми.
Ясно, что водном и том же множестве X можно вводить разные топологии, превращая его тем самым в различные топологические пространства. И все же топологическое пространство, т. е. пару (X, т), мы будем обозначать одной буквой, скажем, Т. Элементы топологического пространства мы будем называть точками.
Множества Т\ G, дополнительные к открытым, называются замкнутыми множествами топологического пространства Т. Из аксиом 1° и 2° в силу соотношений двойственности (§ 1 гл. I)’ вытекает, что:
1. Пустое множество 0 и все Т замкнуты.
2. Пересечение любого (конечного или бесконечного) числа и сумма конечного числа замкнутых множеств замкнуты.
На основе этих определений естественно вводятся во всяком топологическом пространстве понятия окрестности, точки прикосновения, замыкания множества и т. д. Именно:
f 5]	ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА	85-
Окрестностью точки х е Т называется всякое открытое множество G с Г, содержащее точку х; точка х е Т называется точкой прикосновения множества М czT, если каждая окрестность точки х содержит хотя бы одну точку из М- х называется предельной точкой множества М, если каждая окрестность точки х содержит хотя бы одну точку из М, отличную от х. Совокупность всех точек прикосновения множества М называется замыканием множества М и обозначается символом [Af]. Легко доказать (проведите это доказательство), что замкнутые множества (определенные нами выше как дополнения открытых), и только они, удовлетворяют условию [М] = М. Как и в случае метрического пространства, [М] есть наименьшее замкнутое множество, содержащее М.
Упражнение. Докажите, что операция замыкания [AJ], определенная с помощью топологии, обладает свойствами 1)—4), сформулированными в теореме 1 § 2.
Примеры. 1. В силу теоремы 3' § 2 открытые множества ВО' всяком метрическом пространстве удовлетворяют аксиомам 1° и 2° определения топологического пространства. Таким образом, всякое метрическое пространство является и топологическим пространством.
2.	Пусть Т — произвольное множество. Будем считать открытыми все его подмножества. Аксиомы 1° и 2° при этом, очевидно, выполнены, т. е. мы действительно получаем топологическое пространство. В нем все множества одновременно и открыты и замкнуты, и, значит, каждое из них совпадает со своим замыканием. Такой дискретной топологией обладает, например, метрическое пространство, указанное в примере 1 § 1.
3.	В качестве другого крайнего случая рассмотрим в произвольном множестве X тривиальную топологию, состоящую только из двух множеств: всего X и пустого множества 0. Здесь замыкание каждого непустого множества есть все X. Такое топологическое пространство можно назвать «пространством слипшихся точек».
4.	Пусть Т состоит из двух точек а и Ь, причем открытыми множествами мы считаем все Т, пустое множество и множество, состоящее из одной точки Ь. Аксиомы 1° и 2° здесь выполнены. В этом пространстве (которое часто называют связным двоеточием) замкнуты такие подмножества: все Т, пустое множество и точка а. Замыкание одноточечного множества {Ь} есть все Т.
Упражнение. Постройте все топологии в пространстве X, состоящем из двух, трех, четырех и пяти точек.
2,	Сравнение топологий. Пусть на одном и том же носителе X заданы две топологии Ti и Тг (тем самым определены д в а топологических пространства: 7’1= (X, ti) и Т2 = (Х, Тг)- Мы
«6
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. [J
скажем, что топология Х[ сильнее, или тоньше топологии т2, если •система множеств хг содержится в хь Про топологию хг при этом говорят, что она слабее, или грубее, чем хр
В совокупности всех возможных топологий множества X есте-ственным образом вводится частичная упорядоченность (топология Т2 предшествует xi, если она слабее, чем xj. В этой совокупности топологий есть максимальный элемент — топология, в которой все множества открыты (пример 2), — и минимальный — топология, в которой открыты только все X и 0 (пример 3).
Теорема 1. Пересечение произвольного множества топологий х — А ха в X есть топология в X. Эта топология х слабее лю-а
бой из топологий ха.
Доказательство. Ясно, что П та содержит X и 0. Да-а
лее, из того, что каждое ха замкнуто относительно взятия любых сумм и конечных пересечений, следует, что этим свойством обладает и х = П та-
а
Следствие. Пусть S3 — произвольный запас подмножеств множества X; тогда существует минимальная топология в X, содержащая S3.
Действительно, топологии, содержащие S3, существуют (например, та, в которой все А с X открыты). Пересечение всех топологий, содержащих S3, и есть искомая. Эта минимальная топология называется топологией, порожденной системой S3, и обозначается x(S3).
Пусть X — произвольное множество и А — его подмножество. Следом системы множеств S3 на подмножестве А называется система 53а, состоящая из подмножеств вида А П В, Be S3. Легко видеть, что след (на Д) топологии х (заданной в X) является топологией та в А. Таким образом, всякое подмножество А любого топологического пространства само оказывается топологическим пространством. Топологическое пространство (Д, тА) называется подпространством исходного топологического пространства (X, х). Ясно, что две различные топологии, xi и т2, в X могут порождать одну и ту же топологию в А с X. Топология та называется относительной топологией в А.
3.	Определяющие системы окрестностей. База. Аксиомы счетности. Как мы видеДИ, задать в пространстве Т топологию — это значит задать в нем систему открытых множеств. Однако в конкретных задачах бывает удобно задавать не всю топологию, а лишь некоторую ее часть, т. е. некоторый запас открытых множеств, по которому однозначно определяется совокупность всех открытых подмножеств. Так, например, в метрическом пространстве мы ввели сначала понятие открытого шара (е-окрестности), а затем определили открытые множества как
$ 5]	ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА	87
такие, в которых каждая точка содержится вместе с некоторой своей шаровой окрестностью. Иными словами, в метрическом пространстве открыты те и только те множества, которые можно представить как суммы открытых шаров (в конечном или бесконечном числе). В частности, на прямой открыты множества,, представимые в виде сумм интервалов, и только они. Эти соображения приводят нас к важному понятию базы топологического пространства.
Определение. Совокупность 3 открытых подмножеств называется базой топологии пространства Т, если всякое открытое множество в Т может быть представлено как сумма некоторого числа (конечного или бесконечного) множеств из 3.
Так, например, совокупность всех открытых шаров (с произвольным центром и радиусом) образует базу в метрическом пространстве. В частности, система всех интервалов — база на прямой. Базу на прямой образуют и одни только интервалы с рациональными концами, поскольку в виде суммы таких интервалов можно представить любой интервал, а значит, и любое открытое множество на прямой.
Итак, топологию т пространства Т можно задать, указав в этом пространстве некоторую ее базу 3-, эта топология т совпадает с совокупностью множеств, представимых как суммы множеств из 3.
Всякая база 3 в топологическом пространстве Т = (X, т) обладает следующими двумя свойствами:
1)	любая точка хе X содержится хотя бы в одном G ^3\
2)	если х содержится в пересечении двух множеств Gi и G2 из 3, то существует такое G3 е 3, что
х е= G3 с Gi П G2.
Действительно, свойство 1) просто означает, что все X, будучи открытым, должно представляться как сумма каких-то множеств из 3, а 2) вытекает из того, что Gi П G2 открыто и, следовательно, есть сумма каких-то элементов базы.
Обратно, пусть X — произвольное множество и 3 — система подмножеств в X, обладающая свойствами 1) и 2). Тогда совокупность множеств, представимых как суммы множеств из 3, образует в X топологию (т. е. удовлетворяет аксиомам 1° и 2°" определения топологического пространства).
Действительно, пусть т(3)— совокупность всех множеств из X, представимых как суммы множеств из 3. Тогда пустое множество ') и все X принадлежат т(3) и сумма любого числа множеств из т(3) также принадлежит т(3). Покажем, что пересечение любого конечного числа множеств из х(3) принадлежит
’) Оно получается как сумма пустого множества элементов системы У».
«8
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. П
т(^). Достаточно проверить это для двух множеств. Пусть А —
J Ga и В= Gp, тогда 4f|B^= U (Ga Г1 Gp). Из условия 2) следует, что каждое Ga П G$ содержится в т(З’). Но тогда и А ПВ е t(S’).
Итак, мы получаем следующий результат.
Теорема 2. Для того чтобы система 3 подмножества G множества X была базой некоторой топологии в X необходимо и достаточно, чтобы 3 обладала свойствами 1) и 2).
Пусть теперь в пространстве Т задана некоторая фиксированная топология т. Взяв в Т некоторую систему 3 открытых множеств, обладающую свойствами 1) и 2), и приняв ее за базу, мы очевидно получили в Т топологию т(3), или совпадающую с исходной топологией т, или более слабую. Установим условия, при которых 3 порождает именно данную топологию т.
Теорема 3. Для того чтобы система 3 с:т была базой данной топологии т, необходимо и достаточно следующее условие-.
3)	для каждого открытого множества G и каждой точки x^G существует такое Gx е 3, что x^GxcG.
Доказательство. Если условие 3) выполнено, то всякое открытое множество G представимо в виде
G= U Gx, x^G
т. е. 3 есть база топологии т. Обратно, если 3 есть база топологии т, то всякое Сет представимо в виде суммы множеств из 3, а тогда для всякого хе G найдется такое Gx^3, что x^GxcG.
Упражнение. Пусть St и S2 — две базы в X (т. е. две системы множеств, удовлетворяющих условиям 1) и 2) стр. 87), аци т2— определяемые ими топологии. Докажите, что Ti czt2 в том и только том случае, если для .любого Gt е St и любой точки xeG, существует такое G2 е S2, что JceG,c Gt-
С помощью теоремы 3 легко установить, например, что во всяком метрическом пространстве совокупность всех открытых шаров образует базу его топологии. Совокупность всех шаров с рациональными радиусами также представляет собой базу. На прямой базой может служить, например, совокупность всех рациональных интервалов (т. е. интервалов с рациональными концами).
Важный класс топологических пространств образуют пространства со счетной базой, т. е. такие пространства, в которых существует хотя бы одна база, состоящая не более чем из счетного числа множеств. Пространства со счетной базой называют также пространствами со второй аксиомой счетности.
Если в топологическом пространстве Т имеется счетная база, то в нем обязательно имеется счетное всюду плотное множество.
$ 5]	ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА	89’
т. е. такое счетное множество, замыкание которого есть все Т. Действительно, пусть {Gn}—такая база. Выберем в каждом ив элементов этой базы произвольную точку хп- Счетное множество X = {хп} всюду плотно в Т, так как в противном случае непустое открытое множество G = 7'\[Х] не содержало бы ни одной точки из X, что невозможно, поскольку G есть сумма некоторых множеств из системы {Gn}, а хп е Gn.
Топологические пространства со счетным всюду плотным множеством, как и метрические, называются сепарабельными.
Для метрических иространств верно утверждение, обратное^ только что доказанному:
Если метрическое пространство R сепарабельно, то в R есть и счетная база. Действительно, такую базу образуют, например, открытые шары B(xn, 1М), где {хп}—счетное всюду плотное множество, а п и пг независимо пробегают все натуральные числа. Таким образом, справедлива следующая теорема:
Теорема 4. Метрическое пространство R имеет счетную базу тогда и только тогда, когда оно сепарабельно.
В силу этой теоремы все примеры сепарабельных метрических пространств могут служить и примерами метрических пространств со второй аксиомой счетности. Несепарабельное пространство ограниченных последовательностей (см. пример 9 § 1) не имеет и счетной базы.
Замечание. Теорема 4, вообще говоря, неверна для произвольных (не метрических) топологических пространств: можно указать примеры сепарабельных пространств без счетной базы. Поясним происходящие здесь явления. Для каждой точки х метрического пространства R существует счетная система U ее окрестностей (например, система открытых шаров В(х, 1/п)),. обладающая следующим свойством: каково бы ни было открытое множество G, содержащее точку х, найдется окрестность из системы U, целиком лежащая в G. Такая система окрестностей называется определяющей системой окрестностей точки х.
Если точка х топологического пространства Т имеет счетную определяющую систему окрестностей, то говорят, что в этой точке выполнена первая аксиома счетности. Если это верно для каждой точки пространства Т, то пространство Т называется пространством с первой аксиомой счетности.
Всякое метрическое пространство, даже и несепарабельное, автоматически удовлетворяет первой аксиоме счетности. Однако в произвольном топологическом пространстве (даже если оно-состоит лишь из счетного числа точек) первая аксиома счетности может не иметь места. Поэтому те рассуждения, с помощью которых мы для метрического пространства вывели из наличия счетного всюду плотного множества существование в таком пространстве счетной базы, не переносятся на случай произвольного-
-90
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. И
топологического пространства. Но даже и в сепарабельном топологическом пространстве с первой аксиомой счетности счетной -базы может не быть.
Система множеств {MJ называется покрытием множества X, если U Ма zz> X. Покрытие топологического пространства Т, со-а
стоящее из открытых (замкнутых) множеств, называется открытым (замкнутым) покрытием. Если некоторая часть {MaJ покрытия {/Wa} сама образует покрытие пространства Т, то {MaJ называется подпокрытием покрытия {MJ.	‘
Теорема 5. Если Т — топологическое пространство со счетной базой, то из всякого его открытого покрытия можно выбрать конечное или счетное подпокрытие.
Доказательство. Пусть {Оа}—некоторое открытое покрытие пространства Т. Тогда каждая точка х е Т содержится в некотором Оа. Пусть {Gn} — счетная база в Т. Для каждого х е Т существует такой элемент Gn(x) этой базы, что хе eGn(x)cOa. Совокупность выбранных таким образом множеств Gn(x) конечна или счетна и покрывает все Т. Выбрав для каждого Gn(x) одно из содержащих его множеств Оа, мы и получим конечное или счетное подпокрытие покрытия {Оа}. Теорема доказана.
По определению топологического пространства пустое множество и все пространство Т одновременно открыты и замкнуты. Пространство, в котором нет никаких других множеств, одновременно открытых и замкнутых, называется связным. Прямая линия R1 представляет собой один из простейших примеров связных пространств. Если же из R1 удалить одну или несколько точек, то оставшееся пространство уже не будет связным.
4.	Сходящиеся последовательности в Т. На топологические пространства легко переносится знакомое нам в случае метрических пространств понятие сходящейся последовательности. Именно, последовательность xh х2, ..., хп, ... точек из Т называется сходящейся к точке х, если любая окрестность точки х содержит все точки этой последовательности, начиная с некоторой. Однако в топологических пространствах это понятие сходимости не играет той фундаментальной роли, которая ему принадлежит в метрических пространствах. Дело в том, что в метрическом пространстве R точка х есть точка прикосновения множества М cz R в том и только том случае, когда в М существует последовательность, сходящаяся к х, тогда как в топологическом пространстве это, вообще говоря, не так. Из того, что х есть точка прикосновения для М (т. е. принадлежит [Л4]) в топологическом пространстве Т, не вытекает существование в М последовательности, сходящейся к х. Возьмем в качестве примера отрезок [0, 1] и назовем открытыми те его подмноже
$ 5]	ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
ства (наряду с пустым множеством), которые получаются ид него выбрасыванием любого конечного или счетного числа точек. Легко проверить, что требования 1° и 2° (стр. 84) при этом будут выполнены, т. е. мы получим топологическое пространство. В этом пространстве сходящимися будут только стационарные последовательности, т. е. такие, элементы которых, начиная с некоторого номера, совпадают: хп = Хп-н = ... (докажите это!). С другой стороны, если мы возьмем, например, в качестве М полуинтервал (0, 1], то точка 0 будет для него точкой прикосновения (проверьте!), но никакая последовательность точек из М не сходится к 0 в нашем пространстве.
Сходящиеся последовательности «восстанавливаются в своих правах», если мы рассматриваем не произвольные топологические пространства, а пространства с первой аксиомой счетности, т. е. если у каждой точки х пространства Т существует счетнан определяющая система окрестностей. В этом случае каждая точка прикосновения х произвольного множества М с. Т может быть представлена как предел некоторой последовательности точек из М. Действительно, пусть {Оп} — счетная определяющая система окрестностей точки х. Можно считать, что On+i с: Оп
И \
(иначе мы заменили бы Оп на П Ok I . Пусть хь — произволь-fe=l /
ная точка из М, содержащаяся в Ok (k = 1, 2, ...). Ясно, что-такое Xk существует, иначе х не было бы точкой прикосновения для М. Последовательность {хй}, очевидно, сходится к х.
Первой аксиоме счетности удовлетворяют, как мы отмечали, все метрические пространства. Именно поэтому мы и смогли все такие понятия, как замыкание, точка прикосновения и т. д., сформулировать для метрических пространств в терминах сходимости последовательностей.
5.	Непрерывные отображения. Гомеоморфизм. Понятие непрерывного отображения, введенное нами для метрических пространств в § 1, естественно обобщается на произвольные топологические пространства.
Определение. Пусть X и У— два топологических пространства. Отображение f пространства X в пространство У называется непрерывным, в точке хо, если для любой окрестности Uy„ точки г/о — f(x0) найдется такая окрестность V х„ точки х0, что f (У*,) cz Uyil. Отображение f: X -> У называется непрерывным, если оно непрерывно в каждой точке хеХ. В частности, непрерывное отображение топологического пространства X в. числовую прямую называется непрерывной функцией на этом пространстве.
Легко убедиться, что для метрических пространств это определение действительно превращается в то определение непре
”92
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. П
рывности отображения одного метрического пространства в другое, которое было дано в § 1.
Данное нами определение носит «локальный» характер. Непрерывность отображения f на всем X определяется через непрерывность f в каждой точке. Оказывается, что понятие непрерывности отображения одного топологического пространства в другое можно сформулировать в терминах открытых множеств, т. е. в терминах топологии этих пространств.
Теорема 6. Для того чтобы отображение f топологического пространства X в топологическое пространство У было непрерывным, необходимо и достаточно, чтобы прообраз r = f~l(G) всякого открытого множества G с: У был открыт {в X).
Доказательство. Необходимость. Пусть отображение f непрерывно и пусть G — открытое множество в У. Докажем, что r = f~1(G) открыто. Пусть х — произвольная точка множества Г и у = f(x). Тогда G служит окрестностью точки у. По определению непрерывности найдется такая окрестность Vx точки х, что f(Vx) с: G, т. е. Vx cz Г. Иначе говоря, если х е Г, то существует окрестность Vx этой точки, содержащаяся в Г. Но это и значит, что Г открыто.
Достаточность. Пусть r = f_|(G) открыто, если СсУ открыто. Рассмотрим произвольную точку х е X и произвольную окрестность Uy точки y=f(x). Поскольку у е Uу, точка х принадлежит множеству f~l(Uy). Это открытое множество и служит той окрестностью точки х, образ которой содержится в Uy.
Замечание. Пусть X и У — произвольные множества и f — отображение X в У: Если в У задана некоторая топология г (т. е. система множеств, содержащая 0 и У и замкнутая относительно взятия любых сумм и конечных пересечений), то прообраз топологии т (т. е. совокупность всех множеств f~'(G), где Сет) будет топологией в X.
Для доказательства достаточно вспомнить теоремы о прообразе суммы и пересечения множеств (см. § 2 гл. I). Мы обозначим эту топологию /"'(т). Если теперь X и У — топологические пространства с топологиями тх и ту, то теорему 6 можно сформулировать так: отображение f: X -> У непрерывно в том и только том случае, если топология тх сильнее топологии f~l(i:y).
Из того, что прообраз дополнения есть дополнение прообраза, следует теорема, двойственная к теореме 6.
Теорема 6'. Для того чтобы отображение f топологического пространства X в топологическое пространство У было непрерывно, необходимо и достаточно, чтобы прообраз всякого замкнутого множества из У был замкнут (в X).
Легко убедиться, что образ открытого (замкнутого) множества при непрерывном отображении не обязательно открыт (замкнут). Рассмотрим, например, отображение полуинтервала
«5]
ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
93
X = [0, 1) на окружность. Множество [*/2, 1), замкнутое в [0, 1), переходит при этом в незамкнутое множество на окружности (рис. 11).
Отображение называется открытым, если оно переводит каждое открытое множество снова в открытое. Отображение, переводящее каждое замкнутое множество в замкнутое, называется	f(0)
замкнутым.
Для непрерывных отображений	/	\
справедлива следующая теорема, л /Л /	\	/
аналогичная хорошо известной из	'
анализа теореме о непрерывности	fO/i)
сложной функции.
Теорема?. Пусть X, Y uZ — то-	Рис. 11.
пологические пространства и пусть
f и ф — непрерывные отображения X в Y и Y в Z соответственно. Тогда отображение х*-*-tp(f(x)) пространства X в Z непрерывно.
Доказательство этой теоремы сразу получается из теоремы 6.
На топологические пространства распространяется понятие гомеоморфизма, введенное нами в § 1 для метрических пространств, а именно, отображение f топологического пространства X на топологическое пространство У называется гомеоморфизмом, если оно взаимно однозначно и взаимно непрерывно; пространства X и У при этом называют гомеоморфными. Гомеоморфные пространства обладают одними и теми же топологическими свойствами, и с топологической точки зрения их можно рассматривать просто как два экземпляра одного и того же пространства. Топологии в двух гомеоморфных пространствах служат образами и прообразами друг друга. Отношение гомеоморфности рефлексивно, симметрично и транзитивно; поэтому любая совокупность топологических пространств распадается на не-пересекающиеся классы гомеоморфных между собой пространств.
Замечание. Следует иметь в виду, что метрические свойства двух гомеоморфных между собой метрических пространств могут быть различны1). Так, одно из них может быть полно, а другое — нет. Например, интервал (—л/2, л/2) гомео-морфен числовой прямой (соответствующий гомеоморфизм можно задать функцией x-*tgx), но при этом прямая — полное пространство, а интервал — нет.
') Метрика пространства R однозначно определяет его топологию, но не наоборот: одну и ту же топологию в R = (X, р) можно получить, задавая в X различные метрики.
94
Метрические и топологические пространства
[гл. и
6.	Аксиомы отделимости. Хотя многие из основных понятий теории метрических пространств легко переносятся на произвольные топологические пространства, все же такие пространства представляют собой объект, слишком общий с точки зрения задач анализа. Здесь возникают ситуации, существенно отличающиеся от того, что может иметь место в метрических пространствах. Так, мы видели, что конечное множество точек в топологическом пространстве может быть не замкнутым (пример 4, стр. 85) и т. п.
Среди топологических пространств можно выделить пространства, более близкие по своим свойствам к пространствам метрическим. Для этого следует к аксиомам 1° и 2° топологического пространства (стр. 84) присоединить еще те или иные дополнительные условия. Такими условиями служат, например, аксиомы счетности; они позволяют изучать топологию пространства на основе понятия сходимости. Другой важный тип дополнительных условий составляют требования иной природы — так называемые аксиомы отделимости. Мы перечислим эту серию аксиом в порядке их постепенного усиления.
Аксиома Т\ (первая аксиома отделимости)-, для любых двух различных точек х и у пространства Т существуют окрестность Ох точки х, не содержащая точку у, и окрестность Оу точки у, не содержащая точки х.
Пространства, удовлетворяющие этой аксиоме, называются Т\-пространствами. Примером топологического пространства, не являющегося /^-пространством, может служить связное двоеточие.
В /^-пространстве любая точка есть замкнутое множество. Действительно, если х у, то существует окрестность Оу точки у, не содержащая х, т. е. у^[х]. Поэтому [х] = х. Следовательно, в /^-пространстве замкнуто и любое конечное множество точек. Более того, как легко проверить, аксиома 7\ в точности равносильна требованию замкнутости всех таких множеств.
Выше (см. стр. 85) мы определили предельную точку х множества М в топологическом пространстве Т как такую точку, для которой пересечение /7ПЛ4\{х} непусто. Здесь U — произвольная окрестность точки х.
В пространствах, не удовлетворяющих аксиоме 1\, предельные точки могут иметь даже множества М, состоящие только из конечного числа точек. Пусть Т — связное двоеточие с топологией, состоящей из 0, {Ь} и {а, Ь}. Тогда точка а является предельной для множества М = {&}.
В /^-пространствах такое явление уже не может иметь места. Именно, верно следующее утверждение.
Лемма. Для того чтобы точка х была предельной для множества М в ТГпространстве, необходимо и достаточно, чтобы
I 5]
ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
95
любая окрестность U этой точки содержала бесконечно много точек из М.
Достаточность этого условия очевидна. Установим его необходимость. Пусть х — предельная точка для М\ допустим, что Существует такая окрестность U точки х, которая содержит только конечное число точек из М. Пусть х\, х2, ..., хп — все эти точки, кроме самой х (если таковая принадлежит М). Тогда V = U — {%1, ..., хп} — окрестность х и V Я М \ {%} = 0.
Всякое метрическое пространство заведомо является ^-пространством. Поэтому за определение предельной точки множества в метрическом пространстве и было принято свойство, указанное в лемме.
Усилением первой аксиомы отделимости является аксиома Т2.
Аксиома Т2 (вторая, или хаусдорфова, аксиома отделимости): любые две различные точки хну топологического пространства Т имеют непересекающиеся окрестности Ох и Оу.
Пространства, удовлетворяющие этой аксиоме, называются Т2-пространствами, или хаусдорфовыми пространствами. Всякое уаусдорфово пространство есть /^-пространство, но не наоборот. Примером не хаусдорфова /^-пространства может служить отрезок [О, 1], в котором открытыми считаются пустое множество и все множества, получающиеся из отрезка выбрасыванием не более чем счетного числа точек.
Аксиома Т3 (третья аксиома отделимости): любая точка и не содержащее ее замкнутое множество имеют непересекающиеся окрестности. При этом окрестностью множества М в топологическом пространстве Т называется всякое открытое множество U, содержащее М.
Этой аксиоме можно дать следующую эквивалентную формулировку:
Любая окрестность U произвольной точки х содержит меньшую окрестность той же точки, входящую в U вместе со своим замыканием.
Читатель может доказать это в качестве упражнения.
Поскольку в произвольном топологическом пространстве точка может не быть замкнутым множеством, третья аксиома отделимости интересна только для пространств, удовлетворяющих аксиоме 7\. Пространства, удовлетворяющие обеим аксиомам Тх и Т3, называются регулярными.
Всякое регулярное пространство, разумеется, хаусдорфово. Примером хаусдорфова пространства, не являющегося регулярным, может служить отрезок [0, 1], в котором окрестности всех точек, кроме точки 0, определяются обычным способом, а окрестностями нуля считаются всевозможные полуинтервалы [0, а), из которых выкинуты точки вида 1/п (п, — 1, 2, ...). Это — хаусдорфово пространство, но в нем точка 0 и не содержащее ее
96
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. п
замкнутое множество {1/п} не отделимы друг от друга непере-секающимися окрестностями, т. е. аксиома Т3 не выполнена.
Обычно в анализе не приходится встречаться с пространствами более общими, чем регулярные. Более того, как правило, интересные с точки зрения анализа пространства удовлетворяют и следующему более сильному требованию, так называемой нормальности пространства.
Аксиома Т\ (аксиома нормальности): ^-пространство называется нормальным, если в нем всякие два непересекающихся замкнутых множества имеют непересекающиеся окрестности.
К нормальным пространствам относятся, в частности, все метрические пространства. Действительно, пусть X и Y — два непересекающихся замкнутых множества в метрическом пространстве /?. Каждая точка х е X имеет окрестность Ох, не пересекающуюся с У и, следовательно, находится от Y на некотором положительном расстоянии рх. Аналогично расстояние каждой точки у е Y от X есть положительная величина ру. Рассмотрим открытые множества ’)
U = U В(х, рж/2) и V= U В(у,ри/2), х^Х	y^Y
содержащие X и Y соответственно, и покажем, что их пересечение пусто. Допустим, что z е U Г) V. Тогда в X существует такая точка х0, что р (х0, z) < pXj/2, а в Y — такая точка у0, что р (z, z/0) < Pyj'X Пусть для определенности РУо- Тогда
Р (*о- У о) < Р (*о- z) + Р (2> *о) < Р J2 + РУо/2 < РУо>
т. е. х0 е В (yQ, РУо), но это противоречит определению руо. Наше утверждение доказано.
Всякое подпространство метрического пространства само является метрическим пространством и поэтому всегда обладает свойством нормальности. Это, вообще говоря, неверно для произвольных нормальных пространств: подпространство нормального пространства не обязано быть нормальным. Таким образом, нормальность пространства не есть наследственное свойство 2).
Наследственным свойством является так называемая полная регулярность топологических пространств, представляющая собой важное усиление свойства регулярности. Топологическое Г]-пространство называется вполне регулярным, если для каждого замкнутого множества FczT и каждой точки Xo^T\F существует непрерывная на Т действительная функция f, равная
') Здесь, как обычно, В(х, г) — открытый шар радиуса г с центром х.
3) Свойство Р называется наследственным, если из того, что им обладает данное топологическое пространство Т, следует, что им обладают и все его подпространства.
।S]	ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА	97
дулю в точке х0, единице на F и удовлетворяющая условию f(x)^ 1. Всякое нормальное пространство вполне регулярно ’)> но не обратно. Любое подпространство вполне регулярного (в частности, нормального) пространства само вполне регулярно. А. Н. Тихонов, которому принадлежит и само понятие вполне регулярного пространства, показал, что класс вполне, регулярных пространств совпадает с классом всех подпространств нормальных пространств. С точки зрения анализа вполне регулярные пространства важны потому, что на всяком таком пространстве имеется «достаточно много» непрерывных функций, именно, для любых различных точек х, у вполне регулярного пространства Т существует определенная на Т непрерывная вещественная функция, принимающая в этих точках различные значения.
7. Различные способы задания топологии в пространстве. Метризуемость. Самый прямой способ задать топологию в некотором пространстве состоит в том, чтобы непосредственно указать те множества, которые мы считаем открытыми. Набор этих множеств должен удовлетворять требованиям 1° и 2° (см. стр. 84). Равносильный этому двойственный способ — указать, набор замкнутых множеств. Такой набор должен, очевидно, удовлетворять условиям 1 и 2 (стр. 84). Однако фактически этот способ редко может быть применен. Так, например, даже в случае плоскости вряд ли можно дать непосредственное описание всех открытых подмножеств (как это удается сделать для прямой (теорема 5 § 2)).
Распространенный способ задания топологии состоит в выборе некоторой базы; фактически именно так и вводится топология в метрических пространствах, где мы, опираясь на метрику, задаем базу — совокупность открытых шаров.
Еще один из возможных способов задать топологию в пространстве— это ввести в нем понятие сходимости. Однако за пределами метрических пространств такой способ не всегда удобен, поскольку, как уже указывалось в п. 4, не всегда переход от множества к его замыканию можно описать в терминах сходящихся последовательностей. Этот способ можно сделать универсальным, обобщив соответствующим образом само понятие сходящейся последовательности (см., например, [29], гл. 2).
Можно ввести в пространстве топологию, определив в нем аксиоматически операцию замыкания. Именно, говорят, что в множестве X задана операция замыкания, если каждому А а X
’) Этот (совсем не очевидный) факт вытекает из следующей теоремы П. С. Урысона: если Т — нормальное пространство и Fi, F2 — два его непере-секающихся замкнутых подмножества, то на Т существует непрерывная функция, f, 0 f(x) 1, равная нулю на и единице на F2.
98
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. И
поставлено в соответствие некоторое множество [Д] с X, называемое замыканием. А, причем операция перехода от А к [Д] обладает свойствами 1)—4), указанными в теореме 1 § 2. Определив после этого замкнутые множества как те, для которых [Д] = А, легко показать, что этот класс множеств удовлетворяет условиям 1 и 2 (стр. 84), т. е. действительно определяет в X топологию.
Задание метрики — один из важнейших способов введения топологии, хотя и далеко не универсальный. Как мы уже видели, всякое метрическое пространство нормально и удовлетворяет первой аксиоме счетности. В пространстве, лишенном хотя бы одного из этих двух свойств, топологию нельзя задать с помощью какой бы то ни было метрики.
Определение. Топологическое пространство Т называется метризуемым, если его топологию можно задать с помощью какой-либо метрики.
В силу только что сказанного нормальность пространства и первая аксиома счетности представляет собой необходимые условия метризуемости пространства. Вместе с тем ни каждое из этих условий в отдельности, ни даже их совокупность недостаточны для метризуемости пространства. Однако имеет место следующая теорема, принадлежащая П. С. Урысону:
Для того чтобы топологическое пространство со счетной базой было метризуемо, необходимо и достаточно, чтобы оно было нормально.
Необходимость этого условия ясна; доказательство достаточности имеется, например, в [2].
§ 6.	Компактность
1.	Понятие компактности. Фундаментальную роль в анализе играет следующий факт, известный под названием леммы Г ейне — Борел я:
Из любого покрытия отрезка [а, Ь] числовой прямой интервалами можно выбрать конечное подпокрытие.
Это утверждение останется справедливым, если вместо интервалов рассматривать любые открытые множества: из всякого открытого покрытия отрезка [и, Ь] можно выделить конечное подпокрытие.
Отправляясь от этого свойства отрезка числовой прямой, введем следующее важное понятие.
Определение. Топологическое пространство Т называется компактным, если любое его открытое покрытие содержит конечное подпокрытие.
Компактное топологическое пространство, удовлетворяющее аксиоме отделимости Хаусдорфа, называется компактом.
КОМПАКТНОСТЬ
99
«6]
Как мы увидим ниже, свойством компактности наряду с отрезками обладают все замкнутые ограниченные подмножества евклидова пространства любой конечной размерности. Наоборот, прямая, плоскость, трехмерное пространство служат простейшими примерами некомпактных пространств.
Назовем некоторую систему подмножеств {Д} множества Т п
центрированной, если любое конечное пересечение П Дг членов этой системы не пусто. Из сформулированного определения компактности и соотношений двойственности вытекает следующая теорема.
Теорема 1. Для того чтобы топологическое пространство Т было компактным, необходимо и достаточно, чтобы оно удовлетворяло условию:
(R) каждая центрированная система его замкнутых подмножеств имеет непустое пересечение.
Действительно, пусть {FJ — центрированная система замкнутых подмножеств в Г и пусть Т компактно. Множества Ga=T\Fa открыты, причем из того факта, что никакое ко-п
нечное пересечение П Pi не пусто, следует, что никакая конеч-
ная система множеств Gt = Т\ Fi не покрывает все Т. Но тогда и все Ga не образуют покрытия (компактность!), а это значит, что nFa#=0. Итак, если Т компактно, то в нем условие (/?) выполнено. Обратно, пусть Т удовлетворяет условию (R) и {Ga} — открытое покрытие пространства Т. Положив Fa = T\GV, получим, что ПЕа = 0, откуда следует (условие (/?)), что система {Еа} не может быть центрированной, т. е. существуют та-п
кие F\, ..., Fn, что П Е;=0. Но тогда соответствующие t=i
Gi = T\F{ образуют конечное подпокрытие покрытия {Ga}. Итак, условие (R) равносильно компактности.
Установим некоторые основные свойства компактных пространств.
Теорема 2. Если Т — компактное пространство, то каждое его бесконечное подмножество имеет хотя бы одну предельную точку.
Доказательство. Если Т содержит бесконечное множество X, не имеющее ни одной предельной точки, то в нем можно взять счетное множество Xi = (xi, Хг, . •.), также не имеющее ни одной предельной точки. Но тогда множества Хп — = (хп, Xn+i, ...) образуют центрированную систему замкнутых-множеств в Т, имеющую пустое пересечение, т. е. Т не компактно.
Теорема 3. Замкнутое подмножество компактного пространства компактно.
100
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
Доказательство. Пусть F — замкнутое подмножество компактного пространства Т и {Fa} — произвольная центрированная система замкнутых подмножеств подпространства FcT. Тогда каждое Fa замкнуто и в Т, т. е. {Fa}—центрированная система замкнутых множеств в Т. Следовательно,
В силу теоремы 1 отсюда следует компактность F.
Поскольку подпространство хаусдорфова пространства само хаусдорфово, отсюда получаем:
Следствие. Замкнутое подмножество компакта есть компакт.
Теорема 4. Компакт замкнут в любом содержащем его хаусдорфовом пространстве.
Доказательство. Пусть К— компактное множество в хаусдорфовом пространстве Т и пусть у ф К. Тогда для любой точки х е К существуют окрестность Ux точки х и окрестность Vx точки у такие, что
UxftVx = <Z).
Окрестности Ux образуют открытое покрытие множества К.. В силу компактности К из него можно выделить конечное подпокрытие Uxe Ux2, •••, Uxn- Положим
V = Vxjl Vx2 Л • • • Л Vxn.
ТогдаУ—окрестность точки у, не пересекающаяся cUXl U Ux2 U • • •	Следовательно, и значит, К замкнуто. Тео-
рема доказана.
Теоремы 3 и 4 показывают, что в классе хаусдорфовых пространств компактность есть внутреннее свойство пространства, т. е. всякий компакт остается компактом, в какое бы более широкое хаусдорфово пространство мы его ни включали.
Теорема 5. Всякий компакт представляет собой нормальное пространство.
Доказательство. Пусть X и Y — два непересекающихся замкнутых подмножества компакта К. Повторив рассуждения, проведенные в доказательстве предыдущей теоремы, легко убедиться в том, что для каждой точки у е Y существуют такая ее окрестность Uv и такое открытое множество Оу зэ X, что Uy Л Л Оу — 0. Тем самым доказано, что всякий компакт регулярен. Пусть теперь у пробегает множество Y. Выберем из покрытия {Uy} множества Y конечное подпокрытие UVi, ..., UVn. Тогда открытые множества
0(,) = <М ... ло,„ и 0<2>=^,и ... 1Ж„
будут удовлетворять условиям
0(|)=>Х,	и О(,)ЛО(2) = 0>
а это и означает нормальность.
§ 6]
КОМПАКТНОСТЬ
101
2.	Непрерывные отображения компактных пространств. Непрерывные отображения компактных пространств, в частности, компактов, обладают рядом интересных и важных свойств.
Теорема 6. Непрерывный образ компактного пространства есть компактное пространство.
Доказательство. Пусть X— компактное пространство и f — его непрерывное отображение в топологическое пространство Y. Рассмотрим какое-либо покрытие {Ра} образа f(X) открытыми в f(X) множествами. Положим Ua = f-1 (Va). Множества Па открыты (как прообразы открытых множеств при непрерывном отображении) и образуют покрытие пространства X. Из этого покрытия можно выбрать, в силу компактности X, конечное подпокрытие Ult U2, .... Un. Тогда множества Vb V2, ...
Vn, где Vi = f(Ui), покрывают весь образ f(X) пространства X.
Теорема 7. Взаимно однозначное и непрерывное отображение ср компакта X на хаусдорфово пространство Y есть гомеоморфизм.
Доказательство. Нужно показать, что из условий теоремы вытекает непрерывность обратного отображения ф-1. Пусть F — замкнутое множество в X и Р = ф(₽)—его образ в У. В силу предыдущей теоремы Р — компакт и, следовательно, Р замкнуто в У. Таким образом, прообраз при отображении Ф-1 всякого замкнутого множества F <^Х замкнут. А это и означает непрерывность отображения ф~*.
3.	Непрерывные и полунепрерывные функции на компактных пространствах. В предыдущем пункте речь шла о непрерывных отображениях компакта в хаусдорфово пространство. Частным случаем таких отображений являются отображения компактов в числовую прямую, т. е. числовые функции на компактах. Для таких функций сохраняются основные свойства функций на отрезке, известные из анализа.
Теорема 8. Пусть Т — компактное пространство и f — непрерывная на нем числовая функция. Тогда f ограничена на Т и достигает на Т верхней и нижней граней.
Доказательство. Непрерывная функция есть непрерывное отображение Т в числовую прямую R1. Образ Т в R1 в силу общей теоремы 6 компактен. Но, как читателю известно из курса анализа (см. также п. 2 § 7), компактное подмножество числовой прямой замкнуто и ограничено и потому не только имеет конечные верхнюю и нижнюю грани, но и содержит эти трани. Теорема доказана.
Упражнение. Пусть К — компактное метрическое пространство и А — такое отображение К в себя, что р(Ах,Ау) <р(х,у) при х у. Показать,, что отображение А имеет в К единственную неподвижную точку.
102
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
Утверждения последней теоремы допускают обобщение и на более широкий класс функций, а именно, на так называемые полунепрерывные функции»
Функция f(x) называется полунепрерывной снизу (сверху) в точке х0, если для любого в > 0 существует такая окрестность точки х0, в которой f(x) > f(xo) — е (соответственно, f(x) < f(x0) + g).
Например, функция «целая часть от х», f(x) = Е(х) полунепрерывна сверху. Если увеличить (уменьшить) значение f(х0) непрерывной функции в какой-либо одной точке х0, то мы получим полунепрерывную сверху (снизу) функцию. Если f(x) полунепрерывна сверху, то — f(x) полунепрерывна снизу. Эти два замечания позволяют сразу построить большое число примеров полунепрерывных функций.
При изучении свойств полунепрерывности действительных функций удобно-допускать для них бесконечные значения. Если f(xQ) = —ос, то функцию f будем считать полунепрерывной снизу в точке х0; если же для любого h > О' имеется окрестность точки х0. в которой f(x) <_ —h, то будем считать, что-функция f полунепрерывна и сверху в точке х0.
Если f(x0) — +<», то функцию f будем считать полунепрерывной сверху в х0; если же для любого h > 0 имеется окрестность точки х0, в которой f(x) > Л, то будем считать, что функция f полунепрерывна и снизу в точке х0.
Пусть f(x)—действительная функция на метрическом пространстве R. Верхним пределом f(xQ) функции f(x) в точке Хо называется величина (конечная или бесконечная) lim [sup f(x)J. Нижний предел f(x0) определяется е->0	(х0. е)	—
аналогично с заменой верхней грани на нижнюю. Разность оэ/(х0) —J(x0) — — f(xo) (если она имеет смысл, т. е. если числа f(x0) и f(x0) не равны бесконечности одного знака) называется колебанием функции f(x) в точке х0. Легко видеть, что для непрерывности f(x) в точке х0 необходимо и достаточно,, чтобы ы[(х0) = 0, т. е. чтобы —оо < f(x0) = f (х0) < оо.
Для любой функции f(x), заданной на метрическом пространстве, функция f(x) полунепрерывна сверху, а функция Цх) полунепрерывна снизу. Это-легко вытекает из определения верхнего и нижнего пределов.
Рассмотрим метрическое пространство М, элементами х которого служат все действительные ограниченные функции <р(/), заданные на сегменте [а, £>].. Метрику в М зададим равенством
р (х,у) = р (<р, ф) = sup |ф(/) — ф(/)|.
Функции на М, как это обычно делается, будем называть функционалами^ чтобы отличать их от функций <р(/) —элементов М.
Рассмотрим один важный пример полунепрерывного функционала.
Определим длину кривой у — f (х) (а	х Ь) как функционал
Lba (f) = sup £ V(x(.-xi_1)^ + (f(x1.)-f(x/_1))^ i=l
где верхняя грань (которая может быть равна -|-оо) берется по всевозможным разбиениям отрезка [а, д]. Этот функционал определен на всем пространстве М. Для непрерывных функций он совпадает со значением предела
max lx11? I->0 Д	+
Наконец, для функций с непрерывной производной его можно записать в виде
ъ ___________
§ V1 + № (я) dx.
а
^g]	КОМПАКТНОСТЬ'	103
функционал Lba (f) полунепрерывен снизу в Af, что легко следует из его •определения.
На полунепрерывные функции обобщается установленная выше теорема.
Теорема 8а. Полунепрерывная снизу (сверху) конечная функция на компактном Т^-пространстве Т ограничена снизу (сверху).
Действительно, допустим, что inf f(x) ——оо. Тогда существует такая последовательность {хп}, что f(xn) < —п. Поскольку пространство Т компактно, его бесконечное подмножество {х„} имеет (в силу теоремы 2) хотя бы одну предельную точку х0. По предположению, функция f конечная и полунепрерывна снизу; поэтому найдется такая окрестность U точки хо, что f(x) > f(xo) — 1 при х е U. Но тогда окрестность U может содержать лишь конечное число точек множества {х„}, а это противоречит тому, что точка Хо—предельная для этого множества.
Аналогично доказывается теорема и для случая полунепрерывной сверху функции.
Теорема 86. Полунепрерывная снизу (сверху) конечная функция на компактном Т^пространстве Т достигает своей нижней (верхней) грани.
Пусть функция f(x) полунепрерывна снизу. Тогда по теореме 8а она имеет конечную нижнюю грань, и существует такая последовательность {хп}, •что f (х„) С inf f(x) + \/п.
Поскольку Т компактно, множество {х„} имеет предельную точку хо. Если бы было f(x0) > inf f, то, в силу полунепрерывности функции f снизу, нашлись бы такая окрестность U точки х0 и такое б > 0, что f(x) > inf f + 4- 6 при х е U. Но тогда окрестность U не могла бы содержать никакого бесконечного подмножества множества {х„}. Следовательно, f (х0) = inf f, что и требовалось доказать.
4.	Счетная компактность. Введем следующее определение.
Определение. Пространство Т называется счетно-компактным, если каждое его бесконечное подмножество имеет хотя бы одну предельную точку.
Доказанная в п. 1 теорема 2 означает, что всякое компактное пространство счетно-компактно. Обратное, вообще говоря, неверно. Вот «традиционный» пример счетно-компактного, но не компактного пространства. Рассмотрим множество X всех порядковых чисел а, меньших первого несчетного порядкового числа <£>1. Назовем интервалом (а, 0) в X совокупность всех порядковых чисел у, удовлетворяющих неравенствам а < у < 0. Открытым множеством в X назовем объединение произвольного числа интервалов. Легко проверить, что построенное пространство счетно-компактно, но не компактно.
Соотношение между понятиями компактности и счетной компактности становится ясным из следующей теоремы.
Теорема 9. Для того чтобы топологическое пространство было счетно-компактным, необходимо и достаточно любое из следующих двух условий:
1) Каждое счетное открытое покрытие пространства Т содержит конечное подпокрытие.
2) Каждая счетная центрированная система замкнутых множеств в Т имеет непустое пересечение.
104
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. IT
Доказательство. Равносильность условий 1) и 2) непосредственно следует из соотношений двойственности. Далее, если Т не счетно-компактно, то, повторив рассуждения, проведенные при доказательстве теоремы 2, мы получим, что в Т существует счетная центрированная система замкнутых множеств с пустым пересечением. Тем самым достаточность условия 2) (а значит, и 1)) установлена. Докажем необходимость условия 2). Пусть Т счетно-компактно и {Fn}— счетная центрированная система замкнутых множеств в Т. Покажем, что П fn^=0. Пусть п	п
Фп= П Pk- Ясно, что все Фп замкнуты, не пусты (в силу цен-k=l
трированности {fn}) и образуют невозрастающую систему Ф1гдФ2гд ..., и что П = П Л>- Возможны два случая:
п	п
1) Начиная с некоторого номера п0
Фп»== Фпо+1 == • • •
Тогда, очевидно, Q Ф„ = фПо =/= 0. п
2) Среди Фп имеется бесконечно много попарно различных. При этом достаточно рассмотреть случай, когда все Фп различны между собой. Пусть
Последовательность {хп} представляет собой бесконечное множество различных точек из Г; в силу счетной компактности Т она должна иметь хотя бы одну предельную точку, скажем, х0. Так как Фп содержит все точки хп, xn+i.....то х0 — предель-
ная точка для Фп и в силу замкнутости Фп, хоефп. Следовательно, П фпэхо> т. е. П ф„#= 0. п	п
Таким образом, и компактные и счетно-компактные пространства характеризуются «поведением» своих открытых покрытий. И в том, и в другом случае из открытого покрытия можно выбрать конечное, но в первом случае речь идет о любых покрытиях, а во втором — только о счетных.
Хотя в общем случае из счетной компактности компактность не вытекает, имеет место следующий факт.
Теорема 10. Для пространств со счетной базой понятия компактности и счетной компактности совпадают.
Действительно, из любого открытого покрытия пространства Т, имеющего счетную базу, можно выбрать счетное подпокрытие (теорема 5 § 5). Если же Т к тому же и счетно-компактно, то из этого последнего можно в силу предыдущей теоремы выбрать конечное подпокрытие. Тем самым устанавливается, что Г компактно.
КОМПАКТНОСТЬ'
105
$ 6]
Замечание. Понятие счетной компактности топологиче-ского пространства оказалось на самом деле (в противовес компактности) не очень удачным и естественным. Оно возникло так «казать «по инерции». Дело в том, что для метрических пространств (как и для пространств со счетной базой) эти два понятия совпадают (это будет показано в следующем параграфе). При этом для метрических пространств понятие компактности было поначалу дано именно как наличие у каждого бесконечного подмножества предельной точки, т. е. как определение •счетной компактности. «Автоматический» перенос этого определения с метрического случая на топологический и привел к понятию счетно-компактного топологического пространства. Иногда в литературе, особенно более старой, термин «компактность» понимается как «счетная компактность», а топологическое пространство, компактное в нашей терминологии, т. е. такое, из каждого открытого покрытия которого можно выделить конечное подпокрытие, называется бикомпактным. При этом компактное хаусдорфово пространство (т. е. компакт) именуется бикомпактом, а термин «компакт» резервируется для обозначения метрического компактного пространства. Мы будем придерживаться тех терминов (компактность, счетная компактность), которые введены выше; при этом мы и компактные метрические пространства также будем называть компактами, а в тех случаях, когда наличие метрики желательно специально подчеркнуть, — «метрическими компактами».
5. Предкомпактные множества. Если множество М, лежащее в некотором хаусдорфовом пространстве Т, не замкнуто в Т, то М не может быть компактно. Например, ни одно из незамкнутых подмножеств числовой прямой не является компактом. Может, однако, оказаться, что замыкание [М] такого множества М в Т уже обладает свойством компактности. Например, этому условию удовлетворяет любое ограниченное подмножество на числовой прямой или в n-мерном пространстве. Введем следующее определение.
Определение. Множество М, лежащее в некотором топологическом пространстве Т, называется предкомпактным (или компактным относительно Т), если его замыкание в Т компактно. Аналогично, М называется счетно-предкомпактным в Т, если всякое бесконечное подмножество A cz М имеет хотя бы одну предельную точку (которая может принадлежать, но может и не принадлежать М).
Понятие предкомпактности (в отличие от компактности) связано, очевидно, с тем пространством Т, в котором мы данное множество рассматриваем. Например, множество рациональных точек в интервале (0, 1) предкомпактно, если его рассматривать как подмножество числовой прямой, но оно не будет предком-
106
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. IF
пактным как подмножество пространства всех рациональных, чисел.
Понятие предкомпактности наиболее существенно в случае метрических пространств, о чем будет идти речь в следующем параграфе.
§ 7.	Компактность в метрических пространствах
1.	Полная ограниченность. Поскольку метрические пространства представляют собой частный случай топологических, на них распространяются те определения и факты, которые была изложены в предыдущем параграфе. В метрическом случае компактность тесно связана с понятием полной ограниченности, которое мы сейчас введем.
Пусть М— некоторое множество в метрическом пространстве R и е — некоторое положительное число. Множество А из R называется е-сетью для М, если для любой точки хе.М найдется хотя бы одна точка а е А, такая, что
р (х, а) е.
(Множество А не обязано содержаться в М и может даже не иметь с М ни одной общей точки, однако, имея для М некоторую е-сеть А, можно построить 2е-сеть В с<М.)
Н_апример, целочисленные точки образуют на плоскости 1/-\/2-сеть. Множество М называется вполне ограниченным, если для него при любом е > 0 существует конечная е-сеть. Ясно,, что вполне ограниченное множество обязательно ограничено, как сумма конечного числа ограниченных множеств. Обратное, вообще говоря, неверно, как показывает приводимый ниже пример 2.
Часто бывает полезно следующее очевидное замечание: если множество М вполне ограничено, то его замыкание [М] также-вполне ограничено.
Из определения полной ограниченности сразу следует, что если само метрическое пространство R вполне ограничено, то-оно сепарабельно. Действительно, построим для каждого п в R конечную 1/п-сеть. Сумма их по всем п представляет собой счетное всюду плотное в R множество. Поскольку сепарабельное метрическое пространство имеет счетную базу (теорема 4-§ 5), мы получаем, что всякое вполне ограниченное метрическое пространство имеет счетную базу.
Примеры. 1. В n-мерном евклидовом пространстве полная ограниченность совпадает с обычной ограниченностью, т. е. с возможностью заключить данное множество в достаточно большой куб. Действительно, если такой куб разбить на кубики с ребром е, то вершины этих кубиков будут
7]	КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ	107
образовывать конечную (V^/2) е-сеть в исходном кубе, а значит, и подавно, в любом множестве, лежащем внутри этого куба.
2.	Единичная сфера S в пространстве 12 дает нам пример ограниченного, но не вполне ограниченного множества. Действительно, рассмотрим в S точки вида
t?i =(1, 0, 0....0, 0,	...),
е2 = (0, 1,0.....0, 0,	...),
е„ = (0, 0, 0......1,0,	...).
Расстояние между любыми двумя такими точками еп и ет <(п =/= т) равно л]2. Отсюда видно, что в S не может быть конечной е-сети ни при каком е <V2/2.
3.	Рассмотрим в /2 множество П точек х = (хь х2.хп ...),
подчиненных условиям
|Х.1<1, I Х21< 1/2....|х„|<1/2п-1, ...
Это множество называется основным параллелепипедом («гильбертовым кирпичом») пространства /2. Оно служит примером бесконечномерного вполне ограниченного множества. Для доказательства его полной ограниченности поступим следующим образом.
Пусть в>0 задано. Выберем п так, что 1/2п-1 < в/2. Каждой точке
х = (хь х2....*„,.•)	(I)
из П сопоставим точку
x* = (xi, х2...хп, 0, 0, ...)	(2)
из того же множества. При этом
р(*,Л = д/	<|.
* к=п+\	* fe=n
Множество П* точек вида (2) из П вполне ограничено (как ограниченное множество в n-мерном пространстве). Выберем в П* конечную в/2-сеть. Ясно, что она будет в то же время с-сетью во всем П.
2.	Компактность и полная ограниченность.
Теорема 1. Если метрическое пространство R счетно-компактно, то оно вполне ограничено.
Доказательство. Предположим, что R не вполне ограничено. Это значит, что при некотором ео > 0 в R не существует конечной ео-сети. Возьмем в R произвольную точку
108
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. и
В /? найдется хотя бы одна такая точка, скажем, а2, что р(а1,аг)>ео (иначе точка си была бы ео-сетью для /?). Далее, в R найдется такая точка а3, что р(а1,аз)>ео и р(а2, «з) > еэ, иначе пара точек аь а2 была бы ео-сетью. Если точки aj, ..., afi. уже фиксированы, то выберем точку йа+1 е R так, что р(аг-, aft+I) > е0, i = 1, 2, ..., k.
Это построение дает нам бесконечную последовательность аь а2.....которая не имеет ни одной предельной точки, по-
скольку р(а{, aj) > ео при i /. Но тогда /? не счетно-компактно. Теорема доказана.
Итак, мы показали, что для метрических пространств счетная компактность влечет полную ограниченность, которая в свою очередь влечет наличие счетной базы.
В силу теоремы 10 § 6 отсюда получаем такой важный результат.
Следствие. Всякое счетно-компактное метрическое пространство компактно.
Мы показали, что полная ограниченность есть необходимое условие компактности метрического пространства. Это условие не достаточно; например, совокупность рациональных точек отрезка [0, 1] с обычным определением расстояния между ними есть вполне ограниченное, но не компактное пространство: последовательность точек этого пространства
0; 0,4; 0,41; 0,414; 0,4142; ...,
т. е. последовательность десятичных приближений числа V2 — 1, не имеет в нем предельной точки. Однако имеет место следующая теорема.
Теорема 2. Для того чтобы метрическое пространство R было компактом, необходимо и достаточно, чтобы оно было одновременно:
1) вполне ограниченным,
2) полным.
Доказательство. Необходимость полной ограниченности уже отмечалась. Необходимость полноты очевидна: в самом деле, если {хп} — фундаментальная последовательность в R, не имеющая предела, то эта последовательность не имеет в R ни одной предельной точки.
Покажем теперь, что если R вполне ограничено и полно, то оно компактно. В силу следствия из теоремы 1 для этого достаточно установить, что R счетно-компактно, т. е. что всякая последовательность {хп} точек из R имеет хотя бы одну предельную точку.
Построим вокруг каждой из точек, образующих 1-сеть в R„ замкнутый шар радиуса 1. Так как эти шары покрывают все Rr а число их конечно, то по крайней мере один из них, назовем
*7]
КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ
109
его Bi, содержит некоторую бесконечную подпоследовательность х*0,	х^, ... последовательности {хп}. Далее, выберем
^2-сеть в В\ и вокруг каждой из точек этой сети построим замкнутый шар радиуса 1/2. По крайней мере один из этих шаров, назовем его В2, содержит бесконечную подпоследовательность х)Ч х®, ... последовательности {х^}. Далее, найдем замкнутый шар Вз с центром в В2 радиуса 1/4, содержащий бесконечную подпоследовательность х)3), ... х@\ ... последовательности {х®} и т. д. Рассмотрим теперь наряду с каждым шаром Вп замкнутый шар Ап с тем же центром, но в два раза большего радиуса. Легко видеть, что шары Ап вложены друг в друга.
оо
В силу полноты пространства /? пересечение П Ап не пусто и п==1
состоит из одной точки Хо- Эта точка — предельная для исходной последовательности {хп}, так как каждая ее окрестность содержит некоторый шар Вь, а значит, и бесконечную подпоследовательность {х^5} последовательности {хп}.
3.	Предкомпактные подмножества в метрических пространствах. Понятие предкомпактности, введенное нами в предыдущем параграфе для подмножеств произвольного топологического пространства, применимо, в частности, к подмножествам метрического пространства. При этом, очевидно, понятие счетной предкомпактности совпадает здесь с понятием предкомпактности. Отметим следующий простой, но важный факт.
Теорема 3. Для того чтобы множество М, лежащее в полном метрическом пространстве R, было пр ед компактным, необходимо и достаточно, чтобы оно было вполне ограниченным.
Доказательство сразу следует из теоремы 2 и того очевидного факта, что замкнутое подмножество полного метрического пространства само полно.
Значение этой теоремы состоит в том, что, как правило, легче установить полную ограниченность того или иного множества, чем непосредственно доказать его предкомпактность. Вместе с тем для применений в анализе важна обычно предкомпактность.
4.	Теорема Арцела. Вопрос о компактности того или иного множества в метрическом пространстве — довольно распространенная в анализе задача. Между тем, попытка непосредственно применить теорему 2 сталкивается с трудностями. Поэтому для множеств в конкретных пространствах полезно дать специальные критерии компактности (или предкомпактности), более удобные на практике.
В n-мерном евклидовом пространстве предкомпактность множества равносильна, как мы видели, его ограниченности.
по
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. II
Однако для более общих метрических пространств это уже неверно.
Одним из важнейших в анализе метрических пространств является пространство С[а, &]. Для его подмножеств важный и часто используемый критерий предкомпактности доставляет так называемая теорема Арцела. Чтобы ее сформулировать, нам понадобятся следующие понятия.
Семейство Ф функций ср, определенных на некотором отрезке [а, Ь], называется равномерно ограниченным, если существует такое число К, что
I Ф W I < К
для всех х е [а, Ь] и всех (ре Ф.
Семейство Ф — {ср} называется равностепенно непрерывным, если для каждого е > 0 найдется такое 6 > 0, что
|ф(Х1) —ф(х2) I < в
для всех и х2 из [а, Ь] таких, что p(%i,x2)< 6, и для всех <р е Ф.
Теорема 4 (Арцела). Для того чтобы семейство Ф непрерывных функций, определенных на отрезке [а, &], было предкомпактно в С[а, &], необходимо и достаточно, чтобы это семейство было равномерно ограничено и равностепенно непрерывно.
Доказательство. Необходимость. Пусть семейство Ф предкомпактно в С [a, ft]. Тогда по предыдущей теореме для каждого положительного е в семействе Ф существует конечная е/3-сеть <pi, ср2, .... ерь. Каждая из функций ср,, как непрерывная функция на отрезке, ограничена: |ср,(х) | Ki.
Положим К = max Kt + е/3. По определению е/3-сети, для всякого ср е Ф имеем, хотя бы для одного ср,,
Р (ф, Фс) = max I ф (х) — Ф; (*) I е/3. X
Следовательно,
IФ (*) КI Фс W I + у	+ у < К.
Итак, Ф равномерно ограничено.
Далее, так как каждая из функций ср,, образующих е/3-сеть, непрерывна, а следовательно, и равномерно непрерывна на [а, &], то для данного е/3 существует такое 6,, что
I Ф> (*i) — Фс (*2) I < е/3,
если |%1 — х2| < 6,-.
Положим 6 = minfi;. Для произвольной функции среФ выберем ф(- так, чтобы р (ср, ср() < е/3; тогда при | х{ — х21 < 6

КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ
111
будем иметь
| <Р1 (*1) — ф(х2) KI ф(*1) — Ф« (*1) 1 + 1 Ф/ (*1) — Ф/(х2)1 +
+ I Ф« (х2) — Ф (х2) I < е/3 + е/3 + е/3 = е.
Равностепенная непрерывность Ф также доказана.
Достаточность. Пусть Ф — равномерно ограниченное и равностепенно непрерывное семейство функций. Согласно теореме 3 мы установим его предкомпактность в С[а, ft], если покажем, что при любом е > 0 для него в С[а, ft] существует конечная е-сеть. Пусть |ф(х) | К для всех среФ и пусть 6 > О выбрано так, что |ф(Х]) —ф(х2) | < е/5 при |Х] — х2|<6 для всех (р еФ. Разобьем отрезок [a, ft] на оси х точками х0 = = й] < Xi < х2 < ... < хп = ft на промежутки длины меньше б и проведем через эти точки вертикальные прямые. Отрезок [— К, /С] на оси у разобьем точками г/о = —К < У\ < */2 < ... ... < Ут = К на промежутки длины меньше е/5 и проведем через точки деления горизонтальные прямые. Таким образом, прямоугольник а х ft, —К у К разобьется на ячейки с горизонтальной стороной меньше 6 и вертикальной стороной меньше е/5. Сопоставим теперь каждой функции ср е Ф ломаную ф(х) с вершинами в точках (хь, yi), т. е. в узлах построенной сетки, и уклоняющуюся в точках х& от функции ф(х) меньше чем на е/5 (существование такой ломаной очевидно).
Поскольку по построению | ср (xk) — ф(xft) | < е/5, |cp(xft+1) — — ф (xft+1) | < е/5, | ф (xk) — ф (xft+1) | < е/5, то
I Ф (*.<) —Ф<Хл+1)1 < Зе/5.
Так как между точками xh и xh+i функция ф(х) линейна, то I ф (**) — Ф (х) I < Зе/5 для всех хе[хьхь]].
Пусть теперь х — произвольная точка отрезка [a, ft] и Xk— ближайшая к х слева из выбранных нами точек деления. Тогда | Ф (х) — ф (х) К | Ф (х) — Ф (xft) | +
+1 Ф М — Ф (xk) | +1 ф (xfe) — ф (х) К е.
Следовательно, ломаные ф(х) по отношению к Ф образуют е-сеть. Число их очевидно, конечно; таким образом, Ф вполне ограничено. Теорема полностью доказана.
5.	Теорема Пеано. Покажем, как применяется теорема Арцела на примере следующей теоремы существования для обыкновенных дифференциальных уравнений с непрерывной правой частью.
Теорема 5 (Пеано). Пусть дано дифференциальное уравнение
(3>
Если функция f непрерывна в некоторой ограниченной замкнутой области G, то через каждую внутреннюю точку (х0, t/о) этой области проходит хотя бы одна интегральная кривая данного уравнения.
112
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. П
Доказательство. Так как функция f непрерывна в ограниченной замкнутой области, то она ограничена: |f(x, у) | < М = const.
Проведем через точку (х0, у0) прямые с угловыми коэффициентами М н —М. Проведем, далее, вертикальные прямые х — а и х — Ь так, чтобы отсекаемые ими два треугольника с общей вершиной (х0, уо) целиком лежали внутри области G.
Эта пара треугольников образует замкнутое множество Д.
Построим теперь для данного уравнения так называемые ломаные Эйлера следующим образом: проведем из точки (х0, Уо) прямую с угловым коэффициентом f(x0, у0). На этой прямой возьмем некоторую точку (хь yt) и проведем через нее прямую с угловым коэффициентом f(xi,yt). На этой прямой возьмем точку (х2,у2), проведем через нее прямую с угловым коэффициентом f(x2, у2) и т. д. Рассмотрим теперь последовательность ломаных Эйлера £i, L2, ..., Ln...проходящих через точку (х0, уо), таких, что длина наи-
большего из звеньев линии £л стремится к нулю при fe->-oo. Пусть <р*— функция, график которой есть линия Li. Функции <pi, ф2, .... фл, ... обладают следующими свойствами:
1)	они определены на одном и том же отрезке [а, 6],
2)	они равномерно ограничены,
3)	они равностепенно непрерывны.
На основании теоремы Арцела из последовательности {<р&} можно выбрать равномерно сходящуюся последовательность. Пусть это будет подпоследовательность <р(1), <р(2), ..., ф<*>, ...
Положим ф(х) = lim ф<*>(х) при k->-oo. Ясно, что ф(х0) = Уо- Остается проверить, что <р удовлетворяет на отрезке [a, Z>] данному дифференциальному уравнению. Для этого требуется показать, что для любого е > О
I <р (х") — ф (х')	, I
|	f (х', <р (х')) j < е,
если только величина \х" — х'| достаточно мала. Для доказательства этого в свою очередь нужно установить, что при достаточно больших k
ф<*>(х")-ф<*>(х') х" - х'
f (х', Ф(А) (х'У) | < е,
если только разность \х" — х'\ достаточно мала.
Так как f непрерывна в области G, то для любого в > 0 найдется такое 7] > 0, что
если
f (х', y') — e<f (х, у) < f (*', у') + е (/ = ф (*')),
|х —х'|<2п и [у — у' | < 4А4-П-
Совокупность точек (х, у) s G, удовлетворяющих этим двум неравенствам, представляет собой некоторый прямоугольник Q. Пусть теперь К настолько велико, что для всех k > К
| Ф (х) — ф<4) (х) | < 2Af-q
и все звенья ломаной Lk имеют длину меньше Тогда при |х — х'\ < 2т| все ломаные Эйлера ф^), для которых k > К, целиком лежат внутри Q.
Далее, пусть (а0, Ьо), (аь bt), ..., (an+i,6„+i)—вершины ломаной £*, причем
а0 < х' < а, < а2 < ... < ап < х" < an+i
J 7]	КОМПАКТНОСТЬ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ	ИЗ
(мы для определенности считаем х" > х'\ аналогично рассматривается случай х" < х'). Тогда для соответствующей функции <р<*> имеем
<р<*) (aj — <р<*> (х') = f (а0, Ьо) (а, — х'),
<P(*)(fli+l)-<P(*)(e/) = 4ar М(а/+1-“;)- « = 1. 2........п-1,
<p(ft) (х") _ ф(*) (а„) = f (ап, Ьп) (х" — ап).
Отсюда при |х" — х'\ < Т| получаем
[/ (*'. У’) ~ е] (щ — х') < <р<*> (ai) —	(*') < [f (х',	у') + в] (aL — х'),
I/ (*'> у') - е1 («*+1 - ад < <₽(ft) (а/+1) -	(“/) <
< [f (x', у') + e] (a/ + 1 — az);	i = 1, ..n	—	1,
If (x', y') — e] (x" — an) < <p<*> (x") — <p<fe> (a„) < [/ (x',	y') + g]	(x"	—	an).
Суммируя эти неравенства, находим
[/ (х', у') — е] (х" — х') <	(х") - <р<*> (х') < [f (х', у') + в] (х" — х'),
что и требовалось доказать.
Разные подпоследовательности ломаных Эйлера могут сходиться к разным решениям уравнения (3). Поэтому решение уравнения у' — f(x, у), проходящее через точку (х0, уо), вообще говоря, не единственно.
6. Равномерная непрерывность. Непрерывные отображения метрических компактов. Для отображений метрического пространства в метрическое пространство, в частности, для числовых функций на метрических пространствах, наряду с понятием непрерывности имеет смысл важное для анализа понятие равномерной непрерывности: отображение F метрического пространства X в метрическое пространство У называется равномерно непрерывным, если для каждого е > 0 найдется такое б ~> О, что p2(F(X1), F(x2))<e как только pi(хь х2) < б (здесь р( — расстояние в X, а.р2— расстояние в У), причем б зависит только от е, но не от х\ и х2.
Упражнение. Показать, что числовая функция F(x) = supx(t) равно-a<t <(>
мерно непрерывна на пространстве С[а, &].
Для непрерывных отображений метрических компактов имеет место следующая теорема, обобщающая хорошо известную из элементарного курса анализа теорему о непрерывных функциях на отрезке.
Теорема 6. Непрерывное отображение метрического компакта в метрическое пространство равномерно непрерывно.
Доказательство. Пусть отображение F метрического компакта К в метрическое пространство М непрерывно, но не равномерно непрерывно. Это значит, что для -некоторого е > О и каждого натурального п найдутся в К такие точки хп и х'п, что ₽i(xn’<)<V« и в то же время p2(F(x„), F(x'n)^e (р, — расстояние в К, рг — расстояние в Л4). Из последовательности
114
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. и
{хп} в силу компактности К можно выбрать подпоследовательность {xnk}, сходящуюся к некоторой точке х <= К. Тогда и {х^у сходится к х; но при этом для каждого k должно быть выполнено хотя бы одно из неравенств
р2 (F (х), F (х„	> е/2; р2 (F (х), F (xJJ) > е/2,
что противоречит непрерывности отображения F в точке х.
7. Обобщенная теорема Арцела. Пусть X и У— два метрических компакта и пусть Cxy— множество всех непрерывных отображений f компакта X в У. Введем в Cxy расстояние при помощи формулы
p(f, g) = sup p(f (х), g(x)).
X E A
Легко проверить, что таким образом Cxy превращается в метрическое пространство.
Теорема 7 (обобщенная теорема Арцела). Для. предкомпактности множества D cz Cxy необходимо и достаточно, чтобы входящие в D функции f были равностепенно непрерывны.
Последнее означает, что для любого е > 0 должно существовать такое б > 0, что из
Р« х")<6	(4)
вытекает
p(f(x'), f (%"))< в,	(5)
каковы бы ни были f из D и х' и х" из X.
Доказательство. Необходимость доказывается так же, как и в теореме 4.
Докажем достаточность. Для этого погрузим Cxy в пространство Mxy всех отображений компакта X в компакт У с той же самой метрикой
p(f, g) = sup р (/ (х), g(x)), xsX
которая была введена в С.уу, и докажем предкомпактность множества D в Mxy- Так как Cxy замкнуто в Mxy ’), то из предкомпактности множества D в Л4уу следует его предкомпактность в Cxy-
Зададим е > 0 произвольно и выберем б так, чтобы из (4) вытекало (5) для всех f из D и всех х', х" из X. Легко видеть, что X можно представить как сумму конечного числа непересе-кающихся множеств £\, таких, что из х', х" е следует
') Поскольку предел равномерно сходящейся последовательности непрерывных отображений есть также непрерывное отображение. Указанное предложение представляет собой непосредственное обобщение известной теоремы анализа и доказывается так же, как и эта теорема.
< 8]
НЕПРЕРЫВНЫЕ КРИВЫЕ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ
115
р(х', х") < 6. Действительно, для этого достаточно выбрать точки Xt, х2, .... хп так, чтобы они образовали б/2-сеть в X и положить, например,
Et = В (xt, 6/2) \ В (xh 6/2),
где В(Хг, 6/2)— шар радиуса 6/2 с центром х;.
Рассмотрим теперь в компакте Y некоторую конечную е-сеть yi, Уз,  , Ут, и пусть L — совокупность функций g(x), принимающих на множествах Ei значения Число таких функций, очевидно, конечно. Покажем, что они образуют 2е-сеть по отношению к D в MXy- Действительно, пусть f D. Для всякой точки Xi из Xi, ..., хп найдется такая точка у, из у\, ..., ут, что p{f{Xi),y^< е.
Пусть функция g <= L выбрана так, что g(xi) = у>. Тогда р( f (х), g (х)) < р (/ (х), f (х()) + р (/ (хх-), g (xf)) + р (g (xf), g (x)) < 2e, если i выбрано так, что x Ej.
Отсюда вытекает, что конечное множество L действительно есть 2е-сеть для D и, таким образом, D предкомпактно в MXy, а следовательно, и в CXY-
§ 8. Непрерывные кривые в метрических пространствах1)
Пусть задано непрерывное отображение
P = f(t)
отрезка а t sg b в метрическое пространство R. Когда t «пробегает» отрезок от а до &, соответствующая точка Р «пробегает» некоторую «непрерывную кривую» в пространстве R Нам предстоит дать строгие определения, связанные с изложенной сейчас грубой идеей. Порядок, в котором проходятся точки
Рис. 12.	Рис. 13.
Рис. 14.
кривой, существен. Одно и то же множество, изображенное на рис. 12, проходимое в направлениях, указанных на рис. 13 и 14, мы будем считать различными кривыми. В качестве другого примера рассмотрим действительную функцию, определенную на отрезке [0, 1], которая изображена на рис. 15. Она определяет «кривую», расположенную на отрезке [0, 1] оси у, отличную от этого отрезка, однократно пройденного от точки 0 до точки Ц так как отрезок [Л, В] проходится трижды (два раза вверх и один раз вниз).
') Этот параграф не связан с дальнейшим изложением. При желании читатель может его опустить.
116
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. п
Однако при одинаковом порядке прохождения точек пространства выбор «параметра» t мы будем считать несущественным. Например, функции, изображенные на рис. 15 и 16, определяют одну и ту же «кривую», расположенную на оси у, хотя значения параметра t, отвечающие какой-либо точке кривой, в случаях рис. 15 и 16 могут быть различными. Например, в случае рис. 15 точке А соответствуют иа оси t две изолированные точки, а в случае рис. 16 — одна изолированная точка н лежащий правее нее отрезок
(когда t пробегает этот отрезок, точка на кривой остается на месте). (Допускать такие отрезки неподвижности Р = f(/) будет удобно в дальнейшем при исследовании компактности систем кривых.)
Перейдем к формальным определениям. Две непрерывные функции
P = f'(t') н P = i"(t”), определенные соответственно на отрезках
а' t' Ь' и а" t" Ъ"
н принимающие значения в метрическом пространстве К. назовем эквивалентными, если существуют две непрерывные неубывающие функции
/' = ф'(0 н =
определенные на некотором отрезке
а t b
и обладающие свойствами
ф' (а) = а',	ф' (Ь) = Ь',
Ф" (а) = а",	у" (Ь) = Ь",
для всех t е [а, 6].
Легко видеть, что так введенное отношение эквивалентности рефлексивно (f эквивалентно f), симметрично (если f' эквивалентно f", то f" эквивалентно /'). Можно показать, что оно и транзитивно (из эквивалентности f' н и эквивалентности f" и f'" вытекает эквивалентность [' и" f'"). Поэтому все непрерывные функции рассматриваемого типа разбиваются на классы функций, эквивалентных между собой. Каждый такой класс и определяет непрерывную кривую в пространстве R.
Для любой функции Р = определенной на каком-либо отрезке [а', Ь'], найдется эквивалентная ей функция, определенная на отрезке [а", Ь"] =
НЕПРЕРЫВНЫЕ КРИВЫЕ В МЕТРИЧЕСКИХ ПРОСТРАНСТВАХ
11?
»«
ев [0, !]• Действительно достаточно положить ')
i' = <р' (/) = (Ь' — a') i + a', i" — q>" (/) = t.
Таким образом, всякую кривую можно предполагать заданной параметриче ски при помощи функции, определенной на отрезке [0, 1].
Поэтому целесообразно ввести в рассмотрение пространство Ci, r непрерывных отображений f отрезка I = [0, 1] в пространство R с метрикой
Р (Л g) = supp(f (0,5(0)-
t
Будем считать, что последовательность кривых Llt L2, ..., Ln, .. сходится к кривой L, если кривые Ln можно параметрически представить в виде
Р =	0</<1,
а кривую L — в виде
P = f(t),	1,
так что p(f, fn) ->0 при оо.
Применяя обобщенную теорему Арцела (теорема 7 § 7), легко доказать следующую теорему.
Теорема 1. Если последовательность кривых L\, L2, ..., Ln..........ле-
жащих в компакте К, можно представить параметрически при помощи равностепенно непрерывных функций на отрезке [0, 1], то из нее можно выделить сходящуюся подпоследовательность.
Определим теперь длину кривой, заданной параметрически функцией
P = f(t),
как верхнюю грань сумм вида п
<=i
где точки Н подчинены лишь условиям
И “ ^0 Н ••• tl •••	~
Легко видеть, что длина кривой ие зависит от выбора ее параметрического представления. Если ограничиться параметрическими представлениями посредством функций, заданных на отрезке [0, 1], то легко доказать, что длина кривой есть полунепрерывный снизу функционал от f (в пространстве С/, л). На геометрическом языке этот результат можно выразить в виде следующей теоремы о полунепрерывиости.
Теорема 2. Если последовательность кривых Ln сходится к кривой L, то длина кривой L не больше нижнего предела длин кривых Ln.
Расмотрим теперь специально кривые конечной длины. Пусть-кривая определена параметрически функцией
P = f(t),
Функция f, рассматриваемая лишь на отрезке [a, Т], где а Т Ь, определяет «начальный отрезок» кривой от точки Ра = f(a) до точки Рт — f(T). Пусть s = ф(Т) —его длина. Легко устанавливается, что
Р = g(«) = f [ф~‘ («)]
’) Мы считаем, что всегда а < Ь. Однако мы не исключаем «кривых», которые состоят из одной-единствеииой точки и получаются, если на [а, Ь] функция f(t) постоянна. Это тоже удобно для дальнейшего.
118
МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. П
есть новое параметрическое представление той же кривой. При этом s пробегает отрезок 0 s S, где S — длина всей рассматриваемой кривой. Это представление удовлетворяет требованию
o(g(si), g(s2)X|s2 — Si I
(длина дуги не меньше хорды).
Переходя к отрезку [О, 1], получим параметрическое представление
P = F(-v) = g(s), т = s/S, удовлетворяющее условию Липшица
p(F(Ti), F (т2))< S | Ti — т21.
Мы видим, таким образом, что для всех кривых длины S М, где М — некоторая константа, возможно параметрическое представление равностепенно непрерывными функциями, заданными на отрезке [0, 1]. К ним, следовательно, применима теорема 1.
Покажем силу полученных общих результатов на примере доказательства следующего важного предложения.
Теорема 3. Если в компакте К две точки, А и В, можно соединить непрерывной кривой конечной длины, то среди таких кривых существует кривая наименьшей длины.
В самом деле, пусть У есть нижняя грань длин кривых, соединяющих А и В в компакте К. Пусть длины кривых Lh L2, , Ln, ..., соединяющих А и В, стремятся к У. Из последовательности Ln по теореме 1 можно выбрать сходящуюся подпоследовательность. По теореме 2 предельная кривая этой подпоследовательности не может иметь длину больше У.
Отметим, что даже в случае, когда К является замкнутой гладкой (надлежащее число раз дифференцируемой) поверхностью в евклидовом трехмерном пространстве, эта теорема не вытекает непосредственно из результатов, устанавливаемых в курсе дифференциальной геометрии, где ограничиваются обычно случаем достаточно близких друг к другу точек А и В.
Все изложенное выше приобрело бы большую прозрачность, если бы мы наделили множество всех кривых данного метрического пространства R структурой метрического пространства. Это можно сделать, определяя расстояние между кривыми Д и L2 формулой
p(Lb L2) = infpC’I, f2),
где нижняя грань берется по всем возможным парам параметрических представлений кривой Li при помощи функции Р = fi (/), 0 t I, и кривой Li при помощи функции Р = f2(t), 0 t 1.
Доказательство того, что это расстояние удовлетворяет обычным аксиомам, очень просто, за исключением одного пункта: представляет некоторые трудности доказать, что нз p(Lt,L2) == 0 вытекает тождество кривых Li и L2. Этот факт является непосредственным следствием того обстоятельства, что нижняя грань в формуле, которой мы определили расстояние p(Li, L2), достигается при надлежащем выборе параметрических представлений ft и f2. Но доказательство этого последнего утверждения тоже не очень просто,
ГЛАВА III
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА
§ 1. Линейные пространства
Понятие линейного пространства относится к числу самых основных в математике. Оно будет играть важную роль не только в этой главе, но и во всем дальнейшем изложении.
1. Определение и примеры линейных пространств.
Определение 1. Непустое множество L элементов у,, z, ... называется линейным, или векторным, пространством, если оно удовлетворяет следующим условиям:
1. Для любых двух элементов х, у <= L однозначно определен третий элемент геА, называемый их суммой и обозначаемый х + у, причем
1)	ху = ух (коммутативность),
2)	х + (у + г) = (х + у) + z (ассоциативность),
3)	в L существует такой элемент 0, что х + 0 = х для всех хе L (существование нуля),
4)	для каждого хе L существует такой элемент — х, что %+(—х) = 0 (существование противоположного элемента).
II. Для любого числа а и любого элемента xeL определен . элемент ах е L (произведение элемента х на число а), причем
1)	а(рх) = (а(3)х,
2)	1-х = х,
3)	(а+р)х = ах +рх,
4)	а(х + у)= ах + ау.
В зависимости от того, какой запас чисел (все комплексные или только действительные) используется, различают комплексные и действительные линейные пространства1). Всюду, где не оговорено противное, наши построения будут верны как для действительных, так и для комплексных пространств.
Заметим, что всякое комплексное линейное пространство можно рассматривать как некоторое действительное пространство, если ограничиться в нем умножением векторов на действительные числа.
‘) Можно было бы рассматривать и линейные пространства над произвольным полем.
120	НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. (и
Рассмотрим некоторые примеры линейных пространств, предоставив читателю проверить для каждого из них сформулированные выше аксиомы.
1.	Прямая линия R1, т. е. совокупность действительных чисел, с обычными арифметическими операциями сложения и умножения, представляет собой линейное пространство.
2.	Совокупность всевозможных систем п действительных чисел х = (хь х2, ..., хп), где сложение и умножение на число определяются формулами
(*Ь х2....х„) + (1/1, у2, • • •, Уп) = (xt + ylt х2 + у2, хп + уп),
а(хь х2, хй) —(ахь ах2, ..., ах„),
также является линейным пространством. Оно называется действительным п-мерным1) арифметическим пространством и обозначается символом Rn. Аналогично, комплексное п-мерное арифметическое пространство Сп определяется как совокупность систем п комплексных чисел (с умножением на любые комплексные числа).
3.	Непрерывные (действительные или комплексные)-функции на некотором отрезке [a, ft] с обычными операциями сложения функций и умножения их на числа образуют линейное пространство С [а, &], являющееся одним из важнейших для анализа.
4.	Пространство 12, в котором элементами служат последовательности чисел (действительных или комплексных)
* = (*!, х2,	хп, ...),
удовлетворяющие условию
£|х„|2<оо,	(1)
п—1
с операциями
<хь х2, ..., х„, ...) + («/!, г/2, •••, Уп> =
= (Х! 4-Z/1, Х2 + у2, .... Х„+уп, ...),
а(хь х2, ..х„, ...) = (ахь ах2, ..., ахп, . ..),
является линейным пространством. Тот факт, что сумма двух последовательностей, удовлетворяющих условию (1), также удовлетворяет этому условию, вытекает из элементарного неравенства (а( + а2)2 < 2af + 2a|.
5.	Сходящиеся последовательности х = (хь х2, ...) с покоординатными операциями сложения и умножения на числа образуют линейное пространство. Обозначим его с.
!) Этот термин будет разъяснен в дальнейшем.
линейные пространства
12t
6.	Последовательности, сходящиеся к 0, с теми же операциями сложения и умножения, также образуют линейное пространство. Обозначим его Со.
7.	Совокупность т всех ограниченных числовых последовательностей, с теми же операциями сложения и умножения на числа, что и в примерах 4—6, тоже представляет собой линейное пространство.
8.	Наконец, совокупность R00 всевозможных числовых последовательностей, с теми же самыми операциями сложения и умножения на числа, что и в примерах 4—7, тоже является линейным пространством.
Поскольку свойства линейного пространства — это свойства операций сложения элементов и умножения их на числа, естественно ввести следующее определение.
Определение 2. Линейные пространства L и L* называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие, которое согласовано с операциями в L и L*. Это означает, что из
х*->х*, у*-*/ (х, y^L, х*,	следует
х + У *-* X* + У*
и
ах*-* ах*
(а — произвольное число).
Изоморфные пространства можно рассматривать как различные реализации одного и того же пространства. Примерами изоморфных линейных пространств могут служить арифметическое n-мерное пространство (действительное или комплексное) и пространство всех многочленов степени п — 1 (соответственно с действительными или комплексными коэффициентами) с обычными операциями сложения многочленов и умножения их на числа (докажите изоморфность!).
2. Линейная зависимость. Элементы х, у, w линейного пространства L называются линейно зависимыми, если существуют такие числа а, 0, ..., А, не все равные 0, что
ах -|- 0г/ -|- ... -|- Xw = 0.	(2)
В противном случае эти элементы называются линейно независимыми. Иначе говоря, элементы х, у, ..., w линейно независимы, если из равенства (2) вытекает, что а = 0 = ... = А, = О.
Бесконечная система элементов х, у, ... пространства L называется линейно независимой, если любая ее конечная подсистема линейно независима.
122
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. ИГ
Если в пространстве L можно найти п линейно независимых элементов, а любые п +1 элементов этого пространства линейно зависимы, то говорят, что пространство L имеет размерность п. Если же в L можно указать систему из произвольного конечного числа линейно независимых элементов, то говорят, что пространство L бесконечномерно. Базисом в n-мерном пространстве L называется любая система из п линейно независимых элементов. Пространства Rn в действительном случае и Сп в комплексном имеют, как легко проверить, размерность п, оправдывая тем самым свое название.
В курсе линейной алгебры рассматриваются линейные пространства конечной размерности. Наоборот, мы, как правило, будем заниматься пространствами бесконечного числа измерений, представляющими основной интерес с точки зрения анализа. Мы предоставляем читателю проверить, что каждое из пространств, указанных в примерах 3—8, имеет бесконечную размерность.
3. Подпространства. Непустое подмножество L' линейного пространства L называется подпространством, если оно само образует линейное пространство по отношению к определенным в L операциям сложения и умножения на число.
Иначе говоря, L'cL есть подпространство, если из хе L', у е L' следует, что ах + е L' при любых аир.
Во всяком линейном пространстве L имеется подпространство, состоящее из одного нуля, — нулевое подпространство. С другой стороны, все L можно рассматривать как свое подпространство. Подпространство, отличное от L и содержащее хотя бы один ненулевой элемент, называется собственным.
Приведем примеры собственных подпространств.
1.	Пусть L — какое-либо линейное пространство и х— некоторый его ненулевой элемент. Совокупность элементов {Хх}, где X пробегает все числа (соответственно действительные или комплексные), образует, очевидно, одномерное подпространство. Оно является собственным, если размерность L больше 1.
2.	Рассмотрим пространство непрерывных функций С [а, Ь] (пример 3 п. 1) ив нем совокупность всех многочленов Р[а, й]. Ясно, что многочлены образуют в С [а, 6] подпространство (имеющее, как и все С [а, й], бесконечную размерность). В то же время само пространство С [а, й] можно рассматривать как подпространство более обширного пространства всех, непрерывных и разрывных, функций на [а, й].
3.	Рассмотрим, наконец, пространства l2, Со, с, m и R°° (примеры 4—8 п. 1). Каждое из них является собственным подпространством последующего.
Пусть {ха}—произвольное непустое множество элементов линейного пространства L. Тогда в L существует наименьшее
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
123
$11
подпространство (быть может, совпадающее с L), которое содержит {ха}- Действительно, по крайней мере одно подпространство, содержащее {ха}, в L существует: это все L. Далее ясно, что пересечение любого множества {Lv} подпространств есть снова подпространство. В самом деле, если L* = Q Lya х, у е L*,
v
то и ах + Ру е L* при всех а, р. Возьмем теперь все подпространства, содержащие систему векторов {ха}, и рассмотрим их пересечение. Это и будет наименьшее подпространство, содержащее систему {ха}. Такое минимальное подпространство мы назовем подпространством, порожденным множеством {ха}, или линейной оболочкой множества {ха}. Мы будем обозначать это подпространство L ({ха}).
Упражнения. Линейно независимая система {ха} элементов линейного пространства L называется базисом Гамеля, если ее линейная оболочка совпадает с L. Доказать следующие утверждения:
1)	В каждом линейном пространстве существует базис Гамеля.
Указание. Использовать лемму Цорна.
2)	Если {ха}—базис Гамеля в L, то каждый вектор xeL единственным образом представляется в виде конечной линейной комбинации некоторых, векторов системы {ха}.
3)	Любые два базиса Гамеля в линейном пространстве равномощны; мощность базиса Гамеля линейного пространства иногда называют алгебраической размерностью этого пространства.
4)	Линейные пространства изоморфны тогда и только тогда, когда они имеют одинаковую алгебраическую размерность.
4. Фактор-пространства. Пусть L — линейное пространство, и L' — некоторое его подпространство. Скажем, что два элемента х и у из L эквивалентны, если их разность х—-у принадлежит L'. Это отношение рефлексивно, симметрично и транзитивно, т. е. определяет разбиение всех xeL на классы. Класс эквивалентных элементов называется классом смежности (по подпространству L'). Совокупность всех таких классов мы назовем фактор-пространством L по L' и обозначим L/L'.
В любом фактор-пространстве, естественно, вводятся операции сложения и умножения на числа. Именно, пусть £ и ц — два класса, представляющих собой элементы из L/L'. Выберем в каждом из этих классов по представителю, скажем, х и у соответственно, и назовем суммой классов £ и т] тот класс £, который содержит элемент х 4- у, а произведением класса £ на число а тот класс, который содержит элемент ах. Легко проверить, что результат не изменится от замены представителей х и у какими-либо другими представителями х' и у' тех же классов £ и гр Таким образом, мы действительно определили линейные операции над элементами фактор-пространства L/L'. Непосредственная проверка показывает, что эти операции удовлетворяют всем требованиям, содержащимся в определении линейного пространства
724
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. 1Ц
(проведите эту проверку!). Иначе говоря, каждое фактор-пространство L/L' (с теми операциями сложения и умножения на числа, которые мы сейчас в нем определили) представляет собой линейное пространство.
Если L — пространство п измерений, а его подпространство L' имеет размерность k, то фактор-пространство L/L' имеет размерность п — k (докажите это!).
Пусть L — произвольное линейное пространство и L' — некоторое его подпространство. Размерность фактор-пространства L]L' называется коразмерностью подпространства L' в пространстве L.
Если подпространство L' с: L имеет конечную коразмерность п, то в L можно выбрать элементы хь х2, ..., хп так, что всякий элемент х е L будет (однозначно) представим в виде
х = a, Xj + ... + апхп + у,
где аь ..., ап — числа и у е L'. Действительно, пусть фактор-пространство L/L' имеет размерность п. Выберем в этом фактор-пространстве базис •••, и из каждого класса выберем по представителю xh. Пусть теперь х — любой элемент из L и £ — тот класс в L/L', который содержит х. Тогда
5 = ai£i + • • • + ап£п.
По определению это значит, что каждый элемент из £, в частности х, отличается лишь на элемент из L' от такой же линейной комбинации элементов .......хп, т. е.
x = aix1+ ... апхп-\- у.
Однозначность такой записи предоставляем доказать читателю.
5. Линейные функционалы. Числовую функцию f, определенную на некотором линейном пространстве L, мы будем называть функционалом. Функционал f называется аддитивным, если
f (.х + у) = f (х) + f (у) для всех х, уе=Ь\
он называется однородным, если
f (ax) = af (х) (a — произвольное число).
Функционал f, определенный в комплексном линейном пространстве, называется сопряженно-однородным, если f(ax) = — af(x), где a—число, комплексно сопряженное а.
Аддитивный однородный функционал называется линейным функционалом. Аддитивный сопряженно-однородный функционал называется сопряженно-линейным, а иногда полулинейным.
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
125
* Ч
Укажем примеры линейных функционалов.
1.	Пусть R” есть /г-мерное арифметическое пространство с элементами х — (xi, ..., хп) и а = (аь ..., ап)— произвольный набор из п фиксированных чисел. Тогда
f W = £ aix{ ы
— линейный функционал в Rn. Выражение f W = X diXi i=l
представляет собой сопряженно-линейный функционал в Сп.
2.	Интегралы ь	ь
IМ = х (0 dt и 7 [х] = к (0 dt а	а
представляют собой соответственно линейный и сопряженно-линейный функционалы в пространстве С [а, Ь].
3.	Рассмотрим более общий пример. Пусть уо — некоторая фиксированная непрерывная функция на [а, Ь]. Положим для любой функции х <= С [а, Ь] ь
F (х) = х (0 уо (0 dt. а
Линейность этого функционала следует из основных свойств операции интегрирования. Функционал ь
F(x)= х (0 y0(t) dt а будет сопряженно-линейным (в комплексном пространстве С[а,Ь]).
4.	Рассмотрим в том же самом пространстве С [а, б] линейный функционал другого типа, а именно, положим б/„(х) = х(/0), так что значение функционала f>t„ на функции х равно значению этой функции в фиксированной точке t0.
Этот функционал обычно записывают в виде ь
6fo(x)= x(t)b(t — t0)dt, а
понимая под б «функцию», которая равна нулю всюду, кроме точки t = 0, и интеграл от которой равен единице (б-функция
126	НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. ПГ
Дирака). Такие «функции» получили строгое определение в рамках теории обобщенных функций, элементы которой будут изложены в § 4 следующей главы.
5.	Приведем пример линейного функционала в пространстве /г- Пусть k — фиксированное целое положительное число. Для каждого х — (xi, ..., хп, .. .) из /2 положим Д(х) = х&. Линейность такого функционала очевидна. Эти функционалы допускают «распространение» на другие пространства последовательностей, например, на cQ, с, т, R°° (примеры 5—8 п. I).
6.	Геометрический смысл линейного функционала. Пусть f — некоторый отличный от тождественного нулЦ линейный функционал на линейном пространстве L. Совокупность тех элементов х из L, которые удовлетворяют условию
Дх) = 0,
представляет собой подпространство пространства L — подпространство нулей или ядро функционала f. Действительно, если f (-^) = f (i/) = 0, то
f (ах + Ру) = af (х) + pf (у) == 0.
Это подпространство обозначается Kerf ’).
Подпространство Kerf имеет коразмерность 1. Действительно, возьмем какой-либо элемент Хо, не входящий в Ker f, т. е. такой элемент, что f(xo)=0=O. Такой элемент найдется, поскольку f(x)^feO. Без ограничения общности можно считать, что f (х0) = 1, ибо в противном случае мы заменили бы х0 на 	• (Ясно,
I \хо) X
что f ( f(Xx° j~) = 1) Для кажД°Г0 элемента х положим у = = х —f(x)x0; тогда f (у) = f (х — f (х)х0) = 0, т. е. у <= Kerf. Представление элемента х в виде х — ах0 + у, где у & Ker f, при фиксированном элементе х0 единственно. В самом деле, пусть х = ах0 т У, У е Ker f, х = а'х0 + у', у' е Ker f.
Тогда (а — а')х0 = у' — у. Если здесь а — а', то очевидно, что у' = у. Если же а =0= а', то х0 = е Ker f, что противоречит выбору Хо.
Отсюда следует, что два элемента Xi и х2 тогда и только тогда принадлежат одному классу смежности по подпространству Kerf, когда f(х,)= f(x2).
Действительно, из Xi = f(Х])х0 + yi, х2 = f(х2)х0 + у2 вытекает, что Xj —x2 = (f(xi) —/(х2))-х0-|-(у1 —у2). Отсюда видно, что X] — х2 е Ker f тогда и только тогда, когда коэффициент при Хо, т. е. f (xi)— f(x2) равен 0.
>) От английского слова kernel — ядро.
4'1
ЛИНЕЙНЫЕ ПРОСТРАНСТВА
127
Всякий класс £ по подпространству Ker f определяется лю-<5ым из своих представителей. В качестве такого представителя можно взять элемент вида ах0. Отсюда видно, что подпространство L/Кег f действительно одномерно, т. е. Ker f имеет коразмерность 1.
Подпространство Ker f определяет линейный функционал, обращающийся на нем в нуль, с точностью до постоянного множителя.
В самом деле, пусть функционалы f и g имеют одно и то же ядро: Ker f = Ker g. Выберем элемент х0 так, чтобы f(x0)= 1. Мы утверждаем, что g(x0) =4= 0. Действительно,
x = f(x)x0 + у, у (= Ker f == Ker g, я
g W = f (x) g (x0) + g (y) = f (x) g (x0).
Если бы значение g(x0) равнялось 0, то функционал g был бы тождественным нулем. Из равенства g(x) = g(x0)f(x) и вытекает пропорциональность функционалов g и f.
Для всякого подпространства L' коразмерности 1 можно указать такой функционал f, что Ker f = L'. Достаточно выбрать произвольный элемент хофЬ' и представить каждый элемент х е= L в виде х = ах0 у. Такое представление единственно. Положив f(x)— а, мы получим линейный функционал f, для которого Ker f — L' (проверить это!).
Пусть L' — какое-нибудь подпространство коразмерности 1 в линейном пространстве L\ тогда всякий класс смежности пространства L по подпространству L' называется гиперплоскостью, параллельной подпространству L' (в частности, само подпространство L' является гиперплоскостью, содержащей 0, т. е. «проходящей через начало координат»). Иными словами, гиперплоскость М', параллельная подпространству L', — это множество, получающееся из L' параллельным переносом (сдвигом) на какой-нибудь вектор х0 s L:
М' = L' + х0 = {у: у = х + х0, x^L'}.
Ясно, что если хое L', то M'=L'; если же х^фЬ', то М'^Ь'. Если f — нетривиальный линейный функционал на пространстве Д то множество Mf = {х: f(x)= 1} является гиперплоскостью, параллельной подпространству Ker f (действительно, фиксируя какой-нибудь элемент х0, для которого f(xQ)= 1, мы можем всякий вектор х е Mf представить в виде х = х0 + у, где у е Ker f). “С другой стороны, если М' — какая-нибудь гиперплоскость, параллельная подпространству L' (коразмерности 1) и не проходящая через начало координат, то существует единственный линейный функционал f такой, что М' — {х: f[x)= 1}. Действительно, пусть М' = L' 4- х0, х0 е L-, тогда всякий элемент хе L
128	НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. [ц
однозначно представим в виде х = ах0 + У, где у е L'. Полагая, как и выше, f(x) = а, мы получим искомый линейный функционал; единственность следует из того, что если g(x)== 1 при х е М', то g(y) = 0 при у е L', так что
g (ах0 + У) = а = f (ах0 + у).
Таким образом, установлено взаимно однозначное соответствие между всеми нетривиальными линейными функционалами, определенными на L, и всеми гиперплоскостями в L, не проходящими через начало координат.
Упражнение. Пусть f, fi, .... fn — такие линейные функционалы на линейном пространстве L, что из fi(x) = ... = fn(x) = 0 вытекает f(x) = 0. п
Тогда существуют такие постоянные alt ,ал, что f (х) —	а^/г(.х) для
всех х е L.
§ 2.	Выпуклые множества и выпуклые функционалы. Теорема Хана — Банаха
1.	Выпуклые множества и выпуклые тела. В основе многих важных разделов теории линейных пространств лежит понятие выпуклости. Оно опирается на наглядные геометрические представления, но вместе с тем допускает и чисто аналитическую формулировку.
Пусть L — некоторое линейное действительное пространство и х, у — две его точки. Назовем замкнутым отрезком в L, соединяющим точки х и у, совокупность всех элементов вида
ах -ф ₽У, где а, р^О, а-|-р=1.
Отрезок без концевых точек х и у называется открытым отрезком.
Множество М с L называется выпуклым, если оно вместе с любыми двумя точками х и у содержит и соединяющий их отрезок.
Назовем ядром 1 (Е) произвольного множества Е с L совокупность таких его точек х, что для каждого у L найдется такое число е = е (у) > 0, что х -f- ty е Е при 111 •< е.
Выпуклое множество, ядро которого не пусто, называется выпуклым телом.
Примеры. 1. В трехмерном евклидовом пространстве куб, шар, тетраэдр, полупространство представляют собой выпуклые тела. Отрезок, плоскость, треугольник в том же пространстве — выпуклые множества, но не выпуклые тела.
2.	Рассмотрим в пространстве непрерывных функций на отрезке {a, ft] множество функций, удовлетворяющих условию
J 2]
ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ
129
.(/(/) |	1. Это множество выпукло; действительно, если
|f(0 I 1 и I g(0 I 1, то при а + р = 1,а, pxssO
I af (О + ₽g(0 К а + ₽= 1.
Упражнение. Проверить, является ли это множество выпуклым телом.
3.	Единичный шар в /2, т. е. совокупность таких точек х — =2 (хь ... , х„, .. .), что 2Z х„ 1> есть выпуклое тело. Его ядро состоит из точек х, удовлетворяющих условию У, х2 < 1.
4.	Основной параллелепипед П в /2— выпуклое множество, но не выпуклое тело. В самом деле, пусть хеП; это означает, что \хп |	1/2п-1 для всех п = 1,2, ... Положим у0 = (1, 1/2, ...
..., 1/п,...). Пусть х4-/г/0еП, т. е. \хп + t/n\ 1/2п-1; тогда
откуда t — 0, т. е. ядро множества П пусто.
Упражнения. 1. Пусть Ф — совокупность точек х= ...... ...)
из h, удовлетворяющих условию	1. Доказать, что Ф — выпуклое
множество, но не выпуклое тело.
2. Доказать то же самое для множества точек в /2, каждая из которых имеет лишь конечное число отличных от нуля координат.
Если М — выпуклое множество, то его ядро J (М) тоже выпукло. Действительно, пусть х, у е 7(Л1) и z — ах + $у, а, 0X^0, а+р=1. Тогда для данного «еА найдутся такие ei > 0 и е2 > 0, что при | Л | < ei, | /21 < е2 точки х + t\a и у + t^a принадлежат множеству Л1, следовательно, ему принадлежит и точка а (х + ta) + р (у + ta) = z 4- ta при 111 < е = min (ei, 62), т. е. z <= 7(Л1).
Установим следующее важное свойство выпуклых множеств.
Теорема 1. Пересечение любого числа выпуклых множеств есть выпуклое множество.
Доказательство. Пусть М = П Ма и все Ма — выпук-а
лые множества. Пусть, далее, х и у — две произвольные точки из М. Тогда отрезок, соединяющий точки х и у, принадлежит каждому Ма, а следовательно, и М. Таким образом, М действительно выпукло.
Заметим, что пересечение выпуклых тел (будучи выпуклым множеством) не обязано быть выпуклым телом (приведите пример).
Для произвольного множества А в линейном пространстве L существует наименьшее выпуклое множество, которое его содержит; им будет пересечение всех выпуклых множеств, содержащих А (по крайней мере одно выпуклое множество, содержащее А, существует — это все L). Минимальное выпуклое
130
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. IH
множество, содержащее А, мы назовем выпуклой оболочкой множества А.
Рассмотрим один важный пример выпуклой оболочки. Пусть Хь х2, Хп+1 — точки некоторого линейного пространства. Мы скажем, что эти точки находятся в общем положении, если векторы х2— X], х3 — Xi, ..., хп+1 — Х] линейно независимы. (Это rt+1	rt+1
равносильно тому, что из У, Mxf = 0 и У Af = O вытекает, что t=i	£=|
М = Л2 = ... =Xn+i=0). Выпуклая оболочка точек хь х2, .. . , Хп+ь находящихся в общем положении, называется «-мерным симплексом, а сами точки Xi, х2...х„+1 — его вер-
шинами. Нульмерный симплекс — это одна точка. Одномерный симплекс — отрезок, двумерный — треугольник, трехмерный — тетраэдр.
Если точки Xi, х2, ..., Хп+1 находятся в общем положении, то любые k + 1 из них (£ < п) также находятся в общем положении и, следовательно, порождают некоторый й-мерный симплекс, называемый k-мерной гранью данного «-мерного симплекса. Например, тетраэдр с вершинами е2, е3, е4 имеет четыре двумерные грани, определяемые соответственно тройками вершин (е2, е3, <?4), (еь е3, е4), (е{,е2,е4), (еь е2, е3), шесть одномерных граней и четыре нульмерных.
Теорема 2. Симплекс с вершинами Х\, х2, ..., xn+i есть совокупность всех точек, которые можно представить в виде
п-Ы	rt+1
^=Е“Л, а*>0, Еац=1.	(1)
Х=1	fe=l
Доказательство. Легко проверить, что совокупность S точек вида (1) представляет собой выпуклое множество, содержащее точки Xi, х2, ..., хп+ь С другой стороны, всякое выпуклое множество, содержащее эти точки, должно содержать и точки вида (1); следовательно, S является наименьшим выпуклым множеством, содержащим точки Xi, х2, ..., хп+ь
2. Однородно-выпуклые функционалы. С понятием выпуклого множества тесно связано важное понятие однородно-выпуклого функционала. Пусть L — действительное линейное пространство. Определенный на L функционал р называется выпуклым, если
р(ах-ф(1 — а)г/)<ар(х) + (1 — а)р(у)	(2)
для всех х, y^L и 0^а^1.
Функционал р называется положительно-однородным, если
р (ах) = ар (х) для всех х е L и всех а > 0.	(3)
5 2]	ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ	131
Для выпуклого положительно-однородного функционала выполнено неравенство:
р(х + у)^р(х) + р(у).	(2')
Действительно
p(^+i/) = 2p(AY£)<2(p (у)+ Р (у)) = pW + р(у).
Легко понять, что условие (2') вместе с условием (3) обеспечивает выпуклость функционала р. Положительно-однородный выпуклый функционал мы будем называть короче однородновыпуклым. Укажем некоторые простейшие свойства однородновыпуклых функционалов.
1.	Полагая в равенстве (3) х = 0, получаем
р(0) = 0.	(4)
2.	Из (2') и (4) следует, что
О = р{х + (— х)) < р (х) + р(— х) для всех xeL. (5)
Это неравенство означает, в частности, что если р(х)<0, то обязательно р(—х) > 0. Таким образом, ненулевой однородновыпуклый функционал может быть всюду неотрицателен, но если всюду р(х) 0, то р(х) bs 0.
3.	При любом а р (ах) ар (х).
При а > 0 это следует из (3), при а = 0 — из (4); если же а < 0, то в силу (5) получаем
0 < р (ах) 4- р (| а | х) = р (ах) +1 а | р (х), т. е.
р (ах) > — | а | р (х) = ар (х).
Примеры. 1. Всякий линейный функционал является, очевидно, однородно-выпуклым. Однородно-выпуклым будет и функционал р(х) = |/(х) |, если / линеен.
2. Длина вектора в л-мерном евклидовом пространстве есть однородно-выпуклый функционал. Здесь условие (2') означает, что длина суммы двух векторов не превосходит суммы их длин (неравенство треугольника), а (3) непосредственно следует из определения длины вектора в Rn.
3. Пусть т — пространство ограниченных последовательностей х = (xi, х2,..., хп,...). Функционал
р (х) = sup | х„ | п
— однородно-выпуклый.
132
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. Hi
3. Функционал Минковского. Пусть L — произвольное линейное пространство и А — выпуклое тело в L, ядро которого содержит точку 0. Функционал
Ра (х) = inf { г: у- е А, г > 0 }
(6)
называется функционалом Минковского выпуклого тела А.
Теорема 3. Функционал Минковского (6) — однородновыпуклый и неотрицательный. Обратно, если р(х)— произвольный однородно-выпуклый неотрицательный функционал на линейном пространстве Luk — положительное число, то
А = {х: p(x)<fe)	(7)
есть выпуклое тело, ядром которого служит^ множество {х: p(x)<k) (содержащее точку 0). Если в (7) k= 1, то исходный функционал р(х) есть функционал Минковского для А.
Доказательство. Для всякого x^L элемент х/r принадлежит А, если г достаточно велико; поэтому величина рА(х), определяемая равенством (6), неотрицательна и конечна. Проверим положительную однородность функционала (6). Если t > 0 и у = tx, то
Ра (у) — inf (г > 0; У1Г е А} = inf {г > 0: tx/r е А) =
= inf {tr' > 0: xjr' А} = t inf {г' > 0: x/r е А} = tpA (х).	(8)
Проверим выпуклость рА(х). Пусть xt, x2^L и е>0 произвольно. Выберем числа (i— 1,2) так, что рА(Хг)<г,< <Рл(Хг) + е; тогда хД-еА. Положим г = г, + г2, тогда точка (%! -|- х2)/г = Г1%1/(гг1) + г2х2/(гг2) принадлежит отрезку с концами xjri и х2]г2. В силу выпуклости А этот отрезок, а значит, и точка (%1 4-х2)/г принадлежат А, откуда
Ра (Xi + х2)< г = Г| + г2 < рА (%i) + рА (х2) + 2е.
Так как е > 0 здесь произвольно, то
Ра (xi + х2) < рА (х,) + рА (х2).
Следовательно, рА(х) удовлетворяет условиям (27) и (3), а потому это — неотрицательный однородно-выпуклый функционал.
Рассмотрим теперь множество (7). Если х,у <= А и а + + Р = 1, а, Р 0, то
р (ах + Ру) < ар (х) + Рр (у) < k,
т. е. А выпукло. Далее, пусть p(x)<Zk, / > 0 и у е L, тогда р (х ± ty)^p (х) + tp (± у).
$2]
ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ
133
Если р(—у) = р(у) = 0, то x±ty<=A при всех t; если же хотя бы одно из неотрицательных чисел р(у), р(—у) отлично от О, то х ± ty <= А при
t < k~P(x) max [р (у), р (— у)] •
Непосредственно из введенных определений ясно, что р служит функционалом Минковского для множества {х: р(х)^1}.
Итак, введя понятие функционала Минковского, мы установили соответствие между неотрицательными однородно-выпуклыми функционалами и выпуклыми телами с ядром, содержащим точку 0.
Примеры. 1. При А = L имеем, очевидно,
pL(x)==0.
2.	Пусть А — шар с центром 0 и радиусом г в Rn. Тогда Ра (х) = II х ||/г, где || х || — длина вектора х.
3.	Пусть А — «слой» —I sC Х\ 1 в пространстве 12 последовательностей х = (хь х2,..., хп,...). Тогда
Ра(*) = 1 *i I-
Замечания. 1. Иногда удобно рассматривать однородновыпуклые функционалы, которые могут принимать не только конечные значения, но и значение -фоо (но не —сю). Тогда из равенства р(ах) = ар(х) (где а > 0) следует, что р(0) = 0 или р(0)=оо. Легко проверить, что в этом последнем случае можно, не нарушая однородной выпуклости функционала, изменить его значение в одной точке, положив р(0) = 0 вместо р(0) = +°о. Так обычно и делают.
Если р(х) — однородно-выпуклый, но не обязательно конечный, функционал, то А = {х: p(x)^k} есть выпуклое множество, но не обязательно выпуклое тело. Обратно, если А — произвольное выпуклое множество, содержащее точку 0, то для него можно определить функционал Минковского формулой (6), но при этом придется для г допускать и значение + °о.
2. Если Pi(x) и р2(х)— однородно-выпуклые функционалы, то таковы же pi (х) + Рг(х) и арДх) при а > 0. Далее, если {p5(x)}ssS — произвольное семейство однородно-выпуклых функционалов, то таков и функционал р(х) = supps(x). В частности, s^S
верхняя грань р (х) = sup fs (х) любого непустого множества seS
линейных функционалов на L есть однородно-выпуклый функцио
134
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. IIF
нал. Воспользовавшись теоремой Хана — Банаха, легко показать что так можно представить всякий (конечный) однородно-выпуклый функционал.
Упражнение. Множество А в линейном пространстве L называется-поглощающим, если для всякого х s L существует такое а > 0, что х е ХЛ для всех л > а. Доказать, что выпуклое множество А — поглощающее-в том и только том случае, если его ядро содержит точку О.
4.	Теорема Хана — Банаха. Пусть L — действительное линейное пространство и Lo — некоторое его подпространство. Пусть, далее, на подпространстве Lo задан некоторый линейный функционал f0. Линейный функционал f, определенный на всем пространстве L, называется продолжением функционала fQ, если
f (х) = f0 (х) для всех х <= Lo.
I
Задача о продолжении линейного функционала часто встречается в анализе. Основную роль во всем этом круге вопросов^ играет следующая теорема.
Теорема 4 (Хан — Банах). Пусть р — однородно-выпуклый функционал, определенный на действительном линейном: пространстве L, и пусть Lo — линейное подпространство в Если f0 — линейный функционал на Lo, подчиненный на Lo функционалу р(х), т. е. если на Lo
/oMO(4	(9>
то f0 может быть продолжен до линейного функционала f на L„ подчиненного р(х) на всем L.
Доказательство. Покажем, что если Lo =/= L, то функционал f0 можно продолжить с Lo на некоторое большее подпространство L' с сохранением условия (9). Действительно,, пусть z— произвольный элемент из L, не принадлежащий Lo> и пусть L' — подпространство, порожденное Lo и г. Каждый элемент из L' имеет вид tz -)- х, где х е Lo.
Если f' — искомое продолжение функционала fo на L', то
f' (tz + х) = if' (z) + f0 (x),
или, если положить f'(z) = с,
f' (tz + x) = tc + f0 (x).
Теперь выберем с так, чтобы сохранить на L' условие подчинения (9), т. е. так, чтобы при всех х <= Lo и всех действительных t выполнялось неравенство fo(x) + tc р(х + tz). При t > О оно равносильно условию
fo (т) + c^p(-7 + z)> или c<p(-7 + z) — fo (7).
j 2]	ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ	135
а при t < 0 — условию
/о(у) + с>-р(-Т-г), или
Покажем, что всегда существует число с, удовлетворяющее этим двум условиям. Пусть у' и у” — произвольные элементы из Lo. Тогда
— fo (У") + Р {у" + z) > — f0 (у') — р(—у' — г).	(10)
Это вытекает из неравенства
fo (У") — fo < Р (У" — У') = Р ((/' + z) — (У' + z)) <
< р (у" + z) + р (— у' — z).
Положим
с" — inf (— fQ (у") + р (у" + z)), с' = sup (— fo (у') — р (— у' — z)). у"	«'
Из (10' в силу произвольности у' и у" следует, что с" с'. Выбрав с так, что с" с', определим функционал f' на L' формулой
Г (tz + х) = tc + fo (х).
Этот функционал удовлетворяет условию подчинения (9).
Итак, мы показали, что если функционал f0 определен на некотором подпространстве Lo с L и удовлетворяет на Lo условию (9), то f0 можно продолжить с сохранением этого условия на некоторое большее подпространство L'.
Если в L можно выбрать счетную систему элементов хь jc2, •. •, хп, ..., порождающую все L, то функционал на L строим по индукции, рассматривая возрастающую цепочку подпространств
L(1) = {L0, xj, L(2) = {Lll), х2}, ...
“(здесь {LW, Xfe+i} означает минимальное линейное подпространство в L, содержащее 1№> и Хь+1). Тогда каждый элемент хе£ войдет в некоторое LW и, следовательно, функционал будет продолжен на все L.
В общем случае (т. е. когда счетного множества, порождающего L, не существует) доказательство заканчивается применением леммы Цорна. Совокупность 3 всевозможных продолжений функционала f0, удовлетворяющих условию подчинения (9), частично упорядочена, и каждое ее линейно упорядоченное подмножество Зо обладает верхней гранью; этой верхней
136
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ III
гранью служит функционал, определенный на объединении областей определения функционалов f' е g0 и совпадающий с каждым таким f' на его области определения. В силу леммы Цорна во всем § существует максимальный элемент f. Этот максимальный элемент f и представляет собой искомый функционал. Действительно, он является продолжением исходного' функционала f0, удовлетворяет условию (9) на своей области определения и задан на всем L, так как иначе мы продолжили бы его описанным выше способом с того собственного подпространства, на котором он определен, на большее подпространство, и f не был бы максимальным.
Теорема доказана.
Приведем еще комплексный вариант теоремы Хана — Банаха.
Неотрицательный функционал р на комплексном линейном пространстве L называется однородно-выпуклым, если для всех х, у L и всех комплексных чисел А
р(х + у)^р(х) + р(у), р(Ах) = | А|р(х).
Теорема 4а. Пусть р — однородно-выпуклый функционал на комплексном линейном пространстве L, a f0 — линейный функционал, определенный на некотором линейном подпространстве LaciL и удовлетворяющий на нем условию
lfo(x)Kp(x), xeL0.
Тогда существует линейный функционал f, определенный на всем L и удовлетворяющий условиям
1/(х)Ю(х), x^L, f(x) = f0(x), x(eeL0.
Доказательство. Обозначим через LR и L0R пространства L и Lo, рассматриваемые как действительные линейные пространства. Ясно, что р — однородно-выпуклый функционал на Lr, а /он(х) = Ref0(x)— действительный линейный функционал на Lqr, удовлетворяющий условию
I f or (х) К р (х) и, тем более, условию
(х) < р (х).
В силу теоремы 4 существует действительный линейный функционал fR, определенный на всем LR и удовлетворяющий условиям
fR(x)<p(x), xe=LR(=L),
?R (х) == foR (х), X е Lqr (= Lo).
$ 2J	ВЫПУКЛЫЕ МНОЖЕСТВА И ВЫПУКЛЫЕ ФУНКЦИОНАЛЫ	137
Ясно, что —'fn(x) = fR(—х)	р(—х) = р(х), так что
|/я(х)|<р(х),	x<=Lr(=L).	(II)
Определим функционал f на L, полагая
f (х) = f R (х) — ifR (ix)
(здесь мы пользуемся тем, что L — комплексное линейное пространство, так что в нем определено умножение на комплексные числа). Непосредственная проверка показывает, что f — комплексный линейный функционал на L, причем
f (х) = f0 (х) при х (= Lo, Re f (х) — fR(x) при xeL.
Осталось показать, что | f (х) | р (х) для всех xeL. Допустим противное; тогда для некоторого xaeL имеем |/(х0) | > >р(х0). Представим комплексное число f(xQ) в виде f(x0) = =ре‘ф, где р > 0, и положим y0—e~i4>xa. Тогда fR (у0) =Re f (t/0) = = Re (x0)] = p > p (x0) = p(yo), что противоречит условию (11).
Теорема доказана.
Упражнение. Покажите, что условие конечности функционала р в теореме Хана — Банаха можно опустить.
5.	Отделимость выпуклых множеств в. линейном пространстве. Пусть L — действительное линейное пространство, а М « N — два его подмножества. Говорят, что определенный на L линейный функционал f разделяет эти множества, если существует такое число С, что
f(x)^C при хеМ и f(x)^C при xe.V, т. е. если
inf f (х) > sup f (х). х<=М	xesN
Функционал f называется строго разделяющим множества М и N, если выполнено строгое неравенство
inf f (х) > sup f (х). хеN
Следующие два утверждения непосредственно вытекают из определения разделимости.
1) Линейный функционал f разделяет множества М и N в том и только том случае, когда он разделяет множества -А1 — N и {0} (т. е. множества всех элементов вида х — у, где X е М, у <= М, и точку 0).
2) Линейный функционал f разделяет множества М и W в том и только том случае, когда при каждом хе L он разделяет множества М — х и N — х.
138
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. ИГ
Из теоремы Хана — Банаха легко получается следующая теорема об отделимости выпуклых множеств в линейном пространстве, имеющая многочисленные применения.
Теорема 5. Пусть М и N — выпуклые множества в действительном линейном пространстве L, причем ядро хотя бы: одного из них, скажем М, не пусто и не пересекается с другим-множеством. Тогда существует ненулевой линейный функционал, на L, разделяющий М и N.
Доказательство. Без ограничения общности можно считать, что точка 0 принадлежит ядру М множества М. (Иначе-мы рассмотрели бы множества М — х0 и N — х0, где х3е,Й.) Пусть уо е N, тогда точка — у0 принадлежит ядру множества: М — N, а 0 принадлежит ядру д множества К = М — N уо..
О	о
Так как М Г) N = 0, то 0 не принадлежит ядру Af — N и у0<£ К. Пусть р — функционал Минковского для К. Тогда р(уо)^ 1, поскольку уо^К. Введем линейный функционал
fo (ai/o) = «Р (i/o).
Он определен на одномерном пространстве, состоящем из элементов вида ауо, и удовлетворяет условию
fo(az/oXp(az/o),
поскольку р(ауо)=ар{Уо) при a 0, и fo(af/o) = af0(Po) < 0 < < p(apo) при a < 0. По теореме Хана — Банаха функционал /о можно продолжить до линейного функционала f, определенного на всем L и удовлетворяющего на L условию f(y)^p(y). Отсюда следует, что f(y)^ 1 при у е К и в то же время f(yo)^ L. Таким образом, f разделяет множества К и {г/0}, а следовательно, f разделяет М — N и {0}; но тогда f разделяет множества М и N.
Теорема доказана.
§ 3. Нормированные пространства
В главе II мы занимались топологическими и, в частности,, метрическими пространствами, т. е. множествами, в которых: введено, тем или иным способом, понятие близости элементов» а в предыдущих параграфах данной главы мы имели дело с линейными пространствами. До сих пор каждое из этих понятий стояло особняком. Однако в анализе приходится иметь дело с пространствами, в которых введены как операции сложения элементов и умножения их на числа, так и некоторая топология,, т. е. рассматривать так называемые т о п о л о г и ч е с к и е линейные пространства. Среди последних важный класс образуют нормированные пространства. Теория этих
*3]
НОРМИРОВАННЫЕ ПРОСТРАНСТВА
139
пространств была развита в работах С. Банаха и ряда других авторов.
1. Определение и примеры нормированных пространств.
Определение 1. Пусть L — линейное пространство. Однородно-выпуклый функционал р, определенный на L, называется нормой, если он удовлетворяет следующим дополнительным условиям (помимо выпуклости):
1) р (х) = 0 только при х = О,
2) р(ах) = | а| р(х) для всех а.
Таким образом, вспоминая определения из п. 2 § 2, мы можем сказать, что нормой в L называется функционал, удовлетворяющий следующим трем условиям:
1)	р (х)	0, причем р (х) — 0 только при х = О,
2)	р(х + у)^р(х) + р(у), х, y<=L,
3)	р(ах) = |а|р(х), каково бы ни было число а.
Определение 2. Линейное пространство L, в котором задана некоторая норма, мы назовем нормированным простран-ством. Норму элемента хе L мы будем обозначать символом ||х||.
Всякое нормированное пространство становится метрическим Пространством, если ввести в нем расстояние
Р (х, у)—Цх — уЦ.
Справедливость аксиом метрического пространства тотчас же -вытекает из свойств 1)—3) нормы. На нормированные пространства переносятся, таким образом, все те понятия и факты, жоторые были изложены в гл. II для метрических пространств.
Полное нормированное пространство называется банаховым пространством или, короче, В-пространством.
Примеры нормированных пространств. Многие из пространств, рассматривавшихся в гл. II в качестве примеров ’метрических (а в § 1 данной главы — линейных) пространств, ж действительности могут быть наделены естественной структурой нормированного пространства.
1.	Прямая линия R1 становится нормированным пространством, если для всякого числа xeR1 положить ||х||=|х|.
2.	Если в действительном n-мерном пространстве Rn с элементами Х = (Х1, х2, ..., хп) положить
то все аксиомы нормы будут выполнены. Формула
Р(х, I/) = l|x— Vll =
у/ ^(хк — ук)2
140
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. ПГ
определяет в Rn ту самую метрику, которую мы в этом пространстве уже рассматривали.
В этом же линейном пространстве можно ввести норму
п
1И1, = Е I xk I	(2)
А=1 или норму
IIX ||„ = max I xk |.	(3)
Эти нормы определяют в Rn метрики, которые мы рассматривали в примерах 4 и 5 п. 1 § 1 гл. II. Проверка того, что в каждом из этих случаев аксиомы нормы действительно выполнены, не составляет труда.
В комплексном n-мерном пространстве Сп можно ввести норму
1И1=д/Е \xk I2, » fe=i
или любую из норм (2) или (3).
3.	В пространстве С[а, 6] непрерывных функций на отрезке [а, &] определим норму формулой
Ilf»- max |/(0|.	(4)
Соответствующее расстояние уже рассматривалось в примере 6 п. 1 § 1 гл. II.
4.	Пусть т — пространство ограниченных числовых последовательностей X = (Хь Х2, ..., Хп, .. ). Положим
||x|| = sup|x„|.	(5)
п
Условия 1)—3) определения нормы здесь, очевидно, выполнены. Метрика, которая индуцируется в т этой нормой, совпадает с той, которую мы уже рассматривали (гл. II, § 1, п. 1, пример 9).
2. Подпространства нормированного пространства. Мы определили подпространство линейного пространства L (не снабженного какой-либо топологией) как непустое множество Lo, обладающее тем свойством, что если х, у <= Lo, то ах 0г/ <= Lo. В нормированном пространстве основной интерес представляют замкнутые линейные подпространства, т. е. подпространства, содержащие все свои предельные точки. В конечномерном нормированном пространстве всякое подпространство автоматически замкнуто (докажите это!). В бесконечномерном случае это не так.. Например, в пространстве С[а, Ь] непрерывных функций с
I 31
НОРМИРОВАННЫЕ ПРОСТРАНСТВА
141
нормой (4) многочлены образуют подпространство, но не замк-нутое1).
Другой пример: в пространстве т ограниченных последовательностей последовательности, содержащие лишь конечное число отличных от нуля членов, образуют подпространство. Однако оно не замкнуто по норме (5): в его замыкании содержится, например, последовательность (1, 1/2, ..., 1/п, ...).
Как правило, мы будем рассматривать только замкнутые подпространства, поэтому естественно изменить терминологию, которая была установлена в § 1. Подпространством нормированного пространства мы будем называть теперь только замкнутое подпространство; в частности, подпространством, порожденным данной системой элементов {ха}, мы будем называть наименьшее замкнутое подпространство, содержащее {ха}. Мы будем говорить о нем, как о линейном замыкании системы {ха}. Совокупность элементов (не обязательно замкнутую), содержащую вместе с х и у их произвольную линейную комбинацию ах + $у, будем называть линейным многообразием.
Систему элементов, лежащую в нормированном пространстве Е, мы будем называть полной, если порожденное ею (замкнутое!) подпространство есть все Е. Например, в силу теоремы Вейерштрасса совокупность всех функций 1, t, t2........tn, ...
полна в пространстве непрерывных функций С [a, ft].
3. Фактор-пространства нормированного пространства. Пусть R— нормированное пространство и М — некоторое его подпространство. Рассмотрим фактор-пространство Р = R/М. В соответствии со сказанным в п. 4 § 1 этой главы Р есть линейное пространство. Определим в нем норму, положив для каждого класса смежности g
11511= inf II х||.	(6)
Покажем, что при этом выполнены сформулированные в п. 1 аксиомы нормированного пространства. Ясно, что всегда ||g||^ 0. Если go — нулевой элемент фактор-пространства Р (т. е. go совпадает с подпространством Л4), то в качестве хе go можно взять нуль пространства R, и тогда получаем, что llgoll = 0. Обратно, если || g || = 0, то из определения нормы (6) следует существование в классе g последовательности, сходящейся к нулю. Но так как М замкнуто, то замкнут и каждый класс смежности, значит, 0 е g, а это означает, что g = М, т. е. g есть нулевой элемент в Р. Итак, || g ||	0 и ||g|| = 0 лишь тогда, когда g —
нуль пространства Р.
*) В силу теоремы Вейерштрасса, гласящей, что всякая непрерывная Функция на отрезке есть предел равномерно сходящейся последовательности Многочленов, замыкание подпространства многочленов в С[а, 6] есть все Ча, &].
142
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. III
Далее, для всякого хе/? и всякого а имеем
|| ах || = | а | • || х ||.
Беря в обеих частях этого равенства нижнюю грань по хе^, получаем
|<Х| • II а
Наконец, пусть 5, т[ е/1 и хе i/ец. Тогда
Н + п1К1|х + 1/||<||х|| + ||1/||.
Беря в правой части этого неравенства нижнюю грань по всем хе с, i/е д получаем, что
П + пИСШ + ИпИ.
Итак, все аксиомы нормированного пространства для Р выполнены. Покажем теперь, что если R полно, то и Р = R/М полно. Действительно, согласно (6) для каждого £ е R/М найдется такой элемент хе с, что
Пусть {£п}—фундаментальная последовательность в Р. Переходя, если нужно, к подпоследовательности, можно считать, что ряд
III П—1
сходится. Добавив к {£п} еще — нулевой элемент пространства Р,— выберем XnG5n+i_Gn (п = 0, 1, 2, ...) тйк, что
||^ + 1-^||>1||хп||.
оо
Тогда ряд XII хп II сходится, а значит, в силу полноты про-п=0 оо	оо
странства R сходится и ряд хп- Положив х=Ххп и обо-п=0	п=0
значив через g класс, содержащий х, получим (поскольку п
хк е при каждом п) к=0
II ”	II
П—при П-*ОО,
II	*=о II
т. е. £ = lim %п. Итак:
П->ОО
Фактор-пространство банахова пространства по любому его (замкнутому) подпространству есть банахово пространство.
«“1
ЕВКЛИДОВЫ ПРОСТРАНСТВА
143
Упражнения. 1. Пусть R— банахово пространство, В| сэ В2 сэ ... ... зэВпЗЭ... — последовательность вложенных замкнутых шаров в нем. Докажите, что она имеет непустое пересечение (не предполагается, что радиусы этих шаров стремятся к 0; ср. с упражнением 3 на стр. 70). Приведите пример последовательности вложенных непустых ограниченных замкнутых выпуклых множеств в некотором В-пространстве, имеющих пустое пересечение.
2.	Пусть R—бесконечномерное В-пространство; тогда его алгебраическая размерность (см. упражнение 3 на стр. 123) несчетна.
3.	Пусть R — линейное нормированное пространство; доказать справедливость следующих утверждений:
1)	всякое конечномерное линейное многообразие в R замкнуто;
2)	если М — подпространство, a W — конечномерное подпространство в R, то их сумма
М + N = [х: х — у + г, у s М, геН]
замкнута; привести пример двух (замкнутых) линейных подпространств в (2, сумма которых не замкнута;
3)	пусть Q — открытое выпуклое множество в R, и пусть х0& Q; тогда существует гиперплоскость, проходящая через точку х0 и не пересекающая Q.
4.	Две нормы, Il-Hi и ||-||2, в линейном пространстве R называются эквивалентными, если существуют такие постоянные а, b > 0, что alUlli Мг
6||х|11 для всех х е R. Доказать, что если пространство R конечномерно, то любые две нормы в нем эквивалентны.
§ 4. Евклидовы пространства
1. Определение евклидовых пространств. Один из хорошо известных способов введения нормы в линейном пространстве — это задание в нем скалярного произведения. Напомним, что скалярным произведением в действительном линейном пространстве R называется действительная функция (х,у), определенная для каждой пары элементов х, у е R и удовлетворяющая следующим условиям:
1)	(х,у) = (у,х),
2)	(xl+x2,y) = (xi,y) + (x2,y),
3)	(U, у) = Цх, у),
4)	(х, х) 0, причем (х, х) = 0 только при х — 0.
Линейное пространство с фиксированным в нем скалярным произведением называется евклидовым пространством. В евклидовом пространстве R вводится норма с помощью формулы
11*11 = V(*> х) .
Из свойств 1)—4) скалярного произведения следует, что все аксиомы нормы при этом выполнены.
Действительно, выполнение аксиом 1) и 3) нормы (п. 1 § 3) очевидно, а выполнение аксиомы 2) (неравенство треугольника) вытекает из неравенства Коши — Буняковского
1(*. */)К1И1-1Ы1>	(1)
которое мы сейчас докажем.
144
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. III
Рассмотрим квадратный трехчлен от действительной переменной X, неотрицательный при всех значениях X:
ф (Л) = (Ах + у, кх + у) = А2 (х, х) + 2А (х, у) + (у, у) —
= 1|х|рА2 + 2(х, у)К + \\у\\\
Так как это выражение представляет собой скалярный квадрат некоторого вектора, то всегда ф(А)0. Следовательно, дискриминант этого трехчлена меньше или равен нулю.
Неравенство Коши — Буняковского (1) как раз и выражает не что иное, как неположительность дискриминанта этого квадратного трехчлена <р(А).
Отметим, что в евклидовом пространстве сумма, произведение на число и скалярное произведение непрерывны, т. е. если хп->х, уп-^у (в смысле сходимости по норме), АП->А (как числовая последовательность), то
хп + Уп~*х-\-у, Кпхп -> Ах, (хп, уп)-+(х, у).
Доказательство этих фактов основано на использовании неравенства Коши — Буняковского (1) и предоставляется читателю в качестве упражнения.
Наличие в R скалярного произведения позволяет ввести в этом пространстве не только норму (т. е. длину) вектора, но и угол между векторами; именно, угол q> между векторами х и у определяется формулой
с05’-тагйг-	(2)
При этом из неравенства Коши — Буняковского (1) вытекает, что выражение, стоящее в (2) справа, по модулю не превосходит 1 и, следовательно, формула (2) действительно для любых ненулевых х и у определяет некоторый угол ф, 0 q> л.
Если (х, у} = 0, то из (2) получаем, что q> = л/2; в этом случае векторы х и у называются ортогональными.
Система ненулевых векторов {ха} из R называется ортогональной, если
(ха, хр) = 0 при а=Н=₽.
Если векторы {ха} ортогональны, то они линейно независимы. В самом деле, пусть
Я1Ха1 Ц2Ха2 4“ • •  ^пХап == 0>
ЕВКЛИДОВЫ ПРОСТРАНСТВА
145
§ 4]
поскольку {ха}— ортогональная система, имеем
(%az, aiXat + . . . + апХап) = Я/ (хО/, XaJ = О,
но (хар ха.) =/= 0 и, значит, л,- = 0 для всех I — 1, 2, .. ., п.
Если ортогональная система {х7} полна (т. е. наименьшее содержащее ее замкнутое подпространство есть все R), то она называется ортогональным базисом. Если при этом норма каждого элемента равна 1, то система {ха} называется ортогональным нормированным базисом. Вообще, если система {ха} (полная или нет) такова, что
( 0 при а=0=Р, (х„, Хц) = ( .	о
р (, 1 при а = Р,
то она называется ортогональной нормированной (короче ортонормальной} системой. Ясно, что если {ха} — ортогональная си-
{Ха 1
р— — | — ортогональная нормированная система.
2. Примеры. Рассмотрим некоторые примеры евклидовых пространств и ортогональных базисов в них.
1.	n-мерное арифметическое пространство Rn, элементами которого служат системы действительных чисел х = (хь х2, ... ..., хп), с обычными операциями сложения и умножения и скалярным произведением
(х, у} = Е хд{,	(3)
£=1
представляет собой хорошо известный пример евклидова пространства. Ортогональный нормированный базис в нем (один из бесконечного числа возможных) образуют векторы
б! =(1, 0, 0, ..., 0), е2 = (0, 1,0, ..., 0),
е„ = (0, 0, 0, ..., 1).
2.	Пространство /2 с элементами
х = (хь х2, .... х„, ...), где Е х2 < ОО,
4 = 1 и скалярным произведением
(X, у} = Е Xitji	(4)
[=1
есть евклидово пространство. Действительно, сходимость ряда, стоящего в (4) справа, следует из неравенства (4) гл. II, § 1.
146
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. III
Свойства 1)—4) скалярного произведения проверяются непосредственно. Простейший ортогональный нормированный базис в образуют векторы
е, = (1, 0, 0,
е2~ (0, 1> 0, • • •)> ,	/£\
е3 = (0, 0, 1, ...),
Ортогональность и нормированность этой системы ясны; вместе с тем система (5) полна: пусть x = (xj, х2,	*п, ...)—лю-
бой вектор из 12 и = (%], х2, хп, 0, 0, ...). Тогда есть линейная комбинация векторов б]....еп и ||х<п> — х||->0-
при п -> оо.
3.	Пространство С2[а, &], состоящее из непрерывных на [а, д}, действительных функций, со скалярным произведением
ъ (f,g)=\f(t)g(t)dt	(6>
а
также является евклидовым. Среди различных ортогональных базисов, которые можно указать в нем, важнейшим является тригонометрическая система, состоящая из функций
cos п -т-, sinn-r---	(л=1,2, ...).	(7Y
2	b — a	b — a v ’’	' v '
Ортогональность этой системы проверяется непосредственно.
Если рассматриваются непрерывные функции на отрезке длины 2л, скажем, на [—л, л], то соответствующая тригономет-
рическая система есть: 1/2, cosn/,. sin nt (п — 1, 2, ...).
Система (7) полна. Действительно, согласно теореме Вейер-штрасса, всякая непрерывная йа отрезке [а, д] функция ф, принимающая в точках а и b одинаковые значения, может быть
рис 17.	представлена как предел равно-
мерно сходящейся последовательности тригонометрических многочленов, т. е. линейных комбинаций элементов системы (7). Такая последовательность и подавно сходится к ф по норме пространства С2[а, &]. Если же f — произвольная функция из С2[а, &], то ее можно предста-.вить как предел (по норме пространства С2[а, &]) последовательности функций фп, каждая из которых совпадает с f на отрезке [а, b — l/п], линейна на [Ь — 1/п, Ь] и в точке b принимает то же значение, что и в точке а (рис. 17). Следовательно, каждый эле-
f 4]	ЕВКЛИДОВЫ ПРОСТРАНСТВА	147
мент из С2[а, д] можно приблизить сколь угодно точно (в метрике этого пространства) линейными комбинациями элементов системы (7), а это и означает ее полноту.
3. Существование ортогональных базисов, ортогонализация. На протяжении оставшейся части этого параграфа мы ограничимся сепарабельными евклидовыми пространствами, (т. е. содержащими счетное всюду плотное множество). Каждое из пространств, указанных в предыдущем пункте, сепарабельно (докажите это!). Пример несепарабельного евклидова пространства можно построить так. Рассмотрим на прямой всевозможные функции х, для каждой из которых множество точек tt, t2, ..., в которых она отлична от нуля, не более чем счетно, а сумма %x2(t), взятая по всем таким точкам, конечна. Операции сложения и умножения на числа определим в этом пространстве как обычные сложение и умножение функций, а скалярное произведение определим формулой
(х, =
где сумма берется по множеству тех точек t, в которых x(/)z/(/)У= 0. Доказательство того, что в этом пространстве нет Счетного всюду плотного подмножества, мы предоставляем читателю. Отметим, что это пространство — полное.
Итак, пусть R— сепарабельное евклидово пространство. Покажем, что в таком пространстве всякая ортогональная система не более чем счетна.
Действительно, без ограничения общности можно считать рассматриваемую систему {фа} не только ортогональной, но и Нормированной (иначе мы заменили бы ее системой { ~у~фЦ ц~} ) • При этом
II Фа — Ф(3 II = V2 , если а у= 0.
Рассмотрим совокупность шаров В(<ра, 1/2). Эти шары не пересекаются. Если счетное множество {фп} всюду плотно в R, то в каждом таком шаре есть по крайней мере один элемент из {фп}. Следовательно, число таких шаров (а значит, и элементов <ра) не более чем счетно.
В каждом из приведенных выше примеров евклидовых пространств мы указали по ортогональному базису. Докажем теперь следующую общую теорему, аналогичную теореме о существовании ортогонального базиса в n-мерном евклидовом пространстве.
Теорема 1 (об ортогонализации)./?усть
A. f2, .... fa, ...	(8)
148	НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. Ш
— линейно независимая система элементов в евклидовом пространстве R. Тогда в R существует система элементов
Ф1, Ф2,	..... (9)
удовлетворяющая следующим условиям-.
1)	система (9) ортогональная и нормированная-,
2)	каждый элемент фп есть линейная комбинация элементов h, f2,
фп = аП1Л+ ••• +annfn, причем аПп =/= 0;
3)	каждый элемент fn представляется в виде
Л,==Ь„1Ф1+ ••• +&ппфп, причем Ьпп^=0.
Каждый элемент системы (9) определяется условиями 1)—3) однозначно с точностью до множителя ±1.
Доказательство. Элемент <pi ищется в виде Ф1 = «нА; при этом «и определяется из условия
(Фо Ф1) = а?1 (Л. А)=1.
откуда
1 ±1 a, j =-—	.
bn л/(4> fi)
Ясно, что (pi определяется этим однозначно (с точностью да знака). Пусть элементы фь(й < и), удовлетворяющие условиям 1)—3), уже построены. Тогда fn можно представить в виде
/л = ^П1Ф1+ ••• + ^л.л-1фл-1 + Лп> где
(Л„, Фа) — 0 при k < п.
Действительно, соответствующие коэффициенты йпа, а значит, и элемент hn, однозначно определяются из условий
(ЙЛ, Фй) = (/л—^Л1Ф1—•• •—^л,л-1Фл-1, Фа) = (/л, Фа)~&лА(фА. ф*)=0.
Очевидно, что (Лп, йп) > 0 (предположение (hn, йя) = 0 про-тнворечило бы линейной независимости системы (8)). Положим ______________________________
Фл “ V(*n,M ’
Из индуктивного построения ясно, что hn, а значит, и <рп^ выражаются через /ь ..., fn, т. е. фп = an\fi + ... + annfn, где ann==—ir=T =^°- Кроме того, V(Лп> ”п)
(фл> Фл) = 1 > (фп, Фа) = 0	(k<n)
и	______
fn = &л|ф, + • • • + ЛллФл (bnn = V(hn, hn) ф 0),
т. е. фл удовлетворяет условиям теоремы.
$4]	ЕВКЛИДОВЫ ПРОСТРАНСТВА	149
Переход от системы (8) к системе (9), удовлетворяющей условиям 1)—3), называется процессом ортогонализации.
Ясно, что подпространства, порожденные системами (8) и (9), совпадают между собой. Следовательно, эти системы полны или не полны одновременно.
Следствие. В сепарабельном евклидовом пространстве R существует ортогональный нормированный базис.
Действительно, пусть фь фг> ..., фп, ... — счетное всюду плотное множество в /?. Выберем из него полную систему линейно независимых элементов {fn}. Для этого достаточно из последовательности {фп} исключить все те элементы каждый из которых может быть представлен как линейная комбинация ф4 с i < k. Применив к полученной таким образом полной системе линейно независимых элементов процесс ортогонализации, мы и построим ортогональный нормированный базис.
Упражнения. 1. Привести пример (несепарабельного) евклидова пространства, в котором нет ни одного ортогонального базиса. Доказать, что В полном евклидовом пространстве (не обязательно сепарабельном) существует ортогональный нормированный базис.
2. Доказать, что в полном евклидовом пространстве (не обязательно сепарабельном) всякая последовательность непустых вложенных выпуклых замкнутых ограниченных множеств имеет непустое пересечение (ср. с упражнениями на стр. 70 и 143).
4. Неравенство Бесселя. Замкнутые ортогональные системы. Выбрав в n-мерном евклидовом пространстве ортогональный нормированный базис et, е2........еп, можно каждый вектор
хе Rn записать в виде
п
x=Eckek,	(10)
А=1 где
Ck = (x,ek).	(11)
Выясним, как обобщить разложение (10) на случай евклидова бесконечномерного пространства. Пусть
Ф1, Фг....(12)
— ортогональная нормированная система в евклидовом пространстве R и f — произвольный элемент из R. Сопоставим элементу f eR последовательности чисел
Ck = (f,4k), k=l, 2................... (13)
которые мы будем называть координатами, или коэффициентами Фурье элемента f по системе {фл}, и ряд (пока формальный)
Еэдрь	(14>
k
который мы назовем рядом Фурье элемента / по системе {фп}.
150
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ, III
Естественно возникает вопрос: сходится ли ряд (14), т. е. стремится ли последовательность его частичных сумм (в смысле метрики пространства /?) к какому-либо пределу, и если он сходится, то совпадает ли его сумма с исходным элементом /?
Чтобы ответить на эти вопросы, рассмотрим предварительно следующую задачу: при заданном п подобрать коэффициенты ак (k = I, 2.....п) так, чтобы расстояние между f и суммой
5л = Еал	(15)
t=i
было минимальным. Вычислим это расстояние. Так как система (12) ортогональна и нормирована, то
II f — s„ ||2 = 6 — £ f — Е адЛ = \	&=t	fe=i /
= (Л f) — 21 f, E адч) + ( E адь E ад/1 =
\ k=l /	\ft=!	/=1	/
n	n	n	n
=Il f if - 2 E w + E «5 - ll f if - E A + E («, -ft=l	я=1
Ясно, что минимум этого выражения достигается тогда, когда последнее слагаемое равно 0, т. е. при
ак — ск (k— 1, 2, ..., п).	(16)
В этом случае
1И-5л||2 = НЛ12-Еф	(17)
Мы показали, что среди всех сумм вида (15) при данном п наименее уклоняется от f частичная сумма ряда Фурье элемента f. Геометрически этот результат можно пояснить следующим образом. Элемент
f — Е й=1
ортогонален всем линейным комбинациям вида
Е Мь
t=i
т. е. ортогонален подпространству, порожденному элементами фь <Р2, ' •, фп, в том и только том случае, когда выполняется условие (16) (проверьте это!). Таким образом, полученный нами результат представляет собой обобщение известной теоремы элементарной геометрии: длина перпендикуляра, опущенного ид
ЕВКЛИДОВЫ ПРОСТРАНСТВА
15Г
»«1
данной точки на прямую или плоскость, меньше, чем длина любой наклонной, проведенной из той же точки.
Так как всегда ||/— Sn||2	0, то из равенства (17) сле-
дует, что п
Z c2k <11 лр.
*=1
Здесь п произвольно, а правая часть не зависит от п; следова-сю
тельно, ряд У С1 сходится и 4=1 ®
fc2<||/|p.	(18)’
4=1 к
Это неравенство называется неравенством Бесселя. Геометрически оно означает, что сумма квадратов проекций вектора f на взаимно ортогональные направления не превосходит квадрата длины самого вектора f.
Введем следующее важное понятие.
Определение 1. Ортогональная нормированная система (12) называется замкнутой, если для любого f^R справедливо равенство
Г С2 =11/ IP,	(19>-
4=1
называемое равенством Парсеваля.
Из тождества (17) следует, что замкнутость системы (12) равносильна тому, что для каждого f е R частичные суммы ряда оо
Фурье £ спФл сходятся к f.
п=!
Понятие замкнутости ортогональной нормированной системы тесно связано с введенным выше понятием полноты системы.
Теорема 2. В сепарабельном евклидовом пространстве R всякая полная ортогональная нормированная система является замкнутой, и обратно.
Доказательство. Пусть система {фп} замкнута; тогда, каков бы ни был элемент f е R, последовательность частичных сумм его ряда Фурье сходится к f. Это означает, что линейные-комбинации элементов системы {фп} всюду плотны в R, т. е. система {фп} полна. Обратно, пусть система {фп} полна, т. еЛлюбой элемент f^R можно сколь угодно точно аппроксимировать ли-п
нейной комбинацией S а4<Р4 элементов системы {фп}; частич-4=1
п
ная сумма У, ck<pk ряда Фурье для f дает не менее точную
152
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. П[
аппроксимацию. Следовательно, ряд ckqk сходится к f, и ра-£=1
венство Парсеваля имеет место.
В предыдущем пункте мы доказали существование полных ортогональных нормированных систем в сепарабельном евклидовом пространстве. Поскольку для ортогональных нормированных систем понятия замкнутости и полноты совпадают, существование замкнутых ортогональных систем в R не нуждается в новом доказательстве, а приведенные в предыдущем пункте примеры полных ортогональных нормированных систем являются в то же время примерами замкнутых систем.
Выше мы все время предполагали рассматриваемые ортогональные системы нормированными. Можно переформулировать понятия коэффициентов Фурье, ряда Фурье и т. д. и для любых ортогональных систем. Пусть {фп}— произвольная ортогональная система. По ней можно построить нормированную систему, состоящую из элементов -".г. Для любого f^R имеем
II фп II
Cn = (f. Фп) = (Л Фп)
И
СО	ОО	со
X спФп = X Ф” = X art<Pn’ п=1	П=1	п=1
где
___ сп ____ (ft фп) П~ ||фп|| ~ II Фп II2 •
Коэффициенты ап, определяемые формулой (20), мы назовем коэффициентами Фурье элемента f по ортогональной (ненормированной) системе {<рп}- Подставив в неравенство (18) вместо сп их выражения сп = ап11фп11 из (20), получаем
ОО
I ||Фп1К<ИЛ12	(21)
П=1
— неравенство Бесселя для произвольной ортогональной системы.
5. Полные евклидовы пространства. Теорема Рисса — Фишера. Начиная с п. 3 мы рассматривали сепарабельные евклидовы пространства; с этого момента мы будем, кроме того, предполагать, что рассматриваемые пространства полны.
Итак, пусть R — полное сепарабельное евклидово пространство и {фп} — некоторая ортогональная нормированная система в нем (не обязательно полная). Из неравенства Бесселя следует, что для того чтобы числа Сь С2> гп, ... служили ко-
(20)
4 4)	ЕВКЛИДОВЫ ПРОСТРАНСТВА	153
эффициентами Фурье какого-либо элемента f е R, необходимо, чтобы ряд
ОО
сходился. Оказывается, что в полном пространстве это условие не только необходимо, но и достаточно. Именно, справедлива следующая теорема.
Теорема 3 (Рисе — Фишер). Пусть {<рп} — произвольная ортогональная нормированная система в полном евклидовом пространстве R, и пусть числа
ci> с2, ..., сп, ...
таковы, что ряд
Z cl	(22)
А=1
сходится. Тогда существует такой элемент f е R, что
с» = if, 4>k) и
D = llf IP-
fe=l
Доказательство. Положим
п
f П	S
k=i
Тогда
II fn+p	fn IP II £n+14Pn + l H- • • • H- Cn+pTn+p IP == 2C c?.
fe=n+l
Так как ряд (22) сходится, то отсюда в силу полноты R вытекает сходимость последовательности {/п} к некоторому элементу f eR. Далее
(Л ф/) = (fn, Ф.) + (f — fn, фД	(23)
причем справа первое слагаемое при п i равно а, а второе стремится к нулю при п-*оо, так как
I if — fn, ф/) Kllf - Ml • IIФ/ II.
Левая часть равенства (23) от п не зависит; поэтому, переходя в нем к пределу при п-> оо, получаем, что
(Л ф/) =
154
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. III
Так как, по определению f,
II/ —/„||-*0 при то
п.
A=I Действительно,
(f — Ё Cfe<Pfe, f — Ё с*фЛ = (f, f) — Ё c2k ->o \ A=l	A=1	/	A=1
при n -> oo.
Установим в заключение следующую полезную теорему.
Теорема 4. Для того чтобы ортогональная нормированная система {<рп} в полном сепарабельном евклидовом пространстве была полна, необходимо и достаточно, чтобы в R не существовало ненулевого элемента, ортогонального всем элементам системы {фп}-
Доказательство. Пусть система {<рп} полна и, следовательно, замкнута. Если f ортогонален всем элементам системы {фп}, то все его коэффициенты Фурье равны нулю. Тогда из равенства Парсеваля получаем
(Л /) = Ё^ = о,
А=1 т. е. f = 0.
Обратно, пусть система {фп} не полна. Тогда в R существует такой элемент g ф 0, что
оо
(g, g) > Г cl (где ck = (g, фй)).
R=1
На основании теоремы Рисса — Фишера существует такой элемент f е R, что
if, Фа) = ck и (/, П = Ё 4-
Элемент f — g ортогонален всем ф,. Из неравенства
(Л F) = Ё cl < (g, g)
А=1
следует, что f — g 0.
Упражнения. 1. Пусть Н — полное евклидово пространство (не обязательно сепарабельное); тогда в нем существует полная ортогональная нормированная система {<ра) (см. упражнение 1 на стр. 149). Доказать, что для .всякого вектора f е Н справедливы разложения
/ = £(Афа)фа,	IIГII2 = £ (f. фа)2>
а	а
g 4]	ЕВКЛИДОВЫ ПРОСТРАНСТВА	155-
где в суммах, стоящих справа, имеется не более счетного числа отличных от О слагаемых.
2. Система {<ра} векторов евклидова пространства R называется тотальной, если в R не существует отличных от 0 векторов, ортогональных ко всем <ра. Теорема 4 означает, что в полном евклидовом пространстве тотальность, системы векторов эквивалентна ее полноте. Показать, что в неполных пространствах могут существовать тотальные, но не полные системы.
6. Гильбертово пространство. Теорема об изоморфизме. Продолжим рассмотрение полных евклидовых пространств. При этом нас, как и до сих пор, будут интересовать бесконечномерные пространства, а не конечномерные, исчерпывающее описание которых дается в курсах линейной алгебры. По-прежнему мы, как правило, будем предполагать наличие в рассматриваемых пространствах счетного всюду плотного множества. Введем следующее определение.
Определение 2. Полное евклидово пространство бесконечного числа измерений называется гильбертовым пространством ').
Таким образом, гильбертовым пространством называется совокупность И элементов f, g, ... произвольной природы, удовлетворяющая следующим условиям (аксиомам).
I.	Н есть евклидово пространство (т. е. линейное пространство с заданным в нем скалярным произведением).
II.	Пространство Н полно в смысле метрики p{f,g) = = llf-gll.
III.	Пространство Н бесконечномерно, т. е. в нем для любого п можно найти п линейно независимых элементов.
Чаще всего рассматриваются сепарабельные гильбертовы пространства, т. е. пространства, удовлетворяющие еще одной аксиоме.
IV.	Н сепарабельно, т. е. в нем существует счетное всюду плотное множество.
Примером сепарабельного гильбертова пространства может служить действительное пространство /г-
В дальнейшем мы будем рассматривать только сепарабельный случай.
Аналогично определению 2 из § 1 два евклидовых пространства, R и R*, называются изоморфными, если между их элементами можно установить взаимно однозначное соответствие так,, что если
х <-> х', у++у*
(х, у е R; X*, у* е R*),
’) По имени знаменитого немецкого математика Д. Гильберта (1862— 1943), который ввел это понятие.
156
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. Щ
ТО
X + у X* + у*, ах -*-> ах*
и
(х, у} = « у*).
Иначе говоря, изоморфизм евклидовых пространств — это взаимно однозначное соответствие, сохраняющее как линейные операции, определенные в этих пространствах, так и скалярное произведение.
Как известно, любые два n-мерных евклидовых пространства изоморфны между собой и, следовательно, каждое такое пространство изоморфно арифметическому пространству Rn (пример 1, п. 2). Евклидовы пространства бесконечного числа измерений не обязательно изоморфны друг другу. Например, пространства /2 и С2[а, Ь] между собой не изоморфны. Это видно, например, из того, что первое из них полно, а второе — нет.
Однако имеет место следующий факт.
Теорема 5. Любые два сепарабельных гильбертовых пространства изоморфны между собой.
Доказательство. Покажем, что каждое гильбертово пространство Н изоморфно пространству /2. Тем самым будет доказано утверждение теоремы. Выберем в Н произвольную полную ортогональную нормированную систему {<рп} и поставим в соответствие элементу f е Н совокупность Ci, с2, ..., сп, ... его оо коэффициентов Фурье по этой системе. Так как £ с2 < оо, то fe=i к
последовательность (сд, с2, ..., сп, ...) есть некоторый элемент из 12. Обратно, в силу теоремы Рисса — Фишера всякому элементу (ci, с2, ..., сп,  • •) из 12 отвечает некоторый элемент имеющий числа сь с2, ..., сп, ... своими коэффициентами Фурье. Установленное соответствие между элементами из Н в 12 взаимно однозначно. Далее, если
f с2, ..., сп, ...) и
g*+(dh d2.....dn, ...),
то
f + g4-> (ci + db с2 + d2.сп + dn, ...)
и
а/-«-> (ctC], ас2, ..., асп, ...),
т. е. сумма переходит в сумму, а произведение на число — в произведение соответствующего элемента на это же число. Наконец, из равенства Парсеваля следует, что
(f,g^Ycndn.	(24)
л=1

ЕВКЛИДОВЫ ПРОСТРАНСТВА
157
Действительно, из того, что
(£,£)= f d’ п=1	п=1
И
tf + g, f + g) = (f, f) + 2(f, g) + (g, g) =
оо	оо	оо	оо
= S (С.+о1 = Sл + 2 s с А + У п=1	п=1	п=1	П=1
(вытекает (24). Таким образом, установленное нами соответствие между элементами пространств Н и 12 действительно является изоморфизмом.
Доказанная теорема означает, что, с точностью до изоморфизма, существует лишь одно (сепарабельное) гильбертово пространство (т. е. система аксиом I—IV полна) и что пространство /2 можно рассматривать как его «координатную реализацию», подобно тому как n-мерное арифметическое простран-п
ство со скалярным произведением х1у1 представляет собой ..	i = I
координатную реализацию евклидова пространства п измерений, заданного аксиоматически.
Другую реализацию гильбертова пространства можно получить, взяв функциональное пространство С2[а, Ь] и рассмотрев его пополнение. Действительно, легко проверить, что пополнение R* всякого евклидова пространства R (в том смысле, как мы определили пополнение метрического пространства в § 3 гл. II) становится линейным евклидовым пространством, если в нем определить линейные операции и скалярное произведение, продолжая их по непрерывности с пространства R, т. е. полагая
х + у = lim (хп + уп), ах = lim ахп
и
(х, у) — lim (хп, уп), П-Х»
где хп -> х и уп -> У, хп, Уп е R. (Существование всех этих пределов и их независимость от выбора последовательностей {хп} и {//„} легко устанавливается). Тогда пополнение пространства С2[а, Ь] будет полным евклидовым пространством, очевидно, бесконечномерным и сепарабельным, т. е. гильбертовым пространством. В главе VII мы вернемся к этому вопросу и покажем, что те элементы, которые нужно присоединить к С2[а, &], чтобы получить полное пространство, тоже можно представить как функции, но только уже не непрерывные (а именно, как функции, квадрат которых суммируем в смысле Лебега).
158
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. пг
7. Подпространства, ортогональные дополнения, прямая сумма. В соответствии с общими определениями § 3 линейным многообразием в гильбертовом пространстве Н мы назовем такую совокупность L элементов из Н, что если f, g е L, то а/ + Pg е L для любых чисел а и р. Замкнутое линейное многообразие называется подпространством. Приведем некоторые примеры подпространств гильбертова пространства.
1.	Пусть h — произвольный элемент из Н. Совокупность всех элементов f е Н, ортогональных к h, образует в Н подпространство.
2.	Пусть Н реализовано как 12, т. е. его элементы суть такие последовательности (Xj, х2, хп, ...) чисел, что Лх?<оо.
к
Элементы, подчиненные условию Xj = х2, образуют подпространство.
3.	Пусть снова Н реализовано как пространство 12. Элементы х = (х\, х2, хп, ...), у которых хп = 0 при п = 2, 4, 6, ... (и хп произвольны при п= 1, 3, 5, ...), образуют подпространство.
Читателю рекомендуется проверить, что указанные в примерах 1—3 совокупности векторов действительно являются подпространствами.
Всякое подпространство гильбертова пространства либо является конечномерным евклидовым пространством либо само представляет собой гильбертово пространство. Действительно, справедливость аксиом I—III для каждого такого подпространства очевидна, а справедливость аксиомы IV вытекает из следующей леммы.
Лемма. Любое подмножество R' сепарабельного метрического пространства R само сепарабельно.
Доказательство. Пусть
£1> ^2> • • • >	• • •
— счетное всюду плотное множество в R и an= inf p(g„, т]).
Для любых натуральных пит найдется такая точка г)п, m е R', что
Р Лт. т) <	4“ 1/ш.
Пусть е > 0 и \/пг < е/3; для любого г) е R' найдется такое п„ что р(^п, т))< е/3 и, следовательно,
Р (In. П™. m) < ап + Ш < е/3 + е/3 = 2е/3;
но тогда р (т), т)п, т) < е, т. е. не более чем счетное множество {т)п, т} (п, m — 1, 2, ...) всюду плотно в R'.
4 4]
ЕВКЛИДОВЫ ПРОСТРАНСТВА
159
Подпространства гильбертова пространства обладают некоторыми специальными свойствами (не имеющими места для лодпространств произвольного нормированного пространства). Эти свойства связаны с наличием в гильбертовом пространстве скалярного произведения и основанного на нем понятия ортогональности.
Применив процесс ортогонализации к какой-либо счетной всюду плотной последовательности элементов произвольного лодпространства гильбертова пространства, получаем следующую теорему.
Теорема 6. В каждом подпространстве М пространства Н содержится ортогональная нормированная система {фп}, линейное замыкание которой совпадает с М.
Пусть М — подпространство гильбертова пространства Н. Обозначим через
M± = HQM
множество элементов g Н, ортогональных ко всем элементам / е М, и докажем, что тоже есть подпространство пространства И. Линейность А1-1 очевидна, так как из (g\, f) = (gz, f) = = 0 вытекает (aigi + azgz, f) = 0. Для доказательства замкнутости допустим, что элементы gn принадлежат М1 и сходятся к g. Тогда для любого f е Al
(g, f) = Пт (gn, f) = 0, n->oo
и потому g тоже входит в Al-1-.
Подпространство М1- называется ортогональным дополнением подпространства М.
Из теоремы 6 легко получается следующая теорема.
Теорема 7. Если М—(замкнутое!) линейное подпространство пространства Н, то любой элемент f^H единственным образом представим в виде f — h + h', где h М и h' е Al1.
Доказательство. Докажем сначала существование такого разложения. Для этого найдем в А1 полную ортогональную нормированную систему {фп} и положим
оо
А = £ СпФп, сп = (f, ф„). л=1
оо
Так как (по неравенству Бесселя) ряд У, с2п сходится, то эле-п=1
мент h существует и принадлежит А4. Положим
h' = f — h.
160
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. III
Очевидно, что для всех п (Л', <рп)=0 и, поскольку произвольный элемент £ из М представим в виде
ОО
£= £ «Пфп.
п—1 имеем оо
(А', £)=!«„ (Л', <р„) = 0,
П=1
т. е. h' е Л11.
Допустим теперь, что, кроме построенного нами разложения f = h + h', существует другое разложение:
f = hi + hi, hi^M,
Тогда при всех п
<fn) = (f, фп) = с„, откуда следует, что
hi = h, h'\ = h'.
Из теоремы 7 вытекают некоторые полезные следствия.
Следствие 1. Ортогональное дополнение к ортогональному дополнению линейного подпространства М совпадает с самим М.
Таким образом, можно говорить о взаимно дополнительных подпространствах пространства Н. Если М и Л41 — два таких дополняющих друг друга подпространства и {фп}, {<p'j—полные (соответственно в М и Л!1) ортогональные системы, то соединение систем {ф„} и {<р'} дает полную ортогональную систему во всем пространстве Н. Поэтому имеет место следствие:
Следствие 2. Каждая ортогональная нормированная система может быть расширена до системы, полной в Н.
Если система {фп} конечна, то число входящих в_н.ее элементов равно размерности подпространства М, порожденного {фп}, и коразмерности подпространства Л1-1-. Таким образом, получаем еще одно следствие:
Следствие 3. Ортогональное дополнение к пространству конечной размерности п имеет коразмерность п, и наоборот.
Если каждый вектор f е Н представим в виде f == h + h', h^M, h' e M1 (M1 — ортогональное дополнение M), то говорят, что Н есть прямая сумма взаимно ортогональных подпространств М и М1 и пишут
Я = МфЛ1-Ч
Ясно, что понятие прямой суммы может быть непосредственно обобщено на любое конечное или даже счетное число подпро
ЕВКЛИДОВЫ ПРОСТРАНСТВА
161
«*]
странств; именно, говорят, что Н есть прямая сумма своих подпространств М>, М2, ..., Мп, ...
H = Mi®M2® ... ©Мяф..., если
1) подпространства Mi попарно ортогональны, т. е. любой вектор из Mi ортогонален любому вектору из Mh при Г=/= й;
2) каждый элемент f е Н может быть представлен в виде
f = hx + h2+ ... +hn + ..., hnf=Mn,
причем если число подпространств Мп бесконечно, то ^||ЛЛ||2 — п
сходящийся ряд. Легко проверить, что если такое представление элемента f существует, то оно единственно и что
llflF = Zll/in II2. п
Наряду с прямой суммой подпространств можно говорить о прямой сумме конечного или счетного числа произвольных гильбертовых пространств. Именно, если Hi и Н2— два гильбертовых пространства, то их прямая сумма Н определяется следующим образом: элементы пространства Н— это всевозможные пары (hi,h2), где hx е Hit h2^.H2, а скалярное произведение двух таких пар равно
((hi, h2), (hi, h'2)) = (hi, hi) + (h2, h2).
В пространстве H содержатся, очевидно, взаимно ортогональные подпространства, состоящие из пар вида (hi,0) и (0, h2) соответственно; первое из них можно естественным образом отождествить с пространством Hi, а второе — с пространством Н2.
Аналогично определяется сумма любого конечного числа пространств. Сумма H — ^QHn счетного числа пространств Hi, Н2, ..., Нп, ... определяется так: элементы пространства Н — это всевозможные последовательности вида
h = (hi, h2, • ., hn, ...)	(hns=H„),
такие, что У, || hn |р < оо. Скалярное произведение (h, g) эле-п
ментов h и g из Н равно
Е(й„, ёп)-п
8. Характеристическое свойство евклидовых пространств. Рассмотрим следующий вопрос. Пусть R— нормированное пространство. Каким дополнительным условиям должна удовлетворять норма, определенная в R, чтобы пространство R было евклидовым, т. е. чтобы норма в нем определялась некоторым
162
нормированные и топологические пространства
[ГЛ. ш
скалярным произведением? Иначе говоря, как охарактеризовать евклидовы пространства в классе всех нормированных пространств? Такую характеристику дает следующая теорема.
Теорема 8. Для того чтобы нормированное пространство R было евклидовым, необходимо и достаточно, чтобы для любых двух элементов, fug, выполнялось равенство
II f + g II2 + II f - g II2 = 2 (II f II2 + II g ||2).	(25)
Поскольку f + g и f — g — это диагонали параллелограмма, построенного на сторонах f и g, равенство (25) выражает известное свойство параллелограмма в евклидовом пространстве: сумма квадратов диагоналей параллелограмма равна сумме квадратов всех его сторон. Таким образом, необходимость условия очевидна. Докажем его достаточность. Положим
(f, £) = |(llf + £ll2-|lf-£ll2),	(26)
и покажем, что если равенство (25) выполнено, то функция (26) удовлетворяет всем аксиомам скалярного произведения. Поскольку при f = g имеем
(f, f) = т (II 2f II2 - II f - f II2) = II/ II2,	(27)
это и будет то скалярное произведение, которое порождает в пространстве R заданную там норму.
Прежде всего, из (26) сразу видно, что
(f, g) = (g, Г),
т. е. свойство 1) скалярного произведения выполнено. Кроме того, в силу (27) имеет место и свойство 4). Для установления свойства 2) рассмотрим функцию трех векторов
Ф(/, g, A) = 4[(f + g, h)-(f, h)-(g, h)], t. e.
W, g, h) = \\f + g + h\\2-\\f + g-h\?-
- II f + h ||2 +1| f - h ||2 - || g + h ||2 +1| g - h ||2, (28)
и покажем, что она тождественно равна нулю. В силу (25) имеем
||f + g ± h ||2 = 2|| f ± /г |]2 + 2|| g||2-1| f ± h - g||2.
Подставив соответствующие выражения в (28), получим Ф(А g, h) = -\\f + h-gf+\\f-h-g\? +
+ II f + A ||2 — || f —/г ||2 — Hg + А||2+ 11 g —A ||2. (29)
,4]	ЕВКЛИДОВЫ ПРОСТРАНСТВА	163
Взяв полусумму (28) и (29), имеем
Ф(/, g> Л) = у(11 g + h + f II2 + || g + h - f ||2) -
- у (llg - h + f II2 + llg - h - f ||2) -1| g + A||2 +||g - /i||2.
В силу (25) первое слагаемое равно
II g + h 112 +1| f 112, а второе — равно
— II g — A ||2 — II f II2,
Таким образом, Ф(/, g, л>о.
Установим, наконец, свойство 3)—однородность скалярного произведения. Рассмотрим для этого при любых фиксированных f и g функцию
ф(с) = (с/, g) — c(f, g).
Из (26) сразу следует, что
<p(o)=4dlgll2-llglP)=o
и <р(— 1) — 0, поскольку (—f, g)= — (f, g). Поэтому для любого целого п
(nf, g) = (sgn п (f + ... + f), g) =
= sgnn[(f, g)+ ... +(f, g)] = |n|sgnn(f, g) = n(f, g),
t. e. <p(n) = 0. При целых p, q и q ф 0
(fA g)=p(yf. g) = f?(|A g) = ftf. g).
t. e. <p(c) = O при всех рациональных c\ поскольку функция <р непрерывна,
<р(с) =0.
Тем самым мы показали, что функция (f, g) обладает всеми свойствами скалярного произведения.
Примеры. 1. Рассмотрим n-мерное пространство Rp, в котором норма определена формулой
/ п	\(/Р
||х||р = ( Е|х*И . \fe=l	/
При р 1 все аксиомы нормы выполнены, однако евклидовым пространством Rp будет только при р = 2. Действительно, рассмотрим в Rp два вектора:
f = (1, 1, 0, 0..0),
g = (l, -1, 0, 0, .... 0);
164
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
[ГЛ. П[
имеем
f + g = (2, 0, 0..0),
f-g = (O, 2, 0....0),
откуда
II f llP = II g ИР = 21/р, llf + g||p = llf-gl|p = 2,
так что тождество параллелограмма (25) при р#= 2 не выполняется.
2. Рассмотрим пространство непрерывных функций на отрезке [0, п/2]. Положим
f(/) = cos/, g(t) — sint.
Имеем
llfll = llgll=l
и
llf+g|| = max | cos t + sin/1 = -y/2 ,
0<t<n/2
Ilf —g 11 = max | cos/— sin/1= 1.
0<(<Я/2
Отсюда видно, что
Ilf + gll2 + llf-gll2^2(||f||2 + U||2).
Таким образом, норму пространства С[0, л/2] нельзя задать с помощью какого бы то ни было скалярного произведения. Легко видеть, что и пространство непрерывных функций С[а,Ь] на любом отрезке [а, &] не есть евклидово пространство.
9. Комплексные евклидовы пространства. Наряду с действительным может быть введено и комплексное евклидово пространство (т. е. комплексное линейное пространство со скалярным произведением в нем). Однако аксиомы 1)—4), сформулированные в начале этого параграфа, не могут быть в комплексном пространстве выполнены одновременно. Действительно, из 1) и 3) следует
(Лх, Лх) = V (х, х),
откуда при к — i имеем
(/х, /х) — — (х, х),
т. е. скалярные квадраты векторов х и /х не могут быть одновременно положительны. Иными словами, аксиомы 1) и 3) несовместимы с аксиомой 4). Поэтому аксиомы, с помощью которых определяется скалярное произведение, в комплексном случае должны быть несколько изменены по сравнению с действительным. В комплексном пространстве скалярное произве
« 4J
ЕВКЛИДОВЫ ПРОСТРАНСТВА
165
дение мы определим как числовую (комплекснозначную) функцию двух векторов, удовлетворяющую следующим условиям:
1)	(х,у) = (у7х),
2)	(Ах, z/) = А(х, у),
3)	(Х1 + у) = (х1( у) + (х2, у},
4)	(х, х) 0, причем (х, х) > 0, если х=£0. (Таким образом, мы внесли поправку в первую аксиому, сохранив три остальные без изменений.) Из условий 1) и 2) следует, что (х, Ау) = = А (х, у). Действительно,
(х, >.у) = (Ху, х) = К (у, х) = А (х, у).
Хорошо известный пример комплексного евклидова пространства п измерений — это линейное пространство Сп (§1, пример 2), в котором скалярное произведение элементов
X = (хь х2, ..., х„) и у = (yi, уъ . . ., 1/„) определяется формулой
п
(X, у)= ^xkyk.
fe=l
Как известно, всякое комплексное евклидово пространство размерности п изоморфно этому пространству.
Примерами бесконечномерных комплексных евклидовых пространств могут служить:
1) комплексное пространство /2, в котором элементы — это последовательности комплексных чисел
х = (х,, х2...х„, ...),
удовлетворяющие условию
£|х„|2<оо,
п=1
а скалярное произведение определяется формулой
оо
(я, у)== хпуп',
п=1
2) пространство С2[а, &] комплекснозначных непрерывных •функций на отрезке [а, &] со скалярным произведением
ь
(f,
а
В комплексном евклидовом пространстве длина (норма) вектора определяется, как и в действительном случае, формулой
166
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. пт
Понятие угла между векторами в комплексном случае обычно не вводят (поскольку величина ’ д х ।. д у ц' • вообще говоря, комплексна и может не быть косинусом какого-либо действительного угла); однако понятие ортогональности сохраняется: элементы х и у называются взаимно ортогональными, если (х, у} = = 0.
Если {фп}—какая-либо ортогональная система в комплексном евклидовом пространстве /?, и f — произвольный элемент из /?, то, как и в действительном случае, числа
Яп== фп)
называются коэффициентами Фурье, а ряд
£ ^пфл п
— рядом Фурье элемента f по ортогональной системе {фп}-Имеет место неравенство Бесселя:
ElWl ап |2<(f, f). п
В частности, если система {фп} ортогональна и нормирована, то коэффициенты Фурье по такой системе определяются формулами
cn = (f, Ф„),
а неравенство Бесселя имеет вид
Zlc„|2<(f, f). п
Полное комплексное евклидово пространство бесконечной размерности называется комплексным гильбертовым пространством. На комплексный случай переносится теорема об изоморфизме-гильбертовых пространств:
Теорема 9. Все сепарабельные комплексные гильбертовы. простр,анства изоморфны между собой.
Простейшей реализацией комплексного гильбертова пространства является комплексное пространство /г- С другой, функциональной, реализацией комплексного гильбертова пространства мы познакомимся в гл. VII.
Предоставляем читателю проверить, что все теоремы, доказанные выше для действительных евклидовых, в частности гильбертовых, пространств, справедливы (с незначительными-изменениями, учитывающими комплексность скалярного произведения) и для комплексных пространств.
5 5]
ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА
167
§ 5.	Топологические линейные пространства
1.	Определение и примеры. Задание нормы — лишь один из возможных способов введения топологии в линейном пространстве. Развитие таких областей функционального анализа, как теория обобщенных функций (о них будет сказано в следующей главе), показало, что во многих случаях полезно рассматривать линейные пространства с топологией, задаваемой не с помощью нормы, а каким-либо иным способом.
Определение 1. Множество Е называется топологическим, линейным пространством, если
I.	Е представляет собой линейное пространство (с умножением элементов на действительные или комплексные числа).
II.	Е является топологическим пространством.
III	. Операции сложения и умножения на числа в Е непрерывны относительно заданной в Е топологии. Подробнее последнее условие означает следующее:
1) если го = Хо + г/о, то для каждой окрестности U точки z0 можно указать такие окрестности V и W точек Хо и у0 соответственно, что х + у е Е при х е V, у е W;
2) если ао*о = Уо, то для любой окрестности U точки у0 существуют такая окрестность V точки хо и такое число 8 > О, что ах е U при | а — а01 < е и х е V.
Из связи, существующей в линейном топологическом пространстве между алгебраическими операциями и топологией, вытекает, что топология в таком пространстве полностью определяется заданием системы окрестностей нуля. Действительно, пусть х — точка линейного топологического пространства Е, и U — некоторая окрестность нуля в Е. Тогда U -j- х — «сдвиг» этой окрестности на х — есть окрестность точки х; очевидно, что любая окрестность любой точки хеЕ может быть получена таким способом.
Из непрерывности операций сложения и умножения на числа в топологическом линейном пространстве Е непосредственно вытекают следующие утверждения.
1.	Если U, V — открытые множества в Е, то и множество И + V (т. е. совокупность всех элементов вида х + у, х е U, у е <= V) открыто.
2.	Если U открыто, то и множество KU (т. е. совокупность всех элементов вида Хх, х е U) при любом Z =У= О открыто.
3.	Если F замкнутое множество в Е, то и XF замкнуто при любом Л.
Примеры. 1. К топологическим линейным пространствам относятся прежде всего все нормированные пространства. Действительно, из свойств нормы сразу следует, что операции сложения векторов и умножения их на числа в нормированном
168 НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА [ГЛ. ИГ пространстве непрерывны в той топологии, которая определяется нормой.
2. Зададим определяющую систему окрестностей нуля в пространстве R°° всевозможных числовых последовательностей х = = (хь х2, хп, ...) так. Каждая окрестность U(ki, ..., kr', е) определяется целыми числами kit ..., kr и числом е> 0 и состоит из всех тех х е R°°, которые удовлетворяют условиям:
| < е, 1=1, 2, .... г.
Легко проверить, что задание этой системы окрестностей превращает R°° в линейное топологическое пространство. (Наряду с R°° можно рассматривать пространство С°° всех комплексных последовательностей.)
3. Пусть К[а, fe]— пространство бесконечно дифференцируемых ') функций на отрезке [а, 6]. Топологию в К [а, fe] определим с помощью следующей системы окрестностей нуля. Каждая такая окрестность Um, е определяется номером т и числом е, > О и состоит из всех функций <р, удовлетворяющих неравенствам
| <p(fc) (х) | < е,	k = 0, 1, 2, ..., т,
где — производная k-ro порядка от функции ср.
Тот факт, что в топологическом линейном пространстве топология связана с линейными операциями, определенными в нем, накладывает на его топологию довольно жесткие ограничения. Именно, в топологическом линейном пространстве Е точка х и не содержащее ее замкнутое множество имеют непересекаю-щиеся окрестности.
При доказательстве этого утверждения достаточно рассмотреть точку х = 0 и любое не содержащее ее замкнутое множество F. Положим U — E\F. В силу непрерывности операции вычитания в Е найдется такая окрестность нуля W, что W — W ед U. В качестве W можно взять пересечение окрестностей нуля и W2 таких, что х — у е U, если х gz Wj и у е W2. Проверим, что замыкание окрестности W содержится в U. Пусть у е [W7]. Тогда каждая окрестность точки у, в частности, у + W, содержит какую-либо точку z из W. Следовательно, z — у ^W, т. е. у е W — W ст U, что и утверждалось. При этом W и £\ [И?]-—искомые окрестности точки 0 и множества F соответственно.
Топологическое пространство называется /^-пространством, если оно удовлетворяет аксиоме отделимости Т], т. е. если любое его одноточечное подмножество замкнуто; очевидно, что линейное топологическое пространство есть /^-пространство тогда
') Т, е. имеющих производные всех порядков.
3 5]
ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА
169
и только тогда, когда пересечение всех окрестностей нуля не содержит ненулевых элементов. Топологические пространства, удовлетворяющие аксиомам отделимости 1\ и Т3, мы назвали в гл. II регулярными-, из доказанного в предыдущем абзаце следует, что топологическое линейное Т{-пространство регулярно.
В нормированных пространствах важную роль играет понятие ограниченного множества. Хотя там это понятие вводится при помощи нормы, оно может быть естественно сформулировано и для любых линейных топологических пространств.
Множество М, лежащее в топологическом линейном пространстве Е, назовем ограниченным, если для каждой окрестности нуля U существует такое п > 0, что W zo М при всех |Х|^ п.
Ясно, что для нормированных пространств это понятие ограниченности совпадает с ограниченностью по норме (т. е. с возможностью поместить данное множество внутрь некоторого шара ||х||	R). Пространство Е называется локально ограничен-
ным, если в нем существует хотя бы одно непустое открытое ограниченное множество. Всякое нормированное пространство локально ограничено. Примером пространства, не являющегося локально ограниченным, может служить пространство R00, указанное в примере 2 (докажите это!).
Упражнения. 1. Пусть Е— топологическое линейное пространство; докажите справедливость следующих утверждений:
(а)	множество М с. Е ограничено тогда и только тогда, когда для любой последовательности {xn) с. М и любой последовательности положительных чисел {е„}, стремящейся к нулю, последовательность 8пХп стремится к нулю;
(б)	если	и хп—► х, то {хп}—ограниченное множество;
(в)	если Е локально ограничено, то в нем выполняется первая аксиома счетности.
Выполнена ли первая аксиома счетности в пространстве R”?
2. Мы скажем, что множество М в топологическом линейном пространстве Е поглощается окрестностью нуля U, если существует такое X S> 0, что 1.U до М. Доказать, что в локально ограниченном пространстве существует фундаментальная система окрестностей нуля, взаимно поглощающих друг друга. Что можно принять за такую систему в нормированном пространстве?
2.	Локальная выпуклость. Произвольные топологические линейные пространства могут обладать свойствами, слишком уж далекими от привычных свойств евклидовых или нормированных пространств. Важный класс пространств, более общих, чем нормированные, но сохраняющих многие свойства последних, образуют так называемые локально выпуклые пространства.
Определение 2. Топологическое линейное пространство называется локально выпуклым, если в нем всякое непустое открытое множество содержит непустое выпуклое открытое подмножество.
170
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
1ГЛ. нг
Заметим, что если пространство Е локально выпукло, то-для любой точки ге£ и любой ее окрестности U найдется такая выпуклая ее окрестность V, что хе Vc Действительно, достаточно проверить справедливость этого утверждения для точки х = 0. Пусть U — какая-нибудь окрестность нуля. Найдется такая окрестность нуля V, что V— V cz U. Так как Е локально выпукло, то найдется непустое выпуклое открытое множество V'cz V; пусть у е V', тогда V'— у — выпуклая окрестность нуля, содержащаяся в U.
Всякое нормированное пространство локально выпукло. Действительно, в нем любое непустое открытое множество содержит некоторый шар. Таким образом, всякое нормированное пространство локально ограничено и локально выпукло. Можно показать, что, по существу, нормированными пространствами и исчерпывается класс пространств, обладающих обоими этими свойствами. Именно, назовем линейное топологическое пространство Е нормируемым, если та топология, которая имеется в Е, может быть задана с помощью некоторой нормы. Имеет место следующая теорема: всякое отделимое локально выпуклое и локально ограниченное линейное топологическое пространство нормируемо.
Упражнения 1. Докажите, что открытое множество U в топологическом линейном пространстве выпукло тогда и только тогда, когда U + U = = 2U.
2.	Пусть Е — линейное пространство; множество U с. Е называется симметричным, если из х е U следует — х U. Пусть & — семейство всех выпуклых симметричных подмножеств пространства Е, совпадающих со своим-ядром (см. § 2). Доказать справедливость следующих утверждений.
(а)	Семейство & является определяющим семейством окрестностей нуля для некоторой локально выпуклой отделимой топологии в пространстве Е' (эта топология называется ядерно-выпуклой).
(б)	Ядерно-выпуклая топология является сильнейшей из локально выпуклых топологий, в которых линейные операции в Е непрерывны.
(в)	Всякий линейный функционал на Е непрерывен относительно ядерно-выпуклой топологии.
3.	Счетно-нормированные пространства. Очень важным для анализа классом линейных топологических пространств оказались так называемые счетно-нормированные пространства. Для того чтобы сформулировать соответствующее определение, нам понадобится одно вспомогательное понятие.
Пусть в линейном пространстве Е заданы две нормы || • ||i и || • Цг- Они называются согласованными, если всякая последовательность {хп} из Е, фундаментальная по каждой из этих норм и сходящаяся к некоторому пределу хе £ по одной из них,, сходится к тому же пределу х и по второй норме.
Говорят, что норма Ц-lh не слабее, чем || • ||2, если существует такая постоянная с > 0, что llxill Зг с Цх||2 для всех х Е.
ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА
171
§ 5]
Если первая норма не слабее второй, а вторая — не слабее первой, то эти две нормы называются эквивалентными. Две нормы называются сравнимыми, -если одна из них не слабее другой.
Определение 3. Счетно-нормированным пространством называется линейное пространство Е, в котором задана счетная система попарно согласованных норм ||-||п- Всякое счетно-нормированное пространство становится линейным топологическим, если за определяющую систему окрестностей нуля принять совокупность множеств Ur, е, каждое из которых определяется номером г и положительным числом е и состоит из всех тех элементов х е Е, которые удовлетворяют условиям
IIX lit < е..|| X ||г < е.
Мы предоставляем читателю проверить, что такая система •окрестностей нуля действительно определяет в Е топологию, в которой операции сложения элементов и умножения их на числа непрерывны.
Заметим, что всякое счетно-нормированное пространство удовлетворяет первой аксиоме счетности, поскольку систему окрестностей нуля Ur, е можно заменить (не изменяя топологии) счетной подсистемой, в которой е принимает лишь значения 1, 1/2, 1/3, ..., 1/п, ... Более того, топология в счетно-нормированном пространстве может быть задана при помощи некоторой .метрики, например, такой:
оо
р(х, у) = У 2~п -1-1*~у||д|| , х, у<=Е.	(1)
г \	2_1	1 +1| х — у ||п ’ ’ у	'
л=1
Предлагаем читателю проверить, что функция р(х, у) удовлетворяет всем аксиомам расстояния и инвариантна относительно сдвигов (т. е. p(x-|-z, У + z) — р(х, у), х, у, z^E) и что порождаемая ею топология совпадает с исходной. Таким образом, мы получаем возможность говорить о полноте счетно-нормированного пространства, понимая под этим полноту относительно введенной выше метрики. Заметим еще, что последовательность {-*/<} фундаментальна относительно метрики (1) тогда и только тогда, когда она фундаментальна относительно каждой из норм II • ||п, и сходится (в этой метрике) к элементу х^Е тогда и только тогда, когда она сходится к х по каждой из норм || • ||п. Иными словами, полнота счетно-нормированного пространства означает, что в нем всякая последовательность, фундаментальная по каждой из норм || • ||п, сходится.
Примеры. 1. Важным примером счетно-нормированного пространства служит рассмотренное выше пространство К[а, Ь] "бесконечно дифференцируемых функций на отрезке, если счи
172
НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
(ГЛ. пт
тать, что норма ||-||т в этом пространстве определяется формулой
sup ifwm
а< t < b
0<
Очевидно, что все эти нормы согласованы между собой и что они определяют в Л [a, fe] ту самую топологию, которая была описана выше.
2.	Пусть Soo — пространство всех бесконечно дифференцируемых функций на прямой, стремящихся на бесконечности к нулю вместе со всеми своими производными быстрее,'чем 1/|/| в любой степени (т. е. удовлетворяющих условию	при
|£|->оо при любых фиксированных k и q). В этом пространстве определим счетную систему норм, положив
llfllm = sup	m = 0, 1, 2, ...
k, q^m — oo < t < 00
Нетрудно проверить, что эти нормы согласованы между собой. Таким образом, Soo — счетно-нормированное пространство.
3.	Важный частный случай счетно-нормированных пространств— так называемые счетно-гильбертовы пространства. Пусть Н — линейное пространство, в котором задана счетная система скалярных произведений (<р, ф)п, причем предположим, что нормы ||ф||п = дЛ<Р> ф)п> отвечающие этим скалярным произведениям, согласованы между собой. Если такое пространство полно, то оно называется счетно-гильбертовым пространством.
4.	Конкретным примером счетно-гильбертова пространства может служить следующее пространство. Пусть Ф — совокупность всех таких числовых последовательностей {хп}, для которых при каждом целом k 0 ряд
00
п=1
сходится. Зададим в этом пространстве счетную систему норм, положив	_______
II* life = Д/ Д пкхп‘
Нетрудно проверить, что эти нормы согласованы между собой и что Ф полно в указанном выше смысле. Ясно, что каждую из норм ||-На можно задать с помощью скалярного произведения
• 00
(х, y)k = S Пкхпуп,
Л=1
§ 5]	ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА	173
т. е. Ф есть счетно-гильбертово пространство. Оно называется пространством быстро убывающих последовательностей.
Если Е— счетно-нормированное пространство, то заданные в нем. нормы || • На можно считать удовлетворяющими условию
II х lit < II х ||, при k<l,	(2)
так как иначе мы могли бы нормы ||х]|а заменить нормами
IIXlife = sup(IIX||j, IIX||2, .... IIXlife),
определяющими в Е ту же самую топологию, что и исходная система норм. Пополнив пространство Е по каждой из норм || • ||а, мы получим систему полных нормированных пространств Ek-При этом из соотношения (2) и согласованности норм следует, что имеются естественные вложения
Ek Et при k < I.
Таким образом, каждому счетно-нормированному пространству Е можно сопоставить убывающую цепочку полных нормированных пространств
ОО
Е} =) Е2 =) ... => Ek => ...; 0 Efe => £• fe=i
Можно показать, что пространство Е полно тогда и только то-ОО
гда, когда Е= П Ек (докажите это!). Так, например, пространство К[а, &] бесконечно дифференцируемых функций на отрезке [а, &] есть пересечение полных нормированных пространств Сп[а, &] (п = 0, 1,2, ...), где Сп[а, &] состоит из функций, имеющих непрерывные производные до n-го порядка включительно, а норма в нем определяется формулой
||/||„= sup |/W(0|.
0<fe<n
В 30-х годах, когда в основном в работах Банаха была построена теория линейных нормированных пространств, сложилось впечатление, что этот класс пространств достаточно широк для того, чтобы обслуживать все конкретные нужды анализа. Впоследствии, однако, выяснилось, что это не так. Оказалось, что в ряде вопросов важны такие пространства, как пространство бесконечно дифференцируемых функций, пространство всех числовых последовательностей R°° и другие пространства, в которых естественная для них топология не может быть задана с помощью какой бы то ни было нормы. Таким образом, линейные пространства — топологические, но не нормируемые — это вовсе не обязательно «экзотика» или «патология». Наоборот, некоторые из этих пространств представляют собой не менее естественные и важные обобщения конечномерного евклидова пространства, чем, скажем, гильбертово пространство.
ГЛАВА IV
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
§ 1. Непрерывные линейные функционалы
1. Непрерывные линейные функционалы в топологических линейных пространствах. В § 1 гл. III мы уже рассматривали функционалы, определенные на линейном пространстве. Если речь идет о функционалах, заданных на топологическом линейном пространстве, то основной интерес представляют непрерывные функционалы; как обычно, функционал f, определенный на пространстве Е, называется непрерывным, если для всякого х0 е £ и всякого 8> 0 существует такая окрестность U элемента х0, что
I f (х) — f (х0) | < е при хеU.	(1)
Это определение относится, в частности, и к линейным функционалам.
Если £ — конечномерное топологическое линейное пространство, то всякий линейный функционал на £ автоматически непрерывен. В общем случае из линейности функционала его непрерывность не вытекает.
Следующее утверждение существенно для дальнейшего, хотя и почти очевидно.
Если линейный функционал f непрерывен в какой-либо одной точке хе £, то он непрерывен и всюду на Е.
Действительно, пусть у — произвольная точка в £ и пусть е > 0. Выберем окрестность U точки х так, чтобы выполнялось условие (1). Тогда сдвиг этой окрестности
V=U + (y — x)
будет искомой окрестностью точки у, так как если z е V, то zх — у U и, следовательно,
I f (г) — f (у) I = 1 f (z — у + х) — f (х) | < в.
Таким образом, проверять непрерывность линейного функционала достаточно в одной точке, например в точке 0.
Если £ — пространство с первой аксиомой счетности, то непрерывность линейного функционала на £ можно сформулиро
§ 1]
НЕПРЕРЫВНЫЕ ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ
175
вать в терминах последовательностей: функционал f называется непрерывным в точке хе Е, если изхп—>х следует f(xn)—>-f(x). Проверка равносильности этого определения непрерывности приведенному выше (при наличии первой аксиомы счетности) предоставляется читателю.
Теорема 1. Для того чтобы линейный функционал f был непрерывен на Е, необходимо и достаточно, чтобы существовала такая окрестность нуля в Е, на которой функционал f ограничен.
Доказательство. Если функционал f непрерывен в точке О, то для каждого е > 0 существует окрестность нуля, на которой
| f (х) | < е.
Обратно, пусть U — такая окрестность нуля, что
| f (х) | < С при х е U,
и пусть е > 0. Тогда U есть та окрестность нуля, на которой |f(x) |< е. Тем самым доказана непрерывность f в точке 0, а значит, и всюду.
Упражнение. Пусть Е — топологическое линейное пространство; докажите справедливость следующих утверждений.
(а)	Линейный функционал f на Е непрерывен тогда и только тогда, когда существует такое открытое множество U с: Е и такое число t, что где f (U) — множество значений f на U.
(б)	Линейный функционал f на Е непрерывен тогда и только тогда, когда его ядро {х: f (х) = 0} замкнуто в Е.
(в)	Если всякий линейный функционал иа Е непрерывен, то топология в Е совпадает с ядерно-выпуклой топологией (см. упражнение 2 на стр. 170).
(г)	Если Е бесконечномерно и нормируемо, то на нем существует не непрерывный линейный функционал (воспользуйтесь существованием в Е базиса Гамеля; см. упражнение на стр. 123).
(д)	Пусть в Е существует определяющая система окрестностей нуля, мощность которой не превосходит алгебраической размерности пространства Е (т. е. мощности базиса Гамеля в Е; см. упражнение на стр. 123). Тогда на Е существует не непрерывный линейный функционал.
(е)	Для того чтобы линейный функционал f был непрерывен на Е, необходимо, а в случае, когда Е удовлетворяет первой аксиоме счетности, и достаточно, чтобы он был ограничен на каждом ограниченном множестве.
2. Линейные функционалы на нормированных пространствах. Пусть рассматриваемое пространство Е нормировано. По теореме 1 всякий непрерывный линейный функционал f ограничен в некоторой окрестности нуля. Но в нормированном пространстве всякая окрестность нуля содержит шар и, значит, f ограничен на некотором шаре. В силу линейности функционала это равносильно его ограниченности на любом шаре, в частности, на единичном ||х||	1- Обратно, из ограниченности функционала f
на единичном шаре следует, в силу той же теоремы 1, его непрерывность (ибо внутренность этого шара представляет собой окрестность нуля).
176
линейные функционалы и линейные операторы
[ГЛ. IV
Итак, в нормированном пространстве линейный функционал непрерывен в том и только том случае, когда его значения на единичном шаре ограничены в совокупности.
Пусть f — непрерывный линейный функционал в нормированном пространстве Е. Число
II f II = sup | f (х) |,	(2)
||х||<Х
т. е. точную верхнюю грань значений |/(х)| на единичном шаре пространства Е, мы назовем нормой функционала f. Отметим следующие почти очевидные свойства ||/||:
1)	||/|| = SUpl^l;
х=^=0 11*11
это сразу следует из того, что для всякого х =/= О
lf(x)l |f Г х \|
IWI I' к IWI Л •
2) Для любого хе Е
1Нх)К11Л1-11х||.	(3)
Действительно, если х =/= 0, то элемент принадлежит единичному шару, следовательно, по определению нормы функционала,
I'kllrlJI ||х||	11'И’
откуда следует (3). Если же х — 0, то в (3) справа и слева стоят нули.
Упражнение. Пусть С Дг 0 — такое число, что
И(х)|<С|И|	(4)
при любом х. Доказать, что Hfll = inf С, где inf берется по всем С, удовлетворяющим неравенству (4).
Рассмотрим примеры линейных функционалов в нормированных пространствах.
1.	Пусть R” есть n-мерное евклидово пространство и а — какой-либо фиксированный вектор в нем. Скалярное произведение
f (х) = (х, а),
где х пробегает все Rn, представляет собой, очевидно, линейный функционал на R”. В силу неравенства Коши — Буняковского
I Г(Х) 1 = 1 (X, а) |<||х||• Hall;	(5)
§ И
НЕПРЕРЫВНЫЕ ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ
177
следовательно, этот функционал ограничен, а значит, и непрерывен на Rn. Из неравенства (5) получаем, что
<11 а ||.
Так как правая часть этого неравенства не зависит от. х, то
sup
|f(x)l
Ik II
<11 а II,
т.	е. ||f||<||a||. Но положив х — а, получим
| f(a) | = (а, а) =|| а ||2, т. е. ЯШ = ||а||.
II “'ll
Поэтому ||f|| = ||а||.
2.	Интеграл
ь
/ (х) = х (t)dt,
где x(t)—непрерывная функция на [а, &], представляет собой линейный функционал в пространстве С [а, Ь]. Этот функционал ограничен, а его норма равна b — а. Действительно,
ь
|/(х)|= \x(t)dt а
max | х (t) | (b — a) —1| x || (b — a),
причем при x = const достигается равенство.
3.	Рассмотрим более общий пример. Пусть yo(t)—фиксированная непрерывная функция на [а, &]. Положим для любой функции x(t)e С [а, &]
ь
F(x)=^ х (t) уо (t) dt. а
Этот функционал линеен. Он ограничен, так как
ь
ь
|F(x)| = \x{t)y0{t)dt <||x||J| y0{t)\dt.
(6)
В силу линейности и ограниченности он непрерывен. Из (6) следует оценка его нормы:
ь И1К JI y0(t)\dt.
а
(Докажите, что на самом деле здесь имеет место точное равенство!)
178
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
4.	Рассмотрим в пространстве С[а,Ь] линейный функционал
б[,(х) = х(/0),
уже упоминавшийся в п. 5 § 1 гл. III. Его значение на функции x(t) определяется как значение x(t) в данной точке t0. Ясно, что
I Х(/о) |<Ь II,
причем для х = const имеет место равенство. Отсюда сразу следует, что норма функционала равна 1.
5.	В любом евклидовом пространстве X можно определить линейный функционал так же, как и в R”, выбрав некоторый фиксированный элемент ае! и положив для любого хеХ
F (х) = (х, а).
Как в случае Rn, легко проверить, что при этом
IIЕ 11 = 11 а ||.
В дальнейшем мы будем рассматривать только непрерывные линейные функционалы, а слово «непрерывный» будем для краткости опускать.
Понятию нормы линейного функционала можно дать следующую наглядную интерпретацию. Мы уже видели (гл. .Ill, § 1), что всякому ненулевому линейному функционалу можно сопоставить гиперплоскость L, определяемую уравнением
f(x) = i.
Найдем расстояние d от этой гиперплоскости до точки 0. По определению, d — inf ||х||. В силу оценки
f(x)=l
I fW КН f II • Их ||
на гиперплоскости f (х) = 1 будем иметь || х ||	1/|| f || и, значит,
d 1/11 f II- С другой стороны, в силу определения нормы f для любого 8 > 0 найдется такой элемент хе, подчиненный условию
поэтому
Поскольку 8 > 0 произвольно, получаем d = l/||f ||,
т. е. норма линейного функционала f обратна расстоянию гиперплоскости f(x) = 1 от точки 0.
$ 1]	НЕПРЕРЫВНЫЕ ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ	179
3. Теорема Хана—Банаха в нормированном пространстве.
В § 2 гл. III мы доказали общую теорему Хана — Банаха, согласно которой всякий линейный функционал fo, определенный на некотором подпространстве L линейного пространства Е и удовлетворяющий условию
IfoWKp(x)	(7)
(р — фиксированный однородно-выпуклый функционал на Е), может быть продолжен на все Е с сохранением этого условия. Применительно к нормированным пространствам эту теорему можно сформулировать следующим образом:
Пусть Е — действительное нормированное пространство, L — его подпространство и fa — ограниченный линейный функционал на L. Этот линейный функционал может быть продолжен до некоторого линейного функционала f на всем пространстве Е без увеличения нормы, т. е. так, что
II Го Ина L = II f IL Е-Действительно, пусть
II fo Ина L = k.
Ясно, что k||х|| — однородно-выпуклый функционал. Взяв его в качестве р и применяя общую теорему Хана — Банаха, получим требуемый результат.
Эта форма теоремы Хана — Банаха допускает следующую геометрическую интерпретацию. Уравнение
foW = l	(8)
определяет в подпространстве L гиперплоскость, лежащую на расстоянии 1/llfoll от нуля. Продолжая функционал fo без увеличения нормы до функционала на всем Е, мы проводим через эту частичную гиперплоскость «большую» гиперплоскость во всем Е, причем «не позволяем» ей приблизиться к нулю.
Комплексный вариант теоремы Хана — Банаха (теорема 4а § 2 гл. III), дает нам комплексный аналог предыдущей теоремы:
Пусть Е — комплексное нормированное пространство, f0 — линейный ограниченный функционал, определенный на подпространстве LczE. Тогда существует линейный ограниченный функционал f, определенный на всем Е и удовлетворяющий условиям
f(x) = f0(x), x^L, II f Ина Е ~ II fo Ина L-
Укажем некоторые важные факты, вытекающие из теоремы Хана — Банаха для нормированных пространств. Предварительно
180
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ и линейные операторы
[ГЛ. IV
сделаем следующее замечание. Выпуклое множество в линейном пространстве мы назвали выпуклым телом, если оно имеет непустое ядро. Можно показать, что в нормированном пространстве ядро множества совпадает, очевидно, с совокупностью его внутренних точек. Таким образом, в нормированном пространстве выпуклое тело — это выпуклое множество, имеющее хотя бы одну внутреннюю точку. Отсюда и из теоремы 5 § 2 гл. III вытекает следующий факт.
Следствие 1 (первая теорема отделимости). Пусть А и В — выпуклые множества в нормированном пространстве X, причем хотя бы одно из них, скажем Л, является выпуклым телом и его ядро не пересекается с В. Тогда существует ненулевой непрерывный линейный функционал, разделяющий А и В.
Существование ненулевого функционала, разделяющего А и В, обеспечивается самой теоремой 5 § 2 гл. III. Покажем, что соответствующий функционал обязательно непрерывен. Действительно, если
sup f(x)< inf f(x),	(9)
xe= A	X<=B
то функционал f ограничен на А сверху. Пусть хо — внутренняя точка множества А и U(x0)—ее шаровая окрестность, целиком лежащая в А. В силу (9) функционал f ограничен на U(xQ) сверху. Но тогда он ограничен на U(хо) и снизу (проведите доказательство!). Так как линейный функционал, ограниченный на каком-либо шаре, непрерывен, то наше утверждение доказано.
Следствие 2 (вторая теорема отделимости). Пусть А — замкнутое множество в нормированном пространстве X их0^Х— точка, не принадлежащая А. Тогда существует непрерывный линейный функционал, строго разделяющий хо и А.
Действительно, достаточно взять некоторую выпуклую окрестность U точки Хо, не пересекающуюся с Л, и рассмотреть функционал, разделяющий U и А. (Проведите доказательство того, что ненулевой функционал, разделяющий U и А, непременно строго разделяет Хо и Л.)
Следствие 3 (лемма об аннуляторе). Для всякого (замкнутого) собственного подпространства L банахова пространства X существует ненулевой непрерывный линейный функционал f, равный нулю на L.
Действительно, пусть x0^L и f — непрерывный линейный функционал, строго разделяющий х0 и L:
f(x0)> supf(x).
Тогда f(x) = O на L, так как иначе верхняя грань справа была бы равна + оо.
$ 1]	НЕПРЕРЫВНЫЕ ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ	18f
Совокупность функционалов, равных нулю на данном подпространстве, называется аннулятором этого подпространства и обозначается ').
Следствие 4. Если хп— ненулевой элемент в нормированном пространстве X, то существует такой непрерывный линейный функционал f на X, что
11/11=1 и /(х0)=||х0||.	(10}
Действительно, определив сперва функционал f на одномерном подпространстве, состоящем из элементов вида ах0, формулой /(а%о) = а||хо||, а затем продолжив его без увеличения нормы на все X, мы и получим функционал, удовлетворяющий условиям (10).
Замечание. Для произвольных локально-выпуклых пространств следствия 1—3 остаются в силе без изменений, а следствие 4 может быть заменено утверждением: для всякого х0 =# 0 существует такой непрерывный линейный функционал /, что f (Х0) =0= 0.
4. Линейные функционалы в счетно-нормированном пространстве. Пусть Е — счетно-нормированное пространство с нормами II  IIa (k = 1, 2, . ..); не ограничивая общности, можно считать (см. стр. 173), что для всякого х е Е
IWhdlxlbC ... <||Х||„< ...	(11)
Пусть f — непрерывный линейный функционал на С; тогда в Е существует окрестность нуля U, на который / ограничен. В силу определения топологии в счетно-нормированном пространстве найдутся такое натуральное k и такое е > 0, что шар Вь, е — — {х : ||х||а < е} целиком лежит в (7; тогда функционал f ограничен на этом шаре и потому ограничен и непрерывен относительно нормы || • IIа, т. е. существует такое С >0, что
| / (х) |<С|| х ||й,	х<=Е.
С другой стороны, очевидно, что если линейный функционал ограничен по какой-либо из норм || • ||п, то он непрерывен на Е. Таким образом, если Е*п— запас всех линейных функционалов на Е, непрерывных относительно нормы || • ||n, а Е* — запас всех линейных непрерывных функционалов на Е, то
оо
r = U Е*п.	(12)
П = 1
') В § 4 гл. III мы обозначили так ортогональное дополнение подпространства в евклидовом пространстве. Как будет видно в следующем параграфе, в евклидовом пространстве понятия ортогонального дополнения и ан-нулятора равносильны, поэтому совпадение обозначений оправдано,
182
ЛИНЕЙНЫЕ функционалы и линейные операторы
[ГЛ. IV
Кроме того, из условия (11) следует, что
£’<=:£’ с ... с Е*п с ...
Если f — непрерывный линейный функционал на Е, т. е. f^E*, то его порядком называется наименьшее из чисел п, для которых / е Е*п\ в силу равенства (12) каждый непрерывный линейный функционал на Е имеет конечный порядок.
§ 2. Сопряженное пространство
1. Определение сопряженного пространства. Для линейных функционалов можно определить операции сложения и умножения их на числа. Пусть ft и А— Два линейных функционала на некотором линейном пространстве Е. Их суммой fi + f2 называется линейный функционал
/ (х) = Л(х) + /2(х), хе£.
Произведением aft линейного функционала fi на число а называется функционал
f (х) — af[ (х), хе£.
Равенства, определяющие А + А и afi, можно записать и так: (fi +f2)W = fl(x) + f2W. (afi)(x) = afi (х).
Ясно, что сумма fi + f2 и произведение afi представляют собой линейные функционалы. Кроме того, если пространство Е топологическое, то из непрерывности функционалов ft и f2 следует, что ft 4- f2 и afi тоже непрерывны на Е.
Легко проверить, что так определенные операции сложения функционалов и умножения их на числа удовлетворяют всем аксиомам линейного пространства. Иначе говоря, совокупность всех непрерывных линейных функционалов, определенных на некотором топологическом линейном пространстве Е, образует линейное пространство. Оно называется пространством, сопряженным с Е, и обозначается Е*.
Упражнение. Совокупность всех линейных функционалов на Е, не обязательно непрерывных, называется алгебраически сопряженным пространством и обозначается Е*. Привести пример топологического векторного пространства Е, такого, что
Е* =/= Е*.
В сопряженном пространстве Е* можно различными способами ввести топологию. Важнейшие из них — это сильная и слабая топологии.
2. Сильная топология в сопряженном пространстве. Начнем с того простейшего случая, когда исходное пространство Е нормировано. Для непрерывных линейных функционалов, заданных
5 21
СОПРЯЖЕННОЕ ПРОСТРАНСТВО
183
на нормированном пространстве, мы ввели понятие нормы, положив
Эта величина удовлетворяет всем требованиям, содержащимся в определении нормированного пространства. Действительно,
1)	1711 > 0 для любого ненулевого линейного функционала f,
2)	|| <71| = | а| • II f ||,
3)	II f, + f2 II = sup +	<
x^O 4*11
< sup iMjpl + sup = II f, II + II f21|. x^=0 IWI x^=0
Таким образом, пространство E*, сопряженное к нормированному, можно наделить естественной структурой нормированного пространства. Топология в Е*, отвечающая введенной норме, называется сильной топологией в Е*. Желая подчеркнуть, что Е* рассматривается как нормированное пространство, мы будем вместо Е* писать (Е*, II-11).
Установим следующее важное свойство пространства, сопряженного к нормированному.
Теорема 1. Сопряженное пространство (Е*, || • ||) полно.
Доказательство. Пусть {fn} — фундаментальная последовательность линейных функционалов. Тогда для каждого е>0 найдется такое N, что ||fn — /mil < е для всех п, m N. Отсюда для любого х е Е получаем
I fn W - fm(x) |<|| fn - fm|| • ||x|| < e||x||,
t. e. при любом хеЕ числовая последовательность {/п(х)} сходится.
Положим
f(x)= lim f„(x). П->оо
Проверим, что f представляет собой непрерывный линейный функционал. Линейность проверяется непосредственно:
f (ах 4- $у) = lim f„ (ах + fry) =
П-> оо
= Ит [af„ (х) 4- р/„ (z/)] = af (х) 4-	(у),
tl-> ОО
Для доказательства непрерывности функционала f вернемся к неравенству |/п(х)—fm(x) | < е ||х|| и перейдем в нем к пределу при т->оо; получим
|f(x) — f„(x)|<8||x||.
184
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
Отсюда вытекает, что функционал f — fn ограничен. Но тогда ограничен, и значит, непрерывен и функционал / = fn + (f— fn)-Кроме того, отсюда же следует, что ||/ — /п|| е для всех п N, т. е., что {/„} сходится к f.
Подчеркнем еще раз, что эта теорема справедлива независимо от того, полно или нет исходное пространство.
_3 а меч а ние. Если нормированное пространство Е не полно, а Ё — его пополнение, то пространства Е* и (Ё)* изоморфны.
Действительно, если Е вложено в £ в качестве всюду плотного подмножества, то всякий линейный непрерывный на Е функционал f продолжается по непрерывности с Е на все Ё. Обозначим это (единственное!) продолжение f. Ясно, что /е(£)*, ||/|| = = 11/11, и что всякий функционал из (Ё)* служит продолжением некоторого функционала из (Е)* (а именно, своего сужения на Е). Следовательно, отображение f -> f представляет собой изоморфное отображение пространства Е* на все пространство (Ё)*.
Определим теперь сильную топологию в пространстве, сопряженном к произвольному линейному топологическому. В пространстве, сопряженном к нормированному, мы определили окрестность нуля как совокупность функционалов, удовлетворяющих условию
11/11 < в.
Иначе говоря, за окрестность нуля в пространстве Е*, сопряженном к нормированному, принимается совокупность функционалов, для которых |/(х) | < е, когда х пробегает в Е единичный шар ||х||	1. Беря всевозможные е, получим определяющую си-
стему окрестностей нуля. В случае, когда Е — не нормированное, а топологическое линейное пространство, вместо единичного шара в Е естественно взять произвольное ограниченное множество А. Окрестность нуля Us, а в Е* определяется как совокупность линейных функционалов, удовлетворяющих условию
| / (х) | < е при всех х е А.
Варьируя е и А, получим определяющую систему окрестностей нуля в Е.
Итак, сильная топология в Е* задается совокупностью окрестностей нуля, зависящих от положительного числа е и ограниченного множества A cz Е. Мы не будем здесь проверять, хотя это и несложно (см., например, [9]), что такая система окрестностей действительно превращает Е* в линейное топологическое пространство. Ясно, что в случае нормированного пространства Е только что описанная сильная топология в Е* совпадает с той, которая определялась с помощью нормы.
Заметим, что сильная топология в Е* обязательно удовлетворяет аксиоме отделимости Т{ и локально выпукла (независимо от . топологии в Е). Действительно, если /о е Е* и /о ¥= 0, то
S 2]
СОПРЯЖЕННОЕ ПРОСТРАНСТВО
185
найдется такой элемент х0^Е, что fo(xo) У=0; положим е = = yl fo(xo) | И Л={х0), тогда f0&Ue,A, т. е. Е* — Л-простран-ство. Для доказательства локальной выпуклости сильной топологии в Е* достаточно заметить, что для любого е > 0 и любого ограниченного A cz Е окрестность Ub,a выпукла в Е. Сильную топологию в Е* обозначим символом 6; желая подчеркнуть, что Е* рассматривается в сильной топологии, мы будем писать (f*, Ь) вместо Е*.
3. Примеры сопряженных пространств.
1. Пусть Е — n-мерное линейное пространство (действительное или комплексное). Выберем в нем какой-нибудь базис Ci, . . . ..., еп; тогда всякий вектор х е Е однозначно представим в виде п
х = Если f — линейный функционал на Е, то ясно, что »=i п
Ж=Е /«Ж	(I)
следовательно, линейный функционал однозначно определяется своими значениями на векторах базиса eh . .., еп, причем эти значения можно задать произвольно. Определим линейные функционалы gi, .. ., gn, полагая
1, если i = /,
О, если i =/= j.
Очевидно, что эти функционалы линейно независимы. Ясно, что gj(x) = Xj, поэтому формулу (1) можно записать в виде
п Ж = Е f gi (х). i = l
Таким образом, функционалы g\, ..., gn составляют базис в пространстве Е*, т. е. Е* есть n-мерное линейное пространство; базис gi, ..., gn в Е* называют двойственным по отношению к базису Ci, . .. , еп в Е.
Различные нормы в пространстве Е индуцируют различные нормы в Е*. Вот несколько примеров пар соответствующих друг другу норм в Е и Е* (читателю рекомендуется аккуратно провести соответствующие доказательства):
\'/2	/ п	Х'/2
LIMJ . II/11 = (El MJ ;
Ort	\1/P	/ rt	\l/<?
LIM) . 11/11 = (ElMl ; |+-7=1.
=1	/	\i=l	/	P 4
1 < P < OOJ;
gj (e<) = I
186
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
п
(с) ||х|| = sup | Xi |, ||/|| = £|M;
1 C i < n	i=l
(d) ||x||= £|xj, ||f||= SUp \fi\. i=l	1 < i < n
В этих формулах хь . . ., xn — это координаты вектора х е Е в базисе et, . . ., еп, a fi, fn — координаты функционала f е Е* в двойственном базисе gi, ..., gn.
Упражнение. Доказать, что все перечисленные нормы определяют в л-мерном пространстве одну и ту же топологию.
2.	Рассмотрим пространство Со сходящихся к нулю последовательностей X — (Х1, х2, ..., хп . •) с нормой II х || = sup | хп I и
п покажем, что сопряженное к нему пространство (to, || • ||) изоморфно пространству 1\ всех абсолютно суммируемых последова-оо тельностей f — (flt f2, ..., fn, •  •) с нормой || f ||= У, | fn |. Лю-п= 1
бая последовательность f еZ, определяет в пространстве с0 линейный ограниченный функционал f по формуле
F(x)=£f„x„;	(2)
оо	оо
ясно, что | f (х)|<||х|| £ l/п I, так что || f ||< £ | |<||f ||.
п—1
Рассмотрим в с0 векторы
<	?! =(1, 0, 0..О, О, .. .),
<	?2 =(о, 1,0...о, о, . ..),
<	?п = (0, 0, 0..1,0,..	.),
n
и положим xw’ = V еп (если f„=0, то считаем, что ry-i= j I 'п I V	I in I
=о). Тогда ||xW|l<l и
п=1
так что lim f (x(N)) = £ | fn | = || f Ц. Следовательно, II f II > £ I I;
^->оо	п—1
сопоставляя это с доказанным выше противоположным нера-оо венством, заключаем, что ||f||=£ lfnl = llfll-
S 2]
СОПРЯЖЕННОЕ ПРОСТРАНСТВО
187
Таким образом, мы построили линейное изометрическое отображение f пространства Ц в пространство cq; остается проверить, что образ пространства /, при этом отображении совпадает со всем Q, т. е. что всякий функционал f е cj представим в виде (2), где f = {fn} s /,. Для всякого оо
х = {хп}ес0 имеем х=У хпеп, причем ряд, стоящий справа, п=1	дг
сходится в с0 к элементу х, ибо |х — У, хпеп [= sup | хп | —>0
при JV —> оо. Так как функционал f^Cg непрерывен, то J(x) — оо	оо
= У xnJ (е„); поэтому достаточно проверить, что У, | J (е„) | < оо. П=1
ЛГ F
Полагая x<JV> = V еп и замечая, что x(W) ес0, ||х(ЛГ> ||^ 1, 1Неп)1
имеем
N	А
X I Г(е„) I = X	Г(е„) = f(xW) < Ilf II,
Zj I Hen) I
71=1	H=1
откуда в силу произвольности N заключаем, что У, If(en)|<oo.
3.	Нетрудно доказать, что пространство I], сопряженное к пространству /1, изоморфно пространству т, состоящему из всех ограниченных последовательностей х = {хп} с нормой ||х|| = = sup|x„|.
п
4.	Пусть р > 1 и 1р — пространство всех последовательностей х — {хп}, для которых
(оо	X 1/р
£ I Х„ |₽)	< оо;
п=1	/
можно доказать, что сопряженное к нему пространство ГР изоморфно пространству lq, \/р + \/q — 1. Общий вид линейного непрерывного функционала на 1Р:
оо
х = {хп}е/ / = п=1	4
Доказательство основано на применении неравенства Гельдера.
5.	Выясним структуру пространства, сопряженного к гильбертову.
Теорема 2. Пусть Н — действительное гильбертово пространство. Для всякого непрерывного линейного функционала [
188
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
на Н существует единственный элемент х0 е Н, такой, что
f (х) = (х, х0), хеН,	(3)
причем || f || = || Хо ||. Обратно, если х0 е Н, то формула (3) определяет такой непрерывный линейный функционал f, что ||/|| = = ||х0||. Таким образом, равенство (3) определяет изоморфизм f ->хй между пространствами Н* и Н.
Доказательство. Очевидно, что для всякого Хо е Н формула (3) определяетлинейный функционал на Н. Так как| f (х) |= = | (х, х0) | II х || • || х0||, то этот функционал непрерывен, а так как f (xq) = || Хо II2, то || f || = || Хо ||. Покажем, что всякий непрерывный линейный функционал f на/7 представим в виде (3). Если / = 0, то полагаем х0 = 0. Пусть теперь f =£= 0 и Но = {х:/(х) = = 0} — ядро функционала /; так как f непрерывен, то Но — замкнутое линейное подпространство в Н. В п. 6 § 1 гл. III было показано, что коразмерность ядра любого линейного функционала равна 1. Поэтому, учитывая следствие 3 теоремы 7 из § 4 гл. III, заключаем, что ортогональное дополнение Но к подпространству Но одномерно, т. е. существует такой (ненулевой) вектор уо, ортогональный к Но, что всякий вектор х^Н однозначно представим в виде х = у + Ау0, где у е На. Очевидно, можно считать, что || у0 || = 1; положим х0 = f (у0)Уо- Тогда для любого х е Н имеем
х — У + Куо, У^Но, f (х) = А/ (Уо),
(х, х0) = А (Уо, х0) = А/ (у0) (Уо, Уо) = hf (Уо).
Таким образом, f(x) = (x, х0) для всех х е Н. Если /(х) = (х, х'о), х^Н, то (х, х0 — Хо) = 0, откуда, полагая х = х0 — х'о, получаем, ЧТО Xq = Xq.
Замечания. 1. Пусть Е — неполное евклидово пространство, а Н — гильбертово пространство, являющееся его пополнением. Так как пространства Е* и Н* изоморфны (см. замечание на стр. 184), а Н* изоморфно Н, то справедливо следующее утверждение: пространство Е*, сопряженное к неполному евклидову пространству Е, изоморфно пополнению Н пространства Е.
2. Теорема 2 справедлива и для комплексного гильбертова пространства (доказательство в точности то же, с заменой лишь Хо = }*,Уо)Уо на Xq — /(уо)уо). Единственное отличие комплексного случая от действительного состоит в том, что теперь отображение Н в Н*, сопоставляющее элементу хоеЯ функционал f(x) = (x, х0), является сопряженно-линейным изоморфизмом, т. е. элементу Ах0 отвечает функционал АД
6. В примерах 1—5 рассматривались нормированные пространства. Рассмотрим теперь пространство счетно-нормирован
СОПРЯЖЕННОЕ ПРОСТРАНСТВО
189
$ 2]
ное. Пусть Ф — действительное счетно-гильбертово пространство, состоящее из всех последовательностей х = {хп}, для которых
\'/«
£	< 00 при всех й=1, 2, ...
Скалярные произведения в Ф суть
(х, y)k = Е nkxnyn, Л=1, 2, ...
п=1
Пространство Ф со скалярным произведением (•, -)к является евклидовым; пусть Фа— его пополнение. Легко видеть, что Фа можно отождествить с гильбертовым пространством всех последовательностей х = {х„}, у которых ||х||а < 00. В силу теоремы 2 пространство Фа, сопряженное к Фа, изоморфно пространству Фа; при этом изоморфизме каждому непрерывному линейному функционалу f е Фа сопоставляется такая последовательность 7 = {fn}, что
Ш = nk\fn I2)4 <
ОО
f (х) = (Х, f)k = Е nkXnfn, X = {хп} СЕ Фь п=1
и обратно, каждая такая последовательность определяет элемент из Фа. Определим теперь функционал f е Фа не последовательностью {fn}, а последовательностью {gn}, где gn = nkfn. Тогда
f(x) = ^xngn и ||f 11 = (Е •
Таким образом, Фа можно отождествить с гильбертовым пространством последовательностей {gn}, удовлетворяющих условию
ОО
X n~kg2 < 00,	(4)
rt=l
и со скалярным произведением
оо
(g°>, g(2>) = I n~kg"g™
00
Так как Ф*= U Фа, то Ф* — пространство всех последователь-&= 1
ностей {gn}, для каждой из которых существует свое k, такое, что выполняется условие (4).
190
ЛИНЕЙНЫЕ функционалы и линейные операторы
[ГЛ. IV
Значение каждого такого функционала определено на любом оо
элементе х = {хп} еФ и равняется £ xngn.
Пе=1
Итак, если пространство Ф есть пересечение убывающей цепочки гильбертовых пространств
Ф= П Фй, Ф^ФгГЭ ... Фй ..., fc=i
то Ф* есть сумма возрастающей цепочки гильбертовых пространств
Ф’= U Ф£, Ф^сзФгСЗ ... сзФ^с ...
k=i
Удобно ввести обозначение Ф* = Ф~*. Если еще обозначить пространство 4 через Фо, то мы получим такую бесконечную в обе стороны цепочку гильбертовых пространств
. . . CZ Фй CZ ... CZ ф; CZ Фо CZ Ф_, с: ... с Ф_А с . . .,
в которой Фй - Ф_А при каждом k = 0, ±1, ±2, ...
4. Второе сопряженное пространство. Так как непрерывные линейные функционалы на линейном топологическом пространстве Е сами образуют линейное топологическое пространство,— сопряженное к Е пространство (Е*,Ь), — то можно говорить о пространстве £** непрерывных линейных функционалов на Е*, т. е. о втором сопряженном к Е и т. д.
Заметим, что всякий элемент х0 из Е определяет некоторый линейный функционал на Е*. Действительно, положим
(f) = f W	(5>
где х0 — фиксированный элемент из Е, a f пробегает все Е*. Равенство (5) ставит в соответствие каждому f некоторое числа фх (f)> т. е. определяет функционал на Е*. Так как при этом
(af 1 +	= af 1 (хо) + #2 Оо) =	(f j) +	(f2)>
то этот функционал линеен.
Далее, всякий такой функционал непрерывен на Е*. В самом деле, пусть е > 0 и А — ограниченное множество в Е, содержащее х0. Рассмотрим в Е* окрестность нуля U (е, А). По определению £7(е, А), имеем
I)| = И(хо) I <е ПРИ f^U(e,A).
Но это означает, что функционал фХо непрерывен в точке О, а следовательно, и на всем пространстве Е*.	/
$ 2]	СОПРЯЖЕННОЕ ПРОСТРАНСТВО	191
Мы получили, таким образом, отображение всего пространства Е на некоторое подмножество пространства Е**. Это отображение, очевидно, линейно. Такое отображение Е в Е** называется естественным отображением пространства Е во второе сопряженное. Обозначим его л. Если на Е есть достаточно много линейных функционалов (например, если Е нормировано или хотя бы локально выпукло и отделимо), то это отображение взаимно однозначно, так как тогда для любых двух различных х', х" е Е существует такой функционал f^E*, что f(xz)y= =/= f(x"), т. е. фх, и фх„ — различные функционалы на Е*. Если к тому же л(Е) = Е**, то (отделимое локально выпуклое) пространство Е называется полу рефлексивным. В пространстве Е** (как сопряженном к (Е*, Ь)) можно ввести сильную топологию, которую мы обозначим Ь*. Если пространство Е полурефлексивно и отображение л: Е -> Е** непрерывно, то Е называется рефлексивным пространством. Можно показать, что отображение л'1 всегда непрерывно, поэтому если Е рефлексивно, то естественное отображение л: Е-+Е** представляет собой изоморфизм между линейными топологическими пространствами Е и Е** = (Е**, Ь*}.
Поскольку мы можем теперь каждый элемент из Е рассматривать еще и как элемент пространства Е**, удобно для значений линейного функционала f е Е* вместо записи f(x) ввести более симметричное обозначение:
f(v) = (f,x).	(6)
При фиксированном f е Е* мы можем рассматривать (А х) как функционал на Е, а при фиксированном х — как функционал на Е* (при этом уже х выступает в роли элемента из Е**).
Если Е — нормированное пространство (следовательно, нормированы и пространства Е*, Е** и т. д.), то естественное отображение пространства Е в Е** есть изометрия.
Действительно, пусть х — элемент из Е. Обозначим его норму в Е символом ||х||, а норму его образа в £‘* символом ПхПг- Покажем, что ||х|| = ||х||2. Пусть f — произвольный ненулевой элемент из Е*. Тогда
КА x)|<||f ll-llxll, т. е.
и, поскольку левая часть последнего неравенства не зависит от А || XII > sup —1 == || х ||2.
С другой стороны (следствие 4 теоремы Хана — Банаха для нормированных пространств), для каждого хое£ найдется такой ненулевой линейный функционал f0, что
l(fo, Хо)1 = 1КоИ-llхоII,	(7)
192
ЛИНЕЙНЫЕ функционалы и линейные операторы
[ГЛ. IV
поэтому
II X ||2 = sup,1 (1’^1 > II X II,
т. е. ||х|| — 11x11г, что и требовалось доказать. Таким образом, нормированное пространство Е изометрично (вообще говоря, незамкнутому) линейному многообразию л(Е) в Е**; отождествляя Е с л(Е), можно считать, что Е с Е**.
Из изометричности естественного отображения л: Е -> Е** для нормированных пространств следует, что понятия полурефлексивности и рефлексивности для нормированных пространств совпадают.
Поскольку пространство, сопряженное к нормированному, полно, всякое рефлексивное нормированное пространство Е полно.
Конечномерные евклидовы пространства и гильбертово пространство представляют собой простейшие примеры рефлексивных пространств (для них даже Е = Е*).
Пространство с0 сходящихся к нулю последовательностей представляет собой пример полного нерефлексивного пространства. Действительно, как мы показали выше (пример 2 § 2), сопряженным к Со является пространство Е всех абсолютно сходящихся числовых рядов, которому в свою очередь сопряжено пространство m всех ограниченных последовательностей.
Пространство С [я, Ь] непрерывных функций на некотором отрезке [а, 6] тоже нерефлексивно. Мы, однако, не будем здесь приводить доказательства этого утверждения1).
Примером рефлексивного пространства, не совпадающего со своим сопряженным, может служить 1Р при 1 < р =/= 2 (так как Гр = 1д, где 1/р+1/^=1, то /” = /; = /р).
Упражнение. Докажите, что замкнутое подпространство рефлексивного пространства рефлексивно.
§ 3. Слабая топология и слабая сходимость
1. Слабая топология и слабая сходимость в линейном топологическом пространстве. Рассмотрим линейное топологическое пространство Е и совокупность всех непрерывных функционалов на нем. Если fi, . .., fn — произвольный конечный набор таких функционалов и е — положительное число, то множество
{х: I fi(x) | < е; z= 1, 2, ..., п}	(1)
открыто в Е и содержит точку 0, т. е. представляет собой некоторую окрестность нуля. Пересечение двух таких окрестностей
’) Можно доказать даже следующее более сильное утверждение: не существует никакого нормированного пространства, для которого С[а, ft] было бы сопряженным пространством.
S3]
СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТЬ
193
всегда содержит множество вида (1), и, следовательно, в Е можно ввести топологию, для которой совокупность множеств вида (1) будет определяющей системой окрестностей нуля. Она называется слабой топологией пространства Е. Слабая топология в Е — это самая слабая из топологий, в которой непрерывны все линейные функционалы, непрерывные в исходной топологии этого пространства.
Ясно, что всякое множество в Е, открытое в смысле слабой топологии, открыто и в исходной топологии пространства Е, однако обратное, вообще говоря, неверно (множества вида (1) не обязаны образовывать определяющую систему окрестностей нуля в исходной топологии). По терминологии, принятой нами в § 5 гл. II, это означает, что слабая топология пространства Е слабее, чем его исходная топология. Тем самым оправдывается принятое для нее название.
Если в Е существует достаточно много непрерывных линейных функционалов (например, если Е нормировано), то слабая топология в Е удовлетворяет аксиоме отделимости Хаусдорфа. Легко также проверить, что операции сложения и умножения на числа, определенные в Е, непрерывны относительно слабой топологии этого пространства.
Даже в случае нормированных пространств слабая топология в Е может не удовлетворять первой аксиоме счетности. Следовательно, эта топология, вообще говоря, не описывается на языке сходящихся последовательностей. Тем не менее сходимость в Е, определяемая этой топологией, представляет собой важное понятие. Она называется слабой сходимостью. В отличие от нее, сходимость, определяемую исходной топологией пространства Е (нормой, если Е нормировано), называют сильной сходимостью.
Понятие слабой сходимости можно сформулировать следующим образом: последовательность {хп} элементов из Е называется слабо сходящейся к х0^Е, если для любого непрерывного линейного функционала <р(х) на Е числовая последовательность {ф(хп)} сходится к ф(Х0).
Действительно, считая для простоты Хо = 0, предположим, что <р(хп)->0 при всяком фЕЁ*. Тогда для всякой слабой окрестности
U = {х: | <pf (х) | <_ в, i=l,2,..., 6}
точки 0, найдется такое N, что хп е U при всех и N (для этого достаточно выбрать Ni так, что | <р» (хп) | < 8 при n^N{ и затем положить N — max Ni). Обратно, если для каждой слабой окрестности нуля U существует такое N, что х„е U для всех п А\ то условие <р(хп)->0 при п->оо, очевидно, выполнено для каждого фиксированного tpef*. Из того, что слабая топо
194
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
(ГЛ. IV
логия пространства Е слабее его сильной топологии, следует, что всякая сильно сходящаяся последовательность сходится и слабо. Обратное, вообще говоря, неверно (см. примеры ниже).
2. Слабая сходимость в нормированных пространствах. Рассмотрим подробнее понятие слабой сходимости применительно к нормированным пространствам.
Теорема 1. Если {хп}— слабо сходящаяся последовательность в нормированном пространстве, то существует такое постоянное число С, что
Иначе говоря, всякая слабо сходящаяся последовательность в нормированном пространстве ограничена.
Доказательство. Рассмотрим в Е* множества
Л„ = {Л |(f,x„)|<*}, k, га=1, 2, ...
Эти множества замкнуты в силу непрерывности (Д хп) как функции от f при фиксированном хп. Следовательно, замкнуты со
(как пересечения замкнутых) и множества Ак = П Акп. В силу П=1
слабой сходимости {хп} последовательность (Д хп) ограничена для каждого f е Е*, поэтому
£*= U Ак.
А=1
Так как пространство £* полно, то по теореме Бэра (§ 3 гл. II) хоть одно из множеств Ак, скажем Ак„ должно быть плотно в некотором шаре B\f0, е], а так как Ла, замкнуто, то это означает, что
B[f0, е]сД,.
Но это значит, что последовательность {хп} ограничена на шаре B[fo, е], а следовательно, и на любом шаре в £*, в частности на единичном шаре этого пространства. Таким образом, последовательность {хп} ограничена как последовательность элементов из £**. Но в силу изометричности естественного вложения Е в Е** это означает ограниченность {хп} и в Е.
Замечание. При доказательстве ограниченности последовательности {х„} по норме мы воспользовались лишь тем, что числовая последовательность (/, хп) ограничена при каждом f е£'. Таким образом, если последовательность {х„} в Е такова, что числовая последовательность (f, хп) ограничена при каждом f s Е*, то существует такая постоянная С, что ||хп|| С. Это утверждение можно обобщить: всякое слабо ограниченное (т. е. ограниченное в слабой топологии) подмножество Q нормированного пространства Е сильно ограничено (т. е. содержится в некотором шаре). Действительно, допустим, найдется такая последовательность {xn} cz Q, что ||хп|1—► при п—>-оо. Так как Q слабо ограничено, то и множество {хп} слабо ограничено, т. е. поглощается любой слабой окрестностью нуля; в частности, для любого fe.E* найдется такое N, что {xn)c:AZ{x: |(f, х)| < 1}, откуда |(f, xn)| < N для
«3]
СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТИ
195
всех п. Но это в силу сделанного выше замечания противоречит предположению ||Хп11—► оо. Если учесть, что слабая ограниченность множества Q означает, что на нем ограничен любой непрерывный линейный функционал, то мы приходим к следующему важному результату: для того чтобы подмножество Q нормированного пространства было ограничено, необходимо и достаточно, чтобы на Q был ограничен любой функционал f е Е*.
Следующая теорема часто бывает полезна для фактической проверки слабой сходимости той или иной последовательности.
Теорема 2. Последовательность {хп} элементов нормированного пространства Е слабо сходится кхеЕ, если:
1) Iknll ограничены в совокупности некоторой константой М-, 2) f(xn)-*-f(x) для всякого где А — некоторое множество, линейная оболочка которого всюду плотна в Е*.
Доказательство. Из условия 2) и определения действий над линейными функционалами следует, что если <р — линейная комбинация элементов из А, то
<р(х„)-><р(х).
Пусть теперь <р — произвольный элемент из Е* и {<р4 — сходящаяся к <р последовательность линейных комбинаций элементов из А. Покажем, что <р(х„) -> <р(х). Пусть М таково, что
||х„||<Л1(п=1, 2, ...) и ||x||<M.
Оценим разность |<р(хп) — <р(х) |. Так как <рь-хр, то для любого е > 0 существует такое К, что ||ф — <рь|| < 8 для всех k К. Поэтому
IФ (х„) — Ф (х) КIФ М — <pfe (х„) | +1 (х„) — <pfe (х) | +
+1 Фк (х) — Ф (х) I < вЛ1 4- еЛ14-1 <pft (х„) — (х) |.
Но, по условию, <ph(Xn)-> фь(х) при га->оо. Следовательно, ф(хп) — <р(х)->0 при га->оо для всякого феЕ’.
Примеры. Посмотрим, какой смысл имеет понятие слабой сходимости в некоторых конкретных пространствах.
1. В конечномерном евклидовом пространстве Rn слабая сходимость совпадает с сильной. Действительно, пусть в]......еп —
какой-либо ортогональный нормированный базис в R” и {х4 — последовательность в R”, слабо сходящаяся к элементу х. Пусть
X = x<% 4- ... 4- х<п*е„ К я 1 1	* я п
И
х = х<‘> в] ... х(п’еп.
Тогда
41) = (х*.	е1) = х<‘>,
x<k"» = (xfc, е„)->(х,еп) = хЧ
196
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
(ГЛ IV
т. е. последовательность {хп} покоординатно сходится к х. Но тогда
/ п	\'/г
кч.	-о,
т. е. {хп} сильно сходится к х. Поскольку из сильной сходимости всегда вытекает слабая, равносильность этих сходимостей в R” доказана.
2.	Слабая сходимость в 12. Для слабой сходимости ограниченной последовательности {х^} к х достаточно, чтобы выполнялись условия
(xft, et) = 4° “*= (х> ei)> * — 1 > 2, .... где
^ = (1, 0, 0, ...), е2 —(О, 1, 0,
Действительно, линейные комбинации элементов всюду плотны в пространстве 12 (совпадающем, как мы видели, со своим сопряженным). Поэтому наше утверждение вытекает из теоремы 2.
Таким образом, слабая сходимость ограниченной последовательности {хй} в 12 означает, что числовая последовательность координат этих векторов сходится для каждого i— 1, 2, ... Иначе говоря, слабая сходимость совпадает с покоординатной (при условии ограниченности). Нетрудно видеть, что в 12 слабая сходимость не совпадает с сильной. Действительно, покажем, что последовательность е2, ..., еп, ... слабо сходится в 12 к 0. Всякий линейный функционал f в 12 записывается как скалярное произведение f (х) = (х, а) вектора х е 12 на некоторый фиксированный вектор а = (аь а2, ...). Поэтому f(en) = ап, и поскольку ап -> 0 при и -> оо для всякого а е 12, получаем
lim f(en) = O
для каждого линейного функционала в 12.
В то же время в сильном смысле последовательность {еп} ни к какому пределу не сходится.
Упражнения. 1. Пусть последовательность (хп) элементов гильбертова пространства Н слабо сходится к элементу х, причем || хп || -> || х || при п-> оо. Доказать, что в этом случае последовательность (хп) сильно сходится к х, т. е. || хп — х || -> 0.
2.	Доказать, что утверждение упражнения 1 сохранится, если условие II хп II II х || заменить условием || хп || || х || для всех п или условием lim ||х„||<1И1-
П->о°
3.	Пусть Н—(сепарабельное) гильбертово пространство и Q — его ограниченное подмножество’. Тогда топология в Q, индуцируемая слабой топологией пространства Н, может быть задана некоторой метрикой.
4.	Докажите, что всякое замкнутое выпуклое подмножество гильбертова пространства замкнуто в слабой топологии (в частности, всякое замкну
$ 3]	СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТЬ	197
тое линейное подпространство гильбертова пространства слабо замкнуто). Приведите пример замкнутого множества в гильбертовом пространстве, не являющегося слабо замкнутым.
3. Слабая сходимость в пространстве С[а, &] непрерывных функций. Пусть {хп(0} — последовательность функций из С[д, &], слабо сходящаяся к функции x(t). Последовательность {хп(0} •ограничена по норме С[щ &]. Среди функционалов, определенных на С[а, &], имеются, в частности, функционалы каждый из которых есть значение функции в некоторой фиксированной точке t0 (см. пример 4 п. 2 § 1). Для каждого такого функционала •6^ условие
б«.(хп)-*б«,(х)
•означает, что
хп (t0)-+x(t0).
Таким образом, если последовательность {хп(0} слабо сходится, то она:
1)	равномерно ограничена, т. е. |xn(0 | С при всех п = = 1,2,... и
2)	сходится в каждой точке.
Можно показать, что совокупность этих двух условий не только необходима, но и достаточна для слабой сходимости последовательности {хп(0} в £[«,&]. Иначе говоря, слабая сходимость в С[д, Ь] совпадает с поточечной (при условии огра-диченности).
Ясно, что эта сходимость не совпадает со сходимостью по норме С[д, &], т. е. равномерной сходимостью непрерывных функций. (Приведите соответствующий пример.)
3.	Слабая топология и слабая сходимость в сопряженном пространстве. В п. 2 предыдущего параграфа мы ввели в сопряженном пространстве Е* топологию, названную нами сильной, приняв за систему окрестностей нуля совокупность множеств вида
t/e,A = {f: If WK е, х<=А},
где А — произвольное ограниченное множество в Е, а е — произвольное положительное число. Если мы здесь вместо всех огра-Биченных множеств будем рассматривать все конечные подмножества /1сЕ, то мы получим так называемую слабую топологию в сопряженном пространстве Е*. Поскольку всякое конечное множество /1сЕ ограничено (обратное, вообще говоря, не верно), ясно, что слабая топология пространства Е* слабее, чем сильная топология этого пространства. Вообще говоря, эти две топологии не совпадают.
Слабая топология, введенная в Е*, определяет в этом пространстве некоторую сходимость, называемую слабой сходи
198
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
(ГЛ. IV
мостью функционалов. Слабая сходимость линейных функцио-налов представляет собой важное понятие, играющее существенную роль во многих вопросах функционального анализа, в частности, в теории так называемых обобщенных функций, о которых будет идти речь в следующем параграфе.
Слабая сходимость последовательности {фп} линейных функционалов есть, очевидно, сходимость этой последовательности на каждом фиксированном элементе из Е. Иными словами, последовательность {фп} называется слабо сходящейся к ф е Е\ если для каждого хе£ выполнено соотношение
<р„ (х) -> <р (х).
Ясно, что и в сопряженном пространстве последовательность, сходящаяся в сильной топологии, сходится и слабо (но не наоборот).
Пусть Е (а следовательно, и Е*)—банахово пространство.. Имеет место следующая теорема, аналогичная теореме 1.
Теорема 1*. Если {/п}— слабо сходящаяся последовательность линейных функционалов на банаховом пространстве, то существует такое постоянное число С, что
||fn||<C,	п=1, 2, ...
Иначе говоря, всякая слабо сходящаяся последовательность элементов пространства, сопряженного банахову пространству*, ограничена по норме.
Доказательство не отличается от доказательства теоремы L Следующая теорема вполне аналогична теореме 2.
Теорема 2*. Последовательность линейных функционалов {<рп} из Е* слабо сходится к <р е£*, если:
1)	эта последовательность ограничена, т. е.
||<рп|КС,	п=1, 2, ...;
2)	соотношение (<рп, х) -> (<р, х) выполнено для всех х, принадлежащих некоторому множеству, линейные комбинации элементов которого всюду плотны в Е.
Доказательство то же, что в теореме 2.
Рассмотрим пример. Пусть Е есть пространство С[а, 6] непрерывных функций ') и
Ф (х) — х (0),
т. е. ф есть 6-функция (см. § 1, п. 2, пример 4). Пусть, далее, { фп(0) — последовательность непрерывных функций, удовлетво-
') Мы считаем, что 0 е [а, 6]. Можно было бы, конечно, вместо точка t = 0 взять любую другую.
S3]
СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТЬ'
199
ряющих следующим условиям:
1)	Фп(0 = 0 ПРИ И1> 1/«> Фп(0>0;
ь
2)	$ф„(0Л = 1.
а
Тогда для любой непрерывной на [а, функции x(t) с помощью теоремы о среднем получаем
ь	1/п
J ф„(/)х(0Л-*х(0) при и-+оо.
а	—1/п.
Выражение
$ 4>n(t)x(t)dt а
представляет собой линейный функционал на С [а, 6]. Таким образом, б-функцию можно представить как предел в смысле слабой сходимости линейных функционалов на С [а, б] последовательности «обычных» функций.
Замечание. Пространство Е* линейных функционалов на некотором пространстве Е мы можем рассматривать двояко: или как пространство, сопряженное к исходному пространству Е, или же считать само Е* основным пространством и связывать с ним сопряженное к нему пространство Е**. В соответствии с этим мы можем в Е* вводить слабую топологию двумя способами: либо как в пространстве функционалов, определяя окрестности в Е* с помощью всевозможных конечных наборов элементов из Е, либо как в основном пространстве, с помощью пространства Е**. В случае рефлексивного пространства это, разумеется, одно и то же. Если же Е не рефлексивно, то это — две различные топологии в Е*. Чтобы избежать возможной здесь путаницы, будем слабую топологию, определяемую в основном пространстве (т. е. топологию в Е*, определяемую с помощью _Е**) называть просто слабой топологией, а слабую топологию в пространстве функционалов (т. е. топологию в Е*, определяемую с помощью Е) называть «-слабой топологией. Очевидно, что «-слабая топология в Е* слабее, чем слабая топология пространства Е (т. е. в слабой топологии не меньше открытых множеств, чем в «-слабой топологии).
4. Ограниченные множества в сопряженном пространстве. В различных применениях понятия слабой сходимости линейных •функционалов важную роль играет следующая теорема.
Теорема 3. Если Ё — сепарабельное линейное нормированное пространство, то в любой ограниченной последовательности
200
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
непрерывных линейных функционалов на Е содержится слабо сходящаяся подпоследовательность.
Доказательство. Выберем в Е счетное всюду плотное множество (xi,x2) . .., хп, ...). Если {ф„}— ограниченная (по норме) последовательность линейных функционалов на Е, то числовая последовательность
Ф1 U1), Ф2(*1)» •••> Фп(*1), •••
ограничена. Поэтому из {<рп} можно так выбрать подпоследовательность
Ф(1'’> Фг*..Фп*......
чтобы числовая последовательность ф(Р (х^, фР(Х]),..., ф*,1’^), • сходилась. Далее, из {ф^} можно так выбрать подпоследовательность
Ф(Л Ф<22>...Ф<„2>....
чтобы сходилась последовательность ф)2' (х2), ф® (х2),ф®(х2)’ Продолжая этот процесс, получим такую систему последовательностей
ф?*, Фр.....Фр.......
Ф(Д Ф?>,	Ф<2).....
(каждая из которых содержится в предыдущей), что {ф„4)} сходится в точках X], х2, ..., х&. Тогда, взяв «диагональ»
Фр> Фг2)....Фр’> • • •
мы получим такую подпоследовательность линейных функционалов, что фР(хп), фР(хп), ... сходится для всех п. Но тогда (в силу теоремы 2*) последовательность фр(х), фР(х), ... сходится и для любого х е Е.
Эта теорема вместе с теоремой 1* означает, что в пространстве Е*, сопряженном сепарабельному банахову пространству, ограниченные подмножества, и только они, являются счетно-предкомпактными в «-слабой топологии. Покажем, что на самом деле здесь имеет место предкомпактность, а не только счетная предкомпактность.
Докажем прежде всего следующую теорему.
Теорема 4. Пусть S* — замкнутый единичный шар пространства Е*, сопряженного к сепарабельному нормированному пространству Е. Топологию, индуцированную в S* *-с лабой топологией пространства Е*, можно задать при помощи метрики
Р(Л g) = E2"nl (/-£>*")!>	(2>
S 3]
СЛАБАЯ ТОПОЛОГИЯ И СЛАБАЯ СХОДИМОСТЬ'
201
где {хп} — некоторое фиксированное счетное всюду плотное множество в единичном шаре S пространства Е.
Доказательство. Ясно, что функция p(f, g) обладает всеми свойствами расстояния; кроме того, она инвариантна относительно сдвигов:
P(f + h,g + h) = p(f,g).
Поэтому достаточно проверить, что система окрестностей нуля, определяемая в S* слабой топологией пространства Е*, эквивалентна системе окрестностей нуля, определяемой в S* расстоянием (2), т. е. что а) любой «шар»
Qe = {f: p(f.O)<e}
содержит пересечение S* с некоторой слабой окрестностью нуля в Е* и что б) всякая слабая окрестность нуля в Е* содержит пересечение S* с некоторым Qe.
Выберем N так, что 2~N < е/2 и рассмотрим слабую окрестность нуля
V = VX х e/2 = tf: I (f, Xk) | < e/2,	6=1, 2, ..., N}.
1 N
Тогда, если feS'Dl7, то
N	оо
p(f,O) = £ 2-"|tf, X„)|+ £ 2-"|(f, x„)|< n₽=l	п==У+!
N	OO
<1Z2’“+ Ё 2’"<e' n=l	п=У+1
t. e. S‘HVczQe. Тем самым утверждение а) доказано. Докажем утверждение б). Пусть
U = UVl..Vm;6 = {f: \(f,yk)\<t>,	6=1, 2, ..., пг}
— некоторая «-слабая окрестность нуля в Е*. Можно считать, что II ул II I, 6= 1,2, ..., пг\ так как множество {хп} всюду плотно в S, то найдутся такие номера nlt ..., nm, что ||Ул “	< 6/2- k =	2, ..., tn. Пусть N = max(ni..nm)
и е = 2-(У+1|д. Тогда при /eS‘DQe из неравенств
оо
I 2~п| (/, х„)|<8 п=1
202
линейные функционалы и линейные операторы
[ГЛ. IV
получаем, что | (f, хп) | < 2пе; в частности,
|(f, X„t)| <2n‘e<2ye = d/2.
Следовательно, для всех £=1,2, ..., т получаем
l(f, ^)|<|(лм+1С’ ^-М<д/2+1|/Н^~М<б-
Таким образом, S* П Qe cz U. Теорема доказана.
Ясно, что этот результат автоматически распространяется на любой шар, а значит, и на любое ограниченное подмножество-М cz Е*.
Мы показали (теорема 3), что из каждой ограниченной последовательности в Е* можно выбрать «-слабо сходящуюся подпоследовательность. Иначе говоря, в пространстве Е*, сопряженном сепарабельному линейному нормированному и снабженном «-слабой топологией, каждое ограниченное подмножество М счетно-предкомпактно. Но в силу последней теоремы каждое такое множество есть метризуемое топологическое пространство, а для метрических пространств компактность и счетная компактность совпадают. Таким образом, мы получаем следующий результат.
Теорема 3*. Всякое ограниченное множество М в пространстве Е*, сопряженном сепарабельному нормированному пространству, предкомпактно в смысле «-слабой топологии пространства Е*.
Покажем теперь, что если Е — сепарабельное линейное нормированное пространство, то всякий замкнутый шар в пространстве (£*, Ь) замкнут в «-слабой топологии пространства Е*.
Так как сдвиг в пространстве Е* переводит класс замкнутых (в «-слабой топологии) множеств в себя, то достаточно доказать, что в «-слабой топологии замкнут всякий шар вида S’ = = {f: II f II с}. Пусть f0 S*. По определению нормы функционала найдется такой вектор хе£, что ||х||= 1, fo(x) = а > с. Тогда множество = f(x) > —y-j будет «-слабой окрестностью функционала fo, не содержащей ни одного элемента из шара следовательно, шар замкнут в «-слабой топологии.
Из доказанного утверждения и теоремы 3* вытекает следующая теорема.
Теорема 5. Всякий замкнутый шар в пространстве, сопряженном сепарабельному нормированному пространству, компактен в «-слабой топологии.
Изложенные выше результаты об ограниченных множествах в сопряженных пространствах могут быть перенесены с нормированных пространств на> Произвольные локально выпуклые. См. по этому поводу, например, [42].
5 4]
ОБОБЩЕННЫЕ ФУНКЦИИ
203
§ 4. Обобщенные функции
1. Расширение понятия функции. В различных вопросах анализа термин «функция» приходится понимать с разной степенью общности. Иногда рассматриваются непрерывные функции, в других вопросах приходится предполагать, что речь идет о функциях, дифференцируемых один или несколько раз, и т. д. Однако в ряде случаев классическое понятие функции, даже трактуемое в самом широком смысле, т. е. как произвольное правило, относящее каждому значению х из области определения этой функции некоторое число у = ?(х)> оказывается недостаточным. Вот два важных примера.
1) Распределение масс вдоль прямой удобно задавать плотностью этого распределения. Однако, если на прямой существуют точки, несущие положительную массу, то плотность талого распределения заведомо не может быть описана никакой -«обычной» функцией.
2) Применяя аппарат математического анализа к тем или иным задачам, мы сталкиваемся с невыполнимостью некоторых •операций; например, функцию, не имеющую производной (в некоторых точках или даже всюду), нельзя дифференцировать, если производную понимать как «обычную» функцию. Конечно, .затруднений такого типа можно было бы избежать, ограничившись, скажем, рассмотрением одних только аналитических функций. Однако такое сужение запаса допустимых функций во многих случаях весьма нежелательно.
Оказывается, однако, что подобные затруднения можно преодолеть путем не сужения, а существенного расширения понятия функции, вводя так называемые обобщенные функции. Основой для введения соответствующих определений нам послужит понятие сопряженного пространства, рассмотренное выше.
Подчеркнем еще раз, что введение обобщенных функций «было вызвано вовсе не стремлением к возможно большему расширению понятий анализа, а совершенно конкретными .задачами. По существу, в физике обобщенные функции использовались уже довольно давно, во всяком случае раньше, чем была построена строгая математическая теория обобщенных функций.
Прежде чем переходить к точным определениям, изложим основную идею построения.
Пусть f — фиксированная функция на прямой, интегрируемая на каждом конечном интервале, и пусть ср — непрерывная функция, обращающаяся в нуль вне некоторого конечного интервала Хтакие функции мы в дальнейшем будем называть финитными).
204
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
Каждой такой функции ср можно с помощью фиксированной функции f сопоставить число
ОО
(f, ф) = 5 Н*)ф (*)</*	(1>
— оо
(фактически, в силу финитности <р(х) интеграл берется по некоторому конечному интервалу). Иначе говоря, функцию f можно рассматривать как функционал (линейный, в силу основных свойств интеграла) на некотором пространстве финитных функций. Однако функционалами вида (1) не исчерпываются все функционалы, которые можно ввести на таком пространстве; сопоставляя, например, каждой функции ср ее значение в точке х = 0, мы получим линейный функционал, не представимый в виде (1). Таким образом, функции f(x) естественным образом включаются в некоторое более широкое множество — совокупность всех линейных функционалов на финитных функциях.
Запас функций ф можно выбирать различным образом; например, можно было бы взять все непрерывные финитные функции. Однако, как будет ясно из дальнейшего, разумно подчинить допустимые функции ср, помимо непрерывности и финитности, еще и достаточно жестким условиям гладкости.
2. Пространство основных функций. Перейдем теперь к точным определениям. Рассмотрим на прямой совокупность К всех финитных функций ф, имеющих непрерывные производные всех порядков1)- Функции, принадлежащие К, образуют линейное пространство (с обычными операциями сложения функций и умножения их на числа). В этом пространстве нельзя ввести норму, которая отвечала бы излагаемой ниже теории, однако в нем естественным способом вводится понятие сходимости.
Последовательность {ср„} элементов из К называется сходящейся к функции сре/(; если: 1) существует интервал, вне которого все срп равны нулю1); 2) последовательность производных2) {ф1;*1} порядка k (k — 0, 1, 2, ...) сходится на этом интервале равномерно к ср(Ч (Равномерность сходимости по различным k не предполагается.)
Линейное пространство К с той сходимостью, которую мы в нем определили, мы будем называть основным пространством, а его элементы — основными функциями.
Нетрудно описать топологию в К, которой подчиняется заданная в К сходимость. Такая топология порождается системой окрестностей нуля, каждая из которых задается конечным набором у0> • • • > Ym непрерывных положитель-
!) Интервал, вне которого функция ср равна 0, может быть различным для различных <р s К.
’) Под производной нулевого порядка понимается, как обычно, сама функция.
ОБОБЩЕННЫЕ ФУНКЦИИ
205
§ 41
вых функций и состоит нз тех принадлежащих К функций, которые при всех х удовлетворяют неравенствам
I ф (-*) 1 < Vo (х).I ф<т) (х) | < Ym (х).
Проверка того, что этой топологии действительно подчиняется описанная выше сходимость в К, предоставляется читателю.
Упражнение. Обозначим через Кт подпространство пространства К, состоящее из всех функций <р е К, равных 0 вне отрезка [—т, т]. В про-страстве Кт можно ввести структуру счетно-нормированного пространства, полагая
||ф||п= sup I Ф<й) (х) |, п = 0, 1, 2, ...
0< k < п I X |<т
Проверьте, что топология (соответственно сходимость последовательностей) в пространстве Кт, порождаемая этой системой норм, совпадает с топологией (соответственно сходимостью), индуцированной в Кт описанной выше топологией (сходимостью) в пространстве К. Ясно, что X, сХ2с...с Кт cz ...,
ОО
причем К = |J Кт- Покажите, что множество Q с. К тогда и только тогда т=1
ограничено относительно введенной в К топологии, когда существует такое т, что Q является ограниченным подмножеством счетно-нормированного пространства Кт- Пусть Т — линейный функционал на пространстве X; докажите, что следующие четыре условия равносильны: (а) функционал Т непрерывен относительно топологии пространства К', (б) функционал Т ограничен на каждом ограниченном множестве Q cz К', (в) если <рп е К и <рп —> 0 (в смысле введенной в К сходимости последовательностей), то 7"(фп) —>- 0; (г) для каждого m сужение Тт функционала Т на подпространство Кт К есть непрерывный функционал на Кт-
S. Обобщенные функции.
Определение. 1. Обобщенной функцией (заданной на прямой —оо < х < оо) называется всякий непрерывный функционал Т'(ф) на основном пространстве К. При этом непрерывность функционала понимается в том смысле, что 7'((рп)-> Т'(ф), если последовательность фп сходится к ф в основном пространстве К.
Заметим, прежде всего, что всякая интегрируемая на любом конечном интервале функция f(x) порождает некоторую обобщенную функцию. Действительно, выражение
СО
Л (ф) = 5 f (*) <₽ (*)dx	(2)
— со
есть непрерывный линейный функционал на /С. Такие обобщенные функции мы в дальнейшем будем называть регулярными, а все остальные, г. е. не представимые в виде (2), — сингулярными.
Приведем некоторые примеры сингулярных обобщенных функций.
1.	«6-функция»:
Т (ф) = Ф (0).
206
линейные функционалы и линейные операторы
[ГЛ. IV
Это — непрерывный линейный функционал на К, т. е., по введенной выше терминологии, обобщенная функция. Этот функционал обычно записывают в виде
оо
б (х) ф (х) dx,	(3)
— оо
понимая по б(х) «функцию», равную нулю при всех х =/= 0 и обращающуюся в точке х = 0 в бесконечность так, что
оо
б (х) dx = 1.
— оо
Мы рассматривали уже б-функцию в § 1 как функционал на пространстве всех непрерывных функций, определенных на некотором отрезке. Однако рассмотрение б-функции как функционала на К имеет определенные преимущества, например, позволяет ввести для нее понятие производной.
2.	«Смещенная б-функция». Пусть
Т (ф) = <р (а).
Этот функционал естественно записать по аналогии с обозначением (3) в виде
оо
б (х — а) ф (х) dx.	(4)
—оо
3.	«Производная б-функции». Каждой ф е К ставится в соответствие число — <р'(0). Несколько ниже мы выясним, почему этот функционал естественно считать производной функционала, указанного в первом примере.
4.	Рассмотрим функцию 1/х. Она не интегрируема ни на каком интервале, содержащем точку нуль. Однако для каждой Ф е К интеграл
оо
j ф w 4dx — оо
существует и конечен в смысле главного значения по Коши. Действительно,
оо	д	д	r
j ф(х)у(/х= ф (х)У dx = j ) ~ ?(0-^ dx + j -^-dx.
-оо	—R	-R	-R
Здесь (—R, R)—интервал, вне которого ф обращается в нуль. Первый из стоящих справа интегралов существует в обычном
ОБОБЩЕННЫЕ ФУНКЦИИ
207
«4
смысле (под знаком интеграла стоит непрерывная функция), а второй интеграл равен нулю в смысле главного значения. Таким образом, 1/х определяет некоторый функционал на /С, т. е. обобщенную функцию. Можно доказать, что ни одна из обобщенных функций, приведенных в примерах 1—4, не является регулярной (т. е. не представляется в виде (2) ни с какой локально интегрируемой функцией f).
4. Действия над обобщенными функциями. Для обобщенных функций, т. е. непрерывных линейных функционалов на К, определены операции сложения и умножения на числа. При этом, очевидно, для регулярных обобщенных функций (т. е. «обычных» функций на прямой) сложение их как обобщенных функций (т. е. линейных функционалов) совпадает с обычной операцией сложения функций. То же самое относится и к умножению на числа.
Введем в пространстве обобщенных функций операцию предельного перехода. Мы скажем, что последовательность обобщенных функций {fn} сходится к f, если для каждого ф е К выполнено соотношение
(fn, ф) —> (f, ф)-
Иначе говоря, сходимость последовательности обобщенных функций мы определяем как ее сходимость на каждом элементе из К. Пространство обобщенных функций с этой сходимостью будем обозначать /С*.
Если а — бесконечно дифференцируемая функция, то естественно определить произведение а на обобщенную функцию f формулой
(af, ф) = (f, аф)
(выражение, стоящее здесь справа, имеет смысл, так как atpe Все эти операции — сложение, умножение на числа и на бесконечно дифференцируемые функции, — непрерывны.
Произведение двух обобщенных функций мы не вводим. Можно показать, что определить такое произведение невозможно, если потребовать, чтобы эта операция была непрерывна, а для регулярных обобщенных функций совпадала бы с обычным умножением функций.
Определим теперь для обобщенных функций операцию дифференцирования и рассмотрим ее свойства.
Пусть сначала Т — функционал на К, определяемый некоторой непрерывно дифференцируемой функцией f:
ОО
7'(ф)= $ f (х) ф(х)4/х.
208
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
Его производной естественно назвать функционал dT/dx, определяемый формулой
оо
-^-(ф) = $Г(*)ф(*Мх.
— оо
Интегрируя по частям и учитывая, что каждая основная функция <р обращается в нуль вне некоторого конечного интервала, имеем
оо	оо
57(ф)== $ Г (x)q>(x)dx = — J f (х) ф' (х) dx; — 00	—оо
таким образом, мы получили для dT/dx выражение, в котором производная функции f не участвует. Эти соображения подсказывают следующее определение:
Определение 2. Производной dT/dx обобщенной функции Т называется функционал, определяемый формулой
^(Ф)------7(ф').
Ясно, что функционал, определяемый этой формулой, линеен и непрерывен, т. е. представляет собой обобщенную функцию. Аналогично определяются вторая, третья и дальнейшие производные.
Обозначая обобщенную функцию символом f, мы будем обозначать ее производную (понимаемую в определенном только что смысле) обычным символом f'.
Непосредственно из определения производной обобщенной функции вытекает справедливость следующих утверждений:
1.	Всякая обобщенная функция имеет производные всех порядков.
2.	Если последовательность обобщенных функций {fn} сходится к обобщенной функции f (в смысле определения сходимости обобщенных функций), то последовательность производных {f'} сходится к производной f' предельной функции. То же самое верно и для производных любого порядка.
Это равносильно тому, что всякий сходящийся ряд, составленный из обобщенных функций, можно дифференцировать почленно любое число раз.
Рассмотрим некоторые примеры.
1. Из сказанного выше ясно, что если f — регулярная (т. е. «настоящая») функция, производная которой существует и непрерывна (или кусочно-непрерывна), то производная от нее как от обобщенной функции совпадает с ее производной в обычном смысле.
§ 4)
ОБОБЩЕННЫЕ ФУНКЦИИ
209
2. Пусть
( 1 при х > 0, ' Х t 0 при х^О.
(5)
Эта функция, называемая функцией Хевисайда, определяет линейный функционал
ОО
(F, ф)= ^dx-
о
В соответствии с определением производной обобщенной функции имеем
оо
(Г, ф) = — (f, ф') = — J ф' (*) dx = ф (0)
о
(поскольку ф обращается в 0 на бесконечности). Таким образом, производная функции Хевисайда (5) есть б-функция.
3.	Из примеров 1 и 2 ясно, что если f — функция, имеющая в точках хь х2, ... скачки, равные h\, h2, ... и дифференцируемая (в обычном смысле) в остальных точках, то производная от нее (как от обобщенной функции) представляет собой сумму обычной производной f' (в тех точках, где она существует) и выражения вида 52 Л£д (х — Xi).
4.	Применив определение производной к б-функции, получим, что эта производная представляет собой функционал, принимающий на каждой функции из К значение —ф'(0). А это и есть тот самый функционал, который мы уже назвали «производной от б-функции».
5.	Рассмотрим ряд
sin пх п
(6)
Его суммой служит функция, имеющая период 2л и определяемая на отрезке [—л, л] формулами
Я — X 2
Я + X 2
0
f(x) = j
при 0 < х л, при — л^х<0, при х —0.
210
линейные функционалы и линейные операторы
[ГЛ. IV
Обобщенная производная от нее равна
ОО
“4 + я Е t>(x-2kn).	(7>
£= —ОО
Это — некоторая обобщенная функция (применяя ее к любой финитной функции <р(х), мы всегда будем получать лишь конечное число отличных от нуля слагаемых). С другой стороны, 00
Esin пх
—-— почленно, мы получаем расхо-
дящийся ряд
оо
У, cosnx.
П=1
Однако в смысле сходимости обобщенных функций этот ряд сходится [а именно, к выражению (7)]. Таким образом, понятие обобщенной функции позволяет приписать некоторый вполне определенный смысл сумме ряда, который в обычном смысле расходится. То же самое относится и ко многим расходящимся интегралам. С этим обстоятельством приходится часто встречаться в квантовой теории поля и ряде других областей теоретической физики. Впрочем, такая ситуация возникает уже при решении элементарных задач математической физики с помощыо метода Фурье. Например, при решении уравнения колебаний д2и о д2“
струны ~g^ — a возникают тригонометрические ряды, имеющие вторые производные по х и по t только в смысле теории обобщенных функций, и значит, удовлетворяющие этому уравнению тоже только в смысле этой теории.
5. Достаточность запаса основных функций. Мы определили обобщенные функции как линейные функционалы на некотором пространстве — пространстве К финитных бесконечно дифференцируемых функций. Можно было бы основное пространство выбрать и как-либо иначе. Рассмотрим соображения, которые определили выбор К в качестве пространства основных функций. Они применимы и в других случаях. Наложив на элементы из К жесткие требования финитности и бесконечной дифференцируемости, мы получили, во-первых, большой запас обобщенных функций (сужение основного пространства приводит, очевидно, к расширению сопряженного пространства), а во-вторых, большую свободу в применении к обобщенным функциям основных операций анализа (предельный переход, дифференцирование). Но вместе с тем пространство основных функций К является не слишком узким. В нем достаточно много элементов для того, чтобы с их помощью можно было различать непрерывные функ
5 4]
ОБОБЩЕННЫЕ ФУНКЦИИ
211
ции. Точнее говоря, пусть fi и — две различные непрерывные (а следовательно, и локально интегрируемые) функции на прямой. Тогда существует такая функция <р е К, что
оо	оо
$ f J (х) ср (х) dx ф f2 (х) ср (х) dx.	(8)
— оо	—оо
Действительно, положим f(x)=fi(x)—f2(x). Если f(x)^O, то существует такая точка Хо, что f(xo)=/=O. Тогда f(x) сохраняет знак в некотором интервале (а, 0), содержащем точку Хо-Рассмотрим функцию
ф _ J е <P_J£) <*-а) при а < х < 0, ’	0 при остальных х;
эта функция равна нулю вне (а, 0) и положительна внутри этого интервала; кроме того, она имеет производные всех порядков, так что ср е К (проверьте существование производных в точках х — а и х = 0!). При этом, очевидно,
ОО	Р
f (х) ср (x)dx = f (х) ср (х) dx =/= 0. — оо	а
Мы показали, таким образом, что пространство К достаточно для различения любых двух непрерывных функций ’).
6. Восстановление функции по производной. Дифференциальные уравнения в классе обобщенных функций. Дифференциальные уравнения — одна из основных областей, где применяется теория обобщенных функций. Именно задачи, связанные с уравнениями, в значительной мере и стимулировали развитие этой теории. В основном она применяется к уравнениям в частных производных, которые мы здесь не рассматриваем. Однако мы коснемся здесь некоторых простейших вопросов, относящихся к решению (обыкновенных) дифференциальных уравнений с обобщенными функциями. Начнем с простейшего уравнения вида
У' = f (к)
(f(x)—обобщенная, или «обычная», функция), т. е. с задачи о восстановлении функции по ее производной. Начнем со случая f(x)=O.
Теорема 1. Только константы служат решениями (в классе обобщенных функций) уравнения
	/ = 0.	(9)
’) Это утверждение можно распространить и на функции, существенно более общие, чем непрерывные, но для этого нужно пользоваться понятием интегрируемости по Лебегу, о чем речь будет идти в следующей главе.
212
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
Доказательство. Уравнение (9) означает, что
(/, ф) = (у, — ф') == О	(Ю)
для любой основной функции <р К. Рассмотрим совокупность /СО) тех основных функций, каждая из которых может быть представлена как производная какой-то основной функции. Очевидно, что К<‘) есть линейное подпространство в К. Положим ф!(х)== —ф'(х); функция ф) пробегает К{Г>, когда ф пробегает /С. Равенство (10) определяет функционал у на
Заметим теперь, что основная функция ф принадлежит
в том и только том случае, если
оо
ф(х)(/х = 0,	(11)
— оо
оо
т. е. есть ядро функционала ф(х)(/х. Действительно, если
ф(х) = ф'(х), то
оо
Ф (х) dx = ф (х) I — 0.	(12)
-оо	“°°
Обратно, выражение
X
ф(х)= ф (f)dt	(13)
— со
есть бесконечно дифференцируемая функция. Если (11) выполнено, то ф(х) —финитная функция. Ее производная равна ф(х). В соответствии с результатами п. 6 § 1 гл. III любую основную функцию ф ее /С можно представить в виде
Ф = Ф1 + сфо (ф1 <= А’(П),
где фо — фиксированная основная функция, не принадлежащая /С*1’ и удовлетворяющая условию
ОО
Фо(х)б/х = 1.
— оо
Для этого достаточно положить
ОО
с — ф (х) dx и ф] (х) = ф (х) — Сф0 (х).
— ОО
Таким образом, если задать значение функционала у на основной функции фо(х), то тем самым он будет однозначно
ОБОБЩЕННЫЕ ФУНКЦИИ
213-
§ 4]
определен на всем К.. Положив {у, ф0) = а, получим оо	оо
{у, ф) = {у, Ф1) + с (у, Фо) = а ф (х) dx = аф (х) dx, — оо	—оо
т. е. обобщенная функция у есть постоянная а, что и. требовалось доказать.
Отсюда следует, что если для двух обобщенных функций f и g выполнено равенство f' = g', то f — g = const.
Рассмотрим теперь уравнение y' = f(x\	(14)
где f(x) — произвольная обобщенная функция.
Теорема 2. Уравнение (14) при каждом f Е К* имеет решение, принадлежащее К*.
Это решение естественно назвать первообразной обобщенной функции f.
Доказательство. Уравнение (14) означает, что (/, ф) = (У, — ф') = (Л ф)	(15)
для любой основной функции ф Е К- Это равенство определяет значение функционала у на всех основных функциях ф1 из
(X	\
f, — J Ф1 Q)rfd. — оо	'
Используем теперь полученное выше представление Ф = Ф1 Н- сФо,
элементов из К. Положив (у, ф0) = 0, мы доопределим тем самым функционал у на всем X; именно,
/	X	Ч
0/, ф) = 0л Ф1) = ( Л — $Ф1(1НИ. X	—оо	'
Этот функционал, как легко проверить, линеен и непрерывен. Кроме того, он удовлетворяет уравнению (14). Действительно, для всякого ф Е К ,	X	ч
(/> ф) = (у, — ф') = (а $ ф' Q) dlj = (f, ф). X — оо	'
Итак, для каждой обобщенной функции f(x) существует решение уравнения
У' = f (х),
214
ЛИНЕЙНЫЕ функционалы и линейные операторы
[ГЛ. IV
т. е. каждая обобщенная функция имеет первообразную. В силу теоремы 1 эта первообразная определяется функцией f(x) однозначно с точностью до постоянного слагаемого.
Полученные результаты легко переносятся на системы линейных уравнений. Ограничимся здесь соответствующими формулировками, опуская доказательства.
Рассмотрим однородную систему п линейных дифференциальных уравнений с п неизвестными функциями
y'i = S aik (*) У» i=l,2,...,n,	(16)
£=1
тде atk — бесконечно дифференцируемые функции. Такая система имеет некоторое количество «классических» решений (т. е. решений, представляющих собой «обычные», причем бесконечно дифференцируемые функции). Можно показать, что никаких новых решений в классе обобщенных функций система (16) не имеет.
Для неоднородной системы вида
У( = а1Ъ.Уь "Ь h*	(17)
где fi — обобщенные, a aik — «обычные» бесконечно дифференцируемые функции, решение существует в классе обобщенных функций и определяется с точностью до произвольного решения однородной системы (16).
Если в системе (17) не только а^, но и fi — «обычные» функции, то все решения этой системы, существующие в /<*, также оказываются обычными функциями.
7. Некоторые обобщения. Выше мы рассматривали обобщенные функции «одного действительного переменного», т. е. обобщенные функции на прямой. Можно, на основе тех же идей, ввести обобщенные функции на ограниченном множестве, ска-, жем, на отрезке или окружности, обобщенные функции нескольких переменных, обобщенные функции комплексного аргумента и т. д. Наконец, и для обобщенных функций на прямой то определение, которое было дано выше,—далеко не единственно возможное. Рассмотрим вкратце некоторые из указанных типов обобщенных функций.
а)	Функции нескольких переменных. Рассмотрим в п-мерном пространстве совокупность Кп функций ф(хь х2, ..., хп), имеющих частные производные всех порядков по всем аргументам, и таких, что каждая из этих функций равна нулю вне некоторого параллелепипеда
<h^xi^bi, i== I, 2, ..п.
ОБОБЩЕННЫЕ ФУНКЦИИ
215
« <1
Совокупность Кп представляет собой линейное пространство (с обычными операциями сложения функций и умножения их на числа), в котором можно ввести сходимость следующим образом: фь-хр, если существует такой параллелепипед а, х,
i — 1, 2, ..., п, вне которого каждая из функций <ph равна нулю, а в этом параллелепипеде имеет место равномерная сходимость:
dr<fk	дгЧ	(v	А
dxt‘...dxnn	dxt‘ ...дхпа Kfz'i	/
для каждого фиксированного набора целых неотрицательных чисел ои, ..., ап.
Обобщенной функцией п переменных называется любой непрерывный линейный функционал на Кп. Всякая «обычная? функция п переменных Цх), интегрируемая в любой ограниченной области «-мерного пространства, есть в то же время и обобщенная функция. Значения отвечающего ей функционала определяются формулой
(f, ф) = $ f (х) Ф W dx (х = (хь ..., х„), dx = dxi ... dxn).
Как и в случае п — 1 различные непрерывные функции определяют различные функционалы (т. е. представляют собой различные обобщенные функции).
Для обобщенных функций п переменных понятия предельного перехода, производной и т. д. вводятся с помощью тех же методов, что и в случае одного переменного. Например, частные производные обобщенной функции вводятся формулой
Vx,1 ...дхпп )	дх"‘ ...дхпп J
Отсюда видно, что каждая обобщенная функция п переменных имеет частные производные всех порядков.
б)	Комплексные обобщенные функции. Возьмем теперь в качестве основных функций бесконечно дифференцируемые финитные функции на прямой, принимающие комплексные значения. Линейные функционалы на пространстве К таких функций естественно назвать комплексными обобщенными функциями. Напомним, что в комплексном линейном пространстве существуют линейные и сопряженно-линейные функционалы. Первые удовлетворяют условию (а — число)
(А аф) = а(/, ср), а вторые — условию
(/, аф) = а (f, ф).
-216
линейные функционалы и линейные операторы
[ГЛ. IV
Если f(x)—обычная комплекснозначная функция на прямой, то ей можно сопоставить линейный функционал на К двумя способами:
ОО
(f. ф)|= $ f(x)q>(x)dx
— 00
и
оо
(f, Ф>2 === J f (х)ф(х)</Х.
— 00
(18.)
(182)
Этой же функции f(x) можно сопоставить два сопряженно-ли-нейных функционала, а именно:
оо
i(f, ф)= J f(x)<p(x)dx — оо
и
00
2(Л ф)= $ Г(х)ф(х)</х. — оо
(18,)
(184)
Выбор одной из этих четырех возможностей означает определенный способ вложения пространства «обычных» функций в пространство обобщенных функций. Операции над комплексными обобщенными функциями определяются аналогично тому, как это было описано выше для действительных функций.
в)	Обобщенные функции на окружности. Иногда полезно рассматривать обобщенные функции, заданные на некотором ограниченном множестве. В качестве простейшего примера рассмотрим функции на окружности. За пространство основных функций примем совокупность всех бесконечно дифференцируемых функций на окружности, определив для них операции сложения и умножения на числа обычным образом. Последовательность функций {фп(х)} в этом пространстве мы назовем сходящейся, если для каждого k = О, 1, 2, ... последовательность производных {ф(пА) (х)} сходится на всей окружности равномерно. Поскольку здесь все множество аргументов (окружность) ограничено, условие финитности основных функций автоматически отпадает. Линейные функционалы на этом пространстве мы назовем обобщенными функциями на окружности.
Всякую обычную функцию на окружности можно рассматривать как периодическую функцию, заданную на всей прямой. Перенося это соображение на обобщенные функции, можно связать обобщенные функции на окружности с периодическими •обобщенными функциями. При этом периодической обобщенной
ОБОБЩЕННЫЕ ФУНКЦИИ
217
5-»]
функцией (с периодом а) естественно называть функционал f, удовлетворяющий условию
(f(x), ф(х —a)) = (f(x), Ф(х))
для всякой основной функции ф. Примером периодической обобщенной функции может служить функция
ОО	00
У cos их =— у + л Уд д(х— 2kn),
п=1	А=-оо
которая уже упоминалась выше.
г)	Другие основные пространства. Мы определили выше обобщенные функции на прямой как линейные функционалы на пространстве К. бесконечно дифференцируемых финитных функций. Однако такой выбор основного пространства — не единственно возможный. Например, вместо пространства финитных функций К можно было бы взять более широкое пространство всех бесконечно дифференцируемых функций <р(х) на прямой, убывающих вместе со своими производными быстрее, чем любая степень 1/|х|. Точнее говоря, будем считать, что ф(х) принадлежит основному пространству, которое мы обозначим Soo, если для любых фиксированных р, q = О, 1, 2, ... существует такая постоянная Cp,q (зависящая от р, q и ф), что
I xV"’ (х) I < Ср, q, — оо<х<оо.	(19}
Сходимость в STO определяется таким образом: последовательность {фп(х)} называется сходящейся к ф(х), если для каждого <7 = 0, 1, ... последовательность {ф^(х)} сходится равномерно на любом конечном интервале и если в неравенствах
|хРф(4>(х)| <Ср q
постоянные СР, q можно выбрать не зависящими от п.
При этом получается запас обобщенных функций несколько более узкий, чем в случае пространства К. Например, функция
есть непрерывный линейный функционал на К, но не на S^. Выбор Soo в качестве основного пространства удобен, например, при рассмотрении преобразования Фурье обобщенных функций.
Вообще, как показало развитие теории обобщенных функций, нет необходимости связывать себя раз и навсегда каким-то определенным выбором основного пространства, а целесообразно варьировать его в зависимости от рассматриваемого круга задач. При этом, однако, существенное требование состоит в том, чтобы, с одной стороны, основных функций было «достаточно много» (чтобы с их помощью можно было различать
218
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
«обычные» функции, а точнее, регулярные функционалы), а с другой, — чтобы эти основные функции обладали достаточной гладкостью.
Упражнение. Проверьте, что в пространстве можно ввести структуру счетно-нормнрованного пространства, положив, например,
II Ф 11л = У, sup I (1 4-1 г |f) Ф(/) (х) I,
₽+«=« и р
и что последовательность, сходящаяся в 5<» в определенном выше смысле, сходится и в топологии, определяемой этими нормами.
§ 5.	Линейные операторы
1.	Определение и примеры линейных операторов. Пусть Е и Е]—два линейных топологических пространства. Линейным оператором, действующим из £ в Е\, называется отображение
у = Ах (х^Е, y^Ei), удовлетворяющее условию
А (а*! + 0х2) — a^xi + $Ах2.
Совокупность Da всех тех xs Е, для которых отображение А определено, называется областью определения оператора Л; вообще говоря, не предполагается, что DA = Е, однако мы всегда будем считать, что DA есть линейное многообразие, т. е. если х, у е Da, то ах + pz/ е Da при всех а, р.
Оператор А называется непрерывным в точке х0 е DA, если для любой окрестности V точки уо = Ахо существует такая окрестность U точки хо, что Ах е V, как только х е U П DA. Оператор А называется непрерывным, если он непрерывен в каждой точке х е Da-
Когда Е и £i — нормированные пространства, это определение равносильно следующему: оператор А называется непрерывным, если для любого е > 0 существует такое б > 0, что из неравенства
||х' —х"||<6	(x',x"^Da)
следует
|| Ах' — Ах" || < в.
Множество тех х е £, для которых Ах = 0, называется ядром линейного оператора А и обозначается КегА. Множество тех у^Е\, для которых у = Ах при некотором хеОд, называется образом линейного оператора А и обозначается 1mA. Как ядро, так и образ линейного оператора, являются линейными многообразиями. Если оператор непрерывен и DA = Е, то Кег А является подпространством, т. е. замкнуто. Что же ка
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
2191
в 51
сается образа непрерывного линейного оператора, то он не обязательно будет подпространством в Е\, даже если DA = Е.
Понятие линейного функционала, введенное в начале этой главы, есть частный случай линейного оператора. Именно, линейный функционал — это линейный оператор, переводящий данное пространство Е в числовую прямую R1. Определения линейности и непрерывности оператора переходят при Ei — R1 в соответствующие определения, введенные ранее для функционалов.
Точно так же и ряд дальнейших понятий и фактов, излагаемых ниже для линейных операторов, представляет собой довольно автоматическое обобщение результатов, уже изложенных в § 1 этой главы применительно к линейным функционалам.
Примеры линейных операторов. 1. Пусть Е — линейное топологическое пространство. Положим
1х = х для всех х е Е.
Такой оператор, переводящий каждый элемент пространства в себя, называется единичным оператором.
2.	Пусть Е и Е\ — произвольные линейные топологические пространства и пусть
Ох = 0 для всех х^Е
(здесь 0 — нулевой элемент пространства Ei). Тогда О называется нулевым оператором.
3.	Общий вид линейного оператора, переводящего конечномерное пространство в конечномерное. Пусть А — линейный оператор, отображающий n-мерное пространство Rn с базисом €i, ..., еп в m-мерное пространство R"1 с базисом fi> • ••, fm-Если х — произвольный вектор из Rn, то
х= X xiei, i=l
й в силу линейности оператора А
п
Ах — X XiAet, i=i
Таким образом, оператор А задан, если известно, во что он переводит базисные векторы еь ..., еп. Рассмотрим разложения векторов Aei по базису fi, ..., fm. Имеем
Aei — S akifk-k=i
Отсюда ясно, что оператор А определяется матрицей коэффициентов ||ahi||. Образ пространства Rn в Rm представляет собой
220
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
линейное подпространство, размерность которого равна, очевидно, рангу матрицы ||«Atll, т. е. во всяком случае не превосходит п. Отметим, что всякий линейный оператор, заданный в конечномерном пространстве, автоматически непрерывен.
4.	Рассмотрим гильбертово пространство Нив нем некоторое подпространство Н{. Разложив Н в прямую сумму подпространства Н\ и его ортогонального дополнения, т. е. представив каждый элемент h е Н в виде
Л==Л1 + Л2 (А, е Я,, h2 ± Я,),
положим Ph — h\. Этот оператор Р естественно назвать оператором ортогонального проектирования, или ортопроектором Н на Н\. Линейность и непрерывность проверяются без труда.
5.	Рассмотрим в пространстве непрерывных функций на отрезке [а, Ь] оператор, определяемый формулой
ь
Ф (•$) = §/С (•$• О Ф (0	(1)
а
где K(s, t)—некоторая фиксированная непрерывная функция двух переменных. Функция ф($) непрерывна для любой непрерывной функции ф(0, так что оператор (1) действительно переводит пространство непрерывных функций в себя. Его линейность очевидна. Для того чтобы говорить о его непрерывности, необходимо предварительно указать, какая топология рассматривается в нашем пространстве непрерывных функций. Читателю предлагается доказать непрерывность оператора в случаях, когда: а) рассматривается пространство С [а, Ь], т. е. пространство непрерывных функций с нормой || ф || = max | ф (/) |;
Г с А7’
б) когда рассматривается Сг[а, А], т. е. ||ф||=| \ф2 (/)(#) •
6. В том же пространстве непрерывных функций рассмотрим оператор
Ф (0 = Фо (О Ф (О,
где фо(О—фиксированная непрерывная функция. Линейность этого оператора очевидна. (Докажите его непрерывность при нормировках, указанных в предыдущем примере.)
7. Один из важнейших для анализа примеров линейных операторов— это оператор дифференцирования. Его можно рассматривать в различных пространствах.
а)	Рассмотрим пространство непрерывных функций С [а, А] и
оператор
Df (0 = Г (О,
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
221
5 5]
действующий в нем. Этот оператор (который мы считаем действующим из С [а, Ь] опять-таки в С [а, Ь]) определен, очевидно, не на всем пространстве непрерывных функций, а лишь на линейном многообразии функций, имеющих непрерывную производную. Оператор D линеен, но не непрерывен. Это видно, например, из того, что последовательность
сходится к 0 (в метрике С[а, Ь]), а последовательность
Z)qp„ (0 = cos и/ не сходится.
б)	Оператор дифференцирования можно рассматривать как оператор, действующий из пространства С1 непрерывно дифференцируемых функций на [а, Ь] с нормой
|| <р ||, = шах | <р (t) | + max | <р' (t) |
в пространство С [а, &]. В этом случае оператор D линеен и непрерывен и отображает все С1 на все С [а, Ь].
в)	Рассмотрение оператора дифференцирования как оператора, действующего из С1 в С [а, &], не вполне удобно, так как хотя при этом мы и получаем непрерывный оператор, определенный на всем пространстве, но не к любой функции из С* можно применить этот оператор дважды. Удобнее рассматривать оператор дифференцирования в еще более узком пространстве, чем С1, а именно, в пространстве С00 бесконечно дифференцируемых функций на отрезке [а, &], в котором топология задается счетной системой норм
||<р||„= sup | ф<*> (f) |. п
Оператор дифференцирования переводит все это пространство в себя, и, как легко проверить, непрерывен на нем.
г)	Бесконечно дифференцируемые функции составляют весьма узкий класс. Возможность рассматривать оператор дифференцирования в существенно более широком пространстве и вместе с тем как непрерывный оператор дают обобщенные функции. В предыдущем параграфе мы уже говорили о том, как определяется дифференцирование обобщенных функций. Из сказанного там ясно, что дифференцирование есть линейный оператор в пространстве обобщенных функций, притом непрерывный в том смысле, что из сходимости последовательности обобщенных функций {fn(0} к НО следует сходимость последовательности их производных к производной обобщенной функции f(t).
222	ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ (ГЛ. IV
2. Непрерывность и ограниченность. Линейный оператор, действующий из Е в Е\, называется ограниченным, если он определен на всем Е и каждое ограниченное множество переводит снова в ограниченное. Между ограниченностью и непрерывностью линейного оператора существует тесная связь, а именно, справедливы следующие утверждения.
I. Всякий непрерывный линейный оператор ограничен.
Действительно, пусть М с Е — ограниченное множество, а множество AMc^Ei не ограничено. Тогда в Е\ найдется такая окрестность нуля V, что ни одно из множеств — AM не содержится в V. Но тогда существует такая последовательность хп е М, что ни один из элементов — Ахп не принадлежит V, и мы получаем1), что -±-хп-*0 в Е, но последовательность
Ахп } не сходится к 0 в Ef, это противоречит непрерывности оператора А.
II. Если А — ограниченный линейный оператор, действующий из Е в Е], и в пространстве Е выполнена первая аксиома счет-ности, то оператор А непрерывен.
Действительно, если А не непрерывен, то найдется такая окрестность нуля V в Е\ и такая определяющая система {t/n} окрестностей нуля в Е, что t/n+i cr Un и для каждого п существует такое х„е-^-Дп, что Axn^nV. Последовательность хп в Е ограничена (и даже стремится к 0), а последовательность Ахп не ограничена в fj (поскольку она не содержится ни в одном из множеств nV). Итак, если оператор А не непрерывен, а в Е имеет место первая аксиома счетности, то А и не ограничен.
Наше утверждение доказано.
Итак, для оператора, заданного на пространстве с первой аксиомой счетности (к которым, в частности, относятся все нормированные и счетно-нормированные пространства), ограниченность равносильна непрерывности.
Все операторы, приведенные в примерах 1—6 в предыдущем пункте, непрерывны. В силу только что доказанного утверждения I все перечисленные там операторы ограничены.
Если Е и Ei — нормированные пространства, то условие ограниченности оператора А, действующего из Е в Е\, можно сформулировать так: оператор А называется ограниченным, если он переводит всякий шар в ограниченное множество. В силу линейности А это условие можно сформулировать так: оператор А
>) См. упражнение 1 в п. 1, § 5, гл. III.
4 5)
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
223
ограничен, если существует такая постоянная С, что для всякого f Е
II Af || < С || f И.
Наименьшее из чисел С, удовлетворяющих этому неравенству, называется нормой оператора А и обозначается ||Д||.
Теорема 1. Для любого ограниченного оператора А, действующего из нормированного пространства в нормированное, ||Д||= sup || Дх ||= sup ‘Lyi,-.	(2)
Л х л<1	Х-»ЬО II х II
Доказательство. Введем обозначение а = sup ||Ах||. 1*10
В силу линейности А справедливо равенство
Поэтому для любого элемента х
II Дх ||/|| х || ^ а, т. е.
II Дх||<а||х||, откуда следует, что
|| Д || = inf С<а.
Далее, для любого е > О существует такой элемент хе =#= 0, что а —в<|| Дхе ||/|| хе || или
(а-8)||хе||<||Дхе||<С||хе||.
Поэтому
а — в С inf С = || А ||,
и, в силу произвольности 8, а ^ || Д ||. Следовательно, || А || = а.
3. Сумма и произведение операторов.
Определение 1. Пусть А и В — два линейных оператора, действующих из линейного пространства Е в пространство Et. Назовем их суммой А + В оператор С, ставящий в соответствие элементу хеЕ элемент
у = Ах + Вх е Е{.
Он определен на всех элементах, принадлежащих пересечению Da П Db областей определения операторов А и В.
Легко проверить, что С = АВ— линейный оператор, непрерывный, если А и В непрерывны.
Если Е и Е\—нормированные пространства, а операторы А и В ограничены, то Д + В тоже ограничен, причем
||Д + BIKII Д|| + 1|В||.	(3)
224
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
Действительно, для всякого х
|| (Л + В)х|| = || Ах + Вх || < || Ах || +1| Вх||<(|| А || + 1|В ||)||х||, откуда и следует (3).
Определение 2. Пусть А и В — линейные операторы, причем А действует из пространства Е в Е{, а В действует из Ej в Е2. Произведением ВА операторов А и В называется оператор С, ставящий в соответствие элементу хеЕ элемент z = B(Ax) из Е2. Область определения Dc оператора С = ВА состоит из тех хеОд, для которых Ax^DB. Ясно, что оператор ВА линеен. Он непрерывен, если А и В непрерывны.
Упражнение. Доказать, что Dc — линейное многообразие, если DA и Db линейные многообразия.
Если А и В — ограниченные операторы, действующие в нормированных пространствах, то и оператор ВА ограничен, причем
ЦВЛ1КЦВ11-||Л||.	(4)
Действительно,
|| В (Лх) || < || В ||  || Ах || < || В || • || Л || • || х ||,	(5)
откуда следует (4).
Сумма и произведение трех и более операторов определяются последовательно. Обе эти операции ассоциативны.
Произведение kA оператора Л на число k определяется как оператор, который элементу х ставит в соответствие элемент kAx.
Совокупность 2?(Е,Е\) всех непрерывных линейных операторов, определенных на всем Е и отображающих Е в Ei (где Е и Е\ — фиксированные линейные топологические пространства), образует, по отношению к введенным выше операциям сложения и умножения на числа, линейное пространство. Если Е и Е} — нормированные пространства, то ^(Е, Е})—нормированное пространство (с тем определением нормы оператора, которое было дано выше).
Упражнение. Пусть Е—нормированное, а Et— полное нормированное пространства. Тогда: а) нормированное пространство S?(E, £,) полно;
ОО	оо
б) если Ake2(E, Е ) и У || Ak || < со, то ряд £ Ak сходится к некото-к=\
рому оператору А е 2 (Е, Е^ и
|| Л=1 II л=1
4. Обратный оператор, обратимость. Пусть Л — оператор, действующий из Е в Е\, и DA — область определения, a Im Л — образ этого оператора.
§5]
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
225
Определение 3. Оператор А называется обратимым, если для любого уе1тД уравнение
Ах = у
имеет единственное решение.
Если А обратим, то каждому t/elm/l можно поставить в соответствие единственный элемент х е Da, являющийся решением уравнения Ах = у. Оператор, осуществляющий это соответствие, называется обратным к А и обозначается Д-1.
Теорема 2. Оператор Д-1, обратный линейному оператору А, также линеен.
Доказательство. Заметим прежде всего, что образ 1тД оператора Д, т. е. Дл-ь есть линейное многообразие. Пусть yi„ i/jElm/t Достаточно проверить выполнение равенства
Д-1 («1//1 + а2у2) = aiA~'y1 + а2А~'у2.	(7>
Пусть Д%1 — у\ и Ах2 — у2. В силу линейности А имеем
А (ал + а2х2) = а^! + а2у2.	(8}
По определению обратного оператора,
A~'yi=Xi, А~1у2 = х2,
откуда, умножая эти равенства на ai и а2 соответственно и складывая, получим
«1Д-1//1 + а2А~1у2 — сцХ] + а2х2.
С другой стороны, из (8) и из определения обратного оператора следует, что
а,Х! + а2х2 = А~1 (а^ + а2у2), что вместе с предыдущим равенством дает
Д-1(а1У1 + а2г/2) = а1Д-11/1 + а2А~1у2.
Теорема 3 (теорема Банаха об обратном операторе). Пусть А — линейный ограниченный оператор, взаимно однозначно отображающий банахово пространство Е на банахово пространство Ei. Тогда обратный оператор Д-1 ограничен.
Для доказательства нужна следующая лемма.
Лемма. Пусть М — всюду плотное множество в банаховом пространстве Е. Тогда любой ненулевой элемент у^Е можно разложить в ряд
У = У\ + У 2 + • • • + Уп + • • •, где ykf=M и ||ук||<31|у||/2*.
226
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
{ГЛ. (V
Доказательство. Элементы ук будем строить последовательно: у\ выберем так, чтобы
IIУ-Ух II <11 У\№-	(9)
Это возможно, так как неравенство (9) определяет сферу радиуса ||у||/2 с центром в точке у, внутри которой должен найтись элемент из М (М всюду плотно в Е). Выберем уч е М так, чтобы ||у — ух — у2||IIif 11/4, у3 — так, чтобы ||у — ух — уч — у311 < ||у||/8 и вообще уп выберем так, чтобы ||у— ух — ... —уп|| <11у11/2п. Такой выбор всегда возможен, так как М всюду плотно в Е. В силу выбора элементов ук
п II
при п->оо, fe=i II
т. е. ряд У, yk сходится к у. Оценим нормы элементов ук-. fe==l
II Ух II = II Ух~ У + УII <11 Ух ~ УII + IIУII < 31| у Ц/2,
IIУ2II = II У2 + Ух — У + у — Ух II<Н У — Ух — У 2II + IIУ — Ух II< 31| у ||/4.
Наконец,
II II = II +#п-1 + Л-Ух~ У + У — Ух~ ••• — Уп-1И<
<U — Ух— ••• — Уп ll + llif — Ух— ••• —Уп-х II <3||у||/2".
Лемма доказана.
Доказательство теоремы 3. В пространстве Ех рассмотрим множество Мк — совокупность тех у, для которых выполняется неравенство ||Л-1у||^ &||у||. Всякий элемент простран-оо
ства Ех попадает в некоторое Мк, т. е. Et = U Mk. По теореме £=1
Бэра (теорема 2 из п. 3 § 3, гл. II) хотя бы одно из множеств Мк, скажем, Мп, плотно в некотором шаре В. Внутри шара В выберем шаровой слой Р с центром в точке из Мп\ слой Р— это совокупность точек г, для которых справедливо неравенство Р < ||z — yo'll < а, где 0 < р < а, у0 е Мп.
Перенеся слой Р так, чтобы его центр попал в начало координат, получим шаровой слой Ро — {z :0 -< р <||z||< а}.
Покажем, что в Ро плотно некоторое множество MN. Пусть z е Р П Мп-, тогда z — уо е Ро и
II Л’1 (z - уо) || < || А~lz I +1| А~ *уо | < п (||г || +1| уо ||) < <n(l|z-yoll + 2||yo||) = n||z-yo||(l +	<
<л||г-уо1|(1+2||уо||/р), (10)
S 5]
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
227
Величина п (1 + 2|| «/о Il/Р) не зависит от z. Положим1)
АГ= 1 + и [1 + 2|| уо||/0].
Тогда в силу (10) z — уо^ MN, а из того, что А4П плотно в Р, следует, что A4n плотно в Pq.
Рассмотрим произвольный ненулевой элемент у из Е^. Всегда можно подобрать % так, чтобы было 0 < ||Ху|1 < а, т. е. ХуеРо- Так как плотно в Ро, можно построить последовательность yk^MN, сходящуюся к Ьу. Тогда последовательность 4- ук сходится к у. Очевидно, что если yt то и Л
ук^ MN при любом действительном Л, =#= 0; таким образом, MN плотно в £iZ{0), а потому и в
Рассмотрим ненулевой элемент уеЕь по доказанной лемме его можно разложить в ряд по элементам из Mn:
У — У\ + У 2 + • • • + Ук + • • • >
причем || ук || < 31| у ||/2*.
Рассмотрим в пространстве Е ряд, составленный из прообразов элементов ук, т. е. элементов хк = А~1ук-
Этот ряд сходится к некоторому элементу х, так как имеет место неравенство
1|х*||=||АЛ*11<ЛГ||у* || < ЗЛГ|| д/11/2*;
при этом оо	оо
1|х||<£ IIII<ЗЛГ||1/1|£ -Л-= ЗЛГ || у ||.
А=1	А=1 2
ОО
В силу сходимости ряда У, хп и непрерывности оператора А п=1
можно применить почленно А к этому ряду. Получим
Ах = Ах} А-Ах2 А- ••• —У1А~У2~1- • •• — у,
откуда х = А~ху. Кроме того,
1|А~'1/11 = 11х||<ЗЛГ||1/||,
и так как оценка верна для любого у =/= 0, то с оатор А*г ограничен.
Приведем некоторые важные следствия этой теореь. Прежде всего дадим ее естественное обобщение на случай, когда отображение А не взаимно однозначно.
Следствие 1 (теорема об открытом отображении). Линейное непрерывное отображение А банахова пространства Е
1) Скобки [ ] означают целую часть числа.
228
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
на (все) банахово пространство Е\ открыто. Это вытекает из доказанной теоремы и следующей леммы.
Лемма. Пусть Е — банахово пространство и L — некоторое его замкнутое подпространство. Отображение В пространства Е на фактор-пространство Е/L, ставящее в соответствие каждому х Е класс смежности, содержащий х, открыто.
Действительно, пусть Z = £/£, a G — открытое множество в £ и Г = BG. Пусть 20еГ. Тогда найдется элемент х0, принадлежащий B~'z0 П G. Пусть теперь U (х0)— е-окрестность точки Хо, целиком лежащая в G, и пусть z— произвольный элемент Е-окрестности точки 20еГ, т. е. ||z — Zoll< е. В соответствии с определением нормы в фактор-пространстве это означает существование такого элемента xeB-1z, что ||х — х0|| < е, т. е. хе С;(хо)с G. Но тогда z^BG = T, т. е. Е-окрестность точки z0 содержится в Г. Следовательно, Г открыто. Лемма доказана.
Представив отображение А пространства £ на Е{ как суперпозицию отображения В пространства £ на £/Ker4 = Z (открытого в силу леммы) и взаимно однозначного отображения С пространства Z на Et (открытого в силу теоремы 3), получаем, что А открыто.
Следствие 2 (лемма о тройке). Пусть Е, Е\, Е2— банаховы пространства и А, В — непрерывные линейные операторы, из Е в Е[ и из Е в Е2 соответственно, причем В отображает Е на все Е2 (т. е. Im В = Е2). Если при этом
Кег Л => Кег В,	(11)
то существует такой непрерывный линейный оператор С, отображающий Ег в Е], что А = СВ.
Символически это удобно изобразить такой схемой:
в
Кег В—>Е —► £2
П II
Кег А —> £ —£i
Действительно, рассмотрим для каждого элемента ze£2 его полный прообраз B-1ze£. Из условия (11) следует, что все. элементы х, принадлежащие B~lz, переводятся оператором А в один и тот же элемент у. Этот элемент у мы и поставим в соответствие элементу z. Полученный оператор С отображает £2 в £i и, очевидно, линеен. Он непрерывен (а следовательно, и ограничен). Действительно, если G — открытое множество в £ь то его полный прообраз C~lG при отображении С может быть яаписан как B(A~1G). Но A'lG открыто в силу непрерывности оператора А, а тогда и В(А~'О) открыто в силу следствия 1.
ЛИНЕЙНЫЕ ОПЕРАТОРЫ
229
$ 5]
Упражнения. 1. Пусть Е, — нормированные пространства; линейный оператор А, действующий из £ в £,, с областью определения Da cz Е, представляющей собой линейное многообразие, называется замкнутым, если из условий хпеОл, хп->-х, Ахп-*у следует, что xeDa и Ах — у. Проверьте, что всякий ограниченный оператор замкнут.
2. Рассмотрим прямое произведение £Х£| пространств Е и Еи т. е. линейное нормированное пространство, состоящее из всевозможных пар [х, у], хеЕ, ye.Eh с нормой || [х, у] || = || х || Д- || у Hi (|| • || и || • II, — нормы в Е, £ соответственно). Оператору А можно сопоставить множество G^={[x, у] xeDA, у — Ах) cz Е X Е}, называемое его графиком. Проверьте, что Ga — линейное многообразие в Е X Elt замкнутое тогда и только тогда, когда оператор А замкнут. Докажите, что если Е, Е,—банаховы пространства, а оператор А определен на всем Е и замкнут, то он ограничен (теорема Банаха о замкнутом графике).
Указание. Примените теорему 3 к оператору Р: [х, Лх]->х, действующему из Ga в Е.
3. Пусть Е и £,— полные счетно-нормированные пространства. Докажите, что если А — непрерывный линейный оператор, взаимно однозначно отображающий Е на £ь то обратный оператор А~1 непрерывен. Сформулируйте и докажите теорему о замкнутом графике для счетно-нормированных пространств.
Рассмотрим множество S (Е, Е\) ограниченных линейных •операторов А, отображающих банахово пространство Е в банахово пространство Ej. Это — банахово пространство. Выделим в нем множество ^^(Е, £,) операторов, отображающих Е на все Е[ и имеющих ограниченный обратный. Это множество открыто в 3?(Е, ЕД. Именно, справедлива следующая теорема.
Теорема 4. Пусть До е % 2? (Е, ЕД и пусть АД — произвольный оператор из 2?(Е,Е\) такой, что || АД || < 1/|| Д^1||. Тогда оператор (ДоД-АД)-1 существует и ограничен, т. е. Д = = До Д- АД 6= ЗЗ? (Е, ЕД.
Доказательство. Фиксируем произвольный элемент y^Ei и рассмотрим отображение В пространства Е в себя, •определяемое формулой
Вх = Ао^у — До"1 АДх.
Из условия || АД || < || Д711| следует, что отображение В сжимающее. Так как Е полно, то существует единственная неподвижная точка х отображения В:
х = Вх = Ао'у — Д£' АДх, откуда
Дх = Аох Д- АДх = у.
Если Ах' = у, то х' — тоже неподвижная точка отображения В, так что х' = х. Таким образом, для всякого у^Е{ уравнение Ах — у имеет в Е единственное решение, т. е. оператор А обладает обратным Д'1, определенным на всем Еь По теореме 3 •оператор Д'1 ограничен, что и требовалось доказать.
239
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
Теорема 5. Пусть Е — банахово пространство, I — тождественный оператор в Е, а А — такой ограниченный линейный, оператор, отображающий Е в себя, что ||Л||< 1. Тогда оператор (/ — Л)-1 существует, ограничен и представляется в виде
(1-АГ'^Ак.	(12)
Доказательство. Существование и ограниченность оператора (/ — Л)'1 вытекает из теоремы 4 (впрочем, это следует также и из приводимого ниже рассуждения).
Так как || А || < 1, то Е || Ak ||^ Е || A ||ft < оо. Пространство Е 4=0	4=0
со
полно, поэтому из сходимости ряда II Ak II вытекает, что сумма
А=0 со
ряда Ak представляет собой ограниченный линейный оператор. Для любого п имеем
(I-А) Е Аь=ХАк(1-А) = /-Ап+‘; k=0	к=0
переходя к пределу при п->оо и учитывая, что ||Дп+1||^
||Л ||п+1-> 0, получаем
(1-А)Е Ak=E Ak(I — A) — I, fe==0	fe=O
откуда
(I-A)~l=E Ak,
4=0
что и требовалось доказать.
Упражнение. Пусть А — ограниченный линейный оператор, отображающий банахово пространство Е на банахово пространство Е\. Докажите, что существует такая постоянная а > 0, что если В ^2?(Е, £|) и Ц4 —ВЦ < < а, то В отображает Е на все Е\ (Банах).
5. Сопряженные операторы. Рассмотрим непрерывный линейный оператор у = Ах, отображающий линейное топологическое пространство Е в такое же пространство Е[. Пусть g— линейный функционал, определенный на Ei, т. е. g^E*. Применим функционал g к элементу у = Ах; как легко проверить, g(Xx) есть непрерывный линейный функционал, определенный на Е; обозначим его f. Функционал f есть, таким образом, элемент пространства Е*. Каждому функционалу g^ Ei мы поставили в соответствие функционал f е Е*, т. е. получили некото
4 5]
линейные операторы
231
рый оператор, отображающий £Г в Е*. Этот оператор называется сопряженным к оператору А и обозначается А*.
Обозначив значение функционала f на элементе х символом (f, х), получим, что (g, Ах) = (f, х), или
(g, Ax) = (A*g, х).
Это соотношение можно принять за определение сопряженного оператора.
Пример. Сопряженный оператор в конечномерном пространстве. Пусть действительное «-мерное пространство Rn отображается в пространство Rm (m-мерно'е) оператором А и пусть llajjll—матрица этого оператора.
Отображение у = Ах можно записать в виде системы равенств
п yi=Yailxi, i=i
а функционал f(x) —в виде
f (х) = Е f/Xj.
Из равенства
f (х) = g (Лх) = Е giVi = E E gia-ii*! = E E gtait
Hl	z=l /=1	/=1	Z=1
m
получим, что fi = Yi giaih Так как f = A*g, отсюда следует, что
оператор А* задается матрицей, транспонированной по отношению к матрице оператора А.
Следующие свойства сопряженных операторов вытекают сразу из определения.
1.	Оператор А* линеен.
2.	(А + В)* = 4* + В*.
3.	Если k — число, то (kA) * — kA*.
Если А — непрерывный оператор из Е в £ь то А* есть непрерывный оператор из (Е*,Ь) в (£*, Ь) (проверьте это!). Если Е и Ei — банаховы пространства, то это утверждение может быть уточнено следующим образом:
Теорема 6. Если А — ограниченный линейный оператор, отображающий банахово пространство Е в банахово пространство Е], то
II л-ц=и и.
Доказательство. В силу свойств нормы оператора
имеем
1№ X) M(g, Ах) I<||g||. || Л || • || х ||,
232
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ и линейные операторы
[ГЛ. IV
откуда || Д*£|| <|| А || • || g||; следовательно,
II А* || <|| А ||.	(13)
А х
Пусть х^Е и Дх =/= 0; положим Уо = 'ц дх ц ^Ер, очевидно, что ||уо||= 1. По следствию из теоремы Хана-Банаха существует такой функционал g, что ||g||= 1 и (g, уо) = 1, т. е. (g,Ax) = = ||Дх||. Из соотношений
||Дх|| = (я, Дх) = |(Д*£, х)|<
<1|Д*Я1Ы|х||<11 Д‘||-Ш-||х|| = || Д‘1Ы|х|[
получаем || А ||<|| А* ||, что вместе с неравенством (13) дает
II 4*11 = 11 А ||.
Теорема доказана.
Упражнение. Пусть Е и £, — рефлексивные банаховы пространства и А е S?(E, Ei). Докажите, что А** — А.
Следующее утверждение представляет собой еще одно полезное следствие теоремы Банаха об обратном операторе.
Лемма (об аннуляторе ядра оператора). Пусть А — непрерывный линейный оператор, отображающий Е на все Elt где Е, Ei — банаховы пространства. Тогда
(Ker Д)х = 1т Д*.	(14)
Действительно, проверим сначала включение
(КегД)х дэ1ш Д*.	(15)
Если /е!тД*, то существует такой элемент g^E], что f = A*g, и для всех х е Кег А имеем:
(f, х) = (Д*£, х) = (g, Ах) =0, т. е. /е(КегД)х.
Докажем теперь обратное включение:
(Кег Д)х<=1шД’.	(16)
Пусть f е (Кег Д)1. Тогда для отображений
f: E->R и A: E->Et
выполнены условия леммы о тройке (следствие 2). Поэтому существует такой элемент g <= Е*1г что (f, х) = (g, Ах), т. е. f = A*g. Тем самым включение (16), а значит, и равенства (14) доказаны.
6. Сопряженный оператор в евклидовом пространстве. Самосопряженные операторы. Рассмотрим случай, когда А — ограниченный оператор в гильбертовом пространстве Н (действительном или комплексном). Согласно теореме об общем виде линей-
линейные операторы
233
§ 5)
кого непрерывного функционала в гильбертовом пространстве отображение т, сопоставляющее каждому у е Н линейный функционал
(ту) (х) = (х, у),
есть изоморфизм (или сопряженный изоморфизм, если Н комплексно) пространства Н на все сопряженное пространство И*. Пусть А*— оператор, сопряженный оператору А. Ясно, что отображение А* — т-1А*т представляет собой ограниченный линейный оператор, действующий в Н; легко видеть, что для любых х.у^Н
(Ах, у) = (х, А*у).
Так как || А* || = || А ||, а отображения т и т-1 изометричны, то II А* II = 11А ||.
Все сказанное справедливо, разумеется, и для конечномерного евклидова пространства, действительного или комплексного.
Примем следующее соглашение. Если R — евклидово пространство (конечной или бесконечной размерности), то оператором, сопряженным к действующему в R оператору А, мы назовем определенный выше оператор А*, действующий в том ж е пространстве R.
Следует подчеркнуть, что это определение отличается от определения сопряженного оператора в произвольном банаховом пространстве Е, согласно которому сопряженный оператор А* действует в сопряженном пространстве Е*. Иногда оператор А*, в отличие от А*, называют эрмитово-сопряженным. Чтобы не усложнять терминологии и обозначений, мы будем писать А* вместо А* и говорить о сопряженном операторе, помня, однако, что в евклидовом случае сопряженный оператор всегда понимается в смысле, указанном в этом пункте.
Ясно, что в евклидовом пространстве R оператор, сопряженный к А, можно определить как такой оператор, который при всех х, у е R удовлетворяет равенству
(Ах, у) — (х, А'у).
Поскольку операторы А и А* действуют теперь в одном и том же пространстве, возможно равенство А — А*. Выделим важный класс операторов в евклидовом (в частности, гильбертовом) пространстве.
Определение. 4. Ограниченный линейный оператор А, действующий в евклидовом пространстве R, называется самосопряженным, если А — А*, т. е. если
(Ах, у) = (х, Ау) для всех х, у R.
234
линейные функционалы и линейные операторы
(ГЛ. IV
Отметим следующее важное свойство оператора Д* сопряженного к оператору Д. Подпространство /?] евклидова пространства /? называется инвариантным относительно оператора Д, если из вытекает Лхей|. Если подпространство Ri инвариантно относительно А, то его ортогональное дополнение Ri~ инвариантно относительно Д*. Действительно, если у е Ri\ то для всех х <= Ri имеем
(х, Д’у) = (Дх, у) = 0, поскольку Дхей|. В частности, если А — самосопряженный оператор, то ортогональное дополнение к любому его инвариантному подпространству само инвариантно относительно А.
Упражнение. Докажите, что если А и В — ограниченные линейные операторы в евклидовом пространстве, то справедливы равенства:
(аД + РВ)’ = аД* + рВ*.
(ДВ)’ = В’Д’, (Д’)* = Д, /* = /(/ —единичный оператор).
7. Спектр оператора. Резольвента1). Вряд ли можно указать более важное понятие в теории операторов, чем понятие спектра. Напомним прежде это понятие для конечномерного случая.
Пусть А — линейный оператор в n-мерном пространстве Сп. Число X называется собственным значением оператора Д, если уравнение
Дх = Лх
имеет ненулевые решения. Совокупность всех собственных значений называется спектром оператора А, а все остальные значения Л — регулярными. Иначе говоря, X есть регулярная точка, если оператор А — X/ обратим. При этом (Д—А/)*1 определен на всем Сп и, как и всякий оператор в конечномерном пространстве, ограничен. Итак, в конечномерном пространстве существуют две возможности:
1)	уравнение Ах — 'Лх имеет ненулевое решение, т. е. X есть собственное значение для Д; оператор (Д — X/)'1 при этом не существует;
2)	существует ограниченный оператор (Д — X/)"1, определенный на всем пространстве, т. е. X есть регулярная точка.
Но если А—оператор, заданный в бесконечномерном пространстве Е, то имеется еще и третья возможность, а именно:
3)	оператор (Д — V)-1 существует, т. е. уравнение Дх = Хх имеет лишь нулевое решение, но этот оператор определен не на всем Е (и, возможно, неограничен).
*) Всюду, где речь идет о спектре оператора, мы считаем, что оператор действует в комплексном пространстве.
$5]
ЛИНЕЙНЫЕ операторы
235
Введем следующую терминологию. Число X мы назовем регулярным для оператора А, действующего в (комплексном) банаховом пространстве Е, если оператор Ry. = (Д— X/)-,1, называемый резольвентой оператора А, определен на всем Ё и, следовательно (теорема 3), ограничен. Совокупность всех остальных значений X называется спектром оператора А. Спектру принадлежат все собственные значения оператора А, так как если (Д— Х/)х = 0 при некотором х =/= 0, то (Д — X/)-1 не существует. Их совокупность называется точечным спектром. Остальная часть спектра, т. е. совокупность тех X, для которых (Д — V)-1 существует, но определен не на всем Е, называется непрерывным спектром. Итак, каждое значение является для оператора X или регулярным или собственным значением, или точкой непрерывного спектра. Возможность наличия у оператора непрерывного спектра — существенное отличие теории операторов в бесконечномерном пространстве от конечномерного случая.
Пусть А — ограниченный оператор, действующий в банаховом пространстве Е. Если точка X регулярна, т. е. оператор (Д — Й)"1 определен на всем Е и ограничен, то при достаточно малом б оператор (Д—(ХД-б)/)'1 тоже определен на всем Е и ограничен (теорема 4), т. е. точка X Д- б тоже регулярна. Таким образом, регулярные точки образуют открытое множество. Следовательно, спектр, т. е. дополнение этого множества, — замкнутое множество.
Теорема 7. Если А — ограниченный линейный оператор в банаховом пространстве Е и |Х| >||Д||, то X — регулярная точка.
Доказательство. Так как, очевидно, д_	(у_±д),
ТО оо ^и-*о-'--4('-4) =-4Е-£-
При 11Д1К1М этот ряд сходится и задает определенный на всем Е ограниченный оператор (теорема 5). Иначе говоря, спектр оператора А содержится в круге радиуса ||Д|| с центром в нуле.
Примеры. 1. В пространстве С [а, б] рассмотрим оператор Д, определяемый формулой
Ax(t) = tx(t).	(17)
Тогда
(Д — X/) х (/) = (/ — Л) х (/).
Оператор (17) обратим при любом X, так как из равенства
(/-Л)х(0 = 0
236
ЛИНЕЙНЫЕ функционалы и линейные операторы
1ГЛ. IV
следует, что непрерывная функция x(t) тождественно равна нулю. Однако при X е [а, 6] обратный оператор, задаваемый формулой
(Д-Л/)-1х(0 = 7^тх(0
определен не на всем С[а, 6] и неограничен. (Докажите это!) Таким образом, спектр оператора (17) представляет собой отрезок [а, Ь], причем собственные значения отсутствуют, т. е. имеется лишь непрерывный спектр.
2. Рассмотрим в пространстве /г оператор А, определяемый следующим образом:
А: (хь х2,	(О, хь х2, ...).	(18)
Этот оператор не имеет собственных значений. (Докажите это!) Оператор А~' ограничен, но определен в /2 лишь на подпространстве Х| = 0, т. е. X = 0 есть точка спектра оператора.
Упражнения. Содержит ли спектр оператора (18) какие-либо точки, кроме X = О?
Замечания. (1) Всякий ограниченный линейный оператор, определенный в комплексном банаховом пространстве, имеющем хотя бы один отличный от нуля элемент, имеет непустой спектр. Существуют операторы, у которых спектр состоит из единственной точки (например, оператор умножения на число).
(2) Теорема 7 может быть уточнена следующим образом. Пусть п____________________________________
г = lim V|| Ап || П-»о°
(можно доказать, что этот предел существует для любого ограниченного оператора А), тогда спектр оператора А целиком лежит в круге радиуса г с центром в нуле. Величина г называется спектральным радиусом оператора А.
(3) Резольвентные операторы и /?х, отвечающие точкам ц и X, перестановочны между собой и удовлетворяют соотношению
которое легко проверить, умножив обе части этого равенства на
(А — XZ) (А — р7).
Отсюда вытекает, что если Хо— регулярная точка для А, то производная от по X при X = Хо, т. е. предел
lim 7?x»+ax-T_^j_[ ДХ->О ДХ
существует (в смысле сходимости по операторной норме) и равна Rlo.
Упражнение. Пусть А — ограниченный самосопряженный оператор’ в комплексном гильбертовом пространстве Н. Докажите, что его спектр есть замкнутое ограниченное подмножество действительной оси.
КОМПАКТНЫЕ ОПЕРАТОРЫ
237
§ 6]
§ 6. Компактные операторы
1. Определение и примеры компактных операторов. В отличие от линейных операторов в конечномерных пространствах, для которых имеется исчерпывающее описание, изучение произвольных линейных операторов в бесконечномерных пространствах представляет собой весьма сложную и, по существу, необозримую задачу. Однако некоторые важные классы таких операторов могут быть описаны полностью. Среди них один из важнейших образуют так называемые компактные операторы. Эти операторы, с одной стороны, близки по своим свойствам к конечномерным (т. е. ограниченным операторам, переводящим данное пространство в конечномерное) и допускают достаточно детальное описание, а с другой, играют важную роль в различных приложениях, в первую очередь в теории интегральных уравнений, которым будет посвящена гл. IX.
Определение 1. Оператор А, отображающий банахово пространство Е в себя (или другое банахово пространство ЕД, называется компактным, или вполне непрерывным, если он каждое ограниченное множество переводит в предкомпактное.
В конечномерном нормированном пространстве всякий линейный оператор компактен, поскольку он переводит любое ограниченное множество в ограниченное, а в конечномерном пространстве всякое ограниченное множество предкомпактно.
В бесконечномерном пространстве компактность оператора есть требование существенно более сильное, чем просто его непрерывность (т. е. ограниченность). Например, единичный оператор в гильбертовом пространстве непрерывен, но отнюдь не компактен. (Докажите это независимо от рассматриваемого ниже примера 1.)
Рассмотрим некоторые примеры.
1. Пусть / — единичный оператор в банаховом пространстве Е. Покажем, что если Е бесконечномерно, то оператор / не компактен. Для этого достаточно, очевидно, показать, что единичный шар в Е (который, разумеется, переводится оператором I в себя) не предкомпактен. Это в свою очередь вытекает из следующей леммы, которая нам понадобится и в дальнейшем.
Лемма 1. Пусть xly хг, ... линейно независимые векторы в нормированном пространстве Е и пусть Еп — подпространство, порожденное векторами Xj, ..., хп. Тогда существует последовательность векторов у\, у %, . . ., удовлетворяющая следующим условиям:
1) Un 11=1; 2) ;/„e£rt; 3) р(уп, Е„_,) > 1/2, где р(уп, Еп-[)—расстояние вектора уп от En-i, т. е.
inf \\уп — х ||.
х е £п-1
238
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
ГГЛ. IV
Доказательство. Действительно, так как векторы хц Х2, ... линейно независимы, то xn^En-i и p(xn, En-i) = а > 0. Пусть х*— такой вектор из En-ь что ||хп — х*|| < 2а. Тогда, поскольку а = р(хп, Еп-i) = р(*п — х*, En-i), вектор
удовлетворяет всем условиям 1)—3). За у\ при этом можно взять Xi/llxJI.
Лемма доказана.
Пользуясь этой леммой, в единичном шаре всякого бесконечномерного нормированного пространства можно построить последовательность векторов {уп}, для которой p(yn-i, уп) > 1/2. Ясно, что такая последовательность не может содержать никакой сходящейся подпоследовательности. А это и означает отсутствие предкомпактности.
2.	Пусть А — непрерывный линейный оператор, переводящий банахово пространство Е в некоторое его конечномерное подпространство. Такой оператор компактен, поскольку он переводит всякое ограниченное подмножество М с: Е в ограниченное подмножество конечномерного пространства, т. е. в предком-пактное множество.
В частности, в гильбертовом пространстве оператор ортогонального проектирования на подпространство компактен в том и только том случае, если это подпространство имеет конечную размерность.
3.	Рассмотрим в пространстве /2 оператор А, определенный следующим образом: если х = (хь х2, .... хп, ...), то
Ах = (хь |х2, ..., ^хв>	(1)
Этот оператор компактен. Действительно, поскольку всякое ограниченное множество из /г содержится в некотором шаре этого пространства, достаточно доказать, что образы шаров предкомпактны, а в силу линейности оператора достаточно проверить это для единичного шара. Но оператор (1) переводит единичный шар пространства /г в множество точек, содержащееся в основном параллелепипеде (см. гл. II, § 7, п. 1). Следовательно, это множество вполне ограничено, а значит, и предкомпактно.
Упражнение. Пусть Ах = (щх;, a2Xi, .... апхп, • • •); при каких условиях на последовательность чисел {ап} этот оператор в /2 компактен?
4.	В пространстве непрерывных функций С [а, 6] важный класс компактных операторов образуют операторы, представимые
S 61
КОМПАКТНЫЕ ОПЕРАТОРЫ
239
в виде
Ах = у (s) =	(s, t)x (t) dt.	(2)
a
Покажем справедливость следующего утверждения: если функция K(s,t) ограничена на квадрате a^s^b, a^.t^.b и все ее точки разрыва лежат на конечном числе кривых
t — ((>k(s), k—l, 2, ..., п,
где <pft — непрерывные функции, то формула (2) определяет в пространстве С [а, Ь] компактный оператор.
Действительно, заметим, прежде всего, что в указанных условиях интеграл (2) существует для любого s из отрезка [а, Ь], т. е. функция y(s) определена. Далее, пусть
М— sup | (s, t) | а С s, t < Ь
и пусть G — множество тех точек (s, t), для которых хотя бы при одном k — 1, 2, ..., п выполняется неравенство
Следом G(s) этого множества на каждой прямой s = const служит объединение интервалов
п .
G (s) = Д {11 — <р4 (s) | <	.
Пусть F — дополнение множества G до квадрата а s, t b. Так как F компактно, а функция /Cfs, t) непрерывна на F, то существует такое б > 0, что
для любых точек (s', t'), (s", t") из F, удовлетворяющих условию
|s'-s"| + |f— f'|<6.	(3)
Оценим теперь разность y(s')—y(s") в предположении, что | s' — s" | < 6. Имеем ь
| у (s')-y(s")K $ I /С (s',	t) || x(t)\df,
a
для оценки стоящего справа интеграла разобьем промежуток интегрирования [а, б] на объединение интервалов G(s')U G(s"), которое обозначим Р, и остальную часть отрезка [а, б], которую
240
линейные функционалы и линейные операторы
[ГЛ. IV
обозначим Q. Заметив, что Р есть объединение интервалов, суммарная длина которых не превосходит е/(ЗА1), получаем
0-K(s", 011х(01Л <-у1И|. р
Интеграл по Q допускает, очевидно, оценку
?IK(s', 0-K(s", 0 || x(t)\dt < |||х||.
Q
Таким образом,
If/(s') — f/(s")l<e||x||.	(4)
Неравенство (4) показывает, что функция y(s) непрерывна, т. е. формула (2) действительно определяет оператор, переводящий пространство С [а, 6] в себя. Далее, из того же неравенства видно, что если {х(£)} — ограниченное множество в С[а, 6], то соответствующее множество {«/(«)} равностепенно непрерывно. Наконец, если ||х|| С, то
ъ
II у\\ = sup | t/(s) |<sup ^| К(s, t) II x(t)\dt^M(b — a) ||x||. a
Таким образом, оператор (2) переводит всякое ограниченное множество из С [а, 6] в множество функций, равномерно ограниченное и равностепенно непрерывное, т. е. предкомпактное.
4а. Расположение точек разрыва функции K(s,t) на конечном числе кривых, пересекающих прямые s = const лишь в одной точке, существенно. Пусть, например,
( 1 при $ < 1/2,
K(s, 0 = 1 п	'/0
(.0 при s^l/2;
оператор (2) с таким ядром, заданным на квадрате 0 s, t 1 и имеющим точками разрыва весь отрезок s — 1/2, 0 t 1, переводит функцию х(/)= 1 в разрывную функцию.
46. Если положить A(s, t) = 0 при t > s, то оператор (2) примет вид
S
y(s)= t)x(t)dt.	(5)
а
Будем считать, что функция /<(«,/) непрерывна при / < s; тогда из сказанного в примере 4 следует, что оператор (5) вполне непрерывен в С [а, 6].
5 6]
КОМПАКТНЫЕ ОПЕРАТОРЫ
241
Этот оператор называется оператором типа Вольтерра1).
Замечание. При принятом нами определении компактного оператора может оказаться, что образ замкнутого единичного шара некомпактен (хотя он предкомпактен). Действительно, рассмотрим в пространстве С[—1, 1] оператор интегрирования
S
Jx(s)= x(f)dt\
-1
по доказанному выше, J — вполне непрерывный оператор в С[—1, 1]. Положим
	' о,	если	- 1 =S	
xn(f} = <	nt,	если	0 <t	1/«>
	 1,	если	1/п <	
Тогда хп е С[—1, 1], ||хп|| = 1 для всех п и
'	0,	если — 1	<0,
уп (/) = Jxn (t) = -	nt2!?.,	если 0</^l/n,
. t—l/(2n), если l/n<f<l.
Ясно, что последовательность уп сходится в С[—1, 1] к функции ( 0, если — t t, если 0 < t 1,
которая не является образом (при отображении 7) никакой функции из С[—1, 1], ибо функция у' (t) разрывна.
Однако можно доказать, что если пространство рефлексивно (например, гильбертово), то образ замкнутого единичного шара при компактном линейном отображении компактен.
2. Основные свойства компактных операторов.
Теорема 1. Если {Дп}—последовательность компактных операторов в банаховом пространстве Е, сходящаяся по норме к некоторому оператору А, то оператор А тоже компактен.
Доказательство. Для установления компактности оператора А достаточно показать, что, какова бы ни была ограниченная последовательность Xi, х2, ..., хп, ... элементов из Е, из последовательности {Дхп} можно выделить сходящуюся подпоследовательность.
Так как оператор Xi компактен, то из последовательности {Д]ХП} можно выбрать сходящуюся подпоследовательность. Пусть
я?’, Ч”....• • •	(6)
]) Вито Вольтерра — итальянский математик, автор ряда работ по функциональному анализу и интегральным уравнениям.
242
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
1ГЛ. IV
— такая подпоследовательность, что {^х®} сходится. Рассмотрим теперь последовательность	Из нее опять-таки мож-
но выбрать сходящуюся подпоследовательность. Пусть
х®, х®, .... х®, ...
— такая подпоследовательность, выбранная из (6), что сходится. При этом, очевидно, {Л*®} тоже сходится. Рассуждая аналогично, выберем из последовательности {х®} такую подпоследовательность
X®, х®, ..., х®,
что {Л3х®} сходится, и т. д. Возьмем затем диагональную последовательность
х®, х®, ..., х£>, ....
Каждый из операторов А1г А2, ..., Ап, ... переводит ее в сходящуюся. Покажем, что и оператор А тоже переводит ее в сходящуюся. Тем самым компактность А будет установлена. Так как пространство Е полно, то достаточно показать, что {Лх^}— фундаментальная последовательность. Имеем
| АхМ - Ах^ || < || Ах<*> - Akx™ || +
+ II ~ II + IIW ~ II- (П
Пусть ||хп|| С; выберем сначала k так, что ||Л—Дй|| < е/(ЗС), а потом выберем такое N, чтобы при всех п> N и т> N выполнялось неравенство
Il	II <8/з
(это возможно, так как последовательность {A^x^j сходится). При этих условиях из (7) получаем, что
|| Ах<»>-Ах™ || <8
для всех достаточно больших п и т.
Теорема доказана.
Легко проверить, что линейная комбинация компактных операторов компактна. Следовательно, в пространстве 3? (Е, Е) всех ограниченных линейных операторов, определенных на Е, компактные операторы образуют замкнутое линейное подпространство.
Посмотрим теперь, будет ли совокупность компактных операторов замкнута относительно операции перемножения операторов. На самом деле здесь справедливо даже существенно более сильное утверждение.
9 61
КОМПАКТНЫЕ ОПЕРАТОРЫ
243
Теорема 2. Если А — компактный оператор, а В — ограниченный, то операторы АВ и ВА компактны.
Доказательство. Если множество М а Е ограничено, то ВМ тоже ограничено. Следовательно, АВМ предкомпактно, а это и означает, что оператор АВ компактен. Далее, если М ограничено, то AM предкомпактно, а тогда, в силу непрерывности В, множество ВАМ тоже предкомпактно, т. е. оператор ВА компактен.
Теорема доказана.
Следствие. В бесконечномерном пространстве Е компактный оператор не может иметь ограниченного обратного.
Действительно, иначе единичный оператор I — А~'А был бы компактен в Е, что невозможно (см. пример 1).
Замечание. Теорема 2 показывает, что компактные операторы образуют в кольце всех ограниченных операторов SE (Е, Е) двусторонний идеал ').
Теорема 3. Оператор, сопряженный компактному, компактен.
Доказательство. Пусть А—компактный оператор в банаховом пространстве Е. Покажем, что сопряженный оператор А*, действующий в Е*, переводит каждое ограниченное подмножество из Е* в предкомпактное. Поскольку всякое ограниченное подмножество нормированного пространства содержится в некотором шаре, достаточно показать, что А* переводит каждый шар в предкомпактное множество. В силу линейности оператора А* достаточно показать, что образ A*S* замкнутого единичного шара S*aE* предкомпактен.
Будем рассматривать элементы из Е* как функции не на всем пространстве Е, а лишь на компакте AS— замыкании образа единичного шара при отображении А. При этом множество Ф функций, отвечающих функционалам из 5*, будет равномерно ограничено и равностепенно непрерывно. Действительно, если ||<р||	1, то
sup | <р (х) [ == sup | <р (х) КII <р II sup || Ах||<|| А||
х s AS	х е AS	х е S
И
| ф (х') - ф (х") |< II ф || • || х' - х" II < II х' - х" II.
Следовательно, это множество Ф предкомпактно в пространстве С [Д5] (в силу теоремы Арцела). Но множество Ф с метрикой, индуцированной обычной метрикой пространства непрерывных функций С [AS], изометрично множеству A*S* (с метрикой,
) Идеалом (двусторонним) в некотором кольце R называется такое подкольцо Ц, что если ае Ц, г е R, то аге U и гаеЦ.
244	ЛИНЕЙНЫЕ функционалы и линейные ОПЕРАТОРЫ [ГЛ. IV
индуцированной нормой пространства £*). Действительно, если gi,g2eS*, то
II A'g\ — A'g21|= sup | (Д*^ — A*g2, x) | = xeS
= sup | (gt — g2, Ax) |= sup | (gt — g2, z)\ = x S	z e AS
= sup_| (gt - g2, z)| = p(gb g2). z <= AS
Поскольку Ф предкомпактно, то оно вполне ограничено; следовательно, вполне ограничено и изометричное ему множество Д*5*. Поэтому Д*5* предкомпактно в Е*.
Теорема доказана.
Замечание. Нетрудно проверить, что множество Ф замкнуто в С[XS], так что оно компактно, поэтому компактно и множество Д*5*, хотя (как это видно из замечания на стр. 241) образ замкнутого единичного шара при произвольном вполне непрерывном отображении может не быть компактом. Ситуация в только что доказанной теореме отличается от общей тем, что замкнутый единичный шар 5* в Е* компактен в «-слабой топологии пространства Е* (см. теорему 5 § 3). Отсюда и следует компактность (в метрике пространства £*) образа множества 5* для любого компактного оператора.
Упражнения. 1. Пусть А — ограниченный линейный оператор в банаховом пространстве. Докажите, что если оператор А* компактен, то и Л компактен.
2.	Для того чтобы линейный оператор А в гильбертовом пространстве Н был компактен, необходимо и достаточно, чтобы (эрмитово) сопряженный к нему оператор Л* был компактен.
3.	Собственные значения компактного оператора.
Теорема 4. Всякий компактный оператор А в банаховом пространстве Е имеет при любом 6 > 0 лишь конечное число линейно независимых собственных векторов, отвечающих собственным значениям, по модулю превосходящим 6.
Доказательство. Пусть А], А2, ..., Ап, ... какая-либо последовательность собственных значений операторах (различных или с повторениями) таких, что |А„| > б; Xi, х2, ..., хп, ...— отвечающая им последовательность собственных векторов, и пусть эти векторы линейно независимы.
Воспользуемся леммой 1 (стр. 237) и построим такую последовательность векторов yi, у2, ..., уп, .. что
1) уп^Еп, 2) || уп ||=1; 3)р (уп, Еп—Х) — inf || уп - х || > 1/2, х е Еп-1
где Еп — подпространство, порожденное Xi, х2, .. ., хп.
5 6]
КОМПАКТНЫЕ ОПЕРАТОРЫ
245-
Последовательность {} ограничена в силу неравенства Хп|>6. Мы утверждаем, что из последовательности образов ' ^(х-)} нельзя выбрать сходящуюся. Действительно, пусть-п,
Уп — Е “Л тогда fe=l
л(4г)=Е ~хгXk+=Уп+Znt
fe=l
где
п—1 гп=Еа* k=!
1) xk <=
к
Поэтому при любых р> q
IЛ (77) — А (77) I= 'I Ур + Zp ~ "1“ Zp) II
= II УР — (yq + zq — zp} || > 1/2,
поскольку yq + Zq — Zp Ep-{.
Это противоречит компактности оператора А.
Из доказанной теоремы, в частности, вытекает, что числолинейно независимых собственных векторов, отвечающих данному собственному значению X #= О компактного оператора Д, конечно.
Из этой теоремы следует также, что число собственных значений Хп компактного оператора А во внешности круга |Х| > > 6 > 0 всегда конечно, и что все собственные значения оператора А можно перенумеровать в порядке невозрастания модулей: | Xi |	| Хг| • • •
4.	Компактные операторы в гильбертовом пространстве. Выше мы говорили о компактных операторах в произвольном банаховом пространстве. Сейчас мы дополним эти сведения некоторыми фактами, относящимися к компактным операторам в-гильбертовом пространстве.
Мы назвали оператор А компактным, если он переводит всякое ограниченное множество в предкомпактное. Поскольку Н — Н*, т. е. Н есть пространство, сопряженное к сепарабельному, в нем все ограниченные множества (и только они) слабо предкомпактны. Следовательно, в гильбертовом пространстве компактный оператор можно определить как оператор, переводящий всякое слабо предкомпактное множество в множество, предкомпактное в сильной топологии.
246
ЛИНЕЙНЫЕ функционалы и линейные операторы
(ГЛ. IV
Наконец, в некоторых случаях удобно еще и такое определение компактности оператора в гильбертовом пространстве: оператор А называется компактным в И, если он всякую слабо сходящуюся последовательность переводит в сильно сходящуюся. Действительно, пусть это последнее условие выполнено и пусть М — ограниченное множество в И. Каждое бесконечное подмножество множества М содержит слабо сходящуюся последовательность. Если она переводится в сильно сходящуюся последовательность, то AM предкомпактно. Обратно, пусть А — компактный оператор, {хп} — слабо сходящаяся последовательность и х — ее слабый предел. Тогда {Дхп} содержит подпоследовательность, сходящуюся сильно. В то же время {Дхп} сходится слабо, в силу непрерывности А, к Ах, откуда следует, что {Ахп} не может иметь более одной предельной точки. Следовательно, {Ахп} —сходящаяся последовательность.
5.	Самосопряженные компактные операторы в Н. Для самосопряженных линейных операторов в конечномерном евклидовом пространстве известна теорема о приведении матрицы такого оператора к диагональной форме в некотором ортогональном нормированном базисе. В этом пункте мы распространим эту теорему на компактные самосопряженные операторы в гильбертовом пространстве. Результаты этого пункта справедливы как для действительного, так и для комплексного гильбертова пространства. Для определенности будем считать, что Н комплексно.
Установим прежде всего некоторые свойства собственных векторов и собственных значений самосопряженных операторов в Н, вполне аналогичные, впрочем, соответствующим свойствам конечномерных самосопряженных операторов.
I. Все собственные значения самосопряженного оператора А в Н действительны.
В самом деле, пусть Ах = Кх, ||х|| =/= 0, тогда
Х(х, х)==(Дх, х) = (х, Ах) = (х, Хх) = Х(х, х),
-откуда X = X.
II. Собственные векторы самосопряженного оператора, отвечающие различным собственным значениям, ортогональны.
Действительно, если Ах — Хх и Ау = ру, причем X =/= ц, то
Ь (х, у) = (Ах, у) == (х, Ау) = (х, ру) = и (х, у),
откуда (х, у) = 0.
Докажем теперь следующую фундаментальную теорему.
Теорема 5 (Гильберт — Шмидт). Для любого компактного самосопряженного линейного оператора А в гильбертовом пространстве Н существует ортогональная нормированная еистема {фп} собственных векторов, отвечающих собственным
«6}
КОМПАКТНЫЕ ОПЕРАТОРЫ
24Г
значениям {Хп} (Хп =£ 0), такая, что каждый элемент записывается единственным образом в виде
5 = S ck4>k + &'> А
где вектор Кег-А, т. е. удовлетворяет условию А£'.— 0; при-этом
S ^асаФа k
и если система {q>n} бесконечна, то limXn = 0 (п->оо).
Для доказательства этой основной теоремы нам понадобятся» следующие вспомогательные утверждения.
Лемма 2. Если {£п} слабо сходится к £ и линейный оператор А компактен, то
Q(U = (^„, U ->« $ = Q®. ' Доказательство. Для всякого п
I (Aln, & - (А1-, I) |<| (Aln, U - (Л£, у | +1« Ы - (Al, I) |, Но
I (А1-п, Е„) - « 1п) |< || £„ ||  || Л (£„ - g) || и
I (Aln, 1) - (А1-, g) | = | (g, А (£„ - £)) |< || £ || • || А (£„ - g) И, и так как числа ||£га|| ограничены, а || Л(£п — £) ||-*0, то 1(л?„, и-(Д, Ю1-*о, что и требовалось доказать.
Лемма 3. Если функционал
। Qa) i=i ns, g)i,
где А — ограниченный самосопряженный линейный оператор, достигает на единичном шаре максимума в точке go, то из (go, tj) = 0 вытекает, что
И5о, n) = (U ЛП) = 0.
Доказательство. Очевидно, llgoll = 1. Положим t— Ео + дп V1 + I « I2 II nil2 ’
где а — произвольное комплексное число. Из ||g0|| = 1 следует, что
11111=1.
Далее
Q(?) = 1 + |Л~йн2 IQ(5о) + 5+ а+1аWL
248
ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
[ГЛ. IV
Число а можно взять сколь угодно малым по модулю и таким, что а(А%о, и) —действительная величина. Тогда a(Ago, л) = = a (Ago, л) и
Qm = Q(y + 2a(AU л) + О (а2).
Из последнего равенства ясно, что если (Ago, л) =#= 0, то а можно выбрать так, что | Q(£) | > | Q(£o) |, а это противоречит условию леммы.
Из леммы 3 непосредственно вытекает, что если |Q(g) | достигает максимума при g = go, то go есть собственный вектор оператора.
Доказательство теоремы 5. Будем строить элементы <рь по индукции, в порядке убывания абсолютных величин соответствующих им собственных значений:
| %11 | %2 I I I • • •
Для построения элемента tpi рассмотрим выражение/|Ф(Ю! — — | (Ag, g) | и докажем, что оно на единичном шаре достигает максимума. Пусть
S= sup | (Ag, g)|
I J I < 1
и g], g2,	— такая последовательность, что ||gn|| = 1 и
I (А£л, UI-*S при n-»oo.
Так как единичный шар в Н слабо компактен, то из {gn} можно выбрать подпоследовательность, слабо сходящуюся к некоторому элементу ц. При этом ||т]||	1 и в силу леммы 2
| (Ац, т]) 1 = 5.
Элемент i] мы и примем за <р|. Ясно, что || л II в точности равняется 1. (Действительно, пусть ||ц||<1; положим Л| = л/11л11; тогда ||т]|||—1 и | (Ат),, Л1) | > S, что противоречит определению S.) При этом
Aq^^cpi, откуда
Пусть теперь собственные векторы
<Р1, <р2, • • •, фп, отвечающие собственным значениям
Aq, ^-2, • • • 1
уже построены, Пусть M(q>i, <р2, Фп) — подпространство натянутое на <рь <р2> •••> фп- Рассмотрим функционал
I (AL £) I
КОМПАКТНЫЕ ОПЕРАТОРЫ
249
«6]
на совокупности элементов, принадлежащих
<р2, .... <рп)
(т. е. ортогональных фь ф2, . • •, фп) и удовлетворяющих условию Ш<1. Множество Мп есть подпространство, инвариантное относительно А (так как подпространство М(фь.ф2..фп)
инвариантно и А самосопряжен). Применяя к М„ проведенные выше рассуждения, получим, что в М„ найдется вектор (обозначим его фп+i), собственный для оператора А.
Возможны два случая: 1) после конечного числа шагов мы получим подпространством^,, в котором (Л£, £) =0; 2) (Д£, £)
0 на Мп при всех п.
В первом случае из леммы 3 вытекает, что переводится оператором А в нуль (положите т] = Л£0), т. е. целиком состоит из собственных векторов, отвечающих X = 0. Система построенных векторов {фп} состоит из конечного числа элементов.
Во втором случае получаем последовательность {фп} собственных векторов, для каждого из которых Хп =# 0. Покажем, что Хп-> 0. Последовательность {фп} (как и всякая ортогональная нормированная последовательность) слабо сходится к нулю, поэтому элементы Дфп = Хпфп должны сходиться к нулю по норме, откуда | Xn | = IIА<рп II -> 0.
Пусть
М^яеАЦфь <р2, •••, <Р„, ...)=п^ =#0. п
Если	и £ =#= 0, то (Л£, УСХпНЦ2 для всех п, т. е.
(Л£, £) = 0. Отсюда в силу леммы 3 (при тах| (Д£, £) | =0), примененной к М1 получаем At, = 0, т. е. подпространство М1 переводится оператором А в нуль.
Из построения системы {фп} ясно, что всякий вектор можно представить в виде
£ = Е СаФа + I', где А£' = 0
откуда вытекает, что
А%> Е ^г^ф^.
Теорема доказана. Эта теорема играет фундаментальную роль в теории интегральных уравнений, о которых будет идти речь в гл. IX.
Замечание. Доказанная теорема означает, что для всякого компактного самосопряженного оператора А в Н существует ортогональный базис пространства Н, состоящий из собственных векторов этого оператора. Действительно, для получе
~2б0	ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ [ГЛ. IV
ния такого базиса достаточно дополнить построенную в доказательстве теоремы систему собственных векторов {<рп} произвольным ортогональным базисом подпространства Af1 переводимого оператором А в нуль. Иными словами, здесь получается результат, вполне аналогичный теореме о приведении матрицы конечномерного самосопряженного оператора к диагональному виду в ортогональном базисе.
Для несамосопряженных операторов в n-мерном пространстве такое приведение, вообще говоря, невозможно, однако верна следующая теорема: всякое линейное преобразование в п-мер~ лом пространстве имеет хотя бы один собственный вектор. Нетрудно убедиться, что это утверждение не переносится на компактные операторы в Н. Действительно, пусть оператор А задан в /2 формулой
Ax = A(xlt х2...ха, = х„ ......................•)•	(8)
Этот оператор компактен (проверьте!), но не имеет йи одного собственного вектора (докажите это).
Упражнение. Найдите спектр оператора (8).
ГЛАВА V
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
Понятие меры р(А) множества А является естественным' обобщением понятий:
1)	длины Z(A) отрезка Д,
2)	площади S (F) плоской фигуры F,
3)	объема У(б) пространственной фигуры G,
4)	приращения <р(&)—<р(а) неубывающей функции <р(/) на-полуинтервале[а, &),
5)	интеграла от неотрицательной функции, взятого по некоторой линейной, плоской или пространственной области, и т. п.
Это понятие возникло в теории функций действительного переменного, а оттуда перешло в теорию вероятностей, теорию динамических систем, функциональный анализ и многие другие области математики.
В § 1 этой главы мы изложим теорию меры для множеств на плоскости, отправляясь от понятия площади прямоугольника. Общая теория меры будет изложена в §§ 2 и 3. Читатель легко заметит, что все рассуждения, проведенные в § 1, имеют общий, характер и в абстрактной теории повторяются без существенных изменений.
§ 1. Мера плоских множеств
1. Мера элементарных множеств. Рассмотрим систему & множеств на плоскости (х, у), каждое из которых определяете»; одним из неравенств вида
а^х^б,
а^х < Ь,
а <х^Ь,
а<х <Ь
и одним из неравенств вида
с
с < У < d,
с^у <d с < у <d
где а, Ь, с и d — произвольные числа. Множества, принадлежа-, щие этой системе, мы будем называть прямоугольниками. Замк-. нутый прямоугольник, определяемый неравенствами
а^х^б, суd,
•252
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
(ГЛ. V
представляет собой прямоугольник в обычном смысле (вместе с границей), если а < b и с <Zd, отрезок (если а = Ь и с <Zd или а < b и c = d), точку (при а = b, с = d) и, наконец, пустое множество (если а > b или с > d). Открытый прямоугольник
а <х <Ь, с < у <d
•будет в зависимости от соотношения между а, Ь, с и d прямоугольником без границы или пустым множеством. Каждый из прямоугольников остальных типов (назовем их полуоткрытыми) представляет собой настоящий прямоугольник, без одной, двух или трех сторон, интервал, полуинтервал, либо, наконец, пустое множество.
Класс всех прямоугольников на плоскости обозначим S.
Для каждого из прямоугольников определим его меру, в соответствии с известным из элементарной геометрии понятием площади. Именно:
а)	мера пустого множества равна 0;
б)	мера непустого прямоугольника (замкнутого, открытого или полуоткрытого), определяемого числами а, Ь, с и d, равна
(b — a)(d — с).
Таким образом, каждому прямоугольнику Р из ® поставлено в соответствие число т(Р) — его мера; при этом выполнены следующие условия:
1) мера т{Р) принимает действительные неотрицательные значения;
п
2) мера т(Р) аддитивна, т. е. если Р— IJ Р^ и Рь — 0 при i ф k, то
т (Р) = Z т (Рд-4=1
Наша задача — распространить, с сохранением свойств 1) и 2), меру т(Р), определенную пока для прямоугольников, на более широкий класс множеств.
Сначала мы распространим меру на так называемые элементарные множества. Назовем плоское множество элементарным, если его можно представить хотя бы одним способом как объединение конечного числа попарно непересекающихся прямоугольников.
Для дальнейшего нам понадобится следующая теорема:
Теорема 1. Объединение, пересечение, разность и симметрическая разность двух элементарных множеств также являются элементарными множествами.
$ 1]	МЕРА ПЛОСКИХ МНОЖЕСТВ	253
Таким образом, по терминологии, введенной в § 5 гл. I, элементарные множества образуют кольцо.
Доказательство. Ясно, что пересечение двух прямоугольников есть снова прямоугольник. Поэтому, если
д = урА и B = UQ/
— два элементарных множества, то и их пересечение
AflB=U(^nQ/)
k, /
— элементарное множество.
Разность двух прямоугольников есть, как легко проверить элементарное множество. Следовательно, вычитая из прямоугольника некоторое элементарное множество, мы снова получим элементарное множество (как пересечение элементарных). Пусть теперь множества А и В — элементарные. Найдется, очевидно, прямоугольник Р, содержащий каждое из них. Тогда множество
AUB = P\[(P\А)П(Р\В)]
в силу сказанного выше будет элементарным. Отсюда и из равенств
А\В = АП(Р\В)
и
А А В = (A U В) \ (А П В)
следует, что разность и симметрическая разность элементарных множеств являются элементарными множествами. Теорема доказана.
Определим теперь меру т'(А) для элементарных множеств следующим образом: если
где Рь — попарно непересекающиеся прямоугольники, то
т' (А) = £ т (Рк). k
Покажем, что т'(А) не зависит от способа разложения А в сумму конечного числа прямоугольников. Пусть
A=[^Pk = ^Qh
где Ph и Q, — прямоугольники, и PiC\Pk=:0, Q,C\Qk~ 0 при i =/= k. Так как пересечение Q, двух прямоугольников есть
254
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
прямоугольник, то, в силу аддитивности меры для прямоугольников,
S т (Pk) =Xm(Pk0Q/)=Xm (Qz). *	ft, I	i
В частности, для прямоугольников мера т' совпадает с исходной мерой т.
Легко видеть, что определенная таким образом мера элементарных множеств неотрицательна и аддитивна.
Установим следующее важное свойство меры элементарных множеств.
Теорема 2, Если А — элементарное множество и {Лп} — конечная или счетная система элементарных множеств такая, что
»<= U л„,
п
ТО
т' (Л)< £ т' (Л„).	(1)
п,
Доказательство. Для любого е > 0 и данного А можно, очевидно, найти такое замкнутое элементарное множество А, которое содержится в Л и удовлетворяет условию
т' (Л) т' (Л) — е/2.
(Достаточно каждый из k составляющих А прямоугольников Pt заменить лежащим внутри него замкнутым прямоугольником с площадью большей, чем m(Pt)—е/(2Л).)
Далее, для каждого Ап можно найти открытое элементарное множество Ап, содержащее Ап и удовлетворяющее условию т'(Ап)^т'(Ап) + -^,
Ясно, что	_
А с= U Ап-п
Из {Лга} можно (по лемме Гейне — Бореля) выбрать конечную систему Х,, Лп5, покрывающую А. При этом, очевидно, 3
т' (Л) < S т' (Л,)
(так как иначе А оказалось бы покрытым конечным числом прямоугольников, суммарной площади меньшей, чем tn'{А), что не
МЕРА ПЛОСКИХ МНОЖЕСТВ
255
$ И
возможно). Поэтому
т' (А)< т' (Л) + у <	т' (АП1) + у < £ т' (Л„) + <
1=1	п
< S т' (Ап)+S + f=Z т' +е’
п	п	п
откуда в силу произвольности е > 0 вытекает (1).
Свойство меры т', устанавливаемое теоремой 2 (мера множества не превосходит суммы мер покрывающих его множеств, взятых в конечном или счетном числе), называется полуадди-тивностью. Из него вытекает свойство так называемой счетной аддитивности, или о-аддитивности, состоящее в следующем.
Пусть элементарное множество А представлено как сумма счетного числа непересекающихся элементарных множеств Ап (п = 1, 2, ...):
А= U Л;
П=1 тогда
т' (4 = Е >п' (4)
Я=1
(т. е. мера суммы счетного числа непересекающихся слагаемых равна сумме мер).
Действительно, в силу аддитивности при любом У имеем:
/ N	\	N
m' (А) > т' I (J А„ 1 = £ т' (А„).
\п=1	/ п=1
Переходя к пределу при У -> оо, получаем
т' (А)	(Ап).
В силу теоремы 2 имеет место и противоположное неравенство. Таким образом, а-аддитивность меры т' доказана.
Замечание. У читателя может сложиться впечатление, .что а-аддитивность меры на плоскости получается автоматически из её аддитивности, путем предельного перехода. На самом деле это не так (в доказательстве теоремы 2 мы, используя лемму Гейне — Бореля, существенно опирались на связь между метрическими и топологическими свойствами плоских множеств). В § 2 при изучении мер на произвольных абстрактных множествах мы увидим, что из аддитивности меры, вообще говоря, ее а-аддитивность не следует.
256
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
2. Лебегова мера плоских множеств. Элементарные множества не исчерпывают всех множеств, которые встречаются в геометрии и в классическом анализе. Поэтому естественно попытаться распространить понятие меры, с сохранением ее основных свойств, на класс множеств более широкий, чем конечные объединения прямоугольников со сторонами, параллельными осям координат.
Решение этой задачи, в известном смысле окончательное, было дано А. Лебегом в начале XX века.
При изложении теории меры Лебега нам придется рассматривать не только конечные, но и бесконечные объединения прямоугольников. Для того чтобы при этом сразу же не столкнуться с множествами «бесконечной меры», ограничимся сперва множествами, целиком принадлежащими квадрату Е = {0^х
1; 1}.
На совокупности всех таких множеств определим функцию ц*(Д) следующим образом.
Определение 1. Внешней мерой множества А называется число
Н*(А) = inf	(О
A<=UPft *
где нижняя грань берется по всевозможным покрытиям множества А конечными или счетными системами прямоугольников.
Замечания. Если бы мы в определении внешней меры рассматривали покрытия, состоящие не только из прямоугольников, но из любых элементарных множеств (взятых в конечном или счетном числе), то мы получили бы, очевидно, то же самое значение ц*(Д), поскольку всякое элементарное множество есть сумма конечного числа прямоугольников.
2. Если А — элементарное множество, то ц*(Д) = т'(А). Действительно, пусть Р], .,,, Рп — составляющие А прямоугольники. Тогда, по определению,
т' (А) -  Е т (Pi).
i=l
п
Так как прямоугольники Pt покрывают А, то цДА)^ 2 ш(Д) = = т'(А). Но если {QJ— произвольная конечная или счетная система прямоугольников, покрывающая А, то в силу теоремы 2 т'(Д)^ У, m(Qj), поэтому ц*(Д) = т'(А).
i
Теорема 3. Если
А cz U Ап,
§ 1]
МЕРА ПЛОСКИХ МНОЖЕСТВ
257
где Ап — конечная или счетная система множеств, то р* (АХ Ен* (4).	(2)
п
В частности, если A cz В, то р*(А)	р*(В).
Доказательство. По определению внешней меры, для каждого Ап найдется такая система прямоугольников’{Рпа}, конечная или счетная, что Aracz |J Pnk и k
У m (Pnk) < p* (An) +	,
k
где e > 0 выбрано произвольно. Тогда
Ac= U U Pnk п k
И
И* (АХ £ £ пг (Рпк)< £ р* (А„) -|- е. п k	п
Поскольку е > 0 произвольно, отсюда вытекает утверждение теоремы.
Так как на элементарных множествах пг' и р* совпадают, го теорема 2 представляет собой частный случай теоремы 3.
Определение 2. Множество А называется измеримым (в смысле Лебега), если для любого е > 0 найдется такое элементарное множество В, что
р* (А Д В) < е.	(3}
Функция р*, рассматриваемая только на измеримых множествах, называется лебеговой мерой. Будем обозначать ее через р.
Замечание. Введенное нами определение измеримости имеет достаточно наглядный смысл. Оно означает, что множество измеримо, если его можно «сколь угодно точно приблизить» элементарными множествами.
Итак, мы определили некоторый класс 2Ия множеств, называемых измеримыми, и функцию р, меру Лебега, на этом классе. Наша ближайшая цель — установить следующие факты:
1.	Совокупность ЯЯе измеримых множеств замкнута относительно операций взятия конечных или счетных сумм и пересечений (т. е. представляет собой а-алгебру, см. определение в п. 4 § 5 гл. I).
2.	Функция р cs-аддитивна на 2)?я.
Нижеследующие теоремы представляют собой этапы доказательства этих утверждений.
258
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
Теорема 4. Дополнение измеримого множества измеримо. Это сразу следует из равенства
(Е \ А) Д (Е \ В) = А Л В, которое проверяется непосредственно.
Теорема 5, Сумма и пересечение конечного числа измеримых множеств суть измеримые множества.
Доказательство. Достаточно, очевидно, провести доказательство для двух множеств. Пусть А, и А2 — измеримые множества. Это значит, что для любого е > 0 найдутся такие элементарные множества Bi и В2, что
ц* (А1 Д BJ < е/2, ц* (Д2 Д В2) < е/2.
Так как
(A! U А) Д (Bl U В2) с (А, Д BJ U (А2 Д В2), то
н* КА U а2) а (В[ и в2)] ц (А] д в,) + р, (А2 д в2)< е.
Но B]UB2 — элементарное множество, поэтому множество A! U А2 измеримо.
Измеримость пересечения двух измеримых множеств вытекает из теоремы 4 и соотношения
А1ПА2 = Е\[(Е\А1)и(Д\ А)]-	(4)
Следствие. Разность и симметрическая разность двух измеримых множеств измеримы.
Это вытекает из теорем 4 и 5 и равенств
Aj \ А = А П (Е \ А2), А, Д А2 = (Aj \ А2) U (А2 \ AJ.
Теорема 6. Если Aj, Ап — попарно непересекающиеся измеримые множества, то
/ п \ п
н( U a) = Sh(A).	(5)
\fe=l / fe=l
Для доказательства этой теоремы нам понадобится следующая лемма.
Лемма. Для любых двух множеств А и В
|ц*(А)-ц’ (В) Ц* ИД В).
Доказательство леммы. Так как
А с В U (А Д В), то в силу теоремы 3
' ц*(А)<ц’(В) + ц’(А ДВ).
§ 1]	МЕРА ПЛОСКИХ МНОЖЕСТВ	259
Отсюда вытекает утверждение леммы в случае	р*(В).
Если же р*(А)	р,*(В), то утверждение леммы вытекает из не-
равенства
р,* (В) С И* (А) 4-Н* (А Д В), устанавливаемого аналогично.
Доказательство теоремы 6. Как и в теореме 5, достаточно рассмотреть случай двух множеств. Выберем произвольное е > 0 и такие элементарные множества Bi и В2, что
HAjABjXb,	(б>
р*(А2ДВ2)<е.	(7)
Положим А=А1[]А2 и B = B[UB2. Множество А измеримо в силу теоремы 5. Так как множества Ai и А2 не пересекаются, то
B1DB2<=(Ai ДВЛ1)(А2Д В2)
и, следовательно, т'(В,ЛВ2Х2е.	(8>
В силу леммы из (6) и (7) вытекает, что
|т'(В1)-ц*(А,)|<е,	(9)
| т'(В2) — р,* (А2) | < е.	(10)
Так как на совокупности элементарных множеств мера аддитивна, то из (8)—(10) получаем
т' (В) = т' (BJ + т' (В2) — т' (В{ Л В2) > p* (АЛ + р* (А2) — 4е. Заметив еще, что А Д В <= (Aj Д ВЛ U (А2 Д В2) имеем, наконец, р.* (А) т' (В) — р* (А Д В) т' (В) — 2е р* (А,) 4- р* (А2) — бе. Так как е > 0 может быть выбрано произвольно малым, то
Р* (А) > р* (АЛ 4- р* (А2).
Поскольку противоположное неравенство
р*(А)<р*(АЛ4-Ц*(А2)
справедливо (в силу теоремы 3) всегда, окончательно получаем р‘(А) = р.* (АЛ 4-Р-* (А2);
так как Аь А2 и А измеримы, то здесь р* можно заменить на р.
Теорема доказана.
Из этой теоремы, в частности, следует, что для всякого измеримого А
р (В \ А) = 1 — р(А).
Теорема 7. Сумма и пересечение счетного числа измеримых, множеств суть измеримые множества.
260
МЕРА. ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
Доказательство. Пусть
Л], А2, ..., Ап, ...
оо
— счетная система измеримых множеств и A— J Ап. Положим П=1
п—1	оо
Л^ = Л„\ U Ак. Ясно, что А — IJ А'п, причем множества А'п п=1
попарно не пересекаются. В силу теоремы 5 и следствия из нее все множества А'п измеримы. В силу теоремы 6 и определения внешней меры при любом конечном п
п	/ п	\
£ и(ЛЬ) = J U лЯСм’И),
fe=l	\А=1 /
поэтому ряд
оо Z р-(Лп) п=1
сходится и, следовательно, для любого е > 0 найдется такое У, что
£н(4»)<-|-.	(11)
п> N
N
Так как множество С= U Л„ измеримо (как сумма конечного п=1
числа измеримых множеств), то для него найдется такое элементарное множество В, что
Н* (С А В) < е/2.	(12)
Поскольку
а а в с (с д в) и ( U л;), \п> N /
то из (11) и (12) вытекает
р,*(Л А В) < е,
т. е. А измеримо.
Так как дополнения измеримых множеств измеримы, то утверждение теоремы относительно пересечений вытекает из равенства
rM„ = £\U(£\4,). п	п
Теорема 7 усиливает теорему 5. Следующая теорема представляет собой аналогичное усиление теоремы 6.
$ I]	МЕРА ПЛОСКИХ МНОЖЕСТВ	261
Теорема 8. Если {4п) — последовательность попарно непересекающихся измеримых множеств и 4 = (J Ап, то
Я
н (А = Е и (АА
п
Доказательство. В силу теоремы 6 при любом N
(N \ N
U Aj = E и(А.)<Ш
Переходя к пределу при N -* оо, получаем
и (А > Ен (А)-	(13)
п=1
С другой стороны, согласно теореме 3
и (А < Е и (АА	(14)
П=1
Из (13) и (14) вытекает утверждение теоремы.
Установленное в теореме 8 свойство меры было названо ее счетной аддитивностью, или о-аддитивностью. Из а-аддитивно-сти вытекает следующее свойство меры, называемое непрерывностью.
Теорема 9. Если A i о А 2 о ... — последовательность вложенных друг в друга измеримых множеств и А = П Ап, то
Н(А = lim ц(АА
Доказательство. Достаточно рассмотреть случай А = = 0; общий случай сводится к этому заменой Ап на ДП\А Имеем
A = (A\A)U(A\A)U
(И
А» = (А \ Аж) U (Аж \ Аж) U • • •.
причем слагаемые не пересекаются. Поэтому, в силу а-аддитив-«ости ц
и (А) =Дн(А \ Аж)	(15)
и
н(А)=Е н(А\А+А	(16)
262
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
(ГЛ. V
так как ряд (15) сходится, то его остаток (16) стремится к О при п->оо. Таким образом;
р. (/!„);-> О при п->оо,
что и требовалось доказать.
Следствие. Если	... — возрастающая последо-
вательность измеримых множеств и
л = ил,
п
ТО
ц (Л) = lim И (Л„).
Для доказательства достаточно перейти от множеств Ап к их дополнениям и воспользоваться теоремой 9.
Отметим в заключение еще одно очевидное, но. важное обстоятельство. Всякое множество А, внешняя мера которого равна 0, измеримо. Достаточно положить В = 0; тогда
ц* (Л А В) — ц* (Л А 0) = ц* (Л) = 0 < е.
Итак, мы распространили меру с элементарных множеств на более широкий класс 9ЛЕ, замкнутый относительно операций взятия счетных сумм и пересечений, т. е. представляющий собой о-алгебру. Построенная мера о-аддитивна на этом классе. Установленные выше теоремы позволяют составить следующее представление о совокупности измеримых по Лебегу множеств.
Всякое открытое множество, принадлежащее Е, можно представить как объединение конечного или счетного числа открытых прямоугольников, т. е. измеримых множеств, и в силу теоремы 7 все открытые множества измеримы. Замкнутые множества суть дополнения открытых, следовательно, они тоже измеримы. Согласно теореме 7 измеримыми должны быть и все те множества, которые могут быть получены из открытых и замкнутых с помощью конечного или счетного числа операций взятия счетных сумм и пересечений. Можно показать, однако, что этими множествами все измеримые множества еще не исчерпываются.
3.	Некоторые дополнения и обобщения. Выше мы рассматривали только те множества, которые содержатся в единичном квадрате Е = {0 х, у 1}. Нетрудно освободиться от этого ограничения, например, следующим образом. Представив всю плоскость как сумму полуоткрытых квадратов Enm = {п <Z х ^«+1, m < у m + 1} (п, т — целые), мы будем говорить, что плоское множество А измеримо, если его пересечение Апт — АПЕпт с каждым из этих квадратов измеримо. При
§ 1]	МЕРА ПЛОСКИХ МНОЖЕСТВ	263
этом мы положим, по определению,
н И) = Е н Ипш). л, т
Ряд, стоящий справа, либо сходится к конечному значению, либо расходится к 4- оо. Поэтому мера ц может принимать и бесконечные значения. Все свойства меры и измеримых множеств, установленные выше, очевидным образом переносятся на этот случай '). Надо отметить лишь, что сумма счетного числа измеримых множеств конечной меры может иметь бесконечную меру. Класс измеримых множеств на всей плоскости обозначим ЭД.
Мы изложили в этом параграфе построение меры Лебега для плоских множеств.. Аналогично может быть построена лебегова мера на прямой, в трехмерном пространстве или, вообще, в евклидовом пространстве любой размерности п. В каждом из этих случаев мера строится по одному и тому же образцу: исходя из меры, определенной заранее для некоторой системы простейших множеств (прямоугольников в случае плоскости, интервалов '(а, Ь), отрезков [а, й] и полуинтервалов (а, Ь], [а, Ь) в случае прямой, и т. п.), мы определяем меру вначале для конечных объединений таких множеств, а потом распространяем ее на гораздо более широкий класс множеств — на множества, измеримые по Лебегу. Само определение измеримости дословно переносится на множества в пространстве любой размерности.
Вводя понятие меры Лебега, мы исходили из обычного определения площади. Аналогичное построение для одномерного случая опирается на понятие длины интервала (отрезка, полуинтервала). Здесь, однако, можно ввести понятие меры и иным, более общим способом.
Пусть F(t)—некоторая неубывающая, непрерывная слева функция на прямой. Положим
т(a, b) = F(й) — F(а 4- 0), т[а, b] = F(й 4~0) — F(а),
т(а, й] = F(й 4-0) — F(а 4-0), т[а, b) — F(b) — F(а).
Легко видеть, что так определенная функция интервала т неотрицательна и аддитивна. Применяя к ней рассуждения, аналогичные проведенным в настоящем параграфе, мы можем построить некоторую меру ц^(А). При этом совокупность ЭДр множеств, измеримых относительно данной меры, замкнута относительно операций взятия счетных сумм и пересечений, а мера цк будет а-аддитивна. Класс ЭДк множеств, измеримых относительно цк, будет, вообще говоря, зависеть от выбора функции F.
’) Однако в теореме 9 нужно добавить условие |i£j < + оо, чтобы сходился ряд (15). Приведите пример, показывающий, что без этого условия теорема может стать неверной.
264
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
Однако при любом выборе F открытые и замкнутые множества, а следовательно, и все их счетные суммы и пересечения заведомо будут измеримы. Меры, получаемые с помощью той или иной функции F, называются мерами Лебега — Стилтьеса. В частности, функции F(t)= t отвечает обычная мера Лебега на прямой.
Если мера цк такова, что она равна 0 для любого множества, обычная лебегова мера ц которого равна 0, то мера ц^ называется абсолютно непрерывной (относительно ц). Если мера це целиком сосредоточена на конечном или счетном множестве точек (это будет в том случае, когда множество значений функции F конечно или счетно), то она называется дискретной. Мера цк называется сингулярной, если она равна О для любого одноточечного множества, но имеется такое множество М лебеговой меры 0, что мера цк его дополнения равна 0.
Можно показать, что всякая мера цк представима как сумма абсолютно непрерывной, дискретной и сингулярной мер. К мерам Лебега — Стилтьеса мы еще вернемся в следующей главе.
Существование неизмеримых множеств. Мы видели, что класс измеримых по Лебегу множеств весьма широк. Естественно спросить, существуют ли вообще неизмеримые множества? Покажем, что этот вопрос решается положительно. Проще всего неизмеримые множества строятся на окружности, на которой введена линейная мера Лебега.
Пусть С — окружность, длина которой равна 1, и а — некоторое иррациональное число. Отнесем к одному классу те точки окружности С, которые могут быть переведены одна в другую поворотом окружности С на угол пал (п— целое). Каждый из этих классов будет, очевидно, состоять из счетного множества точек. Выберем из каждого такого класса по одной точке. Покажем, что полученное таким образом множество (обозначим его Фо) неизмеримо. Обозначим через Фп множество, получаемое из Фо поворотом на угол пал. Легко видеть, что все множества Фп попарно не пересекаются и в сумме составляют всю окружность С. Если бы множество Фо было измеримо, то были измеримы и конгруэнтные ему множества Фп- Так как
С = U Ф„.	(1 Фт = 0 при га ¥= пг,
Л= —оо
то в силу о-аддитивности меры отсюда следовало бы, что
1= £ Р(Ф„).	(П>
п=-»
Но конгруэнтные множества должны иметь одну и ту же меру, так что если Фо измеримо, то
И (Фп) = И (фо).
$21
ОБЩЕЕ ПОНЯТИЕ МЕРЫ
265
Отсюда видно, что равенство (17) невозможно, так как сумма ряда, стоящего в его правой части, равна 0, если ц(Фо) = О, и бесконечности, если ц(Фо)>О. Итак, множество Фо (а следовательно, и каждое Фп) неизмеримо.
§ 2.	Общее понятие меры. Продолжение меры с полукольца на кольцо. Аддитивность и о-аддитивность1)
1.	Определение меры. Мы строили меру плоских множеств, отправляясь от меры (площади) прямоугольника и распространяя ее на более широкий класс множеств. Для наших построений существенно было вовсе не конкретное выражение площади прямоугольника, а лишь ее общие свойства. Именно, при продолжении плоской меры с прямоугольников на элементарные множества мы пользовались лишь тем, что площадь — это неотрицательная аддитивная функция множества, и тем, что совокупность прямоугольников есть полукольцо. При построении лебегова продолжения плоской меры была, кроме того, важна ее сг-аддитивность.
В силу только что сказанного, конструкции, изложенной в § 1 применительно к плоским множествам, можно придать вполне -общую абстрактную форму. Тем самым ее применимость будет существенно расширена. Этому и посвящены ближайшие два параграфа.
Введем прежде всего следующее основное определение.
Определение 1. Функция множества ц(А) называется мерой, если:
1)	область определения функции ц(А) есть полукольцо множеств,
2)	значения функции ц(А) действительны и неотрицательны,
3)	ц(А) аддитивна, т. е. для любого конечного разложения
A = A!U ... 1М„
множества А е на (попарно непересекающиеся) множества А/, е выполнено равенство
И (А) = £ р (А*).
fe=l
Замечание. Из разложения 0 = 01)0 вытекает, что
Н0) = 2ц(0), т. е. ц(0)=о.
*) В этом параграфе и дальше мы будем систематически пользоваться понятиями и фактами, изложенными в § 5 гл. I.
266
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
2. Продолжение меры с полукольца на порожденное им кольцо. При построении меры плоских множеств: первым шагом было распространение меры с прямоугольников на элементарные множества, т. е. на конечные суммы попарно нбпересекаЮ-щихся прямоугольников. Сейчас мы рассмотрим абстрактный аналог этой конструкции. Сформулируем прежде всего следующее определение.
Опр еделение 2. Мера ц называется продолжением меры т, если с и для каждого А<^&т имеет место равенство
ц(Л) = т(Л).
Цель этого пункта состоит в доказательстве следующего предложения.
Теорема 1. Для каждой меры пг(А), заданной на некотором полукольце ®т, существует одно и только одно продолжение пг'(А), имеющее своей областью определения кольцо 9t(®m) (т. е. минимальное кольцо над <Sm).
Доказательство. Для каждого множества Ле9!(6т) существует разложение
А=[) Bk (Bk(=<5m, Bk(]Bt = 0 при k^t) (1) k=*\
(теорема 3 § 5 гл. I). Положим, по определению,
т' (Л) = £ m (В*)-	(2}
fc=i
Легко видеть, что величина т'(Л), определенная равенством (2), не зависит от выбора разложения (1). Действительно, рассмотрим два разложения
п	г
X=|jB/=UC/, й;е'5та, С(е ®та.
«=1	/=1
Так как все пересечения В, ПС; принадлежат ®т, то в силу аддитивности меры т
>=i	/=1 /=i	/=1
что и требовалось доказать.
Неотрицательность и аддитивность функции т'(А), определяемой равенством (2), очевидны. Итак, существование продолжения т' меры т на кольцо 91 (®т) доказано.
Для доказательства его единственности заметим, что, по оп-п
ределению продолжения, если А— || Bk, где В к — непересекаю-а=1
ОБЩЕЕ ПОНЯТИЕ МЕРЫ
267
§ 2]
щпеся множества из ®т, то для любого продолжения т меры т на кольцо Ш(©т)
т(Л)= X й (Вk) = £ m (Вк) = т' (Л), k	k
т. е. мера т совпадает с мерой т', определенной равенством (2). Теорема доказана.
По существу, мы повторили здесь, в абстрактных терминах, прием, которым мы в § 1 продолжили меру с прямоугольников на элементарные множества. Класс элементарных множеств как раз и представляет собой минимальное кольцо над полукольцом прямоугольников.
Из аддитивности и неотрицательности меры вытекают следующие почти очевидные, но важные свойства.
Теорема 2. Пусть т — мера, заданная на некотором кольце 9?т, и множества A, Ah ..., Ап принадлежат 9?т. Тогда
п
I. если U ,Ak cz А и Ai(]Ai=0 при i =^= j, то k—1
Е m (Ak) m (Л);
II. если U Ak о А, то fe=i
X т(Л)>т(Л);
fe=i
в частности, если Ас А' и А, А' с 91, то т(А) ^.т(А').
Действительно, если Ль ..., Ап попарно не пересекаются и содержатся в А, то в силу аддитивности меры
п	(	п	\
т(Л) = Е т (ДО + т ( А \ J A J.
А=1	X	к=1 /
Поскольку т \ (J д/)^>0, отсюда получаем свойство I.
Далее, для любых At, A2c9tm имеем
т (Л! U ДО = т (Л0 + т (Д2) — /п (Д П ДО < т (Д) + т (Д ).
По индукции отсюда получаем, что
( Ц л) < X т (Д).
\£=1	/ feel
268
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
(ГЛ. V
Наконец, опять-таки в силу аддитивности меры из ЛсН Ак
А=1 следует, что
т (Л) — т (Д /Q — т Qj( Ak \ д) < т (Д /Q ,
откуда в силу предыдущего неравенства и вытекает свойство IL Мы доказали свойства I и II для меры, заданной на кольце множеств. Но если мера первоначально была задана на полукольце, то при продолжении ее на кольцо меры множеств, принадлежащих исходному полукольцу, не меняются. Поэтому свойства I и II справедливы и для мер на полукольцах.
3. а-аддитивность. В различных вопросах анализа приходится рассматривать объединения не только конечного, но и счетного числа множеств. В связи с этим условие аддитивности, которое мы наложили на меры (определение 1), естественно заменить более сильным требованием о-аддитивности.
Определение 3. Мера т называется счетно-аддитивной, или с-аддитивной, если для любых множеств A, At, А2, ... ..., Ап, ..., принадлежащих ее области определения и. удовлетворяющих условиям
Д=11л, АПЛ/ = 0 при i=£j,
П=1
имеет место равенство со m (Л) = Z пг (Ап).
Плоская мера Лебега, построенная нами в § 1, а-аддитивна (теорема 8). Пример а-аддитивной меры совсем иной природы можно построить следующим образом. Пусть
Х =	х2, ...}
— произвольное счетное множество и числа рп > 0 таковы, что
оо
>2ipn=I’
Соответствующий класс измеримых множеств состоит из всех подмножеств множества X. Для каждого А с: X положим
m(A)= X рп-
хпеА
Легко проверить, что т(Д) будет о-аддитивной мерой, причем m(X)= 1. Этот пример естественно появляется в связи со многими вопросами теории вероятностей.
ОБЩЕЕ ПОНЯТИЕ МЕРЫ
269
$ 2)
Укажем пример меры аддитивной, но не о-аддитивной. Пусть X — множество всех рациональных точек отрезка [0, 1], а состоит из пересечений множества X с произвольными интервалами (а, Ь), отрезками [а, Ь] или полуинтервалами (а, Ь], [а, Ь) из [0, 1]. Легко видеть, что представляет собой полукольцо. Для каждого такого множества Ааъ е <эт положим
т(АаЬ) = Ь — а.
Эта мера аддитивна, однако она не о-аддитивна, так как т{Х) = 1, и в то же время X есть сумма счетного числа точек, каждая из которых имеет меру 0.
Меры, которые будут рассматриваться здесь и в следующем параграфе, мы будем предполагать а-аддитивными.
Теорема 3. Если мера т, определенная на некотором полукольце Sm, в-аддитивна, то и мера ц, получающаяся ее прсдол-окением на кольцо fR(Sm), в-аддитивна.
Доказательство. Пусть
4<=Я(®т), fi„e9l(Sm), л =1,2, ... и оо
А = U Вп, п=>1
причем Bs[\Br = <Z при s=f=r. Тогда существуют такие множества Aj и Bni из что
4= (J Вп=уВп;, п=1,2..............
причем множества в правых частях каждого из этих равенств попарно не пересекаются, а суммы по i и / конечны (теорема 3 § 5, гл. I).
Пусть Спц — Bni Р Aj. Легко видеть, что множества Спц попарно не пересекаются, и притом
ОО
4/=UUC„(/> Bni=UcnZ/.
п= I i	/
Поэтому в силу а-аддитивности меры ш на и» ем
"I И/) = X X m	(3)
Л=1 i
m(Bni)=X m{Cnt!),	(4)
/ о в силу определения меры ц на
Ц (4) = X tn {Aj),	(5)
/
н(Вп)= £ tn (Bni).	(6)
270
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
Из (3) — (6) вытекает, что ц.(А) =	„). (Суммы по i и по /
П —1 здесь конечны, ряды по п сходятся.)
Докажем теперь следующие основные свойства а-аддитивных мер, представляющие собой обобщения на счетные суммы свойств, сформулированных в теореме 2. Поскольку, как мы установили, а-аддитивность меры сохраняется при продолжении меры на кольцо, можно с самого начала считать, что мера задана на некотором кольце St.
Теорема 4. Пусть мера пг ^-аддитивна и множества А, А1( ..., Ап, ... принадлежат кольцу 91. Тогда оо
Iсг. Если (J Akcz. А и Л, Г!Л/ = 0 при i #= /, то й=1 оо
£ т(А*)<т(А);
Й=1
оо
Па (счетная полуаддитивность). Если J Ak о А, то fe=l оо
£ m(Ak)^m(A).
Доказательство. Если все Ak не пересекаются и содержатся в А, то, в силу свойства I (теорема 2), при любом п имеем
X т(А4)</и(А). а=1
Переходя здесь к пределу при га->оо, получаем первое утверждение теоремы.
Докажем второе утверждение. Поскольку 91 есть кольцо, множества
П—1
Ва = (А„ПА)\ U Ak k=i принадлежат 91. Так как со
А= U Вп, ВпаАп
и множества Вп попарно не пересекаются, то
оо	оо
m (А) = £ m (Вп) < £ m (А„). п=1	п—1
Замечание. Утверждение 1а доказанной только что теоремы не опирается, очевидно, на а-аддитивность рассматриваемой меры; оно остается справедливым и для любых аддитивных
§ 3]	ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ	271
мер. Наоборот, утверждение Па существенно использует о-ад-дитивность меры. Действительно, в приведенном выше примере аддитивной, но не о-аддитивной меры все пространство X, имеющее меру 1, покрывается счетной суммой одноточечных множеств, каждое из которых имеет меру 0. Более того, нетрудно убедиться, что свойство 11а на самом деле равносильно о-адди-тивности. Действительно, пусть ц— некоторая мера, определенная на полукольце ©. Пусть множества А, Ль Л2, ..., Ап, ... принадлежат ©, А = U Ak и все Ak попарно не пересекаются.
k
Тогда в силу свойства 1а (которым, как мы видели, обладает любая мера)
оо
Если же ц обладает и свойством Па, то (поскольку Ak в совокупности покрывают Л)
f ц(ЛД>ц(Л) Й=1
и, таким образом, оо
S Н (Лй) = р (Д).
Проверить счетную полуаддитивность меры (свойство Па) бывает часто проще, чем прямо установить ее а-аддитивность.
§ 3.	Лебегово продолжение меры
1.	Лебегово продолжение меры, определенной на полукольце с единицей. Если мера т, заданная на полукольце ©т, обладает лишь свойством аддитивности (но не о-аддитивности), то ее продолжением на 9?(®т) исчерпываются в значительной степени все возможности распространения такой меры с исходного полукольца на более широкий класс множеств. Если же рассматриваемая мера о-аддитивна, то она может быть распространена с ®т на класс множеств значительно более обширный, чем кольцо 9i(®m), и в некотором смысле максимальный. Это можно сделать с помощью так называемого лебегова продолжения. Сначала мы рассмотрим лебегово продолжение меры, заданной на полукольце с единицей. Общий случай будет рассмотрен в следующем пункте.
Пусть на некотором полукольце множеств <5т с единицей Е задана о-аддитивная мера т. Определим на системе 21 всех подмножеств множества Е функцию ц*(Д)—внешнюю меру следующим образом.
272
МЕРА. ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ
(ГЛ. V
Определение 1. Внешней мерой множества А<=Е называется число
ц*(Л)= inf £ т(Вп),	(1)
Л
где нижняя грань берется по всем покрытиям множества А конечными или счетными системами множеств Вп е ®т.
Следующее свойство внешней меры играет основную роль во всем дальнейшем построении.
Теорема 1 (счетная полуаддитивность). Если
А <= U А, п
где {Лп} — конечная или счетная система множеств, то
н*(А<Ен*(А). п
Доказательство этого утверждения совпадает с доказательством теоремы 3 § 1 и мы не будем его повторять.
Определение 2. Множество А называется измеримым (по Лебегу), если, каково бы ни было е > 0, найдется такое Be е 9t(®m), что
ц‘(Д Д В) < в.
Функция ц*, рассматриваемая только на измеримых множествах, называется лебеговой мерой (или просто мерой) и обозначается ц. Ясно, что все множества из ®т и из 91 (®т) измеримы. При этом, если А е ®т, то
ц(Д) = т(Д).
Это равенство доказывается точно так же, как и его аналог для множеств на плоскости.
Из равенства
Д Д А2 = (Е \ Д) Д (£ \ А2)
следует, что если А измеримо, то его дополнение тоже измеримо.
Установим теперь основные свойства измеримых множеств и определенной на них лебеговой меры.
Теорема 2. Система 9ft всех измеримых множеств есть кольцо.
Доказательство. Так как всегда
А П А2 — А[ \ (Д \ Д) и
ДиД = £\[(£\Д)П(£\А)1,
то достаточно показать следующее. Если Де ЭИ, Де ЭИ, то и Д = Д \ Д е ЭИ.
S3]
ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ
273
Пусть At и А2 измеримы; тогда существуют B^StfSn,) и В2^(Я(&т) такие, что
ц* (4] Д Bi) < е/2 и ц* (42 А В2) < е/2.
Полагая В = В1 \ В2 е 9t(Sm) и пользуясь соотношением
(4] \ 42) Д (Bj \ В2) cz (4[ Д Bi) U (42 Д В2), получаем
ц* (4 Д В) < е.
В силу произвольности е > О отсюда вытекает измеримость множества 4.
Замечание. Очевидно, что Е есть единица кольца ЭЯ, которое, таким образом, является алгеброй множеств.
Теорема 3. На системе ЭЯ измеримых множеств функция ц(4) аддитивна.
Доказательство этой теоремы представляет собой дословное повторение доказательства теоремы 6 § 1.
Теорема 4. На системе ЭЯ измеримых множеств функция р(4) о-аддитивна.
Доказательство. Пусть
4=0 4„, 4, 4Ь 42, ... е ЭЯ, 4,- П 4, = 0 при / =/= /.
П=1
В силу теоремы 1
И (4) <2 И(4„),	(2)
п
а в силу теоремы 3 при любом N
(N	\	N
U Ап 1= S н(4„), 71= 1 /	П— 1
откуда
И (4) > S И (4„).	(3)
п
Из (2) и (3) следует утверждение теоремы.
В § 1, рассматривая плоскую меру Лебега, мы показали, что не только конечные, но и счетные суммы и пересечения измеримых множеств также измеримы. Это верно и в общем случае, т. е. справедлива следующая теорема:
Теорема 5. Система ЭЯ измеримых по Лебегу множеств является о-алгеброй с единицей Е.
Доказательство. Так как
П 4„ = B\U (£\4„) п	п
274
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
и так как дополнение измеримого множества измеримо, то достаточно показать следующее. Если А2, ..., Ап, ... принадлежат ЗЯ, то А = (J Ап также принадлежит ЗЯ. Доказательство п
этого утверждения, проведенное в теореме 7 § 1 для плоских множеств, дословно сохраняется и в общем случае.
Так же как и в случае плоской меры Лебега, из о-аддитив-ности меры следует ее непрерывность, т. е. если ц — о-аддитив-ная мера, определенная на о-алгебре, Д[ щ> А2 щ> ... щ> Ап щ> ... —• убывающая цепочка измеримых множеств и
а= Ал, п
ТО
ц(Д)= lim ц(Д„), П->оо
а если Д1 сг А2 сг ... с Ап с ... — возрастающая цепочка измеримых множеств и
A=U Ап, п
ТО
цЛ — lim ц (Д„).
Л->оо
Доказательство, проведенное в § 1 для плоской меры (теорема 9), дословно переносится на общий случай.
Итак, мы установили, что система ЗЯ представляет собой о-алгебру, а определенная на ней функция ц(Д) обладает всеми свойствами о-аддитивной меры. Тем самым оправдано следующее определение.
Определение 3. Лебеговым продолжением ix = L(tn) меры m называется функция ц(Д), определенная на системе измеримых множеств ЗЯ и совпадающая на ЗЯ с внешней мерой ц*(Д).
2.	Продолжение меры, заданной на полукольце без единицы. Если полукольцо ®т, на котором определена исходная мера tn, не имеет единицы, то построение лебегова продолжения, изложенное в предыдущем пункте, претерпевает некоторые, впрочем, незначительные, изменения. Определение 1 внешней меры сохраняется, но внешняя мера ц* оказывается определенной только на системе таких множеств А, для каждого из которых существует покрытие U Вп множествами из ®т с конечной п
суммой ^пг(Вп). Определение измеримости сохраняется без п
всяких изменений.
Теоремы 2—4 и заключительное определение 3 сохраняют силу. Предположение о существовании единицы использовалось
ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ
275
§ 3]
лишь в доказательстве теоремы 2. Чтобы дать доказательство теоремы 2 в общем случае, надо установить независимо, что из вытекает U А2 е ЯП. Но это следует из включения
(4, и л2) Д (В1 и В2) с (Д, Д В,) и (А2 Д В2).
В случае, когда не имеет единицы, теорема 5 заменяется следующей теоремой:
Теорема 6. При любой исходной мере т система множеств ЯП, измеримых по Лебегу, является 6-кольцом; измери-оо
мость множества А= J Ап при измеримых Ап имеет место
П=1
z \
в том и только том случае, если меры ц (J АпJ ограничены некоторой константой, не зависящей от N.
Доказательство этого утверждения предоставляется читателю.
Замечание. Поскольку сейчас речь идет о мерах, принимающих лишь конечные значения, необходимость последнего условия очевидна.
Из теоремы 6 вытекает следующий факт.
Следствие. Система ЯП а всех множеств В^ЗЯ, являющихся подмножествами фиксированного множества А е ЯП, образует а-алгебру.
Например, система всех измеримых по Лебегу (в смысле обычной лебеговой меры на прямой) подмножеств любого отрезка [а, Ь] есть о-алгебра множеств.
В заключение отметим еще одно свойство лебеговых мер.
Определение 4. Мера ц называется полной, если из р(Л) — 0 и А' с А вытекает, что А' измеримо.
Очевидно, что при этом ц(Д')=0. Без труда доказывается, что лебегово продолжение любой меры полно. Это вытекает из того, что при А' а: А и ц(Д) — 0 неизбежно ц*(Д')=0, а любое множество С, для которого ц*(С) = 0, измеримо, так как 0 е Я (<5т) и
ц* (С Д 0) — (С) = 0.
Всякую а-аддитивную меру на а-алгебре можно продолжить до полной, положив ее равной нулю для любого подмножества каждого множества нулевой меры.
Дополнительные замечания. I. Предположение о том, что исходная мера m задана на полукольце (а не на некоторой произвольной системе множеств), существенно для однозначности ее продолжения. Рассмотрим в единичном квадрате систему вертикальных и горизонтальных прямоугольников, т. е. таких прямоугольников, у которых или длина или ширина равна 1 (рис. 18), и припишем каждому такому прямоугольнику меру, равную его площади. На порожденную этими прямоугольниками алгебру (а тем
276
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
более а-алгебру) такая мера может быть продолжена неоднозначно (укажите хотя бы два различных продолжения).
2. Укажем на связь между процессом продолжения меры по Лебегу и процессом пополнения метрического пространства. Заметим для этого, что т'(АДВ) можно принять за расстояние между элементами А и В кольца й(@т). Тогда й(@щ) становится метрическим (вообще говоря, неполным)
пространством и его пополнение состоит как раз из всех измеримых множеств (при этом, однако, с метрической точки зрения множества А и В не-
различимы, если ц(Л Д В) — 0).
Упражнения. 1. Пусть мера т задана на полукольце (с единицей)
&т множеств из X жество А измеримо ладает следующим
Рис. 18.
и ц* — отвечающая ей верхняя мера. Доказать, что мно-(по Лебегу) в том и только том случае, если оно об-свойством, называемым измеримостью по Каратеодори:
для любого подмножества Z с X имеет место равенство
ц-(/) = 11*(2ПЛ) + и* (г\Л).
2. Пусть а-аддитивная мера пг задана на кольце 8? с единицей X и m(X) = 1. Введем для каждого А с X наряду с внешней мерой р* внутреннюю меру ц», положив
ц.(Л) = 1-ц* (Х\Л).
В случае, когда
j. Легко видеть, что всегда ц. (Л)	ц*(Л). Дока-
х зать, что
р.(Л)==р*(Л)	(»)
в том и только том случае, если множество А измеримо (в смысле определения 2).
мера задана на кольце с единицей, равенство (*) часто
принимается за определение измеримости множества.
3.	Расширение понятия измеримости в случае о-конечной меры. Если исходная мера пг задана в пространстве X на некотором полукольце без единицы, то введенное выше определение измеримости множества оказывается слишком узким. Например, если X— это плоскость, то такие множества, как вся плоскость, полоса, внешность круга и т. п„ имеющие бесконечную площадь, при таком определении не попадают в число измеримых. Естественно расширить понятие измеримости, допуская для меры и бесконечные значения, с тем, чтобы совокупность измеримых множеств была, как и в случае, когда исходная мера задана на полукольце с единицей, а-алгеброй (а не только 6-кольцом).
Мы ограничимся при этом практически наиболее важным случаем так называемой a-конечной меры, хотя соответствующее построение можно провести и в общем случае.
Пусть а-аддитивная мера m задана на некотором полукольце подмножеств множества X. Мы скажем, что эта мера ^-конечна, если все X может быть представлено как сумма счетного числа множеств из ®т (но не как сумма конечного числа множеств из ®т). Примером a-конечной меры может служить площадь, определенная на всех прямоугольниках на пло
5 3]	ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ	ЧТТ
скости. Простой пример не о-конечной меры можно получить следующим образом. Пусть на отрезке [0, 1] задана некоторая функция f(x). Для каждого конечного подмножества А = = Ui, ..., хп) отрезка положим ц (4) — У, f (хг). Если множество точек х, в которых /(%)#= О, несчетно, то такая мера на [О, 1] не будет о-конечной.
Итак, пусть т есть о-аддитивная и о-конечная мера в X,
СО
определенная на полукольце S>m. Пусть X — IJ В,-, Bt е Sm. i=l
Перейдя от полукольца к порожденному им кольцу 91 (®т) fc-i
и заменяя Вй на Bk \ Н В{, можно считать, что X представлено /=1
как сумма счетного числа попарно непересекающихся измеримых множеств, которые мы по-прежнему обозначим В>, В2, ... Применив к т описанную в предыдущем пункте процедуру лебегова продолжения, мы получим меру ц, определенную на б-кольце ЯП. Пусть Be® и ЯНВ — система всех множеств из ЯП, содержащихся в В:
3RB — {C: Се ЭИ, ВсС}.
Тогда ЯИв есть о-алгебра с единицей В (см. следствие из теоремы 6).
Рассмотрим теперь совокупность ЭД множеств А, имеющих измеримое пересечение с каждым В{:
АПВ^ЗЯв..
Иначе говоря, Ле ЭД означает, что А представимо в виде
оо
Д=ЦЛ£, где Д£еЯИВ(.	(4>
Система ЭД представляет собой о-алгебру (проверьте!), которую мы назовем прямой суммой о-алгебр ЯИВ.. Множества (4), составляющие о-алгебру ЭД, мы назовем измеримыми и определим, меру ц каждого такого А следующим образом: если
оо
Л=Цд£, Д£еЯИВ/,
то
Й И) = 2 и (4г).
г=|
Поскольку мера всякого множества неотрицательна, стоящий здесь справа ряд сходится к некоторому неотрицательному значению или к -роо.
278
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
Теорема 7. В сделанных выше предположениях справед-ливы следующие утверждения-.
1)	c-алгебра 91 и мера р не зависят от выбора системы непересекающихся множеств В[ из ЗЯ, удовлетворяющих условию оо и Bt = x-, 2 = 1
2)	мера Д о-аддитивна на 91;
3)	совокупность множеств А е 91, для которых у, (Л) < оо, совпадает с б-кольцом ЗЯ и на этом б-кольце у = у.
Доказательство. 1) Заметим прежде всего, что А е91 в том и только том случае, если А П С <= ЗЯ для любого С е ЗЯ. Достаточность этого условия ясна, поскольку оно означает, в частности, что А П Bt е ЗЯ (I = 1, 2, ...); проверим его необходимость. Пусть А е 91 и С е Эй. Положим Сг = С П Bz; тогда дпс=0ипс,).
1=1
Так как при всяком W
ц ( Д И П С,)) < Н (U Cz) < у (С),
то в силу теоремы 6 множество Л ПС измеримо.
Пусть {Bz} и {В/} — две системы непересекающихся множеств из ЗЯ, такие, что UBZ = U В) — X. Если Ле 91, то, поскольку мера у каждого множества из ЗЯ неотрицательна, выполнены равенства
. X Н (Л П В,) = £ н (Л n Bt П В,) = £ У (Л П В)),
I	i. I	i
т. e. определяя у (Л) по системе {Bz} или {В/}, мы получим один и тот же результат.
2) Пусть Л(1), Л(2), ... (= 91, Л,й) П Л(/) = 0, k^=l и Л = (J Л(А).
* Тогда в силу а-аддитивности меры у на ЗЯ: Д(Л)=Хи(ЛПВ;)= f и(д(*>пв,) =
I, £=1
= f (2н(л(й)пв(.)) = £ й(^), а=1 \;=1	/	л=1
т. е. у а-аддитивна.
Наконец, 3) непосредственно следует из теоремы 6.
Замечание. Описанное выше расширение понятия измеримости (с допущением для меры бесконечных значений) возможно и без предположения л-конечностн исходной меры, например, по следующей схеме.
ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ
27»
'§ 3]
Пусть % — некоторое пространство и ЭЛ — какое-то 6-кольцо его подмножеств. Множество A cz X называется измеримым относительно ЭЛ, если’ ЛГ|В<еЭЛ для любого В е ЭЛ. Нетрудно проверить, что система 21 измеримых относительно ЭЛ множеств есть о-алгебра с единицей X, причем, если само ЭЛ есть о-алгебра с той же единицей X, то 21 = ЭЛ.
Пусть теперь в X задана некоторая j-аддитивная мера р, которую мы в силу п. 2 можем считать уже продолженной на некоторое 6-кольцо ЭЛ в> пусть 21 — совокупность измеримых относительно ЭЛ множеств из X. Множество А е 21 называется нуль-множеством, если р(ЛПб)—О Для любого В е ЭЛ. Теперь на 21 определяется мера р (принимающая, вообще говоря, и. бесконечные значения) следующим образом: если для данного А е 21 существует такое В е ЭЛ, что Л АВ есть нуль-множество, то полагаем
й(Л) = р(В).
Для всех остальных А е 21 полагаем
р (Л) = оо.
Нетрудно проверить, что мера р о-аддитивна и на 6-кольце ЭЛ cz 21 совпадает с р.
4. Продолжение меры по Жордану. Рассматривая в § 2 этой главы меры, удовлетворяющие лишь условию аддитивности, мы показали, что каждая такая мера m может быть продолжена с полукольца на минимальное кольцо Л(@т), порожденное этим полукольцом. Однако возможно и распространение меры на некоторое кольцо, более обширное, чем Л(@т). Соответствующее построение называется продолжением меры по Жордану '). Идея этого построения, применявшегося в ряде частных случаев еще математиками Древней Греции, состоит в приближении «измеряемого» множества Л множествами Л' И Л", которым мера уже приписана, изнутри и снаружи, т. е. так, что
Л'с Лс А".
Пусть m — мера, заданная на некотором кольце Л.
Определение 5. Будем называть множество Л измеримым по Жордану, если при любом е > 0 в кольце Л имеются множества А' и Л", удовлетворяющие условиям
А' <= A czА", т(Л"\Л')<е.
Справедливо следующее утверждение.
Теорема 8. Система Л* измеримых по Жордану множеств является: кольцом.
Пусть Я—система таких множеств Л, для которых существует множество В zz) А из Л. Для любого Л из Л положим, по определению,
р, (Л) = inf m (В),
В=>А
ji (Л) = sup m (В).
~ Вс А
Функция р(Л) и pi (Л) называются соответственно «внешней» и «внутренней» жордановой мерой множества Л.
Очевидно, что всегда
ц(Л)<Д(Л).
Теорема 9. Кольцо Л* совпадает с системой тех множеств А е для которых р_(Л) = р (Л).
Для множеств из 21 имеют место следующие теоремы:
’) Камилл Жордан, французский математик (1838—1922),
280
МЕРА. ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ
(ГЛ. V
п	и
Теорема 10. Если А <= Н Ак, то Д (Л) V Д (Л*). л=|	jfi
Теорема 11. Если А к a: A (k = 1, 2...п) и А/ П А/ = 0, то
НМ) > £ нМ).
л=1
Определим теперь функцию ц на области
©ц = й’
как общее значение внешней и внутренней меры:
р(Л) = ц(Л) = Д(Л).
Из теорем 10 и 11 и из того очевидного обстоятельства, что для Лей
Д(Л) = р(Л) = т(Л)
вытекает следующее утверждение:
Теорема 12. Функция р(Л) является мерой и продолжением меры tn.
Изложенное построение применимо к любой мере ш, определенной на кольце. В частности, его можно применить к множествам на плоскости. При этом за исходное кольцо принимается, совокупность элементарных множеств (т. е. конечных сумм прямоугольников). Кольцо элементарных множеств зависит, очевидно, от выбора системы координат на плоскости (берутся прямоугольники со сторонами, параллельными осям координат). При переходе к плоской мере Жордана эта зависимость ог выбора системы координат ис-чезает: отправляясь от любой системы координат {xh х2), связанной с первоначальной системой {Х|, х2} ортогональным преобразованием
Xi = cos а • Xi + sin а  х2 + П|,
х2 — — sin а • Х| + cos а • х2 + а2,
мы получим одну и ту же меру Жордана. Этот факт вытекает из следующей общей теоремы.
Теорема 13. Для того чтобы жордановы продолжения щ = /(mi) и ц2 = j(m2) мер mi “ m2, определенных на кольцах й( и й2 совпадали, необходимо и достаточно выполнения условий:
mi (Л)==И2<Л) на
й2с:®Ц(, т2(Л) = Р! (Л) на й2.
Если исходная мера m определена не на кольце, а на полукольце го «е жордановым продолжением естественно назвать меру
i(m)= j(r (m)), получающуюся в результате продолжения m на кольцо й(®т) и дальнейшего продолжения по Жордану.
5. Однозначность продолжения меры. Если множество Л измеримо по Жордану относительно меры ц, т. е. принадлежит й* = й*(©т), то для любой меры Д, продолжающей m и определенной на й*. значение Д(Л) совпадает со значением /(Л) жорданова продолжения J = j(m). Можно показать, что продолжение меры m за пределы системы £Н* множеств, измеримых по Жордану, не будет однозначно. Более точно это значит следующее. Назовем множество А множеством однозначности для меры т, если:
1) существует мера, являющаяся продолжением меры т, определенная для множества А;
5 3]
ЛЕБЕГОВО ПРОДОЛЖЕНИЕ МЕРЫ
28 Г
2) для любых двух такого рода мер pi и р2
Pi (А) = р2 (Л).
Имеет место теорема: система множеств однозначности для меры m совпадает с системой множеств, измеримых по Жордану относительно меры т_ г. е. с кольцом 91*.
Однако если рассматривать только о-аддитивные меры и их продолжения (о-аддитивные), то система множеств однозначности будет, вообще говоря,, обширнее.
Так как именно случай о-аддитивных мер наиболее важен, то введем» следующее определение.
Определение 6. Множество А называется множеством а-однознач-ности для о-аддитивной меры т, если:
1) существует о-аддитивное продолжение Л меры т, определенное для А (т. е. такое, что А е= @х);
2) для всяких двух таких о-аддитивных продолжений Ai и А2 справедливо равенство
Л, (Л) = А2 (Л).
Если Л есть множество о-однозначности для о-аддитивной меры р, то в силу нашего определения существует единственно возможное значение А(Л) для любого о-аддитивного продолжения меры р, определенного на Л.
Легко видеть, что каждое множество Л, измеримое по Жордану, измеримо и по Лебегу (но не наоборот! приведите пример), причем его жорда-нова и лебегова меры одинаковы. Отсюда непосредственно вытекает, что жорданово продолжение о-аддитивнон меры о-аддитивно.
Каждое множество Л, измеримое по Лебегу, является множеством о-од-нозначности для исходной меры т. Действительно, при любом е > 0 для Л существует такое В е SR, что р* (ЛАВ) < е. Каково бы ни было определенное для Л продолжение А меры т,
А(В) = ш'(В),
так как продолжение т' меры т на 3t = 3t (©ш) однозначно. Далее,
А(ЛДВ)<р'(ЛДВ)<е и, следовательно, |А(Л)-т'(В)| <е.
Таким образом, для любых двух о-аддитивных продолжений Aj и А2 меры nt имеем
|А,(Л)-А2(Л)| < 2е,
откуда в силу произвольности е > О
А,(Л) = А2(Л).
Можно показать, что система множеств, измеримых по Лебегу, исчерпывает всю систему множеств о-однозначностн для исходной меры т.
Пусть т — некоторая а-аддитивная мера с областью определения © и Яй = £(©) —область определения ее лебегова продолжения. Легко убедиться в том, что, каково бы ни было полукольцо ®ь удовлетворяющее условию
всегда
© с: ©j с 2Л, £(©,) = £(©).
•282
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ, V-
§ 4. Измеримые функции
1. Определение и основные свойства измеримых функций. Пусть X и У— два произвольных множества и пусть в них выделены две системы подмножеств ©х и ©у соответственно. Абстрактная функция y = f(x) с областью определения X, принимающая значения на У, называется (®х, ©у) -измеримой, если из А сп ©у вытекает, что (А) е бх.
Например, если и за X и за У взять числовую прямую (т. е. рассматривать действительные функции действительного переменного), а за ®х и ®у взять систему всех открытых (или всех замкнутых) подмножеств из R1, то сформулированное определение измеримости сведется к определению непрерывности.. Взяв за ©х и ©у систему всех борелевских множеств, мы придем к так называемым В-измеримым (или измеримым по Во-релю) функциям.
В дальнейшем мы будем интересоваться понятием измеримости главным образом с точки зрения теории интегрирования. В этом плане основное значение имеет понятие измеримости числовых функций, определенных на некотором множестве X, с заданной на нем о-аддитивной мерой ц. При этом за ®х принимается совокупность всех измеримых относительно ц множеств из X, а за ®у — совокупность всех S-множеств на прямой. Поскольку всякая о-аддитивная мера может быть продолжена на некоторую о-алгебру, естественно с самого начала считать, что есть о-алгебра. Таким образом, для числовых функций мы приходим к следующему определению измеримости:
Определение 1. Пусть X — множество, в котором задана о-аддитивная мера ц, определенная на о-алгебре Действительная функция f(x) на X называется ^-измеримой, если для всякого борелевского множества А числовой прямой
Г1И)е®и-
Аналогично, комплексная функция <р(х), определенная на X, называется ^-измеримой, если <р-1(А)е®и для всякого борелевского подмножества комплексной плоскости. Легко проверить, что это равносильно ц-измеримости действительной и мнимой частей этой функции по отдельности.
Числовая функция, заданная на.прямой, называется борелев-ской (или В-измеримой), если прообраз каждого борелевского множества есть борелевское множество.
Теорема 1. Пусть X, У и Z — произвольные множества с выделенными в них системами подмножеств ®х, Sy и соот~ ветственно и пусть определенная на X функция
ИЗМЕРИМЫЕ ФУНКЦИИ
283
»4]
(<5х, ®у) -измерима, а определенная на У функция z — g(y) (®у, ®z) -измерима. Тогда функция
z = <p(x) = g(f (х))
(®х, <52)-измерйма.
Коротко: измеримая функция от измеримой функции есть измеримая функция.
Доказательство. Если А е Sz> то в силу (Sy, ^-измеримости функции g имеем; (Л) = Ве2г. В свою очередь в силу (®х, ©^-измеримости функции f множество f~l (В) принадлежит <S>X, т. е. /-1 (g-1 (Л)) = ф-1 (Л) ен <SX, т. е. функция ср (<SX, ©2)‘измеРима-
Следствие. Борелевская функция от ц-измеримой числовой функции ц-измерима. В частности, непрерывная функция от ц-измеримой ц-измерима.
В дальнейшем, в случаях, когда это не может вызвать недоразумения, мы вместо «ц-измеримости» будем писать просто «измеримость».
Теорема 2. Для того чтобы действительная функция f(x) была измерима, необходимо и достаточно, чтобы при любом действительном с множество {х:[(х) <С с} было измеримо.
Доказательство. Необходимость условия ясна, так как полупрямая (—оо, с) есть борелевское множество. Для доказательства достаточности заметим прежде всего, что о-алгебра, порожденная системой 2 всех полупрямых (—оо, с) совпадает с о-алгеброй всех борелевских множеств на прямой. Но, согласно п. 5 § 5 гл. I отсюда следует, что прообраз каждого бо-релевского множества принадлежит о-алгебре, порожденной прообразами полупрямых, принадлежащих 2, т. е. измерим.
Доказанное условие часто принимают за определение измеримости, т. е. называют функцию f(x) измеримой, если все множества {х : f(x) с с} измеримы.
2. Действия над измеримыми функциями. Покажем, что совокупность измеримых функций, заданных на некотором множестве, замкнута относительно арифметических операций.
Теорема 3. Сумма, разность и произведение двух измеримых функций измеримы. Частное двух измеримых функций, при условии, что знаменатель не обращается в нуль, тоже измеримо.
Доказательство этой теоремы проведем в несколько шагов.
1)	Если f измерима, то, очевидно, измеримы и функции kf и а + f при любых постоянных k и а.
2)	Далее, если f и g — измеримые функции, то множество
{х: / (х) > g (х)}
"284
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ
(ГЛ. V
измеримо. Действительно,
ОО
{х: f (х) > g (х)} = U ({х: f (х) > г*} f| {х: g (х) < г*}),
тде сумма берется по всем рациональным числам гк, занумерованным в любом порядке. Отсюда получаем, что
{х: f (х) > а — g(x)} = {х: f (х) + g(x) > а} измеримо, т. е. сумма измеримых функций измерима.
3)	Из 1) и 2) следует измеримость разности f — g.
4)	Произведение измеримых функций измеримо. Действительно, воспользуемся тождеством
fe=TKf + s)2-(f-s)2l‘
Стоящее справа выражение есть измеримая функция. Это вытекает из 1)—3) и следствия из теоремы 1, в силу которого квадрат измеримой функции измерим.
5)	Если f(x) измерима и /(х)=й=О, то и 1//(х) измерима. Действительно, если с > 0, то
{х: 1// (х) < с) = {х: f (х) > 1 /с} (J {х: f (х) < 0}, если с < 0, то
{х: 1//(х) < с) = {х: 0 > f (х) > 1/с), а если с = 0, то
{х: 1//(х) < с} = {х: f(x) < с}.
Каждый раз справа мы получаем измеримое множество. Из 4) и 5) следует измеримость частного (при условии g(x)=/> ¥= 0).
Итак, мы показали, что арифметические действия над измеримыми функциями снова приводят к измеримым функциям.
Покажем теперь, что совокупность измеримых функций замкнута по отношению не только к арифметическим операциям, но и к операции предельного перехода.
Теорема 4. Предел сходящейся при каждом х е X последовательности измеримых функций измерим.
Доказательство. Пусть /п(х)->/(х); тогда
{х: f(x)<C) = UU А {х: fm(x)<c-\/k}.	(1)
k п m>n
Действительно, если f(x)<c, то существует такое ч k, что /(х)< с — 2/k; далее, при этом k можно найти столь большое п.
•5 41
ИЗМЕРИМЫЕ ФУНКЦИИ
285
что при т п выполнено неравенство fm(x)<C— 1/fe,
а это и означает, что х войдет в правую часть (1).
Обратно, если х принадлежит правой части равенства (1), то существует такое k, что при всех достаточно больших, т
fm(x)<C— \/k,
но тогда f(x)<Z. с, т. е. х входит в левую часть равенства (1).
Если функции fn(x) измеримы, то множества
{*: L(x) <с — 1/fe)
измеримы. Так как совокупность измеримых множеств есть <т-алгебра, то в силу (1) множества
{Х-. f (х) < с}
тоже измеримы, что и доказывает измеримость f(x).
Замечание. Как видно из сказанного, понятие измеримости функции не связано с наличием в рассматриваемых пространствах какой-либо меры. Должны лишь быть выделены системы множеств, называемых измеримыми. Однако фактически понятие измеримости используется, как правило, для функций, определенных на некотором пространстве X с фиксированной мерой, заданной на какой-либо о-алгебре его подмножеств. Именно эта ситуация и будет рассматриваться в дальнейшем.
Как уже было отмечено, о-аддитивную меру, определенную на о-алгебре ® подмножеств некоторого множества X, можно без ограничения общности считать полной, т. е. считать, что если А— измеримое множество меры нуль, то всякое его подмножество А' измеримо (и, конечно, ц(Д')—0). Это условие полноты меры мы всюду в дальнейшем будем предполагать выполненным.
3.	Эквивалентность. При изучении измеримых функций часто можно пренебречь их значениями на множестве меры нуль. В связи с этим возникает следующее определение.
Определение 2. Две функции, f и g, заданные на одном и том же измеримом множестве Е, называются эквивалентными (обозначение: f ~ g), если
Н{х: f(x)^g(x)}=0.
Введем еще следующую терминологию. Говорят, что некоторое свойство выполнено почти всюду на Е, если оно выполнено на Е всюду, кроме, быть может, точек, образующих множество керы нуль. Таким образом, две функции называются эквивалентными, если они совпадают почти всюду.
286
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
Теорема 5. Функция f(x), определенная на некотором измеримом множестве Е и эквивалентная на нем некоторой измеримой функции g(x), тоже измерима.
Доказательство. Из определения эквивалентности следует, что множества
{х :f(x)< а} и {x:g(x)<a}
могут отличаться друг от друга только на некоторое множество меры нуль, следовательно (поскольку мера предположена полной), если второе из них измеримо, то измеримо и первое.
Замечание. В классическом анализе понятие эквивалентности функций не играет существенной роли, так как там в основном рассматриваются непрерывные функции одного или нескольких переменных, а для них эквивалентность равносильна тождественности. Точнее, если две функции, fug, непрерывные на некотором сегменте Е, эквивалентны (относительно меры Лебега), то они совпадают. Действительно, если f(x0) =# g(x0) в какой-либо точке х0, то в силу непрерывности f и g найдется окрестность точки х0, во всех точках которой f(x) =/= g(x). Мера такой окрестности положительна, поэтому непрерывные функции не могут быть эквивалентны, если они не совпадают.
Для произвольных измеримых функций эквивалентность вовсе не означает совпадения. Например, функция на прямой, равная единице в рациональных точках и нулю в иррациональных, эквивалентна функции, тождественно равной нулю.
4.	Сходимость почти всюду. Поскольку во многих случаях поведение измеримой функции на том или ином множестве меры нуль для нас несущественно, будет естественно ввести следующее обобщение обычного понятия поточечной сходимости.
Определение 3. Последовательность {fn(x)} функций, определенных на некотором пространстве X с заданной на нем мерой, называется сходящейся почти всюду к функции f(x), если lim fn (х) = f (х)	(2)
для почти всех хе X (т. е. множество тех точек х, в которых (2) не выполняется, имеет меру нуль).
Пример. Последовательность функций fn(x) = (—х)п определенных на отрезке [0,1], при п->оо сходится к функции f(x)s 0 почти всюду (а именно, всюду, кроме точки х = 1).
Теорема 4 допускает следующее обобщение.
Теорема 4'. Если последовательность измеримых функций fn(x) сходится к функции f(x) почти всюду на X, то f(x) также измерима.
Доказательство. Пусть А — то множество, на котором lim f„(x) = f(x).
n->“>
ИЗМЕРИМЫЕ ФУНКЦИИ
287
§ fl
По условию, ц(Х\Л) = 0. Функция f(x) измерима на А, а так как на множестве меры нуль, очевидно, вообще всякая функция измерима, то f(x) измерима на Х\4, следовательно, она измерима и на множестве X.
Упражнение. Пусть последовательность измеримых функций 1п(х) сходится почти всюду к некоторой предельной функции f(x). Доказать, что последовательность fn(x) сходится почти всюду к g(x) в том и только том случае, если g(x) эквивалентна f(x).
5.	Теорема Егорова. В 1911 г. Д. Ф. Егоровым была доказана следующая важная теорема, устанавливающая связь между понятиями сходимости почти всюду и равномерной сходимости.
Теорема 6. Пусть Е— множество конечной меры и последовательность измеримых функций fn(x) сходится на Е почти всюду к f(x). Тогда для любого б>0 существует такое измеримое множество Е& cz Е, что
О Н(£е)> н(£) —6;
2) на множестве Е& последовательность fn(x) сходится к f(x) равномерно.
Доказательство. Согласно теореме 4' функция f(x) измерима. Положим
Еп = А {х: | f ((х) — f (х) | < 1/т}.
Таким образом, Е™ при фиксированных тип означает множество всех тех точек х, для которых
1Л(х) —f(x)|< 1/щ
при всех i п. Пусть
Ет = U Е™.
72—1
Из определения множеств Е™ ясно, что при фиксированном т ЕГ azE^az... azE™ az ...
В силу того, что о-аддитивная мера непрерывна, для любого т и любого б> 0 найдется такое п0(пТ), что
р(Ет\Е^т})<б/2т.
Положим
оо
Е& = А Еп,(т), т=1
и покажем, что так построенное Е& удовлетворяет требованиям теоремы.
288
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
(ГЛ, V
Докажем сначала, что на Е6 последовательность {А(х)} сходится равномерно к функции f(x). Это сразу вытекает из того, что если х е Е6, то для любого т
I fi (х) — f (х) | < \/т при i > п0 (т).
Оценим теперь меру множества Е\Ев. Для этого заметим, что при всяком т имеем ц (Е\Ет) = 0. Действительно, если х0 е е£ \Ет, то существуют сколь угодно большие значения при которых
1Л(*о) — f (Xq) 1> 1М,
т. е. последовательность {fn(x)} в точке х0 не сходится к f(x). Так как, по условию, {fn(x)} сходится к f(x) почти всюду, то
|1(Е\Егп)=0.
Отсюда следует, что
Н (Е \ Е£ (т)) = И (Em \ EZ (т)) < 6/2m.
Поэтому (оо	\	Z оо	\
Е\ П £”.(т)) = Л J (E\E£m)J< гп—1	'	^т=1	'
< £ М-(Е\ ££(„.)) < f 2^ = 6.
Теорема доказана.
6. Сходимость по мере.
Определение 4. Говорят, что последовательность измеримых функций fn(x) сходится по мере к функции f(x), если для любого о > 0
lim ц{х: IM*) —f(x)|>o} = 0. П->оо
Нижеследующие теоремы 7 и 8 устанавливают связь между понятиями сходимости почти всюду и сходимости по мере. Как и в предыдущем пункте рассматриваемая мера предполагается конечной.
Теорема 7. Если последовательность измеримых функций {fn(x)} сходится почти всюду к некоторой функции f(x), то она сходится к той же самой предельной функции f(x) по мере.
Доказательство. Из теоремы 4' следует, что предельная функция f(x) измерима. Пусть А — то множество (меры нуль), на котором fn(x) не стремятся к f(x). Пусть, далее,
Ek (о) = {х: I fk (х) — f (х) |> о),
00	оо
(о) = U Ek (о),	Л4=П^п(о).
5 4]
ИЗМЕРИМЫЕ ФУНКЦИИ
289
Ясно, что все эти множества измеримы. Так как
/?, (or) ZD R2 (or) ZD
то в силу свойства непрерывности меры
I*(/?Я(а))-*J*(Л!) при п—>оо.
Проверим теперь, что
М с А.	(3)
Действительно, если х0^А, т. е. если
lim fa (х0) = f W,
П->оо
то для данного о > 0 найдется такое п, что
I fk (*о) — f (*о) | < о, при k>n,
т. е. Хо^^п(ог) и, тем более, х0<£ М.
Но ц(Л) = 0, и поэтому из (3) вытекает, что ц(Л4) = 0, и, следовательно,
Ц (Rn (ц)>—* 0 при п—>оо;
так как Еп(о) <=/?п(<т), то теорема доказана.
Нетрудно убедиться, что из сходимости последовательности функций по мере, вообще говоря, не следует ее сходимость почти всюду. Действительно, определим для каждого натурального k на полуинтервале (0, 1] функции
.....
следующим образом:

при
при
остальных значениях х.
Занумеровав все эти функции подряд, мы получим последовательность, которая, как легко проверить, сходится по мере к нулю, но в то же время не сходится ни в одной точке (докажите это!).
Упражнение. Пусть последовательность измеримых функций {f„(x)} сходится по мере к некоторой предельной функции Цх). Доказать, что последовательность {fn (х)} будет сходиться по мере к функции g(x) в том и только в том случае, если g(x) эквивалентна f(x).
Хотя приведенный выше пример показывает, что теорема 7 не может быть обращена в полной мере, тем не менее справедлива следующая теорема:
Теорема 8. Пусть последовательность измеримых функций {fn(x)} сходится по мере к f(x). Тогда из этой последовательности можно выбрать подпоследовательность {/пА(х)}, сходящуюся к f(x) почти всюду.
290	МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ	[ГЛ. V
Доказательство. Пусть еь е2, ... — некоторая последовательность положительных чисел, стремящихся к нулю,
lim 8rt = 0,
п->оо
и пусть положительные числа ль т]2....Лп, ••• таковы, что ряд
Т]1 + Т]2 + • • •
сходится. Построим последовательность индексов
< «2 < • • • следующим образом: выберем пх так, чтобы ц{х: lk(x) — f (х)|>8,} < ти
(такое «1 обязательно существует); далее выберем «2>^i так, чтобы
Н {*: I f п, (х) — f (х) | > е2) < т]2.
Вообще, выберем «а > tik-i так, чтобы
Н {х; I	— f (*) | > в,} < ла-
Покажем, что построенная последовательность сходится к f(x) почти всюду. Действительно, пусть
Ri=Я ।(х) “f(x) । Q=ДRt-
Так как
Ri zz> R2 zd /?3 => ... zd Rn => ...,
то в силу непрерывности меры ц (/?,)-> p(Q).
ио
С другой стороны, ясно, что ц(/?;)< У, ла, откуда
k^i
->0 при i->oo, т. е. p(Q) = 0. Остается проверить, что во всех точках множества Е \ Q имеет место сходимость
Пусть x0^E\Q. Тогда найдется такое i0, что	Это
означает, что для всех k io
Хо Ф {*: | fnk (х) — f (х) | > еА}, т. е.
I fn^ (Xfl) f (Xq) I <
Так как, по условию, 8.J-+-0, то
•im fn (х0) = f (х0).
й->оо я
Теорема доказана.
§5)
ИНТЕГРАЛ ЛЕБЕГА
291
7. Теорема Лузина. С-свойство. Определение измеримой функции, данное в самом начале этого параграфа, относится к функциям на произвольных множествах и в общем случае никак не связано с понятием непрерывной функции. Однако, если речь идет о функциях на отрезке, то имеет место следующая важная теорема, установленная в 1913 г. Н. Н. Лузиным.
Теорема 9. Для того чтобы функция f(x), заданная на отрезке [a, ft], была измерима, необходимо и достаточно, чтобы для любого е > 0 существовала такая непрерывная на [а, ft] функция <р(х), что
ц{х: f (х)	<р(х)} < е.
Иначе говоря, измеримая функция может быть сделана непрерывной на [a, ft] путем ее изменения на множестве сколь угодно малой меры. Про функцию на отрезке, которая может быть сделана непрерывной с помощью такой «малой деформации», говорят, что она обладает С-свойством (термин Н. Н. Лузина). Как показывает теорема Лузина, для функций числового аргумента С-свойство можно положить в основу самого определения измеримости. Доказательство теоремы Лузина можно получить, воспользовавшись теоремой Егорова (проведите это доказательство!).
Упражнение. Доказать, что если А — измеримое множество на отрезке [a, ft], то для любого е > 0 найдутся такое открытое множество G А и такое замкнутое множество F cz А, что ц(С\4)<е и р(Д\Е)<е.
§ 5. Интеграл Лебега
Понятие интеграла Римана, известное из элементарного курса анализа, применимо лишь к таким функциям, которые или непрерывны или имеют «не слишком много» точек разрыва. Для измеримых функций, которые могут быть разрывны всюду, где они определены (или же вообще могут быть заданы на абстрактном множестве, так что Для них понятие непрерывности просто не имеет смысла), римановская конструкция интеграла становится непригодной. Вместе с тем для таких функций имеется весьма совершенное и гибкое понятие интеграла, введенное Лебегом.
Основная идея построения интеграла Лебега состоит в том, что здесь, в отличие от интеграла Римана, точки х группируются не по признаку их близости на оси х, а по признаку близости значений функции в этих точках. Это сразу же позволяет распространить понятие интеграла на весьма широкий класс функций.
Кроме того, интеграл Лебега определяется совершенно одинаково для функций, заданных на любых пространствах с мерой, в то время как интеграл Римана вводится сначала для функций одного переменного, а затем уже с соответствующими изменениями переносится на случай нескольких переменных. Для функций же на абстрактных пространствах с мерой интеграл Римана вообще не имеет смысла.
Всюду, где не оговорено противное, будет рассматриваться некоторая полная ст-аддитивная мера ц, определенная на ст-ал-гебре множеств с единицей X. Все рассматриваемые множества
292
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ
[ГЛ. V
А ci X будут предполагаться измеримыми, а функции f (х)—> определенными для хеХи измеримыми.
Нам удобно будет определить интеграл Лебега вначале для так называемых простых функций, а затем распространить его на существенно более широкий класс функций. Пункты 2—5 содержат построение интеграла Лебега для случая, когда мера всего пространства конечна. Случай бесконечной меры рассматривается в п. 6 этого параграфа.
1. Простые функции.
Определение 1. Функция f(x), определенная на некотором пространстве X с заданной на нем мерой, называется простой, если она измерима и принимает не более, чем счётное число значений.
Структура простых функций характеризуется следующей теоремой.
Теорема 1. Функция f(x), принимающая не более чем счетное число различных значений
Уь Уг, • • •, Уп.
измерима в том и только том случае, если все множества
An = {x:f (х) =-- уп} измеримы.
Доказательство. Необходимость условия ясна, так как каждое Ап есть прообраз одноточечного множества {уп}, а всякое одноточечное множество является борелевским. Достаточность следует из того, что в условиях теоремы прообраз /-1(В) любого борелевского множества есть объединение U Ап не более чем счетного числа измеримых множеств Ап, т. е. измерим.
Использование простых функций в построении интеграла Лебега будет основано на следующей теореме.
Теорема 2. Для измеримости функции f(x) необходимо и достаточно, чтобы она могла быть представлена в виде предела равномерно сходящейся последовательности простых измеримых функций.
Доказательство. Достаточность ясна из теоремы 4 предыдущего параграфа. Для доказательства необходимости рассмотрим произвольную измеримую функцию f(x) и положим fu(x)=mln, если m/n f(х) < (т + 1)/п (здесь пг — целые, а п — целые положительные). Ясно, что функции fn(x) простые; при п -> оо они равномерно сходятся к f(x), так как Ц(х) — — fn(x) | С 1/и.
2. Интеграл Лебега для простых функций. Мы введем понятие интеграла Лебега сначала для функций, названных выше простыми, т. е. для измеримых функций, принимающих конечное или счетное число значений.
ИНТЕГРАЛ ЛЕБЕГА
293
§ 5]
Пусть f — некоторая простая функция, принимающая значения
Уо У г...Уп, • • •; Vi У) при i Ф j,
и пусть А — некоторое измеримое подмножество X.
Естественно определить интеграл от функции f по множеству А равенством
J f (х) dp = УпИ (Л), где Ап = {х: х 6= A, f (х) = уп}, (1) А	п
если ряд справа сходится. Мы приходим к следующему определению (в котором по понятным причинам заранее постулируется абсолютная сходимость ряда).
Определение 2. Простая функция f называется интегрируемой или суммируемой (по мере ц) на множестве А, если ряд (1) абсолютно сходится. Если f интегрируема, то сумма ряда (I) называется интегралом от f по множеству А.
В этом определении предполагается, что все уп различны. Можно, однако, представить значение интеграла от простой функции в виде суммы произведений вида Ckp(Bk) и не предполагая, что все Ck различны. Это позволяет сделать следующая лемма.
Лемма. Пусть А = Bk, Bt П В, — 0 при i =/= j и пусть на каждом множестве Bk функция f принимает только одно значение Ck; тогда
j f (%W = £ QM-Ш,	(2)
A	k
причем функция f интегрируема на А в том и только том случае, когда ряд (2) абсолютно сходится.
Доказательство. Легко видеть, что каждое множество Ап = (х:х^А, f(x) = yn}
является объединением тех Bk, для которых Ck = уп. Поэтому
S ynv (А„) = 22 уп 22 и (Bk) = £ ckp (Bk). п	п ck=yn	k
Так как мера неотрицательна, то
12 I Уп. IН (4>)= 22 I Уп I 22 М- (Bk) — I ck IН (Bk), п	п	ck=yn	k
т. е. ряды X УпР (Ai) и 12 ckp (Bk) абсолютно сходятся или рас-п	k
годятся одновременно. Лемма доказана.
294
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
Установим некоторые свойства интеграла Лебега от простых функций:
A)	$[f(x) + g(x)]dp==^ f(x)dp + ^g(x)dp, А	А	А
причем из существования интегралов в правой части равенства следует существование интеграла в левой.
Для доказательства предположим, что f принимает значения-ft на множествах Л с Л, a g — значения g} на множествах Gj <=Л, так что
/1 = $f(x)dp = ^fip(Fi),	(3>
A	i
J2=\g(x)dii = £gjn(G/).	(4>
A	j
Тогда в силу леммы
/ = J [f (х) + g (х)] dy = £ Е (f‘ + Si) Н (F, П Gy); (5>
A	i i
HO
H (Л) = X H (Fi П Gy), p (Gy) - x p (Fi n Gy),
так что из абсолютной сходимости рядов (3) и (4) следует № абсолютная сходимость ряда (5); при этом
J — Ji +/2.
Б) Для любого постоянного k
^kf (х) dx — k f (х) dx, А	А
причем из существования интеграла в правой части следует существование интеграла в левой части. (Проверяется непосредственно.)
В)	Ограниченная на множестве А простая функция f интегрируема на А, причем, если | f (х) |	М на А, то
J f (х) dp А
< Мр (Л).
(Проверяется непосредственно.)
3. Общее определение интеграла Лебега на множестве конечной меры.
Определение 3. Назовем функцию f интегрируемой (суммируемой) на множестве А, если существует последовательность.
* 5]
ИНТЕГРАЛ ЛЕБЕГА
295
простых интегрируемых на А функций {fn}, сходящаяся равномерно к/. Предел
I = lim ( fn (х) du	(6)
«-►оо *
А обозначим
$ f (*) dp
А
и назовем интегралом функции f по множеству А.
Это определение корректно, если выполнены следующие условия:
1.	Предел (6) для любой равномерно сходящейся последовательности простых интегрируемых на А функций существует.
2.	Этот предел при заданной функции f не зависит от выбора последовательности {/п}.
3.	Для простых функций определение интегрируемости и интеграла равносильно данному в п. 2.
Все эти условия действительно выполнены.
Для доказательства первого достаточно заметить, что в силу свойств А), Б) и В) интеграла от простых функций,
{fn(x)dp — \fm(x)dp	(A)sup |f„(x) —fm(x)|.	(7)
А	1	ХеА
Для доказательства второго условия надо рассмотреть две последовательности, {/«} и {/"„}, сходящиеся к f. Если бы предел (6) для этих двух последовательностей принимал различные значения, то для последовательности, полученной объединением этих двух, предел (6) не существовал бы, что противоречит первому условию. Наконец, для доказательства справедливости третьего условия достаточно рассмотреть последовательность, в которой [п равняется f для всех п.
Замечание. Мы видим, что в построении интеграла Лебега имеются два существенных этапа. Первый — непосредственное определение интеграла (как суммы ряда) для некоторого класса функций (простых суммируемых функций), достаточно простого и в то же время достаточно обширного, второй — распространение определения интеграла на существенно более широкий класс функций с помощью предельного перехода. По существу, сочетание этих приемов — непосредственного конструктивного, но узкого определения и последующего предельного перехода присутствует в любом построении интеграла.
Установим основные свойства интеграла Лебега. Непосредственно из определения следует, что:
I.	J 1 • dp = ц (А).	(8)
296
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[Гл.-У
II.	Для любого постоянного k
^kf (x)dn^k^f (x)dn,	(9)
A	A
причем из существования интеграла в правой части вытекает существование интеграла в левой.
Это свойство выводится при помощи предельного перехода из свойства Б) для интеграла от простых функций.
III.	Аддитивность:
5 If (*) + g (*)Иц = f (x)dp + jj g (х)Др, (10) A	A	A
причем из существования интегралов в правой части вытекает существование интеграла в левой.
Доказательство получается. предельным переходом из свойства А) интеграла от простых функций.
IV.	Ограниченная на множестве А функция f интегрируема на А.
Доказательство получается предельным переходом из свойства В) интеграла от простых функций, с использованием теоремы 2.
V.	Монотонность: если f(x)^ 0, то
f (х) йц О
А
(И)
(в предположении, что интеграл существует).
Для простых функций это утверждение следует прямо .из-определения, а в общем случае его можно вывести, заметив, что если f измерима и неотрицательна, то найдется равномерно сходящаяся к ней последовательность (см. теорему 2) неотрица-г т е л ь н ы х, простых функций.
Из последнего свойства сразу следует, что если f(x)^g(x)t то
$ f (x)rfp> g(x)d[i,	(12)
А	А
а поэтому, если пг f(x)^M для всех (или почти всех) х е А, то
пц1 (А)
А
f (х) du (А).
(13)
§ 5]
ИНТЕГРАЛ ЛЕБЕГА
297
VI.	Если ц(Л) = О, то J f (x)dp =0.
А
VI'. Если f(x) == g(x) почти всюду, то
J f (x)dp = J g(x)dp,
А	А
причем оба интеграла существуют или не существуют одновременно.
Эти два утверждения непосредственно вытекают из определения интеграла Лебега.
VII.	Если функция <р интегрируема на А и почти всюду Ц(х) |	ф(х), то f также интегрируема на А.
Действительно, если f и ф — простые функции, то удалив из множества А некоторое множество меры нуль, оставшееся множество А' можно представить как объединение конечного или счетного числа множеств, на каждом из которых f и ф постоянны: f(x)=an, q>(x)=bn, причем	Из интегрируемо-
сти ф вытекает, что
X ।	। Н (Аг) < X (Аг) = Ф (*) dp = $ Ф (х) dp.
п	п 	А'	А
Поэтому f тоже интегрируема, и
fMdp
А
f(x)dp =	<
п
। f (*)	$q>(x)dp.
n	A'	A
В общем случае это утверждение доказывается предельным переходом с использованием теоремы 2.
VIII.	Интегралы
Ii = \f(x)dp., /2 = J | f (х) |dp	(14)
А	А
существуют или не существуют одновременно.
В самом деле, из существования интеграла /2 вытекает существование /1 в силу свойства VII.
Обратное для случая простой функции вытекает из определения интеграла, а для общего случая доказывается предельным переходом с использованием теоремы 2; при этом нужно воспользоваться неравенством
I а |-| b |<| a-b I.
298
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
4. о-аддитивность и абсолютная непрерывность интеграла. Лебега. В предыдущем пункте были сформулированы свойства интеграла Лебега по фиксированному множеству. Сейчас мь» установим некоторые свойства интеграла Лебега, рассматривая выражение
F(A) — \f(x)dp.
А
как функцию множества, определенную на совокупности измеримых множеств. Установим, прежде всего, следующее свойство:
Теорема 3. Если А = U Ап; ЛгП А/ = 0 при i =/= j, то п
Jf(r)dp = ^ Jf(r)dp,	(15>
А	п Ап
причем из существования интеграла в левой части вытекает существование интегралов и абсолютная сходимость ряда в правой части.
Доказательство. Сначала проверим утверждение теоремы для простой функции f, принимающей значения
У\, У2...Уп, • • •
Пусть
Bk = {x-. х<=А, f(x) = yk}, Впк = {х: х(=Ап, f(x) = yk}. Тогда
J f (х)дц = £ ykn (Bk) = £	=
A	A	An
= ££уаН(Впа)==£	(16>
n k	n An
Так как ряд	в предположении интегрируемости f
на А, абсолютно сходится, а меры всех множеств неотрицательны, то сходятся абсолютно и все остальные ряды в цепочке равенств (16).
В случае произвольной функции f из ее интегрируемости на А вытекает, что для любого е > 0 существует простая интегрируемая на А функция g, удовлетворяющая условию
lf(x)-g(r)|<8.	(17>
Для g имеем
$g(x)4i = £ $ g(x)dn,	(18>
л	п ап
Л 5]
ИНТЕГРАЛ ЛЕБЕГА
299
причем g интегрируема на каждом множестве Ап и ряд (18) абсолютно сходится. Из этого последнего обстоятельства и из оценки (17) вытекает, что f тоже интегрируема на каждом Ап и

f (х) du — ^g (х) dp < У ер (Л„) = ер (Л),
$ f (х) dp —
А	А
g(x)dp <ер(Л),
что вместе с
У Jf(x)dH И п Ап
(18) приводит к абсолютной сходимости ряда к оценке
У Jf(x)dp —Jf(x)dp <2ер(Л). п Ап	А
"Так как е > 0 произвольно, то
У Jf(x)dp = Jf (x)dp. п Ап	А
Следствие. Если f интегрируема на А, то f интегрируема и на любом измеримом множестве A' cz А.
Мы показали, что из интегрируемости функции f по множеству А следует, что если А = U Ап и А{ П Aj = 0, то f интегрируема по каждому Ап и интеграл по А равен сумме интегралов по множествам Ап. Это утверждение может быть обращено в следующем смысле.
Теорема 4. Если А = U Ап, Ai(}Al — 0 при I =/= / и ряд п
У JiЦх)|</р	(19)
п Ап
сходится, то функция f интегрируема на А и
\f(x)dp = Yj А	п Ап
Доказательство. Новым по сравнению с предыдущей теоремой здесь является утверждение, что из сходимости ряда (19) вытекает интегрируемость f на А.
Сначала проведем доказательство для случая простой функции f, принимающей значения Положив
Bt = {х: х е A, f (х) = fj, Anl = Ап f|
300	МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ	[ГЛ. V
имеем
"	Ап	'
Из сходимости ряда (19) вытекает, что сходятся ряды
S Si Мн(лп<)=Е гш(в.).
п i	i
Сходимость последнего ряда означает, что существует интеграл
f W du == У fiH (Bi).
A	I
В общем случае аппроксимируем f простой функцией f так, что lfW-f(x)|<8.	(20)
Тогда
§lf (х) |dp< ^|f(x)|dp + e^(4„), Ап	Ап
и так как ряд Е Н (А>) — Н И) сходится, из сходимости ряда (19) п
вытекает сходимость ряда
п Ап
т. е. по только что доказанному, интегрируемость на А простой функции f. Но тогда в силу (20) исходная функция f тоже интегрируема на А. Теорема доказана.
Неравенство Чебышева. Если ф(х)0 на А и с > 0, го
ц{х: х е А, ф (х) >с} ф (x)dp.	(21)
А
Действительно, пусть
А' = {х: х е А, ф (х)	с).
Тогда
? Ф (х) du = \ ф (х) dp 4- \ ф (х) du > \ ф (х) du ср (Д').
А	А-	А\А'	А'
Следствие. Если
^|f(x)|dp = 0,
А
то f (х) = 0 почти всюду.
§ 5У
ИНТЕГРАЛ ЛЕБЕГА
301
В самом деле, в силу неравенства Чебышева, имеем
А
для всех п. Поэтому
оо
: х е Л, f (х) #= 0} У ц | х-. х е Л, п=1

В предыдущем пункте было указано, что интеграл Лебега по множеству нулевой меры равен нулю для любой функции f.
Это утверждение можно рассматривать как предельный случай следующей важной теоремы.
Теорема 5 (абсолютная непрерывность интеграла Лебега). Если f(x)—суммируемая на множестве А функция, то для каждого е > 0 существует такое б > 0, что
\f(x}dp <е
е
для всякого измеримого е cz А такого, что р(е) < б.
Доказательство. Заметим прежде всего, что наше утверждение очевидно, если / ограничена. Пусть теперь f — произвольная суммируемая на А функция. Положим
A„ = {x: х^А, n<| f(x) | < п-ф 1}
и
N
&N — U Л1я, л=0
CN — А \ BN.
Тогда в силу теоремы 3
ОО
А	л=0 Ап
Выберем N так, что
оо
У I f (х) |dg = | f (х) |du < ~, n=N + i	Cft
и пусть
А Д ______________£______
0	2 (/V ч- 1) '
Если теперь р(е) < б, то
е
^|f(x)|dp= $ | f (х) | dp +	|f(x)|dp.
«	eflCjy
302
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ
|ГЛ. V
Первый из стоящих справа интегралов не превосходит е/2 (свойство V), а второй — не больше, чем интеграл, взятый по всему множеству Ск, т. е. также не превосходит е/2; таким образом, получаем
$ | f(x) |dp < е. е
Установленные свойства интеграла как функции множества приводят к следующему результату. Пусть f — неотрицательная функция, суммируемая на пространстве X по мере ц. Тогда функция
F (А}=^ f (х) dp.
А
определена для всех измеримых множеств A cz X, неотрицательна и о-аддитивна, т. е. удовлетворяет условию-, если А = J Ап и п
Ai П А, — 0, го F (Д) — 2 F (Дп). Иными словами, интеграл от п
неотрицательной функции обладает как функция множества всеми свойствами а-аддитивной меры. Эта мера определена на той же о-алгебре, что и исходная мера ц, и связана с ц условием: если ц(Д) = 0, то и ^(Д) = 0.
5. Предельный переход под знаком интеграла Лебега. Вопрос о предельном переходе под знаком интеграла, или, что то же самое, о почленном интегрировании сходящегося ряда, часто возникает в различных задачах.
В классическом анализе устанавливается, что достаточным условием возможности такого предельного перехода является равномерная сходимость соответствующей последовательности (ряда).
Сейчас мы установим некоторые теоремы о предельном переходе под знаком интеграла Лебега, представляющие собой далеко идущие обобщения соответствующих теорем классического анализа.
Теорема 6 (Лебег). Если последовательность {/п} на А сходится к f и при всех п
I fn to К Ф (х),
где <р интегрируема на А, то предельная функция f интегрируема на А и
fn (x)dp-+ f (x)dg.
A	A
Доказательство. Из условия теоремы легко следует, что |/(х)|^ф(х). Поэтому f (п. 3, свойство VII) интегрируема.
§ 51
ИНТЕГРАЛ ЛЕБЕГА
ЗЭЗ
Пусть е > 0 произвольно. По теореме 5 (об абсолютной непрерывности интеграла) найдется такое б > 0, что если р(В) •< б, то
) Ф (х) dp <	.
в
(22)
В силу теоремы Егорова множество В, удовлетворяющее условию р(В) < б, можно выбрать так, что последовательность {fn} сходится на С = А \ В равномерно. Следовательно, найдется такое N, что при и А' и хе С выполнено неравенство
I f ('*') fn(x)\ < 2fl (Q •
Тогда
^f(x)dp — fn(x)dp = [f (x) — fn(x)]dp + ^f(x)dp — fn(x)dp, Л	А	С	В	В
и так как |f(x) | ф(х) и |fn(x) |	ф(х), то в силу (22) по-
лучаем
J f W dp — j fn (x) dp A	A
Следствие. Если	== const и то
\fn(x)dp-^^f(x) dp. А	А
Замечание. Поскольку значения, принимаемые функцией на множестве меры 0, не влияют на величину интеграла, в теореме 6 достаточно предположить, что {fn} сходится к f почти всюду и что каждое из неравенств |fn(*) I ф(х) также выполняется лишь почти всюду.
Теорема 7 (Б. Леви). Пусть на множестве А
ft (*)<f2(x)^...^fn(x)^..., причем функции fn интегрируемы и их интегралы ограничены в совокупности
5 fn (х) dp < к. А
Тогда почти всюду на А существует (конечный) предел
f (х)— Um fn(x),	(23)
Л->оо
функция f интегрируема на А и
\fn{x)dp-^^f(x)dp.
304
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
При этом на множестве, на котором предел (23) не суще’ ствует, функцию f можно задать произвольно, например, поло-* жив на этом множестве f(x) = 0.
Доказательство. Будем предполагать f i (х) 0, так как общий случай легко сводится к этому путем перехода к функциям
Рассмотрим множество
й = {х: х е A, fn(x)-+ оо).
Легко видеть, что й = Q J ', где
й„г) = {х: xs.4, fn(x)>r}.
В силу неравенства Чебышева (21)
pW^K/r.
Так как йГcz oJPcz ... cz й'Р cz ..то ц (U </C/r; но при любом г
Й <=. J Й^, п
поэтому ц(й)^/</г. Ввиду произвольности г отсюда следует, что
И (й) == 0.
Тем самым доказано, что монотонная последовательность {/„ (х)} почти всюду на А имеет конечный предел f(x).
Обозначим через Аг множество тех точек хе.4, для которых г-К/(х)<г,	г=1, 2.....
и положим ср(х) = г на Аг.
Если будет доказана интегрируемость ср(х) на А, то утверждение нашей теоремы сделается непосредственным следствием теоремы 6. Положим
bs= U 4-Г=!
Так как на Bs функции fn и f ограничены и всегда ср(х)^ f(x)-f- 1, то
\ Ф (х) dp < f (х) dp + pi (А) = lim fn (х) dp + ц. (А)<К + ц (Д). в3	. "“>0° bs
ИНТЕГРАЛ ЛЕБЕГА
395
$5]
Но
( Ф (х) dp = £ гц (ЛД bs ' г=‘ 
Ограниченность же этих сумм означает сходимость ряда
оо
У гр (Лг) = J ф (х) dp. г=1	А
Таким образом, интегрируемость ф на А доказана. Условие монотонного неубывания функций fn(x) можно, очевидно, заменить в доказанной теореме условием их монотонного невозрастания.
Следствие. Если фп (х)	0 и
оо
X 5	< °°>
п=1 А
оо
то почти всюду на А ряд У, (х) сходится и
п=1
/ оо	\	по
и У	w)	=У	(*)d^-
А 4=1	'	п=1	А
Теорема 8 (Фату),. Если последовательность измеримых неотрицательных функций {Д} сходится почти всюду на А к f и \fn(x)dp^K, А
то f интегрируема на А и
dy- К'
А
Доказательство. Положим
фп (х) = inf Д(х);
k > п
<рп измерима, так как
{х: ф„ (х) < с) = J {x: f Дх) < с}.
Далее, 0 «^ф„ (хХМх), поэтому ф„ интегрируемы, и
$ ф™ W < jj fn (х) dp < К; А	А
306
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
(ГЛ. V
наконец,
Ф1 (х) <ф2(х)< ... <ф„(х)< ... и
lim фп (x) = f(x)
п-*оо
почти всюду. Поэтому, применяя предыдущую теорему к {ср«}, получаем требуемый результат.
6. Интеграл Лебега по множеству бесконечной меры. До сих пор, говоря об интеграле и его свойствах, мы считали, что рассматриваются функции, заданные на том или ином измеримом множестве конечной меры. Однако часто приходится иметь дело с функциями, заданными на множестве, мера которого бесконечна, например, на прямой с лебеговой мерой на ней. Поэтому важно распространить понятие интеграла и на этот случай. Мы ограничимся при этом тем практически наиболее существенным случаем, когда рассматриваемое множество X может быть представлено как сумма счетного числа множеств конечной меры:
М*п)<оо.	(24)
п
Если пространство X, в котором задана мера ц, представимо как сумма счетного числа множеств конечной меры, то мера ц на X называется о-конечной (см. п. 3 § 3). Примерами о-конеч-ных мер служат меры Лебега на прямой, плоскости, в л-мерном. пространстве. Меру, не удовлетворяющую условию о-конечности, можно получить, например, приписав каждой точке на прямой вес 1. Тогда все подмножества прямой можно считать измеримыми, причем конечные множества будут иметь конечную меру,, а остальные — бесконечную.
Назовем исчерпывающей последовательностью всякую монотонно возрастающую последовательность {Хп} измеримых подмножеств множества X, удовлетворяющую условию (24). Введем теперь следующее определение.
Определение 4. Измеримая функция f, определенная на множестве X с о-конечной мерой ц, называется суммируемой на X, если она суммируема на каждом измеримом подмножестве А сд X конечной меры и если для каждой исчерпывающей последовательности {Хп} предел
lim ( f (х) dp	(25)
n-*°o J
Лп
существует и не зависит от выбора этой последовательности. Этот предел называется интегралом от f по множеству X и обозначается символом
f (*)
х
$ 5]
ИНТЕГРАЛ ЛЕВЕГА
307
Ясно также, что если функция f равна нулю вне некоторого множества конечной меры, то для нее только что сформулированное определение интеграла равносильно тому, которое было дано в п. 3.
Замечание. Определение интеграла от простой функции, данное в п. 2, можно дословно перенести на случай бесконечной меры. Ясно при этом, что для суммируемости простой функции необходимо, чтобы каждое отличное от нуля значение она принимала только на множестве конечной меры. Определение суммируемости, данное в п. 3, существенно связано с предположением конечности меры множества X. Действительно, если g(X)=oo, то из равномерной сходимости последовательности простых суммируемых функций {<рп} не следует, вообще говоря, сходимость последовательности их интегралов (приведите пример!).
Результаты, изложенные в пп. 3 и 4 для случая конечной меры, в основном переносятся на интегралы по множеству бесконечной меры.
Существенное отличие состоит в том, что в случае р(Х) = оо ограниченная измеримая функция на X не обязана быть суммируемой. В частности, если р(Х)=оо, то никакая отличная от нуля константа не интегрируема на X.
Читатель без труда проверит, что теоремы Лебега, Б. Леви и Фату остаются справедливыми в случае бесконечной меры.
7. Сравнение интеграла Лебега с интегралом Римана. Выясним связь между интегралами Лебега и Римана. При этом мы ограничимся простейшим случаем линейной меры Лебега на прямой.
Теорема 9. Если существует интеграл Римана
ъ
I =	\ f W dx,
а,
то f интегрируема на [а, Ь] по Лебегу и
5 f(x)dn = Z.
[а. И
Доказательство. Рассмотрим разбиение отрезка fa, b] на 2п частей точками
хк = а + ~ (Ь — а)
и соответствующие этому разбиению суммы Дарбу:
2П	2П
Qn = ^r-XMnk’ ап = -^г-'^ГПпк’ к=1	А=1
308
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
[ГЛ. V
где Mnk — верхняя грань f на отрезке xfe_,
a тпк— нижняя грань f на том же отрезке. По определению интеграла Римана,
/ = ПтЙп = Птип-
П->ОО	И->ОО
Положим
fn (х) = Мпк при Xfe-J < X < хк, 1п(,х) = тпь при xi_1<x<xJi,.
В точке х = b функции fn и fn можно доопределить произвольно. Легко вычислить, что
j fn(x)dii = Qn, $ f_n(x)dii = an. [a, b]	[a, 6]
Так как последовательность {fn} не возрастает, а последовательность {fn} не убывает, то почти всюду
L (*) - f (х) > f (х), _fn (X) -_f (X) < f (X).
По теореме Б. Леви
\ f (x)dp = lim Q„ = I = lim con = \ f(x)dp. . tl	n->OO	J
la, Ы	[a, 6]
Поэтому
J I f (x) —£(x)	= J (f (x) — f_(x)) dp = 0
la, b]	la, b]
и, следовательно, почти всюду
f(x) -f(x) = O, т. e.
f (x) =/(x)=f(x) и
jj f(x)dp = /.
[a, 6]
Теорема доказана. ₽
Легко указать примеры ограниченных функций на некотором отрезке, интегрируемых по Лебегу, но не интегрируемых по Риману (например, уже упоминавшаяся функция Дирихле на отрезке [0, 1], равная 1 для рациональных и 0 для иррациональных х). Неограниченные функции вообще не могут быть интегрируемы по Риману, но многие из них интегрируемы по Лебегу.
§ 5]
ИНТЕГРАЛ ЛЕБЕГА
30»
В частности, любая функция f(x)^O, для которой интеграл Римана
ь
f (х) dx
а+8
существует при каждом е> 0 и имеет конечный предел / при е->0, интегрируема по Лебегу на [а, Ь], причем
ь
f(x)dp = lim f(x)dx.
[а, 6]	8->° а+е
Несобственный интеграл
ъ
lim \ f (х) dx
е-»0 J
а+е
в случае, когда

lim
е->0
Jj |f(x)ldx = а+е
оо,
не существует в лебеговом смысле, поскольку, согласно свойству VIII п. 3, из суммируемости функции /(х) следует, что и функция |^(х) I тоже суммируема. Например, интеграл
1
1 . 1 , — sin —dx
X X о
существует как (условно сходящийся) несобственный интеграл Римана, но не существует как интеграл Лебега.
Если рассматривается функция на всей прямой (или полупрямой), то интеграл Римана для такой функции может существовать лишь в несобственном смысле. Опять-таки, если такой интеграл сходится абсолютно, то соответствующий лебегов интеграл существует и имеет то же самое значение. Если же этот интеграл сходится лишь условно, то в лебеговом смысле функ-цня не интегрируема. Например, функция —-—не интегрируема по Лебегу на всей прямой, поскольку
— ОО
310
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
ГГЛ. V
Однако несобственный интеграл
оо
Ssin X . -----ах, X ’
— оо
как известно, существует, и равен л.
§ 6. Прямые произведения систем множеств и мер. Теорема Фубини
В анализе важную роль играют теоремы о сведении двойного (или вообще многократного) интеграла к повторному. В теории кратных интегралов Лебега основным результатом является так называемая теорема Фубини, которая будет доказана в конце этого параграфа. Предварительно мы установим некоторые вспомогательные понятия и факты, имеющие, впрочем, и самостоятельный интерес.
1. Произведения систем множеств. Множество Z упорядоченных пар (х, у), где хеХ, у^¥, называется прямым произведением множеств X и У и обозначается X X У. Аналогично, множество Z упорядоченных конечных последовательностей (хь х2, ..., хп), где xh^Xh, называется прямым произведением множеств Xj, Х2, ..., Хп и обозначается
z=x,xx2x ••• xx„=lx|xt.
В частном случае, когда
Х1 = Х2 = ... = хп = х,
множество Z есть п-я степень множества X:
Z = X\
Например, координатное n-мерное пространство Rn есть п-я •степень числовой прямой R1. Единичный куб 1п, т. е. множество элементов из Rn с координатами, подчиненными условию
0^xft^l, k=l, 2.........п,
является n-й степенью единичного сегмента Z1 = [0, 1].
Если 6^ <э2, ••••	—системы подмножеств множеств Хь
Х2, .... Хп, то
...
обозначает систему подмножеств множества X — |xl X*, представимых в виде
А-АХЛХ ••• ХЛ,
где
5 61
ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР
311
Если <э1 = <э2= ... = <®п = ®, то 91 есть n-я степень системы ®:
й = @я.
Например, система параллелепипедов в R” есть п-я степень системы отрезков в R*.
Теорема 1. Если <эь <э2........®п — полукольца, то и
= 1x1®* есть полукольцо.
Доказательство. Согласно определению полукольца нам нужно проверить, что если А, Вей, то Л f) Be да, и если, m
кроме того, BczA, то А= J С{, где С[ = В, С/ПС/= 0 при
/=#/ и С\еда (Z=l, 2....ri). Проведем доказательство для
случая п = 2.	,
I. Пусть Ле<э1Х®2. Be(5|XS2; это значит, что д=Л1ХД2, Л,е®1, Л2е®2,
B = BiXB2, Bi^&lt В2е®2. Тогда
АПВ = (Д1ПВ1)Х(Д2ПВ2), и так как
Л1ПВ1е®1,	Д2Г1В2е®2,
то
ДПВе®| Х®2-
II. Предположим теперь, дополнительно, что
В! с: Л, В2сА2;
в силу того, что ®i и ®2 — полукольца, имеют место разложения:
Д^В.ивР’и ... ив?’,
л2 = в2ивУ’и ... ив?’.
Но тогда
д = д1ХД2 = (В1ХВ2)и(в1 ХВ?’) U ... U(BiXB?’)U
и (Bi1’ X в2) и (Bi1’ х в?’) и ... и (Bi1’ X в?’) и
и (В?’ х в2) и (в?’ х В<2”) и ... и (в?’ х в?’).
Первым членом этого разложения служит В] X В2 = В, и все члены принадлежат системе ®] X ®2-
Теорема доказана.
Однако из предположения, что системы суть кольца (или о-алгебры), еще не вытекает, вообще говоря, что произведение 1х!®* будет кольцом (соответственно о-алгеброй). ь
312
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ
[ГЛ V
2. Прэизведения мер. Пусть на полукольцах <5Ь <э2, ..., заданы меры
Hi (А), Нг(Л2), • ••, m(Ai), AeSj.
Для простоты будем считать эти меры конечными, хотя излагаемые ниже рассуждения и факты переносятся, без существенных изменений, на случай о-конечных мер (см., например, [21]). Определим на полукольце
«л=е,х@2Х... х®я	(1)
меру и = Hi X р2 X • • • X	(2)
формулой
И (Л) = Р1 (А) р2 (Л2) ... р„ (Л„),	(3)
где	•
Л = л, X А X •  • X Л-
Следует еще доказать, что р(Л) —действительно мера, т. е. что эта функция множества аддитивна. Сделаем это для случая п — 2. Пусть дано разложение
Л = Л1ХЛ,= иЯ(*’. B(i)OB(/) = 0 при £=#=/,
k
Bw = B\k} x В?\
В силу леммы 2 § 5 гл. I существуют такие разложения
л, = исГ, л2=1М\
т	п
что множества В\к} являются объединениями некоторых C(im), и множества — объединениями некоторых С2п). Очевидно, что
и (Л) = И! (А) ц2 (Л2) = Е Е m (сГ) И2 (сП (4) п т
ц = Ц1 (s!fe)) Ц2 ($*>) = Е Е (с!т)) (с^),	(5)
т п
причем в (5) справа сумма берется по всем с\т} с: В^ и cz cz В^, а в правой части равенства (4) стоят по одному разу все члены, появляющиеся в правых частях равенств (5). Поэтому
и(Л)=Ен(йД
k
что и требовалось доказать.
Таким образом, в частности, аддитивность элементарных мер в n-мерном евклидовом пространстве следует из аддитивности линейной меры на прямой.
§6]
ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР
313
Меру (2), заданную на полукольце (1) формулой (3), мы будем называть произведением мер pb ..., цп.
Теорема 2. Если меры ц2, • • •, Нп а-аддитивны, то с-ад-дитивна и мера ц = щ X Иг X • • • X
Доказательство проведем для случая п = 2. Обозначим оо
через Xi лебегово продолжение меры ць Пусть C=U С„, где п=1
Сп П Ст = 0 при п =# т, причем С и Сп входят в ®i X ®2, т. е. С=ДХВ, AeSb
Сп = АпХВп,	Вп^02,
Пусть множества А и Ah А2, ... лежат в пространстве X. Положим для хе X
_ ( Ц2(В„), если х <= А„, In W | Q, если х ф Д*
Легко видеть, что для х е А
Ег„(х) = р2(в),
п
поэтому в силу следствия из теоремы Б. Леви (см. стр. 305)
У J fn (х) dkx = J ц2 (В) dkx = Aj (А) ц2 (В) = Pi (А) ц2 (В), п А	А
НО
jj fn(x) dkl = ц2(В„) pi (An) = р (С„) А
и, следовательно, 1и(С„) = р(С). п
Если Ц], ..., о-аддитивные меры, заданные соответственно на <т-алгебрах ..., 0п, то их произведением мы назовем лебегово продолжение меры щ X М-2 X • • • X Будем обозначать его символом
И! ® Ц2 ®	® Ц„ или ® |Xfe-
В частности, при
И1 = И2= ... = [!„==[!
получаем п-ю степень меры ц:
Например, n-мерная мера Лебега рп есть ц-я степень линейной меры Лебега ц.
314
МЕРА. ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ
(ГЛ. V
Заметим, что произведение мер автоматически оказывается полным (даже если меры рь ..., цп были неполны).
3. Выражение плоской меры через интеграл линейной меры сечений и геометрическое определение интеграла Лебега. Пусть область G на плоскости (х, у) ограничена вертикалями х = а, у = b и кривыми у = ф (х), у = ф (х).
Как известно, площадь области G выражается интегралом ь
V (G) = {<Р W— t (*)} dx.
а
При этом разность ф(х0) —ф(хо) равна длине сечения области G вертикалью х = х0. Нашей задачей является перенести такой способ измерения площадей на произвольные меры-произведения
Ц = Рх ® Ру
В дальнейшем будет предполагаться, что меры рх и определены на о-алгебрах, о-аддитивны и обладают свойством полноты (если В cz А и р(Л) = 0, то В измеримо), которым, как указывалось ранее, обладают все лебеговы продолжения.
Введем обозначения:
Лх == {у : (х, у) е Л}	(х фиксировано),
Ау — {* : (х, У) s Л}	(у фиксировано).
Если X и Y — числовые прямые (а XX Y— плоскость), то ЛХо есть проекция на ось У сечения множества Л вертикальной прямой X = х0.
Теорема 3. В перечисленных выше предположениях для любого ^-измеримого множества1) А
Ц И) = J	(Лх) dpx = $ цх (Ау) dp.у.
X	Y
Доказательство. Достаточно доказать равенство
И (Л) = фл (х) dux, где фд (х) = ру (Лх),	(6)
х
так как второе утверждение теоремы вполне аналогично пер-
') Заметим, что интегрирование по X фактически сводится к интегрированию по множеству	А у с: X, вне которого подынтегральная функция
У г г равна нулю. Аналогично, \ == \ .
§ 61
ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР
315
вому. Заметим, что теорема автоматически включает в себя утверждение, что при почти всех х (в смысле меры цж) множества Ах измеримы относительно меры pv и что функция <ра(*) измерима относительно меры цх. Без этого формула (6) не имела бы смысла.
Мера ц — это лебегово продолжение меры m — цх X Цу. определенной на системе множеств вида А — ДУлХЛХ1. Для таких множеств равенство (6) очевидно, так как для них
. .	( Ру (At,) При X Е=
фд (X) = S Л	.
™	(.	0 при х ф Ау,.
Без труда переносится равенство (6) и на множества из 9?(®т), разложимые в конечную сумму попарно непересекающихся множеств из
Доказательство равенства (6) в общем случае опирается на следующую лемму, которая имеет и самостоятельный интерес для теории лебеговых продолжений.
Лемма. Для любого ц-измеримого множества А существует множество В вида
В = П Вп, Bi=> В2=> . .. гэ Вп=> ..., п
Вп = у Bnh, Вп\ се Вп2 ... се Bnk се •. , где множества Впн принадлежат 9?(®т), причем A cz В и
ц(Л) = ц(В).
(7)
Доказательство. По определению измеримости при любом п множество А можно погрузить во множество Сп = IJ Д„г — г
объединение множеств Дпг из так, что
р(С„)<р(Л) + 1/п.
п
Положим В„ = П Cft и заметим, что множества Вп имеют fe=i
вид Вп — U &ns> где &ns принадлежат ®т. Положив, наконец, S
k
= U Ai.s> МЫ получим СИСТвМу множеств Bnk с нужными свойствами.
Лемма доказана.
Равенство (6) легко переносится с множеств на множества Вп и В при помощи теоремы Б. Леви (теорема 7
316
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ. ИНТЕГРАЛ
[ГЛ. V
§ 5), так как
Фвп(х) = Птфв ft(x), Фз <ф3 п	fe->00	Пл	Пг
ф3(х) = НпГф3 (х), Фв, > Фв2 > • • • п->°°
В силу непрерывности меры эти равенства имеют место .в каждой точке х. Если ц(Д) = 0, то ц(В) = 0 и почти всюду
Фв (х) = Цу(Вх) = 0.
Так как Ах с Вх, то для почти всех х множество Ах измеримо и
Фа М = Ру(Лх)=0,
Фа (хМцх = 0 = ц(Л).
Следовательно, для множеств А меры нуль формула (6) верна. В общем случае представим А в виде В \ С, где в силу (7), ц(С) = 0. Так как формула (6) верна для множеств В и С, то легко видеть, что она верна и для самого множества А. Доказательство теоремы 3 закончено.
Пусть теперь У — числовая прямая, цу— линейная мера Лебега, а множество А есть множество точек (х, у) вида
{(х, у)-. х^М, 0<у</(х)},	(8)
где М — какое-то цж-измеримое множество, а /(х)—интегрируемая неотрицательная функция. В этом случае
( f (х) при х е М,
|	0 ПрИ
и
Р И) = 5 f М dp.x.
м
Таким образом, доказана следующая теорема.
Теорема 4. Интеграл Лебега неотрицательной функции f(x) равен мере ц = X ру множества А, определенного соотношением (8).
Когда X — числовая прямая, множество М — отрезок, а функция /(х) интегрируема по Риману, эта теорема сводится к известному выражению интеграла через площадь, расположенную под графиком функции.
4. Теорема Фубини. Рассмотрим тройное произведение U — = XX УXX; если на X, У, Z заданы меры Цх. цу, цг, то меру
Р« = Их ® Ру ®
ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР
317
можно определить как
(Нх ® И») ® Иг, или же как
Нх ® (Ну ® Иг).
В действительности, как легко проверить, эти определения равносильны.
Следующая т-еорема является основной в теории кратных интегралов.
Теорема 5 (Фубини). Пусть меры рх и ру определены на c-алгебрах, о-аддитивны и полны; пусть, далее,
р = Их ® Ну
и функция f(x, у) интегрируема по мере р на множестве
A^XXY-	(9)
Тогда ’)
\f(x, у) dp. = М f (х, у) с/рЛ dp* = М f (х, у) г/рЛ dpy. (10)
Л	X \лх	/ Y \Лу	/
Утверждение теоремы включает в себя существование внутренних интегралов в скобках при почти всех значениях переменного, по которому берутся внешние интегралы.
Доказательство. Проведем сначала доказательство для случая f(x, у)^0. С этой целью рассмотрим тройное произведение
u = xxrxz,
где третий множитель есть числовая прямая, и произведение мер
Л = рх ® Pj, ® р1 = р ® р1,
где р1 есть линейная лебегова мера.
В U определим подмножество W условием: (х, у, W, если (х, у) е А, 0 z f (х, у). В силу теоремы 4
Л(№)= \f(x, y)dp.	(11)
л
С другой стороны, по теореме 3
Л(Г)= JlOFxMPx,	(12)
х
') См. сноску на стр. 314.
318
МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
(ГЛ. V
где £ = Цу X ц1 и Wx обозначает множество пар (у, z), для которых (х, у, z)e W. При этом, снова по теореме 4,
l(Wx)= \f(x, y)dpy.	(13)
Ах
Сопоставляя (И), (12) и (13), получаем
§ / (х, у) dp = $ Н f (х, у) г/рЛ dpx, А	X \ЛЖ	/
что и требовалось доказать.
Общий случай сводится к разобранному при помощи равенств
f(x, y) = f+(x, y)—f~(x, у),
f(x,	+	Г(х, у)=И(х’	у).
Замечание. Как показывают приводимые ниже примеры, из существования повторных интегралов
и JMfdpx'jdPtf	(14)
X \Лл /	У \Ау J
не следуют, вообще говоря, ни равенства (10), ни интегрируемость функции f(x,y) на А. Однако, если существует хотя бы один из интегралов
Ши (х, у) | dp у') dpx или $ Н | f(x, у) It/Px'jdpy, (15) х	7	Y \Ау	/
то f(x,y) интегрируема на А и справедливы равенства (10).
Действительно, пусть, например, первый из интегралов (15) существует и равен Af. Функция fn(x, у) = min{ | f (х, у) |, п} измерима, ограничена, а значит, и суммируема на А. По теореме Фубини
j \п (х, у) dp = $ f J f„ (x, у) dpy'j dpx < M. (16) A	X \Лл	7
Функции fn образуют монотонно неубывающую последовательность, почти всюду сходящуюся к |f(x, у) |. По теореме Б. Леви отсюда и из неравенства (16) следует, что функция |f(x, z/) | суммируема на А. Но тогда и f(x,y) суммируема и для нее верна теорема Фубини. Отсюда вытекает наше утверждение.
Мы доказали теорему Фубини в предположении, что меры р» и ру (а значит, и р) конечны. Однако, она остается справедливой и в случае о-конечных мер (см., например, [21], стр. 208).
§ 6]
ПРЯМЫЕ ПРОИЗВЕДЕНИЯ СИСТЕМ МНОЖЕСТВ И МЕР
319
Приведем примеры функций, для которых существуют повторные интегралы (14), но равенство (10) не имеет места.
1. Пусть Л = [—1, I}2,
f У} = (х2 + уг)2~ при х2 + у2 > 0 и f (0, 0) = 0:
тогда
f (х, у) dx — 0
при всех у и
при всех х. Поэтому
1
f (х, у} dy = 0
-1
f (х, у) dx
но интеграл в смысле двойного интеграла Лебега по квадрату ие существует, так как
11	1 2л	1
Sf . .,	. , . . _ С . f | sin <р cos <р I .	„ f dr
\\f(x,y}\dxdy^\ dr \ -----у-2-!- dtp = 2 \ — = оо,
-1-1	00	о
2- Пусть А = (0, 1 ]2, 22П ПРИ Цр < X <------------------Ц_;	--L_
2	2"“'	2	2П~
О в остальных случаях.
Можно подсчитать, что
а
ГЛ AB A VI НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА. ТЕОРИЯ ДИФФЕРЕНЦИРОВАНИЯ
В этой главе мы будем рассматривать интеграл Лебега в основном для функций на прямой, считая, что мера, по которой этот интеграл берется, есть обычная линейная мера Лебега.
Если f — суммируемая функция, определенная на измеримом пространстве X с мерой ц, то интеграл
f (XW	(*)
А
существует для каждого измеримого А ед X и при фиксированной f представляет собой функцию множества, определенную для всех измеримых подмножеств А сд X. Такой интеграл называется неопределенным интегралом Лебега. Пространством X может, в частности, служить отрезок числовой прямой. Если при этом А — тоже некоторый отрезок, то интеграл (*) будет функцией пары точек — концов отрезка А'. Будем считать, что в этом случае мерой ц является обычная мера Лебега и писать dt вместо dp. Зафиксировав один из концов промежутка интегрирования, скажем, левый, мы можем изучать свойства инте-
X
грала ^f(t)dt, взятого по отрезку [а, х], как функции одного а
переменного х. Эта задача приведет нас к рассмотрению некоторых важных классов, функций на прямой. Общей задаче изучения интеграла Лебега от фиксированной функции f как функции множества посвящен § 5.
Из элементарного курса анализа известны следующие основные равенства, дающие связь между операциями дифференцирования и интегрирования: если f — непрерывная функция, a F — функция, имеющая непрерывную производную, то
X
1)	-^\f(t)dt=~-f(x),
а b
2)	\F'(t)dt = F(b)- F(a).
а
МОНОТОННЫЕ ФУНКЦИИ
321
§ и
Спрашивается: верно ли равенство 1) для функций, суммируемых в смысле Лебега? Каков класс функций (возможно, более широкий), для которого выполняется равенство 2)?
Этим вопросам посвящены следующие параграфы данной главы.
§ 1. Монотонные функции.
Дифференцируемость интеграла по верхнему пределу
1. Основные свойства монотонных функций. Изучение свойств интеграла Лебега
X
Ф(х)=ф(0^	(1)
а
как функции верхнего предела мы начнем со следующего очевидного, но важного замечания: если функция f неотрицательна, то Ф(х)—монотонно неубывающая функция. Далее, всякая суммируемая функция есть разность двух неотрицательных суммируемых:
/ (0 = /+(0-L(/).	(2)
Поэтому интеграл (1) разлагается в разность двух монотонно неубывающих функций. Следовательно, изучение интеграла Лебега как функции верхнего предела можно свести к изучению монотонных функций того же типа. Монотонные функции (независимо от их происхождения) обладают рядом простых и важных свойств, которые сейчас будут изложены.
Напомним некоторые понятия. Всюду, где не оговорено противное, будут рассматриваться функции, заданные на некотором отрезке.
Функция f называется монотонно неубывающей, если из Xi Х2 следует
f(xi)<f(x2);
аналогично определяются монотонно невозрастающие функции. Пусть /—-произвольная функция на прямой. Предел1)
lim f(x0 + h) h->0 +
(если он существует) называется пределом справа функции f в точке хо и обозначается /(хо + О). Аналогично определяется f(x0 — 0)—предел слева функции f в точке х0- Равенство /(%о + О) = f(x0 — 0) означает, очевидно, что в точке х0 функция
‘) Символ h —► 0 + означает, что h стремится к нулю, принимая только положительные значения.
322
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. vr
f или непрерывна, или имеет устранимый разрыв. Точка, в которой оба эти предела существуют, но не равны между собой, называется точкой разрыва первого рода, а разность f(*o + O)— — f(x0— 0) называется скачком функции f в этой точке.
Если f(x0) = f(x0 — 0), то f называется непрерывной слева в точке хо, а если f(х0) = f(х0 + 0), то f непрерывна справа в этой точке.
Установим основные свойства монотонных функций. Для определенности мы будем говорить о монотонно неубывающих функциях, хотя ясно, что все сказанное ниже автоматически переносится на функции, монотонно невозрастающие.
1.	Всякая монотонно неубывающая на [а, Ь] функция f измерима и ограничена, а следовательно, суммируема.
Действительно, по определению монотонности, f(a)<f(x)<[(&) на [а, &].
Далее, для любого постоянного с множество
Ае = {х: f(x)<c}
есть либо отрезок, либо полуинтервал (либо пусто). В самом деле, пусть точки, в которых f(x)<_c, существуют, и пусть d есть точная верхняя грань таких х. Тогда Ас есть или отрезок [a, d\ или полуинтервал [a, d).
2.	Монотонная функция может иметь разрывы только первого рода.
Действительно, пусть х0 — произвольная точка на [а, Ь] и хп -> х0, причем хп < Хо. Тогда последовательность {/(хп)} ограничена снизу и сверху [например, величинами f(a) и /(£)]• Следовательно, она имеет хотя бы одну предельную точку. Но наличие у любой такой последовательности нескольких предельных точек противоречило бы, очевидно, монотонности функции f. Таким образом, f(x0 — 0) существует. Аналогично устанавливается существование f(x0 + 0).
Монотонная функция не обязана быт!> непрерывной. Однако верно следующее утверждение.
3.	Множество точек разрыва монотонной функции не более чем счетно.
Действительно, сумма любого конечного числа скачков монотонной функции f на отрезке [а, 6] не превосходит f(b)—f(a). Следовательно, для каждого п число скачков, величина которых больше, чем 1/п, конечно. Суммируя по всем п= 1, 2, ..., получаем, что общее число скачков конечно или счетно.
Среди монотонных функций простейшими являются так называемые функции скачков. Они строятся следующим образом. Пусть на отрезке [а, Ь] задано конечное или счетное число точек
X], х2, ..., хп, ...
МОНОТОННЫЕ ФУНКЦИИ
323
§ 1]
и пусть каждой из них поставлено в соответствие положительное число hn, причем У, hn < °°. Определим функцию f на [a, fe], п
положив
(3) хп<х
Ясно, что эта функция монотонно неубывающая. Кроме того, она непрерывна слева1) в каждой точке, а совокупность ее точек разрыва совпадает с множеством {хп}2), причем скачок в точке хп равен hn. Действительно,
f (х — 0) = lim f (х — е) = lim У, hn, е->0+	в->0+ хп<х-е
но так как каждое хп, удовлетворяющее условию хп < х, удовлетворяет и условию хп < х — е при достаточно малом е, то последний предел равен У hn=f (х). Таким образом, f(x — 0) = хп<* * х
= f(x).
Если точка х совпадает с одной из точек хп, скажем,. х = х„„, то
f (хп<> 4- 0) = lim f (xn, + е) = lim £ hn = £ hn, e^°+	e->0+ xrt<x„o+8 xn<xn,
t. e. f (xn, 4- 0) — f (x„, — 0) = hna.
Наконец, если x не совпадает ни с одной из точек хп, то в ней функция скачков непрерывна (проведите доказательство!).
Простейший тип функций скачков — ступенчатые функции, у которых точки разрыва можно расположить в монотонную последовательность
*1 < Х2 < ... < Хп < ...
В общем случае функция скачков может иметь и более сложную структуру, например, если {хД — множество всех рациональных точек на отрезке [a, b], a hn = 1/2”, то формула (3) определяет функцию скачков, разрывную в рациональных точках и непрерывную в иррациональных.
Другой тип монотонных функций, в некотором смысле противоположный функциям скачков, — непрерывные монотонные функции. Имеет место следующее утверждение.
’) Если бы мы определили f формулой
/(*)= У hn,
хп<х
то получили бы функцию, непрерывную справа.
2) Если ни одна из точек хп не совпадает с Ь, поскольку хп = b не участвует в сумме (3). Чтобы учесть скачок в точке Ь, надо вместо [а,Ь] рассматривать полуинтервал [а, b + е), е >• 0.
324
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
4. Всякую монотонную функцию, непрерывную слева, можно представить как сумму непрерывной монотонной функции и функции скачков (непрерывной слева) и притом единственным образом.
Действительно, пусть f — неубывающая непрерывная слева функция и %1, х2, ... — все ее точки разрыва, a hlt h2, ... — ее скачки в этих точках. Положим
//(%)= hn.
хп<х
Разность <р = f — Н есть неубывающая непрерывная функция. Для доказательства рассмотрим разность
ф (х") - ф (х') = (х") - f (х')] - [Н (х") - Н (х')1,
где х' < х". Здесь справа стоит разность между полным приращением функции f на отрезке [х', х"] и суммой ее скачков на этом отрезке. Ясно, что эта величина неотрицательна, т. е. ф — неубывающая функция. Далее, для произвольной точки х* имеем
<р(х*-0) = /(х*-0)-Я(х*-0) = /(х*-0)- Е hn,
хп<х‘
ф(х* + 0) = /(х’ + 0)-Д(х‘ + 0) = Нх* + 0)- Е hn, Хп<х*
откуда
Ф (х* + 0) — ф (х* — 0) = f (х* + 0) — f (х* — 0) — h* = 0
(где h* — скачок функции Н в точке х*). Отсюда и из непрерывности f и Н слева вытекает, что ф действительно непрерывна.
2. Дифференцируемость монотонной функции. Перейдем теперь к вопросу о существовании производной у монотонной функции.
Теорема 1 (Лебег), Монотонная функция f, определенная на отрезке [а, &], имеет почти всюду на этом отрезке конечную производную.
Прежде всего введем некоторые понятия, которые будут нужны для доказательства этой теоремы.
Как известно, производной функции / в точке хо называется предел отношения
f(x) - f(*о)
X Xq
при х-> х0. Этот предел может, конечно, и не существовать, однако всегда имеют смысл следующие четыре величины (которые могут принимать и бесконечные значения):
Апр — верхний предел отношения (4) при х, стремящемся к х0 справа (т. е. так, что х — Хо>О). Эта величина называется верхним правым производным числом.
§ 1]
МОНОТОННЫЕ ФУНКЦИИ
325
Хпр (нижнее правое производное число) — нижний предел отношения (4) при х->хо справа.
Алев (верхнее левое производное число) — верхний предел отношения (4) при х->хо слева.
ХЛев (нижнее левое производное число) — нижний предел от
ношения (4) при х-*х0 слева.
На рис. 19 показаны прямые с угловыми коэффициентами Апр, Хпр, Алев, Хлев
соответственно. Ясно, что всегда
Хпр Апр И Хлев Алев.
Если Апр и ХПр конечны и равны между собой, то это общее их значение есть правая производная функции f(x) в точке х0. Аналогично, если Алев = Хлев, ТО их общее значение есть левая производная. Существование у f в точке %о конечной производной равносильно тому, что в этой точке все производные числа функции / конечны и равны между собой. Поэтому утверждение теоремы Лебега можно сформулировать следующим функции соотношения
Рис. 20.
образом: для монотонной на [а, ft]
00 < Хлев ХПр Алев-----------Апр ОО
выполнены почти всюду на [а, 6].
Упражнение. Пусть f* (х) =—f(x). Как связаны производные числа для f* с производными числами f?
Ответьте на такой же вопрос при переходе от f(x) к f(—х).
Доказательство теоремы Лебега опирается на приводимую ниже лемму, которой мы будем пользоваться и в дальнейшем.
Введем следующее определение. Пусть g(x)— непрерывная функция, заданная на отрезке а х Ь. Точку х0 этого отрезка мы назовем точкой, невидимой справа для функции g, если существует такая точка g (х0 < g Ь), что g(x0)< g(%) (рис. 20).
Лемма (Ф. Рисе). Для любой непрерывной функции g множество точек, невидимых справа, открыто на отрезке [a, ft] и,
326
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VT
следовательно, представляется в виде суммы конечного или. счетного числа попарно непересекающихся интервалов (ak, bk) (и, возможно, полуинтервала, содержащего точку а). В концевых точках этих интервалов выполнены неравенства
g(ak)^g(bk).	(5>
Доказательство леммы. Если хо — точка, невидимая справа для g, то тем же свойством будет обладать, в силу непрерывности g, и любая точка, достаточно близкая к Хо. Следовательно, множество таких точек открыто на [а, &]. Пусть (ak, bk)—один из составляющих его интервалов. Предположим,, что
g(ak)> g(bk);	(6)-
тогда в интервале (ak, bk) найдется внутренняя точка Хо, в которой g(xa)>g(bk). Пусть х* — самая правая из всех точек х на (ak, bk), в которых g(x) = g(x0).
Поскольку х* е(ak, bk), существует такая точка £ > х*, что-g(£) > g(x*)  Точка £ не может лежать на интервале (ан, bk), так как х* — самая правая точка на этом интервале, в которой g(x) = g(xo), тогда как g(bh) < g(xo)  С другой стороны, неравенство | > bk также невозможно, так как мы имели бы g(bk)< g(xo)< g(s), а Ьь не является точкой, невидимой справа. Полученное противоречие показывает, что неравенство (6) не имеет места, т. е. g(ak) g(bk), и лемма доказана. Читатель без труда проверит, что фактически g(ak) = g(bk), если только а.
Замечание. Назовем точку Хо невидимой слева для непрерывной функции g(x), если существует такое | < х0, что g(£) > >g(x0). Такие же рассуждения показывают, что множество невидимых слева точек есть сумма конечного или счетного числа попарно неперекрывающихся интервалов (ak, bh) (и, возможно,, полуинтервала, включающего точку Ь), причем
g(ak)^g(bk).
Перейдем теперь к доказательству самой теоремы Лебега. Докажем ее сначала в предположении, что f — непрерывная монотонно неубывающая функция. Для доказательства теоремы достаточно установить, что почти всюду
1) АПр оо, 2) Л^ев Апр-
Действительно, если мы положим f*(x)~—f(—х), то f* будет тоже монотонно неубывающей непрерывной функцией, определенной на отрезке [—Ь, —а]. Если Л„р и Z.,en — верхнее правое и нижнее левое производные числа для f*, то, как легко проверить (см. упражнение на стр. 325), производные числа функ-г
3 и
МОНОТОННЫЕ ФУНКЦИИ
32/
ций f и f* в соответствующих точках связаны равенствами Л1'!р = ЛЛев, А,лев = А,пр. Поэтому, применив неравенство 2) к f*(x), получим
Ацр Ллев-	(7)
Соединив полученные неравенства в одну цепочку и используя определение производных чисел, будем иметь
АПр Алев Л-лев АПр АПр, а это и означает, что
Алев == АПр == Алев ’ АПр.
Покажем вначале, что Лпр < оо почти всюду. Если ЛПр = оо в некоторой точке х0, то для любого постоянного С > 0 справа от точки х0 найдется такая точка что
г а)-г(хо) > с £ — *0
т. е.
fa)-f(x0)>ca-x0), или
f®-C£>f(x0)-Cx0.
Иначе говоря, точка х0 оказывается точкой, невидимой справа для функции
g W = f W — Сх.
В силу леммы Ф. Рисса множество таких точек открыто, и на концах составляющих его интервалов (ак, &й) выполнены неравенства
f(ak) — Cak^f(bk) — Cbk, т. е.
f(bJ-f(ak)^C(bk-ak).
Деля на С и суммируя полученные неравенства по всем интервалам (ад, bk), получим
f(b)~f(a)
L (bk -ak)^^--------с----C------С------
k	k
Здесь С можно было взять как угодно большим. Таким образом, множество тех точек, в которых Лпр = оо, можно покрыть интервалами, сумма длин которых сколь угодно мала. Следовательно, мера этого множества равна 0.
Тот же прием, связанный с леммой Ф. Рисса, позволяет доказать, что почти всюду Алев Л[1р, но теперь этот прием придется применить дважды. Рассмотрим пару рациональных чисел г? и С, для которых 0 <Z с <Z С < оо и положим р = с/С. Обозначим через Д, с совокупность тех х, для которых Лпр > С,
328
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
а Хлев < с. Если мы докажем, что цЕс, с = 0, то отсюда будет следовать, что почти всюду ХЛев АПр, так как множество тех точек, где Хлев < АПр, очевидно, представимо в виде суммы не более чем счетного числа множеств вида Ес, с-
Установим теперь основное неравенство.
Для любого интервала (а, 0)с: [а, Ь] имеем
Н(Ес,сП(а> ₽)Хр(₽ —а).
Действительно, прежде рассмотрим множество тех хе (а, 0), для которых Хлев < с. Для всякой такой точки х найдется такое | < х, что	< с, т. е. /(£)— Cg > f(x)— сх. Поэтому х
ъ Х
невидима слева для функции f(x)— сх и по лемме Ф. Рисса (см. замечание на стр. 326) множество таких х представимо в виде суммы не более чем счетного числа непересекающихся интервалов (aft, 0h)c:(a, 0), причем f (ah)— cah f(0а)— c0h, т. е.
f (М — f (aj С с (0* — aj.	(8)
На каждом из интервалов (а&, 0а) рассмотрим множество G* тех х, для которых Апр > С. Снова применяя лемму Ф. Рисса (теперь, как и при доказательстве неравенства Апр < оо, для точек, невидимых справа), мы получим, что Ga представимо в виде суммы не более чем счетного числа непересекающихся интервалов (ahj, и
Ph/-aft/<-^[f(Pft/)-f(aft/)].	(9)
Ясно, что множество Ес, сП (а, 0) покрывается системой интервалов (ahj, 0м), причем в силу (8) и (9) имеем
2 (₽*,- - «а/) < 4- Е - f
k, 1	к, !
< £ [f (Ph) - f (“h)] <	£ (Ph - aft) (0 - a),
h	k
и основное неравенство доказано.
Теперь легко доказать, что цЕс, с = 0.
При этом достаточно использовать только то свойство множества Ес,с, которое описывается основным неравенством.
Лемма. Пусть измеримое множество А на отрезке [а, Ь] таково, что для любого интервала (а, 0)с:[а, выполняется неравенство ц(.4 П (а, 0)) ^ р(0 — а), где 0<р<1. Тогда рА == 0.
Доказател ьство. Пусть цА == t. Для любого е > 0 су» ществует такое открытое множество G, равное сумме счетного числа непересекающихся интервалов (ат, Ьт), что A cz G и
МОНОТОННЫЕ ФУНКЦИИ
329
§ 11
У, (Ьт— ат) < t + е (см. упражнение на стр. 291). Положим т
tm— р [Л Г) (ат, Ьт)]. Ясно, что	По условию леммы,
т
— ат). Следовательно, t С р У (bm — ат) < р (/ + е), и т
так как е>0 произвольно, то t pt. Но 0<р< 1 и поэтому t =-- 0.
Лемма доказана, и тем самым завершено доказательство теоремы 1 в предположении непрерывности функции f.
Те же рассуждения переносятся и на случай разрывной монотонной функции, если воспользоваться обобщением леммы Ф. Рисса на функции с разрывами первого рода.
Пусть g— функция на отрезке [а, Ь], имеющая разрывы только первого рода. Назовем точку хое)а, Ь] невидимой справа для g(x), если существует такое g > х0, что
max [g (х0 — 0), g(x0), g(x0 + 0)] < g(^).
Тогда, как и в случае непрерывной g, множество точек, невидимых справа для g, открыто, и в концах составляющих его интервалов (ak, bh) выполняются неравенства
g(ak)^g(bk).
Хотя доказательство теоремы 1 довольно длинно, сама она имеет простой наглядный смысл. Поясним, например, почему Апр (и ЛЛев) обязано быть конечным почти всюду. Отношение А/7Ах — это «коэффициент растяжения» отрезка [а, Ь] в данной точке х при отображении f. Так как при этом отображении конечный отрезок [а, Ь] превращается в конечный отрезок [f(a),f(b)], то «растяжение» не может быть бесконечным на множестве положительной меры.
Иногда бывает полезна следующая теорема о почленном дифференцировании ряда из монотонных функций, называемая иногда «малой теоремой Фубини».
Теорема 2. Всюду сходящийся ряд
ОО
TJFn(x) = F(x),	(10)
где Fn — монотонно неубывающие функции на [а, Ь], почти всюду допускает почленное дифференцирование-.
оо
Е F'n(x) = F' (х).
гг=1
Доказательство. Заменив Fn(x) на Fn(x) — Fn(a), можно считать, что все Fn(x) неотрицательны и обращаются в нуль при х = а.
330
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ vr
В силу теоремы 1 существует множество полной меры Ecz[a, b], на котором существуют все F„(x) и F' (х). Пусть хе£, а £ е [а, &] произвольно. Имеем
£ {Fn - Fn (х)}
. F^)-F(x)
1~х	1-х
Так как %— х и Fn(£,)—Fn(x) имеют одинаковый знак (монотонность!), то при любом /V
х
2 ’Fn (У - Fn (х)}
&FU)-F(x)
Z-x	g-х
Переходя к пределу при 1,-^х, получаем
Е^'(х)<Г(х). fl=l
Поскольку все /^(х) ^0, отсюда следует, что
(ii> n=l
Итак, ряд из производных F'n{x') сходится всюду на Е. Покажем, что при почти всех х в (11) имеет место знак равенства. Для каждого k найдется такая частичная сумма Snk(x) ряда (10), что
0<F(ft)-$„,(&) <1/2*.
Так как функция F (х) — Sn. (х) = У, Fm(x) — неубывающая, s m>nk
то и при любом X
0<r(x)-S„fc(x)<l/2*,
откуда следует, что ряд
<12>
состоящий из неубывающих функций, сходится (даже равномерно) на всем отрезке [а, 6]. Тогда, по уже доказанному, ряд
(13}
полученный из (12) почленным дифференцированием, сходится почти всюду. Следовательно, общий член ряда (13) почти всюду
§ 1]
МОНОТОННЫЕ ФУНКЦИИ
331
стремится к нулю, т. е. S'nk(x) — F'(x) —>0 почти всюду. Но если бы в неравенстве (11) стоял знак <, то никакая последовательность частичных сумм не могла бы сходиться к F'(x). Следовательно,
оо
Л F'n(x) = F'(х)
п=1
почти всюду. Теорема доказана.
Следствие. Функция скачков имеет почти всюду производную, равную нулю.
Действительно, такая функция есть сумма сходящегося ряда неубывающих «ступеней»:
( 0	при х<х„,
Fn (х> ~ 1 I.
I	при х > хп,
каждая из которых имеет почти всюду равную нулю производную.
3. Производная интеграла по верхнему пределу. Поскольку интеграл
зс
<р (/) dt
от любой суммируемой функции можно представить в виде разности двух монотонных функций, из теоремы 1 сразу вытекает следующий результат.
Теорема 3. Для каждой суммируемой функции <р производная
зс
-^\<v(t)dt а
(14)
существует при почти всех х.
Необходимо подчеркнуть, что, хотя мы и установили существование производной (14) почти всюду, вопрос о равенстве
зс
5 <р (0 dt = <р (х) а
пока не обсуждался. В действительности (см. § 3) это равенство оказывается верным почти всюду для любой суммируемой функции ср.
332
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[гл. vr
§ 2.	Функции с ограниченным изменением
Вопрос о дифференцируемости интеграла Лебега по верхнему пределу привел нас к рассмотрению класса функций, представимых в виде разностей монотонных функций. В этом параграфе мы дадим для этих функций другое описание, не опирающееся на понятие монотонности, и рассмотрим основные их свойства. Начнем с необходимых определений.
Определение 1. Функция f, заданная на отрезке [а, Ь[, называется функцией с ограниченным изменением, если существует такая постоянная С, что, каково бы ни было разбиение отрезка [а, Ь] точками
а = х0 < %] < ... < хп = Ь, выполнено неравенство
п
ZifUJ-ffe-jKc.	о)
А=1
Всякая монотонная функция имеет ограниченное изменение, так как для нее сумма, стоящая в (1) слева, не зависит от выбора разбиения и всегда равна |f(6)— f(a) |.
Определение 2. Пусть f — функция с ограниченным изменением. Точная верхняя грань сумм (1) по всевозможным конечным разбиениям отрезка [а, Ь] называется полным изменением (или полной вариацией) функции f на отрезке [а, Ь] и обозначается Va [/]• Таким образом,
Va[fl = SUP£|f(x4)-f(xfc_1)|.
Л=1
Замечание. Функция f, заданная на всей прямой, называется функцией с ограниченным изменением, если величины ^[Л ограничены в совокупности. При этом
lim У*[Л b “> оо д-> —оо
называется полным изменением функции f на прямой — оо < < х < оо и обозначается [Л-
Установим основные свойства полного изменения функции.
1.	Если а — постоянное число, то
У*1аЛ = |а|Уа1Л-
Это сразу следует из определения Уьа [/].
§21
ФУНКЦИИ С ОГРАНИЧЕННЫМ ИЗМЕНЕНИЕМ
333
2.	Если f и g— функции с ограниченным изменением, то f -ф g тоже имеет ограниченное изменение и
+ + (2)
Действительно, для каждого разбиения отрезка [а, 6].имеем
£ I f Ы + g (xk) — f — g	| <
k
< £ l f W — f Ua-i) 1 + £ l g (xk) — g (xfe_,) i, k	k
откуда, поскольку всегда
sup (Л + В) sup А + sup В, получаем требуемое неравенство.
Свойства 1 и 2 означают, что линейная комбинация функций с ограниченным изменением (определенных на данном отрезке [а, 6]) есть снова функция с ограниченным изменением. Иными словами, функции с ограниченным изменением образуют линейное пространство (в отличие от множества монотонных функций, которые линейного пространства не образуют).
3.	Если а < Ь < с, то
УЬа IЛ + УИЛ = V‘a [/].	(3)
Действительно, рассмотрим сначала такое разбиение отрезка [а, с], в котором b служит одной из точек деления, скажем, хт — — Ь. Тогда
£ I f (Xk) — f (Xfe—j) | = £ | f (xk) — f (xk^) | +
n
+ £ |/(ХА)-/(ХА-1)|<Га[Л + УИЛ. (4) fe=r+ 1
Возьмем теперь произвольное разбиение отрезка [а, с] Ясно, что если к его точкам деления добавить еще одну, именно точку Ь, то сумма
п
£ I Н*а) - I
Я=1
от такого добавления не уменьшится. Следовательно, неравенство (4) выполнено для любого разбиения отрезка [а, с], поэтому
Г1Л<Уа[Л + Г[Л.	(4')
334
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
С другой стороны, для всякого е> О найдутся такие разбиения отрезков [а, б] и [Ь, с], что
oi-f i
И
i
Соединив эти два разбиения, мы получим разбиение отрезка [а, с], для которого
= SI f (<)-[(<_,) |+11 f («;')-[| > v; [fi + V‘t 1Л - s.
I	1
В силу произвольности e > 0 отсюда следует, что
+	(5)
Из (4') и (5) следует (3).
Так как полное изменение любой функции на любом отрезке неотрицательно, то из свойства 3 сразу следует свойство 4:
4.	Функция
v (х) = VXa[f]
монотонно неубывающая.
5.	Если f непрерывна в точке х* слева, то и v непрерывна в этой точке слева.
Действительно, пусть е>0 задано. Выберем б>0 так, что |/(х*)—f(x) | < е/2, как только х* — б < х х*. Далее, выберем разбиение
а = х0 < х{ < ... < хп — х*
так, что п
(6)
ь=1
При этом мы можем считать, что
X* — Хп-у < б
(иначе мы добавили бы еще одну точку разбиения, отчего разность, стоящая в (6) слева, могла бы только уменьшиться), поэтому
I fix*) — f(xn-y) | < е/2
§ 2]
ФУНКЦИИ С ОГРАНИЧЕННЫМ ИЗМЕНЕНИЕМ
335
и, следовательно,
ИГ[Л~ fe=l
Но тогда, тем более,
Va [Л — У1”-1[Л < 8, Т. е. и(х*) — и (%„-]) < е.
Так как v — монотонно неубывающая функция, то отсюда следует, что v(x*)— v(x) < е для всех х таких, что xn-i х х*. А это и означает непрерывность функции о в точке х* слева.
Если f непрерывна в точке х* справа, то, как показывают аналогичные рассуждения, и v непрерывна в этой точке справа. Следовательно, если f непрерывна в некоторой точке {или на всем отрезке [а, Ь]), то непрерывна и и.
Пусть f — произвольная функция на [а, Ь] с ограниченным изменением ио — ее полное изменение на [а, х]. Рассмотрим разность
(p = v — f.
Эта разность представляет собой монотонно неубывающую функцию. Действительно, пусть х' х". Тогда
<р (х") - <р (%') = [и (х") - V (х')] - [/= (х") - f (х')].	(7)
Но всегда
| f (х") - f (х') I < v (х") - v (х') =	[Л,
поэтому правая, а значит, и левая части равенства (7) неотрицательны.
Итак, поскольку f = v — ф, мы получили следующий результат:
Теорема 1. Всякая функция с ограниченным изменением может быть представлена как разность двух монотонно неубывающих функций.
Обратное утверждение очевидно: всякая функция, представимая в виде разности двух монотонных, имеет ограниченное изменение. Поэтому совокупность функций, представимых в виде разности монотонных функций, рассмотренная нами еще в предыдущем параграфе, это и есть совокупность функций с ограниченным изменением.
Из теоремы 1 и установленной в предыдущем параграфе теоремы Лебега о существовании производной у монотонной функции сразу следует, что всякая функция с ограниченным изменением имеет почти всюду конечную производную.
336
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
Перейдя от монотонных функций к функциям с ограниченным изменением, полезно следующим образом обобщить введенное выше понятие функции скачков. Пусть xt, х2, . . . , хп,  • • — конечное или счетное множество точек на [а, 6]. Поставим в соответствие каждой из этих точек хп два числа gn и hn так, что
Е (I gn 1 + 1 hn\) < оо. п
Предположим, кроме того, что если хп = а, то gn — 0, а если хп = Ь, то hn = 0.
Положим
Ф(х) = Е £n+ Е hn.	(8)
хп<х	хп<х
Мы будем называть теперь функциями скачков любые функции вида (8). Полное изменение функции ф(х) равно, очевидно,
Е (I gn l + l hn I). п
Точками разрыва функции (8) служат те хп, для которых хотя бы одно из чисел gn, hn отлично от нуля; при этом
ф(х„)- t(x„-0) = g„, Ф(хп + 0)-ф(х„) = /г„.
Теперь легко получается следующее утверждение, обобщающее утверждение 4 п. 1 предыдущего параграфа.
Всякая функция f с ограниченным изменением, определенная на [а, Ь], может быть представлена и притом единственным образом в виде
f — <р + ф,
где <р непрерывна, а ф— функция скачков.
Упражнения. 1. Если f имеет на [а, Ь] ограниченную производную (т. е. f'(x) существует всюду и |f'(x) | < С), то f — функция с ограниченным изменением, причем
2, Пусть f (х) = х sin Е при х 0 и ЦО) = 0. Показать, что изменение функции f на [0, 1] бесконечно.
Постоянные, и только они, представляют собой функции, полное изменение которых равно 0. Положим
II/11= На И-
Величина Vba [/] обладает свойствами 2) и 3) нормы (см. стр. 139), но не свойством 1). Если рассмотреть только функции, удовлетворяющие дополнительному условию [(a) = 0, то
§ 3]	ПРОИЗВОДНАЯ НЕОПРЕДЕЛЕННОГО ИНТЕГРАЛА ЛЕБЕГА	337
они также образуют линейное пространство, в котором величина Va[f] обладает уже всеми свойствами нормы. Пространство V°[a, Ь] функций с ограниченным изменением на [а, Н удовлетворяющих условию f(a) = O, с обычными определениями сложения и умножения на числа и с нормой
11/11= УаШ,
называется пространством функций с ограниченным изменением. (Докажите полноту этого пространства.)
Упражнение. Докажите, что II f II = I f (а) I + [Л является нормой в пространстве всех функций с ограниченным изменением на отрезке [а, Ь] и докажите полноту этого пространства.
§ 3. Производная неопределенного интеграла Лебега
В § 1 мы показали, что интеграл Лебега
J f (t) dt а
как функция от х имеет почти всюду конечную производную. Однако мы пока еще не выясняли, как связана эта производная с подынтегральной функцией. Сейчас мы установим следующий результат, упомянутый в конце § 1.
Теорема 1. Для всякой суммируемой функции f почти всюду имеет место равенство
X
dt = f(x).
а
Доказательство. Положим
Ф (х) = f (/) dt. а
Покажем вначале, что почти всюду
Г(х)>ф'(х).
Если f(x)< Ф'(х), то найдутся такие рациональные числа а и р, что
/ (х) < а < 0 < Ф'(х).	(1)
Пусть Еа$— множество тех точек, в которых выполнено неравенство (1). Оно измеримо, поскольку f и Ф' измеримы. Покажем, что мера каждого из множеств равна нулю. Так как
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
зав
число этих множеств счетно, то отсюда будет следовать, что
Н {х : f (х) < Ф' (х)} = 0.
Пусть е > 0 произвольно и пусть б > 0 таково, что
\f(t)dt <6, е
как только р(е)< б (такое б существует для любого е в силу абсолютной непрерывности интеграла; см. гл. V, § 5, теорема 5). Выберем теперь открытое множество G cz [а, б] так, что
G => Еа(1 и р (G) < р (Еар) + б
(см. упражнение на стр. 291). Если	то
ф(£) —Ф(х)	.
-----------> 0	(2)
для всех £ > х, достаточно близких к х. Записав неравенство (2) в виде
Ф(?)-Га>Ф(х)-рх,
получаем, что точка х — невидимая справа для функции Ф(х) — — 0х на любом из составляющих интервалов множества G. Используя лемму Ф. Рисса, мы можем поэтому указать такое открытое множество S = (J (ак, 6*), состоящее из непересекающихся к
интервалов, что cz S cz G и
Ф(М —₽^>Ф(Ой) —т. е. Ф (6J — Ф (afe) > Р (6fe — аД
или
Ьк
$ /(/)<#> Р (6* — ak). ak
Суммируя такие неравенства по всем интервалам (ак, bh), составляющим S, получаем
J f (/) dt рр (S).	(3)
з
В то же время
/ (/) dt = f(t) dt-j- $ f (/) dt < ар (Eaf}) + e
s	£ap	£ap
< ap (S) + e +1 a 16.	(4)
§ 4]	ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ	339
Сравнивая (3) и (4), получаем
аИ (S) + е 4- | а 16(S),
Таким образом, множество Еар можно заключить в открытое множество сколь угодно малой меры (мы можем считать, например, что |а|6<: е), а это и означает, что ц(Еар) = 0. Итак, мы показали, что
^(х)>Ф'(х)
почти всюду. Заменив f(x) на — f(x), мы таким же путем получим, что почти всюду
— / (х) > — Ф'(х), т. е. [(х)^.Ф'(х)
и, следовательно, почти всюду
X f(x)=-.0'(x) = -^\f(t)dt. а
§ 4. Восстановление функции по ее производной. Абсолютно непрерывные функции
Итак, мы решили первый из поставленных в начале этой главы вопросов, установив равенство
X
dt = f W (почти вс юду) а
для любой суммируемой на [а, Ь] функции f. Рассмотрим теперь второй из сформулированных там вопросов, т. е. выясним, как обобщается на случай интеграла Лебега формула Ньютона — Лейбница
X
F(x) = F(a)+ J F'(t)dt,	(1)
а
хорошо известная в случае непрерывно дифференцируемых функций из элементарного анализа.
Естественно ограничиться рассмотрением функций F, заведомо дифференцируемых почти всюду (иначе равенство (1) просто не имеет смысла). Как мы уже знаем, такими, в частности, являются функции с ограниченным изменением.
С другой стороны, интеграл, стоящий в (1) справа, есть функция с ограниченным изменением. Поэтому равенство (I) не
340
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. vr
может быть верно для более широкого класса функций. Поскольку всякая функция с ограниченным изменением есть разность двух монотонно неубывающих, то именно монотонные функции и нужно рассмотреть в первую очередь.
Однако для произвольных монотонных функций равенство (1), вообще говоря, не имеет места. Вместе с тем справедлива следующая теорема.
Теорема 1. Производная f' монотонно неубывающей функции f суммируема и
ь
\f'(x)dx^f(b)-f(a). а
Доказательство. По определению, производная функции f в точке х есть предел отношения ’)
(2)
при й->0. Из монотонности f вытекает ее суммируемость, а значит, и суммируемость каждой из функций фп. Поэтому равенство (2)	можно	проинтегрировать.	Получаем
b	b	ь
<pA(x)*Zx==-Jr J	f (x + h)dx—	1 J f(x)dx =
a	a	a
b+h	a+h
—4 J f(x)dx.
b	a
Стоящее справа выражение при	стремится к f(b) —
— f(a-}-0). (Докажите!) Поэтому, применив теорему Фату (гл. V, § 5, теорема 8), мы получаем
ь	ь
( f' (х) dx lim ( фл (х) dx — f (b) — f (a -f- 0)< f (b) — f (a)
aJ	л-*° aJ
(само существование интеграла от f' также обеспечивается теоремой Фату).
Теорема доказана.
Нетрудно привести пример монотонной функции, для которой имеет место строгое неравенство
ь
^f'(x)dx <f(b) — f(a).
а
') Чтобы выражение Дх + Л) имело смысл при любом х s [a, Z>], можно считать, что Дх) = f(b) при х > b и Д<) = Да) при х < а.
§ 4]
ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ
341
Достаточно положить
Г о f(x) = ( !
при
0<х< 1/2.
при
1/2 <х
1.
Интересно, однако, что существуют непрерывные монотонные функции, для которых строгое неравенство
$ f' (/) dt < f (х) — f (а) а
выполнено при всех х > а. Вот один из простейших примеров. Рассмотрим на отрезке [0, 1] канторово множество и определим f сначала на его смежных интервалах, положив	"	_
А> = 1, 2, 3..2"-1
на fc-м смежном интервале n-го ранга (включая и его концы). (Интервалы нумеруются слева направо). Следовательно,
f(/)=l/2 при 1/3 </<2/3,	О
при 1/9 </<2/9, /(0 = 3/4 при 7/9 </<8/9
—1---------1__________L
2	Л	f
з з
Рис. 21.
и т. д. (рис. 21). Таким образом, / определена на отрезке [0, 1] всюду, кроме точек второго рода канторова множества (т. е. точек, не принадлежащих ни смежным интервалам, ни совокупности их концов). Доопределим теперь f в этих оставшихся точках следующим образом. Пусть /*— одна из таких точек и пусть (/п) — сходящаяся к ней возрастающая последовательность точек первого рода (т. е. концов смежных интервалов). Тогда существует предел
Нт / (/„);	(3)
П->оо
аналогично, существует и предел
lim/(/'),	(4)
П->оо
если {/„}—убывающая последовательность точек первого рода, сходящаяся к /*, причем пределы (3) и (4) равны между собой. Приняв это общее значение за /(/*), мы получим монотонную функцию, определенную и непрерывную на всем отрезке [0, 1), называемую «канторовой лестницей». Ее производная равна^
342
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
(ГЛ. VI
очевидно, нулю в каждой точке любого смежного интервала, т. е. почти всюду. Следовательно, для этой функции имеем
X
O=\f'(t)dt<f(x)-f(O) = f(x) &
при любом х из полуинтервала 0 < х 1.
Отметим попутно, что в случае монотонной f(x) равенство
Ь	х
j f' (/) dt = f (б) — f (а) влечет равенство f' (t) dt= f (x) — f (a) a	a
при любом x из полуинтервала а < х Ь.
Чтобы описать класс функций, для которых имеет место равенство ь
введем следующее определение.
Определение 1. Функция f, заданная на некотором отрезке |а, 6], называется абсолютно непрерывной на нем, если для любого е > 0 найдется такое б > О, что, какова бы ни была конечная система попарно непересекающихся интервалов
(ak, Ьк), k=l, 2, п
с суммой длин, меньшей б,
S (!>к — ак) < б, ы
выполнено неравенство
п
S I f - f (ак) | < e.
k=t
Ясно, что всякая абсолютно непрерывная функция равномерно непрерывна. Обратное, вообще говоря, неверно, например: описанная выше «канторова лестница» непрерывна (а значит, и равномерно непрерывна) на отрезке [0,1], однако она не абсолютно непрерывна. Действительно, канторово множество можно покрыть конечной системой интервалов (а*, &а), k = 1, 2, . . . , п, сумма длин которых сколь угодно мала. Зместе с тем для каждой такой системы интервалов выполнено, очевидно, равенство
п
fe=l
§ 41
ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ
343
Укажем основные свойства абсолютно непрерывных функций.
1.	Заметим прежде всего, что в определении 1 можно вместо любой конечной системы интервалов с суммой длин < 6 рассматривать любую конечную или счетную систему интервалов, сумма длин которых <6. Действительно, пусть для данного е > 0 мы выбрали б > О так, что
t I f(bk) - f(ak) | < в
*=•-1
для любой конечной системы интервалов (ак, Ьк), удовлетворяющей условию
Е (Ьк — ак) < б,
k=\
и пусть (ось, рй) — счетная система интервалов с суммой длин, не превосходящей б. Тогда при любом п имеем
t IHPJ - f(afe) I < е;
переходя здесь к пределу при п->оо, получаем
оо
Е I f (М - f Ы К е.
*=|
2.	Всякая абсолютно непрерывная функция имеет ограниченное изменение.
Действительно, абсолютная непрерывность функции f на отрезке [а, б] означает, в частности, что для каждого е > 0 можно б > 0 выбрать так, что полное изменение функции f на отрезке длины < б будет не больше, чем е. Поскольку отрезок [а, Ь] можно разбить на конечное число отрезков длины <б, то и полное изменение функции f на [а, Ь\ конечно.
3.	Сумма абсолютно непрерывных функций и произведение такой функции на число суть абсолютно непрерывные функции.
Это сразу вытекает из определения абсолютной непрерывности и свойств модуля суммы и произведения.
Свойства 2 и 3 означают, что абсолютно непрерывные функции в пространстве всех') функций с ограниченным изменением образуют линейное многообразие.
4.	Всякая абсолютно непрерывная функция может быть представлена как разность двух абсолютно непрерывных неубывающих функций.
>) См. упражнение на стр. 337.
344
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
Действительно, абсолютно непрерывная функция, как всякая функция с ограниченным изменением, может быть представлена в виде
f — v — g, где
vW=Va[f] И g (х) = V (х) — f (х)
— неубывающие функции. Покажем, что каждая из этих двух функций абсолютно непрерывна. Достаточно проверить это для V. Пусть е > 0 задано. Выберем б > О для этого е так, как это диктуется абсолютной непрерывностью функции f. Возьмем систему п интервалов (a*, bk) с суммарной длиной меньше, чем б, и рассмотрим сумму
Е (v(bk)-v(ak)). fe=i
(5)
Эта сумма представляет собой точную верхнюю грань чисел п mk
Е ElffeJ-/(**./-1)1	(6)
k=l 1=1
по всевозможным конечным разбиениям
Й1 — Х1>0 <Х[, j <Х),2 <
• •• < X|.mi = bh
й2 --х2, 0 < Х2, 1 < Х2, 2 <'-
&п Хп, 0 < хп, 1 < Хп, 2 <
< х2, mi — Ь2,
<"
п, тп ип
интервалов (ai,&i), ..., (ап, Ьп). Так как сумма длин всех интервалов (Xk, i-i, xk, i), по которым берется сумма (6), не превосходит б > 0, то каждая из сумм (6) не больше, чем е. Следовательно, и сумма (5), — их точная верхняя грань, — не больше, чем е.
Следующие две теоремы устанавливают тесную связь между понятием абсолютной непрерывности и неопределенным интегралом Лебега.
Теорема 2. Функция
X F(x)=\f(t)dt, а
представляющая собой неопределенный интеграл суммируемой функции, абсолютно непрерывна.
§ 4]	ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ	345
Доказательство. Если {(а*, б*)}— какая-либо система непересекающихся интервалов, то
п	п bk	k bk
^|Е(бА)-Е(аД| = £ \f(t)dt \	=
k=l	£=1	k~l
= J
U (ak' bk) k
в силу абсолютной непрерывности интеграла Лебега последнее выражение стремится к нулю, когда суммарная длина интервалов (as, bk) стремится к нулю.
Теорема 3 (Лебег). Производная f — F' абсолютно непрерывной функции, заданной на отрезке [а, 6], суммируема на этом отрезке и для каждого х (а х Ь)
X
\f(t)dt = F(x)-F(a). а
Теоремы 2 и 3 показывают, что абсолютно непрерывные функции, и только они, восстанавливаются с точностью до постоянного слагаемого по своей производной с помощью операции интегрирования.
Для доказательства теоремы 3 нам понадобится следующая лемма.
Лемма. Если производная абсолютно непрерывной монотонно неубывающей функции f равна 0 почти всюду, то эта функция — постоянная.
Доказательство леммы. Пусть f задана на [а, Ь]. Так как f — непрерывная монотонная функция, то ее область значений есть отрезок [f (а), f (b)]. Покажем, что длина этого отрезка равна нулю, если f (х) = О почти всюду. Тем самым лемма будет доказана. Разобьем множество точек отрезка (а, Ь] на два класса: множество Е тех точек, в которых f'(x)=O, и Z— его дополнение. По условию леммы ц(2) = 0. Выберем некоторое е > 0, найдем то б > О, которое отвечает этому е в силу абсолютной непрерывности функции f, и заключим Z в открытое множество, мера которого меньше б (это возможно, поскольку |i(Z) = 0). Иначе говоря, Z покрывается конечной или счетной системой интервалов (a*, bk), сумма длин которых меньше б. В соответствии с выбором б получаем
11Ж)-/Ю1<8.
k
Следовательно, вся система интервалов (а^, bk) (а тем более, и заключенное в их сумме множество Z) переводится функцией f
316
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
з множество, мера которого меньше е. Таким образом, |x(/(Z)) = 0.
Рассмотрим теперь множество Е = [а, &] \ Z. Пусть Хо е Е. Тогда, поскольку Г(х0) = 0, для всех х, достаточно близких к х0, выполнено неравенство
f (х) — f (х0) х — х0
т. е. (мы считаем для определенности, что х > х0)
f(x) — f(x0) < е(х — х0) или
ex0 — f(x0) < ex — f(x);
таким образом, х0 есть точка, невидимая справа для функции g(x)= ex— f(x). Следовательно, по лемме Ф. Рисса, множество Е содержится в конечной или счетной системе непересекающих-ся интервалов (а*, Р/г), в концах которых выполняются условия е₽,г — f (Pt) > eak — f (aft), т. e.
f (PJ — f (aJC e — aft), откуда
E (f (PJ — f (aJ) < eE (Pi ~	e(& — a).
k	k
Иначе говоря, множество E переводится функцией f в множество, покрывающееся системой интервалов, сумма длин которых меньше е(Ь — а). Ввиду произвольности е отсюда следует, что И(/(£)) = О.
Итак, и f(E) и f(Z) имеют меру нуль. Но в сумме эти два множества составляют отрезок [f(a),f(&)]. Тем самым доказано, что длина этого отрезка есть нуль, т. е. что f(x) — const.
Теперь уже легко доказывается и сама теорема 3. Достаточно ограничиться случаем, когда функция F(x) не убывает. В этом случае X
Ф(х) = К(х)- \f(t)dt	(7)
а
представляет собой функцию, тоже монотонно неубывающую. Действительно, если х" > х', то по теореме 1 х"
Ф (х") - Ф (х') = F (х") - F (х') - j f(t) dt > 0.
Кроме того, Ф абсолютно непрерывна (как разность двух абсолютно непрерывных функций) и Ф'(х) = 0 почти всюду (соглас
§ 41	ВОССТАНОВЛЕНИЕ ФУНКЦИИ ПО ЕЕ ПРОИЗВОДНОЙ	347
но теореме 1 § 3). Поэтому в силу леммы Ф есть константа. Положив в (7) х = а, получаем, что эта константа равна F(a).
Теорема доказана.
Мы видели выше, что всякую функцию f с ограниченным изменением можно представить как сумму функции скачков Н и непрерывной функции <р с ограниченным изменением (стр. 336),
f = Н +<р.
Рассмотрим теперь непрерывную, но не абсолютно непрерывную функцию с ограниченным изменением и положим
X
ф (х) = j q/ (/) dt. а
Разность
Х = Ф
представляет собой непрерывную функцию с ограниченным изменением. При этом
^х(*) = ф' (*) —	л==0
а
почти всюду.
Назовем непрерывную функцию с ограниченным изменением сингулярной, если ее производная равна нулю почти всюду. Мы можем теперь сформулировать следующий результат:
всякая функция с ограниченным изменением может быть представлена в виде суммы трех компонент
f = H + + x	(8)
— функции скачков, абсолютно непрерывной функции и сингулярной функции.
Нетрудно показать, что каждое из слагаемых в разложении (8) определяется самой функцией f однозначно с точностью до константы. Если функции, входящие в равенство (8), нормировать, потребовав обращения двух из них в нуль в точке х = а, то разложение (8) будет уже в точности единственным. Продифференцировав равенство (8), мы получим, что почти всюду
Г (х) = ф' (х)
(поскольку Н' и х' равны нулю почти всюду). Следовательно,, при интегрировании производной от функции с ограниченным изменением восстанавливается не сама эта функция, а только ее абсолютно непрерывная компонента. Две другие компоненты (функция скачков и сингулярная) при этом «бесследно исчезают».
348
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
Поучительно сравнить результаты этого параграфа с тем, что дает теория обобщенных функций. Как и в гл. IV, будем понимать под обобщенной функцией линейный непрерывный функционал над пространством К финитных бесконечно дифференцируемых функций. При этом обычной локально суммируемой функции f сопоставляется функционал, действующий на ОО
элементы по формуле (f, ф)= f(x)q>(x)dx. Обобщенной производной от этого функционала служит функционал, ставящий в соответствие элементу (ре К число (f', ср) = со
= — j f (х) ф' (х) dx. Так как в классе обобщенных функций уравнение у' == 0 имеет только обычные решения (константы), то всякая обобщенная функция с точностью до константы восстанавливается по своей производной. В частности, всякая локально суммируемая функция f с точностью до константы почти всюду восстанавливается по своей обобщенной производной f'. Предположим теперь, что функция f почти всюду имеет производную, например, f—монотонная функция. Обозначим через fi = df/dx обычную производную функции f. (Мы уже видели, что df/dx может равняться 0 почти всюду, хотя f(x)^ const!) Функция df/dx является локально суммируемой (мы предполагаем, что f монотонна) и, следовательно, мы можем сопоставить этой функции функционал (обобщенную функцию) ОО
(f1,<p)=	-^-(p(x)dx. Существенный факт состоит в том, что
обобщенная функция fi, вообще говоря, не совпадает с обобщенной функцией f'. Например, если
( 1 при х > О,
(0 при х ^0,
то fi = 0, a f' = 6 (см. пример 1 стр. 205—206).
Теорема 3, собственно говоря, и означает, что среди всех функций с ограниченным изменением для абсолютно непрерывных функций (и только для них!) производная, понимаемая в обычном смысле, совпадает с обобщенной производной той же функции.
Здесь мы снова сталкиваемся с тем положением, о котором уже говорилось в § 4 гл. IV: для выполнимости основных операций анализа (в данном случае речь идет о восстановлении функции по ее производной) нужно или, оставаясь в рамках классических определений, ограничиться достаточно узким запасом
§ 5]
ИНТЕГРАЛ ЛЕБЕГА КАК ФУНКЦИЯ МНОЖЕСТВА
349
функций (абсолютно непрерывными), или же, наоборот, существенно расширить понятие функции (расширив при этом и определение производной).
Упражнения. 1. Показать, что определение абсолютной непрерывности, сформулированное выше, равносильно следующему: f абсолютно непрерывна на [а, &], если она каждое подмножество меры нуль этого отрезка
переводит снова в множество меры нуль.
2. Найти обобщенную производную «канторовой лестницы».
3. Пусть f — функция с ограниченным изменением, /' — ее обобщенная производная и f\— функционал (обобщенная функция), определяемый «обыч
ной» производной — функции f. Доказать, что
а)	если f абсолютно непрерывна, то /' = /г,
б)	если f = fi, то f(x) эквивалентна абсолютно непрерывной функции, т. е. совпадает с такой функцией почти всюду. В частности, если f' = f\ и f непрерывна, то и f абсолютно непрерывна.
§ 5. Интеграл Лебега как функция множества. Теорема Радона—Никодима
1. Заряды. Разложение Хана и разложение Жордана. Понятия и факты, изложенные в предыдущих параграфах для функций на прямой, распространяются в значительной степени и на функции, заданные на произвольном пространстве с мерой.
Пусть X— некоторое пространство с (конечной) мерой ц и /" — суммируемая по ц функция на X. При этом / будет суммируема на каждом измеримом подмножестве А множества X и, следовательно, интеграл
Ф(Д)=$/(хНи	(1)
А
(с фиксированной /) представляет собой функцию множества, определенную и о-аддитивную на о-алгебре всех измеримых множеств пространства X. Таким образом, для любого разложения
А = U 4 k
измеримого множества А в конечную или счетную сумму попарно непересекающихся измеримых множеств выполнено равенство Ф(А) = £ф(4).
k
Иначе говоря, функции Ф, определенная равенством (1), обладает всеми свойствами о-аддитивной меры, за исключением, быть может, неотрицательности. (При неотрицательной / неотрицательна и Ф.)
Определение I. Произвольная (конечная) о-аддитивная функция множества Ф, определенная на некоторой о-алгебре
350
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
подмножеств данного пространства X, называется знакопеременной мерой, или, короче, зарядом.
Понятие заряда служит естественным обобщением понятия о-аддитивной меры и, как мы увидим ниже, сводится в определенном смысле к этому понятию.
Упражнение. Доказать, что для любого (конечного) заряда Ф, заданного на а-алгебре множеств существует такая константа с, что |Ф(Д) | с при всех .4 ей.
Если рассматривается реальный электрический заряд, расположенный, скажем, на некоторой поверхности, то эту поверхность можно разделить на две области: несущую положительный заряд (т. е. такую, что любая ее часть заряжена положительно) и несущую отрицательный заряд. Математическим эквивалентом этого факта служит приводимая ниже теорема 1.
Введем предварительно следующую терминологию. Пусть Ф — заряд, определенный на о-алгебре <5 подмножеств пространства X. Множество Ее® называется отрицательным относительно Ф, если Ф(ЕПЕ)^0 для любого Ее®; аналогично Е называется положительным, если Ф(ЕГ\ F)^ 0 для всех FeS.
Теорема 1. Если Ф — заряд, определенный на X, то существует такое измеримое множество A~czX, что А~ отрицательно и А+ — X \ А~ положительно (относительно Ф).
Доказательство. Положим а = inf Ф(Л), где нижняя грань берется по всем отрицательным множествам А. Пусть {Л„}—такая последовательность отрицательных множеств, что
lim Ф (Л„) = а. п-> 00
Тогда А~ = J Ап представляет собой, как легко видеть, такое п
отрицательное множество, что
ф(Л") = а.
Покажем, что А~ и есть искомое множество, т. е. покажем, что
Л+ = Х \ А~
положительно. Пусть это не так, т. е. пусть Л + содержит такое измеримое подмножество Со, что Ф(С0)<0. При этом множество Со не может быть отрицательным, так как иначе мы присоединили бы его к Л" и получили бы отрицательное множество А, для которого
Ф (Л) < а,
ИНТЕГРАЛ ЛЕБЕГА КАК ФУНКЦИЯ МНОЖЕСТВА
351
§ 51
что невозможно. Поэтому существует такое наименьшее целое число k{, для которого в Со найдется подмножество Сь удовлетворяющее условию
Ф(С,)> I/fe,.
Разумеется, Ci =И= Со. Для множества С0\С! можно повторить рассуждение, проведенное для Со; мы получим множество С2, удовлетворяющее условию
Ф(С2)>1/62 (62>М
и т. д. Наконец, положим
£о = Со \ U Cz. 1=1
Множество Со не пусто, так как Ф(Со)<0, а Ф(Сг)>0 при Из построения следует, что Со отрицательно. Поэтому, присоединив его к А~, мы снова приходим к противоречию с определением а. Следовательно, для всех измеримых £czX\H" имеем
Ф(£)>0,
т. е. Х\ А~ положительно.
Теорема доказана.
Разбиение пространства X на отрицательную часть А~ и положительную А+ называется разложением Хана.
Разложение Хана, вообще говоря, не единственно, однако если
X = Al U Л|+ и X = А2 U Аг”
— два таких разложения, то для всякого
Ф(СПАГ) = Ф(£П <) и Ф(сПАО = Ф(£ПА2+).	(2)
Действительно, СП(АГ\А2“)<=£П4Г,	(3)
откуда следует, что Ф(£П (АГ \ АГ)) <0. В то же время
СП(АГ\А2-)<=£ПА2+,	(4)
откуда ф(£ П (АГ\АГ))^0. Таким образом, ф(£ П (АГ\АГ))=0. Аналогично получаем Ф(£П(АГ \ АГ))=0. Отсюда следует, что
Ф(£ПАГ) = Ф(£ПА2-).
352
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
Точно так же доказывается и второе из равенств (2).
Таким образом, на S заряд Ф однозначно определяет две неотрицательные функции множества, а именно:
Ф+ (£) = ф(£ П Л+),
Ф"(£) = - Ф(£П/Г), называемые соответственно верхней вариацией и нижней вариацией заряда Ф. При этом, очевидно, 1) ф = ф+ — ф-,
2) Ф+ и Ф_ представляют собой неотрицательные о-аддитиз-ные функции множества, т. е. меры.
Мерой будет, очевидно, и функция |Ф| = Ф+4- Ф"; она называется полной вариацией заряда Ф, а представление Ф в виде разности верхней и нижней вариаций называется разложением Жордана этого заряда Ф.
Замечание. Мы рассматривали сейчас конечные заряды, т. е. такие функции Ф, значения которых ограничены как сверху, так и снизу (см. упражнение на стр. 350). При этом Ф+ и Ф' — конечные меры. Сказанное выше можно обобщить на заряды, ограниченные лишь с одной стороны, т. е. такие, для которых хотя бы одна из величин зирФ(Л) и т!Ф(Л) конечна.
2. Основные типы зарядов. Пусть р. — некоторая « аддитивная мера, определенная в пространстве X на некоторой «-алгебре S. Множества, входящие в S, мы будем называть измеримыми. Введем следующие понятия.
Мы скажем, что заряд Ф, определенный на множествах £eS, сосредоточен на измеримом множестве Ао, если Ф(£) =0 для каждого £c.Y\/1o. Множество Ао называется при этом носителем заряда Ф.
Заряд Ф называется непрерывным, если Ф(£)=0 для любого одноточечного множества £. Заряд Ф называется дискретным, если он сосредоточен на некотором конечном или счетном множестве. Иными словами, дискретность заряда означает существование такого конечного или счетного множества точек <?!, с2..сп,    что для каждого £ cz X
Ф(£)= Z Ф(^).
Заряд Ф называется абсолютно непрерывным (относительно данной меры ц), если Ф(Л)= 0 для всякого измеримого А, для которого ц(Л) = 0.
Заряд Ф называется сингулярным (относительно меры ц), если он сосредоточен на некотором множестве нулевой ц-меры. Ясно, что если заряд одновременно абсолютно непрерывен и сингулярен относительно ц, то он нулевой.
ИНТЕГРАЛ ЛЕБЕГА КАК ФУНКЦИЯ МНОЖЕСТВА
353
§ q
3. Абсолютно непрерывные заряды. Теорема Радона—Никодима. Примером заряда, абсолютно непрерывного относительно данной меры ц, может служить интеграл Лебега
Ф(А)= \f(x)dn
А
от фиксированной суммируемой функции f, рассматриваемый как функция множества. Оказывается, что этим и исчерпываются все абсолютно непрерывные заряды. Иначе говоря, справедлива следующая теорема.
Теорема 2 (Радон —Никодим). Пусть ц— некоторая конечная о-аддитивная мера, определенная на о-алгебре S подмножеств из X, а Ф — заряд, определенный на той же о-алгебре и абсолютно непрерывный относительно ц. Тогда существует такая суммируемая по ц функция f на X, что
Ф(А)= \f(x)dn
А
для каждого измеримого А. Эта функция, называемая производной заряда Ф по мере ц, определяется однозначно, с точностью до ^-эквивалентности.
(Две функции называются ^-эквивалентными, если они совпадают почти всюду относительно меры ц).
Доказательство. Каждый заряд можно представить как разность двух неотрицательных (см. п. 1), при этом абсолютно непрерывный заряд представляется как разность абсолютно непрерывных. Поэтому доказательство теоремы достаточно провести для неотрицательных зарядов, т. е. для мер. Итак, пусть Ф — мера, абсолютно непрерывная относительно данной меры ц. Докажем следующую лемму.
Лемма. Пусть мера Ф абсолютно непрерывна относительно ц и не равна нулю тождественно. Тогда существуют такое п и такое измеримое множество В, что р(В)>0 и В положительно по отношению к заряду Ф —
Доказательство леммы. Пусть X = U А„ — разложение Хана, отвечающее заряду Ф — ц, п = 1, 2...и пусть
Ао == А А~, л(+ - U /£.
п=1	П=1
Тогда
ф(А0-)^ц(А0-) при всех п,
354
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
т. е. ф(Ло")==О и, следовательно, Ф(Л<?')>0, а значит, и ц(Ло")>О(в силу абсолютной непрерывности Ф по ц). Поэтому найдется такое п, что ц(Л^)>0. Это п и множество В = А„
удовлетворяют условиям леммы.
Перейдем теперь непосредственно к доказательству ремы. Пусть К. — множество функций f на X, обладающих дующими свойствами: f неотрицательны, интегрируемы по \ f (х) dii Ф (Л) для всякого измеримого А. Пусть
f(x)dn по всем fe/C (.
тео-сле-ц и
Возьмем последовательность функций {fn} из К такую, что lim \fn(x)dn = M.
Положим
g„(x) = max(f1(x), f2(x),
Покажем, что gn е К, т. е., что для всякого измеримого Е
Е
Действительно, Е можно представить в виде пересекаются и gn{x) = fk(x) на Ek; поэтому
п
и Ek, где Elt не А=1
п	п
Е	k=l Ek	fe=I
Положим
f (X) = sup{f„ (x)J.
Ясно, что при этом f(x)= lim gn(x) и, следовательно, по тео п->°°
реме Б. Леви,
\ f (х) d[i — lim \ gn (х) du = М.
J	Л->оо J
Покажем теперь, что
Ф(£)- J /(х)с?ц = 0.
Е
§ 5]	ИНТЕГРАЛ ЛЕБЕГА КАК ФУНКЦИЯ МНОЖЕСТВА	355
По построению, функция множества
Х(£) = Ф(£)- \
Е
неотрицательна и обладает всеми свойствами меры. Кроме того, она абсолютно непрерывна относительно ц. Если А.^0, то в силу леммы найдутся такое е>0 и такое В, ц(В)>0, что
е.и(£ПВ)^Х(ЕПВ)
для любого измеримого Е. Тогда, положив h(x) = f(x) + ехв(х), где хв — индикатор множества В, мы получили бы для любого измеримого Е
h(x)dp = $ f(x)cU + e.i(£DB)^ J f(x)dp. + Ф(£рВ)^Ф(£).
E	E	E\B
Это означало бы, что функция h принадлежит определенному выше множеству К. Но в то же время
h (х) dp = f (х) dp + е i (В) > М, х	х
а это противоречит определению М. Итак, существование такой функции f, что
Ф(Л)=ф(х)г/И,
А доказано. Покажем ее единственность. Если для всех Ле®
ФИ) = fi (х) dp = f2(x) dp, А	А
то при любом п для множеств
Л„ = {х : f2(x) — (х)> !/«} имеем
ц (Л„) П $ (f, (х) — f2 (х)) dp = 0.
Ап
Аналогично, для Вт — {х : (х) — f2 (х) > Цт} имеем
ц(Вт) = 0.
Так как
{х:Л(х)=#^2(х)} = (уЛ)и(У Вт), то
n{x:fi(x)=#f2(x)} = 0,
т. е. fj (X) = f2(x) почти всюду. Доказательство закончено.
356
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
Замечание. Теорема Радона — Никодима представляет собой, очевидно, естественное обобщение теоремы Лебега о том, что абсолютно непрерывная функция есть интеграл от своей производной. Однако, в то время как при рассмотрении функций на прямой у нас есть эффективный способ нахождения производной— вычисление предела отношения Д/ к Дх, теорема Радона — Никодима лишь устанавливает существование производной г/Ф/б/ц абсолютно непрерывного заряда Ф по мере р, по не дает способа для ее вычисления. Такой способ можно указать, но мы не будем на этом останавливаться. В Общих чертах он состоит в вычислении предела отношения Ф(4)/ц(Д) по некоторой системе множеств, «стягивающихся» в определенном смысле к данной точке. Детально эти вопросы рассмотрены, например, в [53].
§ 6.	Интеграл Стилтьеса
1.	Меры Стилтьеса. В § 1 предыдущей главы, говоря о построении меры Лебега на прямой, мы уже упоминали о следующей конструкции. Пусть на некотором отрезке [а, 6] задана монотонно неубывающая функция F, которую мы для определенности будем считать непрерывной слева. Определив меры всех отрезков, интервалов и полуинтервалов, принадлежащих основному отрезку [а, 6], равенствами
т (а, 0) = F (0) — F (а + 0),
т[а, 0] = F(0 + O)-F(a), т(а, 0] = F(0 + O)-F(a + O),	(1)
т [а, 0) = F (0) — F (а),
мы можем затем распространить эту меру с помощью лебеговой процедуры продолжения меры на некоторую о-алгебру а.?, содержащую все открытые и все замкнутые (а значит, и все боре-левские) подмножества отрезка [а, 6]. Меру цр, полученную с помощью такого построения, называют мерой Лебега — Стилтьеса, отвечающей функции F, а саму функцию F называют производящей функцией этой меры1).
Рассмотрим некоторые частные случаи мер Лебега — Стилтьеса.
1.	Пусть F — функция скачков, Хь х2,	— ее точки разрыва,
а hb h2, ... — величины ее скачков в этих точках. Тогда мера отвечающая этой функции, устроена следующим образом:
’) Если монотонно неубывающая функция F не непрерывна слева, то по ней тоже можно определить меру, внеся в формулы (1) очевидные изменения; например, надо положить m [a, 0] — F(|3 + 0)—F(a— 0) и т. д.
§ 6]
ИНТЕГРАЛ СТИЛТЬЕСА
357
все подмножества отрезка [а, 6] измеримы и мера множества А равна
Нд(А) = £ ht.	(2)
Xt е= А
Действительно, из определения меры Лебега — Стилтьеса сразу же видно, что мера каждой точки х,- равна hi, а мера дополнения множества {х;}.=1 равна нулю. Равенство (2) для любого А ст [а, Ь] вытекает отсюда в силу о-аддитивности меры рр. Мера цг, построенная по какой-либо функции скачков, называется дискретной мерой.
2.	Пусть F — абсолютно непрерывная неубывающая функция на [а, 6] и f = F'—ее производная. Тогда соответствующая мера pF заведомо определена на всех измеримых по Лебегу подмножествах отрезков [а, 6], причем для каждого такого множества .4
Pf(A)= \f(x)dx.	(3)
А
Действительно, в силу теоремы Лебега для каждого полуинтервала [а, 8)
В
Pf [а, Р) = F (Р) — F (а) = f (х) dx.
а
Поскольку лебегово продолжение всякой о-аддитивной меры однозначно определяется своими значениями на исходном полукольце, отсюда следует равенство (3) для всех измеримых по Лебегу А с: [а, 6]. Мера pf, отвечающая абсолютно непрерывной функции F, называется абсолютно непрерывной мерой.
3.	Если F — сингулярная непрерывная функция, то отвечающая ей мера рг целиком сосредоточена на том множестве лебеговой меры нуль, на котором F' отлична от нуля или не существует. Сама мера рр называется при этом сингулярной мерой.
Ясно, что если F = F[ -f- F2, то pF = рл + pFz; поэтому из разложимости монотонной функции в сумму функции скачков, абсолютно непрерывной и сингулярной компонент следует, что всякую меру Лебега — Стилтьеса можно представить в виде суммы дискретной, абсолютно непрерывной и сингулярной компонент. Разложение монотонной функции на три составляющие определяется с точностью до постоянных слагаемых. Поэтому разложение каждой меры Лебега — Стилтьеса на дискретную, абсолютно непрерывную и сингулярную компоненты однозначно.
Сказанное выше относится к мерам Лебега — Стилтьеса на отрезке. Если теперь F — ограниченная (сверху и снизу)
358
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
ГГЛ. VF
монотонно неубывающая функция на всей прямой, то, определив меру любого отрезка, интервала и полуинтервала на прямой с помощью формул, аналогичных (1), мы получим конечную-меру на всей прямой, которую мы тоже будем называть мерой Лебега — Стилтьеса. В частности, мера всей прямой при этом будет равна
F (оо) — F (— оо), где
F(oo)= lim F(x), F(—oo) = lim F(x) X->oo	X-> — oo
(существование пределов следует из монотонности и ограниченности F).
Понятие меры Лебега — Стилтьеса на самом деле исчерпывает все меры (т. е. все конечные о-аддитивные неотрицательные функции множеств) на прямой. Действительно, пусть ц— любая из таких мер. Положив
F (х) = ц (— оо, х), мы получим монотонную функцию, такую, что отвечающая ей мера Лебега — Стилтьеса совпадает с исходной мерой ц. Таким образом, термин «меры Лебега — Стилтьеса» на самом деле не выделяет какого-либо специального класса мер на прямой, а указывает лишь на определенный способ построения таких: мер — по заданной производящей функции.
2. Интеграл Лебега — Стилтьеса. Пусть pF — мера на отрезке [а, Ь], порожденная монотонной функцией F. Для этой меры обычным образом определяется класс суммируемых функций и вводится понятие интеграла Лебега
ь
f W dup.
а
Такой интеграл, взятый по мере pF, отвечающей функции F, называется интегралом Лебега — Стилтьеса и обозначается символом
ь
\f(x)dF(x). а
Рассмотрим некоторые частные случаи.
1.	Если F — функция скачков (т. е. если iiF— дискретная! ь
мера), то интеграл ^f(x)dF(x) сводится, очевидно, к сумме-а
где Хг — точки разрыва функции F, a h, — скачки р i
В точках Хг.
•§6]
ИНТЕГРАЛ СТИЛТЬЕСА
359
2.	Если F — абсолютно непрерывная функция, то интеграл ь	ь
Лебега — Стилтьеса (х) dF (х) равен f (х) F' (х) dx, т. е. ин-
а	а
тегралу от f(x)F'(x), взятому по обычной лебеговой мере. Действительно, если /(х) = const на некотором измеримой множестве A cz [а, Ь] и f (х) = 0 вне А, то равенство
ь	ь
f (х) dF (х) = f (х) F' (х) dx	(4)
а	а
следует из (3). В силу о-аддитивности интегралов равенство (4) распространяется и на простые функции, суммируемые по мере |Xf. Пусть теперь {fn} — последовательность простых функций, равномерно сходящаяся к f. Можно при этом считать, что последовательность {f„} неубывающая. Тогда {fn(^)F'(x)} — неубывающая последовательность, почти всюду сходящаяся к f(x)F'(x), и в силу теоремы Б. Леви, в равенстве
ь	ь
fn WdF W = $ fn W F' (x) dx a	a
можно перейти к пределу при оо.
Из сказанного ясно, что если F есть сумма функции скачков ъ абсолютно непрерывной функции, то интеграл Лебега — Стилтьеса по мере сводится к ряду (или конечной сумме) и интегралу по обычной мере Лебега. Если же F содержит и сингулярную компоненту, то такое сведение невозможно.
Понятие интеграла Лебега — Стилтьеса можно естественным •образом расширить, перейдя от монотонных функций к произвольным функциям с ограниченным изменением. Пусть Ф — такая функция. Представим ее в виде разности двух монотонных •функций
Ф = v — g,
где v — полное изменение функции Ф на отрезке [а, х]. Введем теперь интеграл Лебега — Стилтьеса по Ф, положив, по определению, ь	ь	ь
$ f (х) dA> (х) = f (х) dv (х) — f (х) dg (х). а	а	а
Нетрудно проверить, что если Ф представлена каким-либо иным способом как разность двух монотонных функций, скажем,
Ф = w — h,
360
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. vr
то
ь	ь	ь	ь
f (х) dv (х) dg (x)=^f (х) dw (x)—^f (x) dh (x), a	a	a	a
т. e. для вычисления интеграла Лебега — Стилтьеса по данной функции Ф можно пользоваться любым представлением этой функции в виде разности двух монотонных.
3.	Некоторые применения интеграла Лебега — Стилтьеса в теории вероятностей. Интеграл Лебега — Стилтьеса находит применение как в анализе, так и во многих прикладных вопросах. В частности, это понятие широко используется в теории вероятностей. Напомним, что функцией распределения случайной величины £ называется функция F, определяемая для каждого х равенством
F(x) = P(g<x),
т. е. F(x) есть вероятность того, что случайная величина g примет значение, меньшее х. Очевидно, каждая функция распределения монотонно не убывает, непрерывна слева и удовлетворяет условиям
F(-oo) = 0, F(4-oo)=l.
Обратно, каждую такую функцию можно считать функцией распределения некоторой случайной величины.
Существенными характеристиками случайной величины являются ее математическое ожидание
СО
М$ = J xdF(x)	(5)
и дисперсия
ОО
Dl= j (x-MtfdF(x).	(6)
— со
Среди случайных величин выделяют обычно так называемые дискретные и непрерывные случайные величины. Случайная величина называется дискретной, если она может принимать лишь, некоторое конечное или счетное число значений
Xj, х2,	х„, ...
(например, число вызовов на телефонной станции за некоторый промежуток времени есть дискретная случайная величина).
Если pi, рг, > Рп, ... — вероятности, с которыми величина | принимает значения хь х2, ..., хп, ..., то функцией распреде
6]
ИНТЕГРАЛ СТИЛТЬЕСА
361
ления £ служит, очевидно, функция скачков. Для нее интегралы (5) и (6) сводятся соответственно к суммам
Alg = Е xtpt i
Й
Di, = £ (Xi — a)2 Pl (а = М). i
Случайная величина £ называется непрерывной, если ее функция распределения F абсолютно непрерывна. Производная F' этой функции распределения называется плотностью распределения вероятностей случайной величины В соответствии со сказанным в предыдущем пункте, для непрерывной случайной величины стилтьесовские интегралы, выражающие ее математическое ожидание и дисперсию, сводятся к интегралам по обычной лебеговой мере:
оо	оо
= xp(x)dx, D;= (х — а)2 р(х) dx,
—оо	—оо
где р = F' — плотность распределения вероятностей для £ и а = М£.
В элементарных курсах теории вероятностей ограничиваются обычно рассмотрением дискретных и непрерывных случайных величин, которые в основном только и встречаются в прикладных вопросах. Однако, вообще говоря, функция распределения случайной величины может содержать и сингулярную компоненту, так что не всякую случайную величину можно представить как комбинацию дискретной и непрерывной.
Пусть В — случайная величина, F— ее функция распределения и ц = — ф(£)—другая случайная величина, представляющая собой борелевскую функцию от Математическое ожидание Мц величины ц можно, по определению, записать как
ОО
х с1Ф (х),
— ОО
где Ф — функция распределения для ц. Существенно, однако, что если ф суммируема по мере, порождаемой на прямой функцией F, то математическое ожидание величины ц можно записать и через функцию распределения F величины g, а именно:
ОО
Мд = Мф (Ej) =	<f(x)dF(x).
— ОО
Действительно, функция y=tf (х) определяет отображение прямой (—оэ < < х < со) с заданной на ней мерой (порожденной F) в прямую (— со < у < со) с мерой цф, в которую переводится отображением ^ = <р(х). Но из результатов гл. V следует, что если (Л, ц) и (К, v) — два
362
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
Пространства с мерой, ф — сохраняющее меру (т. е. такое, что у(Д) = = ц(ф-*(4))) отображение, переводящее (X, р) в (У, v), а / — суммируема® функция на (У, V), то
jj f (у) dv = f (<p (x)) dy.
Y	X
(замена переменных в интеграле Лебега). Положив здесь f (у) = у и ц — Цг, v = р, мы и получим требуемое равенство. Таким образом, для вычисления математического ожидания (а также, конечно, и дисперсии) функции от величины g достаточно знать лишь функцию распределения самой величины
4. Интеграл Римана—Стилтьеса. Наряду с интегралом Лебега— Стилтьеса, рассмотренным выше и представляющим собой фактически разность лебеговых интегралов от данной функции f по двум мерам, заданным на прямой, можно определить-еще и так называемый интеграл Римана — Стилтьеса. Он вводится как предел интегральных сумм, аналогичных обычным интегральным суммам Римана.
Пусть снова Ф — некоторая непрерывная слева функция с ограниченным изменением, заданная на полуинтервале [а, Ь) к f — произвольная функция на этом же полуинтервале. Рассмотрим некоторое разбиение ’)
а = х0 <	< х2 < ... <хп = Ь
полуинтервала [а, Ь) на элементы [xi-i, Xi) и, выбрав в каждом из них произвольную точку g,-, составим сумму
Ь(^[ФМ-ФЫ]	(7>
i=i
(под Ф(х„) при этом понимается Ф(й— 0)). Если при тах(х< —	эти суммы стремятся к некоторому пределу
(не зависящему ни от способа дробления промежутка [а, Ь), ни от выбора точек gi, в каждом из элементов разбиения), то этот предел называется интегралом Римана — Стилтьеса от функции f по функции Ф по [а, Ь) и обозначается символом
ь
f (х) йФ(х).	(8)
а
Теорема 1. Если функция f непрерывна на отрезке [с, ij, то ее интеграл Римана — Стилтьеса (8) существует и совпадает с соответствующим интегралом Лебега — Стилтьеса.
1) Поскольку в интеграле Стилтьеса вклад отдельных точек может быть, отличен от нуля, элементы разбиения не должны иметь общих точек. Поэтому мы везде берем здесь полуинтервалы.
Ԥ 6]
ИНТЕГРАЛ СТИЛТЬЕСА
363
Доказательство. Сумму (7) можно рассматривать как интеграл Лебега — Стилтьеса от ступенчатой функции
fn(x) = f(h) при x,_1<x<xi.
При измельчении разбиения промежутка [а,Ь) последовательность таких функций равномерно сходится к f. Поэтому предел этих сумм существует и представляет собой интеграл Лебега — Стилтьеса от предельной функции f (теорема о предельном переходе под знаком интеграла). Вместе с тем именно этот предел мы и назвали интегралом Римана — Стилтьеса (8).
Установим некоторые элементарные свойства интеграла Римана — Стилтьеса.
1.	Справедлива оценка (теорема о среднем)
j f (х) с1Ф (х) max | f (х) | Vba [Ф]
(9)
О* [Ф] — полное изменение функции Ф на [a, ft]).
Действительно, при любом разбиении промежутка [а, Ь) выполнено неравенство
Z f (L) (Ф (х.) - ф (xz_,)) < 11 f &) I • | Ф (хг) - Ф (X'-J I < г=1	i=l
< max | f (х) | • I Ф (хг) — Ф (хг-j) | < max | f(x) | Vba [Ф]. i = l
Переходя в этом неравенстве к пределу, мы и получим оценку {9). При Ф(х) = х она переходит в известную оценку
f (х) dx (b — a) max | f (х) |
для интеграла Римана.
2.	Если Ф = Ф, + Ф2, то
$ f (х) г/Ф (х) = р (х) dtby (х) + J f (х) </Ф2 (х).
Действительно, при всяком разбиении промежутка [а, Ь) соответствующее равенство выполнено для интегральных сумм, следовательно, оно сохраняется и в пределе, т. е. для интегралов.
Замечание I. Мы определили интеграл Римана — Стилтьеса (8), считая, что функция Ф(х) непрерывна слева. Однако определение этого интеграла как предела сумм (7) сохраняет.
364
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
очевидно, смысл и для любой функции Ф(х) с ограниченным изменением.
Замечание 2. Все сказанное об интеграле Римана — Стилтьеса по конечному промежутку легко переносится на случай, когда интеграл берется по всей прямой или по полупрямой.
Кроме того, мы определили интеграл Стилтьеса по полуинтервалу [а, Ь). Аналогично можно определить интеграл по (п, &], а также интегралы по [а, й] и (а, Ь). В случае интеграла Стилтьеса, в отличие от обычного риманова интеграла, значения интеграла по интервалу (а, Ь), отрезку [а, Ь] и полуинтервалам (а, Ь] и [а, Ь), вообще говоря, не совпадают между собой. Например, если а — точка разрыва функции Ф, то интеграл по [а, Ь] равен интегралу, взятому по (а, Ь] плюс член вида f(a)h, где h = Ф(а -ф- 0) — Ф(а).
Приведенные свойства 1 и 2 выполнены для любой функции [, для которой входящие в их формулировки выраженйя имеют смысл. Если предположить, что f(x) непрерывна на отрезке [а, 6], то соответствующий интеграл обладает еще следующими существенными свойствами (при этом интеграл можно понимать как интеграл по отрезку [a, ft] или по любому из полуинтервалов (а, 6] и [а, Ь)).
3.	Если Ф1 и Ф2 — две функции с ограниченным изменением на [а, Ь), совпадающие всюду, кроме конечного или счетного числа внутренних точек этого промежутка, то
ь	ь
f (х)	(х) = f (х) </Ф2(х)
а	а
для любой непрерывной на [а, Ь] функции f.
Для доказательства рассмотрим сперва случай, когда Ф2=0, т. е. установим справедливость следующего утверждения.
3'. Если ф — функция с ограниченным изменением, отличная от нуля лишь в конечном или счетном числе точек, лежащих внутри (а, Ь), то
ъ
j f (х) dip (х) — 0 а
для любой непрерывной на [а, 6] функции f.
Действительно, это очевидно для функции, отличной от нуля в одной точке хо (если брать сколь угодно мелкие разбиения промежутка [а, Ь), не включая х0 в число точек деления, то будут получаться интегральные суммы, равные нулю), следовательно, по аддитивности это верно и для любой функции, отличной от нуля в конечном числе точек. Пусть теперь ф отлична от нуля в точках rh г2, ..., гп, ... и ylt у2, ..., уп, ... — ее зна-
§ 6]
ИНТЕГРАЛ СТИЛТЬЕСА
365
чения в этих точках. Поскольку тр имеет ограниченное изменение, то X I Уп I < 00• Выберем номер N так, что X I Уп К 8, и п	п> н
представим гр в виде суммы
Ф = 'P.v + Ф’
где rpw принимает значения у\, ..., у и в точках ri, ..., гк и равна 0 во всех остальных, а ф отлична от 0 только в точках rN+i, rN+2, ... В силу свойства 2
b	b	ь
jj f (х) dip (х) = jj f W dip A, (x) + jj f (x) dip (x).
a	a	a
Первый из этих интегралов по уже доказанному равен нулю, а второй, по свойству I, допускает оценку
ь
jj fWdip(x) а
< max | f (x) | 2e
(поскольку, очевидно, РаГФ] — 2 X l#nl<2e). В силу произ-п > N
вольности е отсюда вытекает наше утверждение.
Теперь для доказательства свойства 3 рассмотрим разность гр — Ф] — Ф2. Она отлична от нуля лишь в конечном или счетном числе точек, принадлежащих (а, Ь). Остается применить 2 и 3'. В частности, поскольку функция с ограниченным изменением имеет не более чем счетное число точек разрыва, получаем следующее свойство.
4.	Если функция f непрерывна, то интеграл Римана — ь
Стилтьеса j f (х) йФ (х) не зависит от значений, принимаемых а
функцией Ф в ее точках разрыва, лежащих внутри (а, Ь).
Поскольку интеграл Римана — Стилтьеса от непрерывной функции совпадает с соответствующим интегралом Лебега — Стилтьеса, для интеграла Римана — Стилтьеса от непрерывной функции f(x) справедливы равенства
ь
jj f (х) йФ (х) = £ f(Xi)h{,
a	i
если Ф — функция скачков, и
b	ь
j f (х) йФ (х) = j f (х) Ф' (х) dx,	(10)
а	а
366
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
если Ф — абсолютно непрерывная функция. Если при этом Фг интегрируема по Риману, то интеграл в (10) справа можно понимать в римановом смысле.
5.	Предельный переход под знаком интеграла Стилтьеса. В гл. V мы доказали ряд теорем о предельном переходе под знаком интеграла Лебега. При этом вопрос ставился следующим образом: даны последовательность функций {Д} и интегралы от них по некоторой фиксированной мере; нас интересует возможность предельного перехода под знаком интеграла. Однако применительно к интегралу Стилтьеса интересна и другая постановка вопроса: дана последовательность функций с ограниченным изменением {Фп}. При каких условиях для фиксированной функции f под знаком интеграла
ь
5 f (*) (х) а
возможен предельный переход?
Здесь имеет место следующая теорема.
Теорема 2 (первая теорема Хелли). Пусть функции Фп с ограниченным изменением на отрезке [а, 6] сходятся в каждой точке этого отрезка к некоторой функции Ф, причем полные изменения функций Фп ограничены в совокупности-.
Еа[Фп]<С (п=1,2, ...).
Тогда предельная функция Ф тоже имеет ограниченное изменение и для любой непрерывной функции f справедливо равенство
ь	ь
lim Ь(Х)4/Ф„(Х)=Ь(Х)4/Ф(Х).	(11)
J	•>
а	а
Доказательство. Покажем прежде всего, что полное изменение предельной функции Ф не превосходит той же константы С, которой ограничены все Еа[Фп]. Действительно, при любом разбиении отрезка [а, 6] точками а—Хо < Xi < ... < xm=& имеем
m	m
£|Ф(-^) — ®(xfc-i)|= lim £|ф„(хй) — Ф„(х4_|)|<С, &=J	fe=I
следовательно,
Еа[Ф]^С.
Покажем теперь, что соотношение (11) выполнено в том случае, если f — ступенчатая функция. Пусть f принимает значения йл
§ 6]
ИНТЕГРАЛ СТИЛТЬЕСА
367
на полуинтервалах [хл_ь xh). Тогда
ь
\ f (х) с!Фп (х) = У hk [Ф„ (xft) — Ф„ (xft_,)] a	k
И
ь
J f (X) 4/Ф (X) = X hk [Ф (Xft) - Ф (Xft_,)]. a	k
Ясно, что первое из этих выражений при п->оо переходит во второе.
Пусть теперь f — непрерывная функция и е — произвольное положительное число. Выберем ступенчатую функцию fe так, что
И (X) — (х) I < е/(ЗС)
Тогда
ь	ь
$Цх)</Ф(х)- $Цх)</Ф„(х)
а	а
b	b
/ \х) 4/Ф (х) — f£ (х) б/Ф (х) а	а
b	Ь
+ J ft (х) йФ W-J ft (х) d®n W + а	а
b
\ /е(х)(/фь(х}- Jf(x)dO„(x) а	а
В силу теоремы о среднем для интеграла Стилтьеса, первое и третье слагаемые здесь меньше, чем е/3, а второе — меньше е/3 при всех достаточно больших п. Поскольку е > 0 произвольно, отсюда вытекает утверждение теоремы.
Замечание. Эта теорема переносится и на тот случай, когда в интегралах
ь
J f (х) d<bn (х)
а
один или оба предела бесконечны. При этом, однако, функция / должна на бесконечности стремиться к некоторому конечному пределу (это позволяет равномерно аппроксимировать ее на всем бесконечном промежутке ступенчатыми функциями, принимающими лишь конечное число значений).
Если первая теорема Хелли устанавливает условия, при которых в интеграле Римана — Стилтьеса можно переходить к пределу по некоторой последовательности {Фп} функций с ограниченным изменением, то вторая выясняет, когда можно гарантировать само существование последовательности, удовлетворяющей условиям первой.
368
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. VI
Теорема 3 (вторая теорема Хелли). Из всякого бесконечного множества М функций Ф, заданных на некотором отрезке [а, 6] и удовлетворяющих условиям
тах|Ф(х)|<С, Уа[Ф]<К,	(12)
(С и К — постоянные, одни и те же для всех Фе.'И), можно выбрать последовательность, сходящуюся в каждой точке отрезка [а, &].
Доказательство. Достаточно доказать эту теорему для монотонных функций. Действительно, пусть
Ф = и — g,
где д(х)— полное изменение функции Ф на отрезке [а, х]. Тогда функции v, отвечающие всем Ф е М, удовлетворяют неравенствам
max | v (х) |	К, Vba [и] = Vba [Ф] К,
т. е. удовлетворяют условиям теоремы, и монотонны. Считая, что для монотонных функций теорема доказана, выберем последовательность {Фп} из М так, чтобы для нее vn сходились к некоторому пределу v. Далее, функции
gn = vn — Ф„
тоже монотонны и удовлетворяют условиям теоремы. Поэтому из {Фп} можно выбрать подпоследовательность так, что gnk сходятся к некоторому пределу g. Но тогда
Ф„4 (х) -> Ф (х) = V (х) — g (х).
Итак, приведем доказательство теоремы для семейства М монотонных функций. Пусть ri, г2, . . ., гп, ... — все рациональные точки отрезка [а, 6]. В силу (12) числа Ф(Г1) (где Ф пробегает все М) образуют ограниченное множество, поэтому найдется последовательность {Ф^}’ сходящаяся в точке /ц. Далее, из нее можно выбрать подпоследовательность {Фп1}, сходящуюся в точке г2 (и, конечно, в ri). Из {Ф„2>} выберем подпоследовательность, сходящуюся в точке гз, и т. д. Диагональная последовательность {Ф^} будет, очевидно, сходиться во всех рациональных точках отрезка [а, 6]. Ее предел есть неубывающая функция Ф, определенная пока лишь в точках г2, . . . , гп, . . . Доопределим ее в остальных точках отрезка [а, 6], положив для иррациональных х Ф(х)= lim Ф(г) (г рациональны). Покажем, что г->х-0
полученная таким образом неубывающая функция Ф во всех точках непрерывности служит пределом последовательности
5 6]
ИНТЕГРАЛ СТИЛТЬЕСА
369
{ф(п'}. Пусть X* — одна из таких точек. Тогда для заданного е > 0 можно найти такое б > О, что
| Ф(х‘) — Ф(х) | < е/6, как только | х*— х | < 6.	(13)
Выберем рациональные точки г' и г" так, что г' < х* <Z г" и г' > х* —б, г" < х* + б. Пусть теперь «о настолько велико, что при п > п0 выполнены неравенства
|Ф„(И-Ф(И1<8/6 и |Ф„(г")-Ф(г")|<8/6.	(14)
Из (13) и (14) следует, что о
|Ф„(г')-Ф„(г")1<уе.
Так как функция Ф„ неубывающая, то Ф„ (г') ^Ф„ (х‘) ^Фп (г"). Поэтому
|Ф(Х*)-Ф„ (х‘)|<
< | Ф (х‘) - Ф (/) I + | Ф (г') - Ф„ (г') I +1 Ф„ (г') - Ф„ (X*) I <
б’ + ’б +“б'~е’
а это и значит, что lim Ф„ (х‘) = Ф (х‘).
П->оо
Итак, мы построили последовательность функций из М, сходящуюся к предельной функции Ф всюду, кроме, быть может, точек разрыва функции Ф. Так как множество таких точек не более чем счетно, то, применив снова диагональный процесс, можно из последовательности {Фп} выделить подпоследовательность, сходящуюся и в этих точках, т. е. всюду на [а, 6].
6.	Общий вид линейных непрерывных функционалов в пространстве непрерывных функций. Выше мы уже указывали некоторые применения интеграла Стилтьеса. Сейчас мы рассмотрим еще одну задачу, связанную с этим понятием, а именно, выясним общий вид линейного функционала в пространстве С [а, 6].
Теорема 4 (Ф. Рисе). Всякий линейный непрерывный функционал F в пространстве С[а,Ь] представим в виде
ь
F(f)=\f(x)dO>(X),	(15)
а
где Ф — некоторая функция с ограниченным изменением1). При этом
II F 11 = Ра [Ф].
') Здесь имеется в виду интеграл по отрезку [а, 6].
370
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ. vr
Доказательство. Пространство С [а, 6] можно рассматривать как подпространство пространства М[а,Ь] всех ограниченных функций на этом отрезке, с той же нормой
II f II = sup | f (х) I,
что и в С [а, &]. Пусть F— непрерывный линейный функционал на С[а, &]. По теореме Хана — Банаха его можно продолжить, с сохранением нормы, с С[а, 6] на все М[а,Ь]. В частности, такой продолженный функционал будет определен на всех функциях вида
( 1 при X < т,
Аа(х) = 0, йт(*) = < п	(16)
(0 при х > т, если т > а.
Положим
Ф(т) = 7Дйт)	(17)
и покажем, что функция Ф имеет ограниченное изменение на отрезке [а, 6]. Действительно, возьмем произвольное разбиение
а = х0 < Xj < ... < хп = Ъ	(18)
этого отрезка и положим
ak = sgn (Ф (xft) — Ф (Xfe-0) (k = 1, 2, ..., п).
Тогда
Е | Ф (xft) — Ф (xft_j) I = Е afe (Ф (xft) — Ф (xft_j)) =
akF(hXk - hXk_t) = Я E ak(hXk - hXk_x к—1	1
n
Но функция У ak (hXk — hx _]) принимает лишь значения ±1 и 0.
Следовательно, ее норма разна 1. Таким образом,
У |Ф(хА)-Ф(х,_1)|<||^||. 6=1
Поскольку это верно для любого разбиения отрезка [а, &], то
Уа[Ф] <11 F ||.
Итак, мы построили по функционалу F функцию Ф, имеющую ограниченное изменение. Покажем, что именно с помощью этой функции функционал F записывается в виде интеграла Стилтьеса (15).
-§ 6]
ИНТЕГРАЛ СТИЛТЬЕСА
371
Пусть f — произвольная непрерывная функция на [a, ft]. Зададим положительное е и выберем б>0 так, что |f(x") — — f(x') | < е при \х"— х'|<6. Выберем теперь разбиение (18) так, чтобы длина каждой из частей была меньше б, и рассмотрим ступенчатую функцию fe:
fe (х) = f (xft) при х4_,<х<хь	А-=1, 2,
h (a) = f(a).
Ее, очевидно, можно записать в виде
h (•<) = S f (xk) [hXk (x) - hXk_t (x)], k = 1
где /it— функция, определенная равенством (16). Ясно, что |f(x)— fe(x) | < е при всех х(а d х Ь), т. е.
II f (*) - h WII < е.
Найдем значение функционала F на элементе fe- В силу линейности этого функционала и определения функции hx оно равно f^F(hXk)-F(hXk_y\=t Ж)[Ф(ха)-Ф(ха-1)1, k —I	fe=l
т. e. представляет собой интегральную сумму для интеграла
ь
f (х) </Ф(х). а
Поэтому при достаточно мелком разбиении отрезка [а, б]
ь
F(fe)~\f(x) ЙФ(х) а
е.
Но в то же время
I F(f) - F(fe) KIIFH • ||f - М<И11'
Следовательно,
ь
F(f)-jf(x)dO(x) a
< 8(1 +IIFII),
откуда в силу произвольности е получаем равенство ь
F(f)=\f(x) dФ(x).
372
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
1ГЛ. VI
Мы показали, что полное изменение функции Ф, определяемой формулой (17), удовлетворяет неравенству
Уа[Ф]<Ш1-	(19)
С другой стороны, из теоремы о среднем для интеграла Римана— Стилтьеса сразу следует, что
И1КУа[Ф].	(20}
Сравнивая (19) и (20), получаем равенство
l|F|| = Va [Ф].
Теорема полностью доказана.
Замечание. Ясно, что взяв произвольную функцию с огра* ниченным изменением Ф на отрезке [а, 6] и положив
ь
F(D = \f(x)d0(x), а
мы получим линейный функционал на пространстве С [а, ft], При этом две функции, Ф1 и Ф2, совпадающие на [a, ft] всюду, за исключением не более чем счетного множества внутренних точек этого отрезка, определяют один и тот же линейный функционал; обратно, пусть Ф] и Ф2 определяют один и тот же функционал на С [a, ft], т. е.
ь	ь
<*Ф1(х)= j fix) </Ф2(х) а	а
для каждой непрерывной функции f. Отсюда легко следует, что ф] — ф2 == const во всех точках непрерывности функции Ф1 — Ф2, т. е. всюду, кроме, быть может, конечного или счетного множества точек.
Таким образом, каждому непрерывному линейному функционалу на С [a, ft] отвечает класс функций с ограниченным изменением на [a, ft], причем Ф! и Ф2 принадлежат одному классу в том и только том случае, если их разность отличается от постоянной не более чем в счетном числе внутренних точек отрезка [a, ft]. В каждом таком классе можно выбрать одну и только одну функцию, равную нулю в.точке а и непрерывную справа всюду на полуинтервале (a, ft]. Функции, удовлетворяющие этим условиям, образуют в пространстве всех функций с ограниченным изменением на [a,ft] замкнутое линейное подпространство, которое мы обозначим Vc[o, ft]. Заметим, наконец, что для любого функционала F на С[а,Ь] соответствующая функция Ф(т), определяемая равенством (17), есть функция именно из V°[a, ft].
ИНТЕГРАЛ СТИЛТЬЕСА
373
§ 61
Так как для таких Ф(т) было установлено равенство ||Г|| = = Уа[Ф], то теореме 4 можно придать следующий вид.
Теорема 4х. Существует изоморфное (т. е. взаимно однозначное, линейное и изометричное) соответствие между пространствами (С[а, Ь])* и V°[a, 6], устанавливаемое равенством
ъ
F(f)= ^(х)</Ф(х). а
Такое представление линейного функционала с помощью функции из У°[а, 6] мы будем называть каноническим.
Из этой теоремы легко получить следующую теорему о каноническом представлении линейного функционала на пространстве С1 [а, Ь] непрерывных и непрерывно дифференцируемых функций, играющую существенную роль в вариационных задачах.
Теорема 5. Всякий линейный функционал в пространстве С1 [а, 6] можно представить одним и только одним способом в виде
ь
F(f) = af(a)+\f'(X)d(I>(X),	(21)
а
где а — число и Ф е V0 [а, 6].
Доказательство. Рассмотрим в С [а, 6] подпространство С1 [а, 6] функций, удовлетворяющих условию /(£г) =0, и оператор А — d/dX, переводящий это подпространство во все пространство С [а, 6]. Пусть F — линейный функционал на С1 [а, &]. Рассмотрим его сначала только на подпространстве С1 [а, 6]. Теперь к оператору А: С1 [а, 6]->С[а, 6] и функционалу F: С?[а,6]-> —> R можно применить лемму о тройке (гл. IV, § 5, п. 4). В силу этой леммы найдется такое линейное отображение:
ф: С [a, b] —> R,
что для каждой функции ge С1 [а, 6]
Ж = Ф(М	(22)
Каждая функция feCfa, 6] может быть представлена в виде
f(X) = f(a) + g(X), geCl[a,b], Поэтому
F(f) = F (f(a)) + F(g).	(?3)
374
НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА
[ГЛ VI
В силу теоремы Рисса, равенства (22) и определения оператора А имеем:
ь
F (g) = Ф (-4g) = ё' W аФ W-
а
ИЛИ
b
/=(§)= Jf'W^(x),	(24)
а
поскольку f'(x)=g'(x). Пусть а—-значение функционала F на функции, тождественно равной единице. Тогда из (23) и (24) окончательно получаем представление (21).
ГЛАВА VII
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
Один из важнейших классов нормированных пространств составляют пространства суммируемых функций, в первую очередь пространство всех суммируемых функций А1 и пространство L2 функций с суммируемым квадратом. Сейчас мы рассмотрим основные свойства этих пространств. Содержание этой главы опирается, с одной стороны, на общие свойства метрических и линейных нормированных пространств, изложенные в гл. II—IV, а с другой, — на введенное в гл. V понятие интеграла Лебега.
§ 1. Пространство L}
1. Определение и основные свойства пространства Пусть X— некоторое пространство с мерой ц; при этом мера самого X может быть конечной или бесконечной. Будем считать меру ц полной (т. е. любое подмножество любого множества меры нуль измеримо). Рассмотрим совокупность'всех функций f, суммируемых на X. Поскольку линейная комбинация суммируемых функций суммируема, эта совокупность, с обычными операциями сложения функций и умножения их на числа, образует линейное пространство. Это пространство мы обозначим L^X, р.) или, короче, просто Lx. Введем в Lx норму, положив1)
Ilf 11 = $lf(*W.	(1)
Ясно, что при этом
II afll = l а| • II fll и
II fl + М<11 fl ll + ll f2ll-
Однако для того чтобы выполнялось и последнее ’-во нормы, а именно,
II f II > 0, если f =£ О,
’) Здесь и дальше символ j будет означать интегрирование по всему пространству X.
376
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЯ
[ГЛ. VII
нужно считать, что функции, эквивалентные друг другу на X, не различаются, а считаются за один и тот же элемент пространства L\. В частности, нулевой элемент в Lx— это совокупность всех функций, равных нулю почти всюду. При этом выражение (1) будет обладать всеми свойствами нормы. Итак, мы приходим к следующему определению.
Определение 1. Пространством Lx называется нормированное пространство, элементами которого служат классы эквивалентных между собой суммируемых функций; сложение элементов в L] и умножение их на числа определяются как обычное сложение и умножение функций1), а норма задается формулой
|| f || = J | f (х) | dp.
В Li, как и во всяком нормированном пространстве, с помощью формулы
p(f, £) = llf — ЯII
вводится расстояние. Сходимость последовательности суммируемых функций в смысле этого расстояния называют сходимостью в среднем. Пространство Lx можно считать состоящим из комплексных функций (комплексное Lx) или из одних только действительных (действительное Lx). Содержание данного параграфа относится к обоим этим случаям.
Весьма важен для многих вопросов анализа следующий факт. Теорема 1. Пространство Lx полно.
Доказательство. Пусть {Д}— фундаментальная последовательность в Lx, т. е.
II fn — fm II 0 при П, Щ->0О.
Тогда можно найти такую возрастающую последовательность индексов {щ}, что
Из этого неравенства и теоремы Б. Леви вытекает, что ряд
1М + 1^-М+ •••
сходится почти всюду на X. Но тогда и ряд
+ •••
') Точнее: каждый элемент в Lx— это класс эквивалентных между собой суммируемых функций; чтобы сложить два таких класса, надо взять в них по представителю и объявить суммой класс, содержащий сумму выбранных представителей. Ясно, что результат не зависит от произвола в выборе представителей. Аналогично — и для умножения элемента из Lx на число.
5 1]
ПРОСТРАНСТВО Lt
37Т
сходится почти всюду на X к некоторой функции f (х) = lim f (х).
&-> оо Й
Таким образом, фундаментальная последовательность в Lx содержит подпоследовательность, сходящуюся почти всюду.
Покажем теперь, что подпоследовательность сходится к той же функции f и в среднем. В силу фундаментальности последовательности {/п}, при любом фиксированном е > 0 для всех достаточно больших k и I имеем
Согласно теореме Фату в этом неравенстве можно перейти к пределу под знаком интеграла при /->оо. Получаем
5 I fnk W — f W Мм < е,
откуда следует, что f Lx и что/П)!,->А Но из того, что фундаментальная последовательность содержит подпоследовательность, сходящуюся к некоторому пределу, следует, что и сама она сходится к тому же пределу.
Теорема доказана.
2.	Всюду плотные множества в Lx. Для всякой функции f, суммируемой на X, и любого е > 0 существует такая простая суммируемая функция <р(х), что
I f W — Ф (х) | dp < е.
Далее, поскольку для простой суммируемой функции, принимающей значения ух, у2, ... на множествах Ех, Ё2, ..., интеграл определяется как сумма ряда
оо
£ Уп№ (^л) л=1
'(при условии его абсолютной сходимости), ясно, что всякую простую суммируемую функцию можно представить как предел ’(в среднем) последовательности простых функций, принимающих лишь конечное число значений. Итак, в пространстве Lx всюду плотны функции, каждая из которых принимает лишь конечное число значений (т. е. представляет собой конечную линейную комбинацию индикаторов).
Пусть R— метрическое пространство с введенной в нем мерой, удовлетворяющей такому условию (выполненному для меры Лебега в евклидовом пространстве и во многих других практически интересных случаях): все открытые и все замкнутые множества в R измеримы, и для любого измеримого множества
378
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ
[ГЛ. VII
Л1 cz и любого е > 0 найдется1) такое открытое G тэ М, что p(G \ М) < е.	(2)
Тогда верна следующая теорема:
Теорема 2. Множество всех непрерывных функций всюду плотно в Li(H, р).
Доказательство. В силу сказанного выше достаточно доказать, что всякая простая функция, принимающая конечное число значений, является пределом, в смысле сходимости в среднем, последовательности непрерывных функций. Далее, так как всякая суммируемая простая функция, принимающая конечное число значений, есть линейная комбинация индикаторов Хм (х) измеримых множеств конечной меры, то достаточно провести доказательство для этих последних. Пусть М — измеримое множество в метрическом пространстве /? и р(Л4)<оо. Тогда из условия (2) сразу следует, что для любого б > 0 найдутся замкнутое множество FM и открытое множество GM такие, что
FMcc/WccGM и p (GM) p (FM) < е.
Определим теперь функцию фе(х), положив 2)
, ч р(х- /?Х(3м) Фе(Х) + ’
Эта функция равна 0 при xg/?\Gm и равна 1 при х е FM'. Она непрерывна, так как каждая из функций р(х, FM) и р(х, /? \ Gm) непрерывна и их сумма нигде не обращается в 0. Функция —фе] не превосходит 1 на GM \FM и равна 0 вне этого множества. Следовательно,
JlXwW — <pe(x)|dp.<8,
откуда и вытекает утверждение теоремы.
Ясно, что пространство L\ (X, р) зависит и от выбора пространства X, и от выбора меры р в нем. Например, если мера р сосредоточена в конечном числе точек, то АДХ, р) будет просто конечномерным пространством. В анализе основную роль играют пространства L\ бесконечной размерности, но содержащие счетное всюду плотное подмножество. Для того чтобы охарактеризовать такие пространства Ly, введем еще одно понятие, относящееся, собственно, к общей теории меры.
Определение 2. Мера р называется мерой со счетным базисом, если существует такая счетная система s/ — {An}
>) Ср. упражнение на стр. 291.
г) р(х, А) означает расстояние от точки х до множества А.
S ч
ПРОСТРАНСТВО L,
379
(н = 1,2, ...) измеримых подмножеств пространства X ('четный базис меры р), что для всякого измеримого М с. X и всякого е > 0 найдется такое Ah е st, что
р (.'И А Л4) < е.
В частности, мера р имеет счетный базис, если ее можно представить как лебегово продолжение меры т, определенной на некотором счетном полукольце S. В самом деле, в этом случае кольцо 9t(S) (очевидно, счетное) и представляет собой искомый базис. Отсюда видно, например, что счетный базис имеет мера Лебега на отрезке, поскольку для нее за исходное полукольцо можно принять совокупность полуинтервалов с рациональными концами.
Произведение р = pi ® рг двух мер со счетными базисами также обладает счетным базисом, ибо конечные суммы произведений элементов из базиса меры pi на элементы из базиса меры рг образуют, как легко проверить, базис меры р = pi ® рг- Поэтому мера Лебега на плоскости (а также и в n-мерном пространстве) имеет счетный базис.
Пусть
лг, л;,..., л*,...	(3)
есть счетный базис меры р. Легко видеть, что, расширяя систему множеств (3), можно образовать новый счетный базис этой меры
Ль Л2, ..., Ап, ...,	(4)
замкнутый по отношению к операциям вычитания и взятия конечных сумм и пересечений, т. е. являющийся кольцом.
Теорема 3. Если мера р имеет счетный базис, то в Ц (X, р) существует счетное всюду плотное множество функций.
Доказательство. Покажем, что счетное всюду плотное множество в Lx(X, р) образуют конечные суммы
п
Е ОЛ (х),	(5)
/?=1
где Ck — рациональные числа, а Д — индикаторы элементов счетного базиса меры р.
Счетность такого множества очевидна; покажем, что оно всюду плотно в Li(X, р). Как мы уже показали, множество ступенчатых функций, принимающих лишь конечное число значений, всюду плотно в L\. Так как любую такую функцию можно сколь угодно точно аппроксимировать функцией того же вида, но принимающей лишь рациональные значения, достаточно показать, что любую ступенчатую функцию f, принимающую значения
У\, У2, •••. Уп (все yt рациональны)
380
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ
ГГЛ. VII
на множествах
ЕьЕ2,...,Еп	( J Et = X, E^Ef^ 0 при i #=/),
\t=I	/
можно сколь угодно точно аппроксимировать в смысле метрики Li функциями вида (5). Согласно сделанному замечанию можно без ограничения общности предполагать, что базис меры ц является кольцом.
По определению счетного базиса меры ц, при любом е > О в нем существуют такие множества А2, . .. , Ап, что
I* (Ек А Ак) < е.
Положим
А'к = Ак\ U (k = l, 2, п) i<k
и определим f*, положив
' Уь при x^A'k,
0 при	J A'i.
i=l
Легко видеть, что при достаточно малом е мера
(х) #= Г(х)}
сколь угодно мала и, следовательно, интеграл
5 I f W — Г W Idy < (2 max | ук |)ц{х: f (х) #= /*(х)} сколь угодно мал при достаточно малом е.
В силу сделанных нами предположений относительно базиса меры ц, функция f* есть функция вида (5).
Теорема доказана.
Для того частного случая, когда X есть отрезок числовой прямой, а ц— мера Лебега, счетное всюду плотное множество в Z-i можно получить и проще, например, взяв множество всех многочленов с рациональными коэффициентами. Оно всюду плотно (даже в смысле равномерной сходимости) в множестве непрерывных функций, а эти последние образуют всюду плотное множество в Li(X, ц).
§ 2. Пространство L2
1. Определение и основные свойства. Пространство Li представляет собой, как мы видели, полное нормированное (т. е. банахово) линейное пространство. Однако оно не является евклидовым: определенную в нем норму нельзя задать с помощью
ПРОСТРАНСТВО Lt
381
§ 2)
какого-либо скалярного произведения. Это вытекает из «теоремы о параллелограмме», установленной в п. 8 § 4 гл. III. Например, для интегрируемых на отрезке [0,2л] функций g = sin х соотношение
Ilf+ glF + llf-glF = 2(||f|p + ||g|p)
в L\ не выполняется.
Функциональное пространство, не только нормированное, но и евклидово, можно построить, взяв совокупность функций с интегрируемым квадратом. Введем соответствующие определения. Будем сперва рассматривать действительные функции f, определенные на некотором пространстве X, с заданной на нем мерой ц. Все функции предполагаются измеримыми и определенными на X почти всюду. Эквивалентные между собой функции не различаются.
Определение 1. Функция f называется функцией с интегрируемым квадратом на X, если интеграл
5 f2W di*
существует (конечен). Совокупность всех таких функций мы обозначим L2(X, ц) или, короче, Лг-
' Установим основные свойства функций с интегрируемым квадратом.
1.	Произведение двух функций с интегрируемым квадратом есть интегрируемая функция.
Это непосредственно вытекает из неравенства
1 f (х) g (х) |<у [f2 (х) + g2 (х)]
и свойств интеграла Лебега.
Следствие. Всякая функция f с интегрируемым квадратом на пространстве с конечной мерой интегрируема.
В самом деле, достаточно, положив g[x) = 1, воспользоваться свойством 1.
2.	Сумма двух функций из Ь2 также принадлежит Ь2.
Действительно,
(f (х) + g (X))2 < f2 (х) + 21 f (x) g (x) | + g2 (x);
в силу свойства 1 каждая из трех функций, стоящих справа, интегрируема.
3.	Если f е Ь2 и а — произвольное число, то af е Ь2.
Действительно, если f е Ь2, то
$ [af (х)]2 dp = а2 f2 (х) dp < оо.
382
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ
[ГЛ. VII
Свойства 2 и 3 означают, что линейные комбинации функций из Ь2 снова принадлежат Ь2-, при этом, очевидно, сложение функций из L2 и умножение их на числа удовлетворяют всем условиям, перечисленным в определении линейного пространства (гл. Ill, § 1). Таким образом, совокупность Ь2 функций с интегрируемым квадратом есть линейное пространство.
Определим теперь в Ь2 скалярное произведение, положив
(Л g) = (xjg(x)dp.
Ясно, что все требования, входящие в определение скалярного произведения (см. § 4, гл. III), а именно:
1)	=
2)	(fi+f2,g) = (h,g)+(f2,g),
3)	(af,g) = a(f,g),
4)	(f, f) > 0, если f =/= 0, при этом выполнены. В частности, выполнение условия 4) обеспечивается тем, что мы условились не различать эквивалентные между собой функции (за нулевой элемент, таким образом, принимается совокупность всех функций на X, эквивалентных ^0).
Итак, введя для функций с интегрируемым квадратом операции сложения и умножения на число, а также скалярное произведение, мы приходим к следующему окончательному определению.
Определение 2. Евклидовым пространством Ь2 называется линейное пространство, состоящее из классов эквивалентных между собой функций с интегрируемым квадратом, в котором скалярное произведение определено формулой
[f, g)=\f(x)g(x)dp.
В Ь2, как и во всяком евклидовом пространстве, выполнены неравенство Коши — Буняковского и неравенство треугольника, которые в данном случае имеют вид
( Ж) g (х)	< j f2 (х) др j g2 (х) dp
и
д/ $ (Ж) + £ (х))2^ц < у/ р2 (х) dp + д/ J g2 (х) dp .
В частности, при ц(Х)<оо и g(x)=l неравенство Коши — Буняковского превращается в следующую полезную оценку:
(Jf(x)dH)2<H(X) \f4*)dp.	(1)
ПРОСТРАНСТВО L,
383
$ 2]
Норма в L2 определяется формулой
и/11=70 =
а расстояние между элементами f и g— формулой
Р (Л g) = II f — ё II =	(/ W — S W)2 •
Величину
5 (fW - g(x))2dp =|| f - g||2
называют также средним квадратичным уклонением функций f и g друг от друга.
Сходимость функциональной последовательности в смысле метрики пространства Ь2 называется сходимостью в среднем квадратичном. Если нет опасности спутать эту сходимость со сходимостью в Ль определенной в предыдущем параграфе, мы и здесь будем пользоваться более коротким термином «сходимость в среднем».
Теорема 1. Пространство L2(X, ц) при ц(Х)<оо полно.
Доказательство. Пусть {/п} — фундаментальная последовательность в L2, т. е.
II fn — fm II -* 0 при П.Щ-+ОО,
Тогда в силу оценки (1) получаем
J I fn W - fm W I dp < [Ц (X)]'4 { J (fn (x) - f m (x))2 dp }" <
< 8 [H (X)]'\	(2)
т. e. последовательность {/n} фундаментальна и в метрике пространства Li. Повторяя рассуждения, которые были проведены при доказательстве полноты пространства Lly выберем из {/п} подпоследовательность сходящуюся почти всюду к некоторой функции f. В неравенстве
W)2^<e,
справедливом для членов этой подпоследовательности при всех достаточно больших k и I, можно, используя теорему Фату, перейти к пределу при I оо. Получим
$(/„* W-f(x))2(/H<e,
откуда следует, что f е Ь2 и чтоДля завершения доказательства остается, как и в теореме 1 § 1, воспользоваться тем,
384
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
[ГЛ. VII
что, если фундаментальная последовательность содержит сходящуюся, то и сама она сходится к тому же пределу.
2. Случай бесконечной меры. Мы рассматривали только что функции с интегрируемым квадратом, определенные на некотором пространстве X конечной меры. При этом условие |i(X)<oo использовалось довольно существенно. Именно, сначала мы прибегли к нему, доказывая, что всякая функция с суммируемым квадратом суммируема и в первой степени, а затем— при выводе неравенства (2), на которое опиралось доказательство полноты пространства L2. Если рассматривать функции на множестве бесконечной меры (например, на всей прямой с лебеговой мерой на ней), то не всякая функция из L2 будет содержаться в Lx. Например, функция 	- не интегрируема
-у 1 + х2
на всей прямой, а ее квадрат интегрируем. Далее, в случае |i(X)<oo имеет место неравенство (1), означающее, что из сходимости последовательности функций в L2 следует их сходимость в При |i(X)— оо это тоже неверно: например, последовательность функций на прямой
( \/п при I X ]^п, <PnW | Q ПрИ |х|>.л
сходится к 0 в пространстве L2(—оо, оо) функций с суммируемым квадратом на прямой, но не сходится ни к какому пределу в АД—оо, оо). Однако теорема о полноте пространства L2 остается справедливой и при р(Х) = оо *).
Докажем это утверждение. Как и в п. 6 § 5 гл. V, где мы ввели понятие интеграла по множеству бесконечной меры, будем предполагать, что все пространство X можно представить как счетную сумму множеств конечной меры. Пусть
Х = U Хп, g(xn)<oo, Хп(]Хт=0 при п =/= т п=1
— такое представление и пусть {Д}— фундаментальная последовательность в L2(X, |i). Таким образом, для каждого е>0 существует такое Л/, что
[Д W -’ fi (х)12 dp < е для всех k, l^N.
Введем обозначение
<р(х) при хеД, О при остальных х.
') Доказательство полноты пространства Z-i, проведенное в § 1, не зависит, очевидно, от предположения конечности меры пространства X.
<р(п) (х) =
5 21
ПРОСТРАНСТВО is
385
Тогда в силу свойства о-аддитивности интеграла Лебега, имеем
оо
J [ffc (*) - ft (х)]2 dH = £ $ №n) (*) - f?> to]2 < e.
n=l Xn
Для каждого конечного M и подавно
м
Е $[^)W-f<n>(x)]2dH<8.	(3)
П=1 хп
Совокупность функций с интегрируемым квадратом на каждом Хп представляет собой полное пространство. Положив
fW (х) = lim f jn) (х)
I -> оо
(где сходимость понимается как сходимость в пространстве Z2(Xn, |i)), мы можем перейти к пределу при /->оо в неравенстве (3). Получаем
м
£ J [fkn)W-f(n)(x)]24i<e.
П=1 хп
Так как это неравенство выполнено для всех Af, то в нем можно перейти к пределу при Af->oo. Таким образом, имеем
со
Z $[nn)W-f(n)W]2^<e.
п=1 хп
Положив
fto = f(n)to при Х(=хп,
мы можем последнее неравенство переписать в виде
$ [fn W— f (x)]2dp<e.
Отсюда вытекает как принадлежность f к L2(X, pi), так и сходимость последовательности {/„} к f.
Упражнение. Определим Lp(X,p) как совокупность классов эквивалентных между собой функций, для которых | / (х) dpi < со, где 1 р < < оо. Доказать, что LP(X, ц) является банаховым пространством относительно нормы II / II = ( j I f (X) \Р du) /Р.
3.	Всюду плотные множества в L2. Теорема об изоморфизме. Итак, пространство L2(X, ц) функций с интегрируемым квадратом есть полное евклидово пространство. За исключением вырожденных случаев, размерность этого пространства бесконечна.
386
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ
[ГЛ. VII
С точки зрения различных применений в анализе важно выяснить, когда пространство L2(X, ц) сепарабельно, т. е. содержит счетное всюду плотное множество. В § 1 мы установили, что для пространства Ь^(Х, ц) сепарабельность вытекает из существования у меры ц счетного базиса. Нетрудно убедиться, что это условие гарантирует и сепарабельность Ь2(Х, ц). Действительно, каждую функцию из Ь2(Х, ц) можно приблизить, с любой точностью, функциями, каждая из которых равна 0 вне некоторого множества конечной меры1). Далее, те же рассуждения, которые были проведены при доказательстве теоремы 3 § 1, показывают, что в совокупности таких функций можно выбрать счетное всюду плотное множество.
Итак, если мера ц имеет счетный базис, то пространство L2(X, ц) есть полное сепарабельное евклидово пространство. Иначе говоря, оставляя в стороне тот случай, когда L2(X, ц) имеет конечную размерность, мы получаем следующий результат: если мера ц имеет счетный базис, то Ь2(Х, ц) есть сепарабельное гильбертово пространство.
В силу теоремы об изоморфизме гильбертовых пространств, это означает, что все такие Ь2(Х, ц) изоморфны между собой. В частности, каждое такое Ь2(Х, ц) изоморфно пространству 12 числовых последовательностей со сходящейся суммой квадратов. Последнее можно рассматривать как L2(X, ц), когда X счетно, а ц определена на всех его подмножествах и равна 1 для каждой точки. Ниже мы будем рассматривать только Ь2(Х,р), отвечающие мерам со счетным базисом. В случаях, когда это не может вызвать недоразумений, каждое такое пространство мы будем обозначать просто Ь2.
Поскольку пространство L2 представляет собой, как мы выяснили, реализацию гильбертова пространства, на Ь2 можно перенести все те понятия и факты, которые были установлены в § 4 гл. III для абстрактного гильбертова пространства.
В частности, согласно теореме Рисса всякий линейный функционал в гильбертовом пространстве Н записывается в виде скалярного произведения
F (Л) = (Л, а),
где а — фиксированный вектор из Н. Поэтому всякий линейный функционал в L2 имеет вид
где g — фиксированная функция с интегрируемым квадратом на X.
>) Если ц(Х)< оо, то этот шаг отпадает.
§ 2]
ПРОСТРАНСТВО L,
387
4.	Комплексное пространство L2. Мы рассматривали сейчас действительное пространство Ь2. Изложенные результаты легко переносятся на комплексный случай. Комплексная функция f, определенная на некотором пространстве X с заданной на нем мерой ц, называется функцией с интегрируемым квадратом, если интеграл
^|f (x)|2d|x х
конечен. Определив сложение таких функций и умножение их на числа обычным образом и введя скалярное произведение по формуле
(f> g) = \f W g(x)dn,
x
мы получим евклидово пространство, называемое комплексным пространством Ь2. (При этом, как и в действительном случае, мы считаем эквивалентные между собой функции одним и тем же элементом пространства.) Это пространство полно, а если мера ц имеет счетный базис, то и сепарабельно. Таким образом (отбрасывая конечномерный случай), мы получаем, что комплексное пространство Ь2, отвечающее мере со счетным базисом, есть комплексное сепарабельное гильбертово пространство. Все такие пространства изоморфны между собой, и для них справедливы результаты, изложенные в § 4 гл. III.
5.	Сходимость в среднем квадратичном и ее связь с другими типами сходимости функциональных последовательностей. Введя в пространстве Ь2 норму, мы определили тем самым для функций с интегрируемым квадратом следующее понятие сходимости:
если
lim Ufn(x) — f (x)]2dp = 0.
rt->oo J
Мы назвали такую сходимость сходимостью в среднем квадратичном. Посмотрим, как такая сходимость связана с другими типами сходимости функциональных последовательностей. Предположим сначала, что мера пространства-«носителя» X конечна.
1.	Если последовательность {fn} функций из Ь2(Х, ц) сходится в метрике Ь2(Х, ц), то она сходится и в метрике L^X, ц).
388
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
(ГЛ VIT
Действительно,в силу неравенства (2) имеем
$ I f«(x) — f (х) |d|x < [|Х (X) $ (fn (х) - f (х))2 dj'2, откуда и следует наше утверждение.
2.	Если последовательность {/п} сходится равномерно, то она сходится и в среднем квадратичном.
Действительно, при каждом е > 0 при всех достаточно больших п имеем
I f п (х) — f (х) | < е и, следовательно,
J[Mx)-f(x)№<8W).
откуда вытекает наше утверждение.
3.	Если последовательность суммируемых функций {/п} сходится в среднем, то она сходится на X и по мере.
Это утверждение сразу же следует из неравенства Чебышева (стр. 300).
Отсюда и из теоремы 8 § 4 гл. V вытекает:
4.	Если последовательность {/п} сходится в среднем, то из нее можно выбрать подпоследовательность }, сходящуюся почти всюду.
Заметим, что при доказательстве теоремы о полноте пространства Lx мы уже установили этот факт, не опираясь на теорему 8 § 4 гл. V.
Нетрудно убедиться в том, что из сходимости некоторой последовательности в среднем (и даже в среднем квадратичном) не вытекает, вообще говоря, ее сходимость почти всюду. Действительно, последовательность {/п}, построенная в п. 6 § 4 гл.У, сходится к f = 0 в среднем (и даже в среднем квадратичном), но при этом, как мы видели, она не сходится к 0 ни в одной точке. Обратно, последовательность {/п} может сходиться почти всюду (и даже всюду) и не сходиться при этом в среднем. Рассмотрим, например, на отрезке [0,1] последовательность функций
( п при х <= (0, 1/п], f (х) = s
(0 при остальных х.
Очевидно, fn(x)->0 при всех хе[0, 1]. Но в то же время
1
I fn (х) | dx = 1 при всех п.
§ 3]
ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L,
389
Связь между различными типами сходимости в случае ц (X) <_ < оо можно изобразить следующей схемой:
где пунктирная стрелка означает возможность выбора из последовательности, сходящейся по мере, подпоследовательности, сходящейся почти всюду.
В случае ц(А')= оо (например, для функций на всей числовой прямой с мерой Лебега на ней) установленные выше связи уже не имеют места. Например, последовательность
М*) = {
1/Vn о
при при
| X п,
| X | > п .
сходится равномерно на всей прямой к функции f= 0, однако она не сходится ни в среднем, ни в среднем квадратичном. Далее, при ц(Х)= оо, как мы уже указывали, сходимость в среднем квадратичном (т. е. в Ь2) не влечет за собой сходимости той же последовательности в среднем (т. е. в Ц).
Заметим в заключение, что из сходимости в среднем ни при р(Х)<; оо, ни тем более при ц(Х) = оо не следует, вообще говоря, сходимость в среднем квадратичном.
§ 3. Ортогональные системы функций в L2. Ряды по ортогональным системам
Общие теоремы, установленные в § 4 гл. III для евклидовых пространств, говорят нам, что в L2 имеются полные ортогональные (в частности, ортогональные и нормированные) системы функций. Такие системы можно получить, например, применяя процесс ортогонализации, описанный там же, к той или иной полной системе. Если в Ь2 выбрана некоторая полная ортогональная система {<рп}, то, опять-таки в соответствии с общими
390
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
[ГЛ. VH
результатами § 4 гл. III, каждый элемент можно представить как сумму ряда
оо
f = Е с„<р„ п=1
— ряда Фурье функции f по ортогональной системе {<рп}. При этом коэффициенты сп — коэффициенты Фурье функции f по системе <рп — определяются формулами
С" = f фп 0 фп ||2 = $ ф« W d(X) •
В этом параграфе мы рассмотрим важнейшие примеры ортогональных систем в пространствах L2 и отвечающие им разложения.
1. Тригонометрическая система. Тригонометрический ряд Фурье. Рассмотрим пространство L2 [—л, л] функций с интегрируемым квадратом на отрезке [—л, л] с обычной мерой Лебега на этом отрезке. В этом пространстве функции
1, cosnx, sinnx (n=l,2, ...)	(1)
образуют полную ортогональную систему, называемую тригонометрической. Ортогональность легко проверяется прямым вычислением, например, при п=/= m
я	я
S,	1 I Г п + m . п — ml, „
cos лх cos tnx ах = у \ I cos —— х + cos —-— xj dx — 0
— я	—я
и т. д. Полнота системы (1) следует из теоремы Вейерштрасса об аппроксимации любой непрерывной периодической функции тригонометрическими многочленами1). Система (1) не нормирована. Соответствующая нормированная система состоит из функций
1 cos пх sin пх .	. о х
-7=-. ----7=~,	—7=^ (л=1,2, ...).
У2л -ул -ул
Пусть /— функция из L2[—л, л]; ее коэффициенты Фурье, отвечающие функциям 1, cos их, sin их, принято обозначать Ло/2, ап и Ъп. Такрм образом, в соответствии с общими формулами для
’) В § 2 гл. VIII мы докажем теорему Фейера, представляющую собой усиление теоремы Вейерштрасса. Тем самым будет дано и доказательство полноты тригонометрической системы (не опирающееся, конечно, на излагаемые здесь факты).
§ 3]	ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИЙ в ь	391
коэффициентов	Фурье, имеем
Я	я
= i \fMdx, т. е. а0 = ^ \f(x)dx Z	/л J	J
—я	-я
И я	я
а„=у j f (х) cos пх dx, bn — -^- f (х) sin пх dx. — Я	—я
Соответствующий ряд Фурье имеет вид оо + У' ап cos пх + bn sin пх п=1
и для любой функции f е L2 сходится в среднем квадратичном именно к ней. Если
п
Sn (х) = -у- + У' ak cos kx + bk sin kx t=i
— частичная сумма ряда Фурье, то среднее квадратичное уклонение Sn от f можно найти по формуле
/ 2 п	\
||f (х) - S„(x)||2 = ||f Ц2 —+ **)• А=1	'
Среди всех тригонометрических многочленов п тп (х) = -у- + У ak cos kx + Р* sin kx fe=i
с данным n частичная сумма ряда Фурье Sn дает наилучшую (в метрике Ь2) аппроксимацию функции f. Неравенство Бесселя для тригонометрической системы имеет вид
9	оо	Я
+	+	\f2(x)dx,
n—l	—я
но поскольку тригонометрическая система полна, на самом деле для любой функции из L2 имеет место равенство Парсеваля
2	2
п=1	-л
392
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
[ГЛ. VII
Для любой функции f е L2 квадраты ее коэффициентов Фурье образуют сходящийся ряд. Обратно, если числа ао, ап, Ьп (п = оо
= 1,2,...) таковы, что ряд У, а2п Ь2п сходится, то ряд оо
•у- + ап cos пх + bn sin пх
тоже сходится (в L2), а его сумма представляет собой функцию, имеющую ао, ап, Ьп своими коэффициентами Фурье.
Все эти утверждения (непосредственно вытекающие из общих результатов § 4 гл. III) легко переносятся на функции, заданные на отрезке произвольной длины, скажем [—I, /]. Если f— функция с суммируемым квадратом на [—I, Z], то замена x—ntjl, т. е. t = lx/п, переводит f(t) в функцию f*(x) = f (•^)на отрезке [—я, л].
В соответствии с этим
i
ап=у ^f(t)cos^dt, n = 0, 1, ...
-i и
I
6„ = -j- j f (Z)sin dt, n=l,2, ... -i
Ряд Фурье для функции f, заданной на отрезке длины 21, имеет вид
оо
аа . V* nnt । l •
-^- + 2,^005—+ &„ SIH—.
rt=l
Замечания. 1. Тригонометрические ряды были использованы французским математиком Ж. Фурье в его работах по математической физике, в первую очередь по теории распространения тепла. Впрочем, формулы для коэффициентов ап и Ьп встречаются уже у Эйлера. В дальнейшем теория тригонометрических рядов развивалась в работах Римана, Дирихле и др. Первоначально термины «ряд Фурье», «коэффициенты Фурье» и т. д. связывались именно с тригонометрической системой и лишь значительно позднее стали употребляться в общем смысле, описанном в § 4 гл. III (т. е. применительно к произвольной ортогональной системе в любом евклидовом пространстве).
§ 31	ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L,	393
2. Из полноты тригонометрической системы и общих теорем § 4 гл. III следует, что для любой f е L2 ее ряд Фурье
оо
-у- + ап cos пх + bn sin пх
п=1
сходится к данной функции f в среднем. Однако с точки зрения конкретных задач анализа важно установить условия, при которых этот ряд сходится к f в другом смысле, скажем, в каждой точке, или равномерно. Этот круг вопросов мы рассмотрим в следующей главе.
2. Тригонометрические системы на отрезке [0, л]. Функции
1, cosx, cos 2х, ...	(2)
и
sinx, sin 2х, ...	(3)
образуют в совокупности полную ортогональную систему на отрезке [—л, л]. Покажем, что каждая из двух систем (2) и (3) ортогональна и полна на отрезке [0, л]. Ортогональность проверяется прямым подсчетом. Докажем полноту системы (2). Пусть f — функция с интегрируемым квадратом на [0, л]. Доопределим ее на полуинтервале [—л, 0) формулой
f(-x) = f(x)
и разложим ее в ряд Фурье по системе
1,	cosnx, sinnx (n=l, 2, ...).
Поскольку функция f, определенная теперь на [—л, л], — четная, все коэффициенты при синусах равны у нее нулю. Это сразу видно из формулы для коэффициентов: для четной функции f при п I
л	0	л
f (х) sin пх dx — f (х) sin пх dx + f (х) sin пх dx —
-л	-л	о
л	л
= — f (х) sin пх dx + f (х) sinnx dx = 0.
о	о
Иначе говоря, эту функцию на [—л, л] (а тем более и на [0, л]) можно аппроксимировать в среднем квадратичном с любой точностью линейными комбинациями элементов системы (2). Отсюда следует полнота системы (2). Полнота системы (3) на (0, л] доказывается аналогично, путем нечетного продолжения функции f, заданной на [0, л], на полуинтервал [—л, 0) по формуле
f( — х) = — f (х).
394
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ
[ГЛ. VII
Полученная при таком продолжении функция на [—л, л] нечетна и разлагается на этом отрезке по одним синусам.
3. Ряд Фурье в комплексной форме. Тригонометрический ряд можно записать компактно, если воспользоваться формулами Эйлера
Plnx , -inx	inx __ -inx
cos пх - -—V------ и si п пх =  ---.
Внося эти выражения в ряд Фурье, получим
-у- + У* ап cos пх + bn sin пх =
п=1
п=1
=-г+Е ib"einx+Е °" ibn e~inx = Е с«е'пх>
n=l	n=l	n=-OC
где c0 — a0/2 и при n 1
a„ — ibn
cn— 2
_	_ an + ibn
^—n —	2	' >
Выражение
y Ce‘"
n= — co
(4)
называется тригонометрическим рядом Фурье в комплексной форме. Коэффициенты сп этого ряда выражаются через ап и Ьп с помощью равенств (4); однако легко написать для них и прямые формулы. Действительно, как показывает непосредственное вычисление, л г , ,	| 0 при n=/=m,
\einxe~lmx dx = \
( 2л при п = пг.
Поэтому, умножая равенство
fW= X спе1пх	(5>
л=—оо
на e~imx (т — 0, ±1, ±2, ...) и интегрируя, получаем
Л
f (x)e~imlcdx = 2ncm,
-Л
•§ 31
ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИЙ В L,
395
т. е.
я
= \f(x)e~lmxdx	(m = 0, ±1, ±2, ...).	(6)
— Я
Разложение (5) остается в силе и для комплексных функций с интегрируемым квадратом на отрезке [—л, л]. Иначе говоря, функции einx образуют базис в пространстве L2[—л, л] комплексных функций с интегрируемым квадратом модуля на отрезке ]—л, л]. При этом выражения (6) представляют собой скалярные произведения f на eimx в этом комплексном пространстве.
. пл X — X
Заменив функции е‘пХ на е 1 , можно перенести все сказанное на пространство Аг[—А /] комплексных функций на отрезке произвольной длины 21.
4. Многочлены Лежандра. Линейные комбинации функций
1, х, х2, ...	(7)
— это совокупность всех многочленов. Следовательно, система (7) полна в пространстве L2 функций на произвольном отрезке1). Ортогонализируя систему (7) на отрезке [—1,1] по отношению к скалярному произведению
1
(f, g)= f (x)g(x)dx,
-I
мы получим полную ортогональную систему
QoW, QiW, Q2(x).....
где Qn — многочлен л-й степени. Покажем, что каждый из многочленов Qn(x) совпадает, с точностью до постоянного множителя, с многочленом
/?nW = ^r(x2-Dn.
В самом деле, во-первых, система {/?„} ортогональна. Пусть п т. Так как
^(«-1)4-.,-^-!)!„, -о
') Полнота системы многочленов в пространстве L2[a, 6] функций с интегрируемым квадратом на произвольном отрезке [а, &] вытекает из теоремы Вейерштрасса о равномерной аппроксимации любой непрерывной функции на отрезке многочленами. См. п. 2 § 2 гл. VIII.
396
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ
(ГЛ. VII
при всех k = 0, 1, п — 1, то, интегрируя по частям, получаем
1 1
Rm(x) Rn(x) dx — — \l)w-^^-(х2—1)" = ...
,	J, dx +	dxn
— 1	— I
1
Г Г Я« + я	1
•••=(-1)n \[-£^(x2~1)mp2-1)n^- <8>
Если m < n, то под знаком последнего интеграла стоит тождественный нуль, откуда следует ортогональность системы {/?п}.
Во-вторых, ясно, что многочлен Rn имеет степень п, т. е. каждый Rn лежит в подпространстве, порожденном «+ 1 первыми элементами системы (7). Таким образом, как система {/?п}, так и система {Qn} обладают следующими свойствами:
1) ортогональность,
2) n-й элемент системы принадлежит подпространству, порожденному элементами 1, х, ..., хп~1.
Но этими двумя свойствами каждый элемент системы определяется однозначно с точностью до числового множителя (теорема 1 § 4 гл. III).
Найдем теперь нормирующие множители для Rn(x). В случае п = т равенство (8) дает
1 1
J/?2(x)6fx = (-l)n J [jgL(X2-l)"](x2- 1)" dx =
1
(l-x2)"dx = -^ ]	\
Иначе говоря, норма многочлена Rn равна n! 2" s\j• Таким образом, система многочленов
"пЛу*" д/
не только ортогональна, но и нормирована.
Обычно рассматриваются не эти нормированные многочлены, а многочлены, определяемые формулой
Рп = «11^ dP" — •
) Последний интеграл можно вычислить элементарно, применяя рекуррентные формулы, или же путем сведения его к В-функции.
S 31
ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L2
397
О при n=/=m, 2
[гТ+Т ПРИ n==m-
пяти первых многочленов Ле-
1
Их называют многочленами Лежандра, а саму эту формулу — формулой Родрига. Из проведенных выкладок следует, что
1
J Pn(x)Pm(x)dx = -j
Приведем явные выражения жандра:
Ро(х)=1, Р1 (х) = х,
Р2(х) = у.
р3 w=4%3—4х’
г> / \	35 д 15 о । з
Р4 W “g- Х Х “Ь "д' •
Разложение функции f на отрезке [—1, 1] по многочленам Лежандра имеет вид оо
f W=S СпРп (х),
П=0 где 1
J f (*) Рп (*) dx.
-1
5. Ортогональные системы в произведениях. Кратные ряды Фурье. Пусть на множествах X' и X" определены меры ц' и р". Соответствующие пространства функций с интегрируемым квадратом будем обозначать L2 и Ь2. В произведении
Х = Х' XX" рассмотрим меру
р. — у' ® ц"
и обозначим через L2 отвечающее ей пространство функций с интегрируемым квадратом. Функции из Ь2 будем записывать как функции двух переменных.
Теорема 1. Если {фт} и {фп} — полные ортонормальные системы соответственно в Ь2 и в Ь2, то система всех произведений fmn(x, у) = фт (х) ф„ (у)
есть полная ортонормальная система в Ь2.
Доказательство. В силу теоремы Фубини (замечание)
$ fmn (*’ dV- = J Tm w ( J (^) dp' = 1.
X	X' \X"	J
398
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
(ГЛ. VII
Если т =/= mh то в силу той же теоремы
y)fm,nSx> у№ =
X
= $ Ф„ (у) Ф„, (у) ( J Фж W Ф«, (х) du" = О, X"	\Х'	/
поскольку функция fmn (х, у) fmith (х, у) двух переменных суммируема на X = X' X %"
Если т = mi, но п =/= п\, то
$ fmn (х> У) fmini (*> У)^ = J Фж W ( J Ф„ (//) Ф„, (у) dp,' = 0.
X	X'	\Х"	/
Докажем полноту системы {fmn}- Допустим, что в Ь2 существует функция f, ортогональная ко всем функциям fmn. Положим
?М = Jf (х, y)(pm(x)dp'.
X'
Легко видеть, что функция Fm(y) имеет интегрируемый квадрат. Поэтому Fm(y)tyn(y) при любом п интегрируема. Снова используя теорему Фубини, получаем
J ?т (У) Фп (У) dp"= J f (х, у) (х, у) dp = 0. X"	X
В силу полноты системы {фп} отсюда вытекает, что для почти всех у
Fm(y) = 0.
Но тогда при почти каждом у имеют место равенства
\f(x, у) ф„ (х) dp' = 0
X'
для всех т. В силу полноты системы {срт} отсюда получается, что при почти каждом у множество тех х, где
f (х, у) 0,
имеет меру нуль. В силу теоремы Фубини это означает, что на X функция f (x, у) равна 0 почти всюду.
Применим эту теорему к некоторым конкретным ортогональным системам. В пространстве функций двух переменных
f (х, у) (— л <х, у^л)
§ 3J
ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L,
399
с интегрируемым квадратом полную ортогональную систему образуют попарные произведения элементов систем:
1, cosтх, sinmx (т=1, 2, ...) и
1, cos пу, sin пу (п — 1, 2, . ..), т. е. функции
1, cos тх, sin тх, cosпу, sin пу, cos тх sin пу, cos тх cos пу, sin тх sin пу, sin тх cos пу. Соответствующий ряд Фурье выглядит несколько громоздко, поэтому здесь удобнее пользоваться показательными функциями eimxeiny _ ei (тх+пу)	m = Qt ±1, ±2, . ..).
Этому базису отвечает ряд Фурье f (х, у) —	£ cmnel ^х+пу)г
т, где я я
ст»=4^- J J Ж y)e-i(mx+ny'>dxdy. —я —л
Многочлены Лежандра дают в пространстве функций, определенных на квадрате — 1 у < 1, полную ортонормальную систему, состоящую из многочленов
С? (х и) =	+ 1) dm , 2 _	, 2 _ jxn
ЧпиЛ ’ У) mlnl2m+n+l dxm 1 J dyn{y
Все сказанное очевидным образом переносится на функции нескольких переменных. В частности, тригонометрический ряд Фурье для функции k переменных имеет вид
Ж.......*k) = f сп, ... n/(W-+n^),
П1 ... пк-ОО
где я	я
•••	.....xt)e-,(Vi+-+^)dX1...t/Xfc.
I ' -я	-я
6. Многочлены, ортогональные относительно данного веса. Мы пришли к многочленам Лежандра, ортогонализируя функции
1, х, х2...хп, ...	(9)
400
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
|ГЛ. VII
относительно скалярного произведения
1
5 f(x)g(x)dx, -1
отвечающего обычной мере Лебега на отрезке [—1, 1]. Если на этом отрезке задать какую-либо иную меру ц, такую, что функции (9) в соответствующем пространстве Ь2 со скалярным произведением f(x)g(x)dp линейно независимы, то, применив к — I
(9) процесс ортогонализации, мы придем к некоторой системе многочленов {Qn}, зависящей, вообще говоря, от выбора меры ц. Предположим, что мера ц определена для измеримых по Лебегу подмножеств сегмента [—1, 1] формулой
p(E) = ^g(x)dx,	(10)
Е
где g — фиксированная неотрицательная суммируемая функция. Условие ортонормальности
( 1 при т — п, (Qm, QJ = [0 при
в этом случае записывается в виде 1
( Qm(x)QJx)g(x)dx = f * ПрИ	(И)
(, 0 при т^=п.
Функция g, определяющая меру (10), носит название веса или весовой функции. Таким образом, про многочлены, удовлетворяющие условию (И), говорят, что они ортогональны с весом g. Выбор того или иного веса приводит к различным системам многочленов. В частности, положив
мы получим многочлены, совпадающие с точностью до постоянного множителя с так называемыми многочленами Чебышева, которые определяются формулой
Тп (х) = cos п arccos х (п=1, 2, ...)
и играют важную роль в различных интерполяционных задачах.
§ 3]
ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L,
401
Ортогональность этих многочленов относительно веса 1/V 1 — х2 легко проверяется. Действительно, полагая
x = cos0, dx = — sin0d0, V1 ~ x2 = sin0,
получаем
I	л	л
St (г\т	Г	V	при	т = п,
——	" '..J- dx — \ cos m0 cos и0 d0 = 2
_i	V1	— x2	J	о	при	m=/=n.
7.	Ортогональный базис в пространствах £2(—°0, °°) и 12(0, оо). Выше мы рассматривали ортогональные системы на отрезке, т. е. на множестве конечной меры. Рассмотрим теперь случай бесконечной меры, а именно, пространство Ь2(—оо, оо) функций с интегрируемым квадратом на всей числовой прямой. Ортогональную систему функций в нем нельзя построить ни из многочленов, ни из тригонометрических функций, ибо ни те, ни другие не принадлежат этому пространству. «Материал» для построения базиса в Ь2(—оо, оо) естественно искать среди функций, достаточно быстро убывающих на бесконечности. В частности, такой базис можно получить ортогонализацией последовательности
хпе-хг/2 (n = 0, 1, 2, ...).
Действительно, всякая функция вида Р(х)е~х'12, где Р— многочлен, принадлежит, очевидно, Ь2(—оо, оо), а полнота системы (12) будет доказана в п. 3, § 4 гл. VIII.
Применив к функциям хпе~х‘12 процесс ортогонализации, мы получим систему функций вида
<Pn(x) = //„(x)e-*’/2 (n = 0, 1, 2, ...),	(12)
где Нп— многочлен степени п. Эти многочлены называются многочленами Эрмита, а сами функции <рп—функциями Эрмит. Нетрудно показать, что многочлены Эрмита совпадают, с точностью до постоянного множителя, с многочленами
Hna~x‘
Действительно, многочлен Н*п имеет, очевидно, степень п, а соотношение ортогональности оо
J Нт (х) Hn (х) е~х' dx = 0	п)
— 00
легко получить интегрированием по частям. В силу теоремы об ортогонализации существует лишь одна, с точностью до постоянных множителей, система ортогональных функций вида Рп(х)е~*2/2, где Рп — многочлен /г-й степени.
402
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИИ
(ГЛ. VII
Полученный результат допускает и такое истолкование. Рассмотрим на прямой меру ц, имеющую плотность е-*’, т. е. такую, что
dp — e~x'dx.
Это —конечная мера. В пространстве функций, интегрируемых с квадратом по этой мере, скалярное произведение имеет вид оо
(Л g) = J f(x)g(x}e-*2dx, — со
а многочлены Эрмита образуют в нем ортогональную систему.
Рассмотрим, наконец, пространство Л2(0, оо) функций с интегрируемым квадратом на полупрямой. Взяв в нем систему функций
xrte-x (n = 0, 1, 2, ...)
и применив к ним процесс ортогонализации, мы получим систему функций
Ln (х) е~х,
называемых функциями Лагерра.
Соответствующие многочлены Ln называются многочленами Лагерра. Многочлены Лагерра можно рассматривать как ортогональный базис в пространстве функций, квадрат которых интегрируем на полупрямой (0, оо) по мере
d\L — e~xdx.
В п. 3 § 4 гл. VIII мы докажем, что система функций Лагерра полна в Л2(0, оо).
8.	Ортогональные многочлены с дискретным весом. Пусть п + 1 различным точкам Хо, хь ..., хп действительной прямой приписаны в качестве «весов» положительные числа ро, Pi, ... ..., рп, а мера ц определена формулой
ц(£)= Е Pk,
xksE
т. е. p(£) равна сумме весов, содержащихся в Е точек Хд. Измеримыми по этой «вырожденной» мере являются здесь любые множества и функции на прямой, причем любое множество не содержащее точек хд (k — 0, 1, ..., п), имеет меру 0. Тем самым интеграл по всей действительной прямой от функции f равен
ОО	П
J f (x)dp = £pj(xft), — оо	fteO
ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L,
403
« 3]
а скалярное произведение дается формулой
(Л g)= Е Pkf (хк) g (хк). k=Q
Очевидно, что функции fag будут эквивалентны по мере ц, если
f (xk) = g(xk)
во всех точках xq, хь ..., хп, и только в этом случае.
Для этого вырожденного случая задача наилучшей аппроксимации в смысле расстояния в L2 сводится к определению сумм
Софо + С1Ф1 + • • • + стфт» обращающих в минимум выражение п	/	т	\ 2
Е рА fM — Е с<ф/ М ( . А=0 (.	>=1	)
т. е. к задаче «интерполирования по методу наименьших квадратов».
В связи с задачей интерполирования по методу наименьших квадратов многочленами заданной степени П. Л. Чебышев развил теорию ортогональных многочленов. Чтобы изложить относящиеся сюда результаты Чебышева, заметим, что система
1, х, х2, .... хп	(13)
при нашей мере ц линейно независима, так как скалярное произведение (хТ, Xs) выражается формулой
« Xs) = £ pkxr+s fe=0
и детерминант Грамма системы (13) есть (суммы по k от 0 до п)
Ера	Ерл	Zpkx2k .	• Е Pkxnk
Ерл	Е рА	ЕрЛ •	• ЕрЛ+1
Ерл	Zpkxk+1	ЕрЛ+2	• • Е pkx2kn
^Ро	Pl • • УрУо Урл ••	У Рп ^~РпХп	2 ~РоР1 .	•  Рп	1 1 . Х0 Х| .	.. 1 •• хп	2 =#=0.
УРохо УрЛ ••				уП уП Л0 Л1 •	•• ХПп	
Наоборот, хг при г > п линейно зависят от функций системы (13), так как в нашем случае L2 имеет размерность п +. 1.
404
ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
[ГЛ. VII
Поэтому процесс ортогонализации приводит к конечной системе многочленов
/’о, Pf > • • • > Рпг
ортонормальных в том смысле, что п
£ PkPr (xk) Ps (хк) = drs к=0
и каждая функция f разлагается в конечный ряд п
f~ Е сгрг,
г=0
где
п
С г	Е PkPr [хк) f {хк).
k=0
В точках Хк выполняются равенства f (xk) = J crPr (xA) (k = 0, 1.................n),
r=0
т. e. полная сумма ряда есть просто интерполяционный многочлен Лагранжа. Неполные суммы
т
Qm = Е CrPr (т < П)
г=0
являются многочленами m-й степени, приближающими f в точках Хк наилучшим способом в том смысле, что выражение
Е Pk {f (xk) — Qm (xfe)}2
для Qm меньше, чем для любого другого многочлена той же степени т.
9. Системы Хаара и Радемахера — Уолша. Хааром был построен следующий пример полной системы функций на отрезке [0, 1]. Система эта состоит из функции
Фо = 1 и серий Фоь
Ф11, Ф12,
ф21> ф22> ф23, Ф21,
%!> Ч’пг.........ЧП2п
(п-я серия содержит 2п функций), где
<Poi —
+ 1,
-1,
0 <х < 1/2, 1/2<х<1, 7Х
Фп = 
-72, О,
0 < х < 1/4, 1/4 < х < 1/2, 1/2 < х < 1,
Ф12 — «
0,
7'2,
-72,
0<х<1/2, 1/2 < х < 3/4, 3/4<х<1.
S 3]
ОРТОГОНАЛЬНЫЕ СИСТЕМЫ ФУНКЦИИ В L,
405-
Вообще, положим (в точках разрыва значения функций можно брать произвольными)
’	2п/2	-f~ - < х <	1 4_____—
’ 2п	2п 2n+l ’
(п = 0, 1, 2, i = 1, 2.....2п).
Легко видеть, что построенная система ортонормальна. Докажем ее полноту.
Разобьем отрезок [0, 1] на 2"+1 равных интервалов Д< и рассмотрим множество Л4„+1 всех функций, сохраняющих постоянное значение на каждом из интервалов Д,. Очевидно, Л4„ + 1 есть линейное подпространство размерности 2П+'. Кроме того, все функции нашей системы до функций n-й серии включительно войдут в Mn+i. Так как эти функции в силу ортонормальности нашей системы линейно независимы и так как их число равно
1 + L 2ft = 2n+1,
й=0
то функция фо и функции фл, серий k = 0, 1......п образуют в Мл-н пол-
ную систему линейно независимых векторов. Отсюда, принимая во внимание,, что любая непрерывная функция может быть сколь угодно точно аппроксимирована функцией из Л1„ + 1 (при достаточно большом п), мы убеждаемся в полноте нашей системы.
Рассмотрим еще один пример ортонормальной системы функций на отрезке [0, 1], принадлежащий Радемахеру. Положим
q>m = (—
Иными словами, функция фт получается следующим образом: сегмент [0, 1J делится на 2т равных частей Дг, причем на интервалах Д,- (» = 1,	2т)
функция фт принимает попеременно значения +1 и —1.
Ортонормальность системы
Фо, ......Фп, •••	(14)
очевидна. Эта система не полна. Это следует хотя бы из того, что, например, функция
1, если 0 < х < 1/4 или 3/4<х<1,
—1, если 1/4 < х < 3/4,
ортогональна ко всем функциям системы (14). Однако последнюю можно расширить до полной ортонормальной системы, добавив к ней функции вида
<Рт1т2...т4 = Фт1Фт2---ФтА (0 < ^ < ГП,, < ... < mJ. (15)
Очевидно, что расширенная таким образом система, называемая системой Радемахера — Уолша, останется ортонормальной. Кроме того, она уже будет полной. Доказательство этого проводится аналогично доказательству полноты, системы Хаара,
Ф12 — Ф1Ф2 —
ГЛАВА VIII
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ.
ПРЕОБРАЗОВАНИЕ ФУРЬЕ
§ 1. Условия сходимости ряда Фурье
1. Достаточные условия сходимости ряда Фурье в точке. Рассмотрим снова пространство L2[—л, л] функций с суммируемым квадратом на отрезке [—л, л]. Это, как было показано в гл. VII, — полное бесконечномерное евклидово пространство, т. е. гильбертово пространство. Функции
1,	cosnx, sinnx (n=l, 2, ...)	(1)
образуют в нем полную ортогональную систему, поэтому для каждой функции f s L2[—л, л] ряд Фурье
ОО
-у- + cosnx + &„sinпх,	(2)
П=1
где л	л
ап = f (х) cos пх dx, bn = -^- f (х) sin пх dx, (3) —л	-л
сходится к f в среднем квадратичном, т. е. в метрике пространства L2[—л, л]. Однако в связи с применением рядов Фурье к задачам математической физики и другим вопросам будет существенно установить условия, гарантирующие сходимость ряда Фурье к f не только в среднем, но и в данной точке, всюду, или даже равномерно. Мы установим сейчас условия, достаточные для сходимости тригонометрического ряда в данной точке. Сделаем некоторые предварительные замечания.
Вместо функций, заданных на отрезке [—л, л], мы можем говорить о периодических функциях с периодом 2л на всей прямой, поскольку каждую функцию, заданную на отрезке, можно периодически продолжить1)- Далее, функции, образующие тригонометрическую систему, ограничены, поэтому формулы (3), определяющие коэффициенты Фурье по этой системе, имеют
>) Заменив, если нужно, fix) эквивалентной функцией, мы можем считать, что f(—л) = f(n).
УСЛОВИЯ СХОДИМОСТИ РЯДА ФУРЬЕ
407
смысл для любой суммируемой функции') (а не только для функций с суммируемым квадратом). Таким образом, каждой функции f е L\ [—л, л] отвечают совокупность ее коэффициентов-Фурье и ее ряд Фурье
fw-т + Е ап cos пх + bn sin пх. /т=1
Перейдем теперь к вопросу о сходимости этого ряда в данной точке х к значению функции f в этой точке. Положим
п
Sn W = -у- + £ ak cos kx + bk sin kx.	(4>
k=i
Преобразуем сначала Sn(x), подставив в (4) вместо коэффициентов ak и Ьк их интегральные выражения (3). Обозначив переменную интегрирования через t, мы получим
с ( п	1
Sn(x) =— \ / (/) у 4- + V cos kx cos kt + sin kx sin kt > dt — ” J	I z Z /	I
-n	4	A=1	'
n
у + £ COS k (t — x) fe=l
Воспользовавшись хорошо известной формулой2)
I	ып 2 и
у + cos и + cos 2и + • • • + cos пи =----------,	(5)
2sinT
будем иметь
sin -П + 1 (/ — jr) /(0-------х--------dt.	(6>
п
S.W=-H
') При этом, конечно, для произвольной суммируемой функции утверждений о сходимости ряда (2) мы не делаем.
') Для получения этой формулы достаточно просуммировать равенства
 и 1 „ и
s,n_=y.2s,n-, Зи и	„и
sin — — sin — = cos и • 2 sin -%,
никаких
+1	. 2л — 1	и
sin —-— и —sin —-— и = cos ли • 2 sin —.
408
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIH
Это представление Sn(x) и различные его модификации называются интегралом Дирихле.
Сделаем замену, положив t — х = z. Поскольку под интегралом в (6) стоит периодическая функция с периодом 2л, интеграл от нее по любому отрезку длины 2л имеет одну и ту же величину. Поэтому и при интегрировании по z мы можем сохранить прежние пределы —л и л. Получаем
Л
— Л
. 2п + 1 sin—
о •	2
2sin т
dz.
Функция
. 2п + 1
1 S,n 2
Dn(z) = -J-------------
' 2л ,2
Sin-
пазывается ядром Дирихле. Из равенства (5) сразу видно, что при любом п
Л
Dn (z) dz = 1.
—л
Используя это равенство, запишем разность Sn(x)— f(x) в виде
л	. 2п + I
. с	sin —5— Z
S„(x) — f (х) =	\ [f (х + z) — f (х)] -----dz. (7)
Л	sinT
Таким образом, мы свели вопрос о сходимости Sn(x) к f(x) к вопросу о стремлении к нулю интеграла (7). Исследование этого интеграла опирается на следующую лемму.
Лемма 1. Если функция ф суммируема на отрезке [а, Ь], то ь
lim \ (p(x)sinpxdx = 0. р->ОО J а
Доказательство. Ecjjjt <р — непрерывно дифференцируемая функция, то с помощью интегрирования по частям получаем, что при р->оо
ь	ь
ср (х) sin рх dx = — ср (х) cospp* |а + j ф' (*) С°|~ dx °-	(8)
а	а
Пусть теперь ф — произвольная суммируемая на [а, 6] функция. Поскольку непрерывно дифференцируемые функции всюду плот
§ 1]
УСЛОВИЯ СХОДИМОСТИ РЯДА ФУРЬЕ
40»
ны в Ai[a, Ь], для любого е > 0 найдется такая непрерывно дифференцируемая функция фе, ЧТО
ь
J I ф (х) — Фе (х) | dx < .	(9>
а
Далее, имеем
ь
ф(х)з1п pxdx
а
Ъ
j [ф (х) ~~ Фе (*)] siп Рх dx 4-а
ь
фе (х) sin рх dx _
Первое слагаемое справа меньше, чем е/2, в силу (9), а второе— стремится к нулю при р-э-оо согласно (8).
Лемма доказана.
Теперь мы легко можем доказать следующий достаточный: признак сходимости ряда Фурье.
Теорема 1. Если f — суммируемая функция и при фиксированном х и некотором 6 > 0 интеграл
в
j|H5,+0-Hx) \dt	(10).
-в
существует, то частичные суммы Sn ряда Фурье функции f сходятся в этой точке х к f(x).
Доказательство. Перепишем интеграл (7) в виде
Л
хс /<«.+.?)-.№). ^_sin2i+lZ(fe. (|1>
-я	2 sin у
Если функция f(x + z) — f(x)
Z
интегрируема (по г) в пределах от —6 до 6, то она интегрируема и на всем отрезке [—л, л] (поскольку feLj—л, л]). Но тогда интегрируема и функция
f (* + z) — f (х) . z	2 sin (z/2) ’
поэтому к интегралу (11) можно применить лемму 1, и мы получаем, что этот интеграл стремится к нулю, когда /г->оо.
Замечания. 1. Сходимость интеграла (10) называется условием Дйни. Оно, в частности, выполнено, если в данной точке х функция f непрерывна и имеет конечную производную, или хотя бы правую и левую производные.
•410
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. УШ
Рассуждения, проведенные при доказательстве теоремы 1, останутся в силе, если вместо условия Дйни потребовать сходимости следующих двух интегралов:
о
И* ±4-И*-°) dz и Z
-б
$ f(x + z)-f (x + 0)d2>	(12)
о
где f(x— 0) и f(x-)-O) суть левый и правый пределы функции f в точке х (предполагается, что х есть точка разрыва первого рода для [). Действительно, разность
5 (х) — в) 4х — 0)
можно представить в виде
2
о	. 2п + 1
1 Г	Sln-----2-----2
— \ [f (к + z) — f (х — 0)] —X	73;— dz +
л J 1/ 4	'	11 2 sin (z/2)	1
— Л
1 г
VpH^ + ^)-f(x + 0)]-2-n(-/2)........... dz-
0
при условии существования интегралов (12) эти выражения стремятся к нулю, когда п->оо.
Отсюда вытекают достаточные условия «глобальной» сходимости ряда Фурье, обычно приводимые в курсах анализа.
Пусть f — ограниченная функция с периодом 2л, имеющая разрывы лишь первого рода, и пусть f имеет в каждой точке левую и правую производные1). Тогда ее ряд Фурье сходится всюду, а его сумма равна f(x) в точках непрерывности и равна у (f (х + 0) + f (х — 0)) в точках разрыва.
2.	Ядро Дирихле Dn(z), игравшее основную роль в наших рассуждениях, представляет собой функцию, принимающую в точке z = 0 значение —— и при больших значениях п быстро колеблющуюся (рис. 22). В силу этого обстоятельства основной
>) В точке разрыва первого рода левая и правая производные понимаются как
/(х-Л)-Нх-О)	.. Нх + Л)-Нх + 0)
lim —-------—т------ и lim -----------т-------
h->0+	— я	Л->0+	л
соответственно.
«11
УСЛОВИЯ СХОДИМОСТИ РЯДА ФУРЬЕ
41Г
вклад в интеграл
л
f (х + z) Dn (z) dz
-л
при больших п дает лишь сколь угодно малая окрестность точки х. Для функций, удовлетворяющих условию Дини, этот вклад стремится к /(х) при /г->оо. Можно сказать, что ядра Дирихле Dn образуют последовательность функционалов, сходящуюся, в. некотором смысле, к б-функции на множестве функций f, разложимых в сходящийся ряд Фурье.
Ясно, что в смысле обычной сходимости последовательность {£)п} не стремится ни к какому пределу, поэтому, исследуя интеграл (7), мы не могли применить какие-либо стандартные теоремы о предельном переходе под знаком интеграла.
3.	Условие Дини, обеспечивающее сходимость ряда Фурье, мо-
жно заменить другими условия-	Рис- 22-
ми, но просто отбросить его в теореме 1 нельзя. Действительно, даже среди непрерывных существуют функции с рядом Фурье, расходящимся в некоторых точках. Среди суммируемых функций существуют такие, ряд Фурье которых расходится всюду (А. Н. Колмогоров). Еще в 1915 г. Н. Н. Лузин поставил следующую проблему: существуют ли в L2 функции, для которых ряд Фурье расходится на множестве положительной меры? Как показал Л. Карлесон (1966 г.), таких функций не существует.
Тот факт, что существуют непрерывные функции, для которых ряд Фурье сходится не во всех точках, легко вытекает из общих теорем о слабой сходимости функционалов (п. 3 § 3-гл. IV). Заметим прежде всего, что
Л
I Dn (г) | dz-+ оо при п-»оо.	(13>
— Л
Действительно, числитель дроби
|£>л(г)|= -I
n t Z 2п sin
I *
412
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII
обращается в 1 в точках, где
=	й = 0, 1, ...,л.	(14)
Окружим каждую из точек, определяемых условием (14), интер-
валом
2k + 1 I . п г---— л|<Т.
(15)

Длина любого из них равна, очевидно, , .. .В каждом из и \ Z/Z *т“ 1 )
I . 2л + 1 I	л т г\
этих интервалов sin——z не меньше, чем 1/2. Оценим вели-
чину sin у на й-м интервале (й = О, 1, ..., л). Имеем
 z . z \ (2k+\ lre\/2rt + l\“‘fc + l sinT<y<yl-^F- п+тД—[>-) <2Т+ТЯ-
Поэтому интеграл от |£)п(г)|, взятый только по промежуткам, определяемым условием (15), больше, чем сумма
га	п
I V1 1	1	4л _ 1 V 1
~2л L ~2 k + 1	3(2n + 1) ~ “ЗтГ Zj k + 1 •
ft='J	2п + 1 Л	А=о
Эта сумма стремится к оо при п->оо. Отсюда вытекает соотношение (13). Оно означает, что нормы функционалов Dn в пространстве непрерывных функций не ограничены в совокупности. Но тогда в силу теоремы о слабой сходимости функционалов эта последовательность не может быть слабо сходящейся на пространстве непрерывных функций, т. е. имеются непрерывные функции f, для которых
Л
lim \ Dn (х) f (х) dx
п-^со J
не существует.
2. Условия равномерной сходимости ряда Фурье. Мы установили условия, достаточные для сходимости ряда Фурье некоторой функции f в каждой точке. Класс функций, удовлетворяющих этим условиям, весьма широк, и даже непрерывность вовсе не необходима для представимости функции суммой всюду сходящегося тригонометрического ряда. Положение несколько изменится, если мы будем интересоваться условиями равномерной сходимости ряда Фурье. Ясно, что если функция f (х) имеет хотя бы один разрыв, то ее ряд Фурье не может сходиться к ней равномерно, поскольку сумма равномерно сходящегося
§ И
УСЛОВИЯ СХОДИМОСТИ РЯДА ФУРЬЕ
413
ряда непрерывных функций всегда непрерывна. Таким образом, непрерывность функции есть необходимое (но, конечно, не достаточное) условие равномерной сходимости ее ряда Фурье.
Простое достаточное условие дает следующая теорема.
Теорема 2. Если функция f с периодом 2л абсолютно непрерывна, а ее производная f' принадлежит L2 [—л, л], то ряд Фурье функции f сходится к ней равномерно на всей прямой.
Доказательство. Обозначим через ап и Ь’п коэффициенты Фурье функции f'. Так как f абсолютно непрерывна, то к интегралу Л
ап = -^- f (х) cos пх dx — Л
можно применить формулу интегрирования по частям. Получаем
Л
ап =-^~ f (х) cos nxdx =
— Л п	f
1 £, ч sin пх Iя 1 f «/л •	.
= — fix)-----------\ f (x)smnxdx =----:
« п 1_я пя J ' ' ’	п ’
—л
аналогично, л	,
if	а
bn = — \ f (х) sin пх dx = —. .
п	л J	1 х '	п
—л
Следовательно,
^+Ё1«л+1м=^+£41-+Ф- ов) п=1	п=1
Этот ряд сходится, поскольку
оо
a S Ь’п + а'п < оо в силу неравенства Бесселя. Числовой ряд
(16) служит, очевидно, мажорантой для ряда Фурье функции f. Но тогда, по признаку Вейерштрасса, ряд Фурье функции f равномерно (и абсолютно) сходится. Остается показать, что сумма этого ряда есть f. Пусть <р — сумма ряда Фурье функции f. Тогда ср имеет те же самые коэффициенты Фурье, что и f. Отсюда в силу непрерывности обеих функций получаем, что f == <р.
414
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIH
Можно дать другое условие равномерной сходимости ряда Фурье, аналогичное условию Дини, именно:
Теорема 3. Если на некотором множестве Е cz [—л, л] суммируемая функция f ограничена, а условие Дйни выполняется на Е равномерно, т. е. для всякого е > 0 существует такое 6 > 0, что
одновременно для всех х^Е, то ряд Фурье функции f сходится к этой функции равномерно на Е.
Доказательство этой теоремы основано на лемме, служащей усилением леммы 1 (см. стр. 408).
Лемма 2. Если В — предкомпактное в метрике L\ [—л, л] множество суммируемых функций, то для всякого е > 0 найдется такое N = N (е), что
fit) sin W dt
при Л Л/(е) для всех f^B одновременно.
Для доказательства леммы возьмем в В конечную е/2-сеть Ф1....<рь и выберем N так, чтобы
Ф,- (/) sin М dt
i — 1, 2, ..., k при Л N.
Если теперь f — произвольная функция из В, то при некотором i
Ilf — Ф,|| < е/2
и, следовательно, ь
ь	ь
f (/) sin kt dt ( ф, (/) sin Л/ dt + ( (f — q>t) sin kt dt < e.
Тем самым лемма доказана.
Применение этой леммы основано на том легко проверяемом факте, что в условиях теоремы 3 множество функций

предкомпактно. Дальнейшие подробности доказательства предоставляем читателю.
До сих пор мы говорили о функциях, заданных на отрезке [—л, л]. Ясно, что все сказанное может быть автоматически пере
3 2]
ТЕОРЕМА ФЕЙЕРА
415
несено на функции, определенные на отрезке произвольной длины 21.
Для случая нескольких независимых переменных тоже можно сформулировать как условия, достаточные для сходимости ряда Фурье в каждой точке, так и условия равномерной сходимости ряда Фурье. Мы не будем на этом останавливаться.
§ 2.	Теорема Фейера
1.	Теорема Фейера. Пусть f—непрерывная функция с периодом 2л на прямой. Эта функция определяется своим рядом Фурье
оо
-у- + ап cos пх + sin пх	(1)
однозначно. Действительно, если Л и /г — две непрерывные функции, имеющие одни и те же коэффициенты Фурье, то f\ — fz — непрерывная функция, равная нулю почти всюду и, следовательно, тождественный нуль. Однако поскольку ряд Фурье непрерывной функции, вообще говоря, не обязан сходиться, мы не можем такую функцию f получить непосредственным суммированием ее ряда Фурье. Способ восстановления непрерывной функции по ее ряду Фурье дает излагаемая ниже теорема, доказанная в 1905 г. Фейером.
.Пусть
k
Sfe (х) = -у- + й] cos jx + bj sin jx /='
— частичная сумма ряда Фурье функции f. Положим
о (х) —	+ Si (х) + ••• +Sn-1(*)
Выражения оп — средние арифметические сумм — называются суммами Фейера функции f.
Теорема 1. (Фейер). Если f — непрерывная функция с периодом 2л, то последовательность {оп} ее сумм Фейера сходится к f равномерно на всей числовой оси.
Доказательство. Воспользуемся полученным в предыдущем параграфе интегральным представлением частичных сумм ряда Фурье:
2k + 1 ‘ 2 Z а -----;—dz. 2 sm у
(2)
(3)
5*(х) = у \ f(x + z)
** V — П
416
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII
Подставив эти интегралы в равенство (3), получим для оп(х) следующее выражение:
а„ (х) =
. 2Л + 1 sin~2~ 2
г s,nT
> f (х 4- z) dz,
которое с помощью формулы ')
fl—1
У sin(2fe + l)z =
sin* 2 nz sin г
может быть Фейера-.
Выражение
представлено в виде так называемого интеграла
р / sin п У --------— f(x + z)dz.	(4)
-я \ siny )

(5)
называется ядром Фейера. Формулу (4) можно переписать в виде
Л
on{x) = J f (x + z)O„(z)dz.	(6)
-л
Нам нужно доказать, что при п~>оо это выражение равномерно стремится к f(x). Отметим предварительно следующие свойства ядра Фейера:
1)	Ф„(г)>0,
Л
2)	J<D„(z)dz = l,
— я
3)	при любом фиксированном 6 > 0 и п->оо имеем
-б	л
Ф„ (z) dz=\ Ф„ (г) dz = т]п (6) -> 0.
-л	в
') Эту формулу легко получить, суммируя по k равенства
2 sin (2k + 1) г • sin г = cos 2kz — cos 2 (k + 1) z.
§2]
ТЕОРЕМА ФЕЙЕРА
417
Первое из этих свойств очевидно, второе получается из равенства (6), если положить f(x) = 1 и учесть, что для такой функции а„(х)= 1 при всех п; наконец, третье свойство сразу выте-е	. z ^2д
кает из того, что если о < z л, то siny.^ — и> следовательно,
Учитывая эти свойства ядра Фейера, нетрудно доказать теорему. Так как функция f — непрерывная и периодическая, то она ограничена и равномерно непрерывна на всей прямой. Иначе говоря, существует такая постоянная М, что для всех х
\f(x)\<M	(7)
и для каждого е > О найдется такое б > О, что
\ f (х") — f (х') \ < ъ/2,	(8)
как только
I х" - х' | < б.
Для доказательства теоремы нам нужно оценить разность
Л
f(x) — Ст„(х)= jj [f(x) — f(x + z)]<D„(z)dz,
-л
которую можно представить в виде суммы следующих трех интегралов:
-в
7-= 5 w — f (^ + г)} ф„ (z) dz,
—л
б
4 = § {f (х) — f(x + z)} Ф„ (г) dz,
-б
л
/+ = 5 V W — f (* -г- г)} ф„ (г) dz. в
Из (7) и (8) непосредственно вытекают следующие оценки:
I /- |<2Л4т]„ (б),
IЛ К 2Мт]п (б),
в
I'oKf 5 Ф„(г)^г<|.
-б
418
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII
Выберем теперь л0 настолько большим, чтобы при п п0 и данном б выполнялось неравенство
2Мт]ч(д) < е/4.
Тогда
I f W — <т„ (х) | < е/2 + е/4 + е/4 = е,
откуда в силу произвольности е и следует утверждение теоремы.
Отметим, что при доказательстве мы использовали только свойства 1)—3) ядра Фейера. Это позволяет получать различные обобщения теоремы 1 (см., в частности, п. 3 этого параграфа).
2. Полнота тригонометрической системы. Теорема Вейер-штрасса. Из теоремы Фейера следует полнота тригонометрической системы в пространстве L2[—л, л]. Действительно, в силу этой теоремы любая непрерывная функция есть предел равномерно (а значит, и в среднем) сходящейся последовательности тригонометрических многочленов сгп. Остается заметить, что непрерывные функции всюду плотны в Ь2. Теорему Фейера можно рассматривать как усиление теоремы Вейерштрасса об аппроксимации непрерывных функций тригонометрическими многочленами: эта последняя устанавливает, что всякая непрерывная функция есть равномерный предел какой-то последовательности тригонометрических многочленов, а теорема Фейера указывает вполне определенную последовательность, обладающую этим свойством, — последовательность сумм Фейера (3). Из теоремы Вейерштрасса о равномерной аппроксимации непрерывной периодической функции тригонометрическими многочленами легко следует и вторая теорема Вейерштрасса — об аппроксимации алгебраическими многочленами любой функции, непрерывной на некотором отрезке [а, &]. Действительно, если f(x)— такая функция, то, положив t — *_ л, т. е. х = = Z а~ + о, мы получим функцию ф(/) от t, заданную на [О, л]. Продолжим ее вначале на полусегмент [—л, 0), положив <р(—— а потом, по периодичности, на всю прямую. Построим теперь тригонометрический многочлен Тп, удовлетворяющий условию
I Тп (/) — Ф (/) | < е/2 при всех t.
Далее, всякий тригонометрический многочлен разлагается в ряд Тейлора, сходящийся равномерно на любом конечном интервале. Пусть Рт — частичная сумма ряда Тейлора для Тп, такая, что
I Тп (0 — Рт (0 | < е/2 при 0	< л.
§ 3]
ИНТЕГРАЛ ФУРЬЕ
419
Тогда
| ф (0 — Рщ (О I < 8 ПРИ 0 t Л.
Сделав в Рт(О обратную замену t = * _ л, мы получим многочлен Qm(x), удовлетворяющий условию
IfU) —Q,n(*)l<8 при
3. Теорема Фейера для пространства L\. В теореме Фейера достигнута определенная симметрия между условием и утверждением теоремы. Из того, что функция f принадлежит пространству С [—л, л] непрерывных функций, следует, что отвечающие ей суммы Фейера сходятся к f в метрике того же самого пространства С [—л, л]. Аналогичные теоремы можно получить и для других функциональных пространств, в частности, для пространства L\ [—л, л]. Точнее говоря, имеет место следующая теорема, которую естественно назвать теоремой Фейера для суммируемых функций:
Если j — суммируемая на отрезке [—л, л] функция, то ее суммы Фейера сходятся к ней по норме пространства L\ [—л, л].
Доказательство этого утверждения может быть получено с помощью рас-суждений, близких к изложенным в п. 1. Мы не будем здесь их проводить, однако отметим следующий важный факт, вытекающий из теоремы Фейера для суммируемых функций.
Всякая суммируемая функция однозначно (с точностью до эквивалентности) определяется своими коэффициентами Фурье.
Действительно, пусть f и g— две суммируемые функции, имеющие одинаковые коэффициенты Фурье. Тогда все коэффициенты Фурье функции f — g равны 0. Следовательно, тождественно равны 0 и все суммы Фейера для f — g. Но тогда и их предел в Li, т. е. функция f — g, есть 0 почти всюду.
§ 3. Интеграл Фурье
1. Основная теорема. В § 1 были установлены условия, при которых периодическая функция может быть разложена в сходящийся ряд Фурье, т. е. представлена как суперпозиция гармонических колебаний. Попытаемся сейчас перенести этот результат на функции непериодические. Мы увидим, что при довольно общих дополнительных условиях такое представление возможно, но только уже с помощью не ряда, а интеграла, так называемого интеграла Фурье.
Начнем с наводящих соображений. Пусть функция f на каждом конечном интервале удовлетворяет условиям, обеспечивающим разложимость ее в ряд Фурье. Иначе говоря, предположим, что f суммируема на любом конечном интервале и в каждой точке удовлетворяет условию Дйни. Рассматривая f, скажем, на отрезке [—I, Z], мы можем написать разложение этой функции в ряд Фурье:
f (х) =	ak cos х + bk sin х.
fe=i
(1)
420
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ VTTT
Подставим сюда вместо а* и bh их выражения:
аа = у f (/) dt, ak = у / (/) cos -у-1 dt, -i	-i
i
Z»A = y j f(/)sin ^-tdt.
—i
Получим
г	“	‘
= jf ^dt + X 7 5 f (0 cos-j^-x cos-^-tdt +
-l	£=!	-I
I	I
+ y	f (t) sin-^-x sin ~tdt = -^ j f(t)dt +
-i	—i
oo I
+ у X j f (/) [cos -y-xcos-y-/ + sin -y-xsin ~ t\dt, A=1 -I
t. e.
i	» i
f(x) = ± J f^dt + ^l- J fW)c°sJr(t-x)dt. (2) — I	A=1	-I
Дополним предположения о функции f еще одним: пусть эта функция абсолютно интегрируема на всей прямой, т. е.
оо
J \f(t)\dt<oo.	(3)
— оо
Перейдем теперь (пока чисто формально) в равенстве (2) к пределу при /—► оо. В силу (3) первое слагаемое в правой части равенства (2) при /->оо стремится к нулю. Второе слагаемое можно рассматривать как интегральную сумму (но только распространенную на бесконечный промежуток) для интеграла
J F(X)dX о от функции
F(X) = y- J f(t)cosk(t~ x)dt, — I
•S3]
ИНТЕГРАЛ ФУРЬЕ
421
если положить Хд = kn/l и АХ = л//. Поэтому формальный предельный переход в (2) при /->сю приводит к равенству
оо оо
f(x) = lj dX J f (t)cosX(t — х) dt.	(4)
О —оо
Это и есть искомое представление. Введя обозначения:
оо	оо
ax=-i- f (t) cos Xt dt, = f (t) sin Xt dt, — oo	— OO
равенство (4) можно переписать в следующем виде, аналогичном ряду Фурье:
оо
f (х) = (ак cos Хх + bK sin Хх) dX.	(5)
о
Мы получили равенство (4), называемое формулой Фурье, с помощью формального предельного перехода. Можно было бы обосновать справедливость этого перехода (при сделанных выше предположениях о функции [), однако проще доказать равенство (4) непосредственно. Итак, докажем следующую теорему.
Теорема 1. Если функция f абсолютно интегрируема на всей прямой и в точке х удовлетворяет условию Дини, то имеет место равенство ОО	ПО
f (х) = ± J dX J f (t) cos X (t — x) dt.
0 —oo
Доказательство. Введем обозначение
A oo
7(4) = 1J dX J f (t) cos X(t — x)dt. 0	—oo
(6)
Нам нужно доказать, что lim /(Д) существует и равен f(x). Так А->ОО
как f абсолютно интегрируема, то внутренний интеграл в (6) сходится, а двойной интеграл сходится абсолютно. Используя теорему Фубини, изменим в повторном интеграле (6) порядок интегрирования:
ПО	А	оо
'И)=4 $ f(t)C08X(t-x)dX = ± J f(t) $а dt. — оо о	—оо
422
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIIT
Заменой переменных t — х = z приведем этот интеграл к виду
оо
= i J f(x + z)^dz.	(7>
— оо
Хорошо известное равенство
оо
1 f sin Дг ,	, , „ ~
- j dz = 1 (4 > 0) — оо
позволяет записать разность /(4)—f(x) в виде
оо
J (Д) - f (х) = 1 J f(x + z)-f(x) s jn Az dz — oo
Представим стоящий справа интеграл в виде суммы трех слагаемых:
N
J(A)-f(x) = ± J /(* + z)-f(*) sJn Azdz +
— N
.1 C f (x + z) . . , fix) C sin Az .
H\	1—- sin Az dz —\ -------------dz.
1 я J z	я J z
|z|>M	|z|>M
Второй и третий члены справа представляют собой сходящиеся интегралы, и каждый из них может быть сделан меньше, чем е/3, если число N взято достаточно большим. Первое слагаемое справа (при фиксированном N) стремится к нулю, когда А -> оо (в силу леммы 1 § 1 и условия Дини). Таким образом, получаем.
lim (J (4)-/(%)) = 0,
Х->оо
что и требовалось доказать.
2. Интеграл Фурье в комплексной форме. В интегральной формуле Фурье (4) внутренний интеграл представляет собой четную функцию от X, что позволяет переписать эту формулу в виде
оо	оо
f(x) = 2_ J dk J f(t)cosK(t-x)dt.	(9>
— oo	—oo
Далее, из абсолютной интегрируемости функции f следует, что оо
интеграл \ f(/)sinX(Z — х) dt существует и представляет собой
§ 41
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ
423
нечетную функцию от X. Поэтому оо оо
2я $ f (О sinX(/ — x)dt = 0	(10)
— оо —оо
^если интеграл по К понимать в смысле главного значения, т. е.
Л
как lim \ ). Прибавив к (9) равенство (10), умноженное на
N-*°° -nJ
—i, получим оо оо
— оо	—оо
Это равенство мы будем называть комплексной формулой Фурье.
§ 4. Преобразование Фурье, свойства и применения
1. Преобразование Фурье и формула обращения. Интегральную формулу Фурье можно расчленить на два равенства. По-
ложим
оо g(X) = J f(t)e~iKtdt. —оо
Тогда
оо
= S g^e^dK.
(1)
(2)
Заметим, что формула (1) имеет смысл для любой абсолютно интегрируемой функции f.	Таким образом, каждой
f е L\ (— оо,о°) мы с помощью формулы (1) сопоставляем определенную функцию g, заданную на всей числовой прямой. Функция g называется преобразованием Фурье исходной функции Формула (2), выражающая f через ее преобразование Фурье, называется формулой обращения для преобразования Фурье. Следует обратить внимание на сходство между формулами (1) и (2). Вторая из них отличается от первой лишь знаком в показателе и множителем 1/(2л) перед интегралом. Можно было бы достигнуть здесь еще большей симметрии, определив g формулой
оо
g&} =	5	(Г)
— 00
424
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ (ГЛ. VI1F
Тогда формула обращения приняла бы вид
ОО
f(x) = -4=- \g(k)elKxdk,
V2n J — СЮ
(2'>
т. е. различие осталось бы только в знаке показателя экспоненты.
Однако при всем их внешнем сходстве формулы (1) и (2), по существу, различны: в первой из них интеграл существует в обычном смысле (поскольку fet|(—оо, ос)), а во второй,, вообще говоря, лишь в смысле главного значения. Кроме того, равенство (1) — это определение функции g, а в равенстве-(2), представляющем собой иную запись интегральной формулы Фурье, содержится утверждение, что стоящий там справа интеграл равен исходной функции f. Как мы видели выше, для обеспечения этого равенства на f надо наложить, помимо интегрируемости, еще дополнительные условия, скажем, условие-Дини.
Замечание. Мы определили преобразование Фурье g для всякой функции f из Li(—оо, оо) и показали, что функция Д удовлетворяющая условию Дини в каждой точке, выражается с помощью формулы обращения через свое преобразование Фурье g. Это положение вещей в точности аналогично тому, которое имеется для рядов Фурье. Действительно, коэффициенты Фурье
Л
Cn==i J f(x)e-‘^dx — Л
определены для всякой f е Lj [—л, л], однако сходимость ряда Фурье
оо
2 cneinx д«—оо
(играющего здесь роль формулы обращения) можно гарантировать лишь при определенных дополнительных условиях (условие-Дини). Вместе с тем для преобразования Фурье (как и для ряда; см. конец § 2), имеет место следующее: если для функции, f Li(— оо, оо)
СО
f (x)e~iKxdx =0,
то f(x) — 0 почти всюду.
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ
425
§ Ч
Действительно, из написанного выше равенства вытекает, первых, что для всех действительных t и Л
f (х 4-t) e~iKx dx = 0.
— оо
Положим теперь
Ф W = $ f (X + /) dt, о
тде g—произвольное фиксированное действительное число. Применяя теорему Фубини и используя условие, наложенное на функцию f, легко усмотреть, что функция <р (которая как и f, принадлежит к Ц (—со, со)) удовлетворяет тому же условию, т. е.
ОО
<р(х) e~iKxdx = 0
— ОО
при всех действительных А. Но, как легко видеть, функция <р абсолютно непрерывна на каждом конечном отрезке и, следовательно, почти всюду обладает конечной производной. В частности, эта функция почти всюду удовлетворяет условию Дини. Поэтому в силу теоремы 1 § 3 она почти всюду обращается в 0, так как ее преобразование Фурье есть тождественный 0. Но <р непрерывна, так что <р(х)=0. Из этого вытекает, в частности, что при всех действительных £
$ f(t)dt = o о
и, следовательно, f (х) = 0 почти всюду.
Рассмотрим теперь некоторые примеры.
1.	Пусть f (х) = е~у |х!, у > 0. Найдем преобразование Фурье этой функции. Имеец
оо	оо
g(A) =	dx — e-v|xl(cosАх — isinАх)dx =
— оо	—оо
оо
= 2 е~чх cos Ах dx.
о
С помощью двукратного интегрирования по частям находим
2V
А2 + у2 ‘
426
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ VHF
2.	Пусть
, , _ ( 1 при |х|<а, '	0 при |х|>а.
Тогда
Г г / \	Г .i	е1Аа —e-i?‘a	2sinAa
g (A) = \ f (x) e lKx dx = \ e~‘Kx dx =-.
— oo	—a
(Следует обратить внимание на то, что функция g здесь не принадлежит —оо.оо)).
3.	Пусть f (х) = --xi . Тогда
оо
sw=	<3>
— оо
Этот интеграл проще всего вычислить с помощью теории вычетов. Пусть сначала А > 0. Дополнив действительную ось, по которой берется интеграл (3), полуокружностью бесконечно большого радиуса, лежащей в нижней полуплоскости (т. е. в тощ где экспонента е~ах стремится к нулю), получим, что интеграл (3) равен сумме вычетов подынтегральной функции в нижней полуплоскости, умноженной на (—2лг). В нижней полуплоско-е~‘Кх
сти функция д2 имеет один полюс первого порядка в точке х = —at. Вычет в этой точке находится по известной формуле: если = и (p(a)=#0, а ф(г) имеет в точке г = а нуль первого порядка, то вычет функции f в точке а равен . Поэтому в нашем случае получаем
g(A) = — 2лг-2-q.' = — е~аК при А>0.
При А < 0 аналогично (рассматривая только верхнюю полуплоскость вместо нижней) получаем
g(^)=-7^-
Таким образом, окончательно
g(A) =-^ е-а) Аг| (—оо < А < оо).
Впрочем, этот результат можно получить сразу по формуле обращения, используя пример 1 и теорему 1 § 3.
§ 41
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ
427
, 4. Положим /(%) = е~ах’. Имеем
оо
£(?.)= e~ax’e~iKx dx.	(4)
— оо
Здесь под интегралом стоит аналитическая функция, не имеющая особенностей в конечной части плоскости и стремящаяся к нулю вдоль каждой прямой, параллельной действительной оси. Поэтому в силу теоремы Коши интеграл (4) не изменит своего значения, если его взять не по действительной оси, а вдоль любой прямой г = х + iy (у = const), параллельной этой оси. Таким образом,
g(A,)=	е-а(х+№ . e-iX(x+ i^dx=:
— со
со	оо
— ^аи2 + 1и j g-ax2-2alxu-ibx у — gW*+Au £-ахг-1х(2ау+К} — CO	—00
Выберем теперь постоянное значение у так, чтобы в показателе подынтегральной экспоненты исчезла мнимая часть, т. е. положим у — —к/(2а). Тогда
А»_А» р	_ А* .----
g (к) = в 4а* 2а е~ах' dx = e 4а д/ у ,
— ОО
поскольку
со е~ах* dx = д/. — оо
В частности, если положить а= 1/2, то мы получим f (х) = е~х‘12, g (к) =	е-^/2,
т. е. функция е~х2/2 переводится преобразованием Фурье сама в себя (с точностью до постоянного множителя).
2. Основные свойства преобразования Фурье. Из формулы {1), определяющей преобразование Фурье, вытекает ряд свойств этого преобразования. Рассмотрим эти свойства. Для сокращения записи будем преобразование Фурье функции f обозначать символом Л[/]. Иначе говоря, мы обозначим через F линейный оператор, определенный на пространстве Lj(—оо, оо) и ставящий в соответствие каждой функции из этого пространства ее преобразование Фурье1).
) Вообще говоря, не принадлежащее Li.
428
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VHT
1.	Если последовательность {fn} функций из L\(—оо, оо) сходится в метрике пространства Lt(—оо, оо), то последовательность их преобразований Фурье gn — ^Ifn] сходится равномерно на всей прямой.
Это утверждение сразу вытекает из очевидной оценки:
СО
IgnGQ —JlfnW — fm(x)\dx. — co
2.	Преобразование Фурье g абсолютно интегрируемой функции f представляет собой ограниченную непрерывную функцию, которая стремится к нулю при |Z|-> оо.
Действительно, ограниченность функции g = /ДЛ сразу видна из оценки
СО 1я(МК $ \fM\dx. — оо
Далее, если f — характеристическая функция интервала (а,Ь)г то для нее
ь
----------------0~О.Ь e~lKx dx=-------.
a
Эта функция, очевидно, непрерывна и стремится к нулю при |Z|-> оо. Так как операция F перехода от f к g линейна, то отсюда следует, что преобразование Фурье любой ступенчатой функции (т. е. линейной комбинации индикаторов интервалов) есть тоже непрерывная функция, стремящаяся к нулю при Z->±°o. Наконец, ступенчатые функции всюду плотны в L[(—оо, оо), поэтому если f е Lit то существует последовательность {fn} ступенчатых функций, сходящаяся к f в Lj(—оо, оо). Тогда в силу свойства 1 последовательность функций gn = /?[/n] сходится равномерно на всей прямой к функции g = F[f]. Но тогда предельная функция g тоже непрерывна и стремится к. нулю при |Z|-> оо.
Упражнения. 1. Доказать, что преобразование Фурье g абсолютно-интегрируемой функции f равномерно непрерывно на всей прямой.
2.	Пусть В — пространство равномерно непрерывных на (—оо, оо) функций, стремящихся к нулю на бесконечности. Показать, что преобразование-Фурье F есть оператор из Lt(—оо, оо) в В с нормой 1, удовлетворяющий, условию Кег F = 0.
3.	Если f абсолютно непрерывна на каждом конечном интервале и f'eLi(—оо, оо), то имеет место равенство
ЛП = *АЛЯ
ПРЕОБРАЗОВАНИЕ ФУРЬЕ. СВОЙСТВА И ПРИМЕНЕНИЯ
429
§ 41
Таким образом, дифференцированию функции (при указанных выше условиях) отвечает умножение ее преобразования Фурье на IX.
Действительно, абсолютно непрерывная на каждом конечном интервале функция может быть записана в виде
X
f(x) = f(O) +
о
Из абсолютной интегрируемости f' следует, что стоящее здесь справа выражение при х->оо и при х-> — оо имеет предел. Этот предел может быть только нулем, так как иначе функция f не была бы интегрируема на всей прямой. Учитывая это, получаем с помощью интегрирования частям
оо
f[/'iw= $ f'(х) e~lKx dx — — со со
= /(х)е~'М	4-гХ	f(x)e~iKxdx = i^F[f](K),
1 — СО	•>
— оо
что и требовалось доказать.
Если функция f такова, что абсолютно непрерывна на каждом интервале и f, ..., /<h* е (— оо, оо), то с помощью таких же рассуждений получим
/?[Г’] = (Л)*Г[/].	(5)
4.	Связь между степенью гладкости функции и скоростью убывания на бесконечности ее преобразования Фурье. Разделив равенство (5) на (iX)ft и вспомнив, что преобразование Фурье всегда стремится к нулю на бесконечности (свойство 2), получим, что если f(h~> абсолютно интегрируема, то
| F[/=]	1 -»о,
т. е. в этих условиях F [f] убывает на бесконечности быстрее, чем 1/|Х|\ Итак, чем больше производных в L\ имеет /, тем быстрее убывает на бесконечности ее преобразование Фурье.
5.	Если f" существует и принадлежит L\(— оо, оо ), то F[f] абсолютно интегрируема.
Действительно, при указанных условиях F[f] ограничена и убывает на бесконечности быстрее, чем 1/Х2. Отсюда следует интегрируемость.
Выше (свойство 4) мы показали, что чем больше производных имеет функция /, тем быстрее убывает на бесконечности ее
430
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIIF
преобразование Фурье. Справедливо и двойственное утверждение, а именно, чем быстрее убывает f, тем глаже ее преобразование Фурье. Точнее говоря, верно следующее утверждение:.
6.	Пусть как функция f (х), так и xf(x) абсолютно интегрируемы. Тогда функция g = F[/] дифференцируема и
g'(X) = F[-ixf(x)\.	[6)
Действительно, продифференцировав интеграл
ОО
f (х) e~iKxdx,
— ОО
определяющий g, по параметру X, мы получим интеграл
оо
— i xf (х) e~iKx dx, — оо
который (в силу интегрируемости функции х/(х)) сходится равномерно по К. Следовательно, производная функция g существует и имеет место (6).
Если f такова, что абсолютно интегрируемы функции f(x), xf(x), ..., xPf(x), то, как показывают аналогичные рассуждения, функция g имеет производные до р-ro порядка включительно, причем
^>U) = E[(-^f(x)] (% = 0, 1, ..., р).
7.	Если потребовать, чтобы функция f убывала на бесконечности еще быстрее, то g будет еще более гладкой функцией. Из предположения, что xpf(х)е —оо, оо) при всех р, вытекает бесконечная дифференцируемость функции g. Допустим теперь, что /(x)ezLi(—оо, оо) при некотором 6 > 0. Тогда g(k) распространяется с действительной оси Л как аналитическая функция в полосу на плоскости £ = + ф комплексного переменного, причем ширина этой полосы тем больше, чем больше 6. Во всяком случае можно утверждать, что g будет аналитической функцией при |ц| < 6. Действительно, интеграл
оо
f(x)e~lx^dx,
— оо
очевидно, будет сходиться при |ц|< 6 и определять непрерывную функцию, совпадающую с преобразованием Фурье функции f на действительной оси. Тот факт, что эта функция дифференцируема при |ц|< 6 в смысле теории аналитических функций, доказывается совершенно так же, как свойство 6.
§ 4]	ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ	431
3.	Полнота функций Эрмита и Лагерра. Используя соображения, изложенные в предыдущем абзаце, можно показать, что если измеримая функция f почти всюду на интервале (а,Ь), где — оо^а</?^оо, отлична от 0 и удовлетворяет условию |/(х) |	Се~6] *1, где 6 > 0, то система функций {хп/(х)}, п —
= 0, 1,2,..., полна в L2(a, b).
Отсюда, в частности, будет следовать, что функции Эрмита образуют полную систему в L2(—оо, оо), а функции Лагерра — в Л2(0, оо) (см. п. 7 § 3 гл. VII).
Докажем сформулированное утверждение о полноте. Предположим, что система {хп/(х)} не полна. Тогда в силу теоремы Хана — Банаха найдется такая ненулевая функция h е L2(— оо, оо), что
оо
xnf (х) h (х) dx = 0 (n = 0, 1, 2, ...).
— оо
(Мы использовали теорему об общем виде линейного непрерывного функционала в гильбертовом пространстве; если рассматривается комплексное L2(a, b), то вместо Л(х) надо писать А(х).) Ясно, что fh <= Ща, Ь) и, более того, М 1 х\fh е (а, Ь) при любом 6| < 6. В дальнейшем удобно считать, что f(x) и А(х) определены на всей прямой, продолжая их, если необходимо, за (а,Ь) нулем. Пусть g— преобразование Фурье функции fh, т. е. оо
g (Л) = f (х) h (х) е~iKx dx.
— оо
Из сказанного выше следует, что функция g продолжается как аналитическая в полосу |lm£|<6. С другой стороны, в силу свойства 6 все производные этой функции при /. — 0 обращаются в 0, так что £(?,) = 0. По свойству единственности, доказанному в п. 1, отсюда следует, что f(x)/i(x) = 0 почти всюду и, следовательно, Л(х) = 0 почти всюду, так как f(x) почти всюду отлична от 0. Но это противоречит нашему предположению о том, что h— ненулевая функция. Полученное противоречие и доказывает полноту системы {xnf(x)}.
4.	Преобразование Фурье быстро убывающих бесконечно дифференцируемых функций. Пользуясь тем, что при переходе от функции f к ее преобразованию Фурье g свойства гладкости функции и убывания ее на бесконечности меняются ролями, легко указать естественные классы функций, которые переводятся преобразованием Фурье сами в себя.
Пусть St» — совокупность бесконечно дифференцируемых функций на прямой, для каждой из которых существует набор
432
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII
постоянных Ср, (зависящих от самой функции f и чисел р, q) таких, что
|x₽fW(x)|<Cp(?.	(7)
Покажем, что если f е S^, то и Я = /?[Ле^оо> Прежде всего из (7) следует абсолютная интегрируемость каждой из функций хр/(т)(х). Действительно, поскольку (7) выполняется при всех р и <7, то
I xPfto (x)iccp+2„/x2,
т. е. функция xpf^(x) убывает не медленнее, чем 1/х2. Отсюда в свою очередь следует, что функция Fjf] имеет производные всех порядков. Наконец, согласно п. 2, из суммируемости /(9)(х), q — I, 2, .... следует что	убывает на бесконечности
быстрее, чем I/]Х|q. Рассмотрим теперь функции
W (Z) = (- /)’ F [(xpf(xn
каждая из них, как преобразование Фурье интегрируемой функции, ограничена некоторой постоянной Dpq. Таким образом, если f s Soo, то и g=f[/)ESoo. Обратно, пусть g е Soo, тогда, по доказанному, функция
/* (х) = j g(X)e~iKx dx: — оо
ВХОДИТ В Soo. Положим f (X) = 2^Г(— х). Ясно, ЧТО feSoo. В то же время по формуле обращения оо	оо
gW = ^ S f*(x)eikxdx= f (x)e~iKx dx, — оо	—00
т. е. g есть преобразование Фурье функции f е S^. Итак, преобразование Фурье переводит класс Soo снова в весь класс Soo. Ясно, что это отображение взаимно однозначно.
ОО
Упражнение. Пусть f е Soo и J хР1 (*) dx = 0 при всех р > 0. Сле-— ОО
дует ли отсюда, что f(x) = О?
5.	Преобразование Фурье и свертка функций. Пусть fi и /2 — интегрируемые на всей прямой функции. Функция
оо f(x)= j
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ
433
§ 4]
называется их сверткой. Функция f(x) определена при почти всех х и интегрируема. Действительно, двойной интеграл
ОО 00
— 00—00
существует, поскольку существует интеграл оо оо — оо —оо
(см. замечание к теореме Фубини, стр. 318). Следовательно, существует и интеграл
оо	оо оо
j f(x)dv= dx f, (g) f2 (x — £) di,. — oo	— oo —oo
Функция f обозначается символом Вычислим преобразование Фурье свертки двух функций из L\. Применяя теорему Фубини и полагая х — | = т], получаем
ОО	00-00
\ j (х) e~lKx dx — U \ f^h(x-№\e-^dx== — 00	—оо \ — оо	7
оо	- оо	«.
= МЕЧ f2(x-i,)e-tKxdx\di,= — оо	— оо	)
ОО	f	оо
=	Мъ)|	$	dl	=
— 00	Ч —00	)
по	ОО
= 5 e-iK"dT\
— 00	— -X-I
т. е.
nf:*f2] = /4fiW2].
Итак, преобразование Фурье переводит операцию свертки в более простую операцию — умножение функций. Этот факт играет важную роль во многих применениях преобразования Фурье.
6. Применение преобразования Фурье к решению уравнения теплопроводности. Применение преобразования Фурье к дифференциальным уравнениям основано на том (см. п. 3), что оно переводит операцию дифференцирования в операцию умножения на независимое переменное. Следовательно, если у нас
434
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIIT
имеется линейное дифференциальное уравнение с постоянными коэффициентами
у^ + а1у^~^+ ... +ап-}у' + any = q>(x),	(8)
то преобразование Фурье переводит его в алгебраическое уравнение вида
(iA.) z ctj (iA,) z ... tzn_]iA,z ctnz = ф (А,),	(9}
где z= F[у] и ф = Т7[ф]. Однако для обыкновенных дифференциальных уравнений этот прием не открывает каких-либо существенно новых перспектив, так как решение линейных уравнений с постоянными коэффициентами и без того не представляет больших трудностей. Кроме того, переход от (8) к (9) возможен, если неизвестная функция у = у(х) интегрируема на всей прямой, а для решений линейных уравнений с постоянными коэффициентами это, вообще говоря, не имеет места.
Более существенно применение преобразования Фурье к уравнениям с частными производными, где оно позволяет, при определенных условиях, свести решение такого уравнения к решению обыкновенного дифференциального уравнения. Покажем это на примере решения задачи Коши для уравнения теплопроводности.
Будем искать решение уравнения
(ю)
dt	дх2	v 1
при — оо < х < оо и t 0, обращающееся при t = 0 в заданную функцию и0(х). Физический смысл этой задачи состоит в нахождении температуры бесконечного теплопроводящего стержня в любой момент времени t > 0, если в начальный момент t = 0 его температура в каждой точке есть и0(х).
Предположив, что и0(х), и'0(х) и и'о(х) принадлежат L](—оо, оо), будем искать решение поставленной задачи в классе функций и(х, t), удовлетворяющих следующим условиям:
1) функции и(х, /), их(х, /), ихх(х, t) абсолютно интегрируемы по всей оси х при любом фиксированном t 0;
2) функция ut (x, t) имеет в каждом конечном интервале 0 t Т интегрируемую мажоранту f(x) (не зависящую от /):
оо
I Щ (х, t) | f (%), f (х) dx < оо.
— оо
Выполним в уравнении (10) преобразование Фурье по х. При этом справа мы получим
К [ихх (х, /)] = — А,2о (А,, /), где v (A,, t) = F [и (х, /)],
§ 4]
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ
435
а слева в силу условия 2) имеем
оо	оо
F\ut\ = и*^х’ е~‘Кх dx==~dT 5 и(х’ f)e~iKx dx = vt(K, t). — оо	— оо
Таким образом, преобразование Фурье переводит уравнение '(10) в обыкновенное дифференциальное уравнение
Vt (Л, /) = — /-2v (Л, /),
для которого нам теперь нужно найти решение, обращающееся при t = 0 в функцию
оо
Оо (Л) = F [«о (х)] = иа(х) e~iKxdx.
Таким решением будет, очевидно,
о(Д., t) = е~х‘(и0(Л.).
Теперь для того чтобы получить решение нашей первоначальной задачи, остается найти ту функцию и(х, t), преобразованием Фурье которой служит функция о (Л, /).
Используя пример 4 п. 1, получаем
g-АИ Р
Поэтому
т. е.
и (х, t)
С V
Мы получили так называемый интеграл Пуассона для решения уравнения теплопроводности.
7. Преобразование Фурье функций нескольких переменных. Преобразование Фурье, рассмотренное нами для функций одной переменной, легко переносится на функции нескольких переменных.
Пусть f(xi, х2, хп) — функция, интегрируемая по всему n-мерному пространству Rn. Ее преобразованием Фурье
436	ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ (ГЛ VIH
называется функция
g(Xb Л2, ..., Л„) = оо	со
= J ••• $ Н*ьХ2, ...,х„)е-‘^>+^+-+хЛ)^1 ... dxn. — GO	— ОО
Этот n-кратный интеграл, заведомо существующий, поскольку f(%i, х2, • ••, хп) интегрируема, можно записать, по теореме Фубини, в виде следующего повторного интеграла:
ё (Ч ^2, • • •>	—
ОО f	оо f ОО	ч
= j < • • • j I $ f (Xi, x2, ..., xn) e~ix^ dxt I X — oo \	— oo V, —co	J
X e~lx,K,dx2 ... } e~ix^ dxn. (11)
Иначе говоря, можно перейти от функции п переменных к ее преобразованию Фурье, последовательно выполняя преобразования по каждой из переменных в отдельности (в любом порядке). Обращая последовательно каждую из п операций в правой части равенства (11), получим формулу
ПОО У ОО
*’* S | J ^(^1> ^2’ • • • ’ X — оо *• —оо
X е‘Хп>'п dkn }	rfA,„_1 ... } eix'K'd^.
Ее можно переписать в виде n-кратного интеграла
f (Х(, х2.х„) =
оо	оо
= -72^ V -	ё^Ъ,-, кп)е‘^+х^+- +x^dK{...dKn^)
J	J
— oo	— oo
однако, поскольку функция g(X|, Хг, . • •, Xn), вообще говоря, не обязана быть суммируемой по всему Rn, нужно указать, в каком смысле следует понимать этот интеграл и те условия на f(xh %2.....хп), при которых она представляется интегра-
лом (12).
Один из возможных ответов на эти вопросы дает следующая теорема.
ПРЕОБРАЗОВАНИЕ ФУРЬЕ, СВОЙСТВА И ПРИМЕНЕНИЯ
437
Теорема 1. Пусть функция f(хь х2, хп) интегрируема по всему пространству Rn и удовлетворяет условиям:
| f(Xi 4-/1, х2.Xn)—f(xb х2,
I f (х1, х2 + ^2, • • •, xn) f (Х1> Х2>
х„)|<С|Л г,
С(х,)|/2Г,
I f (Х11 х2> • • • > хп + tn) f (-^1, х2> • • • 1 хп) I
<С(ХЬХ2, •••• *n-l)l tn Г, где оо	оо
О «С а 1,	\ С (х,) dxx < оо, ..., \ ...
(13)
С (хь х2, ..., хп-{) dx} dx2 ... dxn_{ < оо,
Тогда формула обращения (12) справедлива, если интеграл в ней понимать как
1 (2л)"
\-1	»п
lim \ lim \ g(Z,b Л2,	Л„) X
Xeix^ dXn] e(x»~^~i d^i ... jeix^d^.
Действительно, поскольку f(xi,x2, ..., xn) суммируема в Rn, то в силу теоремы Фубини она суммируема по Х\ при почти всех х2, . .., хп. Следовательно, существует функция
оо
Л(Л1,х2, .... х„) = f(xlt х2, . .., хп) e~ix,K> dxt.
Из (13) следует, что f(xlt х2,	, хп) как функция от xt удовле-
творяет условию теоремы 1 § 3; поэтому f(xb х2, . . . , хп) можно выразить через fi по формуле обращения
A'i
ЦХ1,Х.2,	хп)== lim \ Л(ЛЬ х2, .
Nl~^OO Z31 J
xn)eix^ d)^.
Далее, если мы положим
оо
f2 (Л1, Х21 х3, ..., хп) = ft (Ль х2, ..., хп) е-‘х^ dx2,
— ОО
438
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VHI
то из условия (13) следует, что для /4 справедлива формула обращения
АГ1
•••, *п) = lim J- \ f 2(^1, ^2, •••, xn) eix^> d^,
2n Л т. e.
/(xb x2, xn) =
Ml /	Nt	x
= Hm 1 lim \ f2(Kb Л2....................xn)etx^‘ dbA elx‘x'dkt.
N,->oo J I M2->oo J	I
— Nl 4	— Ab	'
Определив аналогичным образом Л2, Хз .. ., xn) и т. д., мы и придем к формуле (12).
Преобразование Фурье функций нескольких переменных широко используется в теории уравнений с частными производными. Рассмотрим, например, уравнение
ди д2и , д2и	,.лх
~дГ “ ~дхг "1" dp' ’	I14'
описывающее процесс распространения тепла в плоскости. Пусть в момент t = 0 температура задана:
и (0, х, у) = и0{х, у).
Наложив на искомое решение уравнения (14) условия, аналогичные тем, которые указаны в п. 6, мы можем сделать в уравнении (14) преобразование Фурье по переменным х и у. В результате получим обыкновенное уравнение
-^ = -(^2 + а2)щ	(15)
где
оо оо
v(t, X, о-)== u(t, х, y)e~l ax+<wdx dy.
— 00 —00
Решив уравнение (15), можно затем найти решение исходного уравнения (14) с помощью формулы обращения.
§ 5. Преобразование Фурье в пространстве L2(—00, 00)
1. Теорема Планшереля. Вернемся сначала к тем результатам, которые мы получили для рядов Фурье. Для большей аналогии с преобразованием Фурье будем рассматривать ряд Фурье в комплексной форме, т. е. возьмем на отрезке [—л, л] полную ортогональную систему функций е’пх, п — 0, ±1, ±2, ... и ка
§ 5]	ПРЕОБРАЗОВАНИЕ ФУРЬЕ В ПРОСТРАНСТВЕ Ь2(—«>, «>)	439
ждой суммируемой на отрезке [—л, л] функции f мы поставим в соответствие последовательность ее коэффициентов Фурье
Л
сп = -^ S fWe-inxdx (« = °- ± h ±2> •••)• -Л
Если функция f не только суммируема, но и имеет суммируемый квадрат, то ее коэффициенты Фурье удовлетворяют условию
оо
£ I Сп I2 < оо. Л= —ОО
Иначе говоря, переход от суммируемой с квадратом функции к совокупности ее коэффициентов Фурье есть отображение евклидова пространства L2 на евклидово пространство /2, причем это отображение линейно и удовлетворяет равенству Парсеваля
оо	Л
2л £ |с„Р= J I f(x)\2dx	(1)
п=— ОО	—л
(т. е. этот переход отличается лишь числовым множителем от преобразования, сохраняющего норму).
Обратимся теперь к преобразованию Фурье для функций, заданных на всей прямой, и посмотрим, нельзя ли это преобразование трактовать как некоторый линейный оператор в комплексном пространстве L2(—оо, °°). Основная трудность состоит здесь в том, что функция с интегрируемым квадратом на прямой не обязана принадлежать ЬД—оо, оо), т. е. преобразование Фурье в смысле, определенном в § 4, может для нее и не существовать. Однако для всякой f е L2(— оо, оо) можно определить преобразование Фурье в несколько ином смысле. При этом получается следующая теорема, которую можно рассматривать как аналог равенства Парсеваля (1).
Теорема (Планшерель, 1910 г.). Для всякой функции f е L2(— оо, оо) интеграл
N
= J f(x)e~iKxdx — N
при любом N представляет собой функцию от Л, принадлежащую к L2(— оо, оо). При N -> оо функции gN сходятся в метрике пространства Ь2 к некоторому пределу g, причем
оо	оо
5 I gW 2л I f (x) \2dx.	(2)
440
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII
Эту функцию g называют преобразованием Фурье функции f е £2. Если f принадлежит также и к — оо, оо), то соответствующая функция g совпадает с преобразованием Фурье функции f в обычном смысле.
Доказательство. Основная идея доказательства состоит в том, что равенство (2) устанавливается сперва для всех функций, принадлежащих классу S» бесконечно дифференцируемых быстро убывающих функций, которые всюду плотны в L2(—°0. °0), а потом распространяется по непрерывности на все£2(— оо, оо). Реализуем теперь эту идею в деталях.
1)	Пусть fi, f2 е Soo. Обозначим через gi и g2 соответственно их преобразование Фурье. Имеем
оо	оо	оо
$ fi(x)f2(x)dt = J i J	=
— оо	— оо	— оо
1
2л
gl (А) §2 (А)
причем изменение порядка интегрирования здесь законно, поскольку функция
g\ (А) /Дх) eiKx
абсолютно интегрируема в плоскости (х, А). Положив в полученном равенстве f । = f2 = f и gi = gi = g, получим, что формула (2) верна для любой функции f е SM.
2)	Пусть теперь f — произвольная функция из L2(—оо, оо), обращающаяся в нуль вне некоторого интервала (—а, а). Тогда f интегрируема на интервале (—а, а) (т. е. принадлежит L](—ct, а)), а следовательно, и на всей прямой. Поэтому для нее определено преобразование Фурье
оо
g(X) = f (х)е~‘Кх dx. — оо
Пусть теперь {fn} — последовательность функций из SM, обращающихся в нуль вне (—а, а), и сходящаяся по норме пространства L2(—оо, оо) к f. Поскольку f и все fn отличны от нуля лишь на конечном интервале, последовательность {fn} сходится к f и по норме пространства Li(—оо, оо). Поэтому (см. п. 2 § 4) последовательность {gn} сходится к g равномерно на всей прямой. Кроме того, последовательность {gn} фундамен-
$ 5]	ПРЕОБРАЗОВАНИЕ ФУРЬЕ В ПРОСТРАНСТВЕ Ь2(—°о, оо)	44)
талька в Л2(—°°> оо). Действительно gn— gm^S№, поэтому в силу уже доказанного
5	— gmW = \fn(x) — fm(x)?dx,
— оо	—оо
откуда и следует фундаментальность последовательности {§«}. Значит, эта последовательность сходится в L2, причем к той же самой функции g, к которой она сходится равномерно. Поэтому в равенстве
Ш12=-^1Ш2
можно перейти к пределу при п->оо. Таким образом, получаем, что равенство (2) справедливо для каждой f е L2, обращающейся в нуль вне некоторого интервала.
3)	Пусть, наконец, / — произвольная функция из L2. Положим
f при | х
'n(x>— ( 0 при |х|>ЛГ.
Ясно, что
Ilf —при Af—^oo.
Функция fjt принадлежит —оо, оо), следовательно, для нее существует обычное преобразование Фурье. Оно равно
со	N
= 5 fN(x)e-iUdx= f (х) e~iKx dx.
— ОО	— N
Поскольку в силу пункта 2) наших рассуждений
II f N — f М li2 =	II Sn — ём II2>
функции gN сходятся в L2 к некоторому пределу, который мы обозначим g. Поэтому в равенстве
Il fN н2=^k.v li2
можно перейти к пределу при Af->oo, откуда получаем соотношение (2) для произвольной f е L2(— оо, оо). Первая часть теоремы Планшереля доказана.
Если теперь функция f принадлежит как Л2(— оо, оо), так и —оо, оо), то для нее существует преобразование Фурье
g(A) = f (х) е~Лх dx,
442
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII
понимаемое в обычном смысле. При этом функции fv сходятся к f в А](—оо, оо) и, значит, их преобразования Фурье gN сходятся к g равномерно. Но, кроме того, как мы установили, функции gN сходятся в метрике Ь2(—оо, оо) к некоторому пределу, который мы обозначили g. Отсюда следует, что g совпадает с g. Доказательство закончено.
Следствие. Из соотношения (2) сразу вытекает, что для любых fi, f2 е L2(— оо, оо) выполнено равенство
оо	оо
$ fl W ТМ dx = J gj (A) g2(A) dk. — оо	—оо
Для доказательства достаточно написать равенство (2) для функции fi-f-fi и затем сравнить выражения справа и слева. Если равенство (2) означает сохранение нормы в Ь2 при преобразовании Фурье, то последнее равенство означает сохранение скалярного произведения.
2. Функции Эрмита. Теорема Планшереля, изложенная в предыдущем пункте, означает, что преобразование Фурье можно рассматривать как ограниченный линейный оператор F, отображающий пространство L2(—оо, оо) на себя. Если в этом пространстве выбрать какую-либо полную ортогональную нормированную систему, то оператор F (как и любой другой линейный оператор) можно записать с помощью бесконечной матрицы. Вид этой матрицы зависит, конечно, от выбора базиса. Проще всего матрица, отвечающая тому или иному оператору, выглядит в том случае, когда соответствующий базис состоит из собственных функций данного оператора: в этом случае матрица имеет диагональную форму. Посмотрим, существует ли такой базис для преобразования Фурье Г? Иначе говоря, посмотрим, какие функции из Л2(— °°, оо) являются собственными для преобразования Фурье Ё? Для этой цели заметим, что уравнение
7?-^ = ^	(3)
переводится преобразованием Фурье в такое же уравнение1) ^поскольку операция переходит в умножение на —А2, а умножение на —х2 — в операцию . Поэтому естественно искать собственные функции оператора F как решения уравнения (3). Будем искать решения этого уравнения, имеющие вид f = we~x2/2,
') Предполагается, конечно, что неизвестная функция f удовлетворяет соответствующим условиям гладкости и убывания на бесконечности.
§ 5]	ПРЕОБРАЗОВАНИЕ ФУРЬЕ В ПРОСТРАНСТВЕ Lj(-oo, оо)	443
где w — многочлен. Подставив это выражение в (3), получим для w уравнение
w" — 2xw' = (р + 1) w.
Полагая
w = а0 + сцх + ... + апхп,	(4)
получаем равенство
(2а2 + 3 • 2 • а3х 4- ... 4- п (п — 1) апхп~2) —
— 2х(а1+2а2х+ ... +nanxn~v) =
— (н + 1) («о 4- а\х 4- ••• 4" апхп).
Сравнивая в нем коэффициенты при одинаковых степенях х слева и справа, находим, что
— 2па„==(р4- 1)а„, —2(п— 1)а„_, = (ц + 1)ап_,,
и т. д., вообще,
k(k— \)ак — 2{k — 2)аЛ_2 = (ц4- 1)аА-2.	(5)
Поскольку мы считаем старший коэффициент ап отличным от нуля, должно быть
ц = — (2п4-1) и а„_! = 0,
т. е. ц должно быть нечетным целым отрицательным числом. Все коэффициенты многочлена w определяются соотношением (5) с точностью до постоянного множителя. При этом те коэффициенты, четность индекса которых отлична от четности числа п, т. е. степени многочлена w, равны нулю. Наоборот, все коэффициенты с индексами, имеющими ту же четность, что и п, отличны от нуля. Они находятся по рекуррентной формуле
йк~2 “ 2k — 2п — 4 йк
(если значение ап задано). Таким образом, мы получаем формулу ДЛЯ W.
(«) -«,(?-	*-’ + Л»-.)(«-2)	_ у
Итак, мы построили систему функций вида
<р„ (х) = wn (х) е-*1'2 (п = 0, 1,2, ...).
Ясно, что каждая из этих функций принадлежит Л2(—оо, оо) (благодаря наличию множителя е~х2/2). Вдобавок, эти функции попарно ортогональны. Действительно, согласно (3) имеем
ф" (х) — х2уп (х) = — (2п 4- 1) фп(х),
<р" (х) - х2ут (х) = - (2m 4- 1) <рт (х).
444
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ (ГЛ. VIII
Умножив первое из этих равенств на <рт, а второе — на <рп и вычитая из одного равенства другое, получаем
Ф„ФТО - фХ = 2 (т - п) фпфт или
[ф„Фт - ФМ' = 2 (ГН - П) ф„фт.
Если п =£ т, то, интегрируя это равенство, получаем
оо	со
J Фп^ФтМ^^-гСт-л)' J [фХ-фтФп]'^ = — оо	—оо
2 (т — п) [ф«Фт Ф/пФп]_оо
Таким образом, ортогональность доказана.
Каждый из элементов фп полученной ортогональной системы представляет собой многочлен степени п, умноженный на е~х’12. Следовательно, ее элементы должны, с точностью до числовых множителей, совпадать с функциями Эрмита, которые мы построили в § 3 гл. VII ортогонализацией последовательности
е~х’/2, хё~х’12, ..., xnc~x’l2t ...
в пространстве Л2(— оо, оо).
Покажем теперь, что функции {фп} являются собственными функциями преобразования Фурье:
F<Pn = с„фп.	(6)
Это вытекает из следующих фактов.
1. Уравнение (3) инвариантно относительно преобразования F.
2. Уравнение (3) при каждом п имеет, с точностью до постоянного множителя, лишь одно решение вида Рп(х)е~х'/2, где Рп — многочлен степени п.
(d \п / ~dx) е~Х'12~
= Qn (х)е~х’/2, где Qn — многочлен степени п (последнее утверждение легко проверяется по индукции).
Из равенства (6) следует, что при каждом целом k
Fkq> = ска> .
Но преобразование Фурье, примененное четырежды, переводит каждую функцию в себя, умноженную на 4л2. Поэтому с\ — 4л2, т. е. сп может принимать лишь значения ± V 2л и ± i V 2л.
5 6J
ПРЕОБРАЗОВАНИЕ ЛАПЛАСА
445
Итак, преобразование Фурье F в пространстве Ь2(— оо, оо) есть линейный оператор, который в базисе, состоящем из функций Эрмита, записывается как диагональная матрица с элементами вида Эгл/ 2л и ± i -у/ 2л ').
§ 6. Преобразование Лапласа
1. Определение и основные свойства преобразования Лапласа. Применимость преобразования Фурье к дифференциальным уравнениям существенно ограничивается тем, что это преобразование определено лишь для функций, суммируемых на всей прямой. В частности, преобразование Фурье не существует для функций, растущих при х->— оо или х->оо, а такие функции нередко возникают при решении дифференциальных уравнений. Эту трудность можно преодолеть, распространив преобразование Фурье на обобщенные функции; об этом пути мы скажем кратко в § 8 этой главы. Другой возможный подход, не выводящий за рамки классического понятия функции и классических методов анализа, состоит в замене преобразования Фурье так называемым преобразованием Лапласа.
Пусть функция f (вообще говоря, не интегрируемая на всей прямой) становится интегрируемой, если ее умножить на е~^х, где у — некоторое действительное число. Тогда интеграл
оо	оо
g(s)= f(x)e~isxdx — f (x)e~ixKexv-dx — оо	— оо
оказывается сходящимся для некоторых комплексных s = = X + ip, в частности, он сходится на прямой р = —у. На этой прямой он служит преобразованием Фурье функции f(x)e~vx.
Наиболее важный для приложений случай, в котором наши предположения об интегрируемости функции f(x)e~vx выполнены, — это тот, когда f удовлетворяет следующим условиям:
I f (х) | < Cev,x при х > 0, j f(x) = O при х<0 J
*) Если преобразование Фурье определить формулой
F Ш = ~7= \ f(x)e~lKxdx
-у 2л J
(т. е. формулой (Г) § 4, а не формулой (1)), то его четвертая степень будет единичным оператором, и в базисе, состоящем из функций Эрмита, мы получаем для F диагональную матрицу с элементами ±1 и ±i.
446
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VHF
(уо и С — постоянные). Интеграл
со	со
g(s) — j f (x)e~isx dx = f (х) e~isxdx
—со	О
(2>
существует при всех s = \ 4- ip, таких, что ц < —уо, т. е. в полуплоскости, ограниченной прямой Im s =—у0, и представляет собой преобразование Фурье функции f(x)e^. Эта последняя может быть получена из g с помощью формулы обращения (мы считаем, что f удовлетворяет условиям, при которых эта формула применима)
оо
f (х)	g (S) eikx
откуда
/Ц + оо
=	5 g(s)eisxds (s = A,-Hp).	(3>
/ц —OO
Поскольку функция f(x)e^x при p <—уо убывает как экспонента (в силу (1)), ее преобразование Фурье g, а значит, и g(s)eisx, есть функция, аналитическая в полуплоскости Im s < —Ао.
Сделаем теперь в формулах (2) и (3) замену переменных, положив р = is и обозначив g(s) через Ф(р). Получим
со
Ф (р) = f (х) e~?x dx	(2')
о
и
—ц+ico	— ц + i’oo
= i $ ®(p)epxdp. (3'>
— Ц—JOO	— Ц — /co
Функция Ф определена и аналитична в полуплоскости Re р > уо; она называется преобразованием Лапласа функции f (удовлетворяющей условиям (!))
Преобразование Лапласа по своим свойствам мало отличается от преобразования Фурье. Однако класс функций, для которых определено преобразование Лапласа, существенно отличен от класса — оо, оо) функций, для которых существует преобразование Фурье.
2. Применение преобразования Лапласа к решению дифференциальных уравнений (операторный метод). Преобразование Лапласа можно применить для отыскания решений диффе
$ 6]
ПРЕОБРАЗОВАНИЕ ЛАПЛАСА
447
ренциальных уравнений. Пусть дано линейное дифференциальное уравнение с постоянными коэффициентами
Ум _|_ a1£/<«-0 + ... + апу = b (х),	(4)
и пусть ищется его решение, удовлетворяющее начальным условиям
Z/(O) = «/o, у' (0) =	=	(5)
Применим к уравнению (4) преобразование Лапласа1), т. е. умножим его на е~Рх и проинтегрируем от 0 до оо. Пусть
ОО
Y (р) = jj у (х) е~рх dx о
— преобразование Лапласа функции у. Интегрируя по частям, мы найдем преобразование Лапласа производной у':
оо	оо
§ у' (х) е~рХ dx = у (х) е-Р* |q + р $ у (х) е~Рх dx = рУ (р) — у0. о	о
Применяя эту формулу последовательно, найдем
оо
5 yw>(x)e-Pxdx=p(pn-vY (р) — уп-2 — руп-3— ... — р"~2Ро) —= С
п-1
= pnY (р) — yn~i — руп-2 — ... — рп~{у0 = pnY (р) — £ рп~'~кук-
Пусть, наконец, оо
В(р)= b(x)e~Px dx.
о
В итоге преобразование Лапласа переводит дифференциальное уравнение (4) [с учетом начальных условий (5)] в алгебраическое уравнение
Q(p) + J?(p)y(p) = B(p),
где В — преобразование Лапласа функции b, Q — многочлен от р степени п — 1, зависящий от коэффициентов уравнения и от начальных данных. Наконец,
Я = S an-kpk, а0 = 1
&=о
—характеристический многочлен уравнения (4).
’) Нетрудно показать законность его применения к уравнению (4), если |&(х) | растет не слишком быстро.
448
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ VIII
Из полученного уравнения находим
Y(p)
__ В (р) — Q (р)
Й(Р)
Решение у получается отсюда по формуле обращения
и (х) = — ( В ~ Q ерх do у[Х> 2л» J R(p) е ар'
— Ц — i со
Этот интеграл обычно вычисляется с помощью вычетов.
Для решения линейных дифференциальных уравнений с постоянными коэффициентами известен так называемый операторный метод. Он состоит в том, что в таком уравнении
yw +	4- ... 4- апу = b (х)
левая часть рассматривается как результат применения к неизвестной функции у оператора
.( d \ dn . dn~' .	.
4 (—) = —- 4- Я1 „.г 4- • • • 4- ап,	(6)
X dx J dxn dx‘
а решение уравнения — как применение к его правой части уравнения оператора, обратного к оператору (6). Результат применения такого оператора к некоторым простейшим функциям — тригонометрическим, показательным, степенным и их комбинациям— нетрудно найти с помощью непосредственных вычислений. Это дает возможность автоматически выписывать решение линейного уравнения с постоянными коэффициентами, если его правая часть представляет собой комбинации таких функций.
Ясно, что операторный метод можно истолковать как применение в неявной форме преобразования Лапласа (устанавливающего определенное соответствие между алгеброй дифференциальных операторов вида (6) и алгеброй многочленов), что как раз и можно рассматривать как обоснование этого метода, часто фигурирующего в технической литературе в виде некоторого «рецепта».
§ 7. Преобразование Фурье — Стилтьеса
1. Определение немея снова к АД— оо, оо);
преобразования Фурье — Стилтьеса. Вер-преобразованию Фурье в пространстве
ОО
g(X)= J e~lKxf(x)dx. — оо
ПРЕОБРАЗОВАНИЕ ФУРЬЕ - СТИЛТЬЕСА
419
Эту формулу можно переписать в виде интеграла РиманА— Стилтьеса оо
g(A) = j e~axdF(x),	(1)
— оо
где X
F(x) = j	(2)
— оо
— абсолютно непрерывная функция с ограниченным изменением / 00	\
на всей числовой оси I равным j | f (х) | dx 1. Однако 'равенство X	—ОО	S
(1) имеет смысл не только для функций вида (2), но и для любых функций с ограниченным изменением на всей прямой. Интеграл оо
g(X) = j e~iKx dF (х), — оо
где F—произвольная функция с ограниченным изменением на прямой, мы будем называть преобразованием Фурье — Стилтьеса функции F. Для преобразования Фурье — Стилтьеса сохраняется ряд свойств, установленных нами ранее для обычного преобразования Фурье, например, следующее: функция g, определенная интегралом (1), непрерывна и ограничена на всей прямой.
Действительно,
|g(*i)-g(W<
N
| e~lK'x — e~iKiX \dF(x) +	| e~iK'x — e~iK,x\dF (х).
— N	1 AC! > AT
Второе слагаемое справа можно сделать сколь угодно малым (сразу при любых Xi и Хг), взяв N достаточно большим, а первое при фиксированном N стремится к нулю при Х| — >.2~>0.
Однако не все свойства преобразования Фурье переносятся на преобразование Фурье — Стилтьеса. Так, оно не стремится, вообще говоря, к нулю при |Х|->о°. Пусть, например,
(О при х^О, F(X)=1 1 при х > 0.
Тогда
оо
g(A) = e~iKxdF(x)= 1.
450
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. VIII
Аналогично, преобразование Фурье — Стилтьеса функции, равной 0 при х'о и 1 при х > х0, есть е1хЛ, т. е. периодическая функция от X.
Если F — функция скачков, для которой точки п = 0, ±1, ± 2, ...
служат точками разрыва, а числа
. .., а—!, а0, а{.ап, ... (где £| ап | <	,
\ п	'
— величинами скачков в этих точках, то
оо
e~lKx dF (х) = ane~inK — оо	п
есть периодическая функция с периодом 2л. Если же F имеет скачки ап в точках хп, образующих произвольную последовательность чисел (вообще говоря, несоизмеримых), то ее преобразование Фурье — Стилтьеса имеет вид
п
Функции такого типа относятся к так называемым почти периодическим функциям.
2. Применения преобразования Фурье — Стилтьеса в теории вероятностей. Для суммируемых на (—оо, оо) функций мы ввели в § 4 понятие свертки:
оо
f(x) = fi*f2(x)= J Г,(х-1)?2(1)^=.	(3)
— оо
Положим
X	оо	X
F(x)= J f(f)dt, F1(x)== J fi(t)dt и F2(x)= J f2(f)dt.
— ОО	—ОО	—00
Проинтегрировав равенство (3), перепишем его следующим образом:
X	X	оо
Е(х) = J f(t)dt = J dt J — 00	—oo —oo
oo / X	OO
= u $ м/-^ф2а)^= J F^x-^dF^) — 00 '4 —00	'	—oo
(изменение порядка интегрирования здесь возможно в силу теоремы Фубини и абсолютной интегрируемости функции f).
§ 7]
ПРЕОБРАЗОВАНИЕ ФУРЬЕ - СТИЛТЬЕСА
451
Полученное нами соотношение
оо
F(x) = $ F,(x-£)dF2Q) — оо
сопоставляет функциям Fi и F2 функцию F. Но интеграл, стоящий здесь справа, существует как интеграл Лебега — Стилтьеса не только для абсолютно непрерывных функций, но и для любых двух функций с ограниченным изменением на всей прямой. Назовем выражение
F(x) = J F{(x-$dF2(l), — оо
(4)
где F] и F2— произвольные функции с ограниченным изменением на прямой, сверткой этих двух функций и обозначим его F}*F2. Покажем, что выражение (4) представляет собой функцию, определенную при всех значениях х и имеющую ограниченное изменение на всей прямой ’).
Действительно, F]— функция с ограниченным изменением, следовательно, она измерима по Борелю, а потому интеграл (4) существует при всех х. Далее,
| F(x,) — F (х2) | =
J (F.fx.-^-F.fe-^dF^)
оо
< $ I F, (х - £) - /ч (х2 - £) | d (var F2 (£)), — оо
откуда
V [F]< V [F,] V [F2],
t. e. F — функция с ограниченным изменением.
Теорема 1. Если F есть свертка функций с ограниченным изменением Fi и F2, a g, g\ и g2 — их преобразования Фурье — Стилтьеса, то
g(b)=gi (Mg2 W-
Доказательство. Пусть F — FpF2 и а = х0, х1; ..., х„ — b
’) В книге В. И. Гливенко «Интеграл Стилтьеса»,’Гостехиздат, 1936, дана элементарная конструкция, позволяющая придать смысл формуле (4) без использования меры,
452
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ VIII
— некоторое разбиение отрезка [а, 6]. Тогда при каждом X
Ь	п
{e~iKxdF(x) — lim У e-'^(F(xA)-F(xA_,)) =
j	max Дхь->0
a	ft=i
OO n
= *!m J E ^‘К(Хк^НРАхк-1)-РАхк-1-1))е-‘кЧр2щ max Дхь->0 J
*	—oo fe=I
t. e.
b	oo z d —£	\
^e~lKxdF(x) = H j e~lKxdFi (x) k-,lEdF2(|).
a	—oo > a —g	'
Переходя здесь к пределу при а -> —оо и b -> оо, получаем
оо	оо	оо
j e~iKxdF(x) = j e~lKxdFt(x) j e-iKidF2(&, — oo	—oo	— oo
t. e.
g (A.)= gi (A) g? (a.)-
Теорема о том, что преобразование Фурье — Стилтьеса переводит свертку функций в умножение, широко используется в теории вероятностей (метод характеристических функций). Если £ и т] — две независимые случайные величины, a Ft и F2— их функции распределения, то величине В + Л отвечает функция распределения
F = F{ * F2.
Необходимость рассматривать суммы независимых случайных слагаемых возникает в теории вероятностей очень часто. Переход от функций распределения к их преобразованиям Фурье — Стилтьеса, — так называемым характеристическим функциям, — позволяет заменить операцию свертки более простой и удобной операцией умножения.
Упражнения 1. Доказать, что преобразование Фурье — Стилтьеса обладает свойством единственности: если функция F непрерывна слева, а ее преобразование Фурье — Стилтьеса есть тождественный нуль, то F(x) = = const.
2. Доказать, что операция свертки функций с ограниченным изменением коммутативна и ассоциативна.
§ 8.	Преобразование Фурье обобщенных функций
Мы уже говорили, что применение преобразования Фурье, понимаемого в .обычном смысле, в дифференциальных уравнениях и других вопросах сильно ограничивается тем, что это преобразование определено лишь для функций, абсолютно интегри-
ПРЕОБРАЗОВАНИЕ ФУРЬЕ ОБОБЩЕННЫХ ФУНКЦИЙ
453
? 8]
руемых на всей прямой. Применимость преобразования Фурье можно существенно расширить, введя понятие преобразования Фурье для обобщенных функций. Изложим основные идеи такого построения.
Рассмотрим снова пространство S^ функций, бесконечно дифференцируемых на всей прямой и убывающих на бесконечности вместе со своими производными быстрее, чем любая степень 1/|х| (см. § 4, гл. IV).
Приняв Soo за пространство основных функций, рассмотрим соответствующее пространство обобщенных функцийSi.
Определим теперь в пространстве Si преобразование Фурье. Для этого вспомним прежде всего, что пространство Soo переводится преобразованием Фурье (понимаемым в обычном смысле) в себя: если ф е S^, то F [ф] е S^, причем F есть взаимно однозначное отображение Soo снова на все Soo. Исходя из этого, введем следующее определение. Преобразованием Фурье обобщенной функции f е= Si называется линейный функционал g е Si, определяемый формулой
(g, ф) = 2л ([, ср), где ф = /Дф].	(1)
Эту формулу можно переписать и так:
(Ff, ф) = 2л(/, ф) = 2л(/, F-'ф).
т. е. преобразование Фурье функционала f е Si есть функционал, который на каждом элементе ф е Soo принимает значение, равное (умноженному на 2л) значению исходного функционала f на элементе ф = Д_|ф, где F~l—обратное преобразование Фурье.
Поскольку ф = /Дф] пробегает все Soo, когда ф пробегает Soo, равенство (1) действительно определяет функционал на всем Soo. Линейность и непрерывность этого функционала проверяются непосредственно.
Среди элементов Si содержатся все абсолютно интегрируемые функции. Для них только что сформулированное определение преобразования Фурье совпадает с обычным. Действительно, если f е 3°°, ср е S^, g = F[f] и ф = F[ф], то по теореме Планшереля получаем
2л (f, ф) = (g, ф),	(2)
причем, при заданной f существует лишь одна, с точностью до эквивалентности, функция g, удовлетворяющая этому равенству при всех ф е 5те. С помощью соответствующего предельного перехода нетрудно показать, что равенство (2) имеет место и для любой feL|(—оо, оо). Таким образом, преобразование Фурье обобщенных функций представляет собой распространение классического преобразования на более широкий класс объектов.
454
ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЕ ФУРЬЕ [ГЛ. V1TT
Примеры. 1. Пусть f(x) = с = const. Тогда
со
2n(f, ф) = 2л сер (х) dx = 2лсф (0) (ф = F [ф]), — оо
т. е. преобразование Фурье константы равно этой константе, умноженной на 2л и на 6-функцию.
2. Пусть f(x) = eiax. Тогда
оо
2л(/,ф) = 2л	е~‘ал:ф(х)</х = 2лф(—а),
— оо
т. е. преобразование Фурье функции е'ах есть сдвинутая 6-функция 6(х + а), умноженная на 2л.
3. Пусть f(x) = х?- Тогда из равенства
ф"(А.) = —	x2q>(x) e~iKx dx,
— оо
положив в нем % = 0 и умножив его на 2л, получаем
2л (х2, ф (х)) = — 2лф" (0),
т. е. преобразование Фурье функции х2 есть вторая производная от 6-функции, умноженная на —2л.
Сделаем несколько заключительных замечаний.
Мы определили преобразование Фурье для обобщенных функций над S«>. Но можно было бы взять и любое другое основное пространство, например, пространство К бесконечно дифференцируемых финитных функций. Для каждой функции ф е К преобразование Фурье (в обычном смысле) существует и, как можно проверить, представляет собой целую аналитическую функцию экспоненциального роста. Точнее говоря, преобразование Фурье есть линейный оператор, переводящий пространство-К в пространство Z, элементами которого служат целые аналитические функции ф, для каждой из которых выполнены неравенства
| s П ф(5)	1*1	(<7 = 1,2,...),
где т= Ims, a Cq и а — постоянные, зависящие от функции ф. Поскольку в пространстве К было введено понятие сходимости, отображением F, переводящим К в Z, индуцируется некоторое-понятие сходимости в Z: последовательность {ф„} сходится в Z" к ф, если соотношение фп->ф выполнено для соответствующих
<8]
ПРЕОБРАЗОВАНИЕ ФУРЬЕ ОБОБЩЕННЫХ ФУНКЦИИ
455
прообразов. Впрочем, это понятие сходимости нетрудно сформулировать и не пользуясь пространством Л'* 1)-
Пусть теперь f-—произвольный элемент из К*. Поставим ему в соответствие линейный функционал g на Z, положив
(g, Ф) = 2л(f, ф), где ф = Е[ф].
Этот функционал g мы назовем преобразованием Фурье функционала f. Таким образом, преобразование Фурье обобщенной •функции f над основным пространством К. есть обобщенная функция над Z, т. е. над тем пространством, в которое К переводится преобразованием Фурье, понимаемым в обычном смысле.
То же самое построение проходит и для обобщенных функций над какими-либо иными пространствами основных функций. При этом каждый раз будет возникать схема, включающая в себя четыре пространства: некоторое исходное пространство основных функций, совокупность преобразований Фурье этих функций (т. е. второе пространство основных функций) и два •сопряженных пространства.
Эта схема сводится к двум пространствам, когда за основное пространство принимается 3^, поскольку оно переводится преобразованием Фурье само в себя.
Понятие преобразования Фурье для обобщенных функций нашло широкое применение в теории дифференциальных уравнений с частными производными. Читатель может ознакомиться с этими вопросами, например, по книге Г. Е. Шилова [52].
*) Именно, ф„->-0 в Z, если при фиксированных C4(q = 1, 2, ...) на выполняются неравенства
I «"Фп (S) |<С?еа'Ч
и фп-»-0 равномерно на каждом конечном интервале действительной оси.
ГЛАВА IX
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
§ 1.	Основные определения. Некоторые задачи, приводящие к интегральным уравнениям
1.	Типы интегральных уравнений. Интегральным уравнением называется уравнение, которое содержит неизвестную функцию под знаком интеграла. Таково, например, уравнение
ь
Ф (s) = j A (s,/)Ф (/) d/+ f (s),	(1>
а
где f и К — известные функции, а ф — искомая. Переменные s и t пробегают здесь некоторый фиксированный отрезок [а, Ь].
Характерная особенность уравнения (1)— его линейность: неизвестная функция ф входит в него линейно. Ряд задач приводит и к нелинейным интегральным уравнениям, например, к уравнениям вида ъ
Ф (s) = $ К (s, t) g (ф (0, /) dt, а
где К и g— заданные функции. Мы, однако, во всем дальнейшем ограничимся линейными уравнениями.
Отдельные интегральные уравнения рассматривались еще в начале прошлого столетия. Так, еще в 1823 г. Абель рассмотрел уравнение
S (0<а<1,/(0) = 0), о s '
носящее теперь его имя. Здесь f — заданная функция, а ф — искомая. Абель показал, что решение этого уравнения имеет вид
t
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
457
и
Однако общая теория линейных интегральных уравнений была построена лишь на рубеже XIX и XX столетий, в основном в работах Вольтерра, Фредгольма и Гильберта.
Уравнение (1) называется уравнением Фредгольма второго рода (ср. п. 4 § 4 гл. II), а уравнение
ъ
J К (s, t)(p(t)dt = f(s)	(2)
а
(в котором неизвестная функция <р содержится только под знаком интеграла) — уравнением Фредгольма первого рода.
Упомянутое выше уравнение Абеля относится к так называемым уравнениям Вольтерра; общий вид этих уравнений таков:
S
$/((«, t) (f (t) dt = f (s)	(3)
a
(уравнение Вольтерра первого рода) или
S
<p(s)= J/<(s, t)y(t)dt + f(s)	(4)
a
(уравнение Вольтерра второго рода). Ясно, что уравнение Вольтерра можно рассматривать как уравнение Фредгольма, в котором функция К удовлетворяет условию
К (s, /) = 0 при t > s.
Однако уравнения вольтеррова типа целесообразно выделить в особый класс, поскольку они обладают рядом существенных свойств, отсутствующих у произвольных фредгольмовых уравнений.
Если в уравнениях (1), (2) или (3) функция f равна нулю, то такое уравнение называется однородным. В противном случае уравнение называется неоднородным.
2.	Примеры задач, приводящих к интегральным уравнениям. В дальнейших параграфах этой главы мы рассмотрим основные свойства линейных интегральных уравнений, но сначала мы опишем несколько задач, приводящих к таким уравнениям.
I.	Равновесие нагруженной струны. Рассмотрим струну, т. е. упругую материальную нить длины /, которая может свободно изгибаться, но оказывает сопротивление растяжению, пропорциональное величине этого растяжения. Пусть концы струны закреплены в точках х = 0 и х = I. Тогда в положении равновесия струна совпадает с отрезком оси х, О х I. Предположим теперь, что в точке х — £ к струне приложена вертикальная сила Р = Р$. Под действием этой силы струна отклонится
458
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ. IX"
от положения равновесия и примет, очевидно, форму ломаной,, изображенной на рис. 23.
Найдем величину б отклонения струны в точке £ под действием силы Р$, приложенной к этой точке. Если сила Р% мала по сравнению с натяжением ненагруженной струны То, то горизонтальную проекцию натяжения нагруженной струны можно-по-прежнему считать равной Т$.
____£=£___________д Тогда из условия равновесия струны получаем равенство: откуда
Рис. 23.	.	(/ -1) I п
б= Тй1 Pi-
Пусть теперь и(х)— прогиб струны в некоторой точке х под действием силы Р%. Тогда
u(x) = P%G(x, I),

при
при
Из этих формул сразу видно, в частности, что G(x, s) = G(£, х)_ Предположим теперь, что на струну действует сила, распределенная по ней непрерывно, с плотностью р(£). Если эта сила, мала, то деформация зависит от силы линейно, а форма нагруженной струны описывается функцией
i
u(x)=\g(x,1)p(№.	(5>
о
Итак, если задана нагрузка, действующая на струну, то формула (5) позволяет найти форму, которую примет струна под действием этой нагрузки.
Рассмотрим теперь обратную задачу: найти то распределение нагрузки р, при котором струна примет заданную форму и. Мьг получили для нахождения функции р по заданной и уравнение,, которое с точностью до обозначений есть уравнение (2), т. е. интегральное уравнение Фредгольма первого рода.
2.	Свободные и вынужденные колебания струны. Предположим теперь, что струна совершает какие-то колебания. Пусть-u(x,t)—положение в момент t той точки струны, которая имеет абсциссу х, и пусть р — линейная плотность струны '). На
9	Мы полагаем, что р = const, хотя это и несущественно для дальнейшего.
31]
ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ
459
элемент струны длины dx действует сила инерции, равная д2и (х, 0	,	д2и (£, /)
----Р dx, откуда р (|) =-------р.
Подставив это выражение вместо р(£) в формулу (5), мы получим
u(x,t)=-^G(x,l)p-^JLdl.	(6)
о
Предположим, что струна совершает гармонические колебания
с некоторой фиксированной частотой со и амплитудой и(х), зависящей от х. Иначе говоря, пусть
и (х, t) — u (х) sin со/.
Подставив это выражение в (6) и сократив обе части равенства на sin со/, получаем для и следующее интегральное уравнение:
i
u(x) = p^^G(x,t)u(l)dl	(7)
о
Если струна совершает не свободные колебания, а вынужденные, под действием внешней силы, то, как показывает несложная выкладка, соответствующее уравнение гармонических колебаний струны будет иметь вид
i
и (х) = рсо2 G (х, £) и (I) dl + f (х),
о
т. е. будет неоднородным уравнением Фредгольма второго рода.
3. Сведение дифференциальных уравнений к интегральным. Иногда решение дифференциального уравнения целесообразно сводить к решению интегрального. Например, доказывая существование и единственность решения дифференциального уравнения
У' = f <х, у)
с начальным условием у(х0) = уо, мы видели (в гл. II), что его удобно свести к интегральному уравнению (нелинейному)
X
У=Уо+ \Ht»y)dt>.
х9
Такое сведение возможно и для дифференциальных уравнений порядка выше первого. Рассмотрим, например, уравнение вто-
рого порядка
У" +f(x)y = 0.
460
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ. IK
Положив f(x) = p2 — о(х), где р = const, запишем его так:
У" + Р2У = о (х) у.	(8>
Как известно, решение уравнения
У" + P2y^g(x)
с начальными условиями у(а) = уо, у'(а) = у'о можно представить в виде
X
У (х) = Уо cos р (х — а) + -Уй sin ~ а) + -^ sin р (х — £) g (g) dt,.-а
Поэтому нахождение решения уравнения (8) с теми же начальными условиями сводится к решению интегрального уравнении
X
У (х) — j О (|) sin р (х — g) у (|) dl = а
( х । Уъ sin Р (х — а) = Уо cos р (х — а) + —-----------
§ 2. Интегральные уравнения Фредгольма
1. Интегральный оператор Фредгольма. В этом параграфе мы будем рассматривать уравнения Фредгольма второго рода, т. е. уравнения вида
ь
ф (s) = К (s, t) <p (t) dt + f (s).	(1)
a
Все встречающиеся здесь и ниже функции мы будем предполагать, вообще говоря, принимающими комплексные значения. Относительно функции К, называемой ядром этого уравнения, мы предположим, что она измерима и принадлежит классу Ь2 на квадрате a sC s, t b:
ъ b
J J|K(s, f)?dsdt< oo.	(2}
a a
Свободный член f уравнения (1) — это некоторая заданная функция из Ь2[а, Ь], а ф — неизвестная функция из L2[a, ft]. Ядра класса L2 называются ядрами Гильберта — Шмидта.
Сопоставим уравнению (1) оператор А, определяемый равенством: Лф = ф; это означает, что ь
j К (s, t) ф (t) dt = ф (s).	(3)
$ 2]
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА
461
Всякий оператор вида (3) называется оператором Фредгольма. Если же ядро /(($,/) удовлетворяет условию (2), то он называется оператором Гильберта — Шмидта. Исследование уравнения (1), разумеется, сводится к изучению свойств этого опе
ратора.
Теорема 1. Равенство (3), где К(s, t) — функция с интегрируемым квадратом, определяет в пространстве Г2[а, Ь] компактный. линейный оператор А, норма которого удовлетворяет нера
венству
I ь ь а а
(4)
Доказательство. Заметим прежде всего, что интеграл ь
$ I К ($, /) р dt а
существует в силу теоремы Фубини и условия (2) для почти всех s. Иначе говоря, K(s,t) как функция от t при почти всех s принадлежит L2[a, Ь]. Так как произведение функций с суммируемым квадратом суммируемо, то интеграл, стоящий в (3) справа, существует для почти всех $, т. е. функция ф определена почти всюду. Покажем, что	Ь]. В силу неравенства
Коши — Буняковского для почти всех $ имеем
Интегрируя по s и заменяя повторный интеграл от |K(s, t) |2 двойным, получим неравенство
ь	ь ь
Мф1Р= $H(sWs<llq)|l2 5
а	а а
которое дает и интегрируемость |ф($) |2, и оценку (4) для нормы оператора А. Остается показать, что оператор А компактен. Пусть {фп}—полная ортогональная система в L2[a,b]. Тогда всевозможные попарные произведения фт(«)фп(/) образуют полную систему в пространстве L2([a, Ь] X [а, &]) (см. теорему 1 п. 5 § 3 гл. VII) и, следовательно,
оо
К («> 0 = Г «тпф/п (s) Фп (0.
т, п=1
462
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ. tx
Положим теперь
N
Kn («, t) = £ атп^т (s)	(/),
m. n=l
и пусть .4,v — оператор, определяемый ядром /). Этот оператор компактен, поскольку он переводит все L2[a, b] в конечномерное подпространство (в гл. IV мы назвали такие операторы конечномерными). Действительно, если <р е L2 [а, Ь], то
b	N	Ь
Лл,ф =	(s, /) ф (/) dt — £ атп^т (s) ф (/)	(/) dt =
а	т, п~I	а
N	N
= £ Фт (s) £ атпьп, /п=1	п=1
где
ь
ьп = 5 ф (/) (t) dt, а
т. е. каждый элемент ф^АДа, Ь] переводится оператором в элемент конечномерного подпространства, порожденного векторами ipi, . . . , 4^- Далее Kn(s, t) представляет собой частичную сумму ряда Фурье функции /(($, t), поэтому
ь ь
(s, f) — KN (s, t))2ds dt->0 при V->oo.
a a
Отсюда, применив оценку (4) к оператору А—Л .у, имеем
|| А — An ||—*0 при V->oo.
Воспользовавшись теоремой о том, что предел сходящейся последовательности компактных операторов компактен (п. 2 § 6 гл. IV), получаем компактность оператора А.
Замечания. 1. В процессе доказательства теоремы 1 мы установили, что всякий оператор Гильберта — Шмидта может быть представлен как предел (в смысле сходимости по норме) последовательности конечномерных интегральных операторов.
2. Пусть Ai и А2 — два оператора вида (3) и Ki(s,t), ДДх,/)— отвечающие им ядра. Если операторы Л] и Л2 равны, т. е. Л [ф — Л2ф для всех ф е Ь2[а, £>], то Ki(s, t) = Лг(«, /) почти всюду. Действительно, если
ь
Л|ф — Л2ф =$ (Л\ («, i) — А’г (s, /)) Ф (/) dt = О
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА
463
§ 2]
для всех <р е L2[a, 6], то при почти всех s е [а, 6]
t)~K2(s, t)pdt = O
а и, значит, ь ь J $ I Ki (s, t) — K2{s, f)'?dsdt = O, а а
откуда и следует наше утверждение. Таким образом, если мы, как обычно, не будем различать эквивалентные между собой суммируемые функции, то можно сказать, что соответствие между интегральными операторами и ядрами взаимно однозначно.
Теорема 2. Пусть А—оператор Гильберта — Шмидта, определяемый ядром	Тогда сопряженный ему оператор А*
определяется «.сопряженным» ядром
Доказательство. Используя теорему Фубини, получаем
ь ( b	-j
(Л/, g) = U f)f (t)dt Jg(s)ds = a '*• a	’
b b	b f b	\
= § jj /((s, f)f(f)g(s)dt ds = U jj /((s, t) g(s)ds H (/)<#==
a a	a a	*
b	7~~b	7
= V (Z) I J (s> 0 g («) rfs f л = (f, x*g), a	> a	*
откуда и следует утверждение теоремы.
В частности, оператор А вида (3) самосопряжен в L2[a,b], т. е. А* = А, тогда и только тогда, когда K(s, t) — K(t, s). В случае, когда рассматривается действительное гильбертово пространство (и, стало быть, действительные ядра), условием самосопряженности служит равенство /C(s, 0— K(t,s).
Замечание. Мы рассмотрели интегральные операторы, действующие в пространстве Г2[а,Ь]. Однако, как все сказанное выше, так и излагаемые ниже результаты переносятся без изменений на тот случай, когда вместо отрезка [а, 6] берется любое другое пространство с мерой.
2. Уравнения с симметрическим ядром. Рассмотрим интегральное уравнение Фредгольма второго рода
ь
Ф («) = 5 К (s> О ф (z)dt + f (s)>	(5)
a
464
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
(ГЛ IX
ядро которого удовлетворяет условиям
b ь
1)	| К (s, t) fdsdt < оо,
а а
2)	К(М) = О1.
Мы будем называть такие уравнения уравнениями с симметрическим ядром. В силу теорем 1 и 2 предыдущего пункта соответствующий оператор Фредгольма
ь
Лф = J к (s, /) ф (/) dt	(6)
а
компактен и самосопряжен. Следовательно, для него справедлива теорема Гильберта — Шмидта (п. 5 § 6, гл. IV). Применим эту теорему для отыскания решений уравнения (5). Поскольку для нас имеют значение лишь компактность и самосопряженность оператора (6), а не его интегральное представление, естественно писать уравнение (5) в символической форме
Ф = Лф-Н.	(7)
По теореме Гильберта — Шмидта для А существует такая ортонормальная система собственных функций {фп}, отвечающих ненулевым собственным значениям {Хп}, что каждый элемент £ из Z-2 представим в виде
£ = Е апФп + I', где AS,' = 0. п
Положим
f=Eu + r « = 0)	(8)
п
н будем искать решение ф уравнения (7) в виде
ф = Е Мл + ф' Нф' = 0).	(9)
п
Подставив разложения (8) и (9) в уравнение (7), получим
Е х„ф„ + ф' = Е *лМл + Е Мп + Г-п	п	п
Это равенстве удовлетворяется в том и только в том случае, когда
f = ф'
и
xn(l~kn)^bn (н = 1,2, ...),
§ 2]
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА
465
т. е. когда
Г = ф',
b
хп =	При Л„=/=1,
Ьп = 0	при Xn = 1.
Последнее равенство дает необходимое и достаточное условие разрешимости уравнения (7). Координаты хп, отвечающие тем п, для которых Хп=1, при этом произвольны. Мы получаем, таким образом, следующий результат.
Теорема 3. Если 1 не является собственным значением оператора А, то уравнение (7) при любом f имеет одно и только одно решение. Если же 1 есть собственное значение оператора А, то уравнение (7) разрешимо в том и только том случае, когда свободный член f ортогонален всем собственным функциям оператора А, отвечающим собственному значению 1. Если это последнее условие выполнено, то уравнение (7) имеет бесконечное множество решений.
3. Теоремы Фредгольма. Случай вырожденных ядер. Мы перейдем теперь к рассмотрению уравнений Фредгольма второго рода с ядрами, подчиненными условию
b ь
| K(s, t) pdsdt < оо а а
(обеспечивающему компактность оператора), но без условия симметрии.
Предположим сначала, что рассматривается уравнение
6
ф(«) = K(s, t)(f[t)dt + f (s),	(10)
a
ядро которого — вырожденное, т. е. имеет вид
— (11)
где Р,, Qi — функции из L2. Оператор с ядром вида (11) переводит всякую функцию (peLsB сумму
п	b
£>/(*) JQ.WtW dt, i=l a
т. e. в элемент конечномерного подпространства, порожденного функциями Pi, i — 1, 2, ... , п. Заметим, что в выражении (11)
466
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
(ГЛ. IX
функции Pi, . . . , Рп можно считать линейно независимыми между собой. Действительно, если это не так, то, представив каждую из функций Pi как линейную комбинацию независимых, мы получим, что то же самое ядро K(s, i) можно записать в виде суммы меньшего числа слагаемых вида Pj(s)Qj(f), так что функции Pj линейно независимы. Аналогичную редукцию можно проделать для функций Qj. Как легко видеть, после этих редукций получится ядро, в котором и Pj и Qi будут между собой линейно независимы.
Итак, будем решать уравнение (10) с вырожденным ядром (11), в котором функции Pi, . .., Рп (так же как и Qb ... , Qn) линейно независимы. Подставив в уравнение (10) вместо K(s,/) соответствующую сумму, получим
п	b
Ф (s) = £ Pi(s) $ Q, (0Ф(0+ f (s).	(12)
1=1	а
Введя обозначения
ь
j Qi (t) <Р (0 dt = qh a
перепишем уравнение (12) в виде
<Р («)= £ <pP,(s) + f(s). 1=1
Подставив это выражение для <р в уравнение (10), получим
п	п	Ъ	г п	"1
qiPi {s)+f (s) = 2 Pi (*) J Qi (0 2 <ЦР] (0+f W dt+f (s). (13) i=l	/—I a	l-y—i	J
Положив
b	b
J Qi (/) Pj (/) dt = alh J Qi (!) f (/) dt = bi, a	a
запишем равенство (13) так:
£ QiPi (s) = £ Pi («) [ £ Uijqj + 6,1.
i=l	i=l L/=l	J
Функции Pit по предположению, линейно независимы, поэтому отсюда следует равенство соответствующих коэффициентов:
<7; = £^/<7/+ &о 7=1,2..........п.	(14)
§ 21	ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА	457
ААы получили для коэффициентов qi систему линейных уравнений. Решив ее, мы найдем функцию
<Р (s) = S QiPi («) + f (s).
<=i
Эта функция удовлетворяет интегральному уравнению (10), поскольку все выкладки, с помощью которых мы пришли от уравнения (10) к системе (14), можно проделать в обратном порядке.
Итак, решение интегрального уравнения с вырожденным ядром сводится к решению соответствующей ему системы (14) линейных алгебраических уравнений.
Для систем линейных уравнений хорошо известны условия существования и единственности решений.
I.	Система линейных алгебраических уравнений
Тх — у (Г = || aik ||, х = (хь .... х„), £/ = ((/,.//„))
разрешима в том и только том случае, когда вектор у ортогонален каждому решению сопряженной однородной системы
Гг = 0 (Г = ||^||).
II.	Если детерминант матрицы Т отличен от нуля, то уравнение Тх — у имеет при любом у одно и только одно решение. Если же детерминант матрицы Т равен нулю, то однородное уравнение Тх — 0 имеет ненулевые решения.
III.	Поскольку матрица Т и сопряженная матрица Т* имеют один и тот же ранг, однородные системы Тх — 0 и T*z — О имеют одно и то же число линейно независимых решений.
В силу той связи, которая, как мы выяснили, существует между интегральными уравнениями с вырожденными ядрами и системами линейных алгебраических уравнений, эти утверждения можно рассматривать как теоремы, относящиеся к решениям вырожденных интегральных уравнений. Мы покажем в следующем пункте, что, по существу, эти же теоремы имеют место и для уравнений с произвольными (не обязательно вырожденными) ядрами. Однако, поскольку для невырожденных интегральных операторов такие понятия, как ранг матрицы и детерминант не имеют смысла, соответствующие теоремы нужно будет сформулировать так, чтобы эти понятия в них не участвовали.
4. Теоремы Фредгольма для уравнений с произвольными ядрами. Будем снова рассматривать уравнение
ь
qp(s)=^/((s, f)q(t)dt + f (s),	(15)
а
468
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ IX
но теперь на его ядро будем накладывать лишь условие Гильберта — Шмидта ь ь
| К (s, f) \2dsdt < оо
а а
(обеспечивающее компактность оператора), но не будем это ядро предполагать ни вырожденным, ни симметрическим. Нас будут интересовать условия разрешимости уравнения (15) и свойства его решений. При этом существенным для нас будет лишь свойство компактности оператора, отвечающего уравнению (15), а не его интегральное представление. Поэтому мы будем все дальнейшие рассмотрения вести для операторного уравнения
ср = Хф + f,	(16)
считая, что А — произвольный компактный оператор, заданный в гильбертовом пространстве И.
Положив Т = 1 — А (где / — единичный оператор), перепишем уравнение (16) в виде
ГФ = Л	(17)
Будем наряду с этим уравнением рассматривать однородное уравнение
7фо = О	(18)
и сопряженные уравнения
T*^ = g,	(19)
Г1рэ=0	(20)
(Т* = /— Д*)_ Связь между свойствами решений этих четырех уравнений устанавливается следующими теоремами Фредгольма.
I. Неоднородное уравнение Тф — f разрешимо при тех и только тех f, которые ортогональны каждому решению сопряженного однородного уравнения T*4>o = 0.
II (альтернатива Фредгольма). Либо уравнение Tq = f имеет при любом f е Н одно и только одно решение, либо однородное уравнение Тфо — 0 имеет ненулевое решение.
III. Однородные уравнения (18) и (20) имеют одно и то же, и притом конечное, число линейно независимых решений.
Прежде чем приступать к доказательству этих теорем, заметим, что они справедливы (в силу сказанного в п. 2) для уравнений с симметрическим ядром. При этом в силу совпадения А и А* теорема III становится тривиальной.
С другой стороны, если А — вырожденный интегральный оператор, то соответствующие уравнения сводятся, как мы видели выше, к системам линейных алгебраических уравнений; при
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА
469
§ 2]
этом теоремы Фредгольма автоматически переходят в теоремы о линейных системах, приведенные в предыдущем пункте.
Поскольку всякий компактный оператор есть предел сходящейся последовательности вырожденных, т. е. конечномерных, операторов, мы могли бы доказать теоремы Фредгольма с помощью соответствующего предельного перехода (от вырожденных ядер к невырожденным). Мы, однако, пойдем по другому’ пути и дадим доказательство этих теорем, не связанное с рассмотрением вырожденных уравнений.
Доказательство теорем Фредгольма. Напомним, что Кег В есть совокупность нулей линейного непрерывного оператора В (т. е. множество всех тех хе//, для которых Вх — 0), a Im В — область значений оператора В, т. е. совокупность векторов вида у = Вх. Ясно, что Кег В всегда есть замкнутое линейное подпространство. Множество Im В также представляет собой линейное многообразие, однако, вообще говоря, не замкнутое. Мы сейчас покажем, что для оператора Т=1 — А, где А — комплексный оператор, замкнутость соответствующего многообразия имеет место.
Лемма 1. Многообразие Im Т замкнуто.
Доказательство. Пусть уп е Im Т и -> у. По предположению существуют такие векторы хп е Н, что
Уп = Тхп = хп — Ахп.	(21)
Мы можем считать, что векторы хп ортогональны к Ker Т, вычитая, если необходимо, из хп его проекцию на Ker Т. Далее, можно считать, что ||хп|| ограничены в совокупности. Действительно, в противном случае, переходя к подпоследовательности, мы бы имели ||хп||->оо и, разделив на ||хп||, получили бы из (21), что	так как оператор А компактен,
то, снова переходя к подпоследовательности, можно считать последовательность ( Л „ * | сходящейся. Поэтому и „ Хп„ у- б
I II хп II )	J || Хп II 3
дет сходиться, скажем, к вектору z е Н. Ясно, что ||г|| = 1 и Tz = 0, т. е. z е Ker Т. Однако мы считаем векторы хп ортогональными к Ker Т и, следовательно, вектор z обязан быть ортогональным к Ker Т. Полученное противоречие и позволяет считать, что ||хп11 ограничены в совокупности. Вместе с тем в этом случае последовательность {Ахп} можно считать сходящейся, а тогда, как это следует из (21), будет сходящейся и последовательность {хп}. Если через х обозначить предел этой последовательности, то из (21) следует, что у — Тх. Лемма доказана.
Лемма 2. Пространство Н является прямой ортогональной суммой замкнутых подпространств Ker Т и Im Т*, т. е.
Кег ГФ Im Г =/7,	(22).
470
ЛИНЕПНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ. IX
и аналогично,
Ker Т*® Im Т — Н.	[23)
Доказательство. Мы уже знаем, что оба подпространства, фигурирующие в левой части равенства (22), замкнуты. Кроме того, они ортогональны, поскольку если h Ker Т, то (/1, Т*х) — (Th, х) — 0 для всех xs Н. Остается доказать, что никакой ненулевой вектор не может быть одновременно ортогональным к Ker Г и Im Т*. Но если вектор z ортогонален к Im Г*, то для любого хе Н имеем (Tz, х) = (z, Т*х) = 0, т. е. z е Ker Т. Равенство (23) доказывается аналогично. Лемма доказана.
Из леммы 2 сразу вытекает первая теорема Фредгольма. Действительно, f J_ Ker Т* в том и только том случае, если f е Im Т, т. е. если существует такое ср, что Тф = f.
Далее, для каждого целого k положим Hk — Im(Tft), так что, в частности, /71 = Im Т. Ясно, что подпространства Hh образуют депочку вложенных подпространств,
Н=>Н'=>Н2=> ...,	(24)
а в силу леммы 1 все эти подпространства замкнуты. При этом T(Hh)= Hh+l.
Л е м м а 3. Существует такое j, что Hk+l — Hk при всех k^j.
Доказательство. Если такого / не существует, то, очевидно, все Н* различны. В этом случае можно построить такую ортонормированную последовательность {хд}, что х^еЯ6 и ортогонально Hk+t. Пусть I > k. Тогда
Axt — Axk = — xk + (xz + Txk — 7xz)
и, следовательно, ||Axz — Axk|| 1, так как xz + Txh — Txt i= Hk+\ Поэтому из последовательности {Аха} нельзя выбрать сходящейся подпоследовательности, что, однако, противоречит компактности оператора А. Тем самым лемма доказана.
Лемма 4. Если Кег 7 = {0}, то Im Т = Н.
Доказательство. Если Кег Т— {0}, то оператор Т взаимно однозначен и, следовательно, если при этом Im Т =/= И, то цепочка (24) состоит из различных подпространств, а это противоречит лемме 3. Поэтому Im Т = Н. Аналогично, Im Т* — Н, если Кег Т* = {0}.
Л е м м а 5. Если Im Т = Н, то Ke Т — {0}.
Доказательство. Так как Im Т = Н, то, по лемме 2, Ker Т* = {0}, но тогда, по лемме 4, ImT1* = Н и следовательно, по лемме 2, Ker Т = {0}.
Совокупность лемм 4 и 5 и составляет содержание второй теоремы (альтернативы) Фредгольма. Тем самым эта теорема доказана.
Докажем, наконец, третью теорему Фредгольма.
§ 21	ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА	47Г
Предположим, что подпространство Ker Т бесконечномерно. Тогда в этом подпространстве найдется бесконечная ортонормп-рованная система {хД. При этом Ахк = хк и, следовательно, при k I имеем || Ахк— Ах1^ — д/2. Но тогда из последовательности {ЛхД нельзя выбрать сходящейся подпоследовательности, что противоречит компактности оператора А.
Пусть теперь р — размерность Ker Т и v — размерность Ker Т*. Предположим, что р < v. Пусть {фь .... фД— ортонор-мированный базис в Ker Т и {ipi, ..., i|)v}— ортонормированный базис в Ker Т*. Положим
и
Sx = Тх+ 52 (х, /==»
Так как оператор S получается из оператора Т прибавлением конечномерного оператора, то все результаты, доказанные выше для оператора Т, остаются верными и для оператора S.
Покажем, что уравнение Sx = 0 имеет только тривиальное-решение. Действительно, допустим, что
в
7х+ £(х, ф/)'ф/ = 0.	(25>
!='
Так как векторы ip.,- в силу леммы 2 ортогональны ко всем векторам вида Тх, то из (25) следует, что
Тх = 0
и
(х, ф;) = 0 при
Поэтому, с одной стороны, вектор х должен быть линейной комбинацией векторов фь а с другой, — ортогонален им. Следовательно, х = 0. Итак, уравнение Sx = 0 имеет только тривиальное решение. Но тогда по второй теореме существует такой вектор у, что
в
Ту + S (У, Ф/) = tn+i-/=i
Умножив это равенство скалярно на трц+i, мы получим справа 1, а слева 0, поскольку Ту = ImT, a ImT_LKerT* Это противоречие возникло из предположения ц < v. Поэтому ц 2г у. Заменяя теперь оператор Т на Г*, мы получим v и, следовательно, ц = V.
Теорема III доказана полностью.
Замечания. 1. В теоремах Фредгольма по существу речь идет об обратимости оператора А—/и эти теоремы означают, что Х= 1—или регулярная точка для А или собственное значение конечной кратности. Разумеется, все, что утверждается в. этих теоремах, остается справедливым и для операторов А —XI,
472
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
(ГЛ. IX
если X =/= 0. Поэтому всякая отличная от 0 точка спектра ком-пактного оператора является его собственным значением конечной кратности. Кроме того, мы знаем, что множество таких собственных значений не более чем счетно. Ввиду следствия на <тр.243 0 всегда принадлежит спектру компактного оператора в бесконечномерном пространстве, но не обязан, вообще говоря, быть собственным значением. Компактные операторы, для которых 0 служит единственной точкой спектра, называюФся (абстрактными) операторами Вольтерра.
2. Мы доказали теоремы Фредгольма для уравнения вида Ф = Лер -j- f, где А— компактный оператор в гильбертовом пространстве. Эти теоремы могут быть перенесены без существенных изменений и на случай произвольного банахова пространства Е. При этом, разумеется, сопряженное уравнение ip = — A-j- g будет уравнением в пространстве Е*, условие ортогональности (f, фо) = 0 нужно понимать как обращение в нуль на элементе f^E каждого функционала из подпространства Ker Т* аЕ* решений уравнения Т*ф0 = 0 и т. д. Изложение теорем Фредгольма для уравнений в банаховом пространстве содержится, например, в книге Л. А. Л ю с т е р н и к а и В. И. Соболева «Элементы функционального анализа».
5. Уравнения Вольтерра. У равнением Вольтерра (второго рода) называется интегральное уравнение
S
ф(х)= Jk(s, +	(26)
а
где K(s,t) — ограниченная измеримая функция: |Д($, /) | ^ Л4. Поскольку это уравнение можно рассматривать как частный случай уравнения Фредгольма (с ядром, равным нулю при t > s), теоремы Фредгольма справедливы и для уравнения (26). Однако для уравнений Вольтерра эти теоремы можно уточнить следующим образом. Уравнение Вольтерра (26) при любой функции f i= Ь2 имеет одно и только одно решение.
Действительно, дословно повторяя рассуждения п. 4 § 4 гл. II, мы видим, что некоторая степень оператора
$
Аф= К (s, /) ф (f)dt а
является сжимающим оператором и, следовательно, однородное уравнение имеет единственное (тривиальное) решение. В силу теорем Фредгольма отсюда и следует наше утверждение.
Упражнение. Пусть на отрезке задано интегральное уравнение Фредгольма второго рода с непрерывным ядром. Доказать для такого уравнения
S 2]	ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ ФРЕДГОЛЬМА	479
теоремы Фредгольма в пространстве непрерывных функций. При этом роль «сопряженного уравнения» играет интегральное уравнение с транспонированным ядром, а ортогональность понимается в смысле Li.
6. Интегральные уравнения первого рода. Абстрактным уравнением Фредгольма первого рода называется уравнение вида
Дф = А	(27)
т. е. уравнение, содержащее неизвестную функцию ф лишь под знаком компактного оператора.
Решение такого уравнения представляет собой задачу, вообще говоря, более сложную, чем решение уравнения второго рода, и уравнение (27) не может иметь решения при любой правой части.
Рассмотрим вначале в качестве простейшего примера уравнение
S f(s) = (f(i)dt, а
т. е. уравнение с ядром
( 1 при i^.s, K(s, /) = { л
(, 0 при t > 1.
Оно имеет очевидное решение <p(s) =/'(s), если f абсолютно непрерывна и ее производная принадлежит L2, и оно неразрешимо в противном случае.
Покажем, что и в общем случае уравнение (27) не может быть разрешимо при произвольном f е Н. Действительно, существование решения уравнения Дф = f при любом означало бы, что этот оператор отображает Н снова на все Н. Покажем, что это невозможно. Все Н можно представить как сумму счетного числа шаров Хп (например, шаров радиуса 1,2,... ..., п, ... с центром в нуле). Каждый из них переводится компактным оператором А в предкомпактное множество. Таким образом, замыкание Im Л есть сумма счетного числа компактов. Но в Н любой компакт нигде не плотен; в то же время /7, как и любое полное метрическое пространство, не может быть представлено как сумма счетного числа нигде не плотных множеств. Таким образом, 1тД #= Н\ иными словами, каков бы ни был компактный оператор А в Н, уравнение А<р = f не может быть разрешимо при всех f е И.
Другой существенный момент состоит в том, что оператор, обратный компактному, не ограничен. Поэтому, если fi и )2 — два близких между собой элемента из Н и оба уравнения
Лф2 = /2
474
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ. IX
разрешимы, то соответствующие решения <pi = А~1 fг и <р2 = А~![г могут сильно отличаться друг от друга. Иначе говоря, сколь угодно малая погрешность в свободном члене уравнения может привести к сколь угодно большой ошибке в решении. Задачи, в которых малое изменение исходных данных приводит к малому изменению решения (эта «малость» может в разных задачах пониматься по-разному), называются корректными. Решение интегрального уравнения первого рода (в отличие от уравнения второго рода) — некорректная задача. За последнее время разного рода некорректные задачи и методы их регуляризации (т. е. сведения их к задачам, в том или ином смысле корректным) получили широкое развитие. Однако изложение этих вопросов выходит за рамки данной книги.
§ 3. Интегральные уравнения, содержащие параметр. Метод Фредгольма
1. Спектр компактного оператора в Н. Будем рассматривать уравнение
ср = АДф + f, или, иначе,
(/-м)ф = л	(1)
где А — компактный оператор в гильбертовом пространстве Н, а А— числовой параметр.
В силу альтернативы Фредгольма возможны два и только два взаимоисключающих случая:
1. Уравнение (1) имеет при данном X одно и только одно решение для каждого f е Н.
2. Однородное уравнение ф — АЛф имеет ненулевое решение.
В первом случае оператор /— А.4 отображает, и притом взаимно однозначно, Н на все Н. Отсюда следует существование ограниченного обратного оператора (/ — АЛ)"1. Это равносильно тому, что оператор (л— определен на всем Н и ограничен; иначе говоря, в этом случае 1/А не принадлежит спектру оператора А.
Пусть теперь имеет место вторая возможность, т. е. существует такой отличный от нуля элемент ф>. е Н, что
Фх = Мфх. или Лфх = у фх;
тогда 1/А есть собственное значение оператора А.
Мы получаем следующий результат: каждое отличное от нуля число ц = 1/А является собственным значением компактного оператора А либо регулярно. Иными словами, у компакт
§ 3]	ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. СОДЕРЖАЩИЕ ПАРАМЕТР	475
ного оператора непрерывный спектр либо совсем отсутствует либо состоит из одной точки р = 0.
Объединив только что сказанное с теоремой 4 § 6 гл. IV, мы получаем следующее описание спектра компактного оператора в И. Спектр любого компактного оператора А в Н состоит из конечного или счетного числа отличных от нуля собственных значений рь рг,  • •, Р-п, • • •> каждое из которых имеет конечную кратность, и точки нуль1). Точка нуль— единственная возможная предельная точка для последовательности {рп}- Сама точка р = 0 может быть собственным значением конечной или бесконечной кратности, а может и не быть точкой множества собственных значений. Как было показано в п. 5 § 2 для уравнения
<р = АВф + f,
где В — интегральный оператор вольтеррова типа, всегда имеет место первый случай альтернативы Фредгольма (разрешимость при любом f е Ь2). Иначе говоря, спектр интегрального оператора типа Вольтерра состоит из одной точки р = 0. Вместе с тем в конце п. 4 § 2 мы назвали абстрактным оператором Вольтерра компактный оператор, спектр которого сводится к точке 0. Поэтому можно сказать, что интегральный оператор Вольтерра является и абстрактным оператором Вольтерра, и вся эта терминология оказывается оправданной.
2. Отыскание решения в виде ряда по степеням X. Детерминанты Фредгольма. Формально решение уравнения
(/ —А,Л)ф = ^
можно записать в виде
Ф = (/-М)-^.	(2)
Эта формула действительно определяет решение, если||АД||< 1, т. е. | А | < -д jj-, поскольку в этом случае оператор (/ — АЛ)-1 существует, определен на всем Н и ограничен (см. п. 7 § 5 гл. IV). При этом оператор (/ — АЛ)"1 можно представить как сумму степенного ряда
(/- АЛ)-1 = / + АЛ + А2Л2 + ... + кпАп + ...,
сходимость которого (по норме) обеспечивается условием | А | < <1/|| ЛII- Следовательно, решение (2) нашего уравнения (1) можно записать так:
Ф = f + KAf + K2A2f + ... +KnAnf+ ...	(3)
’) p = 0 обязательно принадлежит спектру Д, поскольку А1 не может быть ограничен в бесконечномерном Я (см, следствие на стр. 243).
476
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ. IX
Этот же результат получится, если искать решение уравнения (1) в виде степенного ряда
Фх = Фо + М>1 + ••• + ^пФп + •••
(где фп от X уже не зависят). Подставив этот ряд вместо ф в правую и левую части уравнения ф = АЛф + / и приравняв затем коэффициенты при одинаковых степенях X в обеих частях равенства, мы получим
Фо = f, Ф, = Л/, ..., ф„ = Лф„_1 = Anf, ..., т. е. ряд (3).
Покажем, что если А — интегральный оператор Гильберта— Шмидта, т. е. оператор, определяемый квадратично интегрируемым ядром /C(s,/), то оператор (/—ХЛ)“’ при достаточно малых значениях X может быть записан как сумма / -ф ХГ (X) единичного оператора / и некоторого интегрального оператора ХГ(Х) Гильберта — Шмидта с квадратично интегрируемым ядром, зависящим от параметра X. Выясним сначала, каким образом записываются ядра операторов А2, А3 и т. д. Рассмотрим для этого более общий вопрос: пусть даны два интегральных оператора ь	ь
Лф = К ($, О ф (/) dt, Вф — Q (s, f) ф (/) dt,
а	а
где
b b
| К ($, t) pdsdt = k2 < оо, а а
b b
I Q ($, О I2 ds dt — q2 < оо. а а
Найдем ядро оператора АВ. Имеем ь г	ь
ABq> = Ji K(s, «) j Q (и, t) ф (t) dt du = a (	a
b ( b
= I < к ($, u) Q (u, t)du ф (f) dt.
a (a
Возможность изменения здесь порядка интегрирования вытекает из теоремы Фубини, поскольку подынтегральная функция К (s, u)Q(u, t)q>(t)
суммируема по совокупности переменных и и t как произведение двух функций
K(s, п)ф(0 и Q(u, t), квадрат каждой из которых суммируем.
S 3]
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. СОДЕРЖАЩИЕ ПАРАМЕТР
477
Положим
ь
R(s, t) = j К (s, и) Q(u, t) du;	(4)
a
в силу неравенства Коши — Буняковского имеем
ь	ь
I R (s, t) |2 < J | К (s, и) |2 du J | Q (u, t) |2,7 -. а	а
откуда b ь
J J I R (s, t) |2 ds dt k2q2. a a
Итак, произведение двух интегральных операторов типа Гильберта— Шмидта есть оператор того же типа, с ядром, определяемым формулой (4). В частности, положив А— В, получаем, что А2 есть интегральный оператор с ядром
ь
Ki (s, t) — J К ($, и) К (и, /) du, а
которое удовлетворяет условию
b Ь	Г b Ь	-12
J Jl K2(s, t)\2dsdt^ J J|K(s, /)|2dsrfq = k\ a a	a	J
откуда || A21|	k2, где
ь b
k2 = J J | К (s, t)\2dsdt. a a
Аналогично получаем, что каждый из операторов Ап определяется ядром ь
Кп (s, t) = J Кп-\ (s, и) к (и, t) du (п — 2, 3, ...), а
удовлетворяющим условию
b ь
JJ|K„(S, t)fdsdt^kin.	(5)
а а
Ядра Kn(s,t) называются итерированными ядрами.
478
ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
[ГЛ. IX
При | X | < \/k ряд
/C(s, /) + X/C2(s, /)+ ... +Xn-IK„(s, /) + ...
сходится в силу оценки (5) в пространстве А2([а, b] X [а, &]) к некоторой функции Г(х, /; X), квадрат которой суммируем по «• и t при каждом |Х|< 1//г. Интегральный оператор Г(Х), для которого функция Г(s, /; X) служит ядром, есть сумма сходящегося ряда
Л + ХЛ2+ ... +кп~'Ап + ....	(6)
компактных операторов и, следовательно, он компактен.
Домножив эту сумму на X и прибавив к ней единичный оператор /, мы и получим оператор (/ — ХЛ)~'. Итак, действительно, при |Х| < \/k оператор (/ — ХЛ)-1 есть сумма единичного оператора / и компактного оператора ХГ(Х) с ядром
ХГ (s, /; Х)= § X"K„(s, /).
п— 1
Условие |X| < 1/k достаточно для сходимости ряда (6), но вовсе не необходимо. В некоторых случаях этот ряд может оказаться сходящимся даже при всех значениях X. Например, если А — оператор вольтеррова типа с ядром, удовлетворяющим условию
|K(s, /)|<М,
то, как показывает прямой подсчет, для итерированных ядер Kn(s,t) справедлива оценка:
I Kn(s, /)К
Мп (Ь-а)4-' (/г-1)!
откуда следует сходимость ряда (6) при любом X.
Однако, вообще говоря, степенной ряд (6) имеет некоторый конечный радиус сходимости. В то же время уравнение <р = = ХЛср + f имеет решение при всех X, кроме конечного или счет-‘ного числа значений, именно таких, что 1/Х есть собственное значение оператора А. Фредгольм показал, что для интегрального оператора Л, определяемого ограниченным и непрерывны м ядром /C(s,/), решение уравнения <р —ХЛ<р + / может быть найдено следующим способом. Введем обозначение
«1
Л
К
K(Sl, /,) ... K(slt tn)
К {sn, ... К (sn, tn)
§ 31
ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ. СОДЕРЖАЩИЕ ПАРАМЕТР
479
и определим функции D(X) и D(s,t;h), называемые, соответственно, детерминантом Фредгольма и минором Фредгольма, формулами: b	ь ь
1 -zUf!1 +-7-И
J \ 51 /	z J J V 51 52 /
а	а а
b
С
п! } а
\к(11 ”	... dln+ .... (7)
b	b b
/ S \	р / S £ \	1 г С С
Р(МД)=Ч ,Н UL +
\ Г /	J \Г Ь1 /	z J J
а	а а
(s ЛЯ ЛЯ _1_
G ъ i2)d^d^+-
Я’ J* "	... dln+ ... (8)
J \Г Ь| •• • 6п/
Тогда для интегрального уравнения
ь
Ф (s) = К К (s, t) ф (/) dt + f (s) a
резольвентное ядро дается формулой
г(», t, X)-1	L
и решение записывается в виде ь
=	+	f(t)dt	(9)
а
для всех значений X, таких, что 1/А. не есть собственное значение интегрального оператора А, отвечающего ядру K(s,i). При этом D(K) и	представляют собой целые аналитические
функции параметра X и D(k)—0 в том и только том случае, если 1/А. есть собственное значение интегрального оператора А. Как показал в 1921 г. Т. Карлеман, формулы (7), (8) и (9), полученные Фредгольмом в предположении непрерывности ядра остаются в силе и для любого ядра с интегрируемым квадратом. Мы не будем приводить здесь выводы формулы (9) и формул (7), (8) ').
‘) См. Т. С а г 1 е m a n, Zur Theorie der Integralgleichungen, Math. Zeitschr. 9 (1921), 196—217, а также F. Smithies, The Fredholm theory of integral equations, Duke Math. Journal, 8 (1941), 107—130.
Вывод формул (7), (8) и (9) см. в книгах [35] и [46].
ГЛАВА X ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ
В тех вопросах функционального анализа, которыми мы занимались в предыдущих главах, основную роль играли понятия линейного функционала и линейного оператора. Однако некоторые задачи, возникающие в функциональном анализе, носят существенно нелинейный характер; они приводят к необходимости развивать наряду с «линейным» и «нелинейный» функциональный анализ, т. е. изучать нелинейные функционалы и нелинейные операторы в бесконечномерных пространствах. К нелинейному функциональному анализу относится, по существу, такая классическая область математики, как вариационное исчисление, основы которого были заложены еще в XVII—XVIII вв. в работах Бернулли, Эйлера, Лагранжа. Однако в целом нелинейный функциональный анализ представляет собой сравнительно новую область математики, пока еще далекую от своего завершения. В этой главе мы изложим некоторые первоначальные понятия, относящиеся к нелинейному функциональному анализу, в основном к теории дифференцирования, и некоторые применения этих понятий.
§ 1.	Дифференцирование в линейных пространствах
1.	Сильный дифференциал (дифференциал Фреше). Пусть X и У — два нормированных пространства и F— отображение, действующее из X в У и определенное на некотором открытом подмножестве О пространства X. Мы назовем это отображение дифференцируемым в данной точке хеО, если существует такой ограниченный линейный оператор	У), что для
любого е > 0 можно найти 6 > 0, при котором из неравенства ||/i||< 6 следует неравенство
||F(x + h)- F(x) — Lxh\\^e\\h\\.	(I)
To же самое сокращенно записывают так:
F(x + h)-F(x)-Lxh = o(h).	(2)
Из (I) следует, что дифференцируемое в точке х отображение непрерывно в этой точке. Выражение Lxh (представляющее
§ 1]	ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ	481
собой, очевидно, при каждом h^X элемент пространства У) называется сильным дифференциалом (или дифференциалом Фреше) отображения F в точке х. Сам линейный оператор Lx называется производной, точнее, сильной производной отображения F в точке х. Мы будем обозначать эту производную символом F'(x).
Если отображение F дифференцируемо в точке х, то соответствующая производная определяется единственным образом. В самом деле, равенство \\L\h— £2/i|| = o(h) для операторов Li е (X, У), г = 1,2, возможно, лишь если Ei = L2.
Установим теперь некоторые элементарные факты, непосредственно вытекающие из определения производной.
1.	Если F(x) = уо = const, то F'(x)=0 (т. е. F'(x) в этом случае есть нулевой оператор).
2.	Производная непрерывного линейного отображения L есть само это отображение-.
L'(x) — L.	(3)
Действительно, по определению имеем
L(x + h)~ L(x) — L(h).
Несколько менее очевиден следующий важный результат.
3.	(П роизводная сложной функции). Пусть X, У, Z — три нормированных пространства, U(x0)—окрестность точки xQ е X, F — отображение этой окрестности в У, у0 = F(x0), E(z/o) — окрестность точки у0^ Y и G — отображение этой окрестности в Z. Тогда, если отображение F дифференцируемо в точке хо, a G дифференцируемо в точке уо, то отображение Н = GF (которое определено в некоторой окрестности точки х0) дифференцируемо в точке хо и
H'(x0) = G'(y0)F'(x0).	(4)
Действительно, в силу сделанных предположений
F(x0 + l) = F(x0) + F' (ХоП + oi (Ю и
G (у0 + П) = 6 (Уо) + G' (у0) т) + о2 (т)).
Но F' (х0) и G'(y0) — ограниченные линейные операторы. Поэтому
Н (Хо + В) = G (уо + F' (Хо) | + о, (I)) = G (уо) + G' (yQ) (F' (х0) I +
+ 01 (£)) + О2 (F' (Хо) | + о, (О) = G (уп) + G' (у0) F' (х0) I + о3 (|).
(Проведите аккуратную выкладку сейб).
Если F, G и Н— числовые функции, то формула (4) превращается в известное правило дифференцирования сложной функции.
482
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. X
4.	Пусть F и G — два непрерывных отображения, действующих из X в У. Если F и G дифференцируемы в точке х0, то и отображения F + G и aF (а — число) тоже дифференцируемы в этой точке, причем
(F + G)'(х0) = F'(х0) + 6'(х0)	(5)
(aF)' (x0) = aF'(x0).	(6)
Действительно, из определения суммы операторов и произведения оператора на число сразу получаем, что
(F + G) (х0 + h) = F (х0 -j- h) + G (х0 + й) =
= F (х0) + G (х0) + F' (х0) h + G' (х0) h + ok (й) и
aF (х0 + h) = aF (х0) + aF' (х0) h + о2 (й),
откуда следуют равенства (5) и (6).
2.	Слабый дифференциал (дифференциал Гато). Пусть снова F есть отображение, действующее из X в У. Слабым дифференциалом или дифференциалом Гато отображения F в точке х (при приращении й) называется предел
DF (х, й) = 4 F (х + th) I = lim л (х + th^ ~ F ,
1/=0	/_>о	I
где сходимость понимается как сходимость по норме в простран-стве У.
Иногда, следуя Лагранжу, выражение DF(x,h) называют первой вариацией отображения F в точке х.
Слабый дифференциал DF(x,h) может и не быть линеен по й. Если же такая линейность имеет место, т. е. если
DF(x, й) = Е'с(х)й,
где F'c (х) — ограниченный линейный оператор, то этот оператор называется слабой производной (или производной Гато).
Заметим, что для слабых производных теорема о дифференцировании сложной функции, вообще говоря, неверна. (Приведите пример!)
3.	Формула конечных приращений. Пусть О — открытое множество в X и пусть отрезок [х0, х] целиком содержится в О. Пусть, наконец, F есть отображение X в У, определенное на О и имеющее слабую производную F'c в каждой точке отрезка [х0, х]. Положив Дх == х — хо и взяв произвольный функционал <р е У*, рассмотрим числовую функцию
f (^) = <р(Е (х0+ Мх)),
§ IJ	ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ	483
определенную при	Эта функция дифференцируема
по t. Действительно, в выражении
f (/ + М) — f (/) _ ( F (х0 + t Ьх + М Ьх) — F (х0 + t Ах) \
А/	А/	)
можно перейти к пределу под знаком непрерывного линейного функционала ф. В результате получаем
f' (0 — Ф (Fc (х0 + t Ах) Ах).
Применив к функции f на отрезке [0, 1] формулу конечных приращений, получим
f (l) = f(0) + Г(0), где О<0<1, т. е.
Ф (F (х) — F (х0)) = ф (Fc (хо + 0 Ах) Ах).	(7)
Это равенство имеет место для любого функционала ф е У* (величина 0 зависит, разумеется, от ф). Из (7) получаем
| ф(^(х) - F(x0)) | <||ф|| • sup || F'c (хо + 0 Ах) || • || Ах ||.	(8)
о < е< 1
Выберем теперь ненулевой функционал ф так, что
Ф (F (х) - F (х0)) = || ф || • || F (х) - F (хо) ||
(такой функционал ф существует в силу следствия 4 теоремы Хана — Банаха (см. п. 3 § 1 гл. IV)). При этом из (8) получаем
|| F (х) — F (х0) || < sup || Fc (хо + 0 Ах) || • || Ах || (Ах = х — х0). (9) о < е< 1
Это неравенство можно рассматривать как аналог формулы конечных приращений для числовых функций.
Применив формулу (9) к отображению
х —> F (х) — Fc (хо) Ах, получим следующее неравенство:
|| F (х) — F (хо) — Fc(xo) Ах ||< sup || F'c (хо + 0 Ах) — F’c (х0) || • || Ах ||. о<е<1
(Ю)
4.	Связь между слабой и сильной дифференцируемостью. Сильная и слабая дифференцируемость представляют собой различные понятия даже в случае конечномерных пространств. Действительно, из анализа хорошо известно, что для числовой функции
f(x) = f(xt...*п)
при н > 2 из существования производной
484
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. X
при любом фиксированном h = (йь ..., hn) еще не следует дифференцируемость этой функции, т. е. возможность представить ее приращение f(x-]-h)— f(x) в виде суммы линейной (по h) части и члена выше первого порядка малости относительно h.
Простейшим примером здесь может служить функция двух
переменных
f (хь х2)—
*1*2
X? + Х22
если (хь х2) =# (0, 0),
(Н)
0, если (хь х2) = (0, 0).
Эта функция непрерывна всюду на плоскости, включая точку (0,0). В точке (0,0) ее слабый дифференциал существует и равен 0, поскольку
lim
<-»о
f(O + ^)-f(O) = . f%ft2
t	<->о	+ f2ft2
0.
Вместе с тем этот дифференциал не является главной линейной частью приращения функции (11) в точке (0,0). Действительно, если положить h2 — h2, то
f(hvh2)-f(0, 0) lim ———----------------
цн-»о IIя»
Однако если отображение F имеет сильную производную, то оно имеет и слабую, причем сильная и слабая производные совпадают. Действительно, для сильно дифференцируемого отображения имеем
F (х + th) — F (х) = F' (х) (th) + о (th.) = tF' (х) h + о (th) и
F (х + th) -FM = р, м h + лВ. _> р' (х) .
Выясним условия, при которых из слабой дифференцируемости отображения F следует его сильная дифференцируемость.
Теорема 1. Если слабая производная F'c (х) отображения F существует в некоторой окрестности U точки х0 и представляет собой в этой окрестности (операторную) функцию от х, непрерывную в Хо, то в точке Хо сильная производная F'(x0) существует и совпадает со слабой.
Доказательство. По е > 0 найдем б >0 так, чтобы при ||/i|| < б выполнялось неравенство:
II F'c(x0 + h)~ F'c(x0) |К е.
$ 1]	ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ	485
Применив к отображению F формулу (10), получим:
II F (х0 + А) - F (хо) - F'c (хо) h || <
< sup II F'c(xo + 0ft) — F'c (хо) II II ft IK e I! ft ||.
o< i
Тем самым имеет место (1), т. е. доказано как существование сильной производной F'(x0), так и ее совпадение со слабой производной.
В дальнейшем мы будем, если не оговорено противное, рассматривать такие отображения, которые дифференцируемы в сильном, а значит, и в слабом смысле.
5.	Дифференцируемые функционалы. Мы ввели дифференциал отображения F, действующего из одного нормированного пространства X в другое нормированное пространство У. Производная F'(x) такого отображения при каждом х— это линейный оператор из X в У, т. е. элемент пространства £(Х, У). В частности, если У — числовая прямая, то F — принимающая числовые значения функция на X, т. е. функционал. При этом производная функционала F в точке х0 есть линейный функционал (зависящий от х0), т. е. элемент пространства X*.
Пример. Рассмотрим в действительном гильбертовом пространстве Н функционал F(x) — ||х||2. Тогда
II х + ft ||2 — || х II2 = 2 (х, л) + II л II2;
величина 2(х, й) представляет собой главную линейную (по й) часть этого выражения, следовательно,
F' (х) = F'c (х) = 2х.
Упражнение. Найти производную функционала || х || в гильбертовом пространстве. (Ответ: х/|| х || при х =/= 0; при х = 0 не существует.)
6.	Абстрактные функции. Предположим теперь, что к числовой прямой сводится пространство аргументов X. Отображение Е(х), сопоставляющее числу х элемент некоторого банахова пространства У, называется абстрактной функцией. Производная F'(х) абстрактной функции (если она существует) представляет собой (при каждом х) элемент пространства У — касательный вектор к кривой Е(х). Для абстрактной функции (представляющей собой функцию одного числового аргумента) слабая дифференцируемость совпадает с сильной.
7.	Интеграл. Пусть F — абстрактная функция действительного аргумента t со значениями в банаховом пространстве У. Если F задана на отрезке [а, Ь], то можно определить интеграл функции F по отрезку [а, А]. Этот интеграл понимается как предел интегральных сумм
п — 1
ZF(lk)(tk+i-tk),
Л=»Э
486
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
ГГЛ. X
отвечающих разбиениям
а = /о<Л< ••• </„ = &,	^fe+iL
при условии, что max(/ft+1 —	Интеграл (представляющий,
собой, очевидно, элемент из У) обозначается символом
ь
J F (/) dt.
а
Рассуждения, в значительной мере аналогичные проводимым для функций, принимающих скалярные значения, показывают,, что интеграл от функции, непрерывной на отрезке, существует; при этом он обладает свойствами обычного риманова интеграла. Среди этих свойств отметим следующие.
1.	Если U— фиксированное линейное непрерывное отображение пространства У в некоторое пространство Z, то
ь	ь
^UF(t)dt = U^F (t) dt. а	а
2.	Если F(t) имеет вид f(t)y0, где f(t) — числовая функция, а уо — фиксированный элемент из У, то
ь	ь
J F (t)dt = уо J f (t) dt.	(13>
а	а
II &	Ь
3.	К	F(t)dt	< J||F(/)||c//.
II а	а
Пусть снова X	и	У — нормированные пространства,
а ВС(Х, У) — линейное пространство всех непрерывных ограниченных1) отображений X в У. В пространстве ВС(Х, У) можно ввести топологию, принимая за окрестности нуля множества t/„,E = {F: sup ||F(x)||<e}.
1! х II С п
На подпространстве Z(X, У)cz ВС(Х, У) всех линейных непрерывных отображений X в У эта топология совпадает с обычной топологией в Z(X, У), задаваемой операторной нормой. Пусть J = [х0, х0 -ф- Дх] — какой-нибудь прямолинейный отрезок в X. Допустим, что задано непрерывное отображение этого отрезка
’) Отображение F : X-э-У называется ограниченным, если для всякого ограниченного множества Q а X множество F(Q) ограничено в У. Нелинейное непрерывное отображение не обязательно ограничено.
§ 1)	ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ	487
в пространство ВС(Х, У), т. е. что каждой точке хе / сопоставлено некоторое отображение F(x)e ВС(Х, У), непрерывно зависящее от векторного параметра хе/. Тогда можно определить интеграл от F(х) по отрезку /, полагая
х0+Дх	1
F (х) dx = F (х0 + Мх) (Ax) dt	(14)
Хо	О
(здесь F(x0 + t Ах) (Ах) при каждом t е [0, 1] есть элемент пространства У, являющийся образом элемента Ах е X при отображении F(xq + /Ax). Ясно, что интеграл, стоящий в правой части формулы (14), существует и является элементом пространства У.
Применим эту конструкцию к восстановлению отображения по его производной.
Рассмотрим отображение F, которое действует из X в У и имеет на отрезке [х0, х0+ Ах] непрерывно зависящую от х силь-Хо+Дх
ную производную F'(x). Тогда существует интеграл F'(x)dx.
Хо .Докажем, что имеет место равенство
J F'(x)dx==F(x0 + Ax)- F(x0),	(15)
Хо
обобщающее формулу Ньютона — Лейбница. Действительно, по определению,
Хо+Дх	га-1
( F' (х) dx = lim У F' (х0 + tk Ах) (Ах) (tk+i — tk) =*
j	б->0 “
Xq	«=о
= lim У F'(xk)(Xxk), °-*0 *=о
где
Xk = хй + tk Хх, Xxk = (tk+i — tk)Xx и й = max (ZA+1 — 4). k
Но в то же время при любом разбиении отрезка 0^ t 1 имеем
П—1
F (х0 -J- Ах) — F (х0) = £ [F (х0 + tll+l Ах) — F (х0 + tk Ах)] = k=0
п — 1
= E[^(xft+1) —f(xj].
я=0
488
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
(ГЛ. X
По формуле (10) получаем
I п —1
Е [^ta+i) — F(xk) — F'(xk)\xk] <
11 fe=3
n— 1
<11 Ax II E (tk+i — tk) sup || F' (xk + 0* Ax*) — F' (xk) ||. a=o	e
(16>
Так как производная F'(x) непрерывна, а следовательно, и равномерно непрерывна на отрезке [х0, х0 + Ах], правая часть неравенства (16) стремится к нулю при неограниченном измельчении разбиения отрезка [Хо, х0 -ф Ах], откуда и вытекает равенство (15).
8. Производные высших порядков. Пусть F — дифференцируемое отображение, действующее из X в Y. Его производная F'(x) при каждом х е X есть элемент из Z(X, У), т. е. F' есть отображение пространства X в пространство линейных операторов Z (X, У). Если это отображение дифференцируемо, то его производная называется второй производной отображения F и обозначается символом F". Таким образом, F" (х) есть элемент пространства Z (X, £ (X, У)) линейных операторов, действующих из X в £ (X, У). Покажем, что элементы этого пространства допускают более удобную и наглядную интерпретацию в виде так называемых билинейных отображений.
Мы говорим, что задано билинейное отображение пространства X в пространство У, если каждой упорядоченной паре элементов х, х' из X поставлен в соответствие элемент у = = В(х, х')е У так, что выполнены следующие условия:
1) для любых X], х2, x'l, Х2 из X и любых чисел а, 0 имеют место равенства:
В (aXj + 0х2, xQ = аВ (хр х]) + 0В (х2, х(),
В (Xj, ax] + 0х') = аВ (xu х() + 0В (хр х2);
2) существует такое положительное число М, что
||В(х, х')||<М||х||-||х'|1	(17}
при всех х, х' е X.
Первое из этих условий означает, что отображение В линейно по каждому из двух своих аргументов; нетрудно показать, что второе условие равносильно непрерывности В по совокупности аргументов.
Наименьшее из чисел М, удовлетворяющих условию (17),. называется нормой билинейного отображения В и обозначается ||В|[.
Линейные операции над билинейными отображениями определяются обычным способом и обладают обычными свойствами-
и
ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ
489
Таким образом, билинейные отображения пространства X в пространство У сами образуют линейное нормированное пространство, которое мы обозначим В(Х2, У), При полноте У полно и В(Х2, У).
Каждому элементу А из пространства S(X, S (X, У)) можно поставить в соответствие элемент из В(Х2, У), положив
В(х, х') — (Ах)х'.	(18)
Очевидно, что это соответствие линейно. Покажем, что оно также и изометрично и отображает пространство S(X,S(X,Y)) на. все пространство В(Х2, У). Действительно, если у = : В (х, х') = (Ах)х', то
Ili/IKII Ах|| • ||х'II <11 АII • ||х II. II х'||, откуда
1161К11ЛЦ.	(19)
С другой стороны, если задано билинейное отображение В, то при фиксированном хе.Х отображение х'-*(Ах)х' = В(х, х') есть линейное отображение пространства X в У.
Таким образом, каждому хеХ ставится в соответствие элемент Ах пространства S(X, У); очевидно, что Ах линейно зависит от х, т. е. билинейное отображение В определяет некоторый элемент А пространства S (X, S’ (X, У)). При этом ясно, что отображение В восстанавливается по А при помощи формулы (18) и
II Ах 11 = sup || (Ах) х'||= sup || В (х, х') |К|| В || • || х ||, откуда
11А1КП5Ц-	(20)
Сопоставляя (19) и (20), получаем ||А|| = ||В||. Итак, соответствие между В(Х2, У) и S(X, S(X, У)), определяемое равенством (18), линейно и изометрично, а следовательно, взаимно однозначно. При этом образ пространства S(X, S(X, У)) есть все В(Х2, У).
Мы выяснили, что вторая производная F"(x) есть элемент пространства S (X, S (X, У)). В соответствии с только что сказанным мы можем считать F"(x) элементом пространства В(Х2, У).
Рассмотрим элементарный пример. Пусть X и У — конечномерные евклидовы пространства размерностей тип соответственно. Тогда каждое линейное отображение X в У можно задать некоторой (и X т) -матрицей. Таким образом, производная В'(х) отображения F, действующего из X в У, есть (зависящая <от хеХ) матрица. Если в X и У выбраны базисы, скажем,
eh ..., ет в X и	fn в У,
490
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. к
то
х = XjCi 4-^2^2 + ••• +хтет, y = ylfl+y2f2 + ••• +ynfn-Тогда отображение у = F(x) можно записать в виде
yi = Fl(xl, , хт),
Уп = Рп(х1, хт),
и
Вторая производная F"(х) определяется в этом случае совокуп-52(/.
ностью п X tn X величин ak< ti — д д --. Такую совокупность величин аь, ц можно рассматривать как определяемое формулой т
^к, i “ X &к, ijXi i=l
линейное отображение пространства X в пространство 3?(Х, У), или как определяемой формулой
т
У* = Ч UXiX'i
билинейное отображение пространства X в У.
Очевидным образом можно ввести понятие третьей, четвертой и вообще /i-й производной отображения F, действующего из X в У, определив п-ю производную как производную от производной (п—1)-го порядка. При этом, очевидно, п-я производная представляет собой элемент пространства S’(X,Z’(X, ... . .., Z (X, У))). Повторяя рассуждения, проведенные для второй производной, можно каждому элементу этого пространства естественным образом поставить в соответствие элемент пространства Х(Хп, У) n-линейных отображений X в У. При этом под п-линейным отображением понимается такое соответствие-y = N(x', х", ..., х(п>) между упорядоченными системами (х', х", .. . , х<п)) элементов из X и элементами пространства У, которое линейно по каждому из х1' при фиксированных остальных элементах и удовлетворяет при некотором М > 0 условию
|| N (х!, х", ..., х^) ||< М || х' || • || х" || ... 1| х^ ||.
Таким образом, п-ю производную отображения F можно считать-элементом пространства Х(Хп, У).
§ 1]	ДИФФЕРЕНЦИРОВАНИЕ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ	491
9.	Дифференциалы высших порядков. Мы определили (сильный) дифференциал отображения F как результат применения к элементу АеХ линейного оператора F'(x), т. е. dF = F'(х) h. Дифференциал второго порядка определяется как d2F = = F"(х) (Ji, h), т. е. как квадратичное выражение, отвечающее отображению F" (х) <= В (X2, У). Аналогично дифференциалом n-го порядка называется dnF=F(n>>(x) (h, h, . . ., h), т. e. тот элемент пространства У, в который элемент (ft, й, ..., ft) е е Х/ХХ ... XX = Р переводится отображением Нп)(х).
10.	Формула Тейлора. Сильная дифференцируемость отображения F означает, что разность F(x-\-h)—F(х) может быть представлена в виде суммы линейного члена и слагаемого, имеющего порядок выше первого относительно ||ft||. Обобщением этого факта является формула, аналогичная формуле Тейлора для числовых функций.
Теорема 2. Пусть F — отображение, действующее из X в У, определенное в некоторой области ОсХи такое, что F<n)(x) существует и представляет собой равномерно непрерывную функцию от х в О. Тогда имеет место равенство /(x + ft)-F(x) = F'(x)ft + ^-F"(x)(ft, ft)+ ...
... +^F(n)(x)(ft......ft) + со(х, ft), (21)
где ||co(x, ft) || = о(||йП.
Доказательство будем вести по индукции. При и=1 равенство (21) тривиально. Возьмем теперь произвольное фиксированное п и предположим, что равенство, получающееся из (21) заменой п на п—1, уже доказано для всех отображений, удовлетворяющих условиям теоремы, в которых п заменено на п — 1. Тогда для отображения F' имеем
rix + h^F'^ + F" (,x)h + ^F"'(x)(h, ft)+ ...
 • • + ру~Т)!	й) + (%, ft), (22)
где ||е>1(х, ft)|| = o(||ft|ln-'). Интегрируя обе части равенства (22) по отрезку [х, х-фА] и пользуясь формулой Ньютона — Лейбница (15), мы получим
।	1
/ (х -ф ft) — F (х) = J F' (х + /Л) Л dt = ( { F' (х) -ф tF" (х) й -ф о	о
+ ±t2F"'(x)(h,	.... h}]hdt + Rn, (23)
I
где Rn = coj (%, th) h dt.
о
492
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. к
Из (23) получаем
F(x + h)- F(x)~
= F'(x)h + ±-F"(x)(h, h)+ ... +±-FM(x)(h, .... h) + Rn, причем	i
KK th) II - II ft 11^ = 0(11 ft ID-0
Тем самым наше утверждение доказано.
Формулу (21) называют формулой Тейлора для отображений.
§ 2. Теорема о неявной функции и некоторые ее применения
1. Теорема о неявной функции. Одна из важнейших теорем: классического анализа, имеющая разнообразные применения,— это теорема о неявной функции. Мы сейчас покажем, что эта теорема переносится без больших изменений с числовых функций на отображения произвольных банаховых пространств.
Теорема 1. Пусть X, У, Z— банаховы пространства, U — окрестность точки (хо,Уо)^Х X У и F — отображение U в Z, обладающее следующими свойствами:
1.	F непрерывно в точке (х0,у0).
2.	F(x0, у0) = 0.
3.	Частная производная F'y (х, у) существует в U и непрерывна в точке (х0, z/о), а оператор F'y(xQ, у0) имеет ограниченный обратный.
Тогда уравнение F(x,y) = 0 разрешимо в некоторой окрестности точки (х0,у0). Точнее это означает следующее: существуют такие е>0пб>0п такое отображение
У = Цх),	(1)
определенное при ||х — х0|| < б и непрерывное в точке х0, что-каждая пара (х,у), для которой ||х — х0|| < б и y~f(x), удовлетворяет уравнению
F(x, у) = 0,
(2)
и обратно, каждая пара (х,у), удовлетворяющая уравнению (2) и условиям || х — х01| < б, || у — уо || е, удовлетворяет и (1).
Доказательство. Обозначим через С7(Ж) сг У совокупность тех у, для которых (х, у)е U при данном х. Будем считать, что ||х — х0|| настолько мало, что уо е U&, и рассмотрим определенное на С7(Ж) отображение Л(Х>:
А(Х)У = У~ [F'y (*<г //о)]"' F (х> У)-	(3>
§2]
ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ
493
Ясно, что уравнение
Ах)У = У
равносильно уравнению F(x, у) = 0.
Для доказательства существования решения уравнения (3) применим принцип сжимающих отображений. С этой целью по? кажем, что для каждого достаточно малого е > 0 найдется та* кое б ~> 0, что при ||х — х0|| < 6 отображение Л(Х) является сжимающим и переводит шар ||z/ — z/oll е в себя. Начнем с того, что вычислим и оценим по норме производную отображения Л(х). Имеем в силу формул (3) — (5) § 1:
Аw (У) =1 “ Оо* F'v У) =
= [< (*о> Уо)]"1 [Ру (Л- Уо) - Ру ’ У)]-
В силу непрерывности производной Fy в точке (хо, Уо) можно выбрать 8 и б так, что
№(у)11<<7< 1.
Это неравенство вследствие формулы конечных приращений означает, что отображение Л(х) пространства Y при любом х, удовлетворяющем неравенству ||х—х0||<б на шаре ||г/—z/oll^e является сжимающим. Оценим теперь — */oll. Имеем:
».)]'! If(*. »«)!=
=1И(^ ».)Г'1И(х, у.у-ру.. »»)Ц.
В силу непрерывности отображения F в точке (хо, уо) последнее выражение можно сделать за счет выбора б сколь угодно малым. Пусть б > 0 настолько мало, что
II А*)Уо —УоИ< е(1 — <?) при || х0 — х || < б.
Проверим, что при таком выборе б отображение А(Х) переводит замкнутый шар ||z/ — z/oll е в себя. Действительно, если ||х — Xoll < б и ||г/ — z/ol| 8, то из формулы конечных приращений получим
II А(Х)У — Уо IK II Ах)Уо — Уо II + IIЛ(Х)У — А(х)у01| <
<8(1-<7) + ° suf), ||Л[х)(r/oH-0(t/—х/0))Ц- ||//-у0||<в(1-<7)+е?=е.
Итак, при ||х — Хо|| < б отображение Л(х) переводит замкнутый шар ||г/—z/oll е в себя и является на этом шаре сжимающим. Значит, в этом шаре существует единственная неподвижная точка у* — f(x), т. е. точка, для которой
У* = У*~ [Ру (*о> Уо)]"' Р U- У*).
494
ЭЛЕМЕНТЫ дифференциального исчисления
ГГЛ. X
т. е. в силу условия 3 теоремы
F(x, /) = 0.
Отображение f и есть искомое. Действительно, справедливость уравнения (2) уже проверена. Равенство f(x0) — у0 вытекает из единственности неподвижной точки для отображения А(Х»), а непрерывность построенной функции f следует из того, что в приведенных выше рассуждениях величина е может быть взята сколь угодно малой.
Замечание. Нетрудно показать, что если в теореме 1 предположить отображение F непрерывным в окрестности U (а не только в точке (х0, Уо)), то соответствующее отображение f будет непрерывно в некоторой окрестности точки х0.
Нижеследующая теорема устанавливает условия, при которых функция, определяемая уравнением вида F(x, у) = О, дифференцируема.
Теорема 2. Пусть выполнены условия теоремы 1, и пусть, кроме того, в U существует частная производная F'x, непрерывная в точке (х0, уо). Тогда отображение f дифференцируемо в точке х0 и
f (*о)=	(*о> Уо)] Fx (*о> Уо)-	(4)
Доказательство. Обозначим выражение, стоящее в (4) справа, через А. Оно представляет собой линейный оператор, действующий из X в У. Доказать, что этот оператор служит производной отображения f в точке хс, это значит доказать существование для каждого 8 > 0 такого б > О, что при любом х таком, что ||х— Xoll < б, выполнено неравенство
|| f (х) — f (х0) — А (х — х0) || < е || х — х0||.	(5)
Полагая f(x) = у, и заменив f(x0) на уо, а оператор А — его выражением (4), имеем
f (x)-f (х0)—A (х—х0) = у-у0 + [F' (х0, у0)]~‘ Fx (х0, у0) (х-х0)=
=	(*0’ Уо)] {Fx (*0> Уо) (*	*о) + Fy (*0> Уо) (у Уо)}-
Но F(x, у) — F(x0, уо) = 0, поэтому с помощью формулы конечных приращений получаем такую оценку:
|| f(x) — f (х0) — А (х — х0) || < ||[F'y (х0, г/о)]~11X
Х| {F (х, у) F(xq, уq) Fx(xq, у^)(х х0) Fy(xQ, у^)(у Уо)}||^== <	(*о- Уо)]”' I [0 <SUP <, || F'x (х0 + 0 (х - х0), у0 + 0, (у - у о)) -
- Fy (*о> Уо)II • IIх - *01| + 0 , !ЦР ,IIFy (хо + 0 Iх - *о)>
Уо + е1 (у - Уо)) - F'y (*о> У о) II • II У - Уо II ] < П [ II* “ *о|| + ||У “ У oil ]>
ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ
495
§ 21
где величина ц может быть сделана сколь угодно малой в силу непрерывности производных Fx и Fy, если величина б достаточно мала. Таким образом, мы получили, что
II f(x) — f (х0) — Л (х — х0) НСТ][|| х — х0 II + II f(x) — f (х0) II ] <
< Т] [ IIX — х0 II + II Л (х — х0) II + II f (х) — f (х0) — Л (х — х0) II].
Отсюда при достаточно малом ц получаем
II Ж - f W - Л (х - Хо) II < n (1 - nF1 (1 + II Л II) II х - х0 II,
и для доказательства неравенства (5) остается лишь выбрэть ц так, что т)(1 —т))-1(1 + 11Л||) е е. Теорема доказана.
Рассмотрим теперь некоторые применения теоремы о неявной функции.
2.	Теорема о зависимости решения дифференциального уравнения от начальных данных. Рассмотрим задачу Коши для дифференциального уравнения
dx/dt = f(t, х),	x(t0) = x0,	(6)
где f(t,x) и х — элементы некоторого банахова пространства Е. Задача (6) равносильна интегральному уравнению
t
х (t) — х0 — f (т, х (r))dr = 0.	(7)
*0
Запишем это уравнение как F(x0, x(t)) = 0. Таким образом, F — это оператор, отображающий прямую сумму пространства Е и пространства Се[^о,6] непрерывно дифференцируемых функций со значениями в Е в пространство Се [Cj, 6]. Если функция f(t,x) непрерывна и имеет непрерывную по (t, х) производную, то выражение
t
х (0 — f (т, х (т)) dx
^0
определяет дифференцируемое отображение пространства Се По, 6] в себя. Следовательно, и Е(х0, х(0) есть дифференцируемый по x(t) оператор, а так как х0 входит в Е(х0, х(^)) аддитивно, то F есть дифференцируемая функция на EXCftty. 6]. Дифференциал этой функции по х имеет вид
F'xh = h (t) — f 'х (т, х (т)) h (т) dx.	(8)
^0
495
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. X
Правая часть этого равенства определяет оператор, отображающий СЁ [/о, й] в себя. Этот оператор обратим. Действительно, для любой функции у (t) е Се[/0, /1] уравнение
F'xh (t) = y (/), или t
h (t) — f'x (т, x (т)) h (т) dx = у (О,
равносильно дифференциальному уравнению
^-fat,x(t))h(t) = y'(fy	(9)
с начальным условием h(t0)= y(to).
Уравнение (9) — это линейное уравнение с непрерывными коэффициентами, поэтому в силу известных теорем (см. [24]) существует единственное решение этого уравнения, определенное на всем отрезке [/о, Л] и удовлетворяющее указанному выше начальному условию, а это и означает обратимость оператора F'x.
Полученный результат означает, что к уравнению
F (х0, х (/)) = О
применима теорема о неявной функции. В силу этой теоремы решение х — x(t) данного уравнения, которое может рассматриваться как функция переменного начального значения х0: х == — x(t,x0), дифференцируемым образом зависит от х0. В частности, принимая за Е конечномерное пространство, мы получаем обычную теорему о непрерывной дифференцируемой зависимости решения системы дифференциальных уравнений от начальных условий.
Аналогичным образом с помощью теоремы о неявной функции может быть получено утверждение о дифференцируемой зависимости решения дифференциального уравнения
^=f(t,x,a)
от параметра а, если его правая часть дифференцируемым образом зависит от а.
3.	Касательные многообразия. Теорема Люстерника. В качестве еще одного применения теоремы о неявной функции рассмотрим следующий вопрос. Пусть F(x), где х — (хь х2), — дифференцируемая функция на плоскости. Уравнение F(x)=0 определяет на плоскости некоторую кривую С. Пусть х0 — точка, принадлежащая этой кривой. Касательная к кривой С в данной точке может быть определена либо как совокупность векторов
ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ
437
§ 2]
вида х0 + th, где h— вектор, перпендикулярный вектору F'(хо) (т. е. градиенту функции F в точке х0), либо как совокупность точек + th, расстояние которых до кривой С есть бесконечно малая выше первого порядка относительно t. Содержание теоремы Люстерника состоит в том, что эквивалентность двух определений касательной имеет место и для многообразий в произвольных банаховых пространствах. Введем некоторые понятия и обозначения, необходимые для точной формулировки соответствующей теоремы.
Пусть X и Y — банаховы пространства и F— отображение пространства X в У. Пусть далее Мо — совокупность точек из X, удовлетворяющих уравнению F(x)=0, и х0 е Мо. Предположим, что отображение F непрерывно дифференцируемо в некоторой окрестности U точки хо. Мы назовем отображение F регулярным в точке хо, если линейный оператор F'(x0) отображает пространство X на все У.
Обозначим через То совокупность элементов h е X, удовлетворяющих условию F' (х0)й = 0, т. е. То— КегАДхо). Ясно, что То есть подпространство в X. Сдвиг этого подпространства на вектор хо, т. е. многообразие хо+ То, обозначим через Ти назовем линейным многообразием, касательным к множеству Мо в точке х0. Имеет место следующая теорема.
Теорема 3 (Л. А. Люстерник). При указанных выше условиях относительно F элемент хо + h принадлежит касательному многообразию Тх, в том и только том случае, если расстояние элемента хо + th от множества Мо есть величина выше первого порядка малости относительно t.
Эта теорема играет очень важную роль в задачах оптимального управления. Она служит инструментом, с помощью которого известное правило множителей Лагранжа нахождения условного экстремума может быть распространено на широкий круг экстремальных задач в банаховых пространствах.
Сколько-нибудь полное изложение этих вопросов выходит за рамки настоящей книги (о них см., например, в книге: А. Д. Иоффе и В. М. Тихомиров, Теория экстремальных задач, М., «Наука», 1974). Мы ограничимся тем, что проведем доказательство теоремы Люстерника для так называемого «разложимого» случая, в котором теорема Люстерника почти непосредственно вытекает из теоремы о неявной функции. Именно, предположим, что пространство, на котором определено отображение F, может быть разложено в прямую сумму
А’=Г0®Л
подпространства То = Кег F'(xa) и некоторого пространства Т%. (Заметим, что в банаховом пространстве, отличном от гильбертова, не всякое подпространство имеет прямое дополнение. Бо
•498
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. X
лее того, можно показать, что если в пространстве X всякое линейное подпространство имеет прямое дополнение, то X — гильбертово пространство.)
При этом предположении теорема 3 может быть сформулирована следующим более точным образом.
Теорема 4. Если
Х=Т0®Тъ
и отображение F : X -> У удовлетворяет указанным выше условиям, то существует такое гомеоморфное отображение окрестности точки Хо в Мо на окрестность этой же точки в ТХа, что расстояние между соответствующими друг другу точками есть величина высшего порядка малости по сравнению с их расстояниями до точки Хо-
Доказательство. Обозначим через А оператор F'(x0)> рассматриваемый только на подпространстве 7\, т. е.
Xg = F'(x0)g при
Покажем, что А отображает 7\ на все У. Действительно, по условию каждый элемент из X имеет вид
x = h+l, h<=To, Поэтому
F'(xo)x = F'(xo)(h + £)==F'(xon = Al,	(10)
так как F'(x0)h — 0. Но по условию F'(x0) отображает X на все У, а этб и означает, что Hg пробегает все У, когда g пробегает Т\. Далее отображение
A: Ti->Y
взаимно однозначно, так как, если /lgi = /4g2, т. е. F'(x0) (gj—g2) = — 0, то gi — g2 е То, откуда gi — g2 = 0. Итак, оператор А обратим и по теореме Банаха обратный оператор Л'1 линеен и ограничен.
Представив каждый элемент х е X в виде
x = x0-]-h-]-l,	h^T0,
перепишем уравнение F(x) = 0, определяющее многообразие М, так:
Ф(й, g) = F(.vo + /i + g) = O.
Частный дифференциал этой функции в точке (0,0), отвечающий приращению Ag второго аргумента, имеет вид
Фе (0,0) Ag = F'(x0)Ag = XAg.
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ
499
§ 3j
Оператор Л = Ф£(0, 0) имеет обратный, поэтому в силу теоремы о неявной функции уравнение Ф(й, £) = 0 в некоторой окрестности точки (0,0) равносильно уравнению вида
где ф(й)— дифференцируемое отображение, удовлетворяющее условию ф (0) — 0.
Мы получили, что каждая точка х е Мо, достаточно близкая к точке хо, имеет вид
х = х0 +й + ф(й), йеД	Т$.
Тем самым построено отображение
х0 + h х0 + h + ф (й)
рекоторой окрестности точки х0 в Тх0 на окрестность той же точки в Мо. Это отображение взаимно однозначно и непрерывно. Остается показать, что расстояние между соответствующими друг другу точками, т. е. величина ||т|>(й)||, имеет высший порядок малости по сравнению с ||й||.
Дифференцируя равенство Ф(й, 4>(й)) — 0, имеем:
ф; (о, о) й + ф| (о, о) ф' (о) й = ф; (о, о) й +	(о) й = о,
откуда
ф' (0) й = — А~' Фл (0, 0) й = — A~'F' (х0) й = 0.
Поэтому в равенстве
ф(й) = ф(0) + ф,(0)й + о(||й||)
лервые два слагаемых справа равны нулю, т. е.
"Ф (й) = о (II й II),
-что и требовалось. Теорема доказана.
§ 3. Экстремальные задачи
Один из самых старых и наиболее разработанных разделов нелинейного функционального анализа — нахождение экстремумов функционалов. Изучение таких задач составляет содержание так называемого вариационного исчисления. Большинство методов, существующих в вариационном исчислении, связано со специальным видом тех функционалов, экстремальные значения которых ищутся. Однако некоторые общие приемы и результаты могут быть сформулированы и для более или менее произвольных функционалов. Не ставя себе здесь задачи сколько-нибудь полного изложения вариационных методов, мы
500
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. X
ограничимся кратким рассмотрением элементов общей теории, лежащих в основе вариационного исчисления.
1. Необходимое условие экстремума. Пусть F— некоторый действительный функционал, определенный на банаховом пространстве X. Говорят, что функционал F достигает в точке х0 минимума, если для всех х, достаточно близких к х0, выполнено неравенство F(x)—F(xq)^0. Аналогично определяется максимум функционала. Если в данной точке %о функционал F достигает минимума или максимума, то мы будем говорить, что в этой точке функционал F имеет экстремум.
К отысканию экстремумов тех или иных функционалов могут быть сведены многие физические и механические задачи.
Для функций п переменных хорошо известно следующее необходимое условие экстремума: если функция f дифференцируема в точке х0 = (х®, х?2..х«) и имеет в этой точке экстре-
мум, то в этой точке df = 0 или, что равносильно,
dxt дхг ‘ ’ дхп
Это условие легко переносится на функционалы на произвольном нормированном пространстве.
Теорема 1. Для того чтобы дифференцируемый функционал F достигал в точке х0 экстремума, необходимо, чтобы его дифференциал в этой точке равнялся нулю при всех /и
Г(хо)й=О.
Иначе говоря, необходимо, чтобы F' (xa) — Q.
Доказательство. По определению дифференцируемости имеем
Е(х0 + й)-Е(х0)==Е'(х0)Л + о(/г).	(1)
Если F/(Xo)ft#=O для некоторого h, то при достаточно малых действительных X знак всего выражения F'(x0) (Хй) + о(Хй) совпадает со знаком его главного члена F'(x0) (Mi). Но F'(x0)— линейный функционал, поэтому F'(x0) (Mi) = KF'(x0)h. Следовательно, если F'(x0)h=/= 0, то выражение (1) может принимать при сколь угодно малых h как положительные, так и отрицательные значения, т. е. экстремума в точке х0 быть не может.
Рассмотрим некоторые примеры.
1.	Пусть	&
F(x)=\f(t,x(t))dt,	(2)
а
где f — непрерывно дифференцируемая функция. Этот функционал, рассматриваемый в пространстве С [а, Ь] непрерывных
§ 3]
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ
501
функций на отрезке [а, А], дифференцируем. Действительно,
F (х + А) — F (х) = ь	ъ
= $ [f (t, x(t) + h (/)) - f (t, X (/))] dt=\f'x (t, x (/)) h (t) dt + o (A), a	a
откуда	&
dF = x(t))h(t)dt.
a
Равенство нулю этого линейного функционала для всех h е С [а, Ь] означает, что f'x (t, х (/)) = 0. Действительно, при всяком х(/)се С[а, Ь] производная f'x (t, x(t)) есть непрерывная функция от t. Если в какой-то точке to она отлична от нуля, скажем, f 'x Со’ х (Q) > О’ т0 эт0 неРавенство имеет место и в некоторой окрестности (а, 0) точки to. Тогда, положив
, ..	( (/ —а)(₽ —0 при
А (/) = < п	,
(, 0 при остальных t, получаем
x)h(t)dt>Q.
а
Полученное противоречие доказывает наше утверждение. Уравнение f'x(t,x) = O определяет, вообще говоря, некоторую кривую, на которой функционал (2) может достигать экстремума.
2.	Рассмотрим на том же пространстве С [а, А] функционал ь ъ
Ж = $ ^x^x^d^dU,	(3)
а а
где /C(gi, g2)—непрерывная функция, удовлетворяющая условию /<(£1, £2)= ^(£2,£i)- Нетрудно подсчитать, что дифференциал этого функционала равен
ь ь
dF=2 \ \K^A2)xd)h(l2)d^dl2. а а
Если при всяком АеС[а, А] это выражение равно нулю, то в силу рассуждений, проведенных в примере 1, имеем
ь
К (h, I2) х (h) dh =0 для всех %2, а<£2<А.
592
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. X
Одно из решений этого уравнения — функция х = 0. Ответ на вопрос о том, имеется ли в этой точке экстремум и существуют ли другие точки, в которых экстремум возможен, зависит от вида функции £2) и требует дополнительного исследования.
3.	Рассмотрим функционал
ь
F(x) = \f(t,x(t),	(4)
а
определенный на пространстве С1 [а, й] непрерывно дифференцируемых функций на отрезке [а, &]. Здесь х' (/) = ~-Х^ , a f(t, х, х') — дважды дифференцируемая функция своих аргументов. Функционал (4) играет основную роль во многих вопросах вариационного исчисления. Найдем его дифференциал. Пользуясь формулой Тейлора, получаем
ь
F (х. А) — F (х) = j (/, х -ф h, х' + h') — f (/, x, x')] dt — a
b
= \(f'xh + f'x,h')dt + o(\\h\\), a
где ||й|| — норма функции h как элемента пространства С1 [а, &]. Итак, необходимое условие экстремума для функционала (4) имеет вид
ъ
dF=\(f'xh + f'x,h')dt = O.	(5)
а
В такой интегральной форме это условие мало пригодно для нахождения той функции х, на которой достигается экстремум. Преобразуем его к более удобному виду, проинтегрировав в (5) член f'x,h' по частям *). Получим
&	fab
\f'xh'dt = f'x,h\a-\h-^f'x,dt. а	а
!) Эта операция требует дополнительного обоснования, поскольку суще-d j
 ствование производной х , входящей в выражение	не предполагается,
, См. по этому поводу любой курс вариационного исчисления.
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ
503
§ 3]
Таким образом,
dF=\(f'x--^f'X')hdt + f'x,h[ = O.	(6>
а
Это равенство должно выполняться при всех h, в том числе и таких, для которых h(a) = h(b)= 0. Следовательно,
ь
И?«-4^)',л=0 а
при всех h, для которых /г(а)= h(b)— 0, откуда, в силу рассуждений, аналогичных проведенным в примере 1, получаем
Поэтому равенство (6) сводится к
fX'h\a=Q-	(8)
Если функционал (4) рассматривается на всех непрерывно дифференцируемых функциях х, определенных на [а, &], то мы можем взять h. так, что /г(ц)=0, /г(Ь)У=О, и тогда из равенства (8) получим
Д|,.ь=о.	Го
а положив h(b) = 0, /г(а) =/= 0, получим
Д1,.„=<>	(Го
Таким образом, из условия (6) (т. е. из равенства нулю дифференциала функционала (4)) вытекает, что функция х, на которой функционал (4) достигает экстремума, должна удовлетворять дифференциальному уравнению (7) и граничным условиям (9), (10) на концах отрезка [а, &]. Общее решение дифференциального уравнения второго порядка содержит две произвольные постоянные и в нашем распоряжении оказывается как раз то число граничных условий, которое нужно для отыскания этих постоянных.
2. Второй дифференциал. Достаточные условия экстремума функционала. Вернемся снова к нахождению экстремума функции п переменных. Пусть для функции f(xh .... хп) в точке (xf, ..., xf) выполнено условие df = 0. Тогда, как известно, для решения вопроса о том, действительно ли в данной точке имеется экстремум или нет, следует рассмотреть второй дифференциал. Именно, справедливы следующие утверждения.
504
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ, X
1. Если функция f (хь ..., хп) имеет в точке (х?..х°) ми-
нимум, то в этой точке d2f 0. (Аналогично, если в точке {Хр ..х°) имеется максимум, то в этой точке d2f 0.)
2. Если в точке (х°, .х°) выполнены условия
п
df = O и d2f — £ дх дх. dxt dxk > 0
i, ft=t * й
(когда не все (/х< = 0), то в этой точке f(x) имеет минимум (аналогично максимум, если d2f < 0).
Короче говоря, неотрицательность второго дифференциала необходима, а его положительная определенность достаточна для минимума.
Посмотрим, в какой мере эти факты переносятся на функционалы, заданные на банаховом пространстве.
Теорема 2. Пусть F — действительный функционал, заданный в банаховом пространстве X и имеющий в некоторой окрестности точки х0 непрерывную вторую производную. Если этот функционал достигает в точке хо минимума, то d2F(xo)^O1).
Доказательство. По формуле Тейлора получаем
F (х0 + h) - F (х0) = F' (х0) h + 4 F" (х0) (h, h) + о (|| h ||2).
Если в точке хо функционал F имеет минимум, то К'(хо) = О и остается равенство
F (х0 + h) - F (х0) = у F" (х0) (h, h) + о (|| h IP).	(II)
Если при каком-либо h выполнено неравенство
F"(x0)(h,h)<0,	(12)
то, поскольку F"(x0) (eh, eh) = е2 F"(x0) (h, h), существуют и сколь угодно малые по норме элементы h, для которых выполнено (12). Но при достаточно малых ||/г|| знак всего выражения (11) определяется знаком главного члена F" (х0) (h, h), и мы получаем
F (х0 + h) - F (х0) = 4 F" W (Л> ^) + о (|| Л И2) < 0,
т. е. минимума в точке хо нет.
Аналогичную теорему можно сформулировать для максимума.
Доказанная теорема есть прямое обобщение соответствующей теоремы для функций конечного числа переменных. Иначе
’) Это неравенство означает, что F"(xa)(h,h)	0 для всех h.
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ
505
§ 3]
обстоит дело с достаточным условием. Упомянутое выше условие F"(х0) (Л, h) > 0, достаточное для минимума в случае функции п переменных, не является достаточным для функционалов, определенных на банаховом пространстве бесконечного числа измерений. Рассмотрим простой пример. Пусть в гильбертовом пространстве /2 задан функционал
оо 2	00
F w Е ~ Е х«-п=1	М=1
В точке 0 первый дифференциал этого функционала равен 0,
а второй — ряду 2	, т. е. представляет собой положитель-
п=1
но определенный функционал. Тем не менее, в точке 0 нет минимума, так как F (0) = 0 и F (0, .. ., 0, 1/п, 0, .. .) = 1/п5 —
п-1
— 1/п4 < 0. Следовательно, в любой близости от точки 0 существуют точки, в которых F(x) < F(0).
Введем следующее понятие. Квадратичный функционал В называется сильно положительным, если существует такое постоянное число с > 0, что В(х, х)^ с||х||2 для всех х.
Теорема 3. Если функционал F, определенный в банаховом пространстве X, удовлетворяет условиям
1) df(x0) = 0,
2) d2F(x0)~ сильно положительный квадратичный функционал, то F имеет в точке х0 минимум.
Доказательство. Пусть F" (х0) (h, А) с||А||2. Выберем е>0 настолько малым, чтобы при ||А|| <; е величина о(||А||2) в равенстве (11) удовлетворяла условию | о (|| h ||2) | < -j-1| А ||2,. Тогда
F (х0 + h) - F (х0) = 1 F" (х0) (А, А) + о (|| h If2) > | \\ h |р > 0 при || h || < е.
В конечномерном пространстве сильная положительность квадратичной формы эквивалентна ее положительной определенности, поэтому (при равенстве нулю первого дифференциала) положительная определенность второго дифференциала достаточна для экстремума функции. В бесконечномерном случае (как показывает приведенный выше пример) сильная положительность есть более сильное условие, чем положительная определенность.
Условие сильной положительности второго дифференциала, гарантирующее минимум, удобно тем, что оно применимо к любому дважды дифференцируемому функционалу (независимо от1
503	ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ	[ГЛ. X
его конкретного вида) в любом банаховом пространстве. Вместе с тем это условие обычно оказывается слишком грубым и трудно проверяемым в практически важных случаях. В вариационном исчислении устанавливаются более тонкие достаточные условия экстремума (использующие конкретный вид тех функционалов, которые рассматриваются в вариационных задачах); однако изложение этих вопросов не входит в задачу данной книги.
3. Экстремальные задачи с ограничениями. Выше речь шла о нахождении экстремума для функционалов, заданных на всем пространстве, т. е., как обычно говорят, об экстремальных задачах без ограничений. При наличии тех или иных ограничений, определяющих ту область, на которой задан рассматриваемый функционал, утверждения, приведенные в пп. 1 и 2, вообще говоря, несправедливы. Это видно уже на простейшем примере функции, заданной на отрезке: если такая функция достигает экстремума в граничной точке, то ее первый дифференциал в этой точке может быть отличен от нуля, а знак второго дифференциала может быть любым. Рассмотрение экстремальных задач при наличии ограничений составляет обширную и важную область математики, включающую такие разделы, как классическое вариационное исчисление, оптимальное управление, линейное и выпуклое программирование и т. д. Мы здесь ограничимся тем, что приведем лишь один результат. Его доказательство основано на применении теоремы Люстерника, играющей важную роль во многих вопросах теории экстремальных задач.
Пусть X и Y— банаховы пространства, F— функция на X и Ф: X -> У— отображение пространства X в У. Допустим, чго ищется минимум функции F (х) на множестве, определяемом условием Ф(х) = 0.
Теорема. Пусть функция F и отображение Ф непрерывно дифференцируемы в некоторой окрестности точки х0, удовлетворяющей условию ф(хо)=О, и пусть образ пространства X при отображении Ф'(х0): X-> У замкнут. Если в точке х0 достигается локальный минимум функции F (х) на множестве {х: Ф(х) = = 0), то существуют число Хо и линейный функционал у*, определенный на У, не равные нулю одновременно и такие, что
ЯоЕ(хо) + [Ф'(хо)Г/ = О.	(13)
Доказательство. Введем обозначение А = Ф/(х0)Х. По условию L — замкнутое подпространство. Если Z, У, то, согласно следствию 3 теоремы Хана — Банаха (п. 3 § 1 гл. IV) найдется ненулевой функционал у$ е У*, равный нулю на L. Для него при всех xg X имеем
([Ф'(хо)ГУо, х) = (уо, Ф' (хо)х) = О, так как Ф'(х0)х<=£. Поэтому, приняв уо за у* и положив Хо = 0, получаем (13).
ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ
507
§ 3]
Рассмотрим теперь случай, когда Ф(х0)Х=У. Применив к отображению Ф теорему Люстерника, получаем, что для каждого h е X, удовлетворяющего условию
Ф' (х0) А = 0,
при всех достаточно малых t существует такой элемент х (/, /г) = х0 4* th 4* г (/),
что Ф(х(/, А))==0, Г11| г (t) || -* 0 при /->0.
Рассмотрим функцию
f(t) = F(x(t, ft)).
Ее производная в нуле
должна быть равна нулю. Действительно, если
F' (х0) й = с 4 0, то знак разности
F (х (t, ft)) — F (х0) = ct + F' (х0) г (() 4- о Ц)
определяется членом ct и, следовательно, меняется при замене t на —t, а при этом в точке х0 не может быть экстремума. Итак, мы получаем, что F'(x0')h = t} для всех h таких, что h е КегФ'(хо). Иначе говоря, F'(х0) есть элемент из X*, ортогональный подпространству Кег Ф'(х0) cz X. Но, согласно лемме об аннуляторе ядра оператора (см. стр. 232)
[КегФ' (хо)Н = 1т[Ф'(хо)Г.
Это означает, что если F'(x0) е [Кег Ф'(хо)]-1, то найдется такой функционал у* е У*, что
F'(х0) = — [Ф'(х0)]* у*.	(14)
Положив %о = 1 и взяв тот функционал у*, для которого выполнено равенство (14), мы и получим (13).
Доказанная теорема представляет собой бесконечномерное обобщение известного из классического анализа правила множителей Лагранжа для задач на условный экстремум. Действительно, если X и У — конечномерные пространства, т. е. если ищется минимум функции f0(x,.......хп) при условиях f;(xb ...
..., *п)= 0, i = 1, 2....т, то функционал у*—это система т
чисел Ai.....Хщ. Условие замкнутости образа пространства X
508
ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ
[ГЛ. X
в У при линейном отображении в конечномерном случае выполнено автоматически. Равенство (13) при этом превращается в
зд0)=°-(=0	4 '
т. е. в известное правило Лагранжа для нахождения условного экстремума.
§ 4. Метод Ньютона
Одним из хорошо известных методов решения уравнений вида
f(x) = O	(1)
(f — числовая функция числового аргумента, определенная на некотором отрезке [а, 6]) является так называемый метод Ньютона, или метод касательных. Он состоит в \f^Xj	том, что по рекуррентной формуле
V	х„+1 = хп — ^((хп^	(2)
1 \\	ищутся последовательные приближения к
।	\ \	решению. (За нулевое приближение х0 при
I	\ । \	этом берется произвольная точка того от-
!	\	резка, на котором f определена.) Геометри-
‘	х,	веский смысл этого метода иллюстрируется
\ рис. 24. Можно показать, что если х* — единственный корень уравнения (1) на от-Рис. 24.	резке [а, Ь] и функция f имеет на этом отрез-
ке не обращающуюся в нуль первую про-^ изводную и ограниченную вторую производную, то существует «область притяжения корня х*», т. е. такая окрестность точки х*, что при любом выборе точки хо в этой окрестности последовательность (2) сходится к х*.
Метод Ньютона может быть перенесен на операторные уравнения. Мы изложим его для уравнений в банаховых пространствах.
Рассмотрим уравнение
FW = 0,	(3)
где F— отображение банахова пространства X в банахово пространство У. Предположим, что отображение F сильно дифференцируемо в некотором шаре В(х0, г) радиуса г (центр которого хо мы примем за нулевое приближение искомого решения). Заменяя, как и в одномерном случае, выражение F(x0)—F(x)
МЕТОД НЬЮТОНА
509
§ 4]
его главной линейной частью, т. е. элементом F'(x0) (х0— х), мы получаем из (3) линейное уравнение
F' (х0) (х0 — х) = F (х0),
решение которого
х1 = х0 — [F' (х0)]-‘ Е(х0)
естественно рассматривать как следующее приближение к точному решению х уравнения (3) (существование оператора [Г(хо)]-1 здесь, конечно/предполагается). Повторяя те же рассуждения, мы получаем последовательность
хп+1=хп~ [F'(xn)]~l(F(xn))	(4)
приближенных решений уравнения (3). В бесконечномерном случае нахождение обратного оператора [F'(хп)]-1 может быть достаточно сложной задачей. Поэтому здесь бывает целесообразно пользоваться так называемым модифицированным методом Ньютона (см. [27, 28]). Модификация состоит в том, что вместо последовательности (4) рассматривается последовательность, определяемая формулой
х„+1 = х„-[Е'(хо)]"1(Е(х„)),	(5)
т. е. обратный оператор [Е'(хо)]"1 берется на каждом шаге при одном и том же значении аргумента х = х0. Хотя такая модификация уменьшает скорость сходимости, она часто оказывается целесообразной с вычислительной точки зрения. Перейдем теперь к формулировке и доказательству точного утверждения.
Теорема 1. Пусть отображение F сильно дифференцируемо в некотором шаре В(х0,г) с центром х0 и радиусом г, а производная F(x) удовлетворяет в этом шаре условию Липшица-.
||F'(x,)-F'(x2) IK ill M-*2II.
Пусть [F'(xo)]-1 существует и
М = ||[F' (х0)]-*||, Ml И'К)]"1 F(xo)||,	h — MkL.
Тогда, если h < ’/4, то в шаре ||х — х0|| <5 kta, где t0 —меньший корень уравнения ht2 — t -f- 1 =0, уравнение F(x) = 0 имеет единственное решение х* и последовательность {хп}, определяемая рекуррентной формулой (5), сходится к этому решению.
Доказательство. Рассмотрим в пространстве X отображение Ах = х — [P/(xo)]_|F(x). Его сильная производная равнаО в точке хо. Это отображение переводит шар ||х — х0|| ktQ в себя. Действительно,
Ах — х0 = х — х0 — [F' (х0)]“' F (х) =
= If'(хо)]"’ {F' (х0) (х - х0) - Е(х) + Е(х0)} - [F' (хо)]~‘Г(хо).
5!0	ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ	[ГЛ. X
Поэтому
II Лх — Хо ||<|1[/7'(-Го)Г'|| • II F'(x0)(x - х0) - F(x) 4- F(x0) || +
+ 11 [Г(х0)Г* F<M
т. е.
|| Ах — х0 |К Л41| F' (х0) (х — х0) — F (х) + F (х0) || + k. (6) Рассмотрим вспомогательное отображение
Ф (х) = F (х) — F (х0) — F' (х0) (х — х0).
Оно дифференцируемо и его производная равна Ф'(х) = = Е'(х)— F'(x0). Если ||х — Xoll < kt0, то имеет место оценка
II Ф' W II = II F' (х) - F' (х0) || < L || х - х01| < Ltji.
Отсюда по теореме о среднем (формула (9) § 1) получаем
|| Ф (х) II = || Ф (х) - Ф (х0) || < Lt Ji 11X - х01 < Lt2k2. (7)
Итак, если || х — х01| ^/0£, то из (6) и (7) получаем
|| Ах - х0| < MLFJi2 + k = k (MLt2k + 1) = k {ht2 + 1) = kt0,
а это и означает, что отображение А переводит шар ||х — х0|| <5 kt0 в себя. Покажем теперь, что А —сжимающее отображе-
ние этого шара. При ||х — х0|| ktQ имеем
A' {x] = I- [F (х0)]’' F' (х) = [F' (хо)Г' (F' (х0) - F' (х)),
г ткуда
|| А' (х) ||< М || F' (х0) - F' (х) ||< ML || х - х01| < MLkt0.
Но to — меньший корень уравнения ht2 — / + 1 = 0, т. е. tQ =
= -—. Поэтому
|| А' (х) I! < MLkt0 = Af0 = А	= <7 < 1, (8)
откуда || ЛХ] — Лх21| < у IIX! — х2 II, т. е. Л—сжимающее отображение.
Следовательно, отображение А имеет в шаре ||х — х0|| kt0 одну и только одну неподвижную точку х*. Для этой точки
х* = х* - [Г (х0)]-1Е(х‘), т. е. Е(х‘) = 0.
Вместе с тем
Ахп = хп — [Е'(хо)]-'Е(хп) = Xn+i
МЕТОД НЬЮТОНА
51!
§ 4]
и, в силу теоремы о сжимающих отображениях, последовательность {х„} сходится к х*.
Из неравенства (8) сразу вытекает следующая оценка скорости сходимости модифицированного метода Ньютона:
II хп - х II < [Г (Хо)] F (х0) I,	(9)
т. е. погрешность модифицированного метода Ньютона убывает как геометрическая прогрессия. Отметим для сравнения, что обычный метод Ньютона [в котором приближения определяются формулой (4), а не (5)] сходится быстрее, чем геометрическая прогрессия: для этого метода
1|ХЛ - х‘||^ ^(2/1)^-' k.
Пример. Рассмотрим нелинейное интегральное уравнение ь
x(s)=^K(s, t, x(t))dt,	(10)
а
где K(s, t, и)—непрерывная и непрерывно дифференцируемая функция своих аргументов. Введя отображение у = F(x), определяемое равенством
ь
у (д) = х (s) — j К (s, t, х (/)) dt, a
запишем уравнение (10) в виде F(x)—0.
Пусть х0 — нулевое приближение для решения этого уравнения. Тогда первая поправка Ax(s) = x1—х0 определяется из уравнения
F'(x0)Ax = —F(x0).	(11)
Если функция K(s, t, и) и функциональное пространство, в котором рассматривается уравнение (10), таковы, что производная F'(x) отображения F может быть вычислена «дифференцированием под знаком интеграла», т. е. если
z = F' (х0) х означает, что ь
z(s) = x (s) — Fu (s, t, x0 (0) X (t) dt,
a
то уравнение (11) принимает вид
ь
Лх (s) = j (s, t, x0 (0) Ax (0 dt + <p0 (s),	(12)
512	ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ	[ГЛ. X
где
ь
Фо («) = $ (s> хо (0) dt — х0 (s). а
Аналогично находятся и следующие поправки.
Таким образом, нахождение каждого следующего приближения сводится к решению линейного интегрального уравнения. Если применяется модифицированный метод Ньютона, то при этом на каждом шаге приходится решать линейное уравнение с одним и тем же ядром. Более подробное изложение метода Ньютона и связанных с ним вопросов имеется в книге [28], а также в статье Л. В. Канторовича [27], которому и принадлежат основные результаты, относящиеся к обоснованию метода Ньютона для операторных уравнений.
ДОПОЛНЕНИЕ
БАНАХОВЫ АЛГЕБРЫ
В. М. Тихомиров
В третьей главе этой книги изучались линейные пространства. Там был выделен важный класс линейных пространств — банаховы пространства. Здесь, в этом дополнении, будут изучаться банаховы алгебры, т, е. банаховы пространства, в которых определено умножение элементов. Наличие умножения в сочетании с линейной и метрической структурой наделяет банаховы алгебры рядом замечательных свойств.
§ 1.	Определения и примеры банаховых алгебр
1.	Банаховы алгебры, изоморфизмы банаховых алгебр. Напомним, что линейным пространством называется непустое множество элементов, в котором введены две операции — сложение и умножение на числа, удовлетворяющие восьми аксиомам, сформулированным в § 1 гл. III.
Определение 1. Линейное пространство X называется алгеброй, если в нем введена еще одна алгебраическая операция — умножение, которое подчинено следующим аксиомам:
]. (ху)г = х(уг).
2.	х(у + г) = ху + хг; (у + г)х = ух + гх.
3.	а(ху) = (ах) у = х(ау).
4.	Если существует элемент е е X такой, что ех = хе = х для всех х X, то е называется единицей алгебры X, а сама алгебра называется алгеброй с единицей ‘).
5.	Если операция умножения коммутативна, т. е. если выполняется аксиома:
ху = ух,
то алгебру X называют коммутативной алгеброй.
Коммутативные алгебры с единицей и будут в основном объектом нашего дальнейшего рассмотрения.
Всюду в этом дополнении числовое поле, над которым рассматриваются наши алгебры, это поле С комплексных чисел.
В § 3 гл. Ill было введено понятие нормированного пространства, т. е. линейного пространства, снабженного нормой ||х||, удовлетворяющей трем аксиомам, сформулированным на стр. 139.
Определение 2. Нормированное пространство X называется нормированной алгеброй, если оно является алгеброй с единицей и при этом выполнены еще две аксиомы:
6.	lie 11=1.
7.	II ху || -IIУII-
Если нормированная алгебра X вдобавок полна (т. е. является банаховым пространством), то она называется банаховой алгеброй.
') Единица в алгебре всегда единственна, ибо если бы элемент е' также обладал свойством 4, то мы бы получили ее' = е = е'.
514
ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
Отображение F: X -> У называют гомоморфизмом алгебры X в У, если удовлетворяются условия:
F (х + у) = Fx + Fy,	(1)
F(ax)=aFx,	(2)
F (xy) = Fx  Fy.	(3)
Две алгебры, X и У, называют изоморфными, если существует взаимно однозначное отображение F, удовлетворяющее условиям (1) — (3).
Нормированные пространства X и У называют изометричными, если существует взаимно однозначное отображение F: X-*-tY, для которого выполнены условия (1) и (2) и, кроме того,
|| Fx\\y = ||х||х.
Определение 3. Две банаховые алгебры У и У мы назовем изометрически изоморфными, если существует алгебраический изоморфизм F:X+-*-Y, являющийся изометрией X и У как нормированных пространств.
2.	Примеры банаховых алгебр.
1.	Поле С. Комплексные числа {г} доставляют простейший пример банаховой алгебры, если ввести норму формулой:
l|z|| = |z| = Vx2 +у~	(,г = х + ‘У).
Комплексные числа образуют поле С. В С для всех элементов, кроме нуля, определено деление — операция, обратная умножению. Мы покажем в дальнейшем, что С есть единственная нормированная алгебра, являющаяся полем.
2.	Алгебра Ст. Пусть Т — некоторое компактное хаусдорфово топологическое пространство. Обозначим через Ст линейное пространство всех непрерывных комплексных функций x(t), заданных на Г с обычными для функций операциями сложения и умножения на число, в котором норма определяется равенством
|| х || = шах | х (/) |.
Ранее в гл. II и III рассматривался частный случай пространства Ст, когда Т = [а, Ь] есть отрезок вещественной прямой. Другим важным частным случаем пространства Ст является пространство Сл = {(z;, ..., zn)} «-мерных комплексных векторов, т. е. функций на пространстве из п точек. Сложение, умножение на числа и умножение элементов С" производится покоординатно, а норма определяется формулой
|| z || = шах | z |.
К i <п
Алгебра Ст является коммутативной банаховой алгеброй. Единицей в Ст служит функция e(t) = 1. Проверка всех аксиом не составляет труда.
3.	Алгебра st аналитических функций в к р у г е. Обозначим через st линейное пространство всех функций x(z) комплексного переменного z, определенных и непрерывных в круге К {z:|z|	1} и аналити-
ческих внутри этого круга. Определим умножение в st, как обычное умножение функций и зададим норму формулой
[|х||= max | х (г) |.
I Z |<1
Этим путем мы превратим st в коммутативную банахову алгебру с единицей Справедливость всех аксиом и здесь вполне очевидна.
§ 1]
ОПРЕДЕЛЕНИЯ И ПРИМЕРЫ БАНАХОВЫХ АЛГЕБР
5.15
4.	А л г е б р а /ь Обозначим через 1\ совокупность всех двусторонних абсолютно суммируемых комплексных последовательностей х= (..., х~п, . ..х_ь х0, хь ,.., хп, ...) с нормой
Е lxd-	(4>
k =— оо
Произведением х • у двух таких последовательностей:
X = (..., х_п.....Хо.....Хп, ...), У — (• • •, у-п, ... , Уо, , Уп,  . •)
назовем их свертку 2 = х * у, т. е. последовательность, члены которой определяются так:
оо
z„=(x.y)n= £	(5)
k= — ОО
Если каждой последовательности х из Ц сопоставить ряд Фурье со
х (!) = У, хkeikt, 0 t 2л, то последовательность, определенная форму-k —— оо
лой (5), соответствует произведению функций x(t)  y(t), построенных по последовательностям х и у. Таким образом, алгебра Ц и алгебра W функций x(t) с абсолютно сходящимися рядами Фурье и нормой, определяемой (4), изометрически изоморфны. Поэтому большинство аксиом алгебры и нормированного пространства для проверяются без труда, так как для U7 они верны тривиально. Проверим аксиому 7. Имеем для z = х * у:
||21|=XI zn I=ЕIЕ хп-кУк I < Е ЕI xn-k 11 yk\ =
п	п \ k	I п k
= E(Ek-s i)i‘/4i=ii*ii-iii/h
Алгебра W, очевидно, коммутативна, следовательно, коммутативна и алгебра /ь Единицей в /1 служит последовательность е, соответствующая функции e(t) = I: у этой последовательности все компоненты суть нули, за исключением компоненты с нулевым номером, которая равна единице. В дальнейшем мы будем пользоваться изоморфизмом -*->-1Г и соответствием {хп}+—+-х (/), не оговаривая этого особо.
5.	Банахова алгебра ограниченных операторов. Пусть X— банахово пространство. Рассмотрим пространство S?(X, X) всех линейных непрерывных операторов, преобразующих X в себя, с обычными для операторов действиями сложения, умножения оператора на число и умножения (гл. IV, § 5, п. 3). Единицей в Э?(Х, X) служит тождественный оператор. Превратим 2”(Х, X) в банахову алгебру, определив норму как обычно:
II А || = sup || Ах ||.
»Х||< 1
Действительно, аксиома 7 была уже проверена ранее (см. формулу (4) на стр. 224). Доказать полноту 9?(Х, X) предоставлялось читателю в упражнении, приведенном там же. Алгебра 9?(Х, X)—один из важнейших примеров.'! некоммутативной банаховой алгебры с единицей.
3.	Максимальные идеалы.
Определение 4. Идеалом I коммутативной алгебры X называется-подпространство X, обладающее тем свойством, что для всякого у <= / и любого х из X произведение ух принадлежит I. Идеал, состоящий из одного нуля, а также идеал, состоящий из всего X, мы называем тривиальными'и в дальнейшем исключаем из рассмотрения. Максимальным называется идеал, не содержащийся ни в каком другом нетривиальном идеале.
Введенные понятия рассмотрим на примере алгебры
516
ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
Пусть — непустое подмножество компакта Т. Множество М^ — = {х (/) Е Ст : х (/) — 0,	состоящее из функций, обращающихся в
нуль на ЗГ, образует, как легко видеть, идеал в Ст. Максимальные идеалы в Ст допускают простое описание, являющееся к тому же ключом к пониманию всего замыслатеории коммутативных банаховых алгебр.
Лемма 1. Максимальный идеал алгебры Ст есть совокупность всех функций из Ст, обращающихся в нуль в какой-либо одной фиксированной точке т0 множества Т.
Доказательство, а) Пусть М.^ = {х (/) е Ст: х (т0) = 0}. Тогда есть идеал. Покажем, что он максимален. Действительно, пусть xQ (/) ф М^, т. е. xo(rQ)#=O. Для любого у (t) е С- положим: z(t)=y(t)--(то) *о _
Хд (Тд)
Тогда z(to) = O и, следовательно, z (t) принадлежит MTq. Итак, добавление любого элемента не из приводит к тому, что идеал, порожденный AfTj и этим элементом, становится тривиальным. Следовательно, AfTo — максимален.
б) Пусть наоборот, М — какой-либо максимальный идеал из Ст-
Покажем, что все функции, входящие в этот идеал, обращаются в нуль в некоторой точке. Действительно, если это не так, то для каждой точки те Г найдется функция хт (/) е М такая, что хт (т)#=0. В силу непрерывности хт (/) по t найдется такая окрестность Ux точки г, что хт (/)=/=0 в Ux. Из открытого покрытия Г cz U 17т выберем конечное покрытие U....Uх .
х	1	п
Тогда в силу определения идеала
п
xQ(t) = ^~(i}.xx (t)+ ...+х (t)Xt (/)=£ |Х (0|2 II	п п	। I Л |
принадлежит М.
В силу того, что х0(/) > 0 всюду на Т, функция 1/х0(/) будет непрерывной. Поэтому 1 = (1/х0(/)) • х0(/) е М. Но идеал, содержащий единицу алгебры, содержит и любой элемент алгебры, ибо y(t) = y(t)  1. Поэтому М — тривиальный идеал, что противоречит предположению о том, что М — максимальный, а следовательно, нетривиальный идеал.
Таким образом, мы получили, что между максимальными идеалами и точками из пространства-носителя Т можно установить взимно однозначное соответствие. Это позволяет трактовать функции на Т как «функции на пространстве максимальных идеалов».
Мы покажем,— и в этом цель излагаемой ниже теории коммутативных банаховых алгебр, — что всякая такая алгебра X допускает реализацию в виде подалгебры алгебры непрерывных функций на компактном хаусдорфовом топологическом пространстве, образованном ее максимальными идеалами.
§ 2.	Спектр и резольвента
В этом параграфе алгебра X не обязательно коммутативна, но имеет единицу. Многие рассмотрения здесь подобны тем, которые проводились в § 5 гл. IV,
1.	Определения и примеры.
Определение. Элемент х е X называется обратимым, если он имеет обратный, т. е. если найдется такой элемент х_|, что
х • х~' = х-1 • х = е.
В противном случае элемент х называется необратимым.
Спектром <т(х) элемента хеХ называется множество комплексных чисел X, для которых элемент Ze — х необратим. Если Z^o(x), точку Л называют регулярной.
СПЕКТР И РЕЗОЛЬВЕНТА
517
$ 2]
Функция
7?Х : С \ а (х) -> X, Rj.x = х (Л) — (Хе — х)~1,
определенная на множестве регулярных точек элемента х, называется резоль еентой этого элемента.
Спектральным радиусом г(х) элемента х е X называется число
r(x) = sup IА |.	(1)
К а (х)
Введенные важные понятия проиллюстрируем на примерах.
а)	Если X — С, то обратимы все элементы кроме нуля;
б)	Если X = Ст, то для обратимости x(t) необходимо и достаточно, что-•бы функция x(t) была всюду отлична от нуля. Спектр о(х) совпадает с м н о.ж еством значений x(t); резольвента R-f, имеет вид
Rk= X-x(t) ’ а
г (х) = II х II = max ] х (/) I . t
в)	Если X — Z [Y, У)—алгебра ограниченных операторов, то обратимые элементы суть обратимые операторы, спектр и резольвента в этом случае совпадают со спектром и (с точностью до знака) резольвентой оператора, которые были введены в п. 7 § 5 гл. IV. Собственно говоря, в этом параграфе мы в общем виде исследуем те понятия, которые вводились ранее для банаховой алгебры ограниченных линейных операторов.
2.	Свойства спектра.
Теорема 1. 1°. Для любою линейного функционала f (х) из сопряженного пространства X* функция f (х (Л)) = F (Л) аналитична на С\<т(х) и F Л) -> 0 при | X | -> со.
2°. Спектр <т(х) элемента х банаховой алгебры X есть непустое компактное множество в С. Имеет место неравенство:
г«<1|х||.	(2)
Доказательству теоремы 1 предпошлем несколько лемм.
Лемма 1 (ср. с теоремой 5 § 5 гл. IV). Пусть элемент х из банаховой алгебры X имеет норму, меньшую единицы. Тогда элемент е — х обратим и
(е — х)-1 = е + х + ... +хп+ ...
Действительно, положив sn = е + х + ... + хп, имеем:
k
...
“	1 II л 11
1=1
Итак, последовательность sn фундаментальна. Так как X полно, то она сходится к некоторому элементу se.Y. При этом
s (е — х) = lims„(e —х)= lim (е — xrt+1) — е
П-> со
Аналогично доказывается, что (е — x)s = е.
Следствие. Для всякого х е А'
(е — ix)~' -> е при /->0.
Действительно, (е —/х)-1^ lim (е + tx + ... -f- (tx)n) = е + О (/).
Л-> ОО
518
ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
Лемма 2 (ср. с теоремой 4 § 5 гл. IV). Пусть хи— обратимый элемент и !1 бх II <|| х0-' ||~‘-
Т огда Х1 = х0-|-Дх— обратимый элемент', при этом
х,"1 = (е + х"1 Дх) ' х^'.
Действительно, х, = х0 + Дх = х0 (е + х^1 Дх) = х0 (е — х), ||х|| = = | — х^'1 Дх || < 1.
Применив лемму 1, мы находим, что xt 1 = (е — х) 1 х0 что и требовалось.
Следствие 1. Множество обратимых элементов банаховой алгебры открыто (в нормированной топологии банаховой алгебры). Множество необратимых элементов замкнуто
Следствие 2. Резольвента х (Л) есть непрерывная функция от А на. С\а(х).
Действительно, в силу следствия из леммы 1
х (Ао + ДА) — (Аое — х + ДАе) 1 — (е + ДАх (Ао)) 1 х (Ао) х (Ао).
Лемма 3 (ср. с п. 7 § 5 гл. IV). Пусть A, |ieC\ а (х). Т огда a) R-,x • R^x = R^x  RKx,
6)	R-Kx — R^x = (ц — A) R^x  R^x (тождество Гильберта).
Доказательство.
a)	R-,x • /?цХ = (Ae — x)-1 (це — x)~ =
= [(це — x) (Ae — x)]-1 = [(Ae — x) (це — x)]~* = R^x  RKx.
б)	В силу a) и определения R>. и Rlt имеем
R>x = (це — x) RK x  R^x, R^x = (Xe — x)R^x  R^x, откуда R},x — /?цХ = (це — Ae) R>.x • R^x = (ц — A) R-,x • RILx, что и требовалось.
Следствие. Если Ао е С \ о (х), то х' (Ао) = — х2 (Ао).
Имеем в силу б) и следстьия 2 леммы 2:
х' (Ао) = lim Х ~ \ (Ло)- == - lim х (А) • х (Ао) = - х2 (Ао).
Х->Х0 С. Ад
Теперь докажем теорему 1.
1°. Пусть f (х) линейный непрерывный функционал на х, т. е. f (х) е X*. Положим F (А) — f (х (А)) = f (R^x). Имеем в силу следствия из леммы $ для Ао а (х):
F (А) - F (Ао) _	£ ( х (А) - х (Ао) \
F (Ло)==Л™ А-а;— = Дтх0Ч А-А0- )-
— Ао
Таким образом, доказана аналитичность F (А).
Далее, при | А | > || х || в силу леммы 1 мы получим:'
I F (А) | < || f Цх. || х (А) ||х = || f ||х. || (Ае - х)~! || =
iifiix«k п-1 с п
$ 2!
СПЕКТР И РЕЗОЛЬВЕНТА
519
2°. а) Непустота спектра а (х). Пусть а(х)=0. Тогда в силу 1° для всякого элемента f е X” F (Л)— целая функция, стремящаяся к нулю при | Л |-> оо. Значит, F (Л) = 0, т. е. f ((Ле — х)~*) = 0 для любого f s X*, я значит, в силу следствия 4 из теоремы Хана — Банаха (п. 3 § 1 гл. IV), (Ле— х)~1 = 0, чего не может быть.
б) Компактность спектра а(х). Если |Л|>||х||, то в силу леммы 1 элемент Ле — х = Л [е---обратим, откуда следует ограничен-
ность а(х), а заодно и неравенство (2). Замкнутость а (х) следует сразу из леммы 2: если Ло регулярно, то окрестность | ДЛ | < ||х (Ло)||-1 состоит из регулярных точек, так как (Ло + ДЛ) е — х = Лое — х + ДЛе.
Отметим два следствия из теоремы 1.
Следствие 1. Банахова алгебра над полем С, являющаяся полем, изометрически изоморфна С.
Действительно, пусть X есть «банахово поле» их — произвольный элемент из X. Найдем то Л, для которого элемент Ле — х необратим и, значит, •есть нуль. Мы получим, что х = Ле. Легко понять, что соответствие х-<—>-Л есть изоморфизм X и С. Так как ||el| = 1, то ||х|| — |Л|. Мы получили изометрию X и С.
Следствие. 2. Спектр любого ненулевого оператора А из Э?(Х,Х) не пуст.
Это утверждение без доказательства уже формулировалось ранее (см, стр. 236).
3. Теорема о спектральном радиусе.
Теорема 2. Имеет место следующая формула для спектрального радиуса'.
г(х)= lim V||xrt||.	(3)
n->oo
Действительно, пусть f — любой элемент из X*. В силу теоремы 1 функция F (Л) = f (х (Л)) аналитична на С \ а (х) В частности, F (Л) аналитична в области | Л | > || х ||.
В этой области в силу леммы 1
откуда
F (Л) = f (х W) = f-^J,
причем это разложение, верное вследствие леммы I при |Л[ > ||х||, должно иметь место при |Л| > г(х) в силу теоремы единственности для аналитических функций и, значит,
Мы получили, что множество векторов хп/Лп + 1 является слабо ограниченным, а значит, оно ограничено сильно. (Этот результат, называемый иногда принципом равномерной ограниченности, или теоремой Банаха — Штейнгауза, был доказан в § 3 гл. IV; подробнее об этом см. в монографии [21], гл. II.) Таким образом, существует число с (Л), зависящее от Л, такое, что ’

520
ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
откуда lim || хп ||1/л < | Л | для всех {А : | Л | > г (х)}, т. е.
-О
lim ||хл||1/л <г(х).
Л->оо
С другой стороны, если i.eo(.t), то Лле а (хл), так как элемент Лле — хл, очевидно, делится на Ле — х.
В силу теоремы 1, если ц е а (х), то | ц |	|| х ||.
п _____
Полагая ц = Лл, полагаем, что из ). еа(х) следует, что | Л | Vll хл ||, п ______________________
откуда г (х) lim Vll*nll- Теорема доказана.
оо
§ 3. Некоторые вспомогательные результаты
В этом коротком параграфе сосредоточен ряд вспомогательных утверждений, при доказательстве которых используются стандартные технические приемы.
1. Теорема о фактор-алгебре. Пусть X — коммутативная банахова алгебра с единицей, / — идеал в X.
Отметим, во-первых, что I состоит лить из необратимых элементов, ибо если г <= / обратим, то для любого xe.Y мы получим, что (xz~')z = х е /, т. е. I тривиален, а этот случай мы исключаем. Во-вторых, в силу леммы 1 § 2, расстояние от единицы е до любого необратимого элемента, а значит, п до любого идеала, не меньше единицы.
Рассмотрим теперь фактор-пространство У// (см. § 1 гл. III) и определим там операцию умножения, назвав произведением двух классов | и Г) из X/f тот класс который содержит элемент х • у, где х и у — представители классов £ и Г)- (Проверьте, что результат не изменится, если х и у заменить любыми другими представителями тех же классов | и ц, и что введенная операция «умножение» удовлетворяет аксиомам 1—5 § 1.)
Таким образом, Х/1 становится коммутативной алгеброй. Назовем ее фактор-алгеброй X по идеалу I.
Введем в Х/I норму как и в п. 3 § 3 гл. III:
||5II= inf ||х + </|!,
где х — представитель д.
Имеет место
Теорема 1. Если X — есть банахова алгебра, а 1 — замкнутый идеал в ней, то фактор-алгебра X/f также является банаховой алгеброй с единицей.
В п. 3 § 3 гл. III было показано, что фактор-пространство банахова пространства по любому его замкнутому подпространству является банаховым пространством. Таким образом, нам остается лишь проверить, что выполняются аксиомы 6 и 7 из п. 1 § 1 на стр. 513.
a) Illnll= inf 11*0 +zlK inf II (* + “) (0 + «) IK
zgI	u, t» e /
< inf || x + и || • inf || у + v || = HI! • II П II-ue/	ре/
б)£=е + /, т. e. E2 = e2 + I = e + l, значит, E2 = E, откуда ||£|| = и ||E21| <|| fll2. Но элемент E не эквивалентен нулю, так как окрестность точки е, как мы отметили выше, не содержит необратимых элементов, из которых состоит /. Значит, 1 <||£||. Но, с другой стороны, ||£|| = inf ||е + 0||, у е/
т. е. || £|К1. Итак, ||£|| = 1. Теорема доказана.
ОСНОВНЫЕ ТЕОРЕМЫ
521
§ 4]
2. Три леммы. Нам далее понадобятся три леммы: теоретико-множественная, алгебраическая и топологическая.
Лемма 1. Всякий нетривиальный идеал I содержится в максимальном идеале.
Доказательство этой леммы основано на лемме Цорна, сформулированной на стр. 40.
Действительно, пусть .7 — множество всех нетривиальных идеалов, содержащих I. Ойо частично упорядочено по вложению: Д 12, если Д != Д. Для всякого линейно упорядоченного множества {/а} из 3 объединение [J /а а есть нетривиальный идеал, служащий верхней гранью для {/ а}- Значит, в силу леммы Цорна, / подчинен максимальному элементу в 3, т. е. максимальному идеалу.
Следствие. Если X не есть поле, то в нем имеется максимальный идеал. Более того, каждый необратимый элемент, отличный от нуля, содержится в некотором максимальном идеале.
Действительно, возьмем любой необратимый элемент х0 =/= 0 и рассмотрим совокупность ха  X. Это есть, конечно, идеал. Он содержит Хо и не содержит е — единицы X, т. е. не является тривиальным идеалом, следовательно, в силу леммы 1 содержится в максимальном идеале.
Лемма 2. Для того чтобы идеал I содержался в некотором нетривиальном идеале I' с X, необходимо и достаточно, чтобы алгебра Х/J имела нетривиальный идеал.
Докажем необходимость. Пусть
I с I' с X, 1^=1', Х^ Г.
Выделим среди классов g е Х/I те = х’ + Д для которых х’ е I'. Легко проверить, что получится нетривиальный идеал в Х/I. Достаточность получается аналогично.
Л е м м а 3. Замыкание нетривиального идеала I есть нетривиальный идеал.
Нетривиальность следует из того, что I состоит лишь из необратимых элементов, остальное следует из непрерывности алгебраических операций.
Следствие. Максимальный идеал замкнут.
§ 4. Основные теоремы
В этом параграфе X — коммутативная банахова алгебра с единицей.
1. Линейные непрерывные мультипликативные функционалы и максимальные идеалы.
Определение 1. Линейный непрерывный функционал f на банаховой алгебре X называется мультипликативным, если для любых х и у
f(x.y)=f(x)-f(y).	(1)
Совокупность всех нетривиальных линейных непрерывных мультипликативных функционалов мы обозначим через ЗС.
Заметим, что линейный непрерывный мультипликативный функционал мы могли бы определить, как непрерывный гомоморфизм X в С.
Если f Е М, то
I f (х) КII х И,	(2)
ибо если для некоторого х0, по норме равного единице,
|f(x0) | = Л> 1, то |/(х”) | = г->со,
т. е. мы получили бы, что f не непрерывен.
Далее,
f(e)=/(e2) = (f(e))2,
522
ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
откуда либо f{e) = 0, т. е. f тривиален, либо
f(e) = l.	(3>
Из (2) и (3) следует, что нетривиальные линейные непрерывные мультипликативные функционалы имеют норму единица и, следовательно, Ж есть подмножество единичной сферы в сопряженном пространстве X*.
Нулевое подпространство функционала f (т. е. совокупность тех .геХ, для которых f(x) — 0) обозначим Kerf и назовем ядром f.
Лемма 1. Ядро Ker f при f е Ж есть максимальный идеал.
Действительно, из
у е I = Ker f и х е X следует, что
f(y-x) = f (у) -f(x) = 0, т. е.
у • х е Ker f.
Таким образом, Kerf — идеал. Покажем, что Kerf — максимальный идеал. Допустим, что это не так, т. е. Ker f можно расширить до идеала / =/= X, содержащего Ф Kerf. Но Kerf имеет коразмерность I (см. гл. Ill, § 1, п. 6). Значит, элемент е можно представить так:
е = Ах0 + у,
где у е Ker f. Отсюда следует, что ее/. Значит, 1 = X. Противоречие доказывает лемму.
Лемма 2. По всякому максимальному идеалу М можно однозначно построить линейный непрерывный мультипликативный функционал f е Ж такой,, что М = Ker f.
Действительно, в силу следствия из леммы 3 § 3 М — замкнутый идеал. Применив теорему 1 § 3, мы получим, что Х/М есть банахова алгебра. На в силу леммы 2 § 3 Х/М не имеет нетривиальных идеалов, т. е. алгебра Х/М не содержит необратимых элементов, отличных от нуля (см. следствие из леммы 1 § 3). Значит, Х/М есть поле, являющееся банаховой алгеброй.
В силу следствия 1 из теоремы 1 § 2 поле Х/М изоморфно С. Это, па определению, означает, что для любого х е X найдется однозначно числа f (х) $= С такое, что
x — f (х)-е + и, и<=М.	(4>
Покажем, что f есть гомоморфизм. Докажем, например, что f(x • у) — = f(*) • f (£/) - Имеем
х — f (х) • е + и.	и е М,
У = f (У) • е + v,	v е М,
откуда
ху = f(x)  f(y) • е + w, w ен М.
Но это и означает, что f(x • у) = f(x)  f(y). Соотношения f(x+y) = = f(x)+f(y) и f(Ax) = Af(x) доказываются аналогично. Кроме того, если х ее М, то из (4) следует, что f(x) = 0, а если х = е, то f(x) = 1.
Лемма доказана.
Итак, мы получили, что между максимальными идеалами {Af} и функционалами f из Ж существует взаимно однозначное соответствие. В силу этого обстоятельства условимся функционалы из Ж обозначать fM, а буквой М соответствующие им максимальные идеалы. Для множества всех максимальных идеалов {Af} мы будем употреблять ту же букву Ж, что и для соответствующего ему множества {fM}-
Пусть х — некоторый элемент из X.
$ 4]
ОСНОВНЫЕ ТЕОРЕМЫ
523
Рассмотрим функцию х(М) на множестве Л, задав ее формулой
х = ?м
(5)
{Значение функции х(М), построенной по элементу х, на максимальном идеале М равно числу fM(x), т. е. значению на элементе х гомоморфизма, соответствующего идеалу М.) Мы получили реализацию элементов алгебры X в виде функций на множестве Л, о которой говорили в конце § 1.
2. Топология во множестве Л. Основные теоремы. Нам осталось доказать, что Л компактно в некоторой топологии и что функции х(М) непрерывны в той же топологии.
Чуть ранее мы упомянули, что Л есть подмножество единичного шара. С другой стороны, в п. 4 § 3 гл. IV было приведено доказательство для сепарабельного случая следующего утверждения.
Единичный шар пространства X*, сопряженного к банаховому пространству, компактен в *-слабой топологии.
Доказательство этой теоремы в общем случае можно найти, например, в [21], стр. 459.
Напомним, что «-слабая топология определяется системой окрестностей
....хт. 6 (fo) = I f Ы - f0 ЫI <6-k ’................"О-	(6)
Множество Л мы рассмотрим именно в «-слабой топологии. Компактность Л вытекает из сформулированного выше результата и следующей .леммы.
Лемма 3. Множество Л есть замкнутое подмножество единичного шара в X* и функции х(Л4) непрерывны на Л.
Действительно, пусть функционал /о принадлежит замыканию Л. Это значит, что внутри любой базисной окрестности отображения f0 найдется гомоморфизм fM, порожденный максимальным идеалом М. Возьмем окрестности Ux, у, х+у, б(/о). В силу (6) и определения х(Л4) мы получим
I fM(*)~ fo W | < б, '
I fM (</) - fo (</) | < 6, > | /д! С-* + у) — /о (^ + I/) I < 6. , Но /м есть гомоморфизм, т. е.
fia(x + у) = ?м(х) + [м(у). Тогда из (7) следует, что
fo (х + У) = fo (х) + fo <!/)
(7)
Аналогично показывается, что f0 (ах) = afa (х) и fo(xy) = f0 (х) • f0(y). (Надо взять окрестности Ux, аХ: 6 (f0) и Uх, у, ху> 6 (f0).)
Значит, f есть непрерывный линейный мультипликативный функционал. Далее, взяв окрестности 4e,6(f0), мы получим, что f0(e) = 1, т. е. f0 нетривиален. Значит, fo е Л, т. е. Л замкнуто.
Покажем, что функция х0(Л4) = [м(хо) непрерывна на Л.
Пусть Ма е Л. Для в > 0 возьмем окрестность U х_ е (Л40). Если М е UХа 8( то в силу (6) получится, что
I ?М (Хо) ~ ^Л4о(*о) 1 = 1 *0 W ~ Хо(Мо) I < в.
Но это и означает непрерывность функции лс0(Л1) в точке Л10.
Иемма доказана.
524
ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
Теорема 1. Отображение х->-х(М) задает гомоморфизм алгебры X в алгебру См непрерывных функций на компактном хаусдорфовом пространстве Jt максимальных идеалов алгебры Х\ при этом
II я (М) || = max | х (Л4) |<|| х ||.	(8>
В силу сказанного выше в этом параграфе, нам остается доказать лишь соотношение (8).
Заметим, что для всякого М элемент х — {м(х)е по определению }м(х) принадлежит идеалу М, т. е. является необратимым. Поэтому [м(х) е о(х). С другой стороны, взяв любое число )4ea(.t), мы обнаруживаем, что х — }^е необратим и, значит, принадлежит максимальному идеалу 1ЛГ откуда
0 — [м(х — Хое), т. е. Хо = [м (х).
Итак, образ jfC при отображении х(Л1) совпадает с а(х). Следовательно, в силу утверждения 2° теоремы 1 § 2, мы получаем, что неравенство (8) справедливо.
Нам осталось лишь уточнить теорему 1 при разных допущениях об алгебре X. Введем определения трех понятий.
Определение 2. Пересечение R = Q всех максимальных идеа-.МсЛ
лов называется радикалом X. Если R = {0}, то говорят, что X не имеет радикала. Банахова алгебра X называется регулярной, если ||х2|| = |1х||2. Банахова алгебра X называется симметричной, если для всякой функции х(М) найдется элемент у е X такой, что
у(М) = х(Л4).
(Черта означает комплексное сопряжение.)
Теорема 2. а) Если радикал алгебры X состоит из одного нуля, та отображение х-+х(М) является взаимно однозначным.
б)	Если алгебра X регулярна, то X изометрически изоморфна со своим образом в См, в частности, X не имеет радикала.
в)	Если алгебра X симметрична, то образ X при отображении х-^х(.М) всюду плотен в См.
г)	Если алгебра X обладает свойствами б) и в), го X изометрически изоморфна См.
Доказательство. Сначала выведем последнее утверждение из остальных. В силу б) взаимно однозначное отображение х*-*х(Л4) является изометрией:
II х || = max | х (М) |. Л М
В силу в) {х(Л4)} всюду плотно в См. Но X — полное пространство. Значит, и {л(Л4)} (вследствие равенства норм в X и в См) полно, откуда {х(М)}—См,
Докажем а). Пусть х0 =/= 0, а х0(М) s0 на Л. Это означает, что /м(*о) =0 для всех М, т. е. хоеКег/м для всех М, значит, х0 е R. Но R = {0}, откуда Хо = 0. Противоречие доказывает а).
Для доказательства б) заметим, что из равенства ||х2|| = ||х||2 сразу следует, что
2п ____
lim Vll х2" 11 = II*II-n->oo
Применив теорему о спектральном радиусе (теорема 2 § 2), мы получаем, что
г (х) = |1х II.	(9)
ОСНОВНЫЕ ТЕОРЕМЫ
525
§ 4]
Тогда из (9), во-первых, следует, что радикал состоит только из нуля. Действительно, если допустить, что	то для всех М выражение
/лт(х0) =0, т. е. а(х0) совпадает лишь с нулем, что противоречит тому, что г(х0) = ||х0|| #= 0.
Далее, из (9) следует, что отображение х-»—>-х(М), являющееся изоморфизмом X и соответствующей подалгебры {х(Л4)} в См, будет изометрией, ибо в силу (8)
II х (МЦС = max | х (Л1) | = г (х) = || х ||.
Доказательство в) требует привлечения одной из весьма замечательных теорем алгебры и анализа — теоремы Стоуна — Вейерштрасса — которая звучит так:
Пусть А есть подалгебра банаховой алгебры Ст непрерывных функций на компакте Т такая, что:
1)	Единица (т. е. функция e(t) =1) принадлежит А.
2)	Алгебра А разделяет точки Т (т. е. для любых ti =/= t2 существует функция х(0 е А такая, что x(tt) #= х(/2))-
3)	Алгебра А инвариантна по отношению к комплексному сопряжению (т. е. из x(t) А следует, что x(t) е Д).
Тогда А всюду плотна в Ст.
Доказательство теоремы Стоуна — Вейерштрасса см. в [13], стр. 53—56; [21], стр. 296—297: [26], стр. 20.
Докажем теперь в). Пусть А = {х(М)} означает образ X при отображении х -* х(М).
Из (4) сразу следует, что е-^е(М) = 1, т. е. е(М) == 1 е А. Пусть Л4, и М2 два различных максимальных идеала. Это означает, что существует элемент Хо, принадлежащий Л4] и не принадлежащий М2 (или наоборот), откуда
Хо(^1)==^1(Хо)==О> хо(М2} = ГмЛхо}^°'
т. е. А разделяет точки Л. Далее, по самому определению, симметричная алгебра А инвариантна относительно комплексного сопряжения. Применение теоремы Стоуна — Вейерштрасса приводит к в).
Теорема доказана.
3. Теорема Вииера; упражиеиия. Приложения теории банаховых алгебр весьма разнообразны.
Напомним ряд результатов из алгебры и анализа, которые уже были получены нами по ходу дела.
Банахова алгебра над полем С, являющаяся полем, изометрически изоморфна С.
Спектр любого ненулевого ограниченного оператора в банаховом пространстве не пуст.
Для любого ограниченного оператора А в банаховом пространстве X п _______________________
существует предел lim Vll Ап II =г (Л), и спектр А целиком лежит в круге |Х|	г(Д).
Докажем теперь, используя теорию коммутативных банаховых алгебр, следующую теорему Винера:
Если функция х(0) разлагается в абсолютно сходящийся ряд Фурье
ОО
х(0) = X xke'M и нигде не обращается в нуль, то и функция </(0) = £= — ОО
= 1/х(0) также разлагается в абсолютно сходящийся ряд Фурье.
Рассмотрим изометрически изоморфные алгебры Е и W (см. пример 4 п. 2 § 1). Найдем пространство Л для них. Легко понять, что гомоморфизм W в С достаточно задать на функции x0(t) — е'1 и далее он распространится на U7
526
ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
однозначно. Положим
Ьл (хо) = 1м (в1/) = ?•
Тогда
В силу (2)
1£1 = 16и(*о)1ММ=Ь ll/U = |fAf(xo-1)|<ho_|||=1'
откуда |£| = 1, т. е. £ = eie. Мы получили, что М находится во взаимно однозначном соответствии с окружностью |£| = 1, Для любой последовательности х = (..., х-„, ..., Хо, ..., х„, ...) е и соответствующей ей функции х (/) = ^xkelkl е W имеем: k
fM М = fM (х (t)) = fM xkeik‘\ = £	(e“)]* = £ xke‘ke = x (0).
\ k J k	k
Поэтому тот факт, что функция x(0) не обращается в нуль ни для каких —л 0 <; л, означает, что х не принадлежит ни одному максимальному идеалу. Значит, в силу следствия из леммы 1 § 3, эта последовательность обратима в алгебре Zj. Положим у = х-1 = (..., у-п.....Уо, ..., уп,
Тогда
ОО
y(M)=fM(y)= У z/Aelfe0=/(x’I) = —L-= ^—1-------------------,
*=--	И }	£ xkeM
k=~ ОО
что и требовалось.
Два других важных приложения теории банаховых алгебр — спектральную теорему для ограниченных операторов и теорему Стоуна — Чеха — мы сформулируем ниже в виде упражнений (см. упражнения 8 и 9).
Упражнения. 1. а) Показать, что пространство максимальных идеалов алгебры st (см. пример 3 п. 2 § 1) можно взаимно однозначно и непрерывно сопоставить с точками единичного круга |z|	1.
б) Показать, что st регулярна, несимметрична и не имеет радикала.
2. Какое обстоятельство мешает тому, чтобы можно было утверждать, что li (см. пример 4 п. 2 § 1) изометрически изоморфна пространству См, т. е. пространству всех непрерывных функций на окружности = 1?
3. Доказать, что имеет место теорема:
Пусть
ОО	сю
х (г) = Е хкг\ Е I xk I < °0-fe=j	k=J
причем x(z) 0 при |z|	1. Тогда функция у (?) =
Тейлора, абсолютно сходящийся при |z| sg 1.
4. Обозначим через Сп [а, 6] совокупность п раз цируемых на [а, 6] функций x(t).
а) Показать, что Сп [л, 6] становится банаховой обычных операций и нормы, задаваемой формулой:
1 x(z)
разлагается в ряд
непрерывно дифферен-алгеброй относительно
п
Их 11= У 4т max !x(ft,(0|. к* ас t
ОСНОВНЫЕ ТЕОРЕМЫ
527
§ 4]
б) Найти максимальные идеалы Сп[а,Ь] (см. [13], стр. 19, 20).
в) Проверить, что С" [а, 6] есть симметричная алгебра без радикала. Что дает в этом случае применение теоремы 2?
5.	Пусть CBV [0, 1] означает алгебру непрерывных комплексных функций ограниченной вариации на отрезке [0, 1] с нормой
11x11 = sup | х (/) | +	[х],
0<i <1
а)	Показать, что CBV [0, 1] есть банахова алгебра.
б)	Найти максимальные идеалы этой алгебры.
6.	Привести пример банаховой алгебры, совпадающей со своим радикалом.
7.	Описать все замкнутые идеалы в алгебре С [а, Ь].
8.	Пусть Т — вполне регулярное топологическое пространство (см. п. 6 § 5 гл. II). Обозначим через Вт множество всех определенных на Т ограниченных комплексных функций с обычными операциями и нормой
||х|| = sup|x(<) |. ter
а)	Проверить, что Вт есть регулярная симметричная алгебра без радикала.
б)	Показать, что точки Т гомеоморфно вкладываются в пространство Ж максимальных идеалов алгебры Вт, причем образ Т при этом вложении является в всюду плотным подмножеством.
в)	Показать, что любая ограниченная комплексная функция на образе Т при этом вложении допускает единственное непрерывное продолжение на Ж.
Утверждение б), дополненное тем, что Ж есть компакт (это последнее обстоятельство сразу следует из а), если применить теоремы 1 и 2 § 4), составляет содержание известной теоремы Тихонова о бикомпактном расширении. Утверждение в) принадлежит Стоуну и Чеху. Бикомпактное расширение, обладающее свойством в), называется максимальным. Утверждение в) означает, что Ж есть максимальное бикомпактное расширение (см. [22], стр. 23).
9.	Пусть Н — гильбертово пространство. В алгебре S’(77, И) рассмотрим коммутативную подалгебру В(Л0), порожденную самосопряженным оператором Ло (т. е. являющуюся замыканием линейной оболочки степеней Ло).
а)	Показать, что В(Л0) регулярна и не имеет радикала.
б)	Показать, что В(Л0) симметрична, причем
х(М) = х* (М), где х* — оператор, сопряженный к оператору хеВ(Л0), х(А7)—отображение, построенное в § 4. По поводу б) см. также упражнение 10 в).
Применение теоремы 2 § 4 к алгебре С(Л0) приводит к так называемой спектральной теореме для самосопряженных операторов (см. [22], гл. X; [26], гл. II).
10.	Говорят, что банахова алгебра (необязательно коммутативная) есть алгебра с инволюцией, если имеется отображение Х-+Х, обладающее свойствами:
(х+ </)* = х*+ </’,	(xt/)‘= t/*x‘,	(ах)* = ах*, (х*)' = х.
Алгебра с инволюцией называется В*-алгеброй, если, кроме того ‘||хх*|| = = WI2.
а)	Показать, что алгебра 3?(Н,Н) есть В*-алгебра (см. [22], стр. 26).
б)	Показать, что коммутативная В*-алгебра регулярна (см. [22], стр. 26).
в)	Показать, что В*-алгебра симметрична, более того, х(А4) = х*(М) (см. [22], стр. 27, лемма Аренса).
528	ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
Утверждения б) и в) в сочетании с теоремой 2 приводят к такому результату, принадлежащему Гельфанду и Наймарку и называемому иногда основной теоремой теории коммутативных банаховых алгебр:
Коммутативная В*-алгебра изометрически изоморфна алгебре См и при этом изоморфизме х(М) = х*(М).
Итак, абстрактный алгебраический объект, описываемый двадцатью четырьмя аксиомами (13 аксиом коммутативной алгебры, 5 аксиом, связанных с нормой, аксиома полноты и 5 аксиом В*-алгебры), оказалось возможным реализовать в виде алгебры всех непрерывных функций на компактном ха-усдорфовом топологическом пространстве.
Этот результат позволяет рассмотреть с единой точки зрения такие, казалось бы, весьма далекие друг от друга факты, как теорема Винера об абсолютно сходящихся тригонометрических рядах, теорема о спектральном разложении самосопряженного оператора, топологические теоремы Тихонова, Стоуна и Чеха и ряд других.
ЛИТЕРАТУРА
1.	Авербух В. И., Смол я нов О. Г., Теория дифференцирования в линейных топологических пространствах, УМН XXII, вып. 6 (138) (1967), 20С—260.
2.	Александров П. С., Введение в общую теорию множеств и функций, Гостехиздат, 1948.
3.	Ахиезер Н. И., Глазман И. М., Теория линейных операторов, «Наука», 1966.
4.	Банах С., Курс функцюнального анал!зу, Радяньска школа, Ки1в, 1948.
5.	Березанский Ю. М., Разложение по собственным функциям самосопряженных операторов, «Наукова думка», Киев, 1965.
6.	Бохнер С., Лекции об интегралах Фурье, Физматгнз, 1962.
7.	Бур баки Н„ Общая топология. Основные структуры, Физматгиз, 1958.
8.	Б у р б а к и Н., Теория множеств, «Мир», 1965.
9.	Бурбаки Н., Топологические векторные пространства, ИЛ, 1959.
10.	Виленкин Н. Я. и др., Функциональный анализ (серия «Справочная математическая библиотека»), «Наука», 1964.
11.	Винер Н., Интеграл Фурье и некоторые его приложения, Физматгиз, 1963.
12.	В и н е р Н., И э л и Р., Преобразование Фурье в комплексной области, «Наука», 1964.
13.	Г е л ь ф а н д И. М., Р a ij к о в Д. А., Шилов Г. Е., Коммутативные нормированные кольца, Физматгиз, 1960.
14.	Гельфанд И. М., Шилов Г. Е., Обобщенные функции, вып. 1; Обобщенные функции и действия над ними, изд. 2, Физматгиз, 1959.
15.	Гельфанд И. М., Шилов Г. Е., Обобщенные функции, вып. 2; Пространства основных и обобщенных функций, Физматгиз, 1958.
16.	Гельфанд И. М., Шилов Г. Е., Обобщенные функции, вып. 3; Некоторые вопросы теории дифференциальных уравнений, Физматгиз, 1958.
17.	Гельфанд И. М., Виленкин Н. Я., Обобщенные функции, вып. 4; Некоторые применения гармонического анализа. Оснащенные гильбертовы пространства, Физматгиз, 1961.
18.	Гох б ер г И. Ц., Крейн М. Г., Введение в теорию линейных несамосопряженных операторов, «Наука», 1965.
19.	Г о х б е р г И. Ц., Крейн М. Г., Теория вольтерровых операторов в гильбертовом пространстве и ее приложения, «Наука», 1967.
20.	В у л и х Б. 3., Теория полуупорядоченных пространств, Физматгиз, 1961.
21.	Данфорд Н., Шварц Дж. Т., Линейные операторы. Общая теория, ИЛ, 1962.
22.	Д а н ф о р д Н., Шварц Дж. Т., Линейные операторы. Спектральная теория, «Мир», 1966.
23.	Дэй М., Линейные нормированные пространства, ИЛ, 1961.
24.	Дьедонне Ж-, Основы современного анализа, «Мир», 1964.
25.	Зигмунд А., Тригонометрические ряды, т. 1, 2, «Мир», 1965.
26.	И о с и д а К., Функциональный анализ, «Мир», 1967.
27.	Канторович Л. В., Функциональный анализ и прикладная математика, УМН, 111, вып. 6 (28) (1948), 89—185,
539
ДОПОЛНЕНИЕ. БАНАХОВЫ АЛГЕБРЫ
28.	Канторович Л. В., Акилов Г. П., Функциональный анализ в нормированных пространствах, Физматгиз, 1959.
29.	Келли Дж, Л., Общая топология, «Наука», 1968.
30.	Красносельский М. А., Топологические методы в теории нелинейных дифференциальных уравнений, Гостехиздат, 1956.
31.	Куратовский К., Топология, т. I, «Мир», 1966.
32.	Лебег А., Интегрирование и отыскание примитивных функций, ГТТИ, 1934.
33.	Лоэв М., Теория вероятностей, ИЛ, 1962.
34.	Люмис Л., Введение в абстрактный гармонический анализ, ИЛ, 1956.
35.	Михлин С. Г., Лекции по интегральным уравнениям, Физматгиз, 1959.
36.	Морен К., Методы гильбертова пространства, «Мир», 1965.
37.	Найм ар к М. А., Нормированные кольца, изд. 2, «Наука», 1968.
38.	Н а й м а р к М. А., Линейные дифференциальные операторы, изд. 2, «Наука», 1969.
39.	Н а т а н с о н И. П., Теория функций вещественной переменной, изд. 2, Гостехиздат, 1957.
40.	П л е с и е р А. И., Спектральная теория линейных операторов, «Наука», 1965.
41.	Рисе Ф., Надь Б. С., Лекции по функциональному анализу, ИЛ, 1954.
42.	Робертсон А., Робертсон В., Топологические векторные пространства, «Мир», 1967.
43.	Рудин У., Основы математического анализа, «Мир», 1966.
44.	Сакс С., Теория интеграла, ИЛ, 1949.
45.	Титчмарш Е., Введение в теорию интегралов Фурье, Гостехиздат, 1948.
46.	Трикоми Ф., Интегральные уравнения, ИЛ, 1960.
47.	Ф р е и к е л ь А., Б а р - X и л л е л И., Основания теории множеств, «Мир», 1966.
48.	X а л м о ш П., Теория меры, ИЛ, 1953.
49.	Халмош П., Конечномерные векторные пространства, Физматгиз, 1963.
50.	Халмош И., Лекции по эргодической теории, ИЛ, 1959.
51.	Хилле Е., Филипс Р., Функциональный анализ и полугруппы, ИЛ, 1962.
52.	Ш и л о в Г. Е., Математический анализ. Второй специальный курс. Физматгиз, 1965.
53.	Ш и л о в Г. Е., Гуревич Б. Л., Интеграл, мера и производная. Общая теория, «Наука», 1967.
54.	Ш и л о в Г. Е., Фан Дык Т и н ь, Интеграл, мера и производная на линейных пространствах, «Наука», 1967.
55.	Эдвардс Р., Функциональный анализ, «Мир», 1967.
56.	Schwartz L„ Theorie des distributions, I, 11, Act. Sci. Ind., 1091, 1122, Paris, 1951.
57.	Fraenkel A., Abstract Set Theory, Amsterdam, 1953.
РАСПРЕДЕЛЕНИЕ ЛИТЕРАТУРЫ ПО ГЛАВАМ
Глава I. 2; 8; 47; 56.
Глава II. 2; 4; 7; 24; 29; 31.
Глава III. 4; 9; 10; 13; 15; 17; 20; 21; 23; 24; 26; 27; 28; 34; 36; 37; 41;
42; 49; 51; 55.
Глава IV. 3—5; 13—19- 21—23; 26; 34; 36—38; 40; 52; 57.
Глава V. 12; 21; 32; 33; 39; 41; 44; 48; 50; 53; 54.
Глава VI. 21; 28.
Глава VII. 32; 39; 41; 44; 53.
Глава VIII. 6; 11; 12; 14—17; 25; 52.
Глава IX. 35; 46.
Глава X. 1; 24; 28; 30; 43; 51.
Дополнение. 13; 21; 22; 26.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Абсолютная непрерывность интеграла Лебега 301
Абсолютно непрерывная мера 264
----функция 342 и далее
— непрерывный заряд 352, 353
Абстрактная функция 485
Абстрактное уравнение Фредгольма первого рода 473
Абстрактный оператор Вольтерра 472, 475
Аддитивный функционал 124
Аксиома выбора 39
— нормальности 96
♦- отделимости 94
----Т2 (хаусдорфова) 95
•— счетности первая 89
----вторая 88
— треугольника 48
•— Цермело 39
Аксиоматическая теория множеств 39
Алгебра (банахова, коммутативная, нормированная, с единицей) 513
— множеств 42
----измеримых 273
— с ннволюцней 527
— функций, аналитических в круге 514
----, непрерывных на компакте 514
— — с абсолютно сходящимися рядами
Фурье 515
4- h 515
Алгебраическая размерность 123, 143, 175
Алгебраически сопряженное пространство 182
Алгебраические действия над измеримыми функциями 283
Алгебраическое число 24
Альтернатива Фредгольма 468
Аннулятор 181
Антисимметричность 31
Арифметическое (евклидово) пространство 49, 120
База топологии 87, 88
Базис в конечномерном линейном пространстве 122
— Гамеля 123, 175
—	двойственный 185
—	меры 379
Банахова алгебра 513
—	— ограниченных операторов 515
----, основная теорема о коммутативных 528
---- регулярная 524
----симметричная 524
Банахово пространство 139
Бесконечное множество 21, 26
Бесконечномерное линейное пространство 122
Биекция 17
Бикомпакт 105
Бикомпактное расширение 527
—	топологическое пространство 105
Билинейное отображение 488
Бинарное отношение 21
Борелевская функция 282
Борелевское множество 46, 62
Вариационное исчисление 499, 506
Вариация заряда, верхняя, нижняя и полная 352
—	отображения первая 482
Векторное пространство 119
Верхний предел функции в точке 102
Верхняя грань 40
Вес (весовая функция) 400
Взаимно однозначное соответствие 17
—	между интегральными операто-
рами и их ядрами 463
— -------линейными функционалами и
гиперплоскостями 128
Внешняя мера 256, 272 , 279
---, полуаддитнвность 256
---, — счетная 272
Внутренняя мера 276, 279
—	точка множества 61
Восстановление функции по ее производной 213, 339, 345, 348, 487
Вполне непрерывный оператор 237
—	ограниченное множество 106
—	регулярное топологическое пространство 96
—	упорядоченное множество 34
Всюду плотное подмножество 59
—--------	в пространстве Li 377, 378, 379
-----------L2 386
Вторая аксиома счетности 88
—	производная отображения 488 и далее
Второе сопряженное пространство 190
Выпуклая оболочка 130
Выпуклое множество 128
—	тело 128
—	— в нормированном пространстве 180
Выпуклый функционал 130
Вычитание множеств 15
Геометрическая интерпретация линейного функционала 126
---теоремы Хана — Банаха 179
Геометрический смысл нормы линейного функционала 178
532
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ’
Геометрическое определение интеграла
Лебега 316
Гильбертов кирпич 107, 129
Гильбертово пространство 155, 386
----комплексное 166, 387
Гиперплоскость 127
Глобальная сходимость ряда Фурье 410
Гомеоморфизм пространств метрических
---- топологических 93
Гомоморфизм алгебр 514
Грань симплекса 130
График оператора 229
Двойственности принцип 15
Двойственный базнс 185
Действительное линейное пространство
119
Детерминант Грама 403
— Фредгольма 479
Диагональная процедура Кантора 27
Диаметр множества 70
Дискретная мера 264, 357
—	топология 85
Дискретный заряд 352
Дисперсия 360
Дифференциал Гато 482
—	Фреше 481
Дифференциалы высших порядков отображения 491
Дифференциальное уравнение в классе обобщенных функций 2Н и далее
----второго порядка 459
----, зависимость решений от начальных данных 495
----,------параметра 496
— — с постоянными коэффициентами 434, 447
----, теорема существования и единственности 78—80
Дифференцируемый функционал 485
Длина кривой в метрическом пространстве 117
Дополнение множества 15
Достаточность запаса основных функций 210
Достаточные условия минимума функционала 505
----сходимости интеграла Фурье 421
-----------многомерного 437
------ряда Фурье 409
-----------равномерной 413, 414
Евклидово пространство 143, 162
---- комплексное 164
----п-мериое арифметическое 49
Единица алгебры 513
— системы множеств 42
Единичный оператор 219
Естественное отображение Е в Е** 191
Задача Коши 78—81
---- для уравнения теплопроводности 434
------------На плоскости 438
Задачи, приводящие к интегральным уравнениям 457—460
Замена переменных в интеграле Лебега 362
Замкнутая ортонормальная система 151
Замкнутое множество в метрическом пространстве 60
Замкнутое множество в топологическом пространстве 84 ---на прямой 63 — подпространство нормированного пространства 141
— покрытие 90
Замкнутость максимальных идеалов 521
—	множества необратимых элементов банаховой алгебры 518
Замкнутый оператор 229
—	отрезок 128
—	шар 57
Замыкание линейное 141
— множества в пространстве метрическом 57
---------топологическом 85, 98
Заряд 349, 350
— непрерывный, дискретный, абсолютно непрерывный и сингулярный 352
Знакопеременная мера 349, 350
Идеал в кольце 243
— коммутативной алгебры 515
Измеримая функция 282, 292
---, действия иад ними 283—285
Измеримое множество 257, 272, 276—279, 352 ---, свойства 257—262
Измеримость по Каратеодори 276
Изолированная точка множества в метрическом пространстве 58
Изометрически изоморфные алгебры 514
Изометричность отображения нормированного пространства во второе сопряженное 191
Изометрия. 56
Изоморфизм алгебр 514
— между гильбертовым пространством и ему сопряженным 187
— пространств гильбертовых сепарабельных 156
------— комплексных 166
---евклидовых 155
---линейных 121, 123
------ Ь<Х,ц) 386
—	— — комплексных 387
—	частично упорядоченных множеств 32
Индикатор 31
Интеграл абстрактной функции 485
—	Дирихле 408
— как б-аддитивная функция множества 302
— Лебега 291 н далее
— —, замена переменных 362
— — неопределенный 320
---, основные свойства 295 н далее
---по множеству бесконечной меры 306 и далее
---1 сравнение с интегралом Римана 307
— —t--------— несобственным ЗОЭ
— Лебега—Стилтьеса 358 и далее ------по функции монотонной 358 ------ ограниченной вариации 359 — от простой функции 293 ------, свойства 294
—	по множеству 295
—	Пуассона 435
—	Римана 307
—	Римана — Стилтьеса 362 и далее
—	Фейера 416
— Фурье 419 и далее (см. Преобразование Фурье)
---в комплексной форме 422
Интегральное неравенство Гёльдера 52 ---Коши — Буняковского 51
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
53$
Интегральное неравенство Минковского 54
— уравнение 456
----Абеля 456
----Вольтерра 82, 457, 472
----задачи, к нему приводящие 457—
460
— — нелинейное 82 , 456, 511
— — Фредгольма 81, 457, 460, 463, 473
Интегрируемая функция 294
----простая 293
Интегрируемость ограниченной измери-
мой функции 296
Интервал в множестве порядковых чисел 103
Интерполирование по методу наименьших квадратов 403
Инъекция 17
Исключающее «или» 16
Исчерпывающая последовательность мно-
жеств 306
Итерированные ядра 477
Критерий компактности пространства метрического 108
-------топологического 99
— непрерывности линейного функционала.
в пространстве нормированном 176
—,-----—------топологическом 175
— — отображения топологического пространства 92
—	полноты метрического пространства 69
---ортогональной нормированной системы 154
---счетно-иормированного пространства 171
—	предельности точки в /^-пространствах 94
— предкомпактности множества в полном-метрическом пространстве 109
— слабой сходимости в нормированном пространстве 195
-------последовательности функционалов 198
— суммируемости простой функции 293
•— счетной компактности топологического* пространства 103
Канторова лестница 341
Канторово множество 63
— —, точки первого и второго рода 64
Касательное многообразие к множеству 497
Классы смежности по подпространству 123
Колебание функции в точке 102
Колебания струны 457
Кольцо множеств 41
----измеримых 272
----, — по Жордану 279, 281
•---, порожденное полукольцом 45
----элементарных 252
Коммутативная алгебра 513
Компакт 98, 105
Компактное топологическое пространство 98
Компактность замкнутых подмножеств компактного пространства 99
— интегрального оператора 239
•—спектра элемента алгебры* 517, 519 г— счетно-компактного метрического пространства 108
Компактный оператор 237
----в гильбертовом пространстве 245, 246
Комплексное пространство гильбертово 166
----евклидово 164
----линейное 119
Композиция борелевской функции с измеримой 283 — измеримых функций 283 Компонента открытого множества 65 Конечное множество 21 — разложение множества 43 Конечномерный оператор 237, 462 Континуум-гипотеза 39 Контрпример к теореме Фубинн 319 Координаты вектора в евклидовом пространстве 149
Коразмерность 124
— ядра линейного функционала 126
Корректная задача 474
Коэффициенты Фурье 152, 166, 390—392,
394, 406, 424, 439
----, однозначность определения функции по ним 419
----по ортонормальной системе 149
Критерий базы топологии 88
— измеримости функции 283, 292
-------простой 292
Лебегова мера 257, 263, 272
Лебегово продолжение меры 274
------, полнота 275
Лемма Аренса 527
—	Гейне-Бореля 98
—	о замкнутости образа 469
----замыкании идеала алгебры 521
----максимальных идеалах алгебры непрерывных функций 516
---- равномерном стремлении к нулю коэффициентов Фурье компактного множества функций 414
---разложении гильбертова пространства
в прямую сумму Кег Т и Im Т* 469, 470
----сепарабельности подмножества 158
----стремлении к нулю коэффициентов Фурье суммируемой функции 408
----существовании максимального идеала. 521
---- тройке 228
----ядре мультипликативного функционала 522
— об аннуляторе 180
------ядра оператора 232
----идеалах фактор-алгебры 521
---- обратимости элементов, близких к. единичному 517
---------,----обратимому 518
— Рисса о множестве невидимых точек 325, 326
----обобщенная 329
—	Цорна 40
Линейная зависимость и независимость 121
—	оболочка 123
Линейно упорядоченное множество 33
Линейное замыкание 141
— многообразие 141, 158
----абсолютно непрерывных функций 343-
---- в гильбертовом пространстве 158
----касательное к множеству 497
— пространство 119 и далее
---- топологическое 167
Линейные функционалы в счетно-норми* рованном пространстве 181
Линейный оператор 218 и далее (см также-Оператор)
----, график 229
----замкнутый 229
----непрерывный 218
----ограниченный 222. 223
534
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ'
Линейный оператор самосопряженный 233 ----. сопряженный к данному 231 ----эрмитово сопряженный 233 функционал 124, 174 и далее (см. также
Функционал линейный) ----не непрерывный 175 Локальная выпуклость нормированного
пространства 170 ---- сильной топологии в Е* 134 — ограниченность нормированного пространства 179
Локально выпуклое топологическое линейное пространство 169
«— ограниченное топологическое линейное пространство 169
Ломаные Эйлера 112
-Максимальная цепь 39
Максимальное бикомпактное расширение
527
Максимальный идеал 515
----алгебры С? 516
— элемент 32
Максимум функционала 500
Математическое ожидание 360
Мера 251 и далее, 265
— абсолютно непрерывная 264
— дискретная 264
— Жорданова 279
— Лебега 272
----на плоскости 257
— —, непрерывность 261
----, полнота 262
— — п-мерная 313
Лебега—Стилтьеса 263, 264, 356, 358
------абсолютно непрерывная 264, 357
------дискретная 264 , 357
------1 примеры 357
---производящая функция 356
—-----сингулярная 264, 357
— на классе прямоугольников 252
---- полукольце 265
, непрерывность 274
— полная 275
— сингулярная 264
— со счетным базисом 378, 379
— а-аддитивная 268
— а-конечная 276 ' с
Метод касательных 508
— математической индукции 40
— Ньютона 508
----модифицированный 509
----, пример 511
— последовательных приближений 76
— характеристических функций 452
Метризуемое пространство 98
Метрический компакт 105
Метрическое пространство 48
Минимальная топология, порожденная системой множеств 86
— а-алгебра 46
Минимальное кольцо, порожденное системой множеств 42
Минимальный элемент 32
Минимум функционала 500
Мииор Фредгольма 479
Многочлены Лагерра 402
— Лежандра 395 и далее
— Чебышева 400
— Эрмита 401
Множеств алгебра 42
— кольцо 41
— объединение 13
•«- пересечение 14
Множеств полукольцо 43
— равенство 14
— разность 15
----симметрическая 15
— система 41
Множества диаметр 70
— дополнение 15
— замыкание 57. 85
— мощность 28
Множество 13
— бесконечное 21, 26
— всюду плотное 59
— выпуклое 128
— замкнутое 60, 84
— .измеримое 257 , 272, 277
— — относительно ст-кольца 279
----по Жордану 279, 281
— конечное 21
— линейно упорядоченное 33
— неизмеримое 264
— несчетное 23
— нигде не плотное 59
— ограниченное 57
— однозначности меры 280
— открытое 61, 65, 84
— относительно компактное 105
— отрицательное относительно заряда 350
— плотное в другом множестве 59
— положительное относительно заряда 350
— предкомпактное 105
— пустое 13
— симметричное 170
— совершенно упорядоченное 33
— счетное 22
— счетно-предкомпактное 105
— упорядоченное 33
— — частично 31
— ст-однозначности меры 281
Множители Лагранжа 507
Монотонные функции 321
Мощность континуума 28
— множества 28
—• — всех подмножеств натурального ряда 30
- W1 38
Мультипликативный функционал 521
«Наивная» теория множеств 39
Наличие счетной базы у вполне ограниченных метрических пространств 106
Направленное множество 32
Наследственное свойство 96
Наследственность полной регулярности 96
Начальный отрезок упорядоченного множества 36
Невидимая справа или слева точка 325, 326, 329
Неизмеримое множество 264
Неисключаюшее «или» 16
Некоммутативная банахова алгебра 515
Некомпактность единичного оператора в банаховом пространстве 237
Некорректная задача 474
Нелинейное интегральное уравнение 82. 511
Необратимый элемент алгебры 516
Необходимое условие минимума функционала 504
•--------для задачи с ограничениями 506
---------? контрпример 505
----экстремума функционала 500
Неопределенный интеграл Лебега 320, 344
Неподвижная точка отображения 75, 101
Непрерывная кривая в метрическом пространстве 116
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
535
Непрерывное отображение пространства метрического 55 ------- топологического 91
Непрерывность линейного оператора 222
— меры 261, 274
•	— слева н справа 322
—	сложной функции 93
Непрерывный заряд 352
—	спектр 235
— функционал на линейном топологическом пространстве 174
Неприводимость о-алгебры 46
Непустота спектра элемента алгебры 517, 519
Неравенство Бесселя 151, 152, 166
---для тригонометрической системы 391
—	Гёльдера 52
—	— интегральное 54
— Коши—Буняковского 49, 143
—------интегральное 51, 382
— Минковского 52
--- интегральное 54
— Чебышева 300
Несепарабельность пространства т 60
Несравнимые элементы 33
Несчетное множество 23
Несчетность множества действительных чисел 26
Нигде не плотное множество в метрическом пространстве 59
Нижний предел функции в точке 102
Норма 139
— билинейного отображения 488
— линейного оператора 223
—------сопряженного 23Г
—	функционала 176
Нормальное пространство 96
Нормированная алгебра 513
Нормированное пространство 139
Нормируемость 170 — локально выпуклых, локально ограниченных линейных топологических пространств 170
— пространства, сопряженного к нормируемому 183
Носитель заряда 352
Нулевой оператор 219
Нуль-множество 279
Область значений функции 16
—	определения оператора 218
---функции 16
Обобщение принципа сжимающих отображений 82
Обобщенная производная 208
---, сравнение с обычной 348
—	• теорема Арцела 114
— функция 203 и далее
--- комплексная 215
---на окружности 216
-------пространстве КП 215
--- первообразная 213
---периодическая 216, 217
---, производная 208
--- регулярная 205
--- сингулярная 205
Образ множества 17
—	оператора 218
—	элемента 17
Обратимый оператор 225
— элемент алгебры 516
Общий вид линейного оператора нз в Rm 219
Общий вид линейного функционала в про* странстве гильбертовом 187, 188, 386 -----------— конечномерном 185 -----------—----------счетно-нормированном -----------С[а, 5] 369 -----------С[а, Ь] 373
~ —	— — — Со 186
--------------1,. 1р187	.
Объединение множеств 13
Ограниченное множество в пространстве-лннейном топологическом 169 --------- метрическом 57 — отображение 486
Ограниченность слабо ограниченного под* множества нормированного пространства 194, 195
---сходящейся последовательности функционалов на банаховом пространстве 198
---------элементов нормированного пространства 194
Однозначность определения суммируемой функции по ее коэффициентам Фурье 119-
--------------преобразованию Фурье 424 — продолжения меры 276, 280 и далее Однородно-выпуклый функционал 131 --------------на комплексном пространстве 136 Однородный функционал 124 Окрестность множества 95 — точки 85 Оператор 218 н далее — Вольтерра 241, 472, 475 — вполне непрерывный 237
------ в гильбертовом пространстве 245
— Гильберта—Шмндта 461
------, компактность 461
---—, сопряженный оператор 463
— дифференцирования 220, 221
—	единичный 219
—	замкнутый 229
—	компактный 237
---в гильбертовом пространстве 245, 246^
—	конечномерный 237
—	линейный 218
---нз Rn в Rm 219
—	непрерывный 218
—	нулевой 219
—	обратимый 225
—	обратный к данному 225
—	ортогонального проектирования 220
—	самосопряженный 233, 246
— сопряженный 231
---в евклидовом пространстве 233
—	Фредгольма 4&1
—	эрмитово-сопряженный 233
Операторный метод решения дифференциальных уравнений 446—448
Операции над множествами 13, 15
Операция замыкания в пространстве метрическом 57 --------- топологическом 97
Определяющая система окрестностей 89’
Оптимальное управление 506
Ортогонализация 147
Ортогональная нормированная система 145--
Ортогональное дополнение 159
Ортогональность векторов 144, 166
— с весом 400
Ортогональные многочлены Лагерра 402
---Лежандра 395 и далее
---с дискретным весом 402 и далее
---Чебышева 400
— — Эрмита 401
536
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ’
Ортогональные системы на произведении пространств 397
----функций в Ьъ 389
----Радемахера—Уолша 405
-------Хаара 404. 405
Ортогональный базис 145
----в пространствах L2(— <», °°) и £г(0, <»)
401
----из собственных векторов 249
----нормированный 145
Ортонормальная система 145
Ортопроектор 220
Основной параллелепипед гильбертова
пространства 107
Остаток упорядоченного множества 36
Отделимость выпуклых множеств в про-
странстве линейном 137
-----------нормированном 180
— сильной топологии в £* 184
Отделимые топологические пространства 168, 169
Открытое множество в пространстве метрическом 61 ---- топологическом 84 ---- на прямой 62 — покрытие 90
Открытость множества обратимых ограниченных операторов 229
------- элементов банаховой алгебры 518
Открытый отрезок 128
—	шар 56
Относительная топология 86
Отношение бинарное 21
—	эквивалентности 19
Отображение 16 (см. также Оператор, Функционал, Функция)
—	билинейное 488
— «в» 17
— гомеоморфное пространств метрических 56
-------топологических 93
— дифференцируемое 480
— замкнутое 93
— линейного топологического пространства во второе сопряженное 191
«на» 17
— непрерывное 91, 92
— ограниченное 486
— открытое 93
— регулярное 497
—, сохраняющее порядок 32
— п-лннейное 490
Оценка скорости сходимости метода Ньютона 511
Первая аксиома счетности 89
— вариация отображения 482
Первообразная обобщенной функции 213
Пересечение множеств 14
— системы подпространств линейного пространства 123
Плотное подмножество в метрическом пространстве 59
Плотность распределения вероятностей 361
Поглощение 134, 169
Подмножество 13
— собственное 13
Подпокрытие 90
Подпространство нулей лииёйного функционала 126
— пространства гильбертова 158
----линейного 122
-------нормированного 141
-------, порожденное множеством эле-
ментов 123
Подпространство пространства метрического 55
----топологического 86
Покрытие (открытое, замкнутое, конечное, счетное) 90
Полная вариация заряда 352
----функции 332 и далее
— мера 275
— ограниченность 106
— регулярность топологического пространства 96
— система элементов в нормированном пространстве 141
— упорядоченность 34
Полное метрическое пространство 66
Полнота пространства рефлексивного нормированного 192
----, сопряженного к нормированному, в сильной топологии 183
----счетно-нормированного 171
----С[а, Ь] 67
----Ц 376
----Ьг 383, 384
----li 67
----т 69
----Rn 66
- - R?. R" 67
— системы функций Лагерра 431
-------тригонометрических 390, 393, 418
-------Уолша 405
—------Хаара 405
-------Эрмита 431
Полный прообраз 17
----системы множеств 47
Полуаддитнвность меры 255, 270, 280
Полукольцо 43
Полунепрерывная функция на метриче-
ском пространстве 102
Полуиепрерывность снизу (сверху) 102
----длины кривой в метрическом пространстве 117
Пополнение пространства 71, 157
Порядковое число 35
Порядковый тнп 33
— — (О 3 3
----«1 38
Порядковых чисел произведение 36
---- сравнение 36
----сумма 34
Порядок функционала на счетио-нормнро-
ванном пространстве 182
Последовательность сходящаяся 58, 90
----в счетно-нормированном пространстве 171
----обобщенных функций 207
----слабо 193
— фундаментальная 66
«Почти всюду» 285
Почти периодические функции 450
Правило множителей Лагранжа 507
Предел последовательности в метрическом пространстве 58
— справа нли слева 321
Предельная точка в метрическом пространстве 58
------- топологическом пространстве 85
-------Трпространстве 94, 95
Предельный переход под знаком интеграла
Лебега 302
------------ Стилтьеса 366
Преобразование Лапласа 446
----, применение к решению дифференциальных уравнений 446—448
— Фурье 423
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
537
Преобразование Фурье быстроубывающих функций 4о1
----в пространстве Lz(—°°. °°) 438—445
----обобщенных функций 453
— — — —, примеры 454
----, однозначность определения функции 424
----, основные свойства 427—430 ----, примеры 425—427
— — свертки 432, 433
----, формула обращения 423
----функции п переменных 435 и далее
----Функционала 455
— Фурье — Стилтьеса 449, 452
-------свертки функции с ограниченным изменением 451
Применения принципа сжимающих отображений 75—83
— теоремы о неявной функции 495—499
Пример аддитивной, но не о-аддитивиой меры 269
— не вполне ограниченного множества 107 — неизмеримого множества 264
— иесепарабельного пространства 60, 147 — не о-конечной меры 277 — счетно-компактного, но не компактного пространства 103
— функции, дифференцируемой только слабо 484
Примеры банаховых алгебр 514—515 — линейных операторов 219—221 ----функционалов 125 ----на нормированных пространствах 176-178
— ортогональных базисов 145, 146
— преобразований Фурье 425—427
-------обобщенных функций 454
— производных от обобщенных функций 208—210
— пространств векторных 120, 121
----нормированных 139, 140
----сопряженных 185—190
----счетно-нормированных 171—173
----топологических линейных 167, 168
— слабо сходящихся последовательностей 195-197
— экстремальных задач 500—503
Принцип двойственности 15
•—равномерной ограниченности 519 — сжимающих отображений 75 -------, обобщение 82 -------, применения 75—83 Проблема Н. Н. Лузина 411 Программирование линейное н выпуклое 506
Продолжение меры 246
----по Жордану 279
-------Лебегу 271-276
Произведение бесконечно дифференцируемой функции на обобщенную 207 — мер 312, 313 — оператора на число 224 — операторов 224 — порядковых чисел 36 — функционала на число 182 — элемента линейного пространства на число 119
— элементов алгебры 513
Производная Гато 482
— заряда по мере 353, 356
— интеграла по верхнему пределу 331, 337
—	линейного отображения 481
—	обобщенной функции 208
— сложной функции 481
—	Фреше 481
Производные высших порядков 488
Производные числа 324, 325
Производящая функция меры Лебега — Стилтьеса 356
Прообраз 17
—	топологии 92
Простая функция 292
---суммируемая (интегрируемая) 293
Пространства гомеоморфные 56, 93
— нзометричные 56, 514
—	изоморфные евклидовы 155
---линейные 121
Пространство арифметическое 49, 120
—	банахово 139
—	бикомпактное 105
—	быстро убывающих последовательностей.* 173
—	векторное 119
—	вполне регулярное 96
—	второе сопряженное 190
— гильбертово 155, 156
— дискретное 48, 49, 59, 66
— евклидово 143, 164
— изолированных точек 48, 49, 59, 66
—	компактное 98
— линейное 119, 167
—	метрнзуемое 98
—	метрическое 48
---сепарабельное 59, 89
—	нормальное 96
—	нормированное 139
—	основных функций 204
—	полное 66
—	полурефлексивное 191
—	регулярное 95
—	рефлексивное 191
—	с аксиомой счетности второй 88
		первой 89
—	связное 90
— сепарабельное 59, 89
—	слипшихся точек 85
—	со счетной базой 88
		метрическое 89
—	сопряженное 182
—	, — к пространству быстро убывающих последовательностей 189
—	,-----гильбертову 187, 188
—t--------счетно-нормированному 181
-------С[а, Ь] 373
—	,-----Со 186
-------Zi, 1р 187
—	,-----R ", Сге 185
—	счетно-гильбертово 172
—	счетно-компактное 103
—	счетно-нормированное 171
— топологическое 84, 167
— функций с ограниченным изменением 333, 337
— хаусдорфово 95
— с" 120, 122, 140, 165
— С[а, Ь] 50, 60, 67, 120, 140, 164, 192, 197, 369-
— С‘[а, ft] 373, 502
- с" [a, ft] 173, 526
С,[a, ft] 51, 60, 68, 146
---комплексное 165
— Ст 514
— CBV [0, 1] 527
— с 120
— Со 121, 192
— с* 186, 192
— К 204, 454
— К' 455
— К[а, ft] 168, 171, 173
— К 205
538
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ'
Пространство Кп 215
— Li 376, 379, 387-389
— —, плотность множества функций непрерывных 378
—	—,-------простых 377
— L2 381—384 , 387—389
—	— комплексное 387
-L 385
— /, 186, 192
— I- 50, 60, 67, 107, 120, 145, ГЛ>
----комплексное 165
— 1р 54, 192
— /’. 1* 187, 192
— т 51, 60, 121, 140, 187, 192
— R' 49, 66, 120, 139
—	Rn49, 66, 166, 120, 122, 139, 176,185. 195
-	RJ, 50 . 60. 67. 140. 186
— R” 52, 163, 185
—	rJ, 50 , 60, 67, 140, 186
—	R°° 121, 168
—	172, 217. 218. 432, 453
—	S Jo 453
— Vo[a, b] 337, 372
- Z 453
Процесс ортогонализации 149
Прямая сумма 160
----счетного числа подпространств 161
----а-алгебр 277
Прямое произведение множеств 310
----систем множеств 310
Прямоугольник 251
Пустое множество 13
Равенство множеств 14
—	Парсеваля 151
---для тригонометрической системы 391
—	порядковых чисел 36
Равновесие нагруженной струны 457
Равномерная непрерывность отображения метрического пространства 113
—	ограниченность семейства функций ПО
Равностепенная непрерывность семейства функций ПО
Радикал банаховой алгебры 524
Разбиение множества на классы 18
Разделение выпуклых подмножеств с по-
мощью линейных фннкциоиалов 138, 180
Разложение Жордана 352
— меры Лебега — Стилтьеса в сумму абсолютно непрерывной, дискретной и сингулярной 357
— функции в ряд Фурье (см. Ряд Фурье)
---монотонной на непрерывную и функцию скачков 324
---по многочленам Лежандра 397
--- с ограниченным изменением в разность монотонных 335
------------на абсолютно непрерывную, сингулярную и функцию скачков 347
— Хана 351
Размерность линейного пространства 122
Разность множеств 15
Расстояние в метрическом пространстве 48
—	между двумя множествами 65
---кривыми 117
—	от точки до множества 65
Регулярная банахова алгебра 524
—	точка оператора 235
~ — элемента алгебры 516
Регулярное отображение 497
—	топологическое пространство 95
Регулярность отделимых линейных тополо-
гических пространств 169
Резольвента оператора 235
— элемента алгебры 517
Резольвентное ядро 479
Рефлексивное линейное топологическое
пространство 191
Рефлексивность 19, 31
Решетка 40
Ряд Фурье 149, 152, 166, 407
— — в комплексной форме 394, 424
— по ортогональной системе функций 390
----— ортонормальной системе 149
------- тригонометрической системе на от-
резке [—Я; я] 391
--------------произвольном отрезке 392
— — расходящийся 411
----. суммирование по Фейеру 415 и далее
----, сходимость в точке 409
----, — глобальная 410
----. — равномерная 413, 414
----функции двух переменных 399
Самосопряженный оператор 233, 246—250
Сведение дифференциального уравнения второго порядка к интегральному уравнению 459, 460
Свертка 433
— в li 515
— функций с ограниченным изменением 451
Свойства абсолютно непрерывных функций 343
— измеримых множеств 258 и далее, 272 и далее
----функций 282 и далее
—	интеграла абстрактной функции 486
----Лебега 295 и далее
----Римана — Стилтьеса 363 и далее
—	полной вариации 332—335
•— преобразования Фурье 427—430
— производной Фреше 481, 482
— спектра н резольвенты элемента алгебры 517—519
— счетных множеств 23, 24
— функций с интегрируемым квадратом 381
Свойство параллелограмма 162
Связное двоеточие 85, 94
Связность открытого множества в Rn 65
— топологического пространства 90
Связь между гладкостью функции и убыванием ее преобразования Фурье на бесконечности 429
Сдвиг открытого множества 167
Сепарабельное пространство метрическое 59
---- топологическое 89
Сепарабельность подмножеств сепарабель-иого метрического пространства 158
— пространств Rn,	/2, С 1а, 6]
С2[а, 6] 60
— пространства Li 372
----L2 386
Сжатие (сжимающее отображение) метрического пространства 74
Сильная производная отображения 481 — сходимость в линейном нормированном пространстве 193
— топология в пространстве, сопряженном к линейному топологическому 84
•--------,----нормированному 183
Сильно положительный квадратичный функционал 505
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
530
Сильный дифференциал 481
Симметрическая разность 15
Симметричная банахова алгебра 524
Симметричное множество в линейном пространстве 170
Симплекс 130
Сингулярная функция 347
Сингулярный заряд 352
Система множеств 41
— окрестностей нуля 167
— ортогональных векторов 144
-----функций Радемахера 405
-----Уолша 405
—----Хаара 404, 405
Скалярное произведение 143, 165
— — в комплексном пространстве 165
-----£2 382
Скачок функции в точке разрыва 322
Слабая производная отображения 482
— сходимость в пространстве линейном топологическом 193
--------- нормированном 194
--------- функционалов	198
—--------С[а, Ь] 197
---------/2 196
— топология в пространстве линейном топологическом 193
—--------сопряженном 197, 199
---------. — к банахову 198 и далее
Слабо ограниченное подмножество в нормированном пространстве 194, 195
Слабый дифференциал 482
След системы множеств 86
Случайная величина 360
-----дискретная и непрерывная 361
Собственное значение 234
—	подмножество 13
—	подпространство 122
Совершенно упорядоченное множество 33
Согласованные нормы 170
Соответствие взаимно однозначное 17
Сопряженное пространство 182
— ядро 463
Сопряженно-л инейный изоморфизм 188
— функционал 124
Сопряженно-однородный функционал 124
Сопряженный оператор 231
-----в евклидовом пространстве 233
-----, свойства 231—234
Спектр оператора (точечный и непрерывный) 235
-----в гильбертовом пространстве, компактного 475
— элемента алгебры 516
Спектральная теорема для ограниченных самосопряженных операторов 527
Спектральный раднус 236, 519
-----элемента алгебры 517
Сравнение порядковых чисел 36
— топологий 85, 86
Сравнимые нормы 171
Среднее квадратичное уклонение 383
Степень меры 313
— множества 310
— системы множеств 311
Строение класса множеств, измеримых по
Лебегу 272 и далее
Структура 40
Струна 457—459
Сумма множеств 13
----- упорядоченная 34
— операторов 223
— порядковых чисел 35
— функционалов 182
— элементов векторного пространства 119
Суммируемая функция 293, 294, 306
Суммы Дарбу 307
— Фейера 415
Сходимость в пространстве К 204
-------L\ 376, 387—389
-------La 383, 387—389
-------5оо217
-------Z 454—455
--- среднем 376
------- квадратичном 383
— по мере 288, 388
— последовательности в пространстве метрическом 58
--------- топологическом 90
— — функций, сравнение разных видов 387—389
— почти всюду 286, 388
Счетная аддитивность меры 255, 268, 273
---— Лебега 261
— база 88
— — у вполне ограниченных метрических пространств 106
— компактность 103
Счетно-гильбертово пространство 172
Счетное множество 22, 25
Счетно-компактное топологическое пространство 103
Счетно-нормированное пространство 171
Счетно-предкомпактное множество 105
Счетность множества рациональных чисел 23
— ортогональной системы в сепарабель* ном евклидовом пространстве 147
Счетный базис меры 379
Сюръекция 17
Теорема Арцела 109—111
---обобщенная 114
—	Банаха о замкнутом графике 229
—	— об обратном операторе 225
—	Банаха — Штейнгауза 519
— Бэра 70
— Вейерштрасса 141, 146, 390, 395, 418
—	Вннера 525
—	Гельфанда — Наймарка 528
— Гильберта — Шмндта 246, 247
—	Егорова 287
— Кантора — Бернштейна 28
— Карлесона 411
— Лебега о восстановлении абсолютно непрерывной функции по ее производной 345
------ дифференцируемости монотонной функции 324
------ предельном переходе 302
— Леви 303
— Лузина 291
— Люстерника о касательном многообразии 497
-----------в разложимом случае 498
— о банаховой алгебре, изоморфной полю С 519
---вложенных шарах 69
---выборе счетного подпокрытия в пространствах со счетной базой 90
---выделении подпоследовательности, сходящейся почти всюду, из последовательности, сходящейся по мере 289
---гомеоморфности непрерывной биекции компакта в хаусдорфово пространство 101
— — гомоморфизме банаховой алгебры в алгебру непрерывных функций 523—524 — — дифференцировании интеграла по верхнему пределу 331, 337
<540
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ'
Теорема о дифференцируемости функций с ограниченным изменением 335
----достижении нижией грани полунепрерывной функции 103
----зависимости решения дифференциального уравнения от начальных данных 495
----замкнутости компакта в объемлющем хаусдорфовом пространстве 100
-------множества компактных операторов 241
----компактности замкнутого шара в пространстве, сопряженном сепарабельному нормированному в смысле ‘-слабой топологии 202
-------оператора Гильберта — Шмндта 461
---------, сопряженного компактному 243
------- произведения операторов, одни из которых компактен 243
------- спектра элемента алгебры 517
— — композиции измеримых функций 282, 283
— — метризуемости единичного шара в пространстве, сопряженном сепарабельному нормированному 200
----множителях Лагранжа 506
— — мощности множества всех подмножеств 29
— — наличии счетной базы у сепарабельных метрических пространств 89
----неподвижной точке 75
— — непрерывном образе компактного пространства 101
---- непрерывности композиции непрерывных отображений 93
-•--непустоте спектра 236. 517
----неявной функции, дифференцируемость 494
— — -----, существование 492
----нормальности компакта 100
----пересечении выпуклых множеств 129
-------колец 42
------- топологий 86
---- полной и замкнутой ортонормальных системах 151, 154
— -- — ограниченности счетно-компактного метрического пространства 107
— — полноте произведения полных ортогональных систем 397
------- пространства L\ 376
---------д, 383. 384
---------, сопряженного к нормируемому 183
---- полуаддитивностн меры, заданной на кольце 267
---- пополнении метрического пространства 71
----почленном дифференциповании ряда из монотонных функций 329
-— — предкомпактности ограниченных множеств в Е* в смысле ‘-слабой топологии 202
<---продолжении меры с пппукппьца на
порожденное им кольцо 266. 269
----прообразе пересечения множеств 18
-------суммы множеств 17
----пространстве, сопряженном к гильбертову 187, 188
-------.----счетно-нормированному 189
----прямом произведении полуколец 311
----равенстве норм оператора и его сопряженного 231
----равномерной непрерывности непрерывного отображения метрического компакта 113
.----- разделении выпуклых множеств 180
Теорема о разложении абсолютно непрерывной функции в разность монотонных абсолютно непрерывных функций 343
------- гильбертова пространства в прямую сумму подпространства и его ортогонального дополнения 159
------- заряда 350
------- монотонной функции на функцию скачков и непрерывную 324
-------отображения по формуле Тейлора 491
-------функции с ограниченным изменением в разность монотонных 335
-------------------сумму абсолютно непрерывной, сингулярной и функции скачков 347
----связи выпуклых функционалов н выпуклых множеств 132
----сепарабельности пространства L\ 379
— — слабой сходимости последовательности элементов нормированного пространства 195
-----------функционалов на банаховом
пространстве 198
— — собственных векторах и собственных числах компактного оператора 244 , 246
---- совпадении компактности и счетной компактности для пространств со счетной базой 104
----спектральном радиусе 236, 519
---- спектре ограниченного оператора 235, 236, 519
----сравнении интеграла Римана с интегралом Лебега 307
---------Рнмана — Стилтьеса с интегралом Лебега — Стилтьеса 362
---- сравнимости порядковых чисел 36
---- среднем 363
----строении минимального кольца над полукольцом 45
---- суммируемости производной монотонной функции 340
---- существовании базиса подпространства гильбертова пространства 159
— -----кривой наименьшей длины между
двумя точками метрического компакта 118
—------минимального кольца 42
—------минимальной О-алгебры 46
------- предельной точки у бесконечного подмножества компактного пространства 99
------- сильной производной 484
----сходимости метода Ньютона 509
-------по мере последовательности, сходящейся почти всюду 288
------- ряда Фурье в точке 409
------------равномерной 413. 414
---- счетности множества точек разрыва монотонной Функции 322
— — фактор-алгебре 520
----(j-аддитнвности прямого произведения мео 313
— рб абсолютной непрерывности неопределенного интеграла Лебега 344
----анв ’итн,т«ости резольвенты элемента алгебры 517
---- измеримости предела последовательности измеримых функций 284
----изомот>Фи™<е банаховой алгебры с алгеброй Сд! 524
------- пространств сепарабельпых гильбертовых 156, 166
---------С[а, 6] * и У°[а, 5] 373
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
541
Теорема об обращении оператора, близкого к единичному 230
----— преобразования Фурье 421
-----------функции п переменных 437
----общем виде линейного функционала на пространстве гильбертовом 187, 188, 386
<------------------С‘[а, Ь] 373
— — ограниченности непрерывной функции на компактном пространстве 101
------- снизу функции, полунепрерывной снизу на компактном ^пространстве 103
------- спектра линейного оператора 235
----отделении непересекающихся выпуклых подмножеств в вещественном линейном пространстве 138
----открытом отображении 227
----открытости множества обратимых операторов 230
— — ортогонализации 147, 148
—	- условиях счетной компактности 103
----условном экстремуме 505
отделимости (первая и вторая) 180
—	Пеано J11
—	Планшереля 439, 440
— Радона — Никодима 353
— Рисса об общем виде линейного функционала на Cfa, 369, 372
— Рисса — Фишера* 153
—	Стоуна — Вейерштрасса 525
—	Стоуна — Чеха 527
— Тихонова 527
— Урысона о метризуемости 98
-------продолжении 97
— Фату 305
— Фейера 390, 415
---- для пространства Li 419
— Фубиин 317
----«малая» 329
— Хана — Банаха 134
-------в пространстве комплексном 136
j----------нормированном 179
— Хаусдорфа 40
— Хелли вторая 368
---- первая 366
— Цермело 39
Теоремы Фредгольма для уравнений в пространстве банаховом 472
--------------непрерывных функций 473
---------с ядром вырожденным 465—467
--------------произвольным 468—471
--------------симметрическим 465
Теория множеств 13, 39
— обобщенных Функций 203 и далее
Тождество Гильберта 518
Топологическое пространство 84
---- линейное 167
---- со счетной базой 88
Топология 84
— в	множестве максимальных идеалов	523
— — счетио-нормироваином пространстве 171
— дискретная 85
—, порожденная системой множеств 86
—, способы задания 97
— тривиальная 85
— ядерно-выпуклая 170
Тотальная система векторов 155
Точечный спектр 235
Точка внутренняя 61
— изолированная 58
— неподвижная 75
•— предельная в пространстве метрическом 58
---------топологическом 85
Точка прикосновения в пространстве мет« рическом 57 --------- топологическом 85
Точки невидимые слева 326
---справа 325, 329
— общего положения в линейном пространстве 130
— разрыва монотонной функции 322
---первого рода 322
Точная верхняя нлн нижняя грань 40
Транзитивность 31
Трансфинит 35
— <о 33
— (0i 38
Трансфинитная индукция 40
Трансфнннтное порядковое число 35
Трансцендентное число 27
Тривиальный идеал алгебры 515
Тригонометрическая система на отрезке
[—Л, Л] 390
---------[0, Л] 393
--- — плоскости 399
Тригонометрический ряд Фурье 391
-------в комплексной форме 394
-------для функций п переменных 399
Угол между векторами 144
Умножение в алгебре 513
Упорядоченная сумма 34
Упорядоченное множество 33
—	произведение 35
Уравнение Абеля 456
—	Вольтерра 82
—	— второго рода 457. 472
---первого рода 457
—	колебаний струны 459
— равновесия нагруженной струны 458
— теплопроводности 434, 438
— Фредгольма второго рода 81, 457
---------с симметрическим ядром 463,
464
--- первого рода 457
------- — абстрактное 473
Условие Дини 409, 414
— Липшица 65
Условия сжимаемости 76—78
Условный экстремум 507
Фактор-алгебра 520
Фактор-пространство пространства банахова 142
--- линейного 123
--- нормированного 141
Формула для спектрального радиуса элемента алгебры 519
— конечных приращений для отображения 482, 483
— Ньютона — Лейбница 339
-------обобщенная 487
— обращения для преобразования Фурье 423, 436
—	Родрига 397
—	Тейлора для отображений 491
—	Фурье 421
---комплексная 423
Фундаментальная последовательность точек в метрическом пространстве 66
Функции Лагерра 402
---, полнота 431
—	Эрмита 401
---как собственные Функции преобразования Фурье 442—445
---, полнота 431
542
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Функционал 102, 124
•	— аддитивный 124
—	выпуклый 130
—	дифференцируемый 485
— линейный 124.
---, геометрический смысл 126 н далее
---не непрерывный 175
---непрерывный 174
------на пространстве гильбертовом 187
— --------- нормированном 176
-----------счетно-нормированном 181
----------- С[а, 6] 369
-----------С[д, Ь] 373
—	— — — — Со 186
-----------1,, 1р 187
-----------r" 185
------, примеры 176—178
---ограниченный 175, 176
---, примеры 125, 126
—	Минковского 132
—	мультипликативный 521
—	непрерывный 174
—	однородно-выпуклый 131
---на комплексном пространстве 136
—	однородный 124
—	положительно-однородный 130
—	, разделяющий множества 137, 180
—	сопряженно-линейный 124
—	сопряженно-однородный 124
Функция 16
—	абсолютно непрерывная 342
—	абстрактная 485
—	весовая 400
— Дирихле 286, 308
—	измеримая 282
—	, — по Борелю 282
— монотонно неубывающая (невозрастающая) 321
— непрерывная в пространстве метрическом 55
--------- топологическом 91
— обобщенная 205
—	основная 204
—	простая 292
—	распределения 360
—	с интегрируемым квадратом 381
--------- комплексная 387
—	— ограниченным изменением 332
—	сингулярная 347
— суммируемая 294, 295, 306
—	Финитная 203
—	Хевисайда 209
—	В-измеримая 282
—	м-измеримая 282
—	<5у)-измеримая 282
Характеристическое свойство евклидовых пространств 162
Хаусдорфова аксиома отделимости 95
Хаусдорфовы пространства 95
Центрированная система множеств 99
Цепь в частично упорядоченном множестве 39
Частичная упорядоченность 31
—	~ топологий 86
Число алгебраическое 24
—	производное (верхнее, нижнее, левое правое) 324, 325
—	трансфинитное 35
—	трансцендентное 27
Шар замкнутый 57
—	открытый 56
Шара центр н радиус 57
Эквивалентность множеств 25
—	норм 143, 171
Эквивалентные функции 285, 353
Экстремальные задачи 499 н далее
---с ограничениями 506
Экстремум функционала 500
---, необходимые условия 500, 506
Элементарное множество иа плоскости 25Z-
Эрмитово-сопряженный оператор 233
Ядерно-выпуклая топология 170, 175
Ядро Гильберта — Шмидта 460, 465
—	Дирихле 408
—	интегрального уравнения Фредгольма 81, 460
—	итерированное 477
—	линейного оператора 218
--- функционала 126
— множества в пространстве линейном 128-
---------нормированном 180
— произведения двух интегральных операторов 476—479
—	Фейера 416
В*-алгебра 527
В-измеримая функция 282
В-множества 46
В-пространство 139
С-свойство 291
ft-мерная грань симплекса 130
«-линейное отображение 490
«-мерное пространство арифметическое 120
—	— евклидово 49
«-мерный симплекс 130
n-я производная отображения 488
— степень меры 313
---множества 310
---системы множеств 311
Т\’Пространство 94, 168
Л-пространство 95
б-алгебра 45
б-кольцо 45
—	измеримых множеств 275
б-функция 125, 178, 197, 198, 205, 411
—	, производная 206
—	смещенная 206
е-окрестность 57
8-сеть 106
ц-измеримая функция 282
ц-эквнвалентные функции 353
а-адднтивность интеграла Лебега 298, 302
— меры 255, 257, 261, 268, 273
---Лебега 298, 302
0-алгебра 45
—	измеримых множеств 257—259, 273, 275
—	неприводимая 46
(^кольцо 45
а-конечиая мера 276
t-слабая топология 199
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ
<А 514
Вт 527
В (х0, г) 56
В [х0, г] 57
В(Х2, У) 489
ВС (X, У) 486
Ж(@) 46
С 513
С = С [0, 1] 50
С [а, 6] 50
Ст 514
С1 [а, 6] 373
Сп[а, 6] 173
С2 [а, &] 51
Се Ро1 *1] 495
С°° 168
CBV[0, 1] 527 с 28
DF (х, Л) 482
D (Л), D (s, t; Л) 479
dF, d2F, dnF 491
£*. Е$ 182
(£’, b) 195
(£’, II'll) 183
f: M-> N 17
f(4) 17
Г1(Ь) 17
j-1 (t) 92
F" 488
9S(E, Et) 229
Im 218
J(E) 128
К [a, Z>] 168
Ker 126, 218
Lt, Li (X, pi) 375
T,2, 7,2 (7f, pi) 381
Lp (X, pi) 385
Z (E, Er) 224
L/L' 123
L ({xa}) 123
/i 186, 515
/2 50
lP 54
JT 521
m 51
N (Xn, У) 490 9t(@) 42 Soo 217
S^ 453
Гхо 497
Vba 332
Vo [a, 6] 337
W 515
Z 453
Pi (*, У) 50
Pp (x, У) 54
Poo U. У~) 50
T(E) 86
К 28
«0 28
«1 38 0 13 (J 13 П 14
A 15
\ 15
C 15 ~ 25 q> 19