Оглавление
Предисловие к седьмому изданию
Предисловие к шестому изданию
Предисловие к четвертому изданию
Предисловие к третьему изданию
Из предисловия ко второму изданию
Основные обозначения
ГЛАВА I. ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ
2. Операции над множествами
§ 2. Отображения. Разбиения на классы
2. Разбиение на классы. Отношения эквивалентности
§ 3. Эквивалентность множеств. Понятие мощности множества
2. Счетные множества
3. Эквивалентность множеств
4. Несчетность множества действительных чисел
5. Теорема Кантора-Бернштейна
6. Понятие мощности множества
§ 4. Упорядоченные множества. Трансфинитные числа
2. Отображения, сохраняющие порядок
3. Порядковые типы. Упорядоченные множества
4. Упорядоченная сумма упорядоченных множеств
5. Вполне упорядоченные множества. Трансфинитные числа
6. Сравнение порядковых чисел
7. Аксиома выбора, теорема Цермело и другие эквивалентные им утверждения
8. Трансфинитная индукция
§ 5. Системы множеств
2. Полукольцо множеств
3. Кольцо, порожденное полукольцом
4. σ-алгебры
5. Системы множеств и отображения
ГЛАВА II. МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА
2. Непрерывные отображения метрических пространств. Изометрия
§ 2. Сходимость. Открытые и замкнутые множества
2. Сходимость
3. Плотные подмножества
4. Открытые и замкнутые множества
5. Открытые и замкнутые множества на прямой
§ 3. Полные метрические пространства
2. Теорема о вложенных шарах
3. Теорема Бэра
4. Пополнение пространства
§ 4. Принцип сжимающих отображений и его применения
2. Простейшие применения принципа сжимающих отображений
3. Теоремы существования и единственности для дифференциальных уравнений
4. Применение принципа сжимающих отображений к интегральным уравнениям
§ 5. Топологические пространства
2. Сравнение топологий
3. Определяющие системы окрестностей. База. Аксиомы счетности
4. Сходящиеся последовательности в Т
5. Непрерывные отображения. Гомеоморфизм
6. Аксиомы отделимости
7. Различные способы задания топологии в пространстве. Метризуемость
§ 6. Компактность
2. Непрерывные отображения компактных пространств
3. Непрерывные и полунепрерывные функции на компактных пространствах
4. Счетная компактность
5. Предкомпактные множества
§ 7. Компактность в метрических пространствах
2. Компактность и полная ограниченность
3. Предкомпактные подмножества в метрических пространствах
4. Теорема Арцела
5. Теорема Пеано
6. Равномерная непрерывность. Непрерывные отображения метрических компактов
7. Обобщенная теорема Арцела
§ 8. Непрерывные кривые в метрических пространствах
ГЛАВА III. НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА
2. Линейная зависимость
3. Подпространства
4. Фактор-пространства
5. Линейные функционалы
6. Геометрический смысл линейного функционала
§ 2. Выпуклые множества и выпуклые функционалы. Теорема Хана-Банаха
2. Однородновыпуклые функционалы
3. Функционал Минковского
4. Теорема Хана-Банаха
5. Отделимость выпуклых множеств в линейном пространстве
§ 3. Нормированные пространства
2. Подпространства нормированного пространства
3. Фактор-пространства нормированного пространства
§ 4. Евклидовы пространства
2. Примеры
3. Существование ортогональных базисов, ортогонализация
4. Неравенство Бесселя. Замкнутые ортогональные системы
5. Полные евклидовы пространства. Теорема Рисса-Фишера
6. Гильбертово пространство. Теорема об изоморфизме
7. Подпространства, ортогональные дополнения, прямая сумма
8. Характеристическое свойство евклидовых пространств
9. Комплексные евклидовы пространства
§ 5. Топологические линейные пространства
2. Локальная выпуклость
3. Счетно-нормированные пространства
ГЛАВА IV. ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ
2. Линейные функционалы на нормированных пространствах
3. Теорема Хана-Банаха в нормированном пространстве
4. Линейные функционалы в счетно-нормированном пространстве
§ 2. Сопряженное пространство
2. Сильная топология в сопряженном пространстве
3. Примеры сопряженных пространств
4. Второе  сопряженное пространство
§ 3. Слабая топология и слабая сходимость
2. Слабая сходимость в нормированных пространствах
3. Слабая топология и слабая сходимость в сопряженном пространстве
4. Ограниченные множества в сопряженном пространстве
§ 4. Обобщенные функции
2. Пространство основных функций
3. Обобщенные функции
4. Действия над обобщенными функциями
5. Достаточность запаса основных функций
6. Восстановление функции по производной. Дифференциальные уравнения в классе обобщенных функций
7.  Некоторые обобщения
§ 5. Линейные операторы
2. Непрерывность и ограниченность
3. Сумма и произведение операторов
4. Обратный оператор, обратимость
5. Сопряженные операторы
6. Сопряженный оператор в евклидовом пространстве. Самосопряженные операторы
7. Спектр оператора. Резольвента
§ 6. Компактные операторы
2. Основные свойства компактных операторов
3. Собственные значения компактного оператора
4. Компактные операторы в гильбертовом пространстве
5. Самосопряженные компактные операторы в Н
ГЛАВА V. МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ
2. Лебегова мера плоских множеств
3. Некоторые дополнения и обобщения
§ 2. Общее понятие меры. Продолжение меры с полукольца на кольцо. Аддитивность и σ-аддитивность
2. Продолжение меры с полукольца на порожденное им кольцо
3. σ-аддитивность
§ 3. Лебегово продолжение меры
2. Продолжение меры, заданной на полукольце без единицы
3. Расширение понятия измеримости в случае σ-конечной меры
4. Продолжение меры по Жордану
5. Однозначность продолжения меры
§ 4. Измеримые функции
2. Действия над измеримыми функциями
3. Эквивалентность
4. Сходимость почти всюду
5. Теорема Егорова
6. Сходимость по мере
7. Теорема Лузина. C-свойство
§ 5. Интеграл Лебега
2. Интеграл Лебега для простых функций
3. Общее определение интеграла Лебега на множестве конечной меры
4. σ-аддитивность и абсолютная непрерывность интеграла Лебега
5. Предельный переход под знаком интеграла Лебега
6. Интеграл Лебега по множеству бесконечной меры
7. Сравнение интеграла Лебега с интегралом Римана
§ 6. Прямые произведения систем множеств и мер. Теорема Фубини
2. Произведения мер
3. Выражение плоской меры через интеграл линейной меры сечений и геометрическое определение интеграла Лебега
4. Теорема Фубини
ГЛАВА VI. НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА. ТЕОРИЯ ДИФФЕРЕНЦИРОВАНИЯ
2. Дифференцируемость монотонной функции
3. Производная интеграла по верхнему пределу
§ 2. Функции с ограниченным изменением
§ 3. Производная неопределенного интеграла Лебега
§ 4. Восстановление функции по ее производной. Абсолютно непрерывные функции
§ 5. Интеграл Лебега как функция множества. Теорема Радона-Никодима
2. Основные типы зарядов
3. Абсолютно непрерывные заряды. Теорема Радона-Никодима
§ 6. Интеграл Стилтьеса
2. Интеграл Лебега-Стилтьеса
3. Некоторые применения интеграла Лебега-Стилтьеса в теории вероятностей
4. Интеграл Римана-Стилтьеса
5. Предельный переход под знаком интеграла Стилтьеса
6. Общий вид линейных непрерывных функционалов в пространстве непрерывных функций
ГЛАВА VII. ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ
2. Всюду плотные множества в L1
§ 2. Пространство L2
2. Случай бесконечной меры
3. Всюду плотные множества в L2. Теорема об изоморфизме
4. Комплексное пространство L2
5. Сходимость в среднем квадратичном и ее связь с другими типами сходимости функциональных последовательностей
§ 3. Ортогональные системы функций в L2. Ряды по ортогональным системам
2. Тригонометрические системы на отрезке [0,пи]
3. Ряд Фурье в комплексной форме
4. Многочлены Лежандра
5. Ортогональные системы в произведениях. Кратные ряды Фурье
6. Многочлены, ортогональные относительно данного веса
8. Ортогональные многочлены с дискретным весом
9. Системы Хаара и Радемахера-Уолша
ГЛАВА VIII. ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЯ ФУРЬЕ
2. Условия равномерной сходимости ряда Фурье
§ 2. Теорема Фейера
2. Полнота тригонометрической системы. Теорема Вейерштрасса
3. Теорема Фейера для пространства L1
§ 3. Интеграл Фурье
2. Интеграл Фурье в комплексной форме
§ 4. Преобразование Фурье, свойства и применения
2. Основные свойства преобразования Фурье
3. Полнота функций Эрмита и Лагерра
4. Преобразование  Фурье быстро убывающих бесконечно дифференцируемых функций
5. Преобразование Фурье и свертка функций
6. Применение преобразования Фурье к решению уравнения теплопроводности
7. Преобразование Фурье функций нескольких переменных
1. Теорема Планшереля
2. Функции Эрмита
§ 6. Преобразование Лапласа
§ 7. Преобразование Фурье-Стилтьеса
2. Применения преобразования Фурье-Стилтьеса в теории вероятностей
§ 8. Преобразование Фурье обобщенных функций
ГЛАВА IX. ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ
2. Примеры задач, приводящих к интегральным уравнениям
§ 2. Интегральные уравнения Фредгольма
2. Уравнения с симметрическим ядром
3. Теоремы Фредгольма. Случай вырожденных ядер
4. Теоремы Фредгольма для уравнений с произвольными ядрами
5. Уравнения Вольтерра
6. Интегральные уравнения первого рода
§ 3. Интегральные уравнения, содержащие параметр. Метод Фредгольма
2. Отыскание решения в виде ряда по степеням Л. Детерминанты Фредгольма
ГЛАВА X. ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ
3. Формула конечных приращений
4. Связь между слабой и сильной дифференцируемостью
5. Дифференцируемые функционалы
6. Абстрактные функции
7. Интеграл
8. Производные высших порядков
9. Дифференциалы высших порядков
10. Формула Тейлора
§ 2. Теорема о неявной функции и некоторые ее применения
2. Теорема о зависимости решения дифференциального уравнения от начальных данных
3. Касательные многообразия. Теорема Люстерника
§ 3. Экстремальные задачи
2. Второй дифференциал. Достаточные условия экстремума функционала
3. Экстремальные задачи с ограничениями
§ 4. Метод Ньютона
§ 1. Определение и примеры банаховых алгебр
2. Примеры банаховых алгебр
3. Максимальные идеалы
§ 2. Спектр и резольвента
2. Свойства спектра
3. Теорема о спектральном радиусе
§ 3. Некоторые вспомогательные результаты
2. Три леммы
§ 4. Основные теоремы
2. Топология в множестве М. Основные теоремы
3. Теорема Винера; упражнения
Предметный указатель
Список литературы
Текст
                    УДК 517.5
ББК 22.162
К 60
Колмогоров А. Н., Фомин СВ. Элементы теории функций
и функционального анализа. — 7-е изд. — М.: ФИЗМАТЛИТ, 2004. —
572 с. - ISBN 5-9221-0266-4.
Содержит строгое систематизированное изложение основ функциональ-
функционального анализа и тонких вопросов теории функций действительного перемен-
переменного.
Основой явился курс функционального анализа (вначале «Анализ III»),
читавшийся академиком А. Н. Колмогоровым в течение ряда лет на механи-
механико-математическом факультете МГУ им. М.В. Ломоносова.
6-е изд. — 1989 г.
Для студентов университетов, аспирантов, преподавателей, а также для
научных работников в области математики и в смежных областях.
Ил. 24. Библиогр. 57 назв.
ISBN 5-9221-0266-4	© физматлит, 2004


ОГЛАВЛЕНИЕ Предисловие к седьмому изданию 11 Предисловие к шестому изданию 12 Предисловие к четвертому изданию 13 Предисловие к третьему изданию 14 Из предисловия ко второму изданию 14 Основные обозначения 16 ГЛАВА I ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ § 1. Понятие множества. Операции над множествами 17 1. Основные определения A7). 2. Операции над множества- множествами A7). § 2. Отображения. Разбиения на классы 20 1. Отображение множеств. Общее понятие функции B0). 2. Разбиение на классы. Отношения эквивалентности B3). § 3. Эквивалентность множеств. Понятие мощности множества.... 26 1. Конечные и бесконечные множества B6). 2. Счетные мно- множества B7). 3. Эквивалентность множеств B9). 4. Несчет- Несчетность множества действительных чисел C1). 5. Теорема Кан- тора-Бернштейна C2). 6. Понятие мощности множества C3). § 4. Упорядоченные множества. Трансфинитные числа 36 1. Частично упорядоченные множества C6). 2. Отображения, сохраняющие порядок C7). 3. Порядковые типы. Упорядо- Упорядоченные множества C8). 4. Упорядоченная сумма упорядо- упорядоченных множеств C9). 5. Вполне упорядоченные множества. Трансфинитные числа D0). 6. Сравнение порядковых чи- чисел D2). 7. Аксиома выбора, теорема Цермело и другие экви- эквивалентные им утверждения D4). 8. Трансфинитная индук- индукция D6). § 5. Системы множеств 47 1. Кольцо множеств D7). 2. Полукольцо множеств D9). 3. Кольцо, порожденное полукольцом E0). 4. сг-алгебры E1). 5. Системы множеств и отображения E3).
Оглавление ГЛАВА II МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА Понятие метрического пространства 54 1. Определение и основные примеры E4). 2. Непрерывные отображения метрических пространств. Изометрия F1). Сходимость. Открытые и замкнутые множества 63 1. Предельные точки. Замыкание F3). 2. Сходимость F4). 3. Плотные подмножества F5). 4. Открытые и замкнутые множества F6). 5. Открытые и замкнутые множества на пря- прямой F9). Полные метрические пространства 73 1. Определение и примеры полных метрических прост- пространств G3). 2. Теорема о вложенных шарах G6). 3. Теорема Бэра G7). 4. Пополнение пространства G8). Принцип сжимающих отображений и его применения 81 1. Принцип сжимающих отображений (81). 2. Простейшие применения принципа сжимающих отображений (83). 3. Тео- Теоремы существования и единственности для дифференциаль- дифференциальных уравнений (86). 4. Применение принципа сжимающих отображений к интегральным уравнениям Топологические пространства 91 1. Определение и примеры топологических пространств (91). 2. Сравнение топологий (93). 3. Определяющие системы ок- окрестностей. База. Аксиомы счетности (94). 4. Сходящиеся по- последовательности в Т (98). 5. Непрерывные отображения. Го- Гомеоморфизм (99). 6. Аксиомы отделимости A02). 7. Газлич- ные способы задания топологии в пространстве. Метризуе- Метризуемость A05). Компактность 107 1. Понятие компактности A07). 2. Непрерывные отображе- отображения компактных пространств A09). 3. Непрерывные и по- полунепрерывные функции на компактных пространствах A10). 4. Счетная компактность A12). 5. Предкомпактные множе- множества A15). Компактность в метрических пространствах 115 1. Полная ограниченность A15). 2. Компактность и полная ограниченность A17). 3. Предкомпактные подмножества в метрических пространствах A19). 4. Теорема Арцела A19). 5. Теорема Пеано A21). 6. Гавномерная непрерывность. Не- Непрерывные отображения метрических компактов A23). 7. Об- Обобщенная теорема Арцела A24). Непрерывные кривые в метрических пространствах 125
Оглавление ГЛАВА III НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА 1. Линейные пространства 130 1. Основные определения и примеры линейных прост- пространств A30). 2. Линейная зависимость A32). 3. Подпрост- Подпространства A33). 4. Фактор-пространства A34). 5. Линейные функционалы A35). 6. Геометрический смысл линейного функционала A37). 2. Выпуклые множества и выпуклые функционалы. Теорема Хана-Банаха 139 1. Выпуклые множества и выпуклые тела A39). 2. Однород- Однородно-выпуклые функционалы A42). 3. Функционал Минковско- го A43). 4. Теорема Хана-Банаха A45). 5. Отделимость вы- выпуклых множеств в линейном пространстве A48). 3. Нормированные пространства 150 1. Определение и примеры нормированных пространств A50). 2. Подпространства нормированного пространства A52). 3. Фактор-пространства нормированного пространства A53). 4. Евклидовы пространства 155 1. Определение евклидовых пространств A55). 2. Приме- Примеры A57). 3. Существование ортогональных базисов, ортого- нализация A59). 4. Неравенство Бесселя. Замкнутые ортого- ортогональные системы A61). 5. Полные евклидовы пространства. Теорема Рисса-Фишера A65). 6. Гильбертово пространство. Теорема об изоморфизме A67). 7. Подпространства, ортого- ортогональные дополнения, прямая сумма A70). 8. Характеристи- Характеристическое свойство евклидовых пространств A74). 9. Комплекс- Комплексные евклидовы пространства A77). 5. Топологические линейные пространства 179 1. Определение и примеры A79). 2. Локальная выпук- выпуклость A82). 3. Счетно-нормированные пространства A83). ГЛАВА IV ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ 1. Непрерывные линейные функционалы 188 1. Непрерывные линейные функционалы в топологических ли- линейных пространствах A88). 2. Линейные функционалы на нормированных пространствах A89). 3. Теорема Хана-Бана- Хана-Банаха в нормированном пространстве A92). 4. Линейные функ- функционалы в счетно-нормированном пространстве A95). 2. Сопряженное пространство 196 1. Определение сопряженного пространства A96). 2. Сильная топология в сопряженном пространстве A97). 3. Примеры со-
Оглавление пряженных пространств A99). 4. Второе сопряженное про- пространство B05). Слабая топология и слабая сходимость 207 1. Слабая топология и слабая сходимость в линейном тополо- топологическом пространстве B07). 2. Слабая сходимость в норми- нормированных пространствах B08). 3. Слабая топология и слабая сходимость в сопряженном пространстве B12). 4. Ограничен- Ограниченные множества в сопряженном пространстве B14). Обобщенные функции 218 1. Расширение понятия функции B18). 2. Пространство основных функций B19). 3. Обобщенные функции B21). 4. Действия над обобщенными функциями B22). 5. Достаточ- Достаточность запаса основных функций B25). 6. Восстановление функции по производной. Дифференциальные уравнения в классе обобщенных функций B26). 7. Некоторые обобще- обобщения B29). Линейные операторы 233 1. Определение и примеры линейных операторов B33). 2. Непрерывность и ограниченность B37). 3. Сумма и про- произведение операторов B39). 4. Обратный оператор, обрати- обратимость B40). 5. Сопряженные операторы B46). 6. Сопряжен- Сопряженный оператор в евклидовом пространстве. Самосопряженные операторы B48). 7. Спектр оператора. Резольвента B50). Компактные операторы 253 1. Определение и примеры компактных операторов B53). 2. Основные свойства компактных операторов B58). 3. Собст- Собственные значения компактного оператора B60). 4. Компакт- Компактные операторы в гильбертовом пространстве B62). 5. Само- Самосопряженные компактные операторы в Н B62). ГЛАВА V МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ Мера плоских множеств 267 1. Мера элементарных множеств B67). 2. Лебегова мера плоских множеств B71). 3. Некоторые дополнения и обобще- обобщения B78). Общее понятие меры. Продолжение меры с полукольца на кольцо. Аддитивность и сг-аддитивность 281 1. Определение меры B81). 2. Продолжение меры с полуколь- полукольца на порожденное им кольцо B82). 3. сг-аддитивность B84). Лебегово продолжение меры 287 1. Лебегово продолжение меры, определенной на полукольце с единицей B88). 2. Продолжение меры, заданной на полу- полукольце без единицы B91). 3. Расширение понятия измеримо- измеримости в случае сг-конечной меры B93). 4. Продолжение меры по Жордану B96). 5. Однозначность продолжения меры B98).
Оглавление 4. Измеримые функции 299 1. Определение и основные свойства измеримых функций C00). 2. Действия над измеримыми функциями C01). 3. Эквива- Эквивалентность C03). 4. Сходимость почти всюду C04). 5. Тео- Теорема Егорова C05). 6. Сходимость по мере C07). 7. Теорема Лузина. С-свойство C09). 5. Интеграл Лебега 310 1. Простые функции C11). 2. Интеграл Лебега для простых функций C11). 3. Общее определение интеграла Лебега на множестве конечной меры C14). 4. сг-аддитивность и абсо- абсолютная непрерывность интеграла Лебега C16). 5. Предель- Предельный переход под знаком интеграла Лебега C21). 6. Интеграл Лебега по множеству бесконечной меры C24). 7. Сравнение интеграла Лебега с интегралом Римана C26). 6. Прямые произведения систем множеств и мер. Теорема Фубини 328 1. Произведение систем множеств C28). 2. Произведения мер C30). 3. Выражение плоской меры через интеграл ли- линейной меры сечений и геометрическое определение интеграла Лебега C32). 4. Теорема Фубини C35). ГЛАВА VI НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА. ТЕОРИЯ ДИФФЕРЕНЦИРОВАНИЯ 1. Монотонные функции. Дифференцируемость интеграла по верхнему пределу 340 1. Основные свойства монотонных функций C40). 2. Диф- Дифференцируемость монотонной функции C43). 3. Производная интеграла по верхнему пределу C50). 2. Функции с ограниченным изменением 351 3. Производная неопределенного интеграла Лебега 356 4. Восстановление функции по ее производной. Абсолютно непре- непрерывные функции 358 5. Интеграл Лебега как функция множества. Теорема Радона- Никодима 368 1. Заряды. Разложение Хана и разложение Жордана C68). 2. Основные типы зарядов C71). 3. Абсолютно непрерывные заряды. Теорема Радона-Никодима C72). 6. Интеграл Стилтьеса 375 1. Меры Стилтьеса C75). 2. Интеграл Лебега-Стилтьеса C77). 3. Некоторые применения интеграла Лебега-Стилтьеса в тео- теории вероятностей C79). 4. Интеграл Римана-Стилтьеса C81). 5. Предельный переход под знаком интеграла Стилтьеса C84). 6. Общий вид линейных непрерывных функционалов в про- пространстве непрерывных функций C88).
Оглавление ГЛАВА VII ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ 1. Пространство L\ 393 1. Определение и основные свойства пространства L\ C93). 2. Всюду плотные множества в L\ C95). 2. Пространство L2 398 1. Определение и основные свойства C99). 2. Случай беско- бесконечной меры D02). 3. Всюду плотные множества в L2. Те- Теорема об изоморфизме D04). 4. Комплексное пространство L2 D05). 5. Сходимость в среднем квадратичном и ее связь с другими типами сходимости функциональных последова- последовательностей D06). 3. Ортогональные системы функций в L2. Ряды по ортогональ- ортогональным системам 408 1. Тригонометрическая система. Тригонометрический ряд Фурье D08). 2. Тригонометрические системы на отрезке [О,тг] D11). 3. Ряд Фурье в комплексной форме D12). 4. Мно- Многочлены Лежандра D13). 5. Ортогональные системы в произ- произведениях. Кратные ряды Фурье D15). 6. Многочлены, ортого- ортогональные относительно данного веса D17). 7. Ортогональный базис в пространствах L2(—oo,oo) и L2@,oo) D18). 8. Орто- Ортогональные многочлены с дискретным весом D20). 9. Системы Хаара и Радемахера-Уолша D22). ГЛАВА VIII ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЯ ФУРЬЕ 1. Условия сходимости ряда Фурье 425 1. Достаточные условия сходимости ряда Фурье в точке D25). 2. Условия равномерной сходимости ряда Фурье D31). 2. Теорема Фейера 433 1. Теорема Фейера D33). 2. Полнота тригонометрической си- системы. Теорема Вейерштрасса D36). 3. Теорема Фейера для пространства L\ D37). 3. Интеграл Фурье 437 1. Основная теорема D37). 2. Интеграл Фурье в комплексной форме D40). 4. Преобразование Фурье, свойства и применения 440 1. Преобразования Фурье и формула обращения D40). 2. Ос- Основные свойства преобразования Фурье D44). 3. Полнота функций Эрмита и Лагерра D47). 4. Преобразование Фу- Фурье быстро убывающих бесконечно дифференцируемых функ- функций D48). 5. Преобразование Фурье и свертка функций D49). 6. Применение преобразования Фурье к решению уравнения теплопроводности D50). 7. Преобразование Фурье функций нескольких переменных D52).
Оглавление 5. Преобразование Фурье в пространстве L2(—oo, оо) 454 1. Теорема Планшереля D55). 2. Функции Эрмита D58). 6. Преобразование Лапласа 461 1. Определение и основные свойства преобразования Лапла- Лапласа D61). 2. Применение преобразования Лапласа к решению дифференциальных уравнений (операторный метод) D63). 7. Преобразование Фурье-Стилтьеса 464 1. Определение преобразования Фурье-Стилтьеса D65). 2. Применения преобразования Фурье—Стилтьеса в теории вероятностей D66). 8. Преобразование Фурье обобщенных функций 468 ГЛАВА IX ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ 1. Основные определения. Некоторые задачи, приводящие к ин- интегральным уравнениям 472 1. Типы интегральных уравнений D72). 2. Примеры задач, приводящих к интегральным уравнениям D73). 2. Интегральные уравнения Фредгольма 476 1. Интегральный оператор Фредгольма D76). 2. Уравнения с симметрическим ядром D80). 3. Теоремы Фредгольма. Слу- Случай вырожденных ядер D81). 4. Теоремы Фредгольма для уравнений с произвольными ядрами D83). 5. Уравнения Воль- терра D88). 6. Интегральные уравнения первого рода D89). 3. Интегральные уравнения, содержащие параметр. Метод Фред- Фредгольма 490 1. Спектр компактного оператора в Н D90). 2. Отыскание ре- решения в виде ряда по степеням Л. Детерминанты Фредголь- Фредгольма D91). ГЛАВА X ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ 1. Дифференцирование в линейных пространствах 496 1. Сильный дифференциал (дифференциал Фреше) D96). 2. Слабый дифференциал (дифференциал Гато) D98). 3. Фор- Формула конечных приращений D98). 4. Связь между слабой и сильной дифференцируемостью D99). 5. Дифференцируемые функционалы E01). 6. Абстрактные функции E01). 7. Ин- Интеграл E01). 8. Производные высших порядков E04). 9. Диф- Дифференциалы высших порядков E07). 10. Формула Тейло- Тейлора E07).
10 Оглавление § 2. Теорема о неявной функции и некоторые ее применения 508 1. Теорема о неявной функции E08). 2. Теорема о зависимо- зависимости решения дифференциального уравнения от начальных дан- данных E11). 3. Касательные многообразия. Теорема Люстерни- ка E13). § 3. Экстремальные задачи 516 1. Необходимые условия экстремума E16). 2. Второй диф- дифференциал. Достаточные условия экстремума функциона- функционала E20). 3. Экстремальные задачи с ограничениями E22). § 4. Метод Ньютона 524 ДОПОЛНЕНИЕ БАНАХОВЫ АЛГЕБРЫ (В. М. ТИХОМИРОВ) § 1. Определение и примеры банаховых алгебр 529 1. Банаховы алгебры, изоморфизмы банаховых алгебр E29). 2. Примеры банаховых алгебр E30). 3. Максимальные идеа- идеалы E32). § 2. Спектр и резольвента 533 1. Определения и примеры E33). 2. Свойства спектра E34). 3. Теорема о спектральном радиусе E36). § 3. Некоторые вспомогательные результаты 537 1. Теорема о фактор-алгебре E37). 2. Три леммы E38). § 4. Основные теоремы 539 1. Линейные непрерывные мультипликативные функционалы и максимальные идеалы E39). 2. Топология в множестве М. Основные теоремы E41). 3. Теорема Винера; упражне- упражнения E44). Предметный указатель 548 Список литературы 548
ПРЕДИСЛОВИЕ К СЕДЬМОМУ ИЗДАНИЮ Читатель держит сейчас в руках седьмое издание книги, которая в те- течение почти полувека служит делу математического образования не толь- только у нас, но и во многих других странах. Хочется еще раз сказать о замечательном творческом союзе двух авто- авторов этой книги. Общий замысел синтетического курса, материал которого был рассеян по многим курсам, читавшимся на механико-математическом ф-те МГУ им. М. В. Ломоносова, принадлежал Андрею Николаевичу Колмогорову. Он разработал программу новой дисциплины (названной «Анализом III»), включив в нее элементы теории множеств, метрических и нормированных пространств, теории меры и интеграла Лебега и линей- линейных операторов в банаховых и гильбертовых пространствах. А. Н. Колмо- Колмогоров несколько раз читал лекции по этой программе и задумал написать по нему учебник. Первый вариант книги, вышедшей в двух выпусках 1954 и 1960 годов в издательстве МГУ, был написан в тесном творческом со- сотрудничестве А. Н. Колмогорова и С. В. Фомина, читавшего в те годы курс функционального анализа на физическом факультете. СВ. Фомин считал А.Н. Колмогорова одним из своих учителей; Ан- Андрей Николаевич высоко ценил Сергея Васильевича как ученого, педагога и человека. Их сотрудничество оказалось исключительно плодотворным. В предисловии к первому выпуску книги, написанном в 1954 г., авторы писали, что «в следующих выпусках должны найти место теория меры и интеграл Лебега, гильбертово пространство, теория интегральных урав- уравнений с симметрическим ядром и ортогональных систем функций (эта часть программы была выполнена уже во втором выпуске), элементы не- нелинейного функционального анализа и некоторые применения методов функционального анализа к вопросам вычислительной математики». После выхода первого издания Сергей Васильевич Фомин в течение пятнадцати лет работал над усовершенствованием учебника: значитель- значительно расширил материал, включенный в первое издание; дополнил теорию метрических пространств элементами общей топологии, теорию норми- нормированных пространств — элементами теории линейных топологических пространств, теорию интегрирования — теорией дифференцирования, те- теорию ортогональных систем функций — теорией тригонометрических ря- рядов и преобразованием Фурье. По его просьбе мною было написано «До- «Дополнение. Банаховы алгебры». Сергей Васильевич написал главу, посвя- посвященную нелинейному анализу, и продолжал работать над ней, желая ее значительно расширить, но смерть не дала ему возможности завершить задуманное до конца. К большому сожалению, остался неосуществлен- неосуществленным и замысел включить в книгу «некоторые применения методов функ- функционального анализа к вопросам вычислительной математики».
12 Предисловие к шестому изданию В этом издании исправлены некоторые опечатки, и ссылки на страни- страницы заменены ссылками на соответствующие главу, параграф, пункт (это позволит при последующих переизданиях избежать многих неточностей). В этом году исполняется 50 лет со дня выхода первого выпуска кни- книги Андрея Николаевича Колмогорова и Сергея Васильевича Фомина «Элементы теории функций и функционального анализа». Несомненно, что книга, седьмое издание которой предлагается читателю, — один из лучших учебников, написанных профессорами Московского университета за всю двухсотпятидесятилетнюю историю нашего университета. Москва, 2004 г. В. М. Тихомиров ПРЕДИСЛОВИЕ К ШЕСТОМУ ИЗДАНИЮ Это издание выходит после смерти Андрея Николаевича Колмогоро- Колмогорова. Он был инициатором создания в рамках университетского образова- образования курса теории функций и функционального анализа, получившего бо- более короткое название «Анализ III». Андрей Николаевич разработал про- программу, был первым лектором этого курса на механико-математическом факультете МГУ A946/47 гг.), а при повторном чтении A952/53 гг.) заду- задумал написать учебник. Для этой цели А. Н. Колмогоров привлек Сергея Васильевича Фомина (читавшего аналогичный курс на физическом фа- факультете), научные, педагогические и человеческие качества которого он очень высоко ценил. Так образовался авторский коллектив, создавший замечательную книгу, по которой на протяжении почти тридцати пяти лет ведется преподавание курса «Анализ III» в большинстве наших уни- университетов. Первое издание учебника вышло отдельными выпусками — в 1954 и 1960 годах в издательстве МГУ. Считаю необходимым сказать здесь о большой роли, которую сыграли в судьбе того издания A954 г.) Т.Д. Вентцель и О. С. Кулагина. Они вели подробный конспект лекций Андрея Николаевича, потом авторы доверили им (тогда еще студентам) роль редакторов издания, и они исполняли ее с высоким чувством ответ- ответственности. В замысле курса «Анализ III» отразились разнообразные общие педа- педагогические идеи А. Н. Колмогорова. Прежде всего — о единстве абстракт- абстрактной и прикладной математики, о необходимости (как сказано в преди- предисловии ко второму изданию) «приучить студентов к двойному зрению: с одной стороны, следить за внутренней логикой теории множеств, общей теории непрерывных отображений метрических и топологических про- пространств, линейных пространств и функционалов и операторов на них, чистой теории меры и интегрирования в общих «пространствах с мерой», с другой — не упускать из виду обслуживаемую этими более абстрактны- абстрактными областями математики проблематику классического и даже приклад- прикладного анализа».
Предисловие к четвертому изданию 13 Далее, А. Н. Колмогоров всегда пропагандировал мысль о необходимо- необходимости «синтетических» курсов, идею образования, как бы напоминающего движение по спирали, где обучающийся со все более и более высокого уровня обозревает весь пройденный путь. В этом учебнике осуществляет- осуществляется синтез идей, с которыми уже на начальном этапе образования студенту приходилось сталкиваться в курсах классического анализа («Анализ I»), алгебры, геометрии и дифференциальных уравнений («Анализ II»). Сам же курс «Анализ III» объединил материал, ранее входивший на мехмате в курсы теории функций действительного переменного, функционального анализа, интегральных уравнений, вариационного исчисления и др. Ан- Андрей Николаевич считал, что университетские учебники должны быть написаны просто и доступно, с привлечением большого числа примеров, которые служили бы мотивировкой для развития абстрактной теории. Так и написана эта книга. Сначала учебник был очень кратким (и это соответствовало первона- первоначальному замыслу А. Н. Колмогорова), но затем авторы решили значи- значительно расширить материал книги с тем, чтобы преподаватели различных университетов могли отбирать для себя то, что им более всего подходит. Это расширение было, в основном, осуществлено СВ. Фоминым при вто- втором, третьем и четвертом изданиях. По просьбе авторов тогда мною было написано «Дополнение», посвященное банаховым алгебрам. И здесь снова хочется сказать о большой помощи авторам в тот период работы над кни- книгой ее редакторов — Д. П. Желобенко A960 г.), Ф. В. Широкова A972 г. — третье издание) и В. М. Алексеева A976 г. — четвертое издание). Смерть СВ. Фомина прервала его работу над книгой, многие замыслы (в основ- основном связанные с переработкой десятой главы) остались нереализован- нереализованными. С пятого издания существенных изменений не вносилось. В этом издании несколько модифицирован список литературы. Учебник А. Н. Колмогорова и С. В. Фомина переиздавался в издатель- издательстве «Наука» в 1968, 1972, 1976 и 1981 годах. Он был переведен на многие иностранные языки: выдержал два издания на английском и японском языках, был издан в ГДР, ЧССР и ВНР, переведен на французский и ис- испанский языки; в 1988 г. вышел в издательстве «Мир» на языке дари. Уверен, что еще долгое время книга А. Н. Колмогорова и С. В. Фомина будет нужна новым поколениям математиков. В. М. Тихомиров ПРЕДИСЛОВИЕ К ЧЕТВЕРТОМУ ИЗДАНИЮ Это издание выходит уже после смерти Сергея Васильевича Фомина. Он успел, однако, проделать всю основную работу по усовершенствова- усовершенствованию книги. Существенно переработана десятая глава. В ней добавлен па- параграф, посвященный теореме о неявной функции, и изменен параграф «Экстремальные задачи». Эти изменения повлекли за собой необходи-
14 Из предисловия ко второму изданию мость изменений в четвертой главе (следствия из теоремы Хана—Банаха и теоремы Банаха об обратном операторе). Текст книги был просмотрен В. М. Алексеевым и В. М. Тихомировым, которым я выражаю искреннюю благодарность. А. Колмогоров ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ При подготовке нового издания мы сохранили общий план книги и по- постарались не увеличивать ее объем. Вместе с тем весь текст книги был заново просмотрен и отредактирован. Большую помощь в этой работе нам оказал Ф. В. Широков. В главах I и IV сделаны некоторые перестановки и изменения, облегчающие, на наш взгляд, переход от более простых по- понятий к более сложным (например, от банаховых пространств к более общим в гл. IV). Довольно существенно переработано изложение теории меры (гл. V). В последние годы в курс «Анализ III» часто включаются элементы теории банаховых алгебр и спектрального анализа. Поэтому мы сочли целесообразным включить в нашу книгу написанное В. М. Тихомировым дополнение, посвященное этим вопросам. А. Колмогоров С. Фомин ИЗ ПРЕДИСЛОВИЯ КО ВТОРОМУ ИЗДАНИЮ Первое издание «Элементов теории функций и функционального ана- анализа» вышло двумя отдельными выпусками в 1954 и 1960 годах. Появле- Появление этих выпусков было связано с включением в конце 40-х годов в про- программу механико-математического факультета МГУ курса «Анализ III», объединявшего элементы теории меры и теории функций, интегральные уравнения, сведения из функционального анализа, а позже и вариацион- вариационное исчисление. Этот курс, читавшийся в МГУ сперва А. Н. Колмогоро- Колмогоровым, а потом и другими лекторами, в том числе СВ. Фоминым, вошел в дальнейшем в программы и других университетов. В свое время замена в МГУ отдельных курсов теории функций дей- действительного переменного, интегральных уравнений и вариационного ис- исчисления единым курсом «Анализ III» вызвала большие споры. Перед курсом была поставлена задача приучить студентов к двойному зрению: с одной стороны, следить за внутренней логикой развития теории мно- множеств, общей теории непрерывных отображений метрических и топологи- топологических пространств, линейных пространств и функционалов и операторов на них, чистой теории меры и интегрирования в общих «пространствах
Из предисловия ко второму изданию 15 с мерой», с другой — не упускать из виду обслуживаемую этими более аб- абстрактными областями математики проблематику классического и даже прикладного анализа. При решении этой задачи мы в планировке книги отдаем предпочте- предпочтение абстрактной линии построения курса. От общей теории множеств (глава I) можно перейти к метрическим и топологическим пространствам и их непрерывным отображениям (глава II) либо непосредственно к про- пространствам с мерой (без топологии) и интегрированию в них (глава V). В главах III и IV изучаются линейные пространства и линейные функци- функционалы и операторы в них. От этих глав возможен прямой переход к главе X (нелинейные дифференцируемые операторы и функционалы). В гла- главе VII изучаются линейные пространства суммируемых функций. Лишь в главах VI и VIII внимание, по существу, сосредоточено на функциях действительного переменного. Хотя в первую очередь в нашей книге излагаются общие понятия тео- теории функций и функционального анализа, внимание к примыкающей сю- сюда классической проблематике читатель может проследить почти во всех главах. Включение в книгу глав VI (теория дифференцирования), VIII (тригонометрические ряды и интеграл Фурье) и IX (линейные интеграль- интегральные уравнения) приводит к тому, что сейчас наша книга охватывает всю программу принятого в МГУ курса «Анализ III», кроме вариационного исчисления. Мы не включили этот раздел в нашу книгу, ограничившись лишь изложением в главе X самых первых представлений о нелинейном функциональном анализе. В новом издании, как и в первоначальном, значительное место зани- занимает общая теория меры. В последнее время появилось довольно много изложений теории интегрирования, основанной на схеме Даниеля, не ис- использующей аппарата теории меры. Мы полагаем, однако, что теория меры достаточно важна и сама по себе, независимо от введения понятия интеграла, и заслуживает включения в университетский курс. Включение новых глав заметно увеличило объем книги. Старые гла- главы тоже существенно переработаны и в них включены новые параграфы (например, о порядковых типах и трансфинитных числах, топологиче- топологических пространствах, обобщенных функциях и др.). Перерабатывая нашу книгу и включая в нее новые разделы, мы ста- старались, однако, сохранить в ней тот сравнительно элементарный стиль изложения, который был выдержан, как нам кажется, в первом издании. Мы надеемся, что она найдет свое естественное место в университетском преподавании наряду с другими руководствами, в частности, с книгой Г. Е. Шилова «Математический анализ, специальный курс», в которой более подчеркнута аналитическая сторона дела, а интерес к метрическим и топологическим пространствам, мерам и т. д. как самостоятельным объ- объектам культивируется в меньшей степени. А. Колмогоров С. Фомин
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ ~L Li,Li(X,^K93 ш \м L2,L2(X,/,K99 С S9 j1 2°°' 532 С = C[0; 1] 56 2 °? [,] С" [a, 4 186 C2[a,6] 57 ] J 181 7*o 514 [0,1] 546 Va 351 с 34 У°[а,6]356 DF(x,h)m W 531 D(A), D(s,t;\) 495 Z 470 c/F, d2F, dnF 507 Pi(x,y) 56 ?7*, ?;# 196 Рр(ж,2/) 58 (?7*,Ь) 199 Poo(x,y) 56 (?7*, ||- ||) 197 r(Q5) 94 / : M -+ N 21 К 34 /(A) 21 Ко 34 /->) 21 Ni 44 /-^r) 100 U 18 F/; 504 П 18 ??(?,?iJ45 Л 19 Im 234 \ 19 J(E) 140 С 19 K[a,b] 181 - 29 Ker 234 <p 24
ГЛАВА I ЭЛЕМЕНТЫ ТЕОРИИ МНОЖЕСТВ § 1. Понятие множества. Операции над множествами 1. Основные определения. В математике встречаются самые разнообразные множества. Можно говорить о множестве граней многогранника, точек на прямой, множестве натуральных чисел и т.д. Понятие множества настолько общее, что трудно дать ему какое-либо определение, которое не сводилось бы просто к замене слова «множество» его синонимами: совокупность, собрание элемен- элементов и т. п. Роль, которую понятие множества играет в современной матема- математике, определяется не только тем, что сама теория множеств стала в настоящее время весьма обширной и содержательной дисципли- дисциплиной, но главным образом тем влиянием, которое теория множеств, возникшая в конце прошлого столетия, оказывала и оказывает на всю математику в целом. Не ставя своей задачей сколько-нибудь полное изложение этой теории, мы здесь лишь введем основные обо- обозначения и приведем первоначальные теоретико-множественные по- понятия, используемые в дальнейшем. Множества мы будем обозначать прописными буквами А, В,..., а их элементы — малыми а, 6,... Утверждение «элемент а принад- принадлежит множеству А» символически записывается так: a Е А (или А Э а)] запись а ^ А (или A jf а) означает, что элемент а не принад- принадлежит А. Если все элементы, из которых состоит А, входят и в В (причем случай А = В не исключается), то мы называем А подмно- подмножеством множества В и пишем А С В. Например, целые числа образуют подмножество в множестве всех действительных чисел. Иногда мы не знаем заранее, содержит ли некое множество (на- (например, множество корней данного уравнения) хотя бы один эле- элемент. Поэтому целесообразно ввести понятие пустого множества, т. е. множества, не содержащего ни одного элемента. Мы будем обо- обозначать его символом 0. Любое множество содержит 0 в каче- качестве подмножества. Подмножества некоторого множества, отличные от него самого и от 0, называются собственными.
18 Гл. I. Элементы теории множеств 2. Операции над множествами. Пусть Аи В — произвольные множества; их суммой, или объединением С = A U В называется множество, состоящее из всех элементов, принадлежащих хотя бы одному из множеств Аи В (рис. 1). C=A\JB С=АГ\В Рис. 1 Рис. 2 Аналогично определяется сумма любого (конечного или бес- бесконечного) числа множеств: если Аа — произвольные множества, то их сумма (J Аа есть совокупность элементов, каждый из которых а принадлежит хотя бы одному из множеств Аа. Назовем пересечением С = АпВ множеств Аи В множество, со- состоящее из всех элементов, принадлежащих как А, так и В (рис. 2). Например, пересечение множества всех четных чисел и множества всех чисел, делящихся на три, состоит из всех целых чисел, деля- делящихся без остатка на шесть. Пересечением любого (конечного или бесконечного) числа множеств Аа называется совокупность f]Aa элементов, принадлежащих каждому из множеств Аа. а Операции сложения и пересечения множеств по самому своему определению коммутативны и ассоциативны, т. е. A U В = В U A, (A U В) U С = A U (В U С), АПВ = ВПА, (АП В) ПС = АП (В ПС). Кроме того, они взаимно дистрибутивны: (AU В) П С = (АП С) U (В П С), A) (АП В) U С = (AU С) П (В U С). B) Действительно, проверим, например, первое из этих равенств1). Пусть элемент х принадлежит множеству, стоящему в левой части 1) Равенство двух множеств А = В понимается как тождественное равенство, т. е. оно означает, что каждый элемент множества А принадлежит В, и наоборот. Иначе говоря, равенство А = В равносильно тому, что выполнены оба включе- включения: А С В и В С А.
§ 1. Мноэюества. Операции над мноэюествами 19 равенства A), т. е. х Е (A U В) П С. Это означает, что х входит в С и, кроме того, по крайней мере в одно из множеств А или В. Но тогда х принадлежит хотя бы одному из множеств А П С или В П С, т. е. входит в правую часть рассматриваемого равенства. Обратно, пусть х е (АпС)и(ВП С). Тогда х Е А П С или ж Е Б П С. Следо- Следовательно, х Е G и, кроме того, ж входит в А или В, т.е. ж Е A U 5. Таким образом, ж G (Аи??)ПС. Равенство A) доказано. Аналогично проверяется равенство B). С=А\В С=ААВ Рис. 3 Рис. 4 Определим для множеств операцию вычитания. Назовем раз- разностью С = А\ В множеств А и В совокупность тех элементов из А, которые не содержатся в В (рис. 3). При этом, вообще говоря, не предполагается, что A D В. Вместо А \ В иногда пишут А — В. Иногда (например, в теории меры) удобно рассматривать так на- называемую симметрическую разность двух множеств А и В, ко- которая определяется как сумма разностей А \ В и В \ А (рис. 4). Симметрическую разность С множеств Аи В мы будем обозначать символом А Л В. Таким образом, по определению, AAB = (A\B)U(B\A). Упражнение. Показать, что ААВ = (АиВ)\(АПВ). Часто приходится рассматривать тот или иной запас множеств, являющихся подмножествами некоторого основного множества 5, например, различные множества точек на числовой прямой. В этом случае разность S \ А называют дополнением множества А и обо- обозначают С А или А'. В теории множеств и ее приложениях весьма важную роль играет так называемый принцип двойственности, который основан на следующих двух соотношениях:
20 Гл. I. Элементы теории множеств 1. Дополнение суммы равно пересечению дополнений: S\\JAa = f](S\Aa). C) а а 2. Дополнение пересечения равно сумме дополнений: Aa = [j(S\Aa). D) Принцип двойственности состоит в том, что из любого равен- равенства, относящегося к системе подмножеств фиксированного множе- множества 5, совершенно автоматически может быть получе- получено другое — двойственное — равенство путем замены всех рассма- рассматриваемых множеств их дополнениями, сумм множеств — пересече- пересечениями, а пересечений — суммами. Примером использования этого принципа может служить вывод теоремы 3' из теоремы 3 § 2 гл. П. Приведем доказательство соотношения C). Пусть х Е S \ (J Аа. Это означает, что х не входит в объединение а |JAa, т.е. не входит ни в одно из множеств Аа. Следовательно, х а принадлежит каждому из дополнений S\Aa и потому х Е ПE\ Аа). а Обратно, пусть х Е f](S \ Аа), т.е. х входит в каждое S \ Аа; тогда а х не входит ни в одно из множеств Аа, т. е. не принадлежит их сумме U Аа, а тогда х G S\ (J Аа. Равенство C) доказано. Соотношение D) а а доказывается аналогично. (Проведите доказательство.) Название «симметрическая разность» для операции А Л В не совсем удачно; эта операция во многом аналогична операции взятия суммы мно- множеств A U В. Действительно, AUB означает, что мы связываем неисклю- чающим «или» два утверждения: «элемент принадлежит А» и «элемент принадлежит В», а А Л В означает, что те же самые два утверждения связываются исключающим «или»: элемент х принадлежит А А В тогда и только тогда, когда он принадлежит либо только А, либо только В. Множество А А В можно было бы назвать «суммой по модулю два» мно- множеств А и В (берется объединение этих двух множеств, но элементы, которые при этом встречаются дважды, выбрасываются). § 2. Отображения. Разбиения на классы 1. Отображение множеств. Общее понятие функции. В анализе понятие функции вводится следующим образом. Пусть X — некоторое множество на числовой прямой. Говорят, что на этом множестве определена функция /, если каждому числу
§ 2. Отобраэюения. Разбиения на классы 21 х Е X поставлено в соответствие определенное число у = f(x). При этом X называется областью определения данной функции, а У — совокупность всех значений, принимаемых этой функцией, — ее областью значений. Если же вместо числовых рассматривать множества какой угод- угодно природы, то мы придем к самому общему понятию функции. Пусть М и N — два произвольных множества. Говорят, что на М определена функция /, принимающая значения из JV, если каждому элементу х Е М поставлен в соответствие один и только один эле- элемент у из N. Для множеств произвольной природы (как, впрочем, и в случае числовых множеств) вместо термина «функция» часто пользуются термином «отображение», говоря об отображении од- одного множества в другое. При специализации природы множеств М и N возникают специальные типы функций, которые носят осо- особые названия «вектор-функция», «мера», «функционал», «опера- «оператор» и т.д. Мы столкнемся с ними в дальнейшем. Для обозначения функции (отображения) из М в N мы будем часто пользоваться записью /: М —у N. Если а — элемент из М, то отвечающий ему элемент Ъ = /(а) из N называется образом а (при отображении /). Совокупность всех тех элементов а из М, образом которых является данный элемент Ъ Е N, называется прообразом (или, точнее, полным прообразом) элемента Ъ и обозначается f~1(b). Пусть А — некоторое множество из М\ совокупность {/(а): а Е А} всех элементов вида /(а), где a G А, называется образом А и обозначается f(A). В свою очередь для каждого множества В из N определяется его (полный!) прообраз f~1(B), а именно: f~1(B) есть совокупность всех тех элементов из М, образы которых принадле- принадлежат В. Может оказаться, что ни один элемент Ъ из В не имеет не- непустого прообраза, тогда и прообраз f~1(B) будет пустым множе- множеством. Здесь мы ограничимся рассмотрением самых общих свойств ото- отображений. Введем следующую терминологию. Мы будем говорить, что / есть отображение множества М «па» множество N, если f(M) = N; такое отображение называют также сюръекцией. В общем случае, т.е. когда /(М) С N, говорят, что / есть отображение М «в» N. Если для любых двух различных элементов х\ и х<± из М их образы у\ — j[x\) и ?/2 = /(#2) также различны, то / называется инъекцией. Отображение / : М —у N, которое одновременно явля- является сюръекцией и инъекцией, называется биекцией или взаимно однозначным соответствием между М и N.
22 Гл. I. Элементы теории множеств Установим основные свойства отображений. Теорема 1. Прообраз суммы двух множеств равен сумме их прообразов: Доказательство. Пусть элемент ж принадлежит множеству f~x(A U В). Это означает, что /(ж) е Аи В, т.е. f(x) е А или /(ж) Е В. Но тогда х принадлежит по крайней мере одному из мно- множеств !~Х(А) или f'^B), т.е. х е !~Х(А) U f~1(B). Обратно, если х Е f~1{A) U f~1(B), то х принадлежит по крайней мере одному из множеств f~x{A) и f~1(B), т.е. /(ж) принадлежит хотя бы од- одному из множеств А или В, следовательно, f(x) Е A U В, но тогда х е J-^AUB). Теорема 2. Прообраз пересечения двух множеств равен пере- пересечению их прообразов: Г1(АПВ)=Г1(А)ПГ1(В). Доказательство. Если х G /~1(АГ\ В), то f(x) G А П В, т.е. f(x) е А и f(x) G Б, следовательно, х G /~1(^4) и х G f~1(B), т.е. жеГЧ^п/-1^). Обратно, если ж G /^(А) П/^), т. е. ж G Z^) иж ? /"Ч5), то /(ж) G А и /(ж) G 5. Иначе говоря, /(ж) G АПБ. Следовательно, ж G /-^АПЯ). Теорема 3. Образ суммы двух множеств равен сумме их обра- образов: Доказательство. Если у G f(AU В), то это означает, что у = /(ж), где ж принадлежит по крайней мере одному из множеств А и В. Следовательно, у = /(ж) G /(-4) U f(B). Обратно, если у G f(A) U f(B), то ^/ = /(ж), где ж принадлежит по крайней ме- мере одному из множеств А и В, т.е. ж G АиБ и, следовательно, y = f(x)€f(A\JB). Теоремы 1, 2 и 3 остаются в силе для сумм и пересечений любого (конечного или бесконечного) числа множеств. Заметим, что образ пересечения двух множеств, вообще говоря, не совпадает с пересечением их образов. Например, пусть рассмат- рассматриваемое отображение представляет собой проектирование плоско- плоскости на ось ж. Тогда отрезки (К ж О, У = О, (К ж О, 2/ = 1 не пересекаются, а в то же время их образы совпадают.
§ 2. Отобраэюения. Разбиения на классы 23 Упражнение. Докажите, что прообраз дополнения равен дополне- дополнению прообраза. Верно ли аналогичное утверждение для образа дополне- дополнения? 2. Разбиение на классы. Отношения эквивалентности. В самых различных вопросах встречаются разбиения тех или иных множеств на попарно непересекающиеся подмножества. Например, плоскость (рассматриваемую как множество точек) можно разбить на прямые, параллельные оси ж, трехмерное пространство можно представить как объединение концентрических сфер различных ра- радиусов (начиная с г = 0), жителей данного города можно разбить на группы по их году рождения и т. п. Каждый раз, когда некоторое множество М представлено тем или иным способом как сумма попарно непересекающихся подмножеств, мы говорим о разбиении множества М на классы. Обычно приходится иметь дело с разбиениями, построенными на базе того или иного признака, по которому элементы множе- множества М объединяются в классы. Например, множество всех тре- треугольников на плоскости можно разбить на классы равных между собой или на классы равновеликих треугольников, все функции от х можно разбить на классы, собирая в один класс функции, прини- принимающие в данной точке одинаковые значения, и т. д. Признаки, по которым элементы множества разбиваются на клас- классы, могут быть самыми разнообразными. Но все же такой признак не вполне произволен. Предположим, например, что мы захотели бы разбить все действительные числа на классы, включая число Ъ в тот же класс, что и число а, в том и только в том случае, когда Ъ > а. Ясно, что никакого разбиения действительных чисел на классы та- таким путем получить нельзя, так как если Ъ > а, т. е. если Ъ следует зачислить в тот же класс, что и а, то а < 6, т. е. число а нельзя включить в тот же класс, что и Ъ. Кроме того, так как а не больше, чем само а, то а не должно попасть в один класс с самим собой! Другой пример. Попробуем разбить точки плоскости на классы, от- относя две точки к одному классу в том и только том случае, когда расстояние между ними меньше 1. Ясно, что добиться этого нельзя, так как если расстояние от а до Ъ меньше 1 и расстояние от Ъ до с меньше 1, то это вовсе не означает, что расстояние от а до с мень- меньше 1. Таким образом, зачисляя а в один класс с 6, а Ъ в один класс с с, мы получим, что в один и тот же класс могут попасть две точки, расстояние между которыми больше 1. Приведенные примеры подсказывают условия, при которых тот или иной признак действительно позволяет разбить элементы неко- некоторого множества на классы.
24 Гл. I. Элементы теории множеств Пусть М — некоторое множество и пусть некоторые из пар (а, Ь) элементов этого множества являются «отмеченными»1). Если (а, Ь) — «отмеченная» пара, то мы будем говорить, что элемент а связан с Ъ отношением ср, и обозначать это символом а~Ъ. Напри- Например, если имеется в виду разбиение треугольников на классы рав- равновеликих, то а~Ъ означает «треугольник а имеет ту же площадь, что и треугольник 6». Данное отношение ср называется отношением эквивалентности, если оно обладает следующими свойствами. 1) Рефлексивность: а~а для любого элемента a Е М. 2) Симметричность: если а~Ъ, то Ъ~а. 3) Транзитивность: если а~Ъ и Ь~с, то а~с. Эти условия необходимы и достаточны для того, чтобы отноше- отношение ip (признак!) позволяло разбить множество М на классы. В са- самом деле, всякое разбиение данного множества на классы опреде- определяет между элементами этого множества некоторое отношение экви- эквивалентности. Действительно, если а~Ъ означает «а находится в том же классе, что и Ь», то отношение ip будет, как легко проверить, рефлексивным, симметричным и транзитивным. Обратно, пусть ip — некоторое отношение эквивалентности ме- между элементами множества М и Ка — класс элементов х из М, эквивалентных данному элементу а: х~а. В силу свойства рефлек- рефлексивности элемент а сам принадлежит классу Ка. Покажем, что два класса Ка и Кь либо совпадают, либо не пересекаются. Пусть не- некоторый элемент с принадлежит одновременно и Ка, и Кь, т.е. с~а и с~Ь. Тогда в силу симметричности а~с и в силу транзитивности а~Ь. A) (р V / Если теперь х — произвольный элемент из Ка, т. е. ж~а, то в си- силу A) и свойства транзитивности х~Ъ, т. е. х G Кь. Точно так же доказывается, что всякий элемент у G Кь входит в Ка. Таким образом, два класса Ка и Кь, имеющих хотя бы один общий элемент, совпадают между собой. Мы получили разбиение множества М на классы по заданному отношению эквивалентности. Понятие разбиения множества на классы тесно связано с рассмо- рассмотренным в предыдущем пункте понятием отображения. Пусть / — отображение множества А в множество В. Собрав в один класс все элементы из А, образы которых в В совпадают, 1)При этом элементы а и Ь берутся в определенном порядке, т.е. (а, Ь) и F, а) — две, вообще говоря, различные пары.
§ 2. Отобраэюения. Разбиения на классы 25 мы получим, очевидно, некоторое разбиение множества А. Обратно, рассмотрим произвольное множество А и некоторое его разбиение на классы. Пусть В — совокупность тех классов, на которые разбито множество А. Ставя в соответствие каждому элементу a Е А тот класс (т.е. элемент из В), к которому а принадлежит, мы получим отображение множества А на множество В. Примеры. 1. Спроектируем плоскость ху на ось х. Прообразы точек оси х — вертикальные прямые. Следовательно, этому отобра- отображению отвечает разбиение плоскости на параллельные прямые. 2. Разобьем все точки трехмерного пространства на классы, объ- объединив в один класс точки, равноудаленные от начала координат. Каждый класс представляет собой сферу некоторого радиуса. Сово- Совокупность всех этих классов можно отождествить с множеством всех точек, лежащих на луче [0, оо). Итак, разбиению трехмерного про- пространства на концентрические сферы отвечает отображение этого пространства на полупрямую. 3. Объединим в один класс все действительные числа с одинако- одинаковой дробной частью. Этому разбиению отвечает отображение пря- прямой линии на окружность единичной длины. Понятие эквивалентности является частным случаем более обще- общего понятия бинарного отношения. Пусть М — произвольное множество. Обозначим через М х М или М2 совокупность всех упо- упорядоченных пар (а, 6), где а, Ъ Е М. Говорят, что в М задано бинар- бинарное отношение ср, если в М2 выделено произвольное подмножество R(p. Точнее говоря, мы скажем, что элемент а находится в отноше- отношении ер к элементу Ъ — обозначение acpb — в том и только том случае, когда пара (а, Ь) принадлежит R^. Примером бинарного отношения может служить отношение тождества е; именно, ash в том и только том случае, если а = Ь; иначе говоря, это — отношение, задаваемое диагональю АвМх М, т.е. подмножеством пар вида (а, а). Ясно, что всякое отношение эквивалентности ср в некотором множестве М есть бинарное отношение, подчиненное следующим условиям. 1) Диагональ А принадлежит R^ (рефлексивность). 2) Если (a, b) G it^, то и (b,a) G R^ (симметричность). 3) Если (а, b) G R^p и (Ь, с) G Д^, то и (а, с) G R^ (транзитив- (транзитивность). Итак, эквивалентность — это бинарное отношение, удовлетво- удовлетворяющее условиям рефлексивности, транзитивности и симметрично- симметричности. В § 4 мы рассмотрим другой важный частный случай бинарного отношения — частичную упорядоченность.
26 Гл. I. Элементы теории множеств § 3. Эквивалентность множеств. Понятие мощности множества 1. Конечные и бесконечные множества. Рассматривая раз- различные множества, мы замечаем, что иногда можно, если не факти- фактически, то хотя бы примерно, указать число элементов в данном мно- множестве. Таковы, например, множество всех вершин некоторого мно- многогранника, множество всех простых чисел, не превосходящих дан- данного числа, множество всех молекул воды на Земле и т. д. Каждое из этих множеств содержит конечное, хотя, быть может, и неизвест- неизвестное нам число элементов. С другой стороны, существуют множества, состоящие из бесконечного числа элементов. Таково, например, мно- множество всех натуральных чисел, множество всех точек на прямой, всех кругов на плоскости, всех многочленов с рациональными ко- коэффициентами и т.д. При этом, говоря, что множество бесконечно, мы имеем в виду, что из него можно извлечь один элемент, два эле- элемента и т.д., причем после каждого такого шага в этом множестве еще останутся элементы. Два конечных множества мы можем сравнивать по числу эле- элементов и судить, одинаково это число или же в одном из множеств элементов больше, чем в другом. Спрашивается, можно ли подоб- подобным же образом сравнивать бесконечные множества? Иначе гово- говоря, имеет ли смысл, например, вопрос о том, чего больше: кругов на плоскости или рациональных точек на прямой, функций, опре- определенных на отрезке [0,1], или прямых в пространстве, и т.д.? Посмотрим, как мы сравниваем между собой два конечных мно- множества. Можно, например, сосчитать число элементов в каждом из них и, таким образом, эти два множества сравнить. Но можно по- поступить и иначе, именно, попытаться установить биекцию, т. е. вза- взаимно однозначное соответствие между элементами этих множеств, иначе говоря, такое соответствие, при котором каждому элементу одного множества отвечает один и только один элемент другого, и наоборот. Ясно, что взаимно однозначное соответствие между дву- двумя конечными множествами можно установить тогда и только тогда, когда число элементов в них одинаково. Например, чтобы прове- проверить, одинаково ли число студентов в группе и стульев в аудитории, можно, не пересчитывая ни тех, ни других, посадить каждого сту- студента на определенный стул. Если мест хватит всем и не останется ни одного лишнего стула, т. е. если будет установлена биекция ме- между этими двумя множествами, то это и будет означать, что число элементов в них одинаково.
§ 3. Эквивалентность множеств. Понятие мощности 27 Заметим теперь, что если первый способ (подсчет числа элемен- элементов) годится лишь для сравнения конечных множеств, второй (установление взаимно однозначного соответствия) пригоден и для бесконечных. 2. Счетные множества. Простейшим среди бесконечных мно- множеств является множество натуральных чисел. Назовем счетным множеством всякое множество, элементы которого можно биек- биективно сопоставить со всеми натуральными числами. Иначе говоря, счетное множество — это такое множество, элементы которого мож- можно занумеровать в бесконечную последовательность: ai,..., an,... Приведем примеры счетных множеств. 1. Множество всех целых чисел. Установим соответствие между всеми целыми и всеми натуральными числами по следующей схеме: 0-11-22..., 12 3 4 5 ..., вообще, неотрицательному числу п ^ 0 сопоставим нечетное число 2п + 1, а отрицательному п < 0 — четное число 2\п\: п *-> 2п + 1 при п ^ 0, п *-> 2\п\ при п < 0. 2. Множество всех четных положительных чисел. Соответствие очевидно: п «->¦ 2п. 3. Множество 2,4, 8,..., 2П,... степеней числа 2. Здесь соответ- соответствие также очевидно. Каждому числу 2п сопоставляется число п. 4. Рассмотрим более сложный пример, а именно, покажем, что множество всех рациональных чисел счетно. Каждое рациональное число однозначно записывается в виде несократимой дроби а = p/q, q > 0. Назовем сумму \р\ + q высотой рационального числа а. Ясно, что число дробей с данной высотой п конечно. Например, высоту 1 имеет только число 0/1, высоту 2 — числа 1/1 и —1/1, высоту 3 — числа 2/1, 1/2, —2/1 и —1/2 и т.д. Будем нумеровать все рациональ- рациональные числа по возрастанию высоты, т. е. сперва выпишем числа высо- высоты 1, потом — числа высоты 2 и т. д. При этом всякое рациональное число получит некоторый номер, т. е. будет установлено взаимно однозначное соответствие между всеми натуральными и всеми ра- рациональными числами. Бесконечное множество, не являющееся счетным, называется несчетным множеством.
28 Гл. I. Элементы теории множеств Установим некоторые общие свойства счетных множеств. 1. Всякое подмножество счетного множества конечно или счетно. Доказательство. Пусть А — счетное множество, а В — его подмножество. Занумеруем элементы множества A: ai,..., an,... Пусть ani, an2,... — те из них, которые входят в В. Если среди чисел ni, П2,... есть наибольшее, то В конечно, в противном случае В счетно, поскольку его члены аП1, аП2,... занумерованы числами 1,2,... 2. Сумма любого конечного или счетного множества счетных множеств есть снова счетное множество. Доказательство. Пусть Ai, A^,... — счетные множества. Мы можем считать, что они попарно не пересекаются, так как ина- иначе мы рассмотрели бы вместо них множества Ai, А<± \ А\, A%\{A\\lA<2),... — каждое из которых не более чем счетно, — имею- имеющие ту же самую сумму, что и множества А\, А<±,... Все элементы множеств А\, А<±,... можно записать в виде следующей бесконечной таблицы: &21 &22 &23 &31 &32 азз B41 &42 &43 где в первой строке стоят элементы множества А\, во второй — элементы множества А<± и т.д. Занумеруем теперь все эти элемен- элементы «по диагоналям», т.е. за первый элемент примем ац, за второй ai2, за третий а^\ и т.д., двигаясь в порядке, указанном стрелками на следующей таблице: U>2\ Oj22 ^23 ^24 аз1 аз2 азз <^34 а41 а42 0-43 ^44 Ясно, что при этом каждый элемент каждого из множеств получит определенный номер, т. е. будет установлено взаимно однозначное
§ 3. Эквивалентность множеств. Понятие мощности 29 соответствие между всеми элементами всех множеств А\, А<±, ..., и всеми натуральными числами. Наше утверждение доказано. Упражнения. 1. Доказать, что множество всех многочленов с раци- рациональными коэффициентами счетно. 2. Число ? называется алгебраическим^ если оно является корнем не- некоторого многочлена с рациональными коэффициентами. Доказать, что множество всех алгебраических чисел счетно. 3. Доказать, что множество всех рациональных интервалов (т. е. ин- интервалов с рациональными концами) на прямой счетно. 4. Доказать, что множество всех точек плоскости, имеющих рациональ- рациональные координаты, счетно. Указание. Воспользоваться свойством 2. 3. Всякое бесконечное множество содержит счетное подмноже- подмножество. Доказательство. Пусть М — бесконечное множество. Выбе- Выберем в нем произвольный элемент а\. Поскольку М бесконечно, в нем найдется элемент а2, отличный от ai, затем найдется элемент аз, отличный от а\ и от а^ и т.д. Продолжая этот процесс (который не может оборваться из-за «нехватки» элементов, ибо М бесконеч- бесконечно), мы получаем счетное подмножество А = {аь.. .,ап,...} множества М. Предложение доказано. Это предложение показывает, что среди бесконечных множеств счетные являются «самыми маленькими». Ниже мы выясним, су- существуют ли несчетные бесконечные множества. 3. Эквивалентность множеств. Сравнивая те или иные бес- бесконечные множества с натуральным рядом, мы пришли к поня- понятию счетного множества. Ясно, что множества можно сравнивать не только с множеством натуральных чисел; установление взаимно однозначного соответствия (биекции) позволяет сравнивать между собой любые два множества. Введем следующее определение. Определение. Два множества, М и JV, называются эквива- эквивалентными (обозначение М ~ JV), если между их элементами можно установить взаимно однозначное соответствие. Понятие эквивалентности применимо к любым множествам как конечным, так и бесконечным. Два конечных множества эквива- эквивалентны между собой тогда (и только тогда), когда число элемен- элементов у них одинаково. Определение счетного множества можно те- теперь сформулировать следующим образом: множество называется
30 Гл. I. Элементы теории множеств счетным, если оно эквивалентно множеству натуральных чисел. Ясно, что два множества, эквивалентные третьему, эквивалентны между собой; в частности, любые два счетных множества эквива- эквивалентны между собой. Примеры. 1. Множества точек на любых двух отрезках [а, Ь] и [с, d] эквивалентны между собой. Из рис. 5 ясно, как установить между ними биекцию. Именно, точки р и q соответствуют друг дру- другу, если они являются проекциями одной и той же точки г вспомо- вспомогательного отрезка е/. О Ъ с Рис. 5 Рис 2. Множество всех точек на расширенной комплексной плоскости эквивалентно множеству всех точек на сфере. Биекцию а •<->¦ z мож- можно установить, например, с помощью стереографической проекции (рис. 6). 3. Множество всех чисел в интервале @,1) эквивалентно множе- множеству всех точек на прямой. Соответствие можно установить, напри- например, с помощью функции у = |arctgx + 1. Рассматривая примеры, приведенные здесь и в п. 2, можно заме- заметить, что иногда бесконечное множество оказывается эквивалент- эквивалентным своей истинной части. Например, натуральных чисел оказы- оказывается «столько же», сколько и всех целых или даже всех рацио- рациональных; на интервале @,1) «столько же» точек, сколько и на всей прямой, и т.д. Это явление характерно для бесконечных множеств. Действительно, в п. 2 (свойство 3) мы показали, что из всякого бесконечного множества М можно выбрать счетное подмножество; пусть А = {ai,..., an,... } такое подмножество.
§ 3. Эквивалентность множеств. Понятие мощности 31 Разобьем его на два счетных подмножества А1 = {аьа3,а5,...} и А2 = {а2,а4,а6,... } и установим между Аж А\ взаимно однозначное соответствие. Это соответствие можно затем продолжить до взаимно однозначного со- соответствия между множествами A U (М \ А) = М и А\ U (М \ А) = = М \ ^2, отнеся каждому элементу из М \ А сам этот элемент. Между тем множество М \А2 не совпадает с М, т. е. является соб- собственным подмножеством для М. Мы получаем, таким образом, сле- следующее предложение: Всякое бесконечное множество эквивалентно некоторому свое- своему собственному подмножеству. Это свойство можно принять за определение бесконечного мно- множества. Упражнение. Доказать, что если М — произвольное бесконечное множество и А счетно, то М ~ М U А. 4. Несчетность множества действительных чисел. В п. 2 мы привели примеры счетных множеств. Число этих примеров мож- можно было бы увеличить. Кроме того, как мы показали, сумма ко- конечного или счетного числа счетных множеств снова есть счетное множество. Естественно возникает вопрос: а существуют ли вообще несчет- несчетные множества? Положительный ответ на него дает следующая тео- теорема. Теорема 1. Множество действительных чисел, заключенных между нулем и единицей, несчетно. Доказательство. Предположим, что дано какое-то счетное множество (всех или только некоторых) действительных чисел а, лежащих на отрезке [0,1]: «1 = 0, аца12а13 ... а1п ..., а2 = 0, а21п22а2з ... а2п ..., «з = 0, а31а32а33 ... а3п ..., ап = 0, anian2an3 ...апп ..., Здесь аи* — fc-я десятичная цифра числа с^. Построим дробь
32 Гл. I. Элементы теории множеств диагональной процедурой Кантора, а именно: за Ъ\ примем произ- произвольную цифру, не совпадающую с оц, за Ь^ — произвольную циф- цифру, не совпадающую с а22, и т.д.; вообще, за Ъп примем произволь- произвольную цифру, не совпадающую с апп. Эта десятичная дробь не может совпасть ни с одной дробью, содержащейся в перечне A). Действи- Действительно, от oli дробь C отличается по крайней мере первой цифрой, от «2 — второй цифрой и т. д.; вообще, так как Ъп ф апп для всех п, то дробь C отлична от любой из дробей cti, входящих в перечень A). Таким образом, никакое счетное множество действительных чисел, лежащих на отрезке [0,1], не исчерпывает этого отрезка. Приведенное доказательство содержит небольшой «обман». Дело в том, что некоторые числа (а именно, числа вида p/10q) могут быть записаны в виде десятичной дроби двумя способами: с бесконечным числом нулей или с бесконечным числом девяток; например, 1 = А = 0,5000 • • • = 0,4999 ... Таким образом, несовпадение двух десятичных дробей еще не га- гарантирует различия изображаемых ими чисел. Однако если дробь C строить осторожнее, так, чтобы она не содер- содержала ни нулей, ни девяток, полагая, например, Ъп = 2, если апп = 1 и Ъп = 1, если апп ф 1, то доказательство становится вполне кор- корректным. Упражнение. Показать, что числа, обладающие двумя различными десятичными разложениями, образуют счетное множество. Итак, отрезок [0,1] дает пример несчетного множества. Приведем некоторые примеры множеств, эквивалентных отрезку [0,1]. 1. Множество всех точек любого отрезка [а, Ь] или интервала (а, Ь). 2. Множество всех точек на прямой. 3. Множество всех точек плоскости, пространства, поверхности сферы, точек, лежащих внутри сферы, и т.д. 4. Множество всех прямых на плоскости. 5. Множество всех непрерывных функций одного или нескольких переменных. В случаях 1 и 2 доказательство не представляет труда (см. при- примеры 1 и 3 п. 3). В остальных случаях непосредственное до- доказательство довольно сложно. Упражнение. Используя результаты этого пункта и упражнение 2 п. 2, доказать существование трансцендентных чисел, т. е. чисел, не являющихся алгебраическими. 5. Теорема Кантора—Бернштейна. Следующая теорема явля- является одной из основных в теории множеств.
§ 3. Эквивалентность множеств. Понятие мощности 33 Теорема 2 (Кантор-Бернштейн). Пусть А и В — два произвольных множества. Если существуют взаимно однозначное отображение f множества А на подмножество В\ множества В и вза- взаимно однозначное отображение g множества В на подмножество А\ множества А, то А и В эквивалентны. Доказательство. Не ограничивая общности, можно считать, что А и В не пересекаются. Пусть х — произвольный элемент из А. Положим х = хо и определим последовательность элементов {хп} следующим образом. Пусть элемент хп уже определен. Тогда, если п четно, то за хп+\ примем элемент из В, удовлетворяющий условию g(xn+i) = хп (если такой элемент существует), а если п нечетно, то жп+1 — элемент из А, удовлетворяющий условию /(xn+i) = хп (если он существует). Возможны два случая. 1°. При некотором п элемента жп+ъ удовлетворяющего указан- указанным условиям, не существует. Число п называется порядком эле- элемента х. 2°. Последовательность {хп} бесконечна1). Тогда х называется элементом бесконечного порядка. Разобьем теперь А на три множества: Ае, состоящее из элементов четного порядка, Ао — множество элементов нечетного порядка и Ai — множество всех элементов бесконечного порядка. Разбив аналогичным образом множество В, заметим, что / отображает Ае на Во и Ai на Б/, а д~х отображает Ао на ВЕ- Итак, взаимно однозначное отображение ф, совпадающее с / на Ае U Ai и с д~х на Ао, есть взаимно однозначное отображение всего А на всё В. 6. Понятие мощности множества. Если эквивалентны два ко- конечных множества, то они состоят из одного и того же числа эле- элементов. Если же эквивалентные между собой множества М и N произвольны, то говорят, что М и N имеют одинаковую мощность. Таким образом, мощность — это то общее, что есть у любых двух эквивалентных между собой множеств. Для конечных множеств по- понятие мощности совпадает с привычным понятием числа элементов множества. Мощность множества натуральных чисел (т. е. любого счетного множества) обозначается символом ^о (читается: «алеф нуль»). Про множества, эквивалентные множеству всех действи- действительных чисел отрезка [0,1], говорят, что они имеют мощность 1) При этом число различных элементов хп может быть и конечно: они могут «зацикливаться», образуя бесконечную последовательность, содержащую лишь конечное число попарно различных элементов.
34 Гл. I. Элементы теории множеств континуума. Эта мощность обозначается символом с (или симво- символом N). Весьма глубокий вопрос о существовании мощностей, промежу- промежуточных между ^о и с, будет затронут ниже в § 4. Как правило, бес- бесконечные множества, встречающиеся в анализе, или счетны, или имеют мощность континуума. Для мощностей конечных множеств, т. е. для натуральных чи- чисел, кроме понятия равенства имеются также понятия «больше» и «меньше». Попытаемся распространить эти последние на беско- бесконечные мощности. Пусть А и В — два произвольных множества, а т(А) и т(В) — их мощности. Тогда логически возможны следующие случаи: 1. А эквивалентно некоторой части множества В,&В эквивалент- эквивалентно некоторой части множества А. 2. А содержит некоторую часть, эквивалентную В, но в В нет части, эквивалентной А. 3. В содержит некоторую часть, эквивалентную А, но в А нет части, эквивалентной В. 4. Ни в одном из этих двух множеств нет части, эквивалентной другому. В первом случае множества А и В в силу теоремы Кантора- Бернштейна эквивалентны между собой, т.е. т(А) = т(В). Во вто- втором случае естественно считать, что т(А) > т(В), а в третьем, — что т(А) < т(В). Наконец, в четвертом случае нам пришлось бы считать, что мощности множеств А ж В несравнимы между собой. Но на самом деле этот случай невозможен! Это следует из теоремы Цермело, о которой речь будет идти в § 4. Итак, любые два множества А и В либо эквивалентны между собой (и тогда т(А) = т(В)), либо удовлетворяют одному из двух соотношений: т(А) < т(В) или т(А) > т(В). Мы отметили выше, что счетные множества — это «самые ма- маленькие» из бесконечных множеств, а затем показали, что суще- существуют и бесконечные множества, бесконечность которых имеет бо- более «высокий порядок», — это множества мощности континуума. А существуют ли бесконечные мощности, превосходящие мощность континуума? Вообще, существует ли какая-то «наивысшая» мощ- мощность или нет? Оказывается, верна следующая теорема. Теорема 3. Пусть М — некоторое множество и пусть Ш — множество, элементами которого являются всевозможные подмно- подмножества множества М. Тогда Ш имеет мощность большую, чем мощ- мощность исходного множества М.
§ 3. Эквивалентность множеств. Понятие мощности 35 Доказательство. Легко видеть, что мощность m множества Ш не может быть меньше мощности т исходного множества М, дей- действительно, «одноэлементные» подмножества из М образуют в ШТ часть, эквивалентную множеству М. Остается доказать, что мощ- мощности m и т не совпадают. Пусть между элементами а, 6,... мно- множества М и какими-то элементами А, В,... множества ШТ (т.е. какими-то подмножествами из М) установлено взаимно однознач- однозначное соответствие а <-> А, Ъ <-> В, ... Покажем, что оно наверняка не исчерпывает всего ШТ. Именно, сконструируем такое множество ХсМ, которому не соответствует никакой элемент из М. Пусть X — совокупность элементов из М, не входящих в те подмножества, которые им соответствуют. По- Подробнее: если й о i и a G А, то элемент а мы не включаем в X, а если а ^ А и а ^ А, то мы включаем элемент а в X. Ясно, что X есть подмножество множества М, т.е. некоторый элемент из ШТ. Покажем, что подмножеству X не может соответствовать никакой элемент из М. Допустим, что такой элемент х •<->¦ X существует; посмотрим, будет ли он содержаться в X или нет? Пусть х ? X; но ведь по определению в X входит всякий элемент, не содержа- содержащийся в подмножестве, которое ему соответствует, следовательно, элемент х должен быть включен в X. Обратно, предположив, что х содержится в X, мы получим, что х не может содержаться в X, так как в X включены только те элементы, которые не входят в соответствующие им подмножества. Итак, элемент ж, отвечающий подмножеству X, должен одновременно и содержаться, и не содер- содержаться в X. Отсюда следует, что такого элемента вообще не суще- существует, т. е. что взаимно однозначного соответствия между элемен- элементами множества М и всеми его подмножествами установить нельзя. Теорема доказана. Итак, для любой мощности мы действительно можем построить множество большей мощности, затем еще большей и т.д., получая, таким образом, не ограниченную сверху шкалу мощностей. Замечание. Мощность множестваЭДТ обозначают символом 2т, где т — мощность М. (Читатель легко поймет смысл этого обозна- обозначения, рассмотрев случай конечного М'.) Таким образом, предыду- предыдущую теорему можно выразить неравенством т < 2т. В частности, при т = ^о получаем неравенство ^о < 2^°. Покажем, что 2^° = N;, т. е. покажем, что мощность множества всех подмножеств нату- натурального ряда равна мощности континуума.
36 Гл. I. Элементы теории множеств Разобьем подмножества натурального ряда на два класса, ф и 0, — на те (класс ф), у которых дополнение бесконечно, и на те (класс 0), у которых оно конечно. К классу 0 относится, в частно- частности, сам натуральный ряд, ибо его дополнение пусто. Число подмно- подмножеств в классе 0 счетно (доказать). Класс 0 не влияет на мощность множества 9Л = ф U 0. Между подмножествами класса ф и действительными числа- числами а из полусегмента [0,1) можно установить взаимно однознач- однозначное соответствие. Именно, сопоставим подмножеству A Е ф число а (О ^ а < 1) с двоичным разложением п, — ?1 + ?2, l?il_l где еп = 1 или 0 в зависимости от того, принадлежит ли п множе- множеству А или нет. Проверку деталей предоставляем читателю. Упражнение. Доказать, что совокупность всех числовых функций (или вообще функций, принимающих значения в множестве, содержащем не менее двух элементов), определенных на некотором множестве JW, име- имеет мощность большую, чем мощность множества М. Указание. Воспользоваться тем, что множество всех индикаторов, т. е. функций на М, принимающих только два значения, 0 и 1, эквивалентно множеству всех подмножеств из М. § 4. Упорядоченные множества. Трансфинитные числа В этом параграфе изложен ряд понятий, связанных с идеей упо- упорядоченности множеств. Мы ограничимся здесь самыми первона- первоначальными сведениями; более подробное изложение можно найти в литературе, указанной в конце книги. 1. Частично упорядоченные множества. Пусть М — про- произвольное множество и ср — некоторое бинарное отношение в нем (определяемое некоторым множеством R^ С М х М). Мы назовем это отношение частичной упорядоченностью, если оно удовлетво- удовлетворяет условиям: 1) рефлексивности: акра, 2) транзитивности: если acpb и Ьсрс, то асрс, 3) антисимметричности: если acpb и Ьсра, то а = Ъ. Частичную упорядоченность принято обозначать символом ^. Та- Таким образом, запись а ^ Ъ означает, что пара (а, Ъ) принадлежит соответствующему множеству R^. Про элемент а при этом говорят,
§ 4. Упорядоченные множества 37 что он не превосходит Ъ или что он подчинен Ъ. Множество, в кото- котором задана некоторая частичная упорядоченность, называется час- частично упорядоченным. Приведем примеры частично упорядоченных множеств. 1. Всякое множество можно тривиальным образом рассматривать как частично упорядоченное, если положить а ^ Ъ в том и только том случае, когда а = Ъ. Иначе говоря, за частичную упорядочен- упорядоченность всегда можно принять бинарное отношение тождества е. Этот пример не представляет, конечно, большого интереса. 2. Пусть М — множество всех непрерывных функций на отрезке [а,/3]. Положив / ^ g в том и только том случае, когда /(?) ^ g(t) для всех t (a ^ t ^ C), мы получим, очевидно, частичную упорядо- упорядоченность. 3. Множество всех подмножеств некоторого фиксированного мно- множества частично упорядочено по включению: М\ ^ М^ означает, что Mi С М2. 4. Множество всех натуральных чисел частично упорядочено, если а ^ Ъ означает «6 делится без остатка на а». Пусть М — произвольное частично упорядоченное множество. В случае, когда а ^ Ъ и а ф Ъ, мы будем пользоваться символом <, т.е. писать а < Ъ и говорить, что а меньше Ъ или что а строго подчинено Ъ. Наряду с записью а ^ Ъ мы будем пользоваться рав- равносильной записью Ъ ^ а и говорить при этом, что Ъ не меньше а {больше а, если Ъ ф а) или что Ъ следует за а. Элемент а называ- называется максимальным, если из а ^ Ъ следует, что Ъ = а. Элемент а называется минимальным, если из с ^ а следует, что с = а. Частично упорядоченное множество, для любых двух точек а, Ъ кото- которого найдется следующая за ними точка с (а ^ с, Ъ ^ с), называется направленным. 2. Отображения, сохраняющие порядок. Пусть М и М' — два частично упорядоченных множества и пусть / есть отображение М в М'. Мы скажем, что это отображение сохраняет порядок, если из а ^ Ъ, где а, Ъ G М, следует, /(а) ^ f(b) (в М'). Отображение / называется изоморфизмом частично упорядоченных множеств М и М', если оно биективно, а соотношение /(а) ^ f(b) выполнено в том и только том случае, когда а ^ Ъ. Сами множества М и М' называются при этом изоморфными между собой. Пусть, например, М есть множество натуральных чисел, частич- частично упорядоченное по «делимости» (см. пример 4 п. 1), а М' — то же самое множество, но упорядоченное естественным образом, т. е. так, что Ъ ^ а, если Ъ — а — положительное число. Тогда отображе-
38 Гл. I. Элементы теории множеств ние М на М'', ставящее в соответствие каждому числу п его само, сохраняет порядок (но не является изоморфизмом). Отношение изоморфизма между частично упорядоченными мно- множествами представляет собой, очевидно, отношение эквивалентно- эквивалентности (оно симметрично, транзитивно и рефлексивно). Следовательно, если у нас имеется какой-то запас1) частично упорядоченных мно- множеств, то все эти множества можно разбить на классы изоморфных между собой. Ясно, что если нас интересует не природа элементов множества, а только имеющаяся в нем частичная упорядоченность, то два изоморфных между собой частично упорядоченных множе- множества можно рассматривать просто как тождественные. 3. Порядковые типы. Упорядоченные множества. Про изо- изоморфные между собой частично упорядоченные множества мы бу- будем говорить, что они имеют один и тот же порядковый тип. Та- Таким образом, порядковый тип — это то общее, что присуще любым двум изоморфным между собой частично упорядоченным множе- множествам, подобно тому как мощность — это то общее, что присуще эквивалентным между собой множествам (рассматриваемым неза- независимо от какого бы то ни было отношения порядка в них). Пусть а и Ъ — элементы частично упорядоченного множества. Может оказаться, что ни одно из соотношений а^биЦане име- имеет места. В этом случае элементы а и Ъ называются несравнимыми. Таким образом, отношение порядка определено лишь для некото- некоторых пар элементов, поэтому мы и говорим о частичной упорядо- упорядоченности. Если же в частично упорядоченном множестве М несрав- несравнимых элементов нет, то множество М называется упорядоченным {линейно упорядоченным, совершенно упорядоченным). Итак, мно- множество М упорядочено, если оно частично упорядочено и если для любых двух различных элементов а, Ъ Е М обязательно либо а < 6, либо Ь < а. Ясно, что всякое подмножество упорядоченного множества само упорядочено. Множества, указанные в примерах 1-4 п. 1, являются лишь ча- частично упорядоченными. Простейшими примерами линейно упоря- упорядоченных множеств могут служить натуральные числа, совокуп- совокупность всех рациональных чисел, всех действительных чисел на от- отрезке [0,1] и т. п. (с естественными отношениями «больше» и «мень- «меньше», которые в этих множествах имеются). 1) Мы воздерживаемся от понятий вроде «все частично упорядоченные мно- множества», так как они, подобно понятию «множество всех множеств», по суще- существу, внутренне противоречивы и не могут быть включены в четкие математи- математические концепции.
§ 4. Упорядоченные множества 39 Поскольку упорядоченность есть частный случай частичной упо- упорядоченности, к упорядоченным множествам применимо понятие отображения, сохраняющего порядок, и, в частности, понятие изо- изоморфизма. Поэтому можно говорить о порядковом типе упорядо- упорядоченного множества. Ряд натуральных чисел 1,2,3,... с естествен- естественным отношением порядка между его элементами представляет со- собой простейший пример бесконечного упорядоченного множества. Его порядковый тип принято обозначать символом ио. Если два частично упорядоченных множества изоморфны ме- между собой, то они, конечно, имеют одинаковую мощность (изомор- (изоморфизм — это биекция), поэтому можно говорить о мощности, отвеча- отвечающей данному порядковому типу (например, типу и отвечает мощ- мощность No). Однако обратное неверно; множество данной мощности может быть упорядочено, вообще говоря, многими разными спосо- способами. Лишь порядковый тип линейно упорядоченного конечного множества однозначно определяется числом п его элементов (и обо- обозначается также через п). Уже для счетного множества натураль- натуральных чисел возможен, например, наряду с его «естественным» ти- типом о;, такой тип: 1,3,5,... ,2,4,6,..., т. е. такой, когда любое четное число следует за любым нечетным, а нечетные и четные числа между собой упорядочены по возраста- возрастанию. Можно показать, что число различных порядковых типов, от- отвечающих мощности Nq, бесконечно и даже несчетно. 4. Упорядоченная сумма упорядоченных множеств. Пусть М\ и М.2 — два непересекающихся упорядоченных множества с по- порядковыми типами #i и #2- В объединении М\ U М^ множеств М\ и М.2 можно ввести порядок, считая, что два элемента из М\ упо- упорядочены как в Mi, два элемента из М^ упорядочены как в М^ и что всякий элемент из М\ предшествует всякому эле- элементу из М.2- (Проверьте, что это действительно линейная упоря- упорядоченность!) Такое упорядоченное множество мы будем называть упорядоченной суммой множеств Mi и М^ и обозначать М\ + М^. Подчеркнем, что здесь важен порядок слагаемых: сумма М^ + М\ не изоморфна, вообще говоря, сумме М\ +М2. Порядковый тип сум- суммы М\ + М.2 мы будем называть упорядоченной суммой порядковых типов в\ и #2 и обозначать в\ +62- Это определение легко распространяется на произвольное конеч- конечное число слагаемых в\,..., вт. Пример. Рассмотрим порядковые типы uj и п. Легко видеть, что п + uj — ио] действительно, если мы к натуральному ряду
40 Гл. I. Элементы теории множеств 1,2,3,... , /с,... припишем слева конечное число членов, то мы по- получим тот же порядковый тип и. В то же время порядковый тип uj + п, т. е. порядковый тип множества 1, 2, 3,..., &,..., ai,..., an, не равен, очевидно, и. 5. Вполне упорядоченные множества. Трансфинитные числа. Выше мы ввели понятия частичной упорядоченности и упо- упорядоченности. Введем еще более узкое, но весьма важное понятие полной упорядоченности. Определение. Упорядоченное множество называется вполне упорядоченным, если каждое его непустое подмножество содержит наименьший (т. е. предшествующий всем элементам этого подмно- подмножества) элемент. Если упорядоченное множество конечно, то оно, очевидно, и впол- вполне упорядочено. Примером упорядоченного, но не вполне упорядо- упорядоченного множества может служить отрезок [0,1]. Само это множе- множество содержит наименьший элемент — число 0, но его подмноже- подмножество, состоящее из положительных чисел, наименьшего эле- элемента не содержит. Ясно, что всякое (непустое) подмножество вполне упорядочен- упорядоченного множества само вполне упорядочено. Порядковый тип вполне упорядоченного множества называют по- порядковым числом (трансфинитным порядковым числомили, короче трансфинитом, когда хотят подчеркнуть, что речь идет о бесконеч- бесконечном множестве). Натуральный ряд (с естественным отношением порядка) пред- представляет собой множество не только упорядоченное, но и вполне упорядоченное. Таким образом, его порядковый тип uj есть поряд- порядковое число (трансфинит!). Порядковым числом будет и и + &, т.е. тип множества l,...,n,...,ab...,afe. Напротив, множество ...,-п,...,-3,-2,-1 A) упорядочено, но не вполне упорядочено. Здесь в каждом непустом подмножестве есть наибольший элемент (т.е. следующий за всеми), но, вообще говоря, нет наименьшего (например, наименьшего эле- элемента нет во всем множестве A)). Порядковый тип (не являющий- являющийся порядковым числом!) множества A) принято обозначать симво- символом UJ*.
§ 4. Упорядоченные множества 41 Докажем следующий простой, но важный факт. Лемма 1. Упорядоченная сумма конечного числа вполне упо- упорядоченных множеств есть вполне упорядоченное множество. В самом деле, пусть М — произвольное подмножество упоря- упорядоченной суммы Mi + • • • + Мп вполне упорядоченных множеств; рассмотрим первое из множеств М/,, содержащее элементы из М. Пересечение М П М/, является подмножеством вполне упорядочен- упорядоченного множества М/, и, значит, имеет первый элемент. Этот элемент будет первым элементом и всего М. Следствие. Упорядоченная сумма порядковых чисел является порядковым числом. Мы можем, таким образом, отправляясь от некоторого запаса по- порядковых чисел, строить новые порядковые числа. Например, от- отправляясь от натуральных чисел (т. е. конечных порядковых чисел) и порядкового числа ш, можно получить порядковые числа CJ + П, OJ+OJ, UJ + UJ + П, OJ + OJ + OJ И Т. Д. Читатель легко построит вполне упорядоченные множества, отве- отвечающие этим трансфинитам. Наряду с упорядоченной суммой порядковых типов можно ввести упо- упорядоченное произведение. Пусть Mi и М2 — множества, упорядоченные по типам в\ и 02. Возьмем много экземпляров множества Mi — по одно- одному на каждый элемент М2 — и заменим в множестве М2 его элементы этими экземплярами М\. Полученное множество называется упорядочен- упорядоченным произведением М\ и М2 и обозначается символом М\ • М2. Формально М\ • М2 строится как множество пар (а, 6), где а Е М\ и Ь Е Мг, причем (ai,6i) < @2,62), если bi < &2 (при любых ai, аг), и (ai,6) < (а2,Ь), если ai < a2- Аналогично определяется упорядоченное произведение любого конеч- конечного числа сомножителей М\ • М2 •... • Мр. Порядковый тип в произведения Mi • М2 упорядоченных множеств называется произведением порядковых типов 0i и 02: 0 = 0102- Как и упорядоченная сумма, упорядоченное произведение некоммута- некоммутативно. Лемма 2. Упорядоченное произведение двух вполне упорядоченных множеств есть вполне упорядоченное множество. Доказательство. Пусть М — некоторое подмножество произведе- произведения Mi • М2; множество М есть множество пар (a, b). Рассмотрим все вторые элементы Ь пар, входящих в М. Они образуют некоторое подмно- подмножество в Мг. В силу полной упорядоченности М2 это подмножество име- имеет первый элемент. Обозначим его bo и рассмотрим все пары вида (а,Ьо),
42 Гл. I. Элементы теории множеств входящие в М. Их первые элементы а образуют некоторое подмножество в Mi. В силу полной упорядоченности Mi среди них имеется первый эле- элемент. Обозначим его ао. Тогда пара (ао,Ьо), как легко видеть, и будет первым элементом М. Следствие. Упорядоченное произведение порядковых чисел явля- является порядковым числом. Примеры. Легко видеть, что и + и = а; • 2, и + и + и = и • 3. Легко также построить множества, упорядоченные по типам и • п, о;2, и2 • п, о;3, ... , o;p,... Все эти множества будут иметь счетную мощность. Можно определить и другие действия над порядковыми типами, на- например, возведение в степень, и ввести в рассмотрение такие порядковые числа, как, скажем, иш, uj^ и т.д. 6. Сравнение порядковых чисел. Если п\ и n<i — два ко- конечных порядковых числа, то они или совпадают, или одно из них больше другого. Распространим это отношение порядка на трансфи- трансфинитные порядковые числа. Введем для этого следующие понятия. Всякий элемент а линейно упорядоченного множества М определя- определяет начальный отрезок Р (совокупность элементов < а) и остаток Q (совокупность элементов ^ а). Пусть а и C — два порядковых числа, а М и N — множества, типа а и C соответственно. Мы скажем, что а = /3, если множества М и N изоморфны, что а < /3, если М изоморфно какому-либо на- начальному отрезку множества JV, и что а > C, если, обратно, N изо- изоморфно начальному отрезку множества М. Теорема 1. Любые два порядковых числа а и C связаны между собой одним и только одним из соотношений: a = C, a < C или a > C. Для доказательства установим прежде всего следующую лемму. Лемма 3. Если / — изоморфное отображение вполне упорядо- упорядоченного множества А на какое-либо его подмножество В, то f(a) ^ a для всех a G А. Действительно, если бы имелись такие элементы a G А, что /(а) < а, то среди них был бы первый (полная упорядоченность!). Пусть это — элемент ао и пусть bo = /(ао). Тогда bo < по и, посколь- поскольку / — изоморфизм, /(Ьо) < /(ао) = bo, т.е. ао не был бы первым среди элементов с указанным свойством. Из этой леммы сразу же вытекает, что вполне упорядоченное множество не может быть изоморфно своему отрезку. Если бы А бы- было изоморфно отрезку, определяемому элементом а, то выполнялось бы соотношение /(а) < а. Поэтому соотношения a = C и a < C
§ 4. Упорядоченные множества 43 не могут иметь места одновременно. Аналогично не может быть од- одновременно а = C и а > C. Точно так же несовместны соотношения а < C и а > C, так как иначе мы получили бы (транзитивность!), что а < а, а это, как мы видели, невозможно. Итак, мы показали, что наличие одного из соотношений а = C исключает два остальных. Покажем теперь, что одно из этих соотношений всегда имеет место, т.е. что любые два порядковых числа сравнимы. Сначала для каждого порядкового числа а построим множество W(a), служащее его «стандартным представителем». Именно, при- примем за VF(a) множество всех порядковых чисел, меньших а. Числа, входящие в W(a), все сравнимы между собой, а само множество VF(a) (упорядоченное по величине порядковых чисел) имеет тип а. Действительно, если множество А = {...,а,... Д...} имеет тип а, то, по самому определению, порядковые числа, мень- меньшие, чем а, взаимно однозначно отвечают начальным отрезкам мно- множества А, а следовательно, и элементам этого множества. Иначе го- говоря, элементы множества, имеющего тип а, можно перенумеровать с помощью порядковых чисел, меньших а: А = {а^.а^... ,аЛ,.. .)• Пусть теперь а и C — два порядковых числа; тогда А = W(a) и В = W(/3) — множества типов а и C соответственно. Пусть, далее, С = А П В — пересечение множеств А и В, т.е. совокупность по- порядковых чисел, меньших а и C одновременно. Множество С вполне упорядочено; обозначим его тип гу. Покажем, что 7 ^ а- Действи- Действительно, если С = А, то 7 — а, если же С / А, то С есть отрезок множества А и тогда 7 < ol. В самом деле, при всех (GC, r/Gi\C числа ? и г) сравнимы, т-е- ^ ^ V- Но соотношение г) < ? < а невозможно, так как тогда r\ G С. Итак, ? < ?7, откуда и видно, что С есть отрезок множества А и 7 < d- Кроме того, 7 есть первый элемент множества А\С. Итак, 7 ^ о. и аналогично 7 ^ Р- При этом случай ^ < а, ^ < C невозможен, так как тогда мы имели бы 7 € А \ С, 7 ? В \ С, т. е. с одной стороны, 7 ^ С, с другой стороны, j € АП В = С. Следовательно, возможны лишь случаи 7 = а, 7 = А « = /3, 7 = а, 7 < А а<А 7 < а, 7 = А а>А т. е. а и /3 сравнимы. Теорема полностью доказана.
44 Гл. I. Элементы теории множеств Каждому порядковому числу отвечает определенная мощность, а из сравнимости порядковых чисел следует, очевидно, и сравни- сравнимость соответствующих мощностей. Поэтому: Если А и В — два вполне упорядоченных множества, то либо они эквивалентны между собой (р авно мощны), либо же мощность одного из них больше, чем мощность другого (т. е. вполне упорядо- упорядоченные множества не могут иметь несравнимых мощностей). Рассмотрим совокупность всех порядковых чисел, отвечающих конечной или счетной мощности. Они образуют вполне упо- упорядоченное множество. Нетрудно убедиться в том, что само это мно- множество уже несчетно. Действительно, обозначим в соответствии с общепринятой символикой через ио\ порядковый тип множества всех счетных трансфинитов. Если бы отвечающая ему мощность бы- была счетной, то счетным было бы и множество, имеющее порядковый тип ио\ + 1. Вместе с тем число ио\ следует, очевидно, за всеми транс- финитами, отвечающими конечной или счетной мощности. Обозначим мощность, отвечающую порядковому трансфиниту ио\, символом №]_. Легко видеть, что никаких мощностей т, удовлетво- удовлетворяющих неравенству ^о < т < Ni, нет. Действительно, если бы такая мощность т существовала, то в множестве W(uj\) всех порядковых трансфинитов, предшествую- предшествующих cji, имелось бы подмножество мощности т. Это подмножество вполне упорядочено и несчетно. Но тогда его порядковый тип а предшествовал бы uj\ и в то же время следовал за всеми счетными трансфинитами. Мы получили бы противоречие с определением ио\. 7. Аксиома выбора, теорема Цермело и другие эквива- эквивалентные им утверждения. Сравнимость вполне упорядоченных множеств по мощности подсказывает следующую постановку во- вопроса: нельзя ли всякое множество вполне упорядочить каким- либо образом? Положительный ответ означал бы, в частности, что несравнимых мощностей вообще не существует. Такой ответ дал Цермело, доказав, что каждое множество может быть вполне упорядочено. Доказательство этой теоремы (мы не будем воспроиз- воспроизводить его здесь, см., например, [2]) существенно опирается на так называемую аксиому выбора, состоящую в следующем. Пусть А — некоторое множество индексов а и пусть для ка- каждого а задано некоторое произвольное множество Ма. Тогда, как утверждает аксиома выбора, можно построить функцию ср на А, относящую каждому a Е А некоторый элемент та из соответ- соответствующего множества Ма. Иными словами, можно составить неко-
§ 4. Упорядоченные множества 45 торое множество, выбрав из каждого Ма по одному и только одному элементу. Теория множеств в той форме, в которой мы ее излагаем, восходит к Кантору и Цермело и является «наивной» теорией множеств. Акси- Аксиома выбора, называемая также аксиомой Цермело, возникшая в рам- рамках наивной теории множеств вместе с другими вопросами, такими, как континуум-гипотеза, т. е. вопрос о совпадении мощности контину- континуума с первой несчетной мощностью Ki, привела к многочисленным спо- спорам и к длинной серии работ по математической логике и основаниям математики. Были построены аксиоматические теории множеств Гёделя— Бернайса и Цермело-Френкеля. В рамках этих теорий была установле- установлена непротиворечивость и независимость аксиомы выбора. Мы отсылаем читателя к специальным работам: А. Френкель и И. Бар-Хиллел. Основа- Основания теории множеств. — М.: Мир, 1966; П.Дэю. Коэн. Теория множеств и континуум-гипотеза. — М.: Мир, 1969. Заметим, что отказ от аксиомы выбора существенно обедняет теоретико-множественные построения. Вместе с тем критика наивной теории множеств и попытки обойтись без аксиомы выбора повели к созданию таких замечательных теорий, как теория рекурсивных функций, и таких понятий, как понятие вычислимого числа. Сформулируем некоторые предложения, каждое из которых эк- эквивалентно аксиоме выбора (т. е. каждое из них может быть доказа- доказано, если принять аксиому выбора, и обратно, аксиому выбора можно доказать, допустив справедливость какого-либо из этих предложе- предложений). Прежде всего ясно, что таким предложением является сама теорема Цермело. Действительно, если предположить, что каждое из множеств Ма вполне упорядочено, то для построения функции ср, существование которой утверждается аксиомой выбора, достаточно в каждом Ма взять первый элемент. Для формулировки других предложений, эквивалентных аксиоме выбора, введем следующие понятия. Пусть М — частично упорядо- упорядоченное множество. Всякое его подмножество А, в котором любые два элемента сравнимы между собой (в смысле введенной в М ча- частичной упорядоченности), будем называть цепью. Цепь называет- называется максимальной, если она не содержится в качестве собственного подмножества ни в какой другой цепи, принадлежащей М. Далее, назовем в частично упорядоченном множестве М элемент а верх- верхней гранью подмножества М' С М, если любой элемент a' Е М' подчинен а. Теорема Хаусдорфа. В частично упорядоченном множестве всякая цепь содержится в некоторой его максимальной цепи. Следующее предложение представляет собой, пожалуй, наиболее удобную из всех формулировок, эквивалентных аксиоме выбора.
46 Гл. I. Элементы теории множеств Лемма Цорна. Если всякая цепь в частично упорядоченном множестве М имеет верхнюю грань, то всякий элемент из М под- подчинен некоторому максимальному. Доказательство равносильности всех приведенных утверждений (аксиома выбора, теорема Цермело, теорема Хаусдорфа, лемма Цор- Цорна) имеется, например, в книге А. Г. Курош. Лекции по общей ал- алгебре. — М.: Физматгиз, 1962; см. также [8]. Мы не будем его здесь воспроизводить. Если множество верхних граней подмножества А имеет наименьший элемент а, то а называют точной верхней гранью подмножества А, ана- аналогично определяется точная нилсняя грань. Частично упорядоченное множество, всякое непустое конечное подмножество которого обладает точной верхней гранью и точной нижней гранью, называется решеткой, или структурой. 8. Трансфинитная индукция. Широко распространенный ме- метод доказательства тех или иных утверждений — это метод матема- математической индукции. Он, как известно, состоит в следующем. Пусть имеется некоторое утверждение Р(п), которое формулируется для каждого натурального числа п, и пусть известно, что: 1) утверждение РA) верно; 2) из того, что Р(к) верно для всех к ^ п, следует, что Р{п + 1) верно. Тогда утверждение Р{п) верно для всех п = 1,2,... Действи- Действительно, в противном случае среди тех п, для которых Р(п) неверно, нашлось бы наименьшее число, скажем, п\. Очевидно, что п\ > 1, т. е. п\ — 1 тоже натуральное число, и мы приходим к противоречию с условием 2). Аналогичный прием может быть использован с заменой нату- натурального ряда любым вполне упорядоченным множе- множеством. В этом случае он носит название трансфинитной индукции. Таким образом, метод трансфинитной индукции состоит в следую- следующем. Пусть дано некоторое вполне упорядоченное множество А (если угодно, его можно считать множеством всех порядковых транс- финитов, меньших некоторого данного) и пусть Р(а) — некоторое утверждение, формулируемое для каждого a Е А и такое, что Р(а) верно для первого элемента из А и верно для а, если оно верно для всех элементов, предшествующих а. Тогда Р{сь) верно для всех a G А. Действительно, если бы существовали элементы в А, для которых Р(а) не имеет места, то в множестве таких элементов на- нашелся бы первый, скажем, а*, и мы пришли бы к противоречию, поскольку для всех а < а* утверждение Р(а) было бы верно.
5. Системы мноэюеств 47 Так как в силу теоремы Цермело всякое множество можно впол- вполне упорядочить, трансфинитная индукция может быть, в принципе, применена к любому множеству. Однако практически бывает удоб- удобнее пользоваться заменяющей ее леммой Цорна, которая опирается лишь на наличие частичной упорядоченности в рассматриваемом множестве. А некоторая частичная упорядоченность рассматривае- рассматриваемых объектов в задачах, требующих применения леммы Цорна, обычно возникает естественным образом, «сама собой». § 5. Системы множеств1) 1. Кольцо множеств. Системой мноэюеств называется всякое множество, элементы которого сами представляют собой какие-либо множества. Если не оговорено противное, мы будем рассматривать системы таких множеств, каждое из которых является подмноже- подмножеством некоторого фиксированного множества X. Системы множеств мы будем обозначать прописными готическими буквами. Основной интерес для нас будут представлять системы множеств, удовлетво- удовлетворяющие (по отношению к введенным в § 1 операциям) некоторым определенным условиям замкнутости. Определение 1. Непустая система множеств 9\ называется кольцом, если она обладает тем свойством, что изЛб^НиБЕ^К следует ААВе9\иАпВе9\. Так как для любых А и В AU В = (А А В) U (АП В) и А\В = Аа(АпВ), тоизАе91иБе91 вытекает также принадлежность к 9\ мно- множеств A U В и А \ В. Таким образом, кольцо множеств есть система множеств, замкнутая по отношению к взятию суммы и пересечения, вычитанию и образованию симметрической разности. Очевидно, что кольцо замкнуто и по отношению к образованию любых конечных сумм и пересечений вида С= U М, D= П Ак. к=1 к=1 1) Рассматриваемые в этом параграфе понятия понадобятся нам в гл. V при изложении общей теории меры. Поэтому чтение данного параграфа может быть отложено. Читатель, решивший ограничиться при изучении теории меры мерой на плоскости (§ 1 гл. V), может этот параграф пропустить совсем.
48 Гл. I. Элементы теории множеств Любое кольцо содержит пустое множество 0, так как всегда А\А = 0. Система, состоящая только из пустого множества, пред- представляет собой наименьшее возможное кольцо множеств. Множество Е называется единицей системы множеств E, если оно принадлежит в и если для любого A Е в имеет место равенство АПЕ = А. Таким образом, единица системы множеств в есть не что иное, как максимальное множество этой системы, содержащее все другие входящие в в множества. Кольцо множеств с единицей называется алгеброй множеств. Примеры. 1. Для любого множества А система 9Я(А) всех его подмножеств представляет собой алгебру множеств с единицей Е = А. 2. Для любого непустого множества А система {0, А}, состоящая из множества А и пустого множества 0, образует алгебру множеств с единицей Е — А. 3. Система всех конечных подмножеств произвольного множе- множества А представляет собой кольцо множеств. Это кольцо будет ал- алгеброй в том и только том случае, когда множество А само конечно. 4. Система всех ограниченных подмножеств числовой прямой является кольцом множеств, не содержащим единицы. Из определения кольца множеств непосредственно вытекает Теорема 1. Пересечение *И = f]У\а любого множества колец есть кольцо. Установим следующий простой, но важный для дальнейшего факт. Теорема 2. Для любой непустой системы множеств в суще- существует одно и только одно кольцо *R(&), содержащее в и содержа- содержащееся в любом кольце 11, содержащем в. Доказательство. Легко видеть, что кольцо 9К(&) определя- определяется системой в однозначно. Для доказательства его существования рассмотрим объединение X = (J А всех множеств А, входящих Лее в в, и кольцо Ш(Х) всех подмножеств множества X. Пусть Е — совокупность всех колец множеств, содержащихся в 9Я(Х) и содер- содержащих в. Пересечение ф = f] УК всех этих колец и будет, очевидно, искомым кольцом
5. Системы мноэюеств 49 Действительно, каково бы ни было кольцо *Н*, содержащее E, пересечение 9\ = *И* П 9Я(Х) будет кольцом из Е и, следовательно, в С ?Н С 91*, т. е. ф действительно удовлетворяет требованию ми- минимальности. Это кольцо называется минимальным кольцом над в или кольцом, порожденным в, и обозначается 2. Полукольцо множеств. В ряде вопросов, например, в тео- теории меры, наряду с понятием кольца важную роль играет более общее понятие полукольца множеств. Определение 2. Система множеств в называется полуколь- полукольцом, если она содержит пустое множество 0, замкнута по отно- отношению к образованию пересечений и обладает тем свойством, что из принадлежности к в множеств А и А\ С А вытекает возмож- п ность представления А в виде А — (J Аь, где Аь — попарно не- пересекающиеся множества из E, первое из которых есть заданное множество А\. В дальнейшем всякий набор попарно непересекающихся мно- множеств Ai, ... , Ап, объединение которых есть заданное множество А, мы будем называть конечным разложением множества А. Всякое кольцо множеств 9\ является полукольцом, так как если А и А\ С А входят в 9^, то имеет место разложение А = Ах U А2, где Ах = А \ Ах е 71. Примером полукольца, не являющегося кольцом множеств, мо- может служить совокупность всех интервалов (а, Ь), отрезков [а, Ь] и по- полуинтервалов [а, Ь) и (а, Ь] на числовой прямой1). Еще одним приме- примером служит совокупность всех «полуоткрытых» прямоугольников a<x^b,c<y^d на плоскости или совокупность всех полуот- полуоткрытых параллелепипедов в пространстве. Установим следующие свойства полуколец множеств. Лемма 1. Пусть множества А\,..., Ап, А принадлежат полу- полукольцу в, причем множества А\ попарно не пересекаются и все со- содержатся в А. Тогда набор множеств Ai (ъ = 1,..., п) можно допол- дополнить множествами An+i, ... , As G в до конечного разложения s А= \J Ak, s^n, к=1 множества А. 1)При этом в число интервалов включается, конечно, «пустой» интервал (a, a), а в число отрезков — отрезок, состоящий из одной точки [а, а].
50 Гл. I. Элементы теории множеств Доказательство проведем по индукции. При п = 1 справед- справедливость утверждения леммы вытекает из определения полукольца. Предположим, что это утверждение справедливо для п = т и рас- рассмотрим т + 1 множество Ai,..., Ат, Am+i, удовлетворяющих усло- условиям леммы. По сделанному предположению А = Ах U • • • U Аш U Вх • • • U Вр, где все множества Bq (q = 1,...,р) принадлежат в. Положим Bqi = Am+i П Bq. По определению полукольца, имеется разложе- разложение Bq = Bqi U • • • U Bqr, где все Bqj принадлежат в. Легко видеть, ЧТ0 U U Bqj . gf=l 4j=2 J Таким образом, утверждение леммы доказано для п = т + 1, а сле- следовательно, и вообще для всех п. Лемма 2. Какова бы ни была конечная система множеств Ai,..., Ап, принадлежащих полукольцу в, в в найдется такая ко- конечная система попарно непересекающихся множеств В\, ... , Bt, что каждое А^ может быть представлено в виде суммы Ak= U В8 некоторых из множеств Bs. Доказательство. При п = 1 лемма тривиальна, так как до- достаточно положить t = 1, В\ — А\. Допустим, что она справед- справедлива для n = m, и рассмотрим в в некоторую систему множеств Ai,..., Am, Аш+1. Пусть Bi,..., Bt — множества из в, удовлетво- удовлетворяющие условиям леммы по отношению к А\,..., Аш. Положим В si = Am+i П Bs. В силу леммы 1 имеет место разложение Ат+1 = U Ва1 U U В'р, В'р 6 6, A) s=l р=1 а в силу самого определения полукольца имеет место разложение Легко видеть, что Bs = BslU---UBsfs, Bsj G 6. fs = U U и что множества Вф В'р
5. Системы мноэюеств 51 попарно не пересекаются. Таким образом, множества Bsj, B'p удо- удовлетворяют условиям леммы по отношению к Ai,..., Ат, Аш+1. 3. Кольцо, порожденное полукольцом. Мы уже видели в п. 1, что для каждой системы множеств в существует единствен- единственное минимальное кольцо, содержащее в. Однако для произвольной системы E фактическое построение кольца 9К(&) по E довольно сложно. Оно становится вполне обозримым в том важном случае, когда в представляет собой полукольцо. Это построение дается сле- следующей теоремой. Теорема 3. Если 6 — полукольцо, то <ИF) совпадает с систе- системой 3 множеств А, допускающих конечные разложения А= U на множества А^ Е &. Доказательство. Покажем, что система 3 образует кольцо. Если А и В — два произвольных множества из 3, то имеют место разложения n m А= [jAh в= U в,, Аее, Bjee. i=l j=l Так как в — полукольцо, то множества dj =AiH Bj тоже входят в в. В силу леммы 1 имеют место разложения Ai = U Сц U U fla; Bj = U Сц U U Eji, B) 3 k=l г 1=1 где Dik, Eji G в. Из равенств B) вытекает, что множества А П В и А А В допускают разложения и, следовательно, входят в 3- Таким образом, 3 действительно пред- представляет собой кольцо; его минимальность среди всех колец, содер- содержащих в, очевидна. 4. сг-алгебры. В различных вопросах, в частности, в теории ме- меры, приходится рассматривать суммы и пересечения не только ко- конечного, но и счетного числа множеств. Поэтому целесообразно, по- помимо понятия кольца множеств, ввести еще следующие понятия.
52 Гл. I. Элементы теории множеств Определение 3. Кольцо множеств называется а-кольцом, если оно вместе с каждой последовательностью множеств А\,... ..., Ап,... содержит сумму S = \JAn. П Определение 4. Кольцо множеств называется 5-колъцом, если оно вместе с каждой последовательностью множеств А\,... ..., Ап,... содержит пересечение D = f]An. П Естественно назвать а-алгеброй сг-кольцо с единицей и 5-алгеброй E-кольцо с единицей. Легко, однако, видеть, что эти два понятия совпадают: каждая сг-алгебра является в то же время 5-алгеброй, а каждая ^-алгебра — сг-алгеброй. Это вытекает из соотношений двойственности (см. § 1) (JAn = E\f)(E\An), f)An = E\(J(E\An). п п п п Простейшим примером сг-алгебры является совокупность всех подмножеств некоторого множества А. Если имеется некоторая система множеств в, то всегда существу- существует хотя бы одна сг-алгебра, содержащая эту систему. Действительно, положим Х= [j A лее и рассмотрим систему 03 всех подмножеств множества X. Ясно, что 03 есть сг-алгебра, содержащая в. Если 05 — произвольная сг-алгебра, содержащая в, и X — ее единица, то каждое А Е в содержится в X и, следовательно, X = (J А С X. Назовем лее сг-алгебру 05 неприводимой (по отношению к системе в), если X — U А. Иначе говоря, неприводимая сг-алгебра — это сг-алгебра, не содержащая точек, не входящих ни в одно из A G &. Естественно в каждом случае рассмотрением только таких сг-алгебр и ограничи- ограничиваться. Для неприводимых сг-алгебр имеет место теорема, аналогичная теореме 2, доказанной выше для колец. Теорема 4. Для любой непустой системы множеств в су- существует неприводимая (по отношению к этой системе) а-алгебра
5. Системы множеств 53 ), содержащая 6 и содержащаяся в любой a-алгебре, содержа- содержащей в. Доказательство проводится в точности тем же методом, что и доказательство теоремы 2; сг-алгебра Я3(©) называется минималь- минимальной а-алгеброй над системой в. В анализе важную роль играют так называемые борелевские множества, или В-мноэюества — множества на числовой прямой, принадлежащие минимальной сг-алгебре над совокупностью всех сегментов [а, Ъ]. 5. Системы множеств и отображения. Отметим следующие факты, которые нам понадобятся при изучении измеримых функ- функций. Пусть у = /(ж) — функция, определенная на множестве М и при- принимающая значения из множества JV, и пусть 9Л — некоторая си- система подмножеств множества М. Обозначим через /(9Я) систему всех образов f(A) множеств, принадлежащих ШТ. Пусть, кроме того, У1 — некоторая система множеств, содержащихся в JV, и /~1(ЭГ1) — система всех прообразов f~1(A) множеств, входящих в 91. Справед- Справедливы следующие утверждения, проверка которых предоставляется читателю: 1) Если 91 есть кольцо, то и /-1(91) есть кольцо. 2) Если 91 есть алгебра, то и /-1(91) есть алгебра. 3) Если 91 есть сг-алгебра, то и /~1(91) есть сг-алгебра. 4) 5) Останутся ли эти утверждения справедливыми, если j~x заменить на /, а 91 — на 9Я?
ГЛАВА II МЕТРИЧЕСКИЕ И ТОПОЛОГИЧЕСКИЕ ПРОСТРАНСТВА § 1. Понятие метрического пространства 1. Определение и основные примеры. Одной из важных опе- операций анализа является предельный переход. В основе этой опера- операции лежит тот факт, что на числовой прямой определено расстояние от одной точки до другой. Многие фундаментальные факты ана- анализа не связаны с алгебраической природой действительных чисел (т.е. с тем, что они образуют поле), а опираются лишь на понятие расстояния. Обобщая представление о действительных числах как о множестве, в котором введено расстояние между элементами, мы приходим к понятию метрического пространства — одному из важнейших понятий современной математики. Ниже мы изложим основные факты теории метрических пространств и их обобщения — топологических пространств. Результаты этой главы суще- существенны для всего дальнейшего изложения. Определение. Метрическим пространством называется па- пара (Х,р), состоящая из некоторого множества (пространства) X элементов (точек) и расстояния, т. е. однозначной, неотрицатель- неотрицательной, действительной функции р(х,у), определенной для любых х и у из X и подчиненной следующим трем аксиомам: 1) р(х, у) = 0 тогда и только тогда, когда х = у, 2) р(х,у) = р(у,х) (аксиома симметрии), 3) p(x,z) ^ р{х,у) + p(y,z) (аксиома треугольника). Само метрическое пространство, т.е. пару (Х,р), мы будем обо- обозначать, как правило, одной буквой: В случаях, когда недоразумения исключены, мы будем зачастую обозначать метрическое пространство тем же символом, что и сам «запас точек» X. Приведем примеры метрических пространств. Некоторые из этих пространств играют в анализе весьма важную роль.
1. Понятие метрического пространства 55 1. Положив для элементов произвольного множества 0, если х = ?/, 1, если х ф у, мы получим, очевидно, метрическое пространство. Его можно на- назвать пространством изолированных точек. 2. Множество действительных чисел с расстоянием р(х,у) = \х-у\ образует метрическое пространство Ж1. 3. Множество упорядоченных групп из п действительных чисел х = (х\,..., хп) с расстоянием A) к=1 называется п-мерным арифметическим евклидовым пространст- пространством W1. Справедливость аксиом 1) и 2) для W1 очевидна. Покажем, что в Жп выполнена и аксиома треугольника. Пусть х = 0ь...,жп), у = B/ь... ,2/n), z = (zu...,zn)] тогда аксиома треугольника записывается в виде \ к=1 \ Ук - хкJ к=1 \ B) к=1 Полагая ук - хк = ак, zk - ук = Ьк, получаем zk - хк = ак + а неравенство B) принимает при этом вид \ к=\ \ Е«1 + л k=i \ C) к=1 Но это неравенство сразу следует из известного неравенства Коши- Буняковского1) akbk к=1 D) к=1 к=1 1) Неравенство Коши-Буняковского вытекает из тождества п п п п которое проверяется непосредственно.
56 Гл. П. Метрические и топологические пространства Действительно, в силу этого неравенства имеем п п п п % Л . 7 \ 2 \. Л О % Л % Л О 2_^\ак + Ojfe) = ^^ afe + 2 2_^ Ukbk + ^^ ^^ ^ к=1 к=1 к=1 к=1 k=i Л k=i k=i Л к=1 \ k=i тем самым неравенство C), а следовательно, и B) доказаны. 4. Рассмотрим то же самое множество упорядоченных групп из п действительных чисел х = (xi,...,xn), но расстояние определим в нем формулой pi(x,y) = ^2\хк -ук\. E) к=1 Справедливость аксиом 1)-3) здесь очевидна. Обозначим это метри- метрическое пространство символом Ж™. 5. Возьмем снова то же самое множество, что и в примерах 3 и 4, и определим расстояние между его элементами формулой Роо(х,у)= max \ук-хк\. F) Справедливость аксиом 1)-3) очевидна. Это пространство, которое мы обозначим М^, во многих вопросах анализа не менее удобно, чем евклидово пространство Жп. Последние три примера показывают, что иногда и в самом де- деле важно иметь различные обозначения для самого метрического пространства и для множества его точек, так как один и тот же запас точек может быть по-разному метризован. 6. Множество С [а, Ь] всех непрерывных действительных функций, определенных на сегменте [а, 6], с расстоянием p{f,g)=max\g(t)-№\ G) также образует метрическое пространство. Аксиомы 1)-3) проверя- проверяются непосредственно. Это пространство играет очень важную роль в анализе. Мы будем его обозначать тем же символом С [а, Ь], что и само множество точек этого пространства. Вместо С[0,1] мы бу- будем писать просто С. 7. Обозначим через fa метрическое пространство, точками кото- которого служат всевозможные последовательности х = (xi,..., хп,...) действительных чисел, удовлетворяющие условию оо к=1
1. Понятие метрического пространства 57 а расстояние определяется формулой \ к=1 Из элементарного неравенства (ж/. ± УкJ (8) ^ + f/2,) следует, что функция р(х, у) имеет смысл для всех ж, у Е Ь, т. е. ряд сходится, если ^ — ж/.J Покажем теперь, что функция (8) удовлетворяет аксиомам метри- метрического пространства. Аксиомы 1) и 2) очевидны, а аксиома тре- треугольника принимает здесь вид \ k=l \ к=1 \ (9) к=1 В силу сказанного выше каждый из трех написанных здесь рядов сходится. С другой стороны, при каждом п справедливо неравенство \ к=\ \ п Е< к=1 %к ~ УкJ \ к=1 (см. пример 4). Переходя здесь к пределу при п —у оо, получаем (9), т.е. неравенство треугольника в 1^. 8. Рассмотрим, как и в примере б, совокупность всех функций, не- непрерывных на отрезке [а, 6], но расстояние определим иначе, а имен- именно, положим р(х,у)= (f(x(t)-y(t)Jdty/2. A0) а Такое метрическое пространство мы будем обозначать С2[сц Ь] и называть пространством непрерывных функций с квадратичной метрикой. Здесь аксиомы 1) и 2) метрического пространства опять- таки очевидны, а аксиома треугольника непосредственно вытекает из интегральной формы неравенства Коши—Буняковского1) Оъ \2ь ъ r x(t)y(t)dt) ^ [ x2(t)dt- fy2(t) I J J ' П П dt. 1)Это неравенство может быть получено, например, из легко проверяемого тождества Ъ ч 2 Ъ Ъ Ъ Ъ x(t)y(t)dt) = Г x2(t)dt Г y2(t)dt- 1 Г f[x(s)y(t)-y(s)x(t)]2i 2dsdt.
58 Гл. П. Метрические и топологические пространства 9. Рассмотрим множество всех ограниченных последовательно- последовательностей х = (xi,..., хп,...) действительных чисел. Положив р(х,у) = sup I?//. -xk\, A1) к мы получим метрическое пространство, которое обозначим т. Спра- Справедливость аксиом 1)-3) очевидна. 10. Множество упорядоченных групп из п действительных чисел с расстоянием , П ч 1/р Рр(х,у)= (Y,\yk-Xk\p) , A2) где р — любое фиксированное число ^ 1, представляет собой метри- метрическое пространство, которое мы обозначим Ж?. Справедливость ак- аксиом 1) и 2) здесь опять-таки очевидна. Проверим аксиому 3). Пусть х = (жь...,жп), у = B/ь... ,2/n), z = B:1,...,zn) —три точки из М?. Положим Ук — %k = a>k, %k — Ук — bk, тогда неравенство у^р(ж,2:) ^ рР(х,у) +pP(y,z), справедливость которого мы должны установить, примет вид 1/р , П \1/р/Г1 \ 1/р (У) У) . A3) Это — так называемое неравенство Минковского. При р = 1 нера- неравенство Минковского очевидно (модуль суммы не превосходит сум- суммы модулей), поэтому будем считать, что р > I1). Доказательство неравенства A3) при р > 1 основано на так на- называемом неравенстве Гёльдера 1/р/П ч 1/q (?) ) ( 4=i ^ 4=i где числа р > 1 и g > 1 связаны условием 1 + 1 = 1, т.е. q = ^-v A5) Заметим, что неравенство A4) однородно. Это значит, что если оно выполнено для каких-либо двух векторов a— (ai,...,an) и Ъ = (&i,..., Ьп), то оно выполнено и для векторов Ла и /ab, где Л 1) При р < 1 неравенство Минковского не имеет места. Иначе говоря, если бы мы захотели рассматривать пространство Ш^ при р < 1, то в таком пространстве не была бы выполнена аксиома треугольника.
1. Понятие метрического пространства 59 и \i — произвольные числа. Поэтому неравенство A4) достаточно доказать для случая, когда Итак, пусть выполнено условие A6); докажем, что 1. A6) A7) k=l Рассмотрим на плоскости (?, 77) кривую, определяемую уравнени- уравнением г\ — ?1Р~1 (? > 0), или, что то же самое, уравнением ? = T]q~1 (рис. 7). Из рисунка ясно, что при лю- любом выборе положительных значений а и Ъ будет S\ + S2 ^ о>Ъ. Вычислим пло- Ь щади S\ ж S2'' 0' • * Рис.7 Таким образом, справедливо числовое неравенство Заменив здесь а на |а&| и Ъ на |Ь^| и суммируя по к от 1 до п, получим, учитывая A5) и A6), Неравенство A7), а следовательно, и общее неравенство A4) дока- доказаны. При р = 2 неравенство Гёльдера A4) переходит в неравенство Коши-Буняковского D). Перейдем теперь к доказательству неравенства Минковского. Для этого рассмотрим тождество Заменяя в написанном тождестве а на а& и Ъ на bk и суммируя по к от 1 до п, получим fe=l fe=l
60 Гл. П. Метрические и топологические пространства Применяя теперь к каждой из двух сумм, стоящих справа, нера- неравенство Гёльдера и учитывая, что (р — l)q = p, получим 1/?/г п -| 1/р г п -| 1/р Е E Деля обе части этого неравенства на п получим 1/р у п х 1/р откуда сразу следует неравенство A3). Тем самым установлена ак- аксиома треугольника в пространстве Ж™. Рассмотренная в этом примере метрика рр превращается в евкли- евклидову метрику (пример 3) при р = 2 и в метрику примера 4 при р = 1. Можно показать, что метрика Роо(х,у) = max |2д. -ж^|, введенная в примере 5, является предельным случаем метрики рр(х,у), именно: хк=1 Из неравенства установленного выше, легко выводится и интегральное неравенство Гёльдера ъ / ь \1/р / ъ \1/я / \x(t)y(t)\dt ^ ( I \x(t)\>dt\ ( / \y(i)\qdt\ , а ^а ' ^а ' справедливое для любых функций x(t) и y(t), для которых стоящие справа интегралы имеют смысл. Отсюда в свою очередь получается интегральное неравенство Минковского Ь \ 1/Р / Ъ \1/Р / Ъ \1/Р I \x(t) + y(t)\pdt) ^ I I \x(t)\pdt) + I I \y(t)\pdt) .
§ 1. Понятие метрического пространства 61 11. Укажем еще один интересный пример метрического простран- пространства. Его элементами являются всевозможные последовательности действительных чисел х = (xi,..., хп,...), такие, что к=1 где р ^ 1 — некоторое фиксированное число, а расстояние опреде- определяется формулой \Ук-хк\П . A8) 4=1 J Это метрическое пространство мы обозначим 1Р. В силу неравенства Минковского A3) имеем при любом п к=1 к=1 к=1 Так как, по предположению, ряды (X) (X) к=1 к=1 сходятся, то, переходя к пределу при п —У оо, получим ( Г (Г( к=1 к=1 к=1 Таким образом, доказано, что формула A8), определяющая рассто- расстояние в 1р, действительно имеет смысл для любых ж, у G 1Р. Одно- Одновременно неравенство A9) показывает, что в 1Р выполнена аксиома треугольника. Остальные аксиомы очевидны. Неограниченное количество дальнейших примеров дает следую- следующий прием. Пусть R = (X, р) — метрическое пространство и М — любое подмножество в X. Тогда М с той же функцией р(х,у), ко- которую мы считаем теперь определенной для х и у из М, тоже пред- представляет собой метрическое пространство; оно называется подпро- подпространством пространства R. 2. Непрерывные отображения метрических пространств. Изометрия. Пусть X и Y — два метрических пространства и / — отображение пространства X в Y. Таким образом, каждому х G X ставится в соответствие некоторый элемент у = /(ж) из Y. Это ото- отображение называется непрерывным в точке xq E X, если для каж- каждого г > 0 существует такое 5 > 0, что для всех х Е X таких, что р(х,х0) < S,
62 Гл. П. Метрические и топологические пространства выполнено неравенство Pi(f(x),f(x0)) <e (здесь р — расстояние в X, а р\ — расстояние в Y). Если отобра- отображение / непрерывно во всех точках пространства X, то говорят, что / непрерывно на X. Если X и Y — числовые множества, т.е. / — числовая функция, определенная на некотором подмножестве X числовой оси, то приведенное определение непрерывности отобра- отображения превращается в хорошо известное из элементарного анализа определение непрерывности функции. Аналогично можно определить непрерывную функцию (отобра- (отображение) / от нескольких переменных х\ Е Х\,..., хп Е Хп (где Х\,..., Хп — метрические пространства) со значениями в метри- метрическом пространстве У". Заметим в этой связи, что само расстояние р(х,у), если рассма- рассматривать его как функцию переменных х и у из X, непрерывно. Это сразу же следует из неравенства \р(х,у) -р(хо,уо)\ ^ р(хо,х) +/оB/о,2/), легко выводимого из неравенства треугольника. Если отображение / : X —у Y взаимно однозначно, то существу- существует обратное отображение х = f~1(y) пространства Y на простран- пространство X. Если отображение / взаимно однозначно и взаимно непре- непрерывно (т.е. / и /-1 — непрерывные отображения), то оно назы- называется гомеоморфным отображением или гомеоморфизмом, а са- сами пространства X и У, между которыми можно установить го- гомеоморфизм, называются гомеоморфными между собой. Примером гомеоморфных метрических пространств могут служить вся число- числовая прямая (—оо, оо) и интервал, например, интервал (—1,1). В этом случае гомеоморфизм устанавливается формулой у= farctgx. Важным частным случаем гомеоморфизма является так называемое изометрическое отображение. Говорят, что биекция / между метрическими пространствами R = (X, р) и R' = (У, р') является изометрией, если p(xi,x2) = p'(f(xi),f(x2)) для любых х\, Х2 G R. Пространства R и R', между которыми можно установить изометрическое соответствие, называются изометрич- ными. Изометрия пространства R и R' означает, что метрические связи между их элементами одни и те же; различной может быть лишь
§ 2. Сходимость. Открытые и замкнутые множества 63 природа их элементов, что с точки зрения теории метрических про- пространств несущественно. В дальнейшем изометричные между собой пространства мы будем рассматривать просто как тождественные. К изложенным здесь понятиям (непрерывность, гомеоморфизм) мы вернемся, с более общей точки зрения, в конце § 5 этой главы. § 2. Сходимость. Открытые и замкнутые множества 1. Предельные точки. Замыкание. Мы введем здесь некото- некоторые понятия теории метрических пространств. Эти понятия мы не- неоднократно используем в дальнейшем. Открытым шаром B(xq, г) в метрическом пространстве R мы бу- будем называть совокупность точек х Е Л, удовлетворяющих условию р(х,х0) < г. Точка хо называется центром этого шара, а число г — его радиусом. Замкнутым шаром B[xq, г] мы назовем совокупность точек х Е R, удовлетворяющих условию р(х,х0) ^ г. Открытый шар радиуса г с центром хо мы будем называть также е-окрестностью точки xq и обозначать символом O?(xq). Упражнение. Привести пример метрического пространства и та- таких двух шаров B(x,pi), B(y,p2) в нем, что pi > p2, и тем не менее B(x,pi) C%p2). Множество М С R называется ограниченным, если оно содержит- содержится целиком в некотором шаре. Точка х G R называется точкой прикосновения множест- множества М С R, если любая ее окрестность содержит хотя бы одну точку из М. Совокупность всех точек прикосновения множества М обозна- обозначается [М] и называется замыканием этого множества. Таким обра- образом, мы определили для множеств метрического пространства опе- операцию замыкания — переход от множества М к его замыканию [М]. Теорема 1. Операция замыкания обладает следующими свой- свойствами: 1) м с [М], 2) [[М]] = [М], 3) если Мг С М2, то [Мг[с [М2], 4) [MiUM2] = [Mi]u[M2].
64 Гл. П. Метрические и топологические пространства Доказательство. Первое утверждение очевидно, так как вся- всякая точка, принадлежащая М, является для М точкой прикоснове- прикосновения. Докажем второе. Пусть х Е [[М]]. Тогда в любой окрестности О?(х) этой точки найдется точка х\ Е [М]. Положим г — р(х,х\) = г± и рассмотрим шар О?1 {х\). Этот шар целиком лежит внутри шара 0?{х). Действи- Действительно, если z Е О?1 (х\), то p(z,xi) < S\, и так как р(х,х\) = е — б\, то по аксиоме треугольника p(z,x) <б! + (e-?i) = ?, т. е. z Е Ое(ж). Так как xi G [М], то в О?1 (х\) найдется точка х<± G М. Но тогда Ж2 G 0?{х). Так как Ое(ж) — произвольная окрестность точки ж, то х G [М]. Второе утверждение доказано. Третье свойство очевидно. Докажем, наконец, четвертое свой- свойство. Если х G [Mi U M2], то х содержится по крайней мере в одном из множеств [Mi] или [М2], т.е. [MiUM2] С [Mi]U[M2]. Так как Mi С Mi U М2 и М2 С Mi U М2, то обратное включение следует из свойства 3). Теорема доказана полностью. Точка х G R называется предельной точкой множества М С R, если любая ее окрестность содержит бесконечно много точек из М. Предельная точка может принадлежать, а может и не принад- принадлежать М. Например, если М — множество рациональных чи- чисел из отрезка [0,1], то каждая точка этого отрезка — предельная для М. Точка ж, принадлежащая М, называется изолированной точкой этого множества, если в достаточно малой ее окрестности О?(х) нет точек из М, отличных от х. Предлагаем читателю дока- доказать в качестве упражнения следующее утверждение: Всякая точка прикосновения множества М есть либо предель- предельная, либо изолированная точка этого множества. Отсюда можно заключить, что замыкание [М] состоит, вообще говоря, из точек трех типов: 1) изолированные точки множества М; 2) предельные точки множества М, принадлежащие М; 3) предельные точки множества М, не принадлежащие М. Таким образом, замыкание [М] получается присоединением к М всех его предельных точек. 2. Сходимость. Пусть Ж1,ж2,... — последовательность точек в метрическом пространстве R. Говорят, что эта последовательность
§ 2. Сходимость. Открытые и замкнутые множества 65 сходится к точке ж, если каждая окрестность 0?(х) точки ж содер- содержит все точки жп, начиная с некоторой, т.е. если для всякого г > О найдется такое число N?, что О?(х) содержит все точки хп с п > N?. Точка х называется пределом последовательности {хп}. Это определение можно, очевидно, сформулировать еще и следу- следующим образом: последовательность {жп} сходится к ж, если lim p(x,xn) = 0. п—юо Непосредственно из определения предела вытекает, что 1) ника- никакая последовательность не может иметь двух различных пределов и что 2) если последовательность {хп} сходится к точке ж, то и вся- всякая ее подпоследовательность сходится к той же самой точке. Следующая теорема устанавливает тесную связь между понятия- понятиями точки прикосновения и предела. Теорема 2. Для того чтобы точка х была точкой прикоснове- прикосновения множества М, необходимо и достаточно, чтобы существовала последовательность {хп} точек из М, сходящаяся к х. Доказательство. Условие необходимо, так как если х — точ- точка прикосновения множества М, то в каждой ее окрестности Oi/n(x) содержится хотя бы одна точка xn Е М. Эти точки образуют после- последовательность, сходящуюся к х. Достаточность очевидна. Если х — предельная точка множества М, то точки xn Е О\/П{х) П М, отвечающие разным п, можно выбрать попарно различными. Таким образом, для того чтобы точка х была предель- предельной для М, необходимо и достаточно, чтобы в М существовала последовательность попарно различных точек, сходящаяся к х. Понятие непрерывности отображения метрического пространст- пространства X в метрическое пространство У, введенное в § 1, можно те- теперь сформулировать в терминах сходимости последовательностей. Именно, отображение у = /(ж) непрерывно в точке жо, если для вся- всякой последовательности {жп}, сходящейся к жо, последовательность {уп = /(жп)} сходится к у о = /(жо). Доказательство равносильности этого определения приведенному в § 1 ничем не отличается от дока- доказательства равносильности двух определений непрерывности («на языке г, ?» и «на языке последовательностей») функций числового аргумента и может быть предоставлено читателю. 3. Плотные подмножества. Пусть А ж В — два множества в метрическом пространстве R. Множество А называется плотным в В, если [А] э В. В частности, множество А называется всюду плотным (в пространстве Л), если его замыкание [А] совпадает со
66 Гл. П. Метрические и топологические пространства всем пространством R. Например, множество рациональных чисел всюду плотно на числовой прямой. Множество А называется нигде не плотным, если оно не плотно ни в одном шаре, т. е. если в каждом шаре В С R содержится другой шар В', не имеющий с А ни одной общей точки. Примеры пространств, имеющих всюду плотное счетное множество. Пространства, в которых имеется счетное всюду плотное множество, называют сепарабельными. Рассмотрим с этой точки зрения примеры, которые приведены в § 1. 1. «Дискретное» пространство, описанное в примере 1 § 1, содер- содержит счетное всюду плотное в нем множество тогда и только тогда, когда оно само состоит лишь из счетного числа точек. Дело в том, что замыкание [М] любого множества М в этом пространстве со- совпадает с М. Все пространства, перечисленные в примерах 2—8 § 1, содержат счетные всюду плотные множества. Укажем в каждом из них по та- такому множеству, настоятельно рекомендуя читателю провести по- подробные доказательства. 2. На действительной оси Ж — рациональные точки. 3—5. В n-мерном евклидовом пространстве Жп и в пространствах Ж™, Ж^ — совокупность векторов с рациональными координатами. 6. В пространстве С [а, Ь] — совокупность всех многочленов с ра- рациональными коэффициентами. 7. В пространстве fa — совокупность последовательностей, в каж- каждой из которых все члены рациональны и лишь конечное (свое для каждой последовательности) число этих членов отлично от нуля. 8. В пространстве C^fa, b] — совокупность всех многочленов с ра- рациональными коэффициентами. Вместе с тем пространство ограниченных последовательностей т (пример 9 § 1) несепарабельно. Действительно, рассмотрим всевозможные последовательности, состоящие из нулей и единиц. Они образуют множество мощности континуума (так как между ними и подмножествами натурально- натурального ряда можно установить взаимно однозначное соответствие). Рас- Расстояние между двумя такими точками, определяемое формулой A1) § 1, равно 1. Окружим каждую из этих точек открытым шаром ра- радиуса 1/2. Эти шары не пересекаются. Если некоторое множество всюду плотно в т, то каждый из построенных шаров должен содер- содержать хотя бы по одной точке из этого множества, и, следовательно, оно не может быть счетным.
§ 2. Сходимость. Открытые и замкнутые мноэюества 67 4. Открытые и замкнутые множества. Рассмотрим важней- важнейшие типы множеств в метрическом пространстве, а именно, откры- открытые и замкнутые множества. Множество М, лежащее в метрическом пространстве Л, называ- называется замкнутым, если оно совпадает со своим замыканием: [М] = М. Иначе говоря, множество называется замкнутым, если оно содержит все свои предельные точки. В силу теоремы 1 замыкание любого множества М есть замкну- замкнутое множество. Из той же теоремы вытекает, что [М] есть наимень- наименьшее замкнутое множество, содержащее М. (Докажите это!) Примеры. 1. Всякий отрезок [а, Ь] числовой прямой есть замк- замкнутое множество. 2. Замкнутый шар представляет собой замкнутое множество. В частности, в пространстве С [а, Ь] множество функций /, удовлет- удовлетворяющих условию \f(t)\ ^ К, замкнуто. 3. Множество функций в С [а, Ь], удовлетворяющих условию \f(t)\ < К (открытый шар), не замкнуто; его замыкание есть сово- совокупность функций, удовлетворяющих условию \f(t)\ ^ К. 4. Каково бы ни было метрическое пространство Л, пустое мно- множество 0 и всё R замкнуты. 5. Всякое множество, состоящее из конечного числа точек, зам- замкнуто. Основные свойства замкнутых множеств можно сформулировать в виде следующей теоремы. Теорема 3. Пересечение любого числа и сумма любого конеч- конечного числа замкнутых множеств суть замкнутые множества. Доказательство. Пусть F = P\Fa — пересечение замкнутых множеств Fa и пусть х — предельная точка для F. Это означает, что любая ее окрестность О?(х) содержит бесконечно много точек из F. Но тогда тем более О?(х) содержит бесконечно много точек из каждого Fa и, следовательно, так как все Fa замкнуты, точка х принадлежит каждому Fa; таким образом, х G F = HFa, т.е. F замкнуто. Пусть теперь F — сумма конечного числа замкнутых п множеств: п F = У Fj, и пусть точка х не принадлежит F. Покажем, что х г=1 не может быть предельной для F. Действительно, х не принадлежит ни одному из замкнутых множеств i^, следовательно, не является предельной ни для одного из них. Поэтому для каждого г можно
68 Гл. П. Метрические и топологические пространства найти такую окрестность O?i (х) точки ж, которая содержит ни бо- более чем конечное число точек из F{. Взяв из окрестностей О?1 (ж),..., О?п (ж) наименьшую, мы получим окрестность О?(х) точки ж, содер- содержащую не более чем конечное число точек из F. Итак, если точка х не принадлежит F, то она не может быть предельной для F, т. е. F замкнуто. Теорема доказана. Точка х называется внутренней точкой множества М, если су- существует окрестность О?(х) этой точки, целиком содержащаяся в М. Множество, все точки которого внутренние, называется откры- открытым. Примеры. 6. Интервал (а, Ь) числовой прямой Ж1 есть откры- открытое множество; действительно, если а < а < 6, то О?(а), где г = min(a — а, Ъ — а), целиком содержится в интервале (а, Ъ). 7. Открытый шар В (а, г) в любом метрическом пространстве R есть открытое множество. Действительно, если х Е В (а, г), то р(а,х) < г. Положим е — г — р(а,х). Тогда В(х,е) С В (а, г). 8. Множество непрерывных функций на [а, 6], удовлетворяющих условию /(?) < #(?), где g(t) — некоторая фиксированная непрерыв- непрерывная функция, представляет собой открытое подмножество простран- пространства С [а, Ь]. Теорема 4. Для того чтобы множество М было открыто, не- необходимо и достаточно, чтобы его дополнение R\M до всего про- пространства R было замкнуто. Доказательство. Если М открыто, то каждая точка х из М имеет окрестность, целиком принадлежащую М, т.е. не имеющую ни одной общей точки с R \ М. Таким образом, ни одна из точек, не принадлежащих R \ М, не может быть точкой прикосновения для R\ М, т. е. R\ M замкнуто. Обратно, если R\ M замкнуто, то любая точка из М имеет окрестность, целиком лежащую в М, т.е. М открыто. Так как пустое множество и все R замкнуты и в то же время служат дополнениями друг друга, то пустое множество и всё R открыты. Из теоремы 3 и из принципа двойственности (пересечение допол- дополнений равно дополнению суммы, сумма дополнений равна дополне- дополнению пересечения, см. п. 2 § 1 гл. 1) вытекает следующая важная теорема, двойственная теореме 3.
§ 2. Сходимость. Открытые и замкнутые множества 69 Теорема 3'. Сумма любого (конечного или бесконечного) чи- числа и пересечение любого конечного числа открытых множеств суть открытые множества. Множества, принадлежащие сг-алгебре, порожденной всеми от- открытыми и замкнутыми подмножествами пространства R, называ- называются борелевскими множествами. 5. Открытые и замкнутые множества на прямой. Структу- Структура открытых и замкнутых множеств в том или ином метрическом пространстве может быть весьма сложной. Это относится к от- открытым и замкнутым множествам даже евклидова пространства двух или большего числа измерений. Однако в одномерном случае, т. е. на прямой, исчерпывающее описание всех открытых множеств (а следовательно, и всех замкнутых) не представляет труда. Оно дается следующей теоремой. Теорема 5. Всякое открытое множество на числовой прямой представляет собой сумму конечного или счетного числа попарно непересекающихся интерваловг). Доказательство. Пусть G — открытое множество на пря- прямой. Введем для точек из G отношение эквивалентности, считая, что х ~ у, если существует такой интервал (а,/3), что х,у Е (а,/3) С G. Очевидно, это отношение рефлексивно и симметрично, оно и тран- зитивно, так как если х ~ у ну ~ z, то существуют такие интервалы (а,C) и G,й), что x,ye(a,0)cG и y,ze(rf,S)cG. Но тогда j < 5 и интервал (а, 5) лежит целиком в G и содержит точки х и z. Следовательно, G распадается на непересекающиеся классы 1Т эквивалентных между собой точек: G = UIT. Докажем, что каждое 1Т есть интервал (а, 6), где a=inf /r, 6=sup/r. Включение 1Т С (а, Ь) очевидно. С другой стороны, если ж, у G /г, то по самому определению 1Т интервал (х,у) содержится в 1Т. В лю- любой близости от а справа и в любой близости от Ъ слева есть точки из 1Т. Поэтому 1Т содержит любой интервал (а', Ь'), концы которого принадлежат (а, 6), откуда 1Т = (а, Ъ). Система таких непересекаю- непересекающихся интервалов 1Т не более чем счетна; действительно, выбрав 1) Множества вида ( — сю, сю), (а, сю) и ( — сю,/5) мы при этом также включаем в число интервалов.
70 Гл. П. Метрические и топологические пространства в каждом из этих интервалов произвольным образом рациональ- рациональную точку, мы установим взаимно однозначное соответствие между этими интервалами и некоторым подмножеством множества рацио- рациональных чисел. Теорема доказана. Так как замкнутые множества — это дополнение открытых, то из теоремы 5 следует, что всякое замкнутое множество на прямой получается выбрасыванием из прямой конечного или счетного чис- числа интервалов. Простейшие примеры замкнутых множеств — отрезки, отдель- отдельные точки и суммы конечного числа таких множеств. Рассмотрим более сложный пример замкнутого множества на прямой — так на- называемое канторово множество. Пусть Fq — отрезок [0, 1]. Выбросим из него интервал (^h4h а оставшееся замкнутое множество обозначим F\. Затем выбросим из F\ интервалы ( А, ^ ) и (^,§),а оставшееся замкнутое множество (состоящее из четырех отрезков) обозначим F^. В каждом из этих /-|\3 четырех отрезков выбросим средний интервал длины ( k I и т. д. (рис. 8). Продолжая этот процесс, получим убывающую последова- последовательность замкнутых множеств Fn. Положим оо F = П Fn. п=0 Множество F — замкнутое (как пересечение замкнутых); оно полу- получается из отрезка [0, 1] выбрасыванием счетного числа интервалов. 0 1 0 1/3 2/3 1 _ ^1 0 1/3 2/3 1 1/9 2/9 7/9 8/9 Рис. 8 Рассмотрим структуру множества F. Ему принадлежат, очевид- очевидно, точки 01 — — — — — — A) — концы выбрасываемых интервалов. Однако множество F не ис- исчерпывается этими точками. Действительно, точки отрезка [0,1],
§ 2. Сходимость. Открытые и замкнутые множества 71 которые входят в множество F, можно охарактеризовать следую- следующим образом. Запишем каждое из чисел ж, 0 ^ х ^ 1, в троичной системе счисления где числа ап могут принимать значения 0, 1 и 2. Как и в случае десятичных дробей, некоторые числа допускают двоякую запись. Например, з - з + з2 г " з ^ з2 з3 з™ ^ • • • Легко проверить, что множеству F принадлежат те и только те числа ж, 0 ^ х ^ 1, которые могут быть записаны хотя бы одним способом в виде троичной дроби так, чтобы в последовательности ai,..., an,... ни разу не встретилась единица. Таким образом, каж- каждой точке х Е F можно поставить в соответствие последователь- последовательность аь.. .,ап,..., B) где ап равно 0 или 2. Совокупность таких последовательностей обра- образует множество мощности континуума. В этом можно убедиться, поставив в соответствие каждой последовательности B) последова- последовательность h,...,bn,..., B') где Ъп = 0, если ап = 0, и Ъп = 1, если ап = 2. Последовательность B;) можно рассматривать как запись некоторого действительного числа у, 0 ^ у ^ 1, в виде двоичной дроби. Таким образом, мы получаем отображение множества F на весь отрезок [0,1]. Отсюда вытекает, что F имеет мощность континуумах). Так как множество точек A) счетно, то эти точки не могут исчерпывать все F. Упражнения. 1. Доказать непосредственно, что точка 1/4 принадлежит множеству F, не являясь концом ни одного из выбрасываемых интервалов. Указание. Точка 1/4 делит отрезок [0,1] в отношении 1 : 3. Отрезок [0,1/3], остающийся после первого выбрасывания, она делит также в от- отношении 1 : 3 и т. д. Точки A) называются точками первого рода множества F, остальные его точки называются точками второго рода. 1) Установленное соответствие между F и отрезком [0,1] однозначно, но не взаимно однозначно (из-за того, что одно и то же число иногда может изо- изображаться различными дробями). Отсюда следует, что F имеет мощность не меньше, чем мощность континуума. Но F — часть отрезка [0,1], следовательно, его мощность не может быть больше, чем мощность континуума.
72 Гл. П. Метрические и топологические пространства 2. Доказать, что точки первого рода образуют в F всюду плотное мно- множество. 3. Показать, что числа вида t\ + ?2, где ti,t2 G F, заполняют весь отрезок [0, 2]. Мы показали, что множество F имеет мощность континуума, т. е. содержит столько же точек, сколько и весь отрезок [0,1]. С этим фактом интересно сопоставить следующий результат: сум- 19 4 ма длин i + 4 + yj + • • • всех выброшенных интервалов составляет в точности единицу! Дополнительные замечания. A) Пусть М — некоторое множество в метрическом пространстве R их — точка этого же пространства. Расстоянием от точки х до мноэюе- ства М называется число р(х,М) = inf р(х,а). Если х G М, то р(х, М) = 0, однако из того, что р(х, М) = 0, не сле- следует, что х G М. Из определения точки прикосновения непосредственно получаем, что р(х, М) = 0 в том и только том случае, когда х — точка прикосновения множества М. Таким образом, операцию замыкания мож- можно определить как присоединение к множеству всех тех точек, расстояние от которых до множества равно нулю. B) Аналогично определяется расстояние между двумя множествами. Если А, В — два множества в метрическом пространстве R, то р(А,В)= inf р(а,Ь). а?А; Ъ?В Если А П В ф 0, то р(А, В) = 0; обратное, вообще говоря, неверно. C) Пусть Мк — множество всех функций / из С[а,Ь], удовлетворяю- удовлетворяющих условию Липшица: для всех ti, ti G [a, b] где К — некоторое фиксированное число. Множество Мк замкнуто. Оно совпадает с замыканием множества всех дифференцируемых на [а, Ь] функций таких, что |/'(?)| ^ К. D) Множество М = (J Мк всех функций, каждая из которых удовле- к творяет условию Липшица при каком-либо К, не замкнуто. Его замыка- замыкание есть всё С [а, Ь]. E) Открытое множество G в n-мерном евклидовом пространстве на- называется связным, если любые две точки ж, у G G могут быть соеди- соединены ломаной, целиком лежащей в G. Например, внутренность круга х2 + у2 < 1 — связное множество. Наоборот, сумма двух кругов х2+у2<1 и {х-2J+у2<1
§ 3. Полные метрические пространства 73 — не связное множество (хотя у этих кругов есть общая точка прикосно- прикосновения!). Открытое подмножество Н открытого множества G называется компонентой множества G, если оно связно и не содержится ни в каком большем связном открытом подмножестве G. Введем в G отношение экви- эквивалентности; х ~ у, если существует открытое связное подмножество Н из G, накрывающее хну: х,у<ЕН CG. Как и в случае прямой, легко проверяется транзитивность и поэтому G распадается на непересекающиеся классы: G = U/. Эти классы — откры- открытые компоненты G. Число их не более чем счетно. В случае п = 1, т.е. на прямой, всякое связное открытое множество есть интервал (в число интервалов включаются и бесконечные интер- интервалы (—оо,а), (Ь, оо) и (—оо,оо)). Таким образом, теорема 5 о строении открытых множеств на прямой состоит из двух утверждений: а) всякое открытое множество на прямой есть сумма конечного или счетного чи- числа компонент и б) связное открытое множество на прямой есть интервал. Первое из этих утверждений верно и для множеств в n-мерных евклидо- евклидовых пространствах (и допускает дальнейшие обобщения), а второе отно- относится именно к прямой. § 3. Полные метрические пространства 1. Определение и примеры полных метрических прост- пространств. С первых шагов изучения математического анализа мы ви- видим, сколь важную роль играет в анализе свойство полноты число- числовой прямой, т. е. тот факт, что всякая фундаментальная последо- последовательность действительных чисел сходится к некоторому пределу. Числовая прямая служит простейшим примером так называемых полных метрических пространств, основные свойства которых мы рассмотрим в этом параграфе. Последовательность {хп} точек метрического пространства R мы будем называть фундаментальной, если она удовлетворяет крите- критерию Коши, т.е. если для любого г > 0 существует такое число N?J что р(хп>,хп>>) < е для всех п' > N?, n" > N?. Из аксиомы треугольника непосредственно следует, что всякая сходящаяся последовательность фундаментальна. Действительно, если {хп} сходится к ж, то для данного г > 0 можно найти такое число N?, что р(хп,х) < г/2 для всех п > N?. Тогда р(хп',хп") ^ ^ p{xni, х) + р(хп", х) < г для любых п' > N? и п" > N?. Определение 1. Если в пространстве R любая фундаменталь- фундаментальная последовательность сходится, то это пространство называется полным.
74 Гл. П. Метрические и топологические пространства Примеры. Все пространства, рассмотренные в § 1, за исключе- исключением указанного в примере 8, полные. Действительно: 1. В пространстве изолированных точек (пример 1 § 1) фундамен- фундаментальны только стационарные последовательности, т. е. такие, в ко- которых, начиная с некоторого номера, повторяется все время одна и та же точка. Всякая такая последовательность, конечно, сходит- сходится, т. е. это пространство полно. 2. Полнота евклидова пространства Ж — совокупности действи- действительных чисел — известна из анализа. 3. Полнота евклидова пространства Жп непосредственно вытекает из полноты Ж. В самом деле, пусть {хп } — фундаментальная по- последовательность точек из Ж71; это означает, что для каждого е > О найдется такое N = N?, что k=l при всех р, q больших, чем N. Здесь х^ = {ж-^ ,... ,Жп }. Тогда для каждого к = 1,...,п получаем соответствующее неравенство для координаты ж^ : |жЫ-ж(д)| <г для всех р, q > N, т.е. {ж^ } — фундаментальная числовая после- последовательность. Положим Xk = lim ж^ и ж = (ж1,... ,жп). Тогда, очевидно, lim ж^ = ж. р—>-оо 4-5. Полнота пространств М^ и М™ доказывается совершенно ана- аналогично. 6. Докажем полноту пространства С[а,Ь]. Пусть {жп(?)} — неко- некоторая фундаментальная последовательность в С [а, Ь]. Это означает, что для каждого г > 0 существует такое JV, что при п, т > N для всех ? (а ^ t ^ 6). Отсюда вытекает, что последо- последовательность {жп(?)} равномерно сходится. Как известно, в этом слу- случае ее предел x(t) будет непрерывной функцией. Устремляя в пре- предыдущем неравенстве т к бесконечности, получим |жп(?)-ж(?)| ^? для всех t и для всех п > JV, а это и означает, что {жп(?)} сходится к ж(?) в смысле метрики пространства С[а,6].
§ 3. Полные метрические пространства 75 7. Пространство fa- Пусть {ж^п^} — фундаментальная последова- последовательность в fa. Это означает, что для любого г > 0 найдется такое JV, что оо ,(п) _ (ш)ч2 < > лт (I) Здесь ж^п) = (ж^п ,... ,ж^ ). Из A) следует, что при любом к (ж^ — ж^ J < г, т.е. при каждом к последовательность дейст- действительных чисел {ж^ } фундаментальна и потому сходится. Поло- Положим Xk = Hm ж^ . Обозначим через ж последовательность (ж1,... ..., ж&,...). Нужно показать, что: оо а) 2_,х\ < °°5 т-е- х ^ Ь? к=1 б) Hm у^(ж(п),ж) = 0. п—^оо Сделаем это. Из неравенства A) следует, что для любого фиксиро- фиксированного М м к=1 В этой сумме теперь только конечное число слагаемых, и мы можем, зафиксировав п, перейти к пределу при т —У оо. Получим м к=1 Это равенство верно при любом М. Восстановим бесконечный ряд, переходя к пределу при М —у оо; получаем (X) 5>in)-**JO. B) к=1 Из сходимости рядов ^2 (хк J и S (ж^ ~ж^J следует сходимость к=1 к=1 оо ряда J^ x\ (в силу элементарного неравенства (a + bJ ^ 2(а2 + 62)), А;=1 т. е. утверждение а) доказано. Далее, так как г произвольно мало, то неравенство B) означает, что Hm р(х<уП\х) = Hm \ к=1 т.е. ж^п) —>¦ ж в метрике fa. Утверждение б) доказано.
76 Гл. П. Метрические и топологические пространства 8. Легко убедиться в том, что пространство С^а, Ь] не полно. Рас- Рассмотрим, например, последовательность непрерывных функций {-1 при - 1 ^ t ^ -1/п, nt при — 1/п ^ t ^ 1/п, 1 при 1/п ^ t ^ 1. Она фундаментальна в C^f— 1,1], так как Однако она не сходится ни к какой функции из G2 [—1,1]. Действи- Действительно, пусть / — некоторая функция из C^f— 1,1] и ф — разрывная функция, равная —1 при t < 0 и +1 при t ^ 0. В силу интегрального неравенства Минковского (справедливого, очевидно, и для кусочно-непрерывных функций) имеем ( -1 ( ) ( -1 -1 В силу непрерывности функции / интеграл в левой части отличен от нуля. Далее, ясно, что 1 lim ( (ipn(t)-i;(t)Jdt = 0. 1 Поэтому I (f(t) — cpn(t)Jdt не может стремиться к нулю при -1 п —У оо. Упражнение. Доказать, что пространство всех ограниченных после- последовательностей (пример 9 § 1) полно. 2. Теорема о вложенных шарах. В анализе широко использу- используется так называемая лемма о вложенных отрезках. В теории метри- метрических пространств аналогичную роль играет следующая теорема, называемая теоремой о вложенных шарах. Теорема 1. Для того чтобы метрическое пространство R бы- было полным, необходимо и достаточно, чтобы в нем всякая после- последовательность вложенных друг в друга замкнутых шаров, радиусы которых стремятся к нулю, имела непустое пересечение. Доказательство. Необходимость. Пусть пространство R полно и пусть В\, ??2, В%, ... — последовательность вложенных друг
§ 3. Полные метрические пространства 77 в друга замкнутых шаров. Пусть тп — радиус, а хп — центр ша- шара Вп. Последовательность центров {хп} фундаментальна, посколь- поскольку p(xnjxm) < rn при m > n, а гп —У 0 при п —У оо. Так как R полно, то lim хп существует. Положим х = lim хп; тогда х Е f] Вп. Дей- п—>-оо п—>-оо п ствительно, шар Вп содержит все точки последовательности {жп}, за исключением, быть может, точек xi,... , жп-ь Таким образом, х является точкой прикосновения для каждого шара Вп. Но так как Вп — замкнутое множество, то х Е Вп для всех п. Достаточность. Пусть {хп} — фундаментальная последова- последовательность. Докажем, что она имеет предел. В силу фундаменталь- фундаментальности мы можем выбрать такую точку хП1 нашей последователь- последовательности, что р(хп,хП1) < 1/2 при всех п ^ п\. Примем точку хп за центр замкнутого шара радиуса 1. Обозначим этот шар В\. Выбе- Выберем затем хП2 из {хп} так, чтобы было п^ > п\ и р(хп,хП2) < 1/22 при всех п ^ П2- Примем точку хП2 за центр шара радиуса 1/2 и обозначим этот шар В<±. Вообще, если точки хП1,..., хПк уже вы- выбраны (п\ < ••• < п/.), то выберем точку xnfc+1 так, чтобы было пк+\ > пк и ^(жп,жПй+1) < l/2fe+1 при всех п ^ nfe+b и окружим ее замкнутым шаром Bk+i радиуса 1/2*5. Продолжая это построе- построение, получим последовательность замкнутых шаров Вк, вложенных друг в друга, причем шар Вк имеет радиус \j2k~x. Эта последова- последовательность шаров имеет, по предположению, общую точку; обозначим ее х. Ясно, что эта точка х служит пределом подпоследовательно- подпоследовательности {хПк}. Но если фундаментальная последовательность содержит сходящуюся к х подпоследовательность, то она сама сходится к то- тому же пределу. Таким образом, х = lim xn. п—>-оо Упражнения. 1. Доказать, что пересечение замкнутых вложенных шаров в предыду- предыдущей теореме сводится к одной точке. 2. Диаметром множества М в метрическом пространстве называется число d(M) = sup p(x,y). х,у?М Доказать, что в полном метрическом пространстве всякая последователь- последовательность вложенных друг в друга непустых замкнутых множеств, диаметры которых стремятся к нулю, имеет непустое пересечение. 3. Привести пример полного метрического пространства и последова- последовательности вложенных друг в друга замкнутых шаров в нем, имеющей пустое пересечение. 4. Доказать, что подпространство полного метрического простран- пространства R полно тогда и только тогда, когда оно замкнуто в R.
78 Гл. П. Метрические и топологические пространства 3. Теорема Бэра. В теории полных метрических пространств фундаментальную роль играет следующая теорема. Теорема 2 (Бэр). Полное метрическое пространство R не мо- может быть представлено в виде объединения счетного числа нигде не плотных множеств. ОО Доказательство. Предположим противное. Пусть R=[J Мп, 71=1 где каждое из множеств Мп нигде не плотно. Пусть So — некото- некоторый замкнутый шар радиуса 1. Поскольку множество Mi, будучи нигде не плотным, не плотно в So, существует замкнутый шар Si радиуса меньше 1/2, такой, что Si С So и Si П Mi = 0. Посколь- Поскольку множество М.2 не плотно в Si, по той же причине в шаре Si содержится замкнутый шар $2 радиуса меньше 1/3, для которого $2 П М.2 — 0 и т. д. Мы получаем последовательность вложенных друг в друга замкнутых шаров {5П}, радиусы которых стремятся ОО к нулю, причем Sn П Мп = 0. В силу теоремы 1 пересечение Q Sn 71=1 содержит некоторую точку х. Эта точка по построению не принад- принадлежит ни одному из множеств Мп, следовательно, х ? \jMn, т.е. R ф (J Мп, в противоречии с предположением. п п В частности, всякое полное метрическое пространство без изо- изолированных точек несчетно. Действительно, в таком пространстве каждое множество, содержащее лишь одну точку, нигде не плотно. 4. Пополнение пространства. Если пространство R не полно, то его всегда можно включить некоторым (и, по существу, един- единственным) способом в полное пространство. Определение 2. Пусть R — метрическое пространство. Пол- Полное метрическое пространство Л* называется пополнением про- пространства Л, если: 1) R является подпространством пространства Л*; 2) R всюду плотно в й*, т. е. [R] = R*. (Здесь [R] означает, естественно, замыкание пространства R в Л*.) Например, пространство всех действительных чисел является по- пополнением пространства рациональных чисел. Теорема 3. Каждое метрическое пространство R имеет попол- пополнение, и это пополнение единственно с точностью до изометрии, оставляющей неподвижными точки из R. Доказательство. Начнем с единственности. Нам нуж- нужно доказать, что если Л* и Л** — два пополнения пространства Л,
§ 3. Полные метрические пространства 79 то существует такое взаимно однозначное отображение ср простран- пространства R* на Д**, что 1) ip(x) = ж для всех х G R; 2) если ж** = <р(х*) и ^/** = ip(y*), то pi(x*,y*) = Р2(х**,у**), где ^i — расстояние в R*, а /я2 — расстояние в Л**. Отображение <р определим следующим образом. Пусть ж* — про- произвольная точка из R*. Тогда по определению пополнения суще- существует последовательность {хп} точек из R, сходящаяся к ж*. Точ- Точки {хп} входят и в R**. Так как R** полно, то {хп} сходится в R** к некоторой точке ж**. Ясно, что ж** не зависит от выбора после- последовательности {жп}, сходящейся в точке ж*. Положим (р(х*) = ж**. Отображение ср и есть искомое изометрическое отображение. Действительно, по построению (р(х) = ж для всех ж Е R. Далее, пусть {жп}^ж* в R* и {жп}^ж** в Л**, {Уп}^У* в Л* и {2/п}^2/** в Л**; тогда в силу непрерывности расстояния pi (ж* ,2/*)= Hm p1(xn,yn)= lim p(xn,yn) п—>-оо п—>-оо и, аналогично, ?2О**,2/**) = lim p2(xn,yn)= lim p(xn,yn). п—>-оо п—>-оо Следовательно, Pi(ar*,1/*)=p2(a:",|/"). Докажем теперь существование пополнения. Идея этого до- доказательства та же, что и в канторовой теории действительных чи- чисел. Положение здесь даже проще, чем в теории действительных чи- чисел, так как там для вновь вводимых объектов — иррациональных чисел — требуется еще определить все арифметические операции. Пусть R — произвольное метрическое пространство. Назовем две фундаментальные последовательности {жп} и {ж^} из R эквивалент- эквивалентными (обозначение {жп} ~ {ж^}), если lim p(xn,x'n) = 0. Название п—>-оо «эквивалентность» оправдано, поскольку это отношение рефлексив- рефлексивно, симметрично и транзитивно. Отсюда следует, что все фунда- фундаментальные последовательности, которые можно составить из то- точек пространства Л, распадаются на классы эквивалентных между собой последовательностей. Определим теперь пространство Д*. За его точки мы примем всевозможные классы эквивалентных между собой фундаментальных последовательностей, а расстояние между ними зададим следующим образом. Пусть ж* и у* — два таких
80 Гл. П. Метрические и топологические пространства класса. Выберем в каждом из этих классов по одному представи- представителю, т.е. по некоторой фундаментальной последовательности {хп} и {уп}. Положим1) р(х*,у*) = lim p(xn,yn). C) п—>-оо Докажем корректность этого определения расстояния, т. е. дока- докажем, что предел C) существует и не зависит от выбора представи- представителей {хп} е ж* и {уп} е у*. В силу неравенства \р(хп,уп) - р(Хт,ут)\ ^ р(хп,Хт) + р(уп,Ут) D) получаем, что для всех достаточно больших пит \р(хп,уп) - р(хт,ут)\ ^ г, так как последовательности {хп} и {уп} фундаментальные. Таким образом, последовательность действительных чисел sn = = р(хп,уп) удовлетворяет критерию Коши и, следовательно, имеет предел. Этот предел не зависит от выбора {хп} G х* и {уп} G у*. Дейст- Действительно, пусть Ы,{х'п}ех* и {уп},{у'п}?у*- Выкладка, в точности аналогичная D), дает \р(хп,уп) - р(х'п,у'п)\ ^ р(хп,х'п) +р(уп,Уп)- Поскольку {хп} ~ {х'п} и {уп} ~ {у'п\, отсюда следует, что lim p(xnjyn)= lim p(x'n,y'n). п—>-оо п—>-оо Докажем, что в R* выполнены аксиомы метрического простран- пространства. Аксиома 1) непосредственно вытекает из определения эквива- эквивалентности фундаментальных последовательностей. Аксиома 2) очевидна. Проверим аксиому треугольника. Так как в исходном простран- пространстве R аксиома треугольника выполнена, то Р(хп, *п) ^ р(Хп,Уп) + р(Уп, Zn). Переходя к пределу при п —у оо, получаем lim p(xn,zn) ^ lim p(xn,yn) + lim p(yn,zn), п—уоо п—уоо п—уоо 1) Чтобы не усложнять запись, мы обозначаем расстояние в Ж* тем же сим- символом р, что и расстояние в исходном пространстве Ж.
§ 4. Принцип сжимающих отображений 81 Докажем теперь, что R можно рассматривать как подпростран- подпространство пространства Л*. Каждой точке ж Е R отвечает некоторый класс эквивалентных фундаментальных последовательностей, именно, совокупность всех последовательностей, сходящихся к точке ж. Этот класс непуст, по- поскольку он содержит стационарную последовательность, все члены которой равны х. При этом, если х = lim хп и у = lim yn, то п—>-оо п—>-оо р(х,у) = lim р(хп,уп). п—>-оо Следовательно, соотнеся каждой точке х ? R класс ж* сходящих- сходящихся к ней фундаментальных последовательностей, мы изометрически отобразим R в пространство R*. В дальнейшем мы можем не разли- различать само пространство R и его образ в Л* и рассматривать R как подпространство в R*. Покажем теперь, что R всюду плотно в R*. Действительно, пусть х* — некоторая точка из R* и г > 0 произвольно. Выберем в ж* пред- представителя, т. е. некоторую фундаментальную последовательность {хп}. Пусть N таково,что р(хп,хт) < г для всех п,т > N. Тогда имеем р(хп,х*) = lim р(хп,хт) ^е при п > N, т. е. произвольная окрестность точки ж* содержит неко- некоторую точку из R. Таким образом, замыкание R в R* есть всё R*. Остается доказать полноту R*. Заметим, прежде всего, что по по- построению Л* любая фундаментальная последовательность х\,..., хп,... точек из R сходится в Л* к некоторой точке, а именно, к точ- точке ж* G R*, определяемой самой этой последовательностью. Далее, так как R плотно в R*, то для любой фундаментальной последо- последовательности ж*,..., ж^,... точек из R* можно построить эквива- эквивалентную ей последовательность Ж1,..., жп,... точек из R. Для это- этого достаточно в качестве хп взять любую точку из Л, такую, что р(хп,Хп) < 1/п. Построенная последовательность {хп} фундамен- фундаментальна в R и, по определению, сходится к некоторой точке ж* G R*. Но тогда к ж* сходится и последовательность {ж^}. § 4. Принцип сжимающих отображений и его применения 1. Принцип сжимающих отображений. Ряд вопросов, свя- связанных с существованием и единственностью решений уравнений то- того или иного типа (например, дифференциальных уравнений), мож- можно сформулировать в виде вопроса о существовании и единственно- единственности неподвижной точки при некотором отображении соответствую-
82 Гл. П. Метрические и топологические пространства щего метрического пространства в себя. Среди различных критери- критериев существования и единственности неподвижной точки при такого рода отображениях один из простейших и в то же время наиболее важных — так называемый принцип сжимающих отображений. Пусть R — метрическое пространство. Отображение А простран- пространства R в себя называется сжимающим отображением, или короче, сжатием, если существует такое число а < 1, что для любых двух точек х,у Е R выполняется неравенство р(Ах,Ау) ^ ар(х,у). A) Всякое сжимающее отображение непрерывно. Действительно, если хп —у ж, то в силу A) и Ахп —у Ах. Точка х называется неподвижной точкой отображения А, если Ах = х. Иначе говоря, неподвижные точки — это решения уравне- уравнения Ах = х. Теорема 1 (принцип сжимающих отображений). Вся- Всякое сжимающее отображение, определенное в полном метрическом пространстве R, имеет одну и только одну неподвижную точку. Доказательство. Пусть хо — произвольная точка в R. Поло- Положим х\ — Ахо, Х2 = Ах\ = А2хо и т.д.; вообще, хп = Ахп-\ — Апхо. Покажем, что последовательность {хп} фундаментальная. Дей- Действительно, считая для определенности m ^ п, имеем p(xn,xm) = p(Anx0,Amx0) ^ ^ an{p(xQ,X1) + р(х!,Х2) -\ \ ^ апр(х0,Х!){1 + а + а2 + Так как а < 1, то при достаточно большом п эта величина сколь угодно мала. В силу полноты R последовательность {жп}, будучи фундаментальной, имеет предел. Положим х = lim xn. п—>-оо Тогда в силу непрерывности отображения А Ах = A lim xn = lim Axn = lim xn+i = x. n—>-oo n—>-oo n—>-oo Итак, существование неподвижной точки доказано. Дока- Докажем ее единственность. Если Ах = ж, Ау = у,
4. Принцип сжимающих отображений 83 то неравенство A) принимает вид р(х,у) ^ ар(х,у); так как а < 1, отсюда следует, что р(х,у) = О, т.е. х = 2/. Упражнение. Показать на примере, что отображение А, удовлетво- удовлетворяющее условию р(Ах,Ау) < р(х,у) для всех х ф у, может не иметь ни одной неподвижной точки. 2. Простейшие применения принципа сжимающих отоб- отображений. Принцип сжимающих отображений можно применять к доказательству теорем существования и единственности реше- решений для уравнений различных типов. Помимо доказательства суще- существования и единственности решения уравнения Ах = ж, принцип сжимающих отображений дает и фактический метод приближен- приближенного нахождения этого решения (метод последовательных приближений). Рассмотрим следующие простые примеры. 1. Пусть / — функция, которая определена на сегменте [а, 6], удовлетворяет условию Липшица с константой К < 1 и отображает сегмент [а, Ь] в себя. Тогда / есть сжимающее отображение и согласно доказанной теореме последова- последовательность жо, х\ — /(жо), Ж2 = f(xi), • • • сходится к единственному корню уравнения х = f(x). у, h ЛЬ) Л") а 0 / а / уу\л II1 II1 хх3х2 Рис. / у 1 1 1 9 / ' 1 1 1 1 1 | х0 ) / / у - э ъ > =х -Ах) X ъ Аа) ЛЬ) а 0 / с 1 7 Xq X2X4XX3 Рис. 10 / X, 1 7" 1 X
84 Гл. П. Метрические и топологические пространства В частности, условие сжимаемости выполнено, если функция имеет на сегменте [а, Ь] производную f'(x), причем |/'(ж)| ^ К < 1. На рис. 9 и 10 изображен ход последовательных приближений в случае 0 < f'(x) < 1 и в случае -1 < f'(x) < 0. Пусть теперь мы имеем дело с уравнением вида F{x) = 0, причем F(a) < 0, F(b) > 0 и 0 < Кх ^ F'(x) ^ К2 на [а, Ъ]. Введем функцию f(x) = х — XF(x) и будем искать решение уравнения х = /(ж), равно- равносильного уравнению F(x) = 0 при Л ф 0. Так как f'(x) = 1 — XF'(x), то 1 — ХК2 ^ f'{x) ^ 1 — ХК\ и нетрудно подобрать число Л так, чтобы можно было действовать методом последовательных прибли- приближений. Это — распространенный метод отыскания корня. 2. Рассмотрим отображение А n-мерного пространства в себя, за- задаваемое системой линейных уравнений п Если А есть сжатие, то мы можем применить метод последова- последовательных приближений к решению уравнения х = Ах. При каких же условиях отображение А будет сжатием? Ответ на этот вопрос зависит от выбора метрики в пространстве. Рассмо- Рассмотрим три варианта. а) Пространство Ж^, т.е. р(х,у) = max l<i<n ',У") = mfx \у[ - у"\ = \dij\\Xj-Xj Отсюда условие сжимаемости a ац[х) - х'-) 3 max x dijlmaxlXj -Xj = (max V i г = \aij\jp(x',x"). B) б) Пространство Щ, т.е. р(х,у) = J2 \хг ~ Уг г=1 ЕЕ ia
4. Принцип сжимающих отображений 85 Отсюда условие сжимаемости J^\aij\^a<l, j = l,...,n. C) в) Пространство Мп, т.е. р(х,у) = \Г^2(хг — yiJ. На основании V<=i неравенства Коши-Буняковского имеем Отсюда условие сжимаемости D) Таким образом, если выполнено хотя бы одно из условий1) B)— D), то существует одна и только одна точка (xi,..., хп) такая, что п Xi = ^2 aijxj + ^ь причем последовательные приближения к этому решению имеют вид ж(о) _ (ж(°) ж(°)) где (к) а в качестве ж^0^ = (х[ ,..., Хп ) можно взять любую точку из Мп. Каждое из условий B)-D) достаточно для того, чтобы ото- отображение у = Ах было сжатием. Относительно условий B) и C) 1)В частности, из любого из условий B)—D) вытекает, что йп — 1 а\2 Q-21 0-22 ~~ 0"п1 CLn2 CL2n dnn — 1 #0.
86 Гл. П. Метрические и топологические пространства можно было бы доказать, что они и необходимы для того, что- чтобы отображение у = Ах было сжатием (в смысле метрик а) или б) соответственно). Ни одно из условий B)-D) не необходимо для применимости ме- метода последовательных приближений. Если \cbij\ < 1/w, то все три условия B)—D) выполнены и метод последовательных приближений заведомо применим. Если \aij\ ^ 1/п, то ни одно из условий B)-D) не выполнено. 3. Теоремы существования и единственности для диффе- дифференциальных уравнений. В предыдущем пункте были даны два простейших примера применения принципа сжимающих отображе- отображений в одномерном и в n-мерном пространствах. Однако наиболее существенны для анализа применения этого принципа в бесконечно- бесконечномерных функциональных пространствах. Сейчас мы покажем, как с его помощью можно получить теоремы существования и един- единственности решения для некоторых типов дифференциальных и ин- интегральных уравнений. 1. Задача Коши. Пусть дано дифференциальное уравнение dy/dx = f(x,y) E) с начальным условием у(х0) = у0, F) причем функция / определена и непрерывна в некоторой плоской области G, содержащей точку (жо, 2/о)? и удовлетворяет в этой обла- области условию Липшица по у: \f(z,yi) -/(я,2/2I ^ М\У1 — 2/21- Докажем, что тогда на некотором сегменте \х — хо\ ^ d существу- существует, и притом только одно, решение у = (р(х) уравнения E), удовле- удовлетворяющее начальному условию F) (теорема Пикара). Уравнение E) вместе с начальным условием F) эквивалентно интегральному уравнению ф)=уо+ f f(t,<p(t))dt. G) Хо В силу непрерывности функции / имеем \f(x,y)\ ^ К в некоторой области G' С G, содержащей точку (жо?2/о)- Подберем d > 0 так, чтобы выполнялись условия: 1) (х?у) ? G'\ если \х — хо\ ^ d, \у — уо\ ^ Kd; 2) Md< 1.
§ 4. Принцип сжимающих отображений 87 Обозначим через С* пространство непрерывных функций ср, опре- определенных на сегменте \х — хо\ ^ d и таких, что \ф{х) — 2/01 ^ Kd, с метрикой p((fi, (р2) = max | <^i (x) — if 2 (x) |. Пространство С* полно, так как оно является замкнутым под- подпространством полного пространства всех непрерывных функций на [хо — d, жо + d]. Рассмотрим отображение ф = Aip, определяемое формулой #r)=2/o + f f(t,<p(t))dt, хо где \х — хо\ ^ d. Это отображение переводит полное пространство С* в себя и является в нем сжатием. Действительно, пусть ср G С*, ж — хо | ^ d. Тогда f(t,<p(t))dt\ и, следовательно, А(С*) С С*. Кроме того, ШХ)-МХ)\<: f \f(t,Mt))-f(t,ip2 хо ^ Mdmax l^i(x) — (f2(x)\. X Так как Md < 1, то А — сжатие. Отсюда вытекает, что уравнение ср = Аср (т. е. уравнение G)) име- имеет одно и только одно решение в пространстве С*. 2. Задача Коши для системы уравнений. Пусть дана система дифференциальных уравнений (Pi(x) = fi(x,(p1(x),...,(pn(x)), i = l,...,n, (8) с начальными условиями 1 i = l,...,n, (9) причем функции fi определены и непрерывны в некоторой области G пространства Mn+1, содержащей точку (xo,2/oi? • • • ?2/0п)? и летворяют условию Липшица {x,y?\ ... ,yW) - fi(x,y[2\ ... ,у^)\ ^ Mmax \yf] - yf Докажем, что тогда на некотором сегменте \х — xq\ ^ d сущест- существует одно и только одно решение начальной задачи (8), (9), т.е. одна и только одна система функций <^, удовлетворяющих уравне- уравнениям (8) и начальным условиям (9).
88 Гл. П. Метрические и топологические пространства Система (8) вместе с начальными условиями (9) эквивалентна системе интегральных уравнений <Pi(x)=yoi + f fi(t,Mt),---,<Pn(t))dt, i = l,...,n. A0) Xq В силу непрерывности функции fi ограничены в некоторой обла- области G' С G, содержащей точку (жо, 2/оъ • • • •> Уоп), т- е. существует та- такое постоянное число К, что |/^(ж,2/ъ ... ,2/n)| ^ If. Подберем d > 0 так, чтобы выполнялись условия: 1) (ж,2/1,...,2/п) е С,если |ж-жо| ^ d, |з/« — 2/о* I ^ ifd (г = 1,... ,п); 2) Md< 1. Рассмотрим пространство С^, элементами которого являются на- наборы ip = ((^i,..., ipn) из п функций, определенных и непрерывных при |ж — хо\ ^ б?, и таких, что \(fi(x) —yoi\ ^ ^"d- Определим метрику формулой р(<р,ф) = max|(^0) -^(ж)|. ж,г Введенное пространство полно. Отображение ф = А(р, задаваемое системой равенств Mx)=Voi+ f /i(t,(pi(t),...,(pn(t))dt, Хо есть сжимающее отображение полного пространства С% в себя. Действительно, и, следовательно, Отображение А — сжимающее, поскольку Md < 1. Отсюда вытекает, что операторное уравнение ср = Аср имеет одно и только одно решение в пространстве С^. 4. Применение принципа сжимающих отображений к ин- интегральным уравнениям. 1. Уравнения Фредгольма. Применим теперь метод сжи- сжимающих отображений для доказательства существования и един- единственности решения неоднородного линейного интегрального урав- уравнения Фредгольма второго рода, т.е. уравнения f(x) =Xf K(x, y)f(y) dy + ф), A1)
§ 4. Принцип сжимающих отображений 89 где К (так называемое ядро) и ср суть данные функции, / — искомая функция, а Л — произвольный параметр. Мы увидим, что наш метод применим лишь при достаточно ма- малых значениях параметра Л. Предположим, что К(х,у) и ср(х) непрерывны при а ^ х ^ 6, а ^у ^Ь и, следовательно, \К(х,у)\ ^ М. Рассмотрим отображение g = Af полного пространства С [а, Ь] в себя, задаваемое формулой ъ д(х) = Л I K(x, y)f(y) dy + <р(х). а Имеем p(9i,92) =max\g1(x) - д2(х)\ ^ |А|М(Ь - a) max \fi(x) -/2(ж)|. Следовательно, при Л < , г отображение А — сжимающее. Из принципа сжимающих отображений заключаем, что для вся- всякого Л с |А| < ,, г уравнение Фредгольма имеет единственное 1VJ. [ О (Л J непрерывное решение. Последовательные приближения к этому ре- решению /о, /i,..., /п,... имеют вид ь fn(x) = A I K(x,y)fn-1(y)dy +<р(ж), а где в качестве /о (ж) можно взять любую непрерывную функцию. 2. Нелинейные интегральные уравнения. Принцип сжимающих отображений можно применить и к нелинейному интегральному уравнению вида у + ф), A2) где К И(р непрерывны и, кроме того, ядро К удовлетворяет условию Липшица по своему «функциональному» аргументу: \K{x,y,zx) -K(x,y;z2)\ ^M\z! - z2\. В этом случае для отображения д = Af полного пространства G[а, Ь] в себя, заданного формулой g(x) = \fK(x,y;f(y))dy + v(x), A3) а имеет место неравенство max |#i(ж) - д2(х)\ ^ |A|MF-a)max|/i(x) -/2(ж)|, где #i = Afi, #2 = -4/2- Следовательно, при |А| < , г- отобра- 1VJ. 1С/ iX J жение А будет сжимающим.
90 Гл. П. Метрические и топологические пространства 3. Уравнения Вольтерра. Рассмотрим, наконец, интеграль- интегральное уравнение типа Вольтерра f(x)=\fK(x,y)f(y)dy + <p(x). A4) а Здесь, в отличие от уравнений Фредгольма, верхний предел в инте- интеграле — переменная величина х. Формально это уравнение можно рассматривать как частный случай уравнения Фредгольма, доопре- доопределив функцию К равенством: К(х,у) = 0 при у > х. Однако в случае интегрального уравнения Фредгольма мы были вынуждены ограничиться малыми значениями параметра Л, а к уравнениям Вольтерра принцип сжимающих отображений (и метод последовательных приближений) применим при всех значе- значениях Л. Точнее, речь идет о следующем обобщении принципа сжи- сжимающих отображений. Пусть А — такое непрерывное отображение полного метриче- метрического пространства R в себя, что некоторая его степень В = Ап является сжатием; тогда уравнение Ах = х имеет одно и только одно решение. Действительно, пусть х — неподвижная точка отображения ??, т. е. Вх = х. Имеем Ах = АВкх = ВкАх = Вкх0 -> х, к -»> оо, ибо отображение В — сжимающее, а потому последовательность Вхо, В2хо, В3хо,... для любого хо Е R сходится к неподвижной точке х отображения В. Следовательно, Ах = х. Эта неподвижная точка единственна, поскольку всякая точка, не- неподвижная относительно А, неподвижна и относительно сжимающе- сжимающего отображения Ап, для которого неподвижная точка может быть только одна. Покажем теперь, что некоторая степень отображения Af(x) = А / К(х, y)f(y) dy + ф) а является сжатием. Пусть Д и /2 — две непрерывные функции на от- отрезке [а, Ь]. Тогда -Ah{x)\ = [ I J a ^ |А|М(ж - a) max |/i (ж) - /2(
§ 5. Топологические пространства 91 Здесь М = тзх\К(х,у)\. Отсюда и, вообще, \Anh(x)-Anf2(x) где т = max|/i(x) - /2(ж)|. При любом значении Л число п можно выбрать настолько боль- Тогда отображение Ап будет сжатием. Итак, уравнение Вольтер- ра A4) при любом А имеет решение, и притом единственное. § 5. Топологические пространства 1. Определение и примеры топологических пространств. Основные понятия теории метрических пространств (предельная точка, точка прикосновения, замыкание множества и т.д.) мы вво- вводили, опираясь на понятие окрестности или, что, по существу, то же самое, на понятие открытого множества. Эти последние поня- понятия (окрестность, открытое множество) в свою очередь определя- определялись с помощью метрики, заданной в рассматриваемом простран- пространстве. Можно, однако, стать на другой путь и, не вводя в данном множестве R метрику, непосредственно определить в R систему от- открытых множеств посредством аксиом. Этот путь, обеспечивая зна- значительно большую свободу действий, приводит нас к топологичес- топологическим пространствам, по отношению к которым метрические про- пространства представляют собой хотя и весьма важный, но несколько специальный случай. Определение. Пусть X — некоторое множество — простран- пространство-носитель. Топологией в X называется любая система т его под- подмножеств G, удовлетворяющая двум требованиям: 1°. Само множество X и пустое множество 0 принадлежат т. 2°. Сумма U Ga любого (конечного или бесконечного) и пересече- а п ние Р| Gk любого конечного числа множеств из т принадлежат т. k=i Множество X с заданной в нем топологией г, т.е. пара (X,г), называется топологическим пространством.
92 Гл. П. Метрические и топологические пространства Множества, принадлежащие системе т, называются открытыми. Так же как метрическое пространство есть совокупность множе- множества точек — «носителя» и введенной в этом множестве метрики, топологическое пространство есть совокупность множества точек и введенной в нем топологии. Таким образом, задать топологическое пространство — это значит задать некоторое множество X и задать в нем топологию т, т. е. указать те подмножества, которые считают- считаются в X открытыми. Ясно, что в одном и том же множестве X можно вводить разные топологии, превращая его тем самым в различные тополо- топологические пространства. И все же топологическое пространство, т. е. пару (X, г), мы будем обозначать одной буквой, скажем, Т. Элемен- Элементы топологического пространства мы будем называть точками. Множества T\G, дополнительные к открытым, называются замк- замкнутыми множествами топологического пространства Т. Из аксиом 1° и 2° в силу соотношений двойственности (§ 1 гл. I) вытекает, что: 1. Пустое множество 0 и все Т замкнуты. 2. Пересечение любого (конечного или бесконечного) числа и сум- сумма конечного числа замкнутых множеств замкнуты. На основе этих определений естественно вводятся во всяком то- топологическом пространстве понятия окрестности, точки прикосно- прикосновения, замыкания множества и т. д. Именно: Окрестностью точки х Е Т называется всякое открытое множе- множество G С Т, содержащее точку ж; точка х Е Т называется точкой прикосновения множества МсГ, если каждая окрестность точки х содержит хотя бы одну точку из М; х называется предельной точ- точкой множества М, если каждая окрестность точки х содержит хотя бы одну точку из М, отличную от х. Совокупность всех точек при- прикосновения множества М называется замыканием множества М и обозначается символом [М]. Легко доказать (проведите это дока- доказательство), что замкнутые множества (определенные нами выше как дополнения открытых), и только они, удовлетворяют условию [М] = М. Как и в случае метрического пространства, [М] есть наименьшее замкнутое множество, содержащее М. Упражнение. Докажите, что операция замыкания [М], определен- определенная с помощью топологии, обладает свойствами 1)-4), сформулирован- сформулированными в теореме 1 § 2. Примеры. 1. В силу теоремы 3; § 2 открытые множества во вся- всяком метрическом пространстве удовлетворяют аксиомам 1° и 2° определения топологического пространства. Таким образом, всякое метрическое пространство является и топологическим простран- пространством.
§ 5. Топологические пространства 93 2. Пусть Т — произвольное множество. Будем считать откры- открытыми все его подмножества. Аксиомы 1° и 2° при этом, очевидно, выполнены, т. е. мы действительно получаем топологическое про- пространство. В нем все множества одновременно и открыты, и замкну- замкнуты, и, значит, каждое из них совпадает со своим замыканием. Та- Такой дискретной топологией обладает, например, метрическое пространство, указанное в примере 1 § 1. 3. В качестве другого крайнего случая рассмотрим в произволь- произвольном множестве X тривиальную топологию, состоящую только из двух множеств: всего X и пустого множества 0. Здесь замыка- замыкание каждого непустого множества есть всё X. Такое топологическое пространство можно назвать «пространством слипшихся точек». 4. Пусть Т состоит из двух точек а и Ъ, причем открытыми мно- множествами мы считаем всё Т, пустое множество и множество, состоя- состоящее из одной точки Ъ. Аксиомы 1° и 2° здесь выполнены. В этом про- пространстве (которое часто называют связным двоеточием) замкнуты такие подмножества: всё Т, пустое множество и точка а. Замыкание одноточечного множества {а} есть всё Т. Упражнение. Постройте все топологии в пространстве X, состоя- состоящем из двух, трех, четырех и пяти точек. 2. Сравнение топологий. Пусть на одном и том же носителе X заданы две топологии Т\ и т^ (тем самым определены два топо- топологических пространства: Т\ — (X,т\) и Т<± — (X,тг). Мы скажем, что топология т\ сильнее, или тоньше топологии Т2, если система множества т^ содержится в т\. Про топологию т^ при этом говорят, что она слабее, или грубее, чем т\. В совокупности всех возможных топологий множества X естест- естественным образом вводится частичная упорядоченность (топология т^ предшествует т\, если она слабее, чем т\). В этой совокупности то- топологий есть максимальный элемент — топология, в которой все множества открыты (пример 2), — и минимальный — топология, в которой открыты только всё X и 0 (пример 3). Теорема 1. Пересечение произвольного множества топологий т = П ra в X есть топология в X. Эта топология т слабее любой a ИЗ ТОПОЛОГИЙ Та. Доказательство. Ясно, что f]ra содержит X и 0. Далее, а из того, что каждое та замкнуто относительно взятия любых сумм и конечных пересечений, следует, что этим свойством обладает и г = р|та.
94 Гл. П. Метрические и топологические пространства Следствие. Пусть 03 — произвольный запас подмножеств мно- множества X; тогда существует минимальная топология в X, содержа- содержащая 03. Действительно, топологии, содержащие 03, существуют (напри- (например, та, в которой все А С X открыты). Пересечение всех топологий, содержащих 03, и есть искомая. Эта минимальная топология назы- называется топологией, порожденной системой 03, и обозначается г@3). Пусть X — произвольное множество и А — его подмножество. Следом системы множеств 03 на подмножестве А называется си- система 03^, состоящая из подмножеств вида А П ??, В Е 03. Легко видеть, что след (на А) топологии т (заданной в X) явля- является топологией та в А. Таким образом, всякое подмножество А любого топологического пространства само оказывается топологи- топологическим пространством. Топологическое пространство (А, та) назы- называется подпространством исходного топологического пространства (X, г). Ясно, что две различные топологии, т\ и Т2, в X могут поро- порождать одну и ту же топологию в А С X. Топология та называется относительной топологией в А. 3. Определяющие системы окрестностей. База. Аксио- Аксиомы счетности. Как мы видели, задать в пространстве Т тополо- топологию — это значит задать в нем систему открытых множеств. Однако в конкретных задачах бывает удобно задавать не всю топологию, а лишь некоторую ее часть, т. е. некоторый запас открытых мно- множеств, по которому однозначно определяется совокупность всех от- открытых подмножеств. Так, например, в метрическом пространстве мы ввели сначала понятие открытого шара (^-окрестности), а за- затем определили открытые множества как такие, в которых каждая точка содержится вместе с некоторой своей шаровой окрестностью. Иными словами, в метрическом пространстве открыты те и толь- только те множества, которые можно представить как суммы открытых шаров (в конечном или бесконечном числе). В частности, на прямой открыты множества, представимые в виде сумм интервалов, и толь- только они. Эти соображения приводят нас к важному понятию базы топологического пространства. Определение. Совокупность С открытых подмножеств назы- называется базой топологии пространства Т, если всякое открытое мно- множество в Т может быть представлено как сумма некоторого числа (конечного или бесконечного) множеств из С. Так, например, совокупность всех открытых шаров (с произволь- произвольным центром и радиусом) образует базу в метрическом простран- пространстве. В частности, система всех интервалов — база на прямой. Базу
§ 5. Топологические пространства 95 на прямой образуют и одни только интервалы с рациональными кон- концами, поскольку в виде суммы таких интервалов можно представить любой интервал, а значит, и любое открытое множество на прямой. Итак, топологию т пространства Т можно задать, указав в этом пространстве некоторую ее базу Q; эта топология т совпадает с со- совокупностью множеств, представимых как суммы множеств из Q. Всякая база Q в топологическом пространстве Т = (X, т) облада- обладает следующими двумя свойствами: 1) любая точка х Е X содержится хотя бы в одном G Е Q] 2) если х содержится в пересечении двух множеств G\ и G2 из Q, то существует такое G3 G G', что х G G3 С Gi HG2. Действительно, свойство 1) просто означает, что все X, будучи открытым, должно представляться как сумма каких-то множеств из б, а 2) вытекает из того, что G\ П G2 открыто и, следовательно, есть сумма каких-то элементов базы. Обратно, пусть X — произвольное множество и Q — система под- подмножеств в X, обладающая свойствами 1) и 2). Тогда совокупность множеств, представимых как суммы множеств из ??, образует в X топологию (т. е. удовлетворяет аксиомам 1° и 2° определения топо- топологического пространства). Действительно, пусть r(Q) — совокупность всех множеств из X, представимых как суммы множеств из Q. Тогда пустое множество1) и всё X принадлежат r{Q) и сумма любого числа множеств из r{Q) также принадлежит r{Q). Покажем, что пересечение любого конеч- конечного числа множеств из r(Q) принадлежит r(Q). Достаточно прове- проверить это для двух множеств. Пусть А = (J Ga и В = [JGp, тогда а C А П В = U (Ga П Gp). Из условия 2) следует, что каждое Ga П Gp содержится в r{Q). Но тогда и А П В G t{Q). Итак, мы получаем следующий результат. Теорема 2. Для того чтобы система Q подмножества G мно- множества X была базой некоторой топологии в X необходимо и доста- достаточно, чтобы Q обладала свойствами 1) и 2). Пусть теперь в пространстве Т задана некоторая фиксированная топология т. Взяв в Т некоторую систему Q открытых множеств, обладающую свойствами 1) и 2), и приняв ее за базу, мы очевидно получили в Т топологию t(Q), или совпадающую с исходной то- топологией г, или более слабую. Установим условия, при которых Q порождает именно данную топологию т. 1)Оно получается как сумма пустого множества элементов системы Q.
96 Гл. П. Метрические и топологические пространства Теорема 3. Для того чтобы система Q С G была базой данной топологии т, необходимо и достаточно следующее условие: 3) для каждого открытого множества G и каждой точки х Е G существует такое Gx Е б, что х Е Gx С G. Доказательство. Если условие 3) выполнено, то всякое от- открытое множество G представимо в виде G= U Gx, xeG т.е. Q есть база топологии т. Обратно, если Q есть база топологии т, то всякое G Е т представимо в виде суммы множеств из Q, а тогда для всякого х Е G найдется такое Gx Е G, что х Е Gx С G. Упражнение. Пусть Q\ и $2 — две базы в X (т.е. две системы мно- множеств, удовлетворяющих условиям 1) и 2), а т\ и тг, — определяемые ими топологии. Докажите, что п С тг в том и только том случае, если для любого G\ G Q\ и любой точки жЕй существует такое G2 G ?/2, что ж<Е?2 cGi. С помощью теоремы 3 легко установить, например, что во вся- всяком метрическом пространстве совокупность всех открытых шаров образует базу его топологии. Совокупность всех шаров с рациональ- рациональными радиусами также представляет собой базу. На прямой базой может служить, например, совокупность всех рациональных интер- интервалов (т.е. интервалов с рациональными концами). Важный класс топологических пространств образуют прост- пространства со счетной базой, т.е. такие пространства, в кото- которых существует хотя бы одна база, состоящая не более чем из счет- счетного числа множеств. Пространства со счетной базой называют так- также пространствами со второй аксиомой счетности. Если в топологическом пространстве Т имеется счетная база, то в нем обязательно имеется счетное всюду плотное множество, т. е. такое счетное множество, замыкание которого есть всё Т. Дейст- Действительно, пусть {Gn} — такая база. Выберем в каждом из элемен- элементов этой базы произвольную точку хп. Счетное множество X = {хп} всюду плотно в Т, так как в противном случае непустое открытое множество G = Т\ [X] не содержало бы ни одной точки из X, что не- невозможно, поскольку G есть сумма некоторых множеств из системы {Gn}, a xn G Gn. Топологические пространства со счетным всюду плотным множе- множеством, как и метрические, называются сепарабельными. Для метрических пространств верно утверждение, обратное толь- только что доказанному:
§ 5. Топологические пространства 97 Если метрическое пространство R сепарабельно, то в R есть и счетная база. Действительно, такую базу образуют, например, от- открытые шары В(хп, 1/га), где {хп} — счетное всюду плотное множе- множество, апиш независимо пробегают все натуральные числа. Таким образом, справедлива следующая теорема. Теорема 4. Метрическое пространство R имеет счетную базу тогда и только тогда, когда оно сепарабельно. В силу этой теоремы все примеры сепарабельных метрических пространств могут служить и примерами метрических пространств со второй аксиомой счетности. Несепарабельное пространство огра- ограниченных последовательностей (см. пример 9 § 1) не имеет и счетной базы. Замечание. Теорема 4, вообще говоря, неверна для произволь- произвольных (не метрических) топологических пространств: можно указать примеры сепарабельных пространств без счетной базы. Поясним происходящие здесь явления. Для каждой точки х метрического пространства R существует счетная система Я ее окрестностей (например, система открытых шаров В(х,1/п)), обладающая сле- следующим свойством: каково бы ни было открытое множество G, со- содержащее точку ж, найдется окрестность из системы Я, целиком ле- лежащая в G. Такая система окрестностей называется определяющей системой окрестностей точки х. Если точка х топологического пространства Т имеет счетную определяющую систему окрестностей, то говорят, что в этой точ- точке выполнена первая аксиома счетности. Если это верно для каж- каждой точки пространства Т, то пространство Т называется простран- пространством с первой аксиомой счетности. Всякое метрическое пространство, даже и несепарабельное, авто- автоматически удовлетворяет первой аксиоме счетности. Однако в про- произвольном топологическом пространстве (даже если оно состоит лишь из счетного числа точек) первая аксиома счетности может не иметь места. Поэтому те рассуждения, с помощью которых мы для метрического пространства вывели из наличия счетного всюду плотного множества существование в таком пространстве счетной базы, не переносятся на случай произвольного топологического про- пространства. Но даже и в сепарабельном топологическом пространстве с первой аксиомой счетности счетной базы может не быть. Система множеств {Ма} называется покрытием множества X, если (J Ма э X. Покрытие топологического пространства Т, состоя- а щее из открытых (замкнутых) множеств, называется открытым
98 Гл. П. Метрические и топологические пространства {замкнутым) покрытием. Если некоторая часть {Mai} покрытия {Ма} сама образует покрытие пространства Т, то {Mai} называет- называется подпокрытием покрытия {Ма}. Теорема 5. Если Т — топологическое пространство со счет- счетной базой, то из всякого его открытого покрытия можно выбрать конечное или счетное подпокрытие. Доказательство. Пусть {Оа} — некоторое открытое покры- покрытие пространства Т. Тогда каждая точка х Е Т содержится в не- некотором Оа. Пусть {Gn} — счетная база в Т. Для каждого х Е Т существует такой элемент Gn(x) этой базы, что х Е Gn(x) С Оа. Со- Совокупность выбранных таким образом множеств Gn(x) конечна или счетна и покрывает всё Т. Выбрав для каждого Gn(x) одно из со- содержащих его множеств Оа, мы и получим конечное или счетное подпокрытие покрытия {Оа}. Теорема доказана. По определению топологического пространства пустое множество и всё пространство Т одновременно открыты и замкнуты. Простран- Пространство, в котором нет никаких других множеств, одновременно от- открытых и замкнутых, называется связным. Прямая линия Ж пред- представляет собой один из простейших примеров связных пространств. Если же из Ж удалить одну или несколько точек, то оставшееся пространство уже не будет связным. 4. Сходящиеся последовательности в Т. На топологические пространства легко переносится знакомое нам в случае метрических пространств понятие сходящейся последовательности. Именно, последовательность xi,... ,жп,... точек из Т называется сходящейся к точке ж, если любая окрестность точки х содержит все точки этой последовательности, начиная с некоторой. Однако в топологических пространствах это понятие сходимости не играет той фундаментальной роли, которая ему принадлежит в метриче- метрических пространствах. Дело в том, что в метрическом пространстве R точка х есть точка прикосновения множества М С R в том и только том случае, когда в М существует последовательность, сходящаяся к ж, тогда как в топологическом пространстве это, вообще говоря, не так. Из того, что х есть точка прикосновения для М (т. е. принад- принадлежит [М]) в топологическом пространстве Т не вытекает существо- существование в М последовательности, сходящейся к х. Возьмем в качестве примера отрезок [0,1] и назовем открытыми те его подмножества (наряду с пустым множеством), которые получаются из него выбра- выбрасыванием любого конечного или счетного числа точек. Легко про- проверить, что требования 1° и 2° (п. 1 § 5) при этом будут выполнены,
§ 5. Топологические пространства 99 т. е. мы получим топологическое пространство. В этом пространстве сходящимися будут только стационарные последовательности, т. е. такие, элементы которых, начиная с некоторого номера, совпадают: %п = %п+\ = • • • (докажите это!). С другой стороны, если мы возь- возьмем, например, в качестве М полуинтервал @,1], то точка 0 будет для него точкой прикосновения (проверьте!), но никакая последова- последовательность точек из М не сходится к 0 в нашем пространстве. Сходящиеся последовательности «восстанавливаются в своих правах», если мы рассматриваем не произвольные топологические пространства, а пространства с первой аксиомой счетности, т. е. если у каждой точки х пространства Т существует счетная определяю- определяющая система окрестностей. В этом случае каждая точка прикосно- прикосновения х произвольного множества М С Т может быть представле- представлена как предел некоторой последовательности точек из М. Действи- Действительно, пусть {Оп} — счетная определяющая система окрестностей точки х. Можно считать, что On+i С Оп (иначе мы заменили бы Оп п на Р| Ok)- Пусть Xk — произвольная точка из М, содержащаяся k=i в Ok (к = 1,2,...). Ясно, что такое Xk существует, иначе х не было бы точкой прикосновения для М. Последовательность {ж/.}, очевид- очевидно, сходится к х. Первой аксиоме счетности удовлетворяют, как мы отмечали, все метрические пространства. Именно поэтому мы и смогли все такие понятия, как замыкание, точка прикосновения и т.д., сформулиро- сформулировать для метрических пространств в терминах сходимости последо- последовательностей. 5. Непрерывные отображения. Гомеоморфизм. Понятие непрерывного отображения, введенное нами для метрических про- пространств в § 1, естественно обобщается на произвольные топологи- топологические пространства. Определение. Пусть X и Y — два топологических простран- пространства. Отображение / пространства X в пространство Y называ- называется непрерывным в точке жо, если для любой окрестности Uyo точки уq = /(жо) найдется такая окрестность VXo точки жо, что f(VXo) С Uyo. Отображение / : X —У Y называется непрерывным, если оно непрерывно в каждой точке х G X. В частности, непре- непрерывное отображение топологического пространства X в числовую прямую называется непрерывной функцией на этом пространстве. Легко убедиться, что для метрических пространств это определе- определение действительно превращается в то определение непрерывности
100 Гл. П. Метрические и топологические пространства отображения одного метрического пространства в другое, которое было дано в § 1. Данное нами определение носит «локальный» характер. Непре- Непрерывность отображения / на всем X определяется через непрерыв- непрерывность / в каждой точке. Оказывается, что понятие непрерывности отображения одного топологического пространства в другое можно сформулировать в терминах открытых множеств, т. е. в терминах топологии этих пространств. Теорема 6. Для того чтобы отображение f топологического пространства X в топологическое пространство Y было непрерыв- непрерывным, необходимо и достаточно, чтобы прообраз Г = f~1{G) всякого открытого множества G CY был открыт (в X). Доказательство. Необходимость. Пусть отображение / непрерывно и пусть G — открытое множество в Y. Докажем, что Г = f~1{G) открыто. Пусть ж — произвольная точка множества Г и у = /(ж). Тогда G служит окрестностью точки у. По определе- определению непрерывности найдется такая окрестность Vx точки ж, что f(Vx) С G, т.е. Vx С Г. Иначе говоря, если ж Е Г, то существует окрестность Vx этой точки, содержащаяся в Г. Но это и значит, что Г открыто. Достаточность. Пусть Г = f~1{G) открыто, если G С Y от- открыто. Рассмотрим произвольную точку х Е X и произвольную окрестность Uy точки у = /(ж). Поскольку у Е Uy, точка х при- принадлежит множеству f~1(Uy). Это открытое множество и служит той окрестностью точки ж, образ которой содержится в Uy. Замечание. Пусть X и Y — произвольные множества и / — отображение X в Y. Если в Y задана некоторая топология т (т.е. система множеств, содержащая 0 и У и замкнутая относительно взятия любых сумм и конечных пересечений), то прообраз тополо- топологии т (т.е. совокупность всех множеств f~1(G), где G G т) будет топологией в X. Для доказательства достаточно вспомнить теоремы о прообразе суммы и пересечения множеств (см. §2 гл. I). Мы обозначим эту топологию /—1(т). Если теперь X и Y — топологические простран- пространства с топологиями тх и Ту, то теорему б можно сформулировать так: отображение / : X —>¦ Y непрерывно в том и только том случае, если топология тх сильнее топологии f~1(ry). Из того, что прообраз дополнения есть дополнение прообраза, следует теорема, двойственная к теореме 6.
§ 5. Топологические пространства 101 Теорема 6'. Для того чтобы отображение f топологического пространства X в топологическое пространство Y было непрерыв- непрерывно, необходимо и достаточно, чтобы прообраз всякого замкнутого множества из Y был замкнут {в X). 1 > 0 1/2 1 \ /1/2) Рис. 11 Легко убедиться, что образ открытого (замкнутого) множества при непрерывном отображении не обязательно открыт (замкнут). Рассмотрим, например, отображение полуинтервала X = [0,1) на окружность. Множество [1/2,1), замкнутое в [0,1), переходит при этом в незамкнутое множество на окружности (рис. 11). Отображение называется открытым, если оно переводит каждое открытое множество снова в открытое. Отображение, переводящее каждое замкнутое множество в замкнутое, называется замкнутым. Для непрерывных отображений справедлива следующая теорема, аналогичная хорошо известной из анализа теореме о непрерывности сложной функции. Теорема 7. Пусть X, Y и Z — топологические пространства и пусть f и ер — непрерывные отображения X в Y и Y в Z соот- соответственно. Тогда отображение х н-» cp(f(x)) пространства X в Z непрерывно. Доказательство этой теоремы сразу получается из теоремы 6. На топологические пространства распространяется понятие го- гомеоморфизма, введенное нами в § 1 для метрических пространств, а именно, отображение / топологического пространства X на топо- топологическое пространство Y называется гомеоморфизмом, если оно взаимно однозначно и взаимно непрерывно; пространства X и Y при этом называют гомеоморфными. Гомеоморфные пространства обладают одними и теми же топологическими свойствами, и с топо- топологической точки зрения их можно рассматривать просто как два экземпляра одного и того же пространства. Топологии в двух гомео- морфных пространствах служат образами и прообразами друг дру- друга. Отношение гомеоморфности рефлексивно, симметрично и тран- зитивно; поэтому любая совокупность топологических пространств
102 Гл. П. Метрические и топологические пространства распадается на непересекающиеся классы гомеоморфных между со- собой пространств. Замечание. Следует иметь в виду, что метрические свой- свойства двух гомеоморфных между собой метрических пространств мо- могут быть различны1). Так, одно из них может быть полно, а дру- другое — нет. Например, интервал (—тг/2,тг/2) гомеоморфен числовой прямой (соответствующий гомеоморфизм можно задать функцией х —у tgx, но при этом прямая — полное пространство, а интервал — нет. 6. Аксиомы отделимости. Хотя многие из основных понятий теории метрических пространств легко переносятся на произволь- произвольные топологические пространства, все же такие пространства пред- представляют собой объект, слишком общий с точки зрения задач анали- анализа. Здесь возникают ситуации, существенно отличающиеся от того, что может иметь место в метрических пространствах. Так, мы виде- видели, что конечное множество точек в топологическом пространстве может быть не замкнутым (пример 4, п. 1, § 5) и т.п. Среди топологических пространств можно выделить простран- пространства, более близкие по своим свойствам к пространствам метриче- метрическим. Для этого следует к аксиомам 1° и 2° топологического про- пространства (п. 1, § 5) присоединить еще те или иные дополнительные условия. Такими условиями служат, например, аксиомы счетности; они позволяют изучать топологию пространства на основе понятия сходимости. Другой важный тип дополнительных условий составля- составляют требования иной природы — так называемые аксиомы отдели- отделимости. Мы перечислим эту серию аксиом в порядке их постепенного усиления. Аксиома Т\ (первая аксиома отделимости): для любых двух раз- различных точек х и у пространства Т существуют окрестность Ох точки ж, не содержащая точку у, и окрестность Оу точки у, не со- содержащая точку х. Пространства, удовлетворяющие этой аксиоме, называются Т\-пространствами. Примером топологического пространства, не являющегося Т\-пространством, может служить связное двоеточие. В Т\-пространстве любая точка есть замкнутое множество. Дей- Действительно, если х ф у, то существует окрестность Оу точки у, не содержащая ж, т.е. у ? [х]. Поэтому [х] = х. Следовательно, 1) Метрика пространства R однозначно определяет его топологию, но не на- наоборот: одну и ту же топологию в R = (X, р) можно получить, задавая в X различные метрики.
§ 5. Топологические пространства 103 в Т\-пространстве замкнуто и любое конечное множество точек. Бо- Более того, как легко проверить, аксиома Т\ в точности равносильна требованию замкнутости всех таких множеств. Выше (п. 1, § 5) мы определили предельную точку х множества М в топологическом пространстве Т как такую точку, для которой пе- пересечение 1/Г\М\{х} непусто. Здесь U — произвольная окрестность точки х. В пространствах, не удовлетворяющих аксиоме 7\, предельные точки могут иметь даже множества М, состоящие только из ко- конечного числа точек. Пусть Т — связное двоеточие с топологией, состоящей из 0, {Ь} и {а, Ь}. Тогда точка а является предельной для множества М = {Ь}. В Т\ -пространствах такое явление уже не может иметь места. Именно, верно следующее утверждение. Лемма. Для того чтобы точка х была предельной для множе- множества М в Т\ -пространстве, необходимо и достаточно, чтобы любая окрестность U этой точки содержала бесконечно много точек из М. Достаточность этого условия очевидна. Установим его необходи- необходимость. Пусть х — предельная точка для М; допустим, что существу- существует такая окрестность U точки ж, которая содержит только конечное число точек из М. Пусть х\,... ,жп — все эти точки, кроме самой х (если таковая принадлежит М). Тогда V = U \ {xi,...,xn} — окрестность х и V П М \ {х} = 0. Всякое метрическое пространство заведомо является Т\ -про- -пространством. Поэтому за определение предельной точки множества в метрическом пространстве и было принято свойство, указанное в лемме. Усилением первой аксиомы отделимости является аксиома Т<±. Аксиома Тъ (вторая, или хаусдорфова, аксиома отделимости): любые две различные точки хну топологического пространства Т имеют непересекающиеся окрестности Ох и Оу. Пространства, удовлетворяющие этой аксиоме, называются T<i-пространствами, или хаусдорфовыми пространствами. Всякое хаусдорфово пространство есть Т\-пространство, но не наоборот. Примером не хаусдорфова Т\ -пространства может служить отре- отрезок [0,1], в котором открытыми считаются пустое множество и все множества, получающиеся из отрезка выбрасыванием не более чем счетного числа точек. Аксиома Тз (третья аксиома отделимости): любая точка и не содержащее ее замкнутое множество имеют непересекающиеся
104 Гл. П. Метрические и топологические пространства окрестности. При этом окрестностью множества М в топологи- топологическом пространстве Т называется всякое открытое множество U, содержащее М. Этой аксиоме можно дать следующую эквивалентную формули- формулировку: Любая окрестность U произвольной точки х содержит меньшую окрестность той же точки, входящую в U вместе со своим замыка- замыканием. Читатель может доказать это в качестве упражнения. Поскольку в произвольном топологическом пространстве точка может не быть замкнутым множеством, третья аксиома отделимо- отделимости интересна только для пространств, удовлетворяющих аксио- аксиоме Т\. Пространства, удовлетворяющие обеим аксиомам Т\ и Гз, называются регулярными. Всякое регулярное пространство, разумеется, хаусдорфово. При- Примером хаусдорфова пространства, не являющегося регулярным, мо- может служить отрезок [0,1], в котором окрестности всех точек, кро- кроме точки 0, определяются обычным способом, а окрестностями нуля считаются всевозможные полуинтервалы [0, а), из которых выкину- выкинуты точки вида 1/п (п = 1,2,...). Это — хаусдорфово пространство, но в нем точка 0 и не содержащее ее замкнутое множество {1/п} не отделимы друг от друга непересекающимися окрестностями, т. е. аксиома Тз не выполнена. Обычно в анализе не приходится встречаться с пространствами более общими, чем регулярные. Более того, как правило, интерес- интересные с точки зрения анализа пространства удовлетворяют и сле- следующему более сильному требованию, так называемой нормаль- нормальности пространства. Аксиома Т^ (аксиома нормальности): Т\-пространство называет- называется нормальным, если в нем всякие два непересекающихся замкну- замкнутых множества имеют непересекающиеся окрестности. К нормальным пространствам относятся, в частности, все метри- метрические пространства. Действительно, пусть X и Y — два непере- непересекающихся замкнутых множества в метрическом пространстве R. Каждая точка х Е X имеет окрестность Ох, не пересекающуюся с Y и, следовательно, находится от Y на некотором положительном рас- расстоянии рх. Аналогично расстояние каждой точки у Е Y от X есть положительная величина ру. Рассмотрим открытые множества1) U= U В(х,рх/2) и V= U В(у,ру/2), хех :) Здесь, как обычно, В(х,г) — открытый шар радиуса г с центром х.
§ 5. Топологические пространства 105 содержащие X и Y соответственно, и покажем, что их пересече- пересечение пусто. Допустим, что z Е U П V. Тогда в X существует та- такая точка жо, что p(xo,z) < рХо/2, а в У — такая точка уо, что p(z,y0) < рУо/2. Пусть для определенности рХо ^ руо. Тогда р(хо,уо) ^p(xo,z) + p(z,x0) <рХ0/2 + рУ0/2 < руо, т.е. хо Е В(уо,рУо), но это противоречит определению рУо. Наше утверждение доказано. Всякое подпространство метрического пространства само явля- является метрическим пространством и поэтому всегда обладает свой- свойством нормальности. Это, вообще говоря, неверно для произвольных нормальных пространств: подпространство нормального простран- пространства не обязано быть нормальным. Таким образом, нормальность пространства не есть наследственное свойство1). Наследственным свойством является так называемая полная ре- регулярность топологических пространств, представляющая собой важное усиление свойства регулярности. Топологическое Т\-про- Т\-пространство называется вполне регулярным, если для каждого за- замкнутого множества F С Т и каждой точки хо Е T\F существует непрерывная на Т действительная функция /, равная нулю в точ- точке жо, единице на F и удовлетворяющая условию 0 ^ f(x) ^ 1. Вся- Всякое нормальное пространство вполне регулярно ), но не обратно. Любое подпространство вполне регулярного (в частности, нормаль- нормального) пространства само вполне регулярно. А. Н. Тихонов, которому принадлежит и само понятие вполне регулярного пространства, по- показал, что класс вполне регулярных пространств совпадает с клас- классом всех подпространств нормальных пространств. С точки зрения анализа вполне регулярные пространства важны потому, что на вся- всяком таком пространстве имеется «достаточно много» непрерывных функций, именно, для любых различных точек ж, у вполне регу- регулярного пространства Т существует определенная на Т непрерыв- непрерывная вещественная функция, принимающая в этих точках различные значения. 7. Различные способы задания топологии в пространстве. Метризуемость. Самый прямой способ задать топологию в неко- некотором пространстве состоит в том, чтобы непосредственно указать 1) Свойство Р называется наследственным, если из того, что им обладает данное топологическое пространство Т, следует, что им обладают и все его подпространства. 2) Этот (совсем не очевидный) факт вытекает из следующей теоремы П. С. Урысона: если Т — нормальное пространство hFi,F2 — два его непересе- непересекающихся замкнутых подмножества, то на Т существует непрерывная функция, / @ ^ f(x) ^ 1) равная нулю на F\ и единице на F?,.
106 Гл. П. Метрические и топологические пространства те множества, которые мы считаем открытыми. Набор этих мно- множеств должен удовлетворять требованиям 1° и 2° (см. п. 1 § 5). Рав- Равносильный этому двойственный способ — указать набор замкнутых множеств. Такой набор должен, очевидно, удовлетворять услови- условиям 1 и 2 (п. 1, § 5). Однако фактически этот способ редко может быть применен. Так, например, даже в случае плоскости вряд ли можно дать непосредственное описание всех открытых подмно- подмножеств (как это удается сделать для прямой (теорема 5 § 2)). Распространенный способ задания топологии состоит в выборе некоторой базы; фактически именно так и вводится топология в ме- метрических пространствах, где мы, опираясь на метрику, задаем ба- базу — совокупность открытых шаров. Еще один из возможных способов задать топологию в простран- пространстве — это ввести в нем понятие сходимости. Однако за пределами метрических пространств такой способ не всегда удобен, поскольку, как уже указывалось в п. 4, не всегда переход от множества к его замыканию можно описать в терминах сходящихся последователь- последовательностей. Этот способ можно сделать универсальным, обобщив соот- соответствующим образом само понятие сходящейся последовательно- последовательности (см., например, [29], гл. 2). Можно ввести в пространстве топологию, определив в нем акси- аксиоматически операцию замыкания. Именно, говорят, что в множе- множестве X задана операция замыкания, если каждому А С X поставле- поставлено в соответствие некоторое множество [А] С X, называемое замы- замыканием А, причем операция перехода от А к [А] обладает свойствами 1)-4), указанными в теореме 1 § 2. Определив после этого замкну- замкнутые множества как те, для которых [А] = А, легко показать, что этот класс множеств удовлетворяет условиям 1 и 2 (п. 1 § 5), т.е. действительно определяет в X топологию. Задание метрики — один из важнейших способов введения то- топологии, хотя и далеко не универсальный. Как мы уже видели, всякое метрическое пространство нормально и удовлетворяет пер- первой аксиоме счетности. В пространстве, лишенном хотя бы одного из этих двух свойств, топологию нельзя задать с помощью какой бы то ни было метрики Определение. Топологическое пространство Т называется метризуемым, если его топологию можно задать с помощью какой- либо метрики. В силу только что сказанного нормальность пространства и пер- первая аксиома счетности представляют собой необходимые усло- условия метризуемости пространства. Вместе с тем ни каждое из этих
6. Компактность 107 условий в отдельности, ни даже их совокупность недостаточны для метризуемости пространства. Однако имеет место следующая теорема, принадлежащая П. С. Урысону: Для того чтобы топологическое пространство со счетной ба- базой было метризуемо, необходимо и достаточно, чтобы оно было нормально. Необходимость этого условия ясна; доказательство достаточно- достаточности имеется, например, в [2]. § 6. Компактность 1. Понятие компактности. Фундаментальную роль в анали- анализе играет следующий факт, известный под названием леммы Гейне-Боре ля: Из любого покрытия отрезка [а, Ь] числовой прямой интервалами можно выбрать конечное подпокрытие. Это утверждение останется справедливым, если вместо интерва- интервалов рассматривать любые открытые множества: из всякого откры- открытого покрытия отрезка [а, Ь] можно выделить конечное подпокры- подпокрытие. Отправляясь от этого свойства отрезка числовой прямой, введем следующее важное понятие. Определение. Топологическое пространство Т называется компактным, если любое его открытое покрытие содержит к о- нечное подпокрытие. Компактное топологическое пространство, удовлетворяющее ак- аксиоме отделимости Хаусдорфа, называется компактом. Как мы увидим ниже, свойством компактности наряду с отрез- отрезками обладают все замкнутые ограниченные подмножества евкли- евклидова пространства любой конечной размерности. Наоборот, прямая, плоскость, трехмерное пространство служат простейшими примера- примерами некомпактных пространств. Назовем некоторую систему подмножеств {А} множества Т цент- п рированной, если любое конечное пересечение Q А\ членов этой си- г=1 стемы не пусто. Из сформулированного определения компактности и соотношений двойственности вытекает следующая теорема.
108 Гл. П. Метрические и топологические пространства Теорема 1. Для того чтобы топологическое пространство Т было компактным, необходимо и достаточно, чтобы оно удовлетво- удовлетворяло условию: (R) каждая центрированная система его замкнутых подмножеств имеет непустое пересечение. Действительно, пусть {-Fa} — центрированная система замкну- замкнутых подмножеств в Т и пусть Т компактно. Множества Ga = T\Fa открыты, причем из того факта, что никакое конечное пересечение п Р| Fi не пусто, следует, что никакая конечная система множеств j=i Gi = Т \ Fi не покрывает всё Т. Но тогда и все Ga не образуют покрытия (компактность!), а это значит, что Q Fa ф 0. Итак, если Т компактно, то в нем условие (R) выполнено. Обратно, пусть Т удовлетворяет условию (R) и Ga — открытое покрытие простран- пространства Т. Положив Fa = T\Ga, получим, что f]Fa = 0, откуда следу- следует (условие (Д)), что система {Fa} не может быть центрированной, п т. е. существуют такие F\,..., Fn, что [\ Fi = 0. Но тогда соответст- г=1 вующие Gi = T\Fi образуют конечное подпокрытие покрытия {Ga}. Итак, условие (R) равносильно компактности. Установим некоторые основные свойства компактных прост- пространств. Теорема 2. Если Т — компактное пространство, то каждое его бесконечное подмножество имеет хотя бы одну предельную точку. Доказательство. Если Т содержит бесконечное множест- множество X, не имеющее ни одной предельной точки, то в нем можно взять счетное множество Х\ — (жьЖг,...)? также не имеющее ни одной предельной точки. Но тогда множества Хп = (жп,жп+1,...) обра- образуют центрированную систему замкнутых множеств в Т, имеющую пустое пересечение, т. е. Т не компактно. Теорема 3. Замкнутое подмножество компактного простран- пространства компактно. Доказательство. Пусть F — замкнутое подмножество ком- компактного пространства Т и {i^*} — произвольная центрированная система замкнутых подмножеств подпространства F С Т. Тогда каждое Fa замкнуто и в Т, т.е. {Fa} — центрированная система замкнутых множеств в Т. Следовательно, f^\Fa ф 0.В силу теоре- теоремы 1 отсюда следует компактность F. Поскольку подпространство хаусдорфова пространства само хаусдорфово, отсюда получаем:
6. Компактность 109 Следствие. Замкнутое подмножество компакта есть компакт. Теорема 4. Компакт замкнут в любом содержащем его хаус- дорфовом пространстве. Доказательство. Пусть К — компактное множество в хаус- дорфовом пространстве Т и пусть у ? К. Тогда для любой точ- точки х Е К существуют окрестность Ux точки х и окрестность Vx точки у такие, что uxnvx = 0. Окрестности Ux образуют открытое покрытие множества К. В си- силу компактности К из него можно выделить конечное подпокрытие UXl,..., UXn. Положим v = vxln---nvXn. Тогда V — окрестность точки у, не пересекающаяся с UXl U • • • U UXn D К. Следовательно, у ? [К] и, значит, К замкнуто. Тео- Теорема доказана. Теоремы 3 и 4 показывают, что в классе хаусдорфовых про- пространств компактность есть внутреннее свойство пространства, т. е. всякий компакт остается компактом, в какое бы более широкое хаус- дорфово пространство мы его ни включали. Теорема 5. Всякий компакт представляет собой нормальное пространство. Доказательство. Пусть X и Y — два непересекающихся замкнутых подмножества компакта К. Повторив рассуждения, про- проведенные в доказательстве предыдущей теоремы, легко убедиться в том, что для каждой точки у G Y существуют такая ее окрест- окрестность Uу и такое открытое множество Оу D X, что Uy П Оу = 0. Тем самым доказано, что всякий компакт регулярен. Пусть теперь у пробегает множество Y. Выберем из покрытия {Uy} множества Y конечное подпокрытие Uyi,..., UVn. Тогда открытые множества = иУ1п---пиУп и будут удовлетворять условиям О^ э X, О^ э Y и О^ П ОB) = 0, а это и означает нормальность. 2. Непрерывные отображения компактных пространств. Непрерывные отображения компактных пространств, в частности, компактов, обладают рядом интересных и важных свойств.
110 Гл. П. Метрические и топологические пространства Теорема 6. Непрерывный образ компактного пространства есть компактное пространство. Доказательство. Пусть X — компактное пространство и / — его непрерывное отображение в топологическое пространство Y. Рассмотрим какое-либо покрытие {Va} образа f(x) открытыми в f(x) множествами. Положим Ua = f~1(Va). Множества Ua откры- открыты (как прообразы открытых множеств при непрерывном отобра- отображении) и образуют покрытие пространства X. Из этого покрытия можно выбрать, в силу компактности X, конечное подпокрытие Ui, ... ,Un. Тогда множества Vi,..., Vn, где Vi = f(Ui), покрывают весь образ f(X) пространства X. Теорема 7. Взаимно однозначное и непрерывное отображение if компакта X на хаусдорфово пространство V есть гомеоморфизм. Доказательство. Нужно показать, что из условий теоремы вытекает непрерывность обратного отображения ср~г. Пусть F — замкнутое множество в X и Р = ip(F) — его образ в У. В силу пре- предыдущей теоремы Р — компакт и, следовательно, Р замкнуто в Y. Таким образом, прообраз при отображении ср~г всякого замкнутого множества F С X замкнут. А это и означает непрерывность отобра- отображения Lf~X . 3. Непрерывные и полунепрерывные функции на ком- компактных пространствах. В предыдущем пункте речь шла о не- непрерывных отображениях компакта в хаусдорфово пространство. Частным случаем таких отображений являются отображения ком- компактов в числовую прямую, т. е. числовые функции на компактах. Для таких функций сохраняются основные свойства функций на от- отрезке, известные из анализа. Теорема 8. Пусть Т — компактное пространство и f — непре- непрерывная на нем числовая функция. Тогда / ограничена на Т и до- достигает на Т верхней и нижней граней. Доказательство. Непрерывная функция есть непрерывное отображение Т в числовую прямую Ж. Образ Тв1в силу общей теоремы б компактен. Но, как читателю известно из курса анали- анализа (см. также п. 2 § 7), компактное подмножество числовой прямой замкнуто и ограничено и потому не только имеет конечные верхнюю и нижнюю грани, но и содержит эти грани. Теорема доказана. Упражнение. Пусть К — компактное метрическое пространство и А — такое отображение К в себя, что р(Ах,Ау) < р(х,у) при х ф у. Показать, что отображение А имеет в К единственную неподвижную точку.
6. Компактность 111 Утверждения последней теоремы допускают обобщение и на более ши- широкий класс функций, а именно, на так называемые полунепрерывные функции. Функция /(ж) называется полунепрерывной снизу (сверху) в точке жо, если для любого е > 0 существует такая окрестность точки жо, в которой /(ж) > /(жо) — в (соответственно, /(ж) < /(жо) + в). Например, функция «целая часть от ж», /(ж) = ?7(ж) полунепрерывна сверху. Если увеличить (уменьшить) значение /(жо) непрерывной функ- функции в какой-либо одной точке жо, то мы получим полунепрерывную свер- сверху (снизу) функцию. Если /(ж) полунепрерывна сверху, то —/(ж) полуне- полунепрерывна снизу. Эти два замечания позволяют сразу построить большое число примеров полунепрерывных функций. При изучении свойств полунепрерывности действительных функций удобно допускать для них бесконечные значения. Если /(жо) = — оо, то функцию / будем считать полунепрерывной снизу в точке жо; если же для любого h > 0 имеется окрестность точки жо, в которой /(ж) < —h, то будем считать, что функция / полунепрерывна и сверху в точке жо. Если /(жо) = +оо, то функцию / будем считать полунепрерывной свер- сверху в жо; если же для любого h > 0 имеется окрестность точки жо, в кото- которой /(ж) > /г, то будем считать, что функция / полунепрерывна и снизу в точке жо. Пусть /(ж) — действительная функция на метрическом простран- пространстве R. Верхним пределом /(жо) функции /(ж) в точке жо называется величина (конечная или бесконечная) lim sup /(ж) . Нижний пре- г^О^-хеВ(хо,?) J дел /(жо) определяется аналогично с заменой верхней грани на нижнюю. Разность ujf(xo) = /(жо) — /(жо) (если она имеет смысл, т.е. если числа /(жо) и /(жо) не равны бесконечности одного знака) называется колеба- колебанием функции /(ж) в точке жо. Легко видеть, что для непрерывности /(ж) в точке жо необходимо и достаточно, чтобы ujf(xo) = 0, т. е. чтобы —оо < /(жо) = /(жо) < оо. Для любой функции /(ж), заданной на метрическом пространстве, функция /(ж) полунепрерывна сверху, а функция /(ж) полунепрерывна снизу. Это легко вытекает из определения верхнего и нижнего пределов. Рассмотрим метрическое пространство JW, элементами ж которого слу- служат все действительные ограниченные функции (p(t), заданные на сегмен- сегменте [а, 6]. Метрику в М зададим равенством ) = sup Функции на М, как это обычно делается, будем называть функционалами, чтобы отличать их от функций ip(t) — элементов М. Рассмотрим один важный пример полунепрерывного функционала. Определим длину кривой у = /(ж) (а ^ ж ^ Ь) как функционал Lba(f) = sup^
112 Гл. П. Метрические и топологические пространства где верхняя грань (которая может быть равна +оо) берется по всевоз- всевозможным разбиениям отрезка [а, Ь]. Этот функционал определен на всем пространстве М. Для непрерывных функций он совпадает со значением предела max \ХА— X4_i \—>0 *—^ г = 1 Наконец, для функций с непрерывной производной его можно записать в виде Функционал La(f) полунепрерывен снизу в М, что легко следует из его определения. На полунепрерывные функции обобщается установленная выше тео- теорема. Теорема 8а. Полунепрерывная снизу (сверху) конечная функция на компактном Т\-пространстве Т ограничена снизу (сверху). Действительно, допустим, что inf f(x) = — оо. Тогда существует такая последовательность {жп}, что f(xn) < —п. Поскольку пространство Т компактно, его бесконечное множество {жп} имеет (в силу теоремы 2) хо- хотя бы одну предельную точку хо. По предположению, функция / конечна и полунепрерывна снизу; поэтому найдется такая окрестность U точки хо, что f(x) > f(xo) — 1 при х G U. Но тогда окрестность U может содержать лишь конечное число точек множества {жп}, а это противоречит тому, что точка xq — предельная для этого множества. Аналогично доказывается теорема и для случая полунепрерывной сверху функции. Теорема 86. Полунепрерывная снизу (сверху) конечная функция на компактном Т\ -пространстве Т достигает своей нижней (верхней) грани. Пусть функция f(x) полунепрерывна снизу. Тогда по теореме 8а она имеет конечную нижнюю грань, и существует такая последовательность {хп}, что f(xn) ^ inf f(x) + 1/n. Поскольку Т компактно, множество {хп} имеет предельную точку хо. Если бы было f(xo) > inf/, то, в силу полунепрерывности функции / снизу, нашлись бы такая окрестность U точки хо и такое S > 0, что f(x) > inf/ + S при х G U. Но тогда окрестность U не могла бы со- содержать никакого бесконечного подмножества множества {жп}. Следова- Следовательно, f(xo) = inf/, что и требовалось доказать. 4. Счетная компактность. Введем следующее определение. Определение. Пространство Т называется счетно-компакт- счетно-компактным, если каждое его бесконечное подмножество имеет хотя бы одну предельную точку.
6. Компактность 113 Доказанная в п. 1 теорема 2 означает, что всякое компактное пространство счетно-компактно. Обратное, вообще говоря, неверно. Вот «традиционный» пример счетно-компактного, но не компакт- компактного пространства. Рассмотрим множество X всех порядковых чи- чисел а, меньших первого несчетного порядкового числа uj\. Назо- Назовем интервалом (а,/3) в X совокупность всех порядковых чи- чисел 7•> удовлетворяющих неравенствам а < 7 < /3. Открытым мно- множеством в X назовем объединение произвольного числа интервалов. Легко проверить, что построенное пространство счетно-компактно, но не компактно. Соотношение между понятиями компактности и счетной ком- компактности становится ясным из следующей теоремы. Теорема 9. Для того чтобы топологическое пространство было счетно-компактным, необходимо и достаточно любое из следующих двух условий: 1) Каждое счетное открытое покрытие пространства Т содержит конечное подпокрытие. 2) Каждая счетная центрированная система замкнутых множеств в Т имеет непустое пересечение. Доказательство. Равносильность условий 1) и 2) непосред- непосредственно следует из соотношений двойственности. Далее, если Т не счетно-компактно, то, повторив рассуждения, проведенные при доказательстве теоремы 2, мы получим, что в Т существует счетная центрированная система замкнутых множеств с пустым пересечени- пересечением. Тем самым достаточность условия 2) (а значит, и 1)) установле- установлена. Докажем необходимость условия 2). Пусть Т счетно-компактно и {Fn} — счетная центрированная система замкнутых множеств п в Г. Покажем, что f]Fn ф 0. Пусть Фп = [\ Fk. Ясно, что все Фп n k=l замкнуты, не пусты (в силу центрированности {Fn}) и образуют не- возрастающую систему $i D Ф2 D ... и что f] Фп = f]Fn. Возможны п п два случая: 1) Начиная с некоторого номера по Фп0 = Фпо + 1 Тогда, очевидно, f| Фп = ФПо ф 0. п 2) Среди Фп имеется бесконечно много попарно различных. При этом достаточно рассмотреть случай, когда все Фп различны между собой. Пусть хп е Фп\Фп+1.
114 Гл. П. Метрические и топологические пространства Последовательность {хп} представляет собой бесконечное множе- множество различных точек из Т; в силу счетной компактности Т она должна иметь хотя бы одну предельную точку, скажем, xq. Так как Фп содержит все точки жп, жп+ъ ..., то хо — предельная точка для Фп и в силу замкнутости Фп, хо Е Фп. Следовательно, f] Фп Э Жо, т.е. [)Фп Ф®- п Таким образом, и компактные, и счетно-компактные простран- пространства характеризуются «поведением» своих открытых покрытий. И в том, и в другом случае из открытого покрытия можно выбрать конечное, но в первом случае речь идет о любых покрытиях, а во втором — только о счетных. Хотя в общем случае из счетной компактности компактность не вытекает, имеет место следующий факт. Теорема 10. Для пространств со счетной базой понятия ком- компактности и счетной компактности совпадают. Действительно, из любого открытого покрытия пространства Т, имеющего счетную базу, можно выбрать счетное подпокрытие (тео- (теорема 5 § 5). Если же Т к тому же и счетно-компактно, то из этого последнего можно в силу предыдущей теоремы выбрать конечное подпокрытие. Тем самым устанавливается, что Т компактно. Замечание. Понятие счетной компактности топологического пространства оказалось на самом деле (в противовес компактности) не очень удачным и естественным. Оно возникло так сказать «по инерции». Дело в том, что для метрических пространств (как и для пространств со счетной базой) эти два понятия совпадают (это бу- будет показано в следующем параграфе). При этом для метрических пространств понятие компактности было поначалу дано именно как наличие у каждого бесконечного подмножества предельной точки, т. е. как определение счетной компактности. «Автоматический» пе- перенос этого определения с метрического случая на топологический и привел к понятию счетно-компактного топологического простран- пространства. Иногда в литературе, особенно более старой, термин «ком- «компактность» понимается как «счетная компактность», а топологи- топологическое пространство, компактное в нашей терминологии, т. е. такое, из каждого открытого покрытия которого можно выделить конеч- конечное подпокрытие, называется бикомпактным. При этом компактное хаусдорфово пространство (т. е. компакт) именуется бикомпактом, а термин «компакт» резервируется для обозначения метричес- метрического компактного пространства. Мы будем придерживаться тех терминов (компактность, счетная компактность), которые введены
§ 7. Компактность в метрических пространствах 115 выше; при этом мы и компактные метрические пространства также будем называть компактами, а в тех случаях, когда на- наличие метрики желательно специально подчеркнуть, — «метричес- «метрическими компактами». 5. Предкомпактные множества. Если множество М, лежа- лежащее в некотором хаусдорфовом пространстве Т, не замкнуто в Т, то М не может быть компактно. Например, ни одно из незамкнутых подмножеств числовой прямой не является компактом. Может, од- однако, оказаться, что замыкание [М] такого множества М в Т уже обладает свойством компактности. Например, этому условию удо- удовлетворяет любое ограниченное подмножество на числовой прямой или в n-мерном пространстве. Введем следующее определе- определение. Определение. Множество М, лежащее в некотором тополо- топологическом пространстве Т, называется предкомпактным (или ком- компактным относительно Т), если его замыкание в Т компактно. Аналогично, М называется счетно-предкомпактным в Т, если вся- всякое бесконечное подмножество А С М имеет хотя бы одну предель- предельную точку (которая может принадлежать, но может и не принадле- принадлежать М). Понятие предкомпактности (в отличие от компактности) связа- связано, очевидно, с тем пространством Т, в котором мы данное мно- множество рассматриваем. Например, множество рациональных точек в интервале @,1) предкомпактно, если его рассматривать как под- подмножество числовой прямой, но оно не будет предкомпактным как подмножество пространства всех рациональных чисел. Понятие предкомпактности наиболее существенно в случае мет- метрических пространств, о чем будет идти речь в следующем пара- параграфе. § 7. Компактность в метрических пространствах 1. Полная ограниченность. Поскольку метрические простран- пространства представляют собой частный случай топологических, на них распространяются те определения и факты, которые были изложе- изложены в предыдущем параграфе. В метрическом случае компактность тесно связана с понятием полной ограниченности, которое мы сейчас введем.
116 Гл. П. Метрические и топологические пространства Пусть М — некоторое множество в метрическом пространстве R же — некоторое положительное число. Множество А из R называ- называется г-сетью для М, если для любой точки х Е М найдется хотя бы одна точка a Е А, такая, что р(х,а) ^ е. (Множество А не обязано содержаться в М и может даже не иметь с М ни одной общей точки, однако, имея для М некоторую г-сеть А, можно построить 2г-сеть В С М.) Например, целочисленные точки образуют на плоскости 1/л/2-сеть. Множество М называется вполне ограниченным, если для него при любом е > 0 существует конечная г-сеть. Ясно, что вполне ограниченное множество обязательно ограничено, как сумма конечного числа ограниченных множеств. Обратное, вообще говоря, неверно, как показывает приводимый ниже пример 2. Часто бывает полезно следующее очевидное замечание: если мно- множество М вполне ограничено, то его замыкание [М] также вполне ограничено. Из определения полной ограниченности сразу следует, что если само метрическое пространство R вполне ограничено, то оно се- парабельно. Действительно, построим для каждого п в R конечную l/n-сеть. Сумма их по всем п представляет собой счетное всюду плотное в R множество. Поскольку сепарабельное метрическое про- пространство имеет счетную базу (теорема 4 § 5), мы получаем, что вся- всякое вполне ограниченное метрическое пространство имеет счет- счетную базу. Примеры. 1. В n-мерном евклидовом пространстве полная ог- ограниченность совпадает с обычной ограниченностью, т. е. с возможностью заключить данное множество в достаточно большой куб. Действительно, если такой куб разбить на кубики с ребром г, то вершины этих кубиков будут образовывать конечную (у/п/2)г-сеть в исходном кубе, а значит, и подавно, любом множе- множестве, лежащем внутри этого куба. 2. Единичная сфера S в пространстве Ь дает нам пример огра- ограниченного, но не вполне ограниченного множества. Действительно, рассмотрим в S точки вида ei = A,0,0,...,0,0,...), е2 = @,1,0,...,0,0,...),
§ 7. Компактность в метрических пространствах 117 Расстояние между любыми двумя такими точками еп и ет (п ф т) равно у2. Отсюда видно, что в S не может быть конечной г-сети ни при каком е < л/2/2. 3. Рассмотрим в 1^ множество П точек х = (xi,..., жп,...), под- подчиненных условиям |si|^l, |ж2|^1/2, ..., \хп\ sC 1/2"-1, ... Это множество называется основным параллелепипедом («гильбер- («гильбертовым кирпичом») пространства 1^ - Оно служит примером бесконеч- бесконечномерного вполне ограниченного множества. Для доказательства его полной ограниченности поступим следующим образом. Пусть г > 0 задано. Выберем п так, что l/2n-1 < г/2. Каждой точке х = 0ь...,жп,...) A) из П сопоставим точку х* = (хи...,хп,0,0,...) B) из того же множества. При этом р(х,х*) = \ k=n+l \ 2' к=п Множество П* точек вида B) из П вполне ограничено (как ограни- ограниченное множество в n-мерном пространстве). Выберем в П* конеч- конечную г/2-сеть. Ясно, что она будет в то же время г-сетью во всем П. 2. Компактность и полная ограниченность. Теорема 1. Если метрическое пространство R счетно-компакт- счетно-компактно, то оно вполне ограничено. Доказательство. Предположим, что R не вполне ограничено. Это значит, что при некотором ?q > 0 в R не существует конечной го-сети. Возьмем в R произвольную точку а±. В R найдется хотя бы одна такая точка, скажем, а2, что p(ai,a,2) > ?o (иначе точка а± была бы го-сетью для R). Далее, в R найдется такая точка аз, что p(ai,as) > So и у^(^2,^з) > ?о5 иначе пара точек ai, a^ была бы го-сетью. Если точки oi,..., а\» уже фиксированы, то выберем точку ak+1 G R так, что р((ц, ак+1) > е0 (г = 1,..., к). Это построение дает нам бесконечную последовательность ai, a2,..., которая не имеет ни одной предельной точки, поскольку p(ai,aj) > So при г ф j. Но тогда R не счетно-компактно. Теоре- Теорема доказана. Итак, мы показали, что для метрических пространств счетная компактность влечет полную ограниченность, которая в свою оче- очередь влечет наличие счетной базы. В силу теоремы 10 § б отсюда получаем такой важный результат.
118 Гл. П. Метрические и топологические пространства Следствие. Всякое счетно-компактное метрическое простран- пространство компактно. Мы показали, что полная ограниченность есть необходимое условие компактности метрического пространства. Это условие н е достаточно; например, совокупность рациональных точек от- отрезка [0,1] с обычным определением расстояния между ними есть вполне ограниченное, но не компактное пространство: последова- последовательность точек этого пространства 0; 0,4; 0,41; 0,414; 0,4142; ..., т.е. последовательность десятичных приближений числа у2 — 1, не имеет в нем предельной точки. Однако имеет место следующая теорема. Теорема 2. Для того чтобы метрическое пространство R было компактом, необходимо и достаточно, чтобы оно было одновремен- одновременно: 1) вполне ограниченным, 2) полным. Доказательство. Необходимость полной ограниченности уже отмечалась. Необходимость полноты очевидна: в самом деле, если {хп} — фундаментальная последовательность в R, не имею- имеющая предела, то эта последовательность не имеет в R ни одной пре- предельной точки. Покажем теперь, что если R вполне ограничено и полно, то оно компактно. В силу следствия из теоремы 1 для этого достаточно установить, что R счетно-компактно, т. е. что всякая последователь- последовательность {хп} точек из R имеет хотя бы одну предельную точку. Построим вокруг каждой из точек, образующих 1-сеть в R, замк- замкнутый шар радиуса 1. Так как эти шары покрывают все Л, а чи- число их конечно, то по крайней мере один из них, назовем его ??i, содержит некоторую бесконечную подпоследовательность х[ ,... ..., Хп , • • • последовательности {хп}. Далее, выберем 1/2-сеть в Бь и вокруг каждой из точек этой сети построим замкнутый шар ради- радиуса 1/2. По крайней мере один из этих шаров, назовем его В<±, со B) B) держит бесконечную подпоследовательность х\ ,..., хп ,... после- последовательности {хп }. Далее, найдем замкнутый шар В% с центром в ??2 радиуса 1/4, содержащий бесконечную подпоследовательность х[ ,..., Хп ,... последовательности {хп } и т. д. Рассмотрим теперь наряду с каждым шаром Вп замкнутый шар Ап с тем же центром,
§ 7. Компактность в метрических пространствах 119 но в два раза большего радиуса. Легко видеть, что шары Ап вложе- оо ны друг в друга. В силу полноты пространства R пересечение f] An 71=1 не пусто и состоит из одной точки хо. Эта точка — предельная для исходной последовательности {жп}, так как каждая ее окрестность содержит некоторый шар ??/., а значит, и бесконечную подпоследо- подпоследовательность {х\г '} последовательности {хп}. 3. Предкомпактные подмножества в метрических про- пространствах. Понятие предкомпактности, введенное нами в преды- предыдущем параграфе для подмножеств произвольного топологического пространства, применимо, в частности, к подмножествам метриче- метрического пространства. При этом, очевидно, понятие счетной предком- предкомпактности совпадает здесь с понятием предкомпактности. Отметим следующий простой, но важный факт. Теорема 3. Для того чтобы множество М, лежащее в полном метрическом пространстве R, было предкомпактным, необходимо и достаточно, чтобы оно было вполне ограниченным. Доказательство сразу следует из теоремы 2 и того очевидно- очевидного факта, что замкнутое подмножество полного метрического про- пространства само полно. Значение этой теоремы состоит в том, что, как правило, легче установить полную ограниченность того или иного множества, чем непосредственно доказать его предкомпактность. Вместе с тем для применений в анализе важна обычно предкомпактность. 4. Теорема Арцела. Вопрос о компактности того или иного множества в метрическом пространстве — довольно распространен- распространенная в анализе задача. Между тем, попытка непосредственно приме- применить теорему 2 сталкивается с трудностями. Поэтому для множеств в конкретных пространствах полезно дать специальные критерии компактности (или предкомпактности), более удобные на практике. В n-мерном евклидовом пространстве предкомпактность множе- множества равносильна, как мы видели, его ограниченности. Однако для более общих метрических пространств это уже неверно. Одним из важнейших в анализе метрических пространств явля- является пространство С [а, Ь]. Для его подмножеств важный и часто ис- используемый критерий предкомпактности доставляет так называе- называемая теорема Арцела. Чтобы ее сформулировать, нам пона- понадобятся следующие понятия. Семейство Ф функций ср, определенных на некотором отрезке [а, 6], называется равномерно ограниченным, если существует такое
120 Гл. П. Метрические и топологические пространства ЧИСЛО К, ЧТО \Ф)\ < к для всех х G [а, Ь] и всех ip G Ф. Семейство Ф = {ср} называется равностепенно непрерывным, если для каждого г > 0 найдется такое 5 > 0, что для всех xi и Ж2 из [а, 6] таких, что р(х\,х2) < S, и для всех у? Е Ф. Теорема 4(Арцела). Для того чтобы семейство Ф непрерыв- непрерывных функций, определенных на отрезке [a,b], было предкомпактно в С [а, Ь], необходимо и достаточно, чтобы это семейство было рав- равномерно ограничено и равностепенно непрерывно. Доказательство. Необходимость. Пусть семейство Ф предкомпактно в С [а, Ь]. Тогда по предыдущей теореме для каждо- каждого положительного г в семействе Ф существует конечная г/3-сеть <^1,..., ipk. Каждая из функций <^, как непрерывная функция на от- отрезке, ограничена: |^i(^)| ^ ^Q- Положим К = m&xKi + г/3. По определению г/3-сети, для вся- всякого ср G Ф имеем, хотя бы для одного <^, p(ip,ipi) = max\ip(x) -ipi(x)\ ^ г/3. X Следовательно, Итак, Ф равномерно ограничено. Далее, так как каждая из функций <^, образующих г/3-сеть, не- непрерывна, а следовательно, и равномерно непрерывна на [а, 6], то для данного г/3 существует такое Si, что г/3, если \xi - х2\ < Si. Положим S — min^. Для произвольной функции ip G Ф выберем (pi так, чтобы p(cp,cpi) < г/3; тогда при \х± — х2\ < S будем иметь |(piOi) - ip(x2)\ ^ \ip(xi) - ^;Oi)| + \ч>ъ{х{) - (Pi(x2)\ + + \(Pi(x2) - <p(x2)\ < e/3 + г/3 + г/3 = г. Равностепенная непрерывность Ф также доказана. Достаточность. Пусть Ф — равномерно ограниченное и рав- равностепенно непрерывное семейство функций. В силу теоремы 3 для доказательства его предкомпактности в С [а, Ъ] достаточно показать, что при любом г > 0 для него в С [а, Ь] существует конечная г-сеть.
§ 7. Компактность в метрических пространствах 121 Пусть |<^(ж)| ^ К для всех ср Е Ф и пусть 5 > 0 выбрано так, что \ip(xi) — Ц>(х2)\ < s/Ъ при \х\ — Х2\ < S для всех if Е Ф. Разобьем отрезок [а, Ь] на оси х точками хо = а± < х\ < • • • < хп = Ъ на промежутки длины меньше 8 и проведем через эти точки вер- вертикальные прямые. Отрезок [—К, К] на оси у разобьем точками у о = —К<у\ < • • • < Ут = К на промежутки длины мень- меньше г/5 и проведем через точки деления горизонтальные прямые. Таким образом, прямоугольник а ^ х ^ Ь, —К ^ у ^ К разобьет- разобьется на ячейки с горизонтальной стороной меньше S и вертикальной стороной меньше г/5. Сопоставим теперь каждой функции ср G Ф ломаную ф(х) с вершинами в точках (xk,yi), т.е. в узлах построен- построенной сетки, и уклоняющуюся в точках Xk от функции ср(х) меньше, чем на г/5 (существование такой ломаной очевидно). Поскольку по построению \ip(xk) - ф(хк)\ < е/5, \ip(xk+i) - i/>(xk+i)\ < е/5, \(р(хк) -(р(хк+1)\ <г/5, то \ф{хк) - ф{хк+1)\ <Зг/5. Так как между точками хк и хк+\ функция ф(х) линейна, то \ф(хк) - Ф(х)\ < Зг/5 для всех х е [xk,xk+i]. Пусть теперь х — произвольная точка отрезка [а, Ь] и хк — бли- ближайшая к х слева из выбранных нами точек деления. Тогда \<р(х) - ф(х)\ ^ \<р(х) - (р(хк)\ + Ыхк) - Ф(хк)\ + \Ф(хк) - Ф(х)\ ^ г. Следовательно, ломаные ф{х) по отношению к Ф образуют г-сеть. Число их, очевидно, конечно; таким образом, Ф вполне ограничено. Теорема полностью доказана. 5. Теорема Пеано. Покажем, как применяется теорема Арцела на примере следующей теоремы существования для обыкновенных диффе- дифференциальных уравнений с непрерывной правой частью. Теорема 5 (Пеано). Пусть дано дифференциальное уравнение g = /(*,»)• О) Если функция f непрерывна в некоторой ограниченной замкнутой обла- области G, то через каждую внутреннюю точку (жо, У о) этой области проходит хотя бы одна интегральная кривая данного уравнения. Доказательство. Так как функция / непрерывна в ограниченной замкнутой области, то она ограничена: |/(ж,г/)| < М = const.
122 Гл. П. Метрические и топологические пространства Проведем через точку (жо,2/о) прямые с угловыми коэффициентами М и —М. Проведем, далее, вертикальные прямые х = а и х = Ь так, что- чтобы отсекаемые ими два треугольника с общей вершиной (жо,2/о) целиком лежали внутри области G. Эта пара треугольников образует замкнутое множество А. Построим теперь для данного уравнения так называемые ломаные Эйлера следующим образом: проведем из точки (жо,2/о) прямую с угло- угловым коэффициентом /(жо,2/о)- На этой прямой возьмем некоторую точку (ж1, г/i) и проведем через нее прямую с угловым коэффициентом f(xi,yi). На этой прямой возьмем точку (жг, 2/2), проведем через нее прямую с угло- угловым коэффициентом /(#2,2/2) и Т-Д- Рассмотрим теперь последователь- последовательность ломаных Эйлера Li,..., Ln,..., проходящих через точку (жо, уо), таких, что длина наибольшего из звеньев линии L& стремится к нулю при к —>- оо. Пусть (fk — функция, график которой есть линия L&. Функ- Функции <?>!,...,<?>?,... обладают следующими свойствами: 1) они определены на одном и том же отрезке [а, Ь], 2) они равномерно ограничены, 3) они равностепенно непрерывны. На основании теоремы Арцела из последовательности {(fk} можно вы- выбрать равномерно сходящуюся последовательность. Пусть это будет по- последовательность (р^\ ..., (р^к\ • • • Положим (р(х) = \im(p(k\x) при к —»¦ оо. Ясно, что <р(хо) = г/о- Остается проверить, что (р удовлетворяет на отрезке [а, Ь] данному дифференциаль- дифференциальному уравнению. Для этого требуется показать, что для любого е > О х" - х если только величина х" — х'\ достаточно мала. Для доказательства этого в свою очередь нужно установить, что при достаточно больших к если только разность \х" — х'\ достаточно мала. Так как / непрерывна в области G, то для любого е > 0 найдется такое г] > 0, что f(xf,yf) -е< /(ж, у) < f(xf,yf) + е, у = (р(х), 2г] и \у — у'\ < 4Мг]. Совокупность точек (ж, у) G G, удовлетворяющих этим двум неравен- неравенствам, представляет собой некоторый прямоугольник Q. Пусть теперь К настолько велико, что для всех к > К \ф) - (р{к)(х)\ <2Мг]
§ 7. Компактность в метрических пространствах 123 и все звенья ломаной L& имеют длину меньше г]. Тогда при \х — х'\ < 2г] все ломаные Эйлера уг , для которых к > К, целиком лежат внутри Q. Далее, пусть (ао, Ьо), • • •, (fln+i, Ьп+i) — вершины ломаной L&, причем «о ^ ж7 < ai < п2 < • • • < ап < х" ^ an+i (мы для определенности считаем х" > х \ аналогично рассматривается случай х" < х'). Тогда для соответствующей функции уг ' имеем ?>(fc)(ai) - ^к\х) = /(ao,bo)(ai - х), (fi(k) (ai+i) - (fi(k) (ai) = /(ai,6i)(ai+i -a,), г = 1,... ,n - 1, ^)(x")-^)(an) = /(an,bn)(a;"-an). Отсюда при \х" — x'\ < i) получаем [f(x', у') - e](oi - x') < <pW(ai) - <p™(x') < [f(x',y') + s](ai - x'), [f(x\ y') - s](ai+1 - ai) < <p(h)(ai+1) - <р™(<ц) < < [f{x',y) + e](ai+i - at); i = 1,..., n - 1, [/(*',»') - e](x" - an) < <f(k)(x") - <p(k)(an) < [f(x\ y') + e](x" - an). Суммируя эти неравенства, находим \S{x',y')-e](x"-x') < <pw(x") - <pw(x') < [f(x',y')+s](x"-x'), что и требовалось доказать. Разные подпоследовательности ломаных Эйлера могут сходиться к разным решениям уравнения C). Поэтому решение уравнения у = = /(ж, у), проходящее через точку (жо, 2/о), вообще говоря, не единственно. 6. Равномерная непрерывность. Непрерывные отображе- отображения метрических компактов. Для отображений метрического пространства в метрическое пространство, в частности, для число- числовых функций на метрических пространствах, наряду с понятием не- непрерывности имеет смысл важное для анализа понятие равномерной непрерывности: отображение F метрического пространства X в ме- метрическое пространство Y называется равномерно непрерывным, если для каждого г>0 найдется такое S>0, что p2(F(xi),F(x2))<? как только pi(xi,X2) < 8 (здесь pi — расстояние в X, а р^ — рас- расстояние в У), причем 8 зависит только от г, но не от х\ и Х2- Упражнение. Показать, что числовая функция F(x) = sup x(t) равномерно непрерывна на пространстве С [a, b]. a^t^b Для непрерывных отображений метрических компактов имеет место слецующая теорема, обобщающая хорошо известную из эле- элементарного курса анализа теорему о непрерывных функциях на от- отрезке.
124 Гл. П. Метрические и топологические пространства Теорема 6. Непрерывное отображение метрического компакта в метрическое пространство равномерно непрерывно. Доказательство. Пусть отображение F метрического ком- компакта К в метрическое пространство М непрерывно, но не равно- равномерно непрерывно. Это значит, что для некоторого г > 0 и каждого натурального п найдутся в К такие точки хп и х'п, что pi(xn,x'n) < < 1/п и в то же время p2(F(xn),F(x'n)) ^ г (pi — расстояние в К, р2 — расстояние в М). Из последовательности {хп} в силу компакт- компактности К можно выбрать подпоследовательность {хПк}, сходящуюся к некоторой точке х Е К. Тогда и {#^fe} сходится к ж; но при этом для каждого к должно быть выполнено хотя бы одно из неравенств P2(F(x),F(xnk)) 2 е/2; p2{F(xIF{xlnk)) > г/2, что противоречит непрерывности отображения F в точке х. 7. Обобщенная теорема Арцела. Пусть X и Y — два метри- метрических компакта и пусть Cxy — множество всех непрерывных ото- отображений / компакта X в Y. Введем в Cxy расстояние при помощи формулы p(f,g) = sup p(f(x),g(x)). хех Легко проверить, что таким образом Cxy превращается в метри- метрическое пространство. Теорема 7 (обобщенная теорема Арцела). Для пред- компактности множества D С Cxy необходимо и достаточно, чтобы входящие в D функции / были равностепенно непрерывны. Последнее означает, что для любого е > 0 должно существовать такое S > 0, что из р(х',х")<6 D) вытекает p(f(x'),f(x"))<e, E) каковы бы ни были / из D и х' и х" из X. Доказательство. Необходимость доказывается так же, как и в теореме 4. Докажем достаточность. Для этого погрузим Cxy в пространство Mxy всех отображений компакта X в компакт Y с той же самой метрикой P(f,9) = sup хех
§ 8. Кривые в метрических пространствах 125 которая была введена в Сху •> и докажем предкомпактность множе- множества D в Мху - Так как Сху замкнуто в Мху 1), то из предкомпакт- ности множества D в Мху следует его предкомпактность в Сху • Зададим г > 0 произвольно и выберем 5 так, чтобы из D) вы- вытекало E) для всех /из Dh всех ж', х" из X. Легко видеть, что X можно представить как сумму конечного числа непересекающих- непересекающихся множеств Ei, таких, что из ж', х" Е Е{ следует р(х'\х") < 5. Действительно, для этого достаточно выбрать точки xi,..., хп так, чтобы они образовали 5/2-сетъ в X и положить, например, \JB(Xj6/2), где B(xi,S/2) — шар радиуса 8/2 с центром х\. Рассмотрим теперь в компакте У некоторую конечную г-сеть 2/ъ---?2/т? и пУСТь L — совокупность функций д(х), принимаю- принимающих на множествах Е\ значения yj. Число таких функций, оче- очевидно, конечно. Покажем, что они образуют 2г-сеть по отношению к D в Мху- Действительно, пусть / G D. Для всякой точки Х{ из xi,..., хп найдется такая точка yj из 2/ъ ..., Ут, что p(f(xi),yj) < е. Пусть функция д G L выбрана так, что g(xi) = yj. Тогда p(f(x),g(x)) ^ p(f(x)J(xi)) + р(/(х{),д(х{)) + р(д(х{),д(х)) < 2s, если i выбрано так, что х G Е{. Отсюда вытекает, что конечное множество L действительно есть 2г-сеть для D и, таким образом, D предкомпактно в Мху -> а следо- следовательно, и в Сху - § 8. Непрерывные кривые в метрических пространствах2) Пусть задано непрерывное отображение р = /(о отрезка а ^ t ^ Ъ в метрическое пространство R. Когда t «пробегает» от- отрезок от а до Ь, соответствующая точка Р «пробегает» некоторую «непре- «непрерывную кривую» в пространстве R. Нам предстоит дать строгие опреде- определения, связанные с изложенной сейчас грубой идеей. Порядок, в котором 1) Поскольку предел равномерно сходящейся последовательности непрерыв- непрерывных отображений есть также непрерывное отображение. Указанное предложе- предложение представляет собой непосредственное обобщение известной теоремы анализа и доказывается так же, как и эта теорема. 2) Этот параграф не связан с дальнейшим изложением. При желании чита- читатель может его опустить.
126 Гл. П. Метрические и топологические пространства проходятся точки кривой, существен. Одно и то же множество, изобра- изображенное на рис. 12, проходимое в направлениях, указанных на рис. 13 и 14, мы будем считать различными кривыми. В качестве другого примера рассмотрим действительную функцию, определенную на отрезке [0,1], ко- которая изображена на рис. 15. Она определяет «кривую», расположенную на отрезке [0,1] оси ?/, отличную от этого отрезка, однократно пройденно- пройденного от точки 0 до точки 1, так как отрезок [А, В] проходится трижды (два раза вверх и один раз вниз). Рис. 12 Рис. 13 Рис. 14 Однако при одинаковом порядке прохождения точек простран- пространства выбор «параметра» t мы будем считать несущественным. Например, функции, изображенные на рис. 15 и 16, определяют одну и ту же «кри- «кривую», расположенную на оси у, хотя значения параметра ?, отвечающие какой-либо точке кривой, в случаях рис. 15 и 16 могут быть различными. Например, в случае рис. 15 точке А соответствуют на оси t две изолиро- изолированные точки, а в случае рис. 16 — одна изолированная точка и лежащий правее нее отрезок (когда t пробегает этот отрезок, точка на кривой оста- остается на месте). (Допускать такие отрезки неподвижности Р = f{t) будет удобно в дальнейшем при исследовании компактности систем кривых.) Рис. 15 Рис. 16 Перейдем к формальным определениям. Две непрерывные функции определенные соответственно на отрезках
§ 8. Кривые в метрических пространствах 127 и принимающие значения в метрическом пространстве R, назовем экви- эквивалентными, если существуют две непрерывные неубывающие функции t = <p (t), t = <p (t), определенные на некотором отрезке а ^ t ^ b и обладающие свойствами tp'ia) = а', <р'{Ь) = Ь', <р"(а)=а", у."(Ь) = 6", для всех t G [а, Ь]. Легко видеть, что так введенное отношение эквивалентности рефлек- рефлексивно (/ эквивалентно /), симметрично (если / эквивалентно / , то / эквивалентно /'). Можно показать, что оно и транзитивно (из эквивалент- эквивалентности /' и f" и эквивалентности /' и f'" вытекает эквивалентность /' и f'"). Поэтому все непрерывные функции рассматриваемого типа разби- разбиваются на классы функций, эквивалентных между собой. Каждый такой класс и определяет непрерывную кривую в пространстве R. Для любой функции Р = ff(tf), определенной на каком-либо отрез- отрезке [а7, б7], найдется эквивалентная ей функция, определенная на отрезке [а",Ь"] = [0,1]. Действительно, достаточно положить1) t = ip (t) = [b — a )t + a , t = (p (t) = t. Таким образом, всякую кривую можно предполагать заданной параме- параметрически при помощи функции, определенной на отрезке [0,1]. Поэтому целесообразно ввести в рассмотрение пространство Cir не- непрерывных отображений / отрезка / = [0,1] в пространство R с метрикой p(f,g) = sap p(f(t),g(t)). t Будем считать, что последовательность кривых Li, ... , Ln,... схо- сходится к кривой L, если кривые Ln можно параметрически представить в виде р = Ш, o^t^i, а кривую L — в виде р = №, o^t^i, так что р(/, fn) —>- 0 при п —»¦ оо. Применяя обобщенную теорему Арцела (теорема 7 § 7), легко доказать следующую теорему. 1) Мы считаем, что всегда а < Ь. Однако мы не исключаем «кривых», которые состоят из одной-единственной точки и получаются, если на [а, Ь] функция f(t) постоянна. Это тоже удобно для дальнейшего.
128 Гл. П. Метрические и топологические пространства Теорема 1. Если последовательность кривых Ь\,..., Ln,..., лежа- лежащих в компакте К, можно представить параметрически при помощи рав- равностепенно непрерывных функций на отрезке [О,1], то из нее можно вы- выделить сходящуюся подпоследовательность. Определим теперь длину кривой, заданной параметрически функцией P = f(t), a^t^b, как верхнюю грань сумм вида где точки ti подчинены лишь условиям a = to ^ t\ ^ • • • ^ ti ^ • • • ^ tn = Ъ. Легко видеть, что длина кривой не зависит от выбора ее параметриче- параметрического представления. Если ограничиться параметрическими представле- представлениями посредством функций, заданных на отрезке [0,1], то легко дока- доказать, что длина кривой есть полунепрерывный снизу функционал от / (в пространстве Cir). На геометрическом языке этот результат можно выразить в виде следующей теоремы о полу непрерывности. Теорема 2. Если последовательность кривых Ln сходится к кривой L, то длина кривой L не больше нижнего предела длин кри- кривых Ln. Рассмотрим теперь специально кривые конечной длины. Пусть кривая определена параметрически функцией P = f(t), a^t^b. Функция /, рассматриваемая лишь на отрезке [а,Т], где а ^ Т ^ 6, определяет «начальный отрезок» кривой от точки Ра = /(а) до точки Рт = f(T). Пусть s = <р(Т) — его длина. Легко устанавливается, что P = g(s) = f[<P~1(s)] есть новое параметрическое представление той же кривой. При этом s пробегает отрезок 0 ^ s ^ 5, где S — длина всей рассматриваемой кривой. Это представление удовлетворяет требованию p(g(si),g(s2)) ^ |s2 -si| (длина дуги не меньше хорды). Переходя к отрезку [0,1], получим параметрическое представление Р = F(t) = g(a), т = a/S, удовлетворяющее условию Липшица Мы видим, таким образом, что для всех кривых длины S ^ М, где М — некоторая константа, возмоэюно параметрическое представление равностепенно непрерывными функциями, заданными на отрезке [0,1]. К ним, следовательно, применима теорема 1. Покажем силу полученных общих результатов на примере доказатель- доказательства следующего важного предложения.
§ 8. Кривые в метрических пространствах 129 Теорема 3. Если в комплекте К две точки, А и В, можно соединить непрерывной кривой конечной длины, то среди таких кривых существует кривая наименьшей длины. В самом деле, пусть Y есть нижняя грань длин кривых, соединяющих А и В в компакте К. Пусть длины кривых Li,..., Ln,.. ., соединяющих А и В, стремятся к Y. Из последовательности Ln по теореме 1 можно выбрать сходящуюся подпоследовательность. По теореме 2 предельная кривая этой подпоследовательности не может иметь длину больше Y. Отметим, что даже в случае, когда К является замкнутой гладкой (надлежащее число раз дифференцируемой) поверхностью в евклидовом трехмерном пространстве, эта теорема не вытекает непосредственно из ре- результатов, устанавливаемых в курсе дифференциальной геометрии, где ограничиваются обычно случаем достаточно близких друг к другу точек А и В. Все изложенное выше приобрело бы большую прозрачность, если бы мы наделили множество всех кривых данного метрического простран- пространства R структурой метрического пространства. Это можно сделать, опре- определяя расстояние между кривыми Li,L2 формулой p(Li,L2) =infp(/i, /2), где нижняя грань берется по всем возможным парам параметрических представлений кривой L\ при помощи функции Р = fi{t) @ ^ t ^ 1) и кривой L2 при помощи функции Р = f2(t) @ ^ t ^ 1). Доказательство того, что это расстояние удовлетворяет обычным ак- аксиомам, очень просто, за исключением одного пункта: представляет не- некоторые трудности доказать, что из p(Li,L2) = 0 вытекает тождество кривых Li,L2. Этот факт является непосредственным следствием того обстоятельства, что нижняя грань в формуле, которой мы определили расстояние p(Li,L2), достигается при надлежащем выборе параметриче- параметрических представлений /i, /г- Но доказательство этого последнего утвержде- утверждения тоже не очень просто.
ГЛАВА III НОРМИРОВАННЫЕ И ТОПОЛОГИЧЕСКИЕ ЛИНЕЙНЫЕ ПРОСТРАНСТВА § 1. Линейные пространства Понятие линейного пространства относится к числу самых основ- основных в математике. Оно будет играть важную роль не только в этой главе, но и во всем дальнейшем изложении. 1. Основные определения и примеры линейных прост- пространств. Определение 1. Непустое множество L элементов ж, y,z,... называется линейным, или векторным, пространством, если оно удовлетворяет таким условиям: I. Для любых двух элементов х,у Е L однозначно определен тре- третий элемент z Е L, называемый их суммой и обозначаемый х + у, причем 1) ж + у = у + ж (коммутативность), 2) х + (у + z) = (ж + у) + z (ассоциативность), 3) в L существует такой элемент 0, что х + 0 = х для всех х Е L (существование нуля), 4) для каждого х Е L существует такой элемент —ж, что х + (—х) = 0 (существование противоположного элемента). П. Для любого числа а и любого элемента х G L определен эле- элемент ах G L (произведение элемента х на число а), причем 1) а(Cх) = (а(З)х, 2) 1-х = х, 3) (а + /3)х - ах + /Зх, 4) а(х + у) = ах + ш/. В зависимости от того, какой запас чисел (все комплексные или только действительные) используется, различают комплексные и действительные линейные пространстваг). Всюду, где не оговоре- оговорено противное, наши построения будут верны как для действитель- действительных, так и для комплексных пространств. 1) Можно было бы рассматривать и линейные пространства над произволь- произвольным полем.
§ 1. Линейные пространства 131 Заметим, что всякое комплексное линейное пространство мож- можно рассматривать как некоторое действительное пространство, если ограничиться в нем умножением векторов на действительные числа. Рассмотрим некоторые примеры линейных пространств, предо- предоставив читателю проверить для каждого из них сформулированные выше аксиомы. 1. Прямая линия М, т.е. совокупность действительных чисел, с обычными арифметическими операциями сложения и умножения, представляет собой линейное пространство. 2. Совокупность всевозможных наборов п действительных чисел х = (xi,... , жп), где сложение и умножение на число определяются формулами (жь... ,хп) + B/1,... ,уп) = (xi +2/i,... ,хп + Уп), а(хи...,хп) = (ахи...,ахп), также является линейным пространством. Оно называется действи- действительным п-мерным1) арифметическим пространством и обознача- обозначается символом Жп. Аналогично, комплексное n-мерное арифмети- арифметическое пространство Сп определяется как совокупность наборов п комплексных чисел (с умножением на любые комплексные числа). 3. Непрерывные (действительные или комплексные) функции на некотором отрезке [а, Ъ] с обычными операциями сложения функ- функций и умножения их на числа образуют линейное пространство С[а, Ь], являющееся одним из важнейших для анализа. 4. Пространство l^-, в котором элементами служат последователь- последовательности чисел (действительных или комплексных) X — \Х\ , . . . , Жп, . . . J, удовлетворяющие условию A) п=1 с операциями является линейным пространством. Тот факт, что сумма двух по- последовательностей, удовлетворяющих условию A), также удовле- удовлетворяет этому условию, вытекает из элементарного неравенства (ai + а2J ^ 2а\ + 2а\. 1) Этот термин будет разъяснен в дальнейшем.
132 Гл. III. Нормированные и топологические пространства 5. Сходящиеся последовательности х = (жьЖ2,...) с покоорди- покоординатными операциями сложения и умножения на числа образуют линейное пространство. Обозначим его с. 6. Последовательности, сходящиеся к 0, с теми же операциями сложения и умножения, также образуют линейное пространство. Обозначим его со- 7. Совокупность т всех ограниченных числовых последователь- последовательностей с теми же операциями сложения и умножения на числа, что и в примерах 4-6, тоже представляет собой линейное пространство. 8. Наконец, совокупность М°° всевозможных числовых последо- последовательностей с теми же самыми операциями сложения и умножения на числа, что и в примерах 4-7, тоже является линейным простран- пространством. Поскольку свойства линейного пространства — это свойства опе- операций сложения элементов и умножения их на числа, естественно ввести следующее определение. Определение 2. Линейные пространства L и L* называются изоморфными, если между их элементами можно установить взаим- взаимно однозначное соответствие, которое согласовано с операциями в L и L*. Это означает, что из ж<н>ж*, у <-»> у* (х,у Е L; х*,у* Е L*) следует х + у <-> х* + у* и ах <-> ах* {а — произвольное число). Изоморфные пространства можно рассматривать как различные реализации одного и того же пространства. Примерами изо- изоморфных линейных пространств могут служить арифметическое n-мерное пространство (действительное или комплексное) и про- пространство всех многочленов степени ^ п — 1 (соответственно с дей- действительными или комплексными коэффициентами) с обычными операциями сложения многочленов и умножения их на числа (до- (докажите изоморфность!). 2. Линейная зависимость. Элементы ж, y,...,w линейного пространства L называются линейно зависимыми, если существу- существуют такие числа а, /3,..., Л, не все равные 0, что ах + /Зу + ... + Xw = 0. B)
§ 1. Линейные пространства 133 В противном случае эти элементы называются линейно независимы- независимыми. Иначе говоря, элементы х,у,... ,w линейно независимы, если из равенства B) вытекает, что а = /3 = ... = Х = 0. Бесконечная система элементов ж,у,... пространства L на- называется линейно независимой, если любая ее конечная подсистема линейно независима. Если в пространстве L можно найти п линейно независимых эле- элементов, а любые п + 1 элементов этого пространства линейно зави- зависимы, то говорят, что пространство L имеет размерность п. Если же в L можно указать систему из произвольного конечного числа линейно независимых элементов, то говорят, что пространство L бесконечномерно. Базисом в n-мерном пространстве L называется любая система из п линейно независимых элементов. Пространства Жп в действительном случае и Сп в комплексном имеют, как легко проверить, размерность п, оправдывая тем самым свое название. В курсе линейной алгебры рассматриваются линейные простран- пространства конечной размерности. Наоборот, мы, как правило, будем зани- заниматься пространствами бесконечного числа измерений, представля- представляющими основной интерес с точки зрения анализа. Мы предостав- предоставляем читателю проверить, что каждое из пространств, указанных в примерах 3-8, имеет бесконечную размерность. 3. Подпространства. Непустое подмножество V линейного пространства L называется подпространством, если оно само обра- образует линейное пространство по отношению к определенным в L опе- операциям сложения и умножения на число. Иначе говоря, V С L есть подпространство, если из ж Е I/, у Е V следует, что ах + /Зу Е V при любых а и /3. Во всяком линейном пространстве L имеется подпространство, состоящее из одного нуля, — нулевое подпространство. С другой стороны, все L можно рассматривать как свое подпространство. Подпространство, отличное от L и содержащее хотя бы один не- ненулевой элемент, называется собственным. Приведем примеры собственных подпространств. 1. Пусть L — какое-либо линейное пространство и ж — некоторый его ненулевой элемент. Совокупность элементов {Лж}, где Л пробе- пробегает все числа (соответственно действительные или комплексные), образует, очевидно, одномерное подпространство. Оно является соб- собственным, если размерность L больше 1. 2. Рассмотрим пространство непрерывных функций С [а, Ь] (при- (пример 3 п. 1) и в нем совокупность всех многочленов Р[а,Ь]. Ясно, что многочлены образуют в С [а, Ь] подпространство (имеющее, как
134 Гл. III. Нормированные и топологические пространства и все С[а,6], бесконечную размерность). В то же время само про- пространство С [а, Ъ] можно рассматривать как подпространство более обширного пространства всех, непрерывных и разрывных, функций на [а, Ъ]. 3. Рассмотрим, наконец, пространства h,co,c,m и М°° (приме- (примеры 4-8 п. 1). Каждое из них является собственным подпростран- подпространством последующего. Пусть {ха} — произвольное непустое множество элементов ли- линейного пространства L. Тогда в L существует наименьшее подпро- подпространство (быть может, совпадающее с L), которое содержит {ха}. Действительно, по крайней мере одно подпространство, содержащее {ха}, в L существует: это все L. Далее ясно, что пересечение любо- любого множества {Lu} подпространств есть снова подпространство. В самом деле, если L* = [\LV и х,у Е L*, то и ах + (Зу Е L* при всех а, р. Возьмем теперь все подпространства, содержащие систему векторов {жа}, и рассмотрим их пересечение. Это и будет наимень- наименьшее подпространство, содержащее систему {ха}. Такое минималь- минимальное подпространство мы назовем подпространством, порожденным множеством ха, или линейной оболочкой множества {ха}. Мы бу- будем обозначать это подпространство L({xa}). Упражнение. Линейно независимая система {ха} элементов линей- линейного пространства L называется базисом Гамеля, если ее линейная обо- оболочка совпадает с L. Доказать следующие утверждения: 1) В каждом линейном пространстве существует базис Гамеля. Указание. Использовать лемму Цорна. 2) Если {ха} — базис Гамеля в L, то каждый вектор х Е L един- единственным образом представляется в виде конечной линейной комбинации некоторых векторов системы {жа}. 3) Любые два базиса Гамеля в линейном пространстве равномощны; мощность базиса Гамеля линейного пространства иногда называют алге- алгебраической размерностью этого пространства. 4) Линейные пространства изоморфны тогда и только тогда, когда они имеют одинаковую алгебраическую размерность. 4. Фактор-пространства. Пусть L — линейное пространство, и V — некоторое его подпространство. Скажем, что два элемента х и у из L эквивалентны, если их разность х — у принадлежит V. Это отношение рефлексивно, симметрично и транзитивно, т. е. опреде- определяет разбиение всех х G L на классы. Класс эквивалентных элемен- элементов называется классом смежности (по подпространству L'). Сово- Совокупность всех таких классов мы назовем фактор-пространством L по V и обозначим L/' V'.
§ 1. Линейные пространства 135 В любом фактор-пространстве, естественно, вводятся операции сложения и умножения на числа. Именно, пусть ? и г) — два клас- класса, представляющих собой элементы из L/L'. Выберем в каждом из этих классов по представителю, скажем, хну соответственно, и назовем суммой классов ? и г\ тот класс, который содержит эле- элемент х-\-у, а произведением класса ? на число а тот класс ?, который содержит элемент ах. Легко проверить, что результат не изменит- изменится от замены представителей хну какими-либо другими предста- представителями х' и у' тех же классов ? и rj. Таким образом, мы дей- действительно определили линейные операции над элементами фактор- пространства L/'V'. Непосредственная проверка показывает, что эти операции удовлетворяют всем требованиям, содержащимся в опре- определении линейного пространства (проведите эту проверку!). Иначе говоря, каждое фактор-пространство L/L' (с теми операциями сло- сложения и умножения на числа, которые мы сейчас в нем определили) представляет собой линейное пространство. Если L — пространство п измерений, а его подпространство V имеет размерность к, то фактор-пространство L/L' имеет размер- размерность п — к (докажите это!). Пусть L — произвольное линейное пространство и I/ — неко- некоторое его подпространство. Размерность фактор-пространства L/Lf называется коразмерностью подпространства V в пространстве L. Если подпространство L' С L имеет конечную коразмерность п, то в L можно выбрать элементы xi,... ,хп так, что всякий элемент х Е L будет (однозначно) представим в виде х = aixi + ... + апхп + у, где ai,...,an — числа и у G V. Действительно, пусть фактор- пространство L/L' имеет размерность п. Выберем в этом фактор- пространстве базис ?i,..., ?п и из каждого класса ?/. выберем по представителю Xk. Пусть теперь х — любой элемент из L и ? — тот класс в L/L1', который содержит х. Тогда По определению это значит, что каждый элемент из ?, в частности ж, отличается лишь на элемент из V от такой же линейной комбинации элементов х\,..., хп, т. е. х = а\Х\ + ... + апхп + у. Однозначность такой записи предоставляем доказать читателю. 5. Линейные функционалы. Числовую функцию /, опреде- определенную на некотором линейном пространстве L, мы будем называть функционалом. Функционал / называется аддитивным, если f(x + у) = f(x) + f(y) для всех х,у G Ц
136 Гл. III. Нормированные и топологические пространства он называется однородным, если f(ax) = otf{x) (a — произвольное число). Функционал /, определенный в комплексном линейном про- пространстве, называется сопряженно-однородным, если f(ax)=af(x), где а — число, комплексно сопряженное а. Аддитивный однородный функционал называется линейным функционалом. Аддитивный сопряженно-однородный функционал называется сопряженно-линейным, а иногда полулинейным. Укажем примеры линейных функционалов. 1. Пусть Жп есть n-мерное арифметическое пространство с эле- элементами х = (xi,..., хп) и а = (ai,..., ап) — произвольный набор из п фиксированных чисел. Тогда линейный функционал в W1. Выражение /(*) = представляет собой сопряженно-линейный функционал в Сп. 2. Интегралы ъ _ ъ I[x] = J x(t) dt, I[x] = J x(t) dt a a представляют собой соответственно линейный и сопряженно-линей- сопряженно-линейный функционалы в пространстве С [а, Ь]. 3. Рассмотрим более общий пример. Пусть у о — некоторая фикси- фиксированная непрерывная функция на [а, Ь]. Положим для любой функ- функции х G С[а, Ь] F(x) = fx(t)yo(t)dt. а Линейность этого функционала следует из основных свойств опе- операции интегрирования. Функционал F(x)= fx(t)yo(t)dt а будет сопряженно-линейным (в комплексном пространстве С [а, Ь]). 4. Рассмотрим в том же самом пространстве С[а, Ь] линейный функционал другого типа, а именно, положим ^0 = ж (to), так что
§ 1. Линейные пространства 137 значение функционала 5t0 на функции х равно значению этой функ- функции в фиксированной точке to- Этот функционал обычно записывают в виде ъ St0(x) = fx(tN(t-to)dt, а понимая под S «функцию», которая равна нулю всюду, кроме точки t = 0, и интеграл от которой равен единице (^-функция Дирака). Такие «функции» получили строгое определение в рамках теории обобщенных функций, элементы которой будут изложены в § 4 сле- следующей главы. 5. Приведем пример линейного функционала в пространстве Ь- Пусть к — фиксированное целое положительное число. Для каж- каждого х = (xi,..., хп,...) из Ь положим fk(x) = Xk- Линейность та- такого функционала очевидна. Эти функционалы допускают «распро- «распространение» на другие пространства последовательностей, например, на со, с, т, М°° (примеры 5-8, п. 1). 6. Геометрический смысл линейного функционала. Пусть / — некоторый отличный от тождественного нуля линейный функ- функционал на линейном пространстве L. Совокупность тех элементов х из L, которые удовлетворяют условию fix) = О, представляет собой подпространство пространства L — подпро- подпространство нулей или ядро функционала /. Действительно, если f(x) = /(|/) = 0, то = af(x)+Cf(y)=0. Это подпространство обозначается Ker f1). Подпространство Кег/ имеет коразмерность 1. Действительно, возьмем какой-либо элемент жо, не входящий в Кег /, т. е. такой эле- элемент, что f(xo) ф 0. Такой элемент найдется, поскольку /(ж) ф. 0. Без ограничения общности можно считать, что /(жо) = 1? ибо в про- противном случае мы заменили бы хо на ,f ° ч. (Ясно, что /( ,f° A =1.) /Оо) V V/Oo)/ / Для каждого элемента х положим y = x — f(x)xo; тогда f(y) = = f(x ~ f(x)x0) = 0, т. е. у G Кег /. Представление элемента х в виде х = ахо + у, где у G Кег/, при фиксированном элементе хо единственно. В самом деле, пусть , 2/ЕКег/, х = а'хо + у', y'^Kerf. Тогда (а — а')хо=у' — у. :) От английского слова kernel — ядро.
138 Гл. III. Нормированные и топологические пространства Если здесь а = а', то очевидно, что у' = у. Если же а ф а', то ГЦ ГЦ хо = — *у ? Кег/, что противоречит выбору xq. а* — а* Отсюда следует, что два элемента х\ и ж 2 тогда и только тогда принадлежат одному классу смежности по подпространству Кег/, когда /Oi) = /(ж2). Действительно, из х\ = f(xi)xo + 2/1,Ж2 = /(^2)^0 + 2/2 вытекает, что xi - ж2 = (f(xi) - /(^2)) • ж0 + B/1 - 2/2). Отсюда видно, что xi — Ж2 G Кег/ тогда и только тогда, когда коэффициент при жо, т.е. f(xi) - /(ж2), равен 0. Всякий класс ? по подпространству Кег / определяется любым из своих представителей. В качестве такого представителя мож- можно взять элемент вида ахо. Отсюда видно, что подпространство L/ Кег / действительно одномерно, т. е. Кег / имеет коразмерность 1. Подпространство Кег/ определяет линейный функционал, обра- обращающийся на нем в нуль, с точностью до постоянного множителя. В самом деле, пусть функционалы / и д имеют одно и то же ядро: Кег/ = Кег д. Выберем элемент хо так, чтобы /(жо) = 1- Мы утверждаем, что д(хо) ф 0. Действительно, х = f(x)x0 +у, у G Кег/ = Кег#, д(х) = f(x)g(xo)+g(y) = f(x)g(x0). Если бы значение д(хо) равнялось 0, то функционал д был бы тож- тождественным нулем. Из равенства д(х) = g(xo)f(x) и вытекает про- пропорциональность функционалов д и /. Для всякого подпространства V коразмерности 1 можно указать такой функционал /, что Кег/ = L'. Достаточно выбрать произ- произвольный элемент хо ? V и представить каждый элемент х G L в ви- виде х = ахо+у. Такое представление единственно. Положив /(ж) = а, мы получим линейный функционал /, для которого Кег / = L1 (про- (проверить это!). Пусть V — какое-нибудь подпространство коразмерности 1 в ли- линейном пространстве L; тогда всякий класс смежности простран- пространства L по подпространству V называется гиперплоскостью, парал- параллельной подпространству L' (в частности, само подпространство L' является гиперплоскостью, содержащей 0, т. е. «проходящей через начало координат»). Иными словами, гиперплоскость М'', парал- параллельная подпространству L', — это множество, получающееся из L' параллельным переносом (сдвигом) на какой-нибудь вектор жо G L: М' = Z/ + х0 = {у: у = х + ж0,х е L'}. Ясно, что если жо G L', то М' = I/; если же жо ^ I/, то М' ф V'. Если / — нетривиальный линейный функционал на пространстве L,
§ 2. Выпуклые множества и выпуклые функционалы 139 то множество Mf = {ж: /(ж) = 1} является гиперплоскостью, парал- параллельной подпространству Кег/ (действительно, фиксируя какой- нибудь элемент жо, для которого /(жо) = 15 мы можем всякий век- вектор ж Е Mf, представить в виде х = жо + у, где 2/ ? Кег/). С другой стороны, если М' — какая-нибудь гиперплоскость, параллельная подпространству V (коразмерности 1) и не проходящая через нача- начало координат, то существует единственный линейный функ- функционал / такой, что М' = {х: f{x) = 1}. Действительно, пусть М' = V + жо,жо Е L; тогда всякий элемент х Е L однозначно пред- представим в виде х = ахо+у, где у G L'. Полагая, как и выше, /(ж) = а, мы получим искомый линейный функционал; единственность сле- следует из того, что если д(х) = 1 при ж G М;, то д(у) = 0 при у G I/, так что у) = а = /(ажо + У)- Таким образом, установлено взаимно однозначное соответствие между всеми нетривиальными линейными функционалами, опре- определенными на L, и всеми гиперплоскостями в L, не преходящими через начало координат. Упражнение. Пусть /, /i,..., fn — такие линейные функционалы на линейном пространстве L, что из fi(x) = ••• = fn(x) = 0 вы- вытекает /(ж) = 0. Тогда существуют такие постоянные ai,...,an, что п f(x) = 2 akfk(x) для всех х е L. § 2. Выпуклые множества и выпуклые функционалы. Теорема Хана—Банаха 1. Выпуклые множества и выпуклые тела. В основе мно- многих важных разделов теории линейных пространств лежит понятие выпуклости. Оно опирается на наглядные геометрические предста- представления, но вместе с тем допускает и чисто аналитическую форму- формулировку. Пусть L — некоторое линейное действительное простран- пространство и ж, у — две его точки. Назовем замкнутым отрезком в L, соединяющим точки ж и у, совокупность всех элементов вида ах + (Зу, где а,/3^0, а + /3 = 1. Отрезок без концевых точек х и у называется открытым отрез- отрезком.
140 Гл. III. Нормированные и топологические пространства Множество М С L называется выпуклым, если оно вместе с лю- любыми двумя точками хну содержит и соединяющий их отрезок. Назовем ядром J(E) произвольного множества Е С L совокуп- совокупность таких его точек ж, что для каждого у Е L найдется такое число е = е(у) > 0, что х + ty Е Е при |?| < е. Выпуклое множество, ядро которого не пусто, называется выпу- выпуклым телом. Примеры. 1.В трехмерном евклидовом пространстве куб, шар, тетраэдр, полупространство представляют собой выпуклые тела. Отрезок, плоскость, треугольник в том же пространстве — выпу- выпуклые множества, но не выпуклые тела. 2. Рассмотрим в пространстве непрерывных функций на отрезке [а, Ъ] множество функций, удовлетворяющих условию |/(?)| ^ 1. Это множество выпукло; действительно, если |/(?)| ^ 1 и \g(t)\ ^ 1? т0 при а + /? = 1, а,/?^0 \af(t)+0g(t)\ ^a + 0 = l. Упражнение. Проверить, является ли это множество выпуклым те- телом. 3. Единичный шар в fa т, е. совокупность таких точек х = (xi,..., хп,...), что 5^жп ^ 1? есть выпуклое тело. Его ядро состоит из то- точек ж, удовлетворяющих условию Х]жп < 1- 4. Основной параллелепипед П в fa — выпуклое множество, но не выпуклое тело. В самом деле, пусть х G П; это означает, что \хп\ ^ l/2n-1 для всех п = 1,2,... Положим у0 = A,1/2,..., 1/п,...). Пусть х + tyo G П, т. е. \хп + t/n\ ^ l/2n-1; тогда _ _L_ * 2n~1 2n~1 2n~2' откуда t = 0, т. е. ядро множества П пусто. Упражнения. 1. Пусть Ф — совокупность точек х = (xi,..., хп, • • •) из /2, удовлетворяющих условию ^2п2Хп ^ 1. Доказать, что Ф — выпу- выпуклое множество, но не выпуклое тело. 2. Доказать то же самое для множества точек в /2, каждая из которых имеет лишь конечное число отличных от нуля координат. Если М— выпуклое множество, то его ядро J(M) тоже выпукло. Действительно, пусть ж, у G J{M) и z = ах + Ру, а,/3 ^ 0, а + /3 = 1. Тогда для данного a G L найдутся такие Е\ > 0 и г2 > 0, что при |ti| < ?1, ^1 < ?2 точки x + tia и y + t2d принадлежат множеству М, следовательно, ему принадлежит и точка а(ж + ?а)+/3B/ + ?а) = ? + ?а при \t\ < г = min(?i,?2), т. е. 2: G J(M).
§ 2. Выпуклые множества и выпуклые функционалы 141 Установим следующее важное свойство выпуклых множеств. Теорема 1. Пересечение любого числа выпуклых множеств есть выпуклое множество. Доказательство. Пусть М = f] Ma и все Ма — выпуклые а множества. Пусть, далее, хну — две произвольные точки из М. Тогда отрезок, соединяющий точки хиу, принадлежит каждому Ма, а следовательно, и М. Таким образом, М действительно выпу- выпукло. Заметим, что пересечение выпуклых тел (будучи выпуклым мно- множеством) не обязано быть выпуклым телом (приведите пример). Для произвольного множества А в линейном пространстве L су- существует наименьшее выпуклое множество, которое его содержит; им будет пересечение всех выпуклых множеств, содержащих А (по крайней мере одно выпуклое множество, содержащее А, существу- существует — это всё L). Минимальное выпуклое множество, содержащее А, мы назовем выпуклой оболочкой множества А. Рассмотрим один важный пример выпуклой оболочки. Пусть xi,... ,жп+1 — точки некоторого линейного пространства. Мы ска- скажем, что эти точки находятся в общем положении, если векто- векторы Х2 — Ж1,жз — Ж1,...,жп+1 — х\ линейно независимы. (Это рав- п+1 п+1 носильно тому, что из ^2 XiXi = 0 и ^2 Xi = 0 вытекает, что Ai = ... = An+i = 0.) Выпуклая оболочка точек xi,... , жп+ъ на- находящихся в общем положении, называется п-мерным симплексом, а сами точки х\,...,хп+\ — его вершинами. Нульмерный симплекс — это одна точка. Одномерный симплекс — отрезок, двумерный — треугольник, трехмерный — тетраэдр. Если точки xi,... , жп+1 находятся в общем положении, то любые к + 1 из них (к < п) также находятся в общем положении и, следо- следовательно, порождают некоторый ^-мерный симплекс, называемый к-мерной гранью данного n-мерного симплекса. Например, тетра- тетраэдр с вершинами е1,в2,ез,е4 имеет четыре двумерные грани, опре- определяемые соответственно тройками вершин (е2,ез,в4), (в1,ез,е4), (ei,e2,e4), (е1,в2,ез), шесть одномерных граней и четыре нульмер- нульмерных. Теорема 2. Симплекс с вершинами х\,...,хп+\ есть совокуп- совокупность всех точек, которые можно представить в виде п+1 п+1 х = ^акхк, ak^0, ^2ak = l. A) k=l k=l
142 Гл. III. Нормированные и топологические пространства Доказательство. Легко проверить, что совокупность S то- точек вида A) представляет собой выпуклое множество, содержащее точки xi,... , жп+ь С другой стороны, всякое выпуклое множество, содержащее эти точки, должно содержать и точки вида A); следова- следовательно, S является наименьшим выпуклым множеством, содержа- содержащим ТОЧКИ Х\ , . . . 2. Однородно-выпуклые функционалы. С понятием выпу- выпуклого множества тесно связано важное понятие однородно-выпук- однородно-выпуклого функционала. Пусть L — действительное линейное простран- пространство. Определенный на L функционал р называется выпуклым, если р(ах + A - а)у) ^ ар(х) + A - а)р(у) B) для всех х,у Е L и 0 ^ а ^ 1. Функционал р называется положительно-однородным, если р(ах) = ар(х) для всех х Е L и всех а > 0. C) Для выпуклого положительно-однородного функционала выпол- выполнено неравенство: р(х + у) ^р(х)+р(у). B') Действительно, р(х + у) = 2р(Ш) ^ 2(р(§) +р(|)) =р(х) +Р(у). Легко понять, что условие B') вместе с условием C) обеспечивает выпуклость функционала р. Положительно-однородный выпуклый функционал мы будем называть короче однородно-выпуклым. Ука- Укажем некоторые простейшие свойства однородно-выпуклых функцио- функционалов. 1. Полагая в равенстве C) х = 0, получаем Р(О) = 0. D) 2. Из B') и D) следует, что 0 = р{х + (~х)) ^ р(х) +р(—х) для всех х G L. E) Это неравенство означает, в частности, что если р(х) < 0, то обяза- обязательно р(—х) > 0. Таким образом, ненулевой однородно-выпуклый функционал может быть всюду неотрицателен, но если всюду р(х) ^ 0, то р{х) = 0. 3. При любом а р(ах) ^ ар(х). При а > 0 это следует из C), при а = 0 — из D); если же а < 0, то в силу E) получаем 0 ^ р(ах) + р(\а\х) = р(ах) + |а|р(ж), т.е. р(ах) ^ -\а\р(х) = ар(х).
§ 2. Выпуклые множества и выпуклые функционалы 143 Примеры. 1. Всякий линейный функционал является, очевид- очевидно, однородно-выпуклым. Однородно-выпуклым будет и функцио- функционал р(х) = |/(ж)|, если / линеен. 2. Длина вектора в n-мерном евклидовом пространстве есть одно- однородно-выпуклый функционал. Здесь условие B') означает, что дли- длина суммы двух векторов не превосходит суммы их длин (неравен- (неравенство треугольника), а C) непосредственно следует из определения длины вектора в Жп. 3. Пусть т — пространство ограниченных последовательностей х = (xi,..., хп,...). Функционал р(х) =sup|xn| п — однородно-выпуклый. 3. Функционал Минковского. Пусть L — произвольное ли- линейное пространство и А — выпуклое тело в L, ядро которого со- содержит точку 0. Функционал PA(x)=mf{r:f€A,r>0} F) называется функционалом Минковского выпуклого тела А. Теорема 3. Функционал Минковского F) — однородно-выпук- однородно-выпуклый и неотрицательный. Обратно, если р(х) — произвольный одно- однородно-выпуклый неотрицательный функционал на линейном про- пространстве L и к — положительное число, то А = {х: р(х) <С к} G) есть выпуклое тело, ядром которого служит множество {х: р(х) < к} (содержащее точку 0). Если в G) к = 1, то исходный функцио- функционал р(х) есть функционал Минковского для А. Доказательство. Для всякого х G L элемент х/r принадле- принадлежит А, если г достаточно велико; поэтому величина ра(х), опреде- определяемая равенством F), неотрицательна и конечна. Проверим поло- положительную однородность функционала F). Если t > 0 и у = tx, то Ра(у) = inf{r > 0: у/г G А} = inf{r > 0: tx/r G A} = = inijtr' > 0: x/r' e A} = tinijr' > 0: x/r G A} = tpA(x). (8) Проверим выпуклость рл(х). Пусть Xi,^2 G L и е > 0 произвольно. Выберем числа ri(i = 1,2) так, что PA(%i) < П < PA(%i) + ?'•> тогда XiJTi G А. Положим г = Г1+Г2, тогда точка (xi+X2)/r = riXi/(rri) +
144 Гл. III. Нормированные и топологические пространства +г2х2 / (гг2) принадлежит отрезку с концами x\jr\ и х2/г2. В силу выпуклости А этот отрезок, а значит, и точка [х\ + х2)/г принадле- принадлежат А, откуда Pa(xi +ж2) ^ г = ri +r2 <pa(xi) Так как г > 0 здесь произвольно, то Следовательно, ра(х) удовлетворяет условиям B') и C), а потому это — неотрицательный однородно-выпуклый функционал. Рассмотрим теперь множество G). Если х,у Е А и а + C = 1, а, E ^ 0, то р(ах + /32/) ^ ар(ж) + (Зр(у) ^ fe, т. е. А выпукло. Далее, пусть р(х) <k,t>0ny?L, тогда р(х ± ty) ^ р(х) + tp(±y). Если р(—у) = р(з/) = 0, то x±ty G А при всех ?; если же хотя бы одно из неотрицательных чисел р(у), р(—у) отлично от 0, то ж =Ь t^/ G А при *p(*) Непосредственно из введенных определений ясно, что р служит функционалом Минковского для множества {х: р(х) ^1}. Итак, введя понятие функционала Минковского, мы установи- установили соответствие между неотрицательными однородно-выпуклыми функционалами и выпуклыми телами с ядром, содержащим точ- точку 0. Примеры. 1. При А = L имеем, очевидно, Рь(х) =0. 2. Пусть А — шар с центром 0 и радиусом гв1п. Тогда Ра(х) = \\х\\/г, где ||ж|| — длина вектора х. 3. Пусть А — «слой» — 1 ^ х\ ^ 1 в пространстве 12 последова- последовательностей х = (xi,..., хп,...). Тогда РА (х) = |xi|. Замечания. 1. Иногда удобно рассматривать однородно-вы- однородно-выпуклые функционалы, которые могут принимать не только конеч- конечные значения, но и значение +оо (но не — оо). Тогда из равенства р(ах) = ар(х) (где а > 0) следует, что р@) = 0 или р@) = оо. Легко
§ 2. Выпуклые множества и выпуклые функционалы 145 проверить, что в этом последнем случае можно, не нарушая одно- однородной выпуклости функционала, изменить его значение в одной точке, положив р@) = 0 вместо р@) = +оо. Так обычно и делают. Если р(х) — однородно-выпуклый, но не обязательно конечный, функционал, то А = {х: р(х) ^ к} есть выпуклое множество, но не обязательно выпуклое тело. Обратно, если А — произволь- произвольное выпуклое множество, содержащее точку 0, то для него можно определить функционал Минковского формулой F), но при этом придется для г допускать и значение +оо. 2. Если pi (ж) и р2 [х) — однородно-выпуклые функционалы, то та- таковы же р\{х) +Р2(х) и api(x) при а > 0. Далее, если {ps(x)}ses — произвольное семейство однородно-выпуклых функционалов, то та- таков и функционал р{х) = supps(x). В частности, верхняя грань ses р(х) = sup/s(x) любого непустого множества линейных функциона- ses лов на L есть однородно-выпуклый функционал. Воспользовавшись теоремой Хана—Банаха, легко показать, что так можно представить всякий (конечный) однородно-выпуклый функционал. Упражнение. Множество А в линейном пространстве L называется поглощающим, если для всякого х Е L существует такое а > 0, что х Е А А для всех Л ^ а. Доказать, что выпуклое множество А — поглощающее в том и только том случае, если его ядро содержит точку О. 4. Теорема Хана—Банаха. Пусть L — действительное линей- линейное пространство и Lq — некоторое его подпространство. Пусть, далее, на подпространстве Lq задан некоторый линейный функцио- функционал /о. Линейный функционал /, определенный на всем простран- пространстве L, называется продолжением функционала /о, если f(x) = /о (ж) для всех х е Lo. Задача о продолжении линейного функционала часто встречается в анализе. Основную роль во всем этом круге вопросов играет сле- следующая теорема. Теорема 4 (Хан-Банах). Пусть р — однородно-выпуклый функционал, определенный на действительном линейном простран- пространстве L, и пусть Z/Q — линейное подпространство в L. Если /о — ли- линейный функционал на Lq, подчиненный на Lq функционалу р(х), т. е. если на Lq /о (ж) О(я), (9) то /о может быть продолжен до линейного функционала / на L, подчиненного р(х) на всем L.
146 Гл. III. Нормированные и топологические пространства Доказательство. Покажем, что если Lq ф L, то функцио- функционал /о можно продолжить с Z/Q на некоторое большее подпростран- подпространство L' с сохранением условия (9). Действительно, пусть z — про- произвольный элемент из L, не принадлежащий Lq, и пусть V — под- подпространство, порожденное Lq и z. Каждый элемент из V имеет вид tz + ж, где х Е I/q. Если /' — искомое продолжение функционала /о на Z/, то f'(tz + x)=tf'(z) + fo(x), или, если положить ff(z) = с, Теперь выберем с так, чтобы сохранить на V условие подчине- подчинения (9), т.е. так, чтобы при всех х G Lq и всех действительных t выполнялось неравенство /о(х) + tc ^ р(ж + tz). При ? > 0 оно рав- равносильно условию ), или а при ? < 0 — условию или Покажем, что всегда существует число с, удовлетворяющее этим двум условиям. Пусть у' и у" — произвольные элементы из Lq. Тогда -/о(у") +Р(У" + z) > -Ш)-Р(~У' ~ z). Это вытекает из неравенства у"-У') =p((y"+z)-(y'+z)) ^p(y"+ Положим c" = mi(-fo(y")+p(y" + z)), у" с' = sup(-/0B/') - р(-2/' - ^)). у' Из (9) в силу произвольности у' и у" следует, что с" ^ с'. Выбрав с так, что с" ^ с ^ с1', определим функционал /; на L; формулой f(tz + x) =tc + /0(x). Этот функционал удовлетворяет условию подчинения (9).
§ 2. Выпуклые множества и выпуклые функционалы 147 Итак, мы показали, что если функционал /о определен на неко- некотором подпространстве Lq С L и удовлетворяет на Lq условию (9), то /о можно продолжить с сохранением этого условия на некоторое большее подпространство L'. Если в L можно выбрать счетную систему элементов х\,..., жп,..., порождающую все L, то функционал на L строим по ин- индукции, рассматривая возрастающую цепочку подпространств (здесь {L,(k\xk+i} означает минимальное линейное подпростран- подпространство в L, содержащее l/^ и Xk+i)- Тогда каждый элемент х Е L войдет в некоторое l/^ и, следовательно, функционал будет про- продолжен на все L. В общем случае (т. е. когда счетного множества, порождающе- порождающего L, не существует) доказательство заканчивается применением леммы Цорна. Совокупность Т всевозможных продолжений функ- функционала /о, удовлетворяющих условию подчинения (9), частично упорядочена, и каждое ее линейно упорядоченное подмножество J-q обладает верхней гранью; этой верхней гранью служит функционал, определенный на объединении областей определения функционалов /' Е fo и совпадающий с каждым таким /' на его области опреде- определения. В силу леммы Цорна во всем Т существует максимальный элемент /. Этот максимальный элемент / и представляет собой ис- искомый функционал. Действительно, он является продолжением ис- исходного функционала /о, удовлетворяет условию (9) на своей обла- области определения и задан на всем L, так как иначе мы продолжили бы его описанным выше способом с того собственного подпростран- подпространства, на котором он определен, на большее подпространство, и / не был бы максимальным. Теорема доказана. Приведем еще комплексный вариант теоремы Хана—Банаха. Неотрицательный функционал рна комплексном линейном пространстве L называется однородно-выпуклым, если для всех ж, у G L и всех комплексных чисел Л р(х + у) ^р(х) +р(у), р(Хх) = \Х\р(х). Теорема 4а. Пусть р — однородно-выпуклый функционал на комплексном линейном пространстве L, а /о — линейный функ- функционал, определенный на некотором линейном подпространстве Lq С L и удовлетворяющий на нем условию |/оО)| ^р(х), х G I/O-
148 Гл. III. Нормированные и топологические пространства Тогда существует линейный функционал /', определенный нзь всем L и удовлетворяющий условиям |/0)| 00), х Е Ц f(x)=fo(x), х Е Lo. Доказательство. Обозначим через Ьц и Lqr пространства L и Lq, рассматриваемые как действительные линейные пространства. Ясно, что р — однородно-выпуклый функционал на L#, а /од(ж) = = Re /о (х) — действительный линейный функционал на Z/оя, удо- удовлетворяющий условию |/ояО)| ^р(х) и, тем более, условию /од (я) 00). В силу теоремы 4 существует действительный линейный функцио- функционал /д, определенный на всем Lr и удовлетворяющий условиям /яО) ^ рО), х G ?д(= I/), /яО) = /од(ж), ж G ?Од(= ^о). Ясно, что —Jr{x) = Jr{—x) ^ р(—ж) = р(ж), так что |/я(х)| ^р(х), xeLR(=L). A1) Определим функционал / на L, полагая /(ж) = fR(x) - ifR(ix) (здесь мы пользуемся тем, что L — комплексное линейное пространство, так что в нем определено умножение на комплексные числа). Непосредственная проверка показывает, что / — комплекс- комплексный линейный функционал на L, причем f(x) = /о(ж) при х е Lo, Re/(ж) = /д(ж) при х G L. Осталось показать, что /|(ж)| ^ р(х) для всех х G L. Допустим противное; тогда для некоторого хо G L имеем |/(жо)| > р(хо). Пред- Представим комплексное число /(жо) в виде /(жо) = рег(р, где р > 0, и по- положим 2/о = е~г(рх0. Тогда /д(з/о) = Re/B/o) = Re[e~^/(x0)] = /о > > р(жо) = р(уо), что противоречит условию A1). Теорема доказана. Упражнение. Покажите, что условие конечности функционала р в теореме Хана-Банаха можно опустить. 5. Отделимость выпуклых множеств в линейном прост- пространстве. Пусть L — действительное линейное пространство, а М и N — два его подмножества. Говорят, что определенный на L ли-
§ 2. Выпуклые множества и выпуклые функционалы 149 нейный функционал / разделяет эти множества, если существует такое число С, что f(x) ^ С при х е М и f(x) ^ С при х е N, т. е. если inf f(x) ^ sup f(x). х^м xeN Функционал / называется строго разделяющим множества М и N, если выполнено строгое неравенство inf' f(x) > sup/(ж). хем Следующие два утверждения непосредственно вытекают из опре- определения разделимости. 1) Линейный функционал / разделяет множества М и N в том и только том случае, когда он разделяет множества M — Nn {0} (т. е. множества всех элементов вида х — у, где х Е М, у Е N, и точку 0). 2) Линейный функционал / разделяет множества М и N в том и только том случае, когда при каждом х G L он разделяет множе- множества М — х и N — х. Из теоремы Хана-Банаха легко получается следующая теоре- теорема об отделимости выпуклых множеств в линейном пространстве, имеющая многочисленные применения. Теорема 5. Пусть М и N — выпуклые множества в действи- действительном линейном пространстве L, причем ядро хотя бы одного из них, скажем М, не пусто и не пересекается с другим множеством. Тогда существует ненулевой линейный функционал на L, разделяю- разделяющий М и N. Доказательство. Без ограничения общности можно считать, что точка 0 принадлежит ядру М множества М. (Иначе мы рассмот- рассмотрели бы множества М — хо и N — жо, где хо G М.) Пусть у о G N, тогда точка — у о принадлежит ядру множества М — N, а 0 принадлежит ядру К множества К = М - N + у0. Так как М П N = 0, то 0 не принадлежит ядру М — N и у о (? К. Пусть р — функционал Минковского для К. Тогда р(уо) ^ 1, поскольку уо ? К. Введем линейный функционал /о(ш/о) = ар(уо). Он определен на одномерном пространстве, состоящем из элементов вида ay о, и удовлетворяет условию /о(ш/о)
150 Гл. III. Нормированные и топологические пространства поскольку р(ауо)=ар(уо) при а^О, и fo(ayo)=afo(yo)<0<p(ayo) при а < 0. По теореме Хана-Банаха функционал /о можно продолжить до линейного функционала /, определенного на всем L и удовлетво- удовлетворяющего на L условию f{y) ^ р(у)- Отсюда следует, что f{y) ^ 1 при у Е К и в то же время f(yo) ^ 1. Таким образом, / разделяет множества К и {уо}, а следовательно, / разделяет М — N и {0}; но тогда / разделяет множества М и N. Теорема доказана. § 3. Нормированные пространства В главе II мы занимались топологическими и, в частности, метри- метрическими пространствами, т. е. множествами, в которых введено, тем или иным способом, понятие близости элементов, а в предыдущих параграфах данной главы мы имели дело с линейными простран- пространствами. До сих пор каждое из этих понятий стояло особняком. Од- Однако в анализе приходится иметь дело с пространствами, в которых введены как операции сложения элементов и умножения их на чи- числа, так и некоторая топология, т. е. рассматривать так называемые топологические линейные пространства. Среди послед- последних важный класс образуют нормированные пространства. Теория этих пространств была развита в работах С. Банаха и ряда других авторов. 1. Определение и примеры нормированных пространств. Определение 1. Пусть L — линейное пространство. Одно- Однородно-выпуклый функционал р, определенный на L, называется нормой, если он удовлетворяет следующим дополнительным усло- условиям (помимо выпуклости): 1) р(х) = 0 только при х = 0, 2) р(ах) = |а|р(ж) для всех а. Таким образом, вспоминая определения из п. 2 § 2, мы можем сказать, что нормой в L называется функционал, удовлетворяющий следующим трем условиям: 1) р(х) ^ 0, причем р(х) = 0 только при х = 0, 2) р(х + у) ^ р(х) + р(у), х,у е L, 3) р(ах) = |а|р(ж), каково бы ни было число а.
§ 3. Нормированные пространства 151 Определение 2. Линейное пространство L, в котором зада- задана некоторая норма, мы назовем нормированным пространством. Норму элемента х Е L мы будем обозначать символом ||ж||. Всякое нормированное пространство становится метрическим пространством, если ввести в нем расстояние P\xj У) — IIх У\\- Справедливость аксиом метрического пространства тотчас же вы- вытекает из свойств 1)—3) нормы. На нормированные пространства пе- переносятся, таким образом, все те понятия и факты, которые были изложены в гл. II для метрических пространств. Полное нормированное пространство называется банаховым пространством или, короче, В -пространством. Примеры нормированных пространств. Многие из пространств, рассматривавшихся в гл. II в качестве примеров ме- метрических (а в § 1 данной главы — линейных) пространств, в дей- действительности могут быть наделены естественной структурой нор- нормированного пространства. 1. Прямая линия Ш. становится нормированным пространством, если для всякого числа xGl положить ||ж|| = |ж|. 2. Если в действительном n-мерном пространстве W1 с элемента- элементами х = {х\,... , хп) положить \х\\ = \ A) к=1 то все аксиомы нормы будут выполнены. Формула р(х,у) = \\x-y\\ = \ п к=1 хк -Ук) 2 определяет в Кп ту самую метрику, которую мы в этом пространстве уже рассматривали. В этом же линейном пространстве можно ввести норму B) k = l или норму ЦжЦоо = max \xk\. C) l^k^n Эти нормы определяют в W1 метрики, которые мы рассматривали в примерах 4 и 5 п. 1 § 1 гл. П. Проверка того, что в каждом из этих
152 Гл. III. Нормированные и топологические пространства случаев аксиомы нормы действительно выполнены, не составляет труда. В комплексном n-мерном пространстве Сп можно ввести норму \\x\\ = ^ k=l \ или любую из норм B) или C). 3. В пространстве С [а, Ь] непрерывных функций на отрезке [а, Ь] определим норму формулой = max.|/(t)|. D) Соответствующее расстояние уже рассматривалось в примере б п. 1 § 1 гл. П. 4. Пусть т — пространство ограниченных числовых последова- последовательностей х = (xi,... , хп,...). Положим ||ж|| = sup \xn\. E) п Условия 1)-3) определения нормы здесь, очевидно, выполнены. Мет- Метрика, которая индуцируется в т этой нормой, совпадает с той, ко- которую мы уже рассматривали (пример 9 п. 1 § 1 гл. II). 2. Подпространства нормированного пространства. Мы определили подпространство линейного пространства L (не снаб- снабженного какой-либо топологией) как непустое множество Lq, обла- обладающее тем свойством, что если х,у Е Lq, то ах + (Зу G Lq. В нор- нормированном пространстве основной интерес представляют замкну- замкнутые линейные подпространства, т. е. подпространства, содержащие все свои предельные точки. В конечномерном нормированном про- пространстве всякое подпространство автоматически замкнуто (дока- (докажите это!). В бесконечномерном случае это не так. Например, в про- пространстве С [а, Ь] непрерывных функций с нормой D) многочлены образуют подпространство, но не замкнутое1). Другой пример: в пространстве т ограниченных последователь- последовательностей последовательности, содержащие лишь конечное число от- отличных от нуля членов, образуют подпространство. Однако оно не замкнуто по норме E): в его замыкании содержится, например, последовательность A,1/2,..., 1/п,...). 1)В силу теоремы Вейерштрасса, гласящей, что всякая непрерывная функ- функция на отрезке есть предел равномерно сходящейся последовательности много- многочленов, замыкание подпространства многочленов в С[а,6] есть все С[а,6].
§ 3. Нормированные пространства 153 Как правило, мы будем рассматривать только замкнутые под- подпространства, поэтому естественно изменить терминологию, кото- которая была установлена в § 1. Подпространством нормированного пространства мы будем называть теперь только замкнутое под- подпространство: в частности, подпространством, порожденным данной системой элементов {жа}, мы будем называть наименьшее замкну- замкнутое подпространство, содержащее {ха}. Мы будем говорить о нем, как о линейном замыкании системы {жа}. Совокупность элементов (не обязательно замкнутую), содержащую вместе с х и у их произ- произвольную линейную комбинацию ах-\- (Зу, будем называть линейным многообразием. Систему элементов, лежащую в нормированном пространстве Е, мы будем называть полной, если порожденное ею (замкнутое!) под- подпространство есть все Е. Например, в силу теоремы Вейерштрасса совокупность всех функций 1, ?, ?2,..., ?п,... полна в пространстве непрерывных функций С [а, Ь]. 3. Фактор-пространства нормированного пространства. Пусть R — нормированное пространство и М — некоторое его под- подпространство. Рассмотрим фактор-пространство Р = R/M. В соот- соответствии со сказанным в п. 4 § 1 этой главы Р есть линейное про- пространство. Определим в нем норму, положив для каждого класса смежности ? IKII = infN|. F) Покажем, что при этом выполнены сформулированные в п. 1 аксио- аксиомы нормированного пространства. Ясно, что всегда ||?|| ^ 0. Если ?о — нулевой элемент фактор-пространства Р (т. е. ?о совпадает с подпространством М), то в качестве xG(o можно взять нуль про- пространства Л, и тогда получаем, что ||?о|| = 0- Обратно, если ||?|| = 0, то из определения нормы F) следует существование в классе ? по- последовательности, сходящейся к нулю. Но так как М замкнуто, то замкнут и каждый класс смежности, значит, 0 Е ?, а это означает, что ? = М, т. е. ? есть нулевой элемент в Р. Итак, ||?|| ^ 0 и ||?|| = 0 лишь тогда, когда ? — нуль пространства Р. Далее, для всякого х G R и всякого а имеем ||аж|| = \а\ • \\x\\. Беря в обеих частях этого равенства нижнюю грань по х G ?, полу- получаем 1К11 = 1«Н1?Ц. Наконец, пусть ?, г] G Р и х G ?, у G г\. Тогда
154 Гл. III. Нормированные и топологические пространства Беря в правой части этого неравенства нижнюю грань по всем у Е г], получаем, что Итак, все аксиомы нормированного пространства для Р выполнены. Покажем теперь, что если R полно, то и Р = R/M полно. Действи- Действительно, согласно F) для каждого ? Е R/M найдется такой элемент jG(, что u\\>hn\- Пусть {?п} — фундаментальная последовательность в Р. Переходя, если нужно, к подпоследовательности, можно считать, что ряд 71=1 сходится. Добавив к {?п} еще ?о — нулевой элемент простран- пространства Р, — выберем хп G ?n+i — ?п (п = 0,1, 2,...) так, что ОО Тогда ряд ^2 \\хп\\ сходится, а значит, в силу полноты простран- п—0 оо оо ства R сходится и ряд ^2 хп • Положив х — ^2 хп и обозначив через п=0 п=0 п—1 ? класс, содержащий ж, получим (поскольку ^2 хк ? ?k ПРИ ка~ ждом п) к=0 k=0 т.е. ? = lim ?п. Итак: О при п —У оо, фактор-пространство банахова пространства по любому его {замкнутому) подпространству есть банахово пространство. Упражнения. 1. Пусть R — банахово пространство, В\ D B^ D ... D D 5П Э ... — последовательность вложенных замкнутых шаров в нем. Докажите, что она имеет непустое пересечение (не предполагается, что радиусы этих шаров стремятся к 0; ср. с упражнением 3 п. 2, § 3, гл. II). Приведите пример последовательности вложенных непустых ограничен- ограниченных замкнутых выпуклых множеств в некотором 5-пространстве, имею- имеющих пустое пересечение. 2. Пусть R — бесконечномерное 5-пространство; тогда его алгебраи- алгебраическая размерность (см. упражнение 3), п. 3 § 1) несчетна. 3. Пусть R — линейное нормированное пространство; доказать спра- справедливость следующих утверждений: 1) всякое конечномерное линейное многообразие в R замкнуто;
§ 4. Евклидовы пространства 155 2) если М — подпространство, а N — конечномерное подпространство в Я, то их сумма М + N = {х: х = у + z, у е М, 2 G N} замкнута; привести пример двух (замкнутых) линейных подпространств в Ь, сумма которых не замкнута; 3) пусть Q — открытое выпуклое множество в Я, и пусть хо ф Q; тогда существует гиперплоскость, проходящая через точку хо и не пересекаю- пересекающая Q. 4. Две нормы, || • ||i и || • Цг, в линейном пространстве R называют- называются эквивалентными, если существуют такие постоянные а, Ь > 0, что a||x||i ^ \\x\\2 ^ b||#||i, Для всех х Е R. Доказать, что если пространство R конечномерно, то любые две нормы в нем эквивалентны. § 4. Евклидовы пространства 1. Определение евклидовых пространств. Один из хорошо известных способов введения нормы в линейном пространстве — это задание в нем скалярного произведения. Напомним, что скалярным произведением в действительном линейном пространстве R называ- называется действительная функция (ж, у), определенная для каждой пары элементов х,у G R и удовлетворяющая следующим условиям: 1) (ж,у) = (у,ж), 2) (х1+х2,у) = (х1,у) + (х2,у), 3) (\х,у) = \(х,у), 4) (ж, ж) ^ 0, причем (ж, ж) = 0 только при ж = 0. Линейное пространство с фиксированным в нем скалярным про- произведением называется евклидовым пространством. В евклидовом пространстве R вводится норма с помощью формулы Из свойств 1)—4) скалярного произведения следует, что все аксиомы нормы при этом выполнены. Действительно, выполнение аксиом 1) и 3) нормы (п. 1 § 3) оче- очевидно, а выполнение аксиомы 2) (неравенство треугольника) выте- вытекает из неравенства Коши-Буняковского \(х,у)\^\\х\\-\\у\\, A) которое мы сейчас докажем.
156 Гл. III. Нормированные и топологические пространства Рассмотрим квадратный трехчлен от действительной перемен- переменной Л, неотрицательный при всех значениях Л: <р(Х) = (Аж + у, Хх + у) = Л2 (ж, ж) + 2А(ж, у) + (у,у) = Так как это выражение представляет собой скалярный квадрат не- некоторого вектора, то ц>(Х) ^ 0 при всех Л. Следовательно, дискри- дискриминант этого квадратного трехчлена меньше или равен нулю, т. е. 4(ж,?/J — 4||ж||2||?/||2 ^ 0, что и требовалось доказать. Отметим, что в евклидовом пространстве сумма, произведение на число и скалярное произведение непрерывны, т. е. если хп —У ж, Уп —> У (в смысле сходимости по норме), Лп —у X (как числовая последовательность), то Хп + Уп ~> X + у, ЛпХп ^ АЖ, (Хп,Уп) ~+ (Х,у). Доказательство этих фактов основано на использовании неравен- неравенства Коши-Буняковского A) и предоставляется читателю в качестве упражнения. Наличие в R скалярного произведения позволяет ввести в этом пространстве не только норму (т. е. длину) вектора, но и угол между векторами: именно, угол ср между векторами х и у определяется формулой cos(^= „ VV ... B) INI -Иг/11 При этом из неравенства Коши-Буняковского A) вытекает, что вы- выражение, стоящее в B) справа, по модулю не превосходит 1 и, сле- следовательно, формула B) действительно для любых ненулевых хну определяет некоторый угол ср @ ^ ср ^ тг). Если (ж, у) = 0, то из B) получаем, что ср = тг/2; в этом случае векторы х и у называются ортогональными. Система ненулевых векторов {ха} из R называется ортого- ортогональной, если (ха,ур) = 0 при аф J5. Если векторы {ха} ортогональны, то они линейно независимы. В са- самом деле, пусть O'lXon + о,2Ха2 + ... + апхап = 0; поскольку {ха} — ортогональная система, имеем + ... + апхап) = а;(жа.,жа.) = 0,
§ 4. Евклидовы пространства 157 но (xai, xai) ф 0 и, значит, а^ = 0 для всех г = 1,... , п. Если ортогональная система {ха} полна (т.е. наименьшее содер- содержащее ее замкнутое подпространство есть все R), то она называется ортогональным базисом. Если при этом норма каждого элемента равна 1, то система {ха} называется ортогональным нормирован- нормированным базисом. Вообще, если система {ха} (полная или нет) такова, что Г 0 при a/ft 1 при а = р, то она называется ортогональной нормированной (короче: ортонор- мальной) системой. Ясно, что если {ха} — ортогональная система, то < .. а.. > — ортогональная нормированная система. I \\Х(х || J 2. Примеры. Рассмотрим некоторые примеры евклидовых про- пространств и ортогональных базисов в них. 1. n-мерное арифметическое пространство Мп, элементами ко- которого служат системы действительных чисел х = (xi,... ,жп), с обычными операциями сложения и умножения и скалярным про- произведением п (х,у) = ^XiUi, C) г=1 представляет собой хорошо известный пример евклидова простран- пространства. Ортогональный нормированный базис в нем (один из беско- бесконечного числа возможных) образуют векторы ei = A,0,0,... ,0), е2 = @,1,0,... ,0), еп = @,0,0,... ,1). 2. Пространство 1^ с элементами оо х = (xi,... ,жп,...), где /_^xi ^ °°' и скалярным произведением (X) \xi У) — / J xiVi \?=) г=1 есть евклидово пространство. Действительно, сходимость ряда, стоящего в D) справа, следует из неравенства D) § 1 гл. П. Свойства
158 Гл. III. Нормированные и топологические пространства 1)—4) скалярного произведения проверяются непосредственно. Про- Простейший ортогональный нормированный базис в 1^ образуют векто- РЫ /-, г, г, E) Ортогональность и нормированность этой системы ясны. Вместе с тем система E) полна: пусть х = (xi,... , жп,...) — любой вектор из ^2 и ^ — (^ъ • • • •> хп-> О, О? • • • )• Тогда х^1' есть линейная комби- комбинация векторов ei,... , еп и ||ж(п) — ж|| —У 0 при п —У оо. 3. Пространство С2[а, Ь], состоящее из непрерывных на [а, 6] дей- действительных функций со скалярным произведением (/,<?) = / f(t)g(t)dt, F) а также является евклидовым. Среди различных ортогональных ба- базисов, которые можно указать в нем, важнейшим является тригоно- тригонометрическая система, состоящая из функций 2тг? ^ _ 1 о ^, cosn. smn-j G) >- a' b- a' Ортогональность этой системы проверяется непосредственно. Если рассматриваются непрерывные функции на отрезке дли- длины 2тг, скажем, на [—тг,тг], то соответствующая тригонометрическая система есть: 1/2, cosnt, sinnt (n = 1, 2,...). Система G) полна. Действи- Действительно, согласно теореме Вейер- штрасса всякая непрерывная на отрезке [а, Ъ] функция (р, прини- принимающая в точках а и Ъ одинако- одинаковые значения, может быть пред- представлена как предел равномерно сходящейся последовательности Рис. 17 тригонометрических многочле- многочленов, т. е. линейных комбинаций элементов системы G). Такая последовательность и подавно сходит- сходится к ер по норме пространства С2[а, 6]. Если же / — произволь- произвольная функция из С2 [а, Ь], то ее можно представить как предел (по норме пространства С2[а,Ь]) последовательности функций срп, ка- каждая из которых совпадает с / на отрезке [а, Ъ — 1/п], линейна на [Ь — 1/п, Ь] и в точке Ъ принимает то же значение, что и в точке а ь-i ь
§ 4. Евклидовы пространства 159 (рис. 17). Следовательно, каждый элемент из С^а, Ь] можно прибли- приблизить сколь угодно точно (в метрике этого пространства) линейными комбинациями элементов системы G), а это и означает ее полноту. 3. Существование ортогональных базисов, ортогонализа- ция. На протяжении оставшейся части этого параграфа мы ограни- ограничимся сепарабельными евклидовыми пространствами (т. е. содержа- содержащими счетное всюду плотное множество). Каждое из пространств, указанных в предыдущем пункте, сепарабельно (докажите это!). Пример несепарабельного евклидова пространства можно построить так. Рассмотрим на прямой всевозможные функции ж, для каждой из которых множество точек t\, ?2, • • •, в которых она отлична от ну- нуля, не более чем счетно, а сумма ^2x2(t), взятая по всем таким точ- точкам, конечна. Операции сложения и умножения на числа определим в этом пространстве как обычные сложение и умножение функций, а скалярное произведение определим формулой где сумма берется по множеству тех точек ?, в которых x{i) y(i) ф 0. Доказательство того, что в этом пространстве нет счетного всюду плотного подмножества, мы предоставляем читателю. Отметим, что это пространство — полное. Итак, пусть R — сепарабельное евклидово пространство. Пока- Покажем, что в таком пространстве всякая ортогональная система не более чем счетна. Действительно, без ограничения общности можно считать рас- рассматриваемую систему {(ра} не только ортогональной, по и норми- нормированной (иначе мы заменили бы ее системой {^а/||^а||}. При этом \\фа ~<Ы1 = V^, если афC. Рассмотрим совокупность шаров В((ра, 1/2). Эти шары не пересе- пересекаются. Если счетное множество {грп} всюду плотно в R, то в каж- каждом таком шаре есть по крайней мере один элемент из {фп}- Сле- Следовательно, число таких шаров (а значит, и элементов сра) не более чем счетно. В каждом из приведенных выше примеров евклидовых прост- пространств мы указали по ортогональному базису. Докажем теперь сле- следующую общую теорему, аналогичную теореме о существовании ор- ортогонального базиса в n-мерном евклидовом пространстве. Теорема 1 (об ортогонализации). Пусть /ь--.,/«,... (8)
160 Гл. III. Нормированные и топологические пространства — линейно независимая система элементов в евклидовом простран- пространстве R. Тогда в R существует система элементов <рь... ,<рп,... , (9) удовлетворяющая следующим условиям: 1) система (9) ортогональная и нормированная] 2) каждый элемент срп есть линейная комбинация элементов /ь ...,/„: Wn — CLnlfl + • • • + O"nnfn, причем ann ф 0; 3) каждый элемент fn представляется в виде fn = bni(pi + ... + Ьппсрп, причем bnn ф 0. Каждый элемент системы (9) определяется условиями 1)—3) од- однозначно с точностью до множителя =Ы. Доказательство. Элемент ср± ищется в виде ср± = ацД; при этом аи определяется из условия откуда аи = 577 = Ясно, что ifi определяется этим однозначно (с точностью до знака). Пусть элементы cfk(k < n), удовлетворяющие условиям 1)-3), уже построены. Тогда fn можно представить в виде fn = где = 0 при к <п. Действительно, соответствующие коэффициенты bkk, а значит, и элемент /in, однозначно определяются из условий k) = (fn - Ьп1ф1 - ... - Ьп,п-1фп- = (fn,<Pk) -bnk(?k,?k) = 0. Очевидно, что (hn,hn) > 0 (предположение (hn,hn) = 0 противо- противоречило бы линейной независимости системы (8)). Положим
§ 4. Евклидовы пространства 161 Из индуктивного построения ясно, что /in, а значит, и (рп, вы- выражаются через /ь...,/п, т.е. <рп = ani/i + . • . + Q>nnfn, где ann = * 0. Кроме того, = 0, к < n, fn = ЬП1ф1 + ... + bnn(pn, Ъпп = y/(hn,hn) Ф 0, т. е. Lpn удовлетворяет условиям теоремы. Переход от системы (8) к системе (9), удовлетворяющей условиям 1)-3), называется процессом ортогонализации. Ясно, что подпространства, порожденные системами (8) и (9), совпадают между собой. Следовательно, эти системы полны или не полны одновременно. Следствие. В сепарабельном евклидовом пространстве R су- существует ортогональный нормированный базис. Действительно, пусть ф\^... ,фп,... — счетное всюду плотное множество в R. Выберем из него полную систему линейно независи- независимых элементов {/п}. Для этого достаточно из последовательности {фп} исключить все те элементы фп, каждый из которых может быть представлен как линейная комбинация ф^ с г < к. Применив к полученной таким образом полной системе линейно независимых элементов процесс ортогонализации, мы и построим ортогональный нормированный базис. Упражнения. 1. Привести пример (несепарабельного) евклидова пространства, в котором нет ни одного ортогонального базиса. Доказать, что в полном евклидовом пространстве (не обязательно сепарабельном) существует ортогональный нормированный базис. 2. Доказать, что в полном евклидовом пространстве (не обязательно сепарабельном) всякая последовательность непустых вложенных выпу- выпуклых замкнутых ограниченных множеств имеет непустое пересечение (ср. с упражнениями п. 2 § 3 гл. II и п. 3 § 3 этой главы). 4. Неравенство Бесселя. Замкнутые ортогональные систе- системы. Выбрав в n-мерном евклидовом пространстве ортогональный нормированный базис ei,... ,еп, можно каждый вектор х G W1 за- записать в виде х = ^2скек, A0) к=1 где ск = (х,ек). A1)
162 Гл. III. Нормированные и топологические пространства Выясним, как обобщить разложение A0) на случай евклидова бес- бесконечномерного пространства. Пусть <Ръ... ,^п,-.. A2) — ортогональная нормированная система в евклидовом простран- пространстве R и / — произвольный элемент из R. Сопоставим элементу / Е R последовательность чисел ck = (f,<pk), A: = 1,2,...; A3) числа ск мы будем называть координатами, или коэффициентами Фурье элемента / по системе {^^}, и ряд (пока формальный) A4) к который мы назовем рядом Фурье элемента / по системе {^рп}- Естественно возникает вопрос: сходится ли ряд A4), т. е. стремит- стремится ли последовательность его частичных сумм (в смысле метрики пространства R) к какому-либо пределу, и если он сходится, то со- совпадает ли его сумма с исходным элементом /? Чтобы ответить на эти вопросы, рассмотрим предварительно следующую задачу: при заданном п подобрать коэффициенты ак (к = 1,... , п) так, чтобы расстояние между / и суммой п Sn = ^2^kipk A5) к=1 было минимальным. Вычислим это расстояние. Так как система A2) ортогональна и нормирована, то II/ - ( к=1 к=1 k=l k=l к=1 к=1 к=1 к=1 Ясно, что минимум этого выражения достигается тогда, когда по- последнее слагаемое равно 0, т. е. при oik =ск, к = 1,... ,п. A6) В этом случае 11/-^112 = 11Л12-Ё4. A7) к=1
§ 4. Евклидовы пространства 163 Мы показали, что среди всех сумм вида A5) при данном п наи- наименее уклоняется от / частичная сумма ряда Фурье элемента /. Геометрически этот результат можно пояснить следующим образом. Элемент п k=l ортогонален всем линейным комбинациям вида k=l т. е. ортогонален подпространству, порожденному элементами ipi,... ... , ipn, в том и только том случае, когда выполняется условие A6) (проверьте это!). Таким образом, полученный нами результат пред- представляет собой обобщение известной теоремы элементарной геомет- геометрии: длина перпендикуляра, опущенного из данной точки на прямую или плоскость, меньше, чем длина любой наклонной, проведенной из той же точки. Так как всегда ||/ — 5n||2 ^ 0, то из равенства A7) следует, что k=l Здесь п произвольно, а правая часть не зависит от п; следовательно, оо ряд ^2 с\ сходится и к=1 оо ЕС^11/1|2' A8) к=1 Это неравенство называется неравенством Бесселя. Геометрически оно означает, что сумма квадратов проекций вектора / на взаимно ортогональные направления не превосходит квадрата длины самого вектора /. Введем следующее важное понятие. Определение 1. Ортогональная нормированная система A2) называется замкнутой, если для любого /ЕЙ справедливо равен- равенство оо ZL = ll/ll2, A9) называемое равенством Парсеваля. Из тождества A7) следует, что замкнутость системы A2) равно- равносильна тому, что для каждого f € R частичные суммы ряда Фурье Cnifn СХОДЯТСЯ К /. оо 71=1
164 Гл. III. Нормированные и топологические пространства Понятие замкнутости ортогональной нормированной системы тесно связано с введенным выше понятием полноты системы. Теорема 2. В сепарабельном евклидовом пространстве R вся- всякая полная ортогональная нормированная система является замк- замкнутой, и обратно. Доказательство. Пусть система {(рп} замкнута; тогда, каков бы ни был элемент /ЕЙ, последовательность частичных сумм его ряда Фурье сходится к /. Это означает, что линейные комбинации элементов системы {(рп} всюду плотны в й, т.е. система {(рп} пол- полна. Обратно, пусть система {^п} полна, т.е. любой элемент /ЕЙ можно сколь угодно точно аппроксимировать линейной комбинаци- п п ей ^2 aWk элементов системы {^п}; частичная сумма ^2 cWk ряда k=l k=l Фурье для / дает не менее точную аппроксимацию. Следовательно, оо ряд ^2 Ck^fk сходится к /, и равенство Парсеваля имеет место. k=l В предыдущем пункте мы доказали существование полных орто- ортогональных нормированных систем в сепарабельном евклидовом про- пространстве. Поскольку для ортогональных нормированных систем понятия замкнутости и полноты совпадают, существование замкну- замкнутых ортогональных систем в й не нуждается в новом доказатель- доказательстве, а приведенные в предыдущем пункте примеры полных ортого- ортогональных нормированных систем являются в то же время примерами замкнутых систем. Выше мы все время предполагали рассматриваемые ортогональ- ортогональные системы нормированными. Можно переформулировать понятия коэффициентов Фурье, ряда Фурье и т. д. и для любых ортогональ- ортогональных систем. Пусть {^рп} — произвольная ортогональная система. По ней можно построить нормированную систему, состоящую из эле- элементов фп = ^n/H^nll- Для любого /ЕЙ имеем оо где - п ~ II ~~ II 1|2 * Коэффициенты ап, определяемые формулой B0), мы назовем коэф фициентами Фурье элемента / по ортогональной (ненормирован
§ 4. Евклидовы пространства 165 ной) системе {^п}- Подставив в неравенство A8) вместо сп их вы- выражения сп = ап||(^п|| из B0), получаем оо ?ll?>»ll2«Ull/ll2 B1) 71=1 — неравенство Бесселя для произвольной ортогональной системы. 5. Полные евклидовы пространства. Теорема Рисса— Фишера. Начиная с п. 3 мы рассматривали сепарабельные евкли- евклидовы пространства; с этого момента мы будем, кроме того, предпо- предполагать, что рассматриваемые пространства полны. Итак, пусть R — полное сепарабельное евклидово пространство и Wn} — некоторая ортогональная нормированная система в нем (не обязательно полная). Из неравенства Бесселя следует, что для того, чтобы числа ci,... , сп,... служили коэффициентами Фурье какого-либо элемента /ЕЙ, необходимо, чтобы ряд 71=1 сходился. Оказывается, что в полном пространстве это условие не только необходимо, но и достаточно. Именно, справедлива сле- следующая теорема. Теорема 3 (Рисе-Фишер). Пусть {^рп} — произвольная ортогональная нормированная система в полном евклидовом про- пространстве R, и пусть числа сь... ,сп,... таковы, что ряд ?<* B2) k = l сходится. Тогда существует такой элемент /ЕЙ, что ? к=1 4 = (f,f) = Доказательство. Положим п k=i
166 Гл. III. Нормированные и топологические пространства Тогда k=n+l Так как ряд B2) сходится, то отсюда в силу полноты R вытекает сходимость последовательности {/п} к некоторому элементу / Е R. Далее (f,<Pi) = (fn,<Pi) + (f-fn,<Pi), B3) причем справа первое слагаемое при п ^ i равно q, а второе стре- стремится к нулю при п —> оо, так как Левая часть равенства B3) от п не зависит; поэтому, переходя в нем к пределу при п —У оо, получаем, что (f,<Pi)=Ci- Так как, по определению /, II/ - /п|| ->• 0 при п ->• оо, ТО оо Действительно, при n —у оо. Установим в заключение следующую полезную теорему. Теорема 4. Для того чтобы ортогональная нормированная си- система {срп} в полном сепарабельном евклидовом пространстве была полна, необходимо и достаточно, чтобы в R не существовало нену- ненулевого элемента, ортогонального всем элементам системы {(рп}- Доказательство. Пусть система {(рп} полна и, следователь- следовательно, замкнута. Если / ортогонален всем элементам системы {^п}5 то все его коэффициенты Фурье равны нулю. Тогда из равенства Парсеваля получаем т.е. / = 0.
§ 4. Евклидовы пространства 167 Обратно, пусть система {^п} не полна. Тогда в R существует та- такой элемент g ф О, что На основании теоремы Рисса—Фишера существует такой элемент / G д> чт0 Элемент / — g ортогонален всем cpi. Из неравенства следует, что / — g ф 0. Упражнения. 1. Пусть Н — полное евклидово пространство (не обя- обязательно сепарабельное); тогда в нем существует полная ортогональная нормированная система {ра} (см. упражнение 1 в п. 3). Доказать, что для всякого вектора / Е Н справедливы разложения где в суммах, стоящих справа, имеется не более счетного числа отличных от 0 слагаемых. 2. Система {(ра} векторов евклидова пространства R называется то- тотальной, если в Дне существует отличных от 0 векторов, ортогональных ко всем (ра. Теорема 4 означает, что в полном евклидовом пространстве тотальность системы векторов эквивалентна ее полноте. Показать, что в неполных пространствах могут существовать тотальные, но не полные системы. 6. Гильбертово пространство. Теорема об изоморфизме. Продолжим рассмотрение полных евклидовых пространств. При этом нас, как и до сих пор, будут интересовать бесконечномер- бесконечномерные пространства, а не конечномерные, исчерпывающее описание которых дается в курсах линейной алгебры. По-прежнему мы, как правило, будем предполагать наличие в рассматриваемых простран- пространствах счетного всюду плотного множества. Введем следующее опре- определение. Определение 2. Полное евклидово пространство бесконечно- бесконечного числа измерений называется гильбертовым пространством1). 1)По имени знаменитого немецкого математика Д. Гильберта A862-1943), который ввел это понятие.
168 Гл. III. Нормированные и топологические пространства Таким образом, гильбертовым пространством называется сово- совокупность Н элементов /, д,... произвольной природы, удовлетво- удовлетворяющая следующим условиям (аксиомам). I. H есть евклидово пространство (т. е. линейное пространство с заданным в нем скалярным произведением). П. Пространство Н полно в смысле метрики p(f,g) = ||/ — д\\. III. Пространство Н бесконечномерно, т.е. в нем для лю- любого п можно найти п линейно независимых элементов. Чаще всего рассматриваются сепарабельные гильбертовы про- пространства, т. е. пространства, удовлетворяющие еще одной аксиоме. IV. Н сепарабельно, т.е. в нем существует счетное всюду плотное множество. Примером сепарабельного гильбертова пространства может слу- служить действительное пространство Ь- В дальнейшем мы будем рассматривать только сепарабельный случай. Аналогично определению 2 из § 1 два евклидовых пространства, Rn R*, называются изоморфными, если между их элементами мож- можно установить взаимно однозначное соответствие так, что если х,у е R; x*,y* eR то х + у +± ж* + у*, ах *-> ах* Иначе говоря, изоморфизм евклидовых пространств — это взаим- взаимно однозначное соответствие, сохраняющее как линейные операции, определенные в этих пространствах, так и скалярное произведение. Как известно, любые два n-мерных евклидовых пространства изоморфны между собой и, следовательно, каждое такое простран- пространство изоморфно арифметическому пространству Жп (пример 1, п. 2). Евклидовы пространства бесконечного числа измерений не обяза- обязательно изоморфны друг другу. Например, пространства Ь и C^fa, b] между собой не изоморфны. Это видно, например, из того, что пер- первое из них полно, а второе — нет.
§ 4. Евклидовы пространства 169 Однако имеет место следующий факт. Теорема 5. Любые два сепарабельных гильбертовых простран- пространства изоморфны между собой. Доказательство. Покажем, что каждое гильбертово прост- пространство Н изоморфно пространству 1^. Тем самым будет доказано утверждение теоремы. Выберем в Н произвольную полную ортого- ортогональную нормированную систему {(рп} и поставим в соответствие элементу / Е Н совокупность ci,..., сп,... его коэффициентов Фу- оо рье по этой системе. Так как ^2 c\ < оо, то последовательность (ci,... , cn,...) есть некоторый элемент из 1^- Обратно, в силу тео- теоремы Рисса-Фишера всякому элементу (с\,... , сп ...) из Ь отвечает некоторый элемент / Е Н, имеющий числа ci,..., сп,... своими ко- коэффициентами Фурье. Установленное соответствие между элемен- элементами из Н в ^2 взаимно однозначно. Далее, если то f + g +± (a +db... ,cn + dn,...), a/ ** (acb... ,acn,...), т. е. сумма переходит в сумму, а произведение на число — в про- произведение соответствующего элемента на это же число. Наконец, из равенства Парсеваля следует, что cndn. B4) 71=1 Действительно, из того, что оо оо (/,/) = Ес- (9,9) = J2 dn> п=1 п=1 вытекает B4). Таким образом, установленное нами соответствие между элементами пространств Н и 1^ действительно является изо- изоморфизмом.
170 Гл. III. Нормированные и топологические пространства Доказанная теорема означает, что, с точностью до изоморфизма, существует лишь одно (сепарабельное) гильбертово простран- пространство (т. е. система аксиом I-IV полна) и что пространство fa можно рассматривать как его «координатную реализацию», подобно тому как n-мерное арифметическое пространство со скалярным произ- п ведением ^2 хгУг представляет собой координатную реализацию ев- евклидова пространства п измерений, заданного аксиоматически. Другую реализацию гильбертова пространства можно получить, взяв функциональное пространство C^fa, Ъ] и рассмотрев его попол- пополнение. Действительно, легко проверить, что пополнение R* всякого евклидова пространства R (в том смысле, как мы определили попол- пополнение метрического пространства в § 3 гл. II) становится линейным евклидовым пространством, если в нем определить линейные опе- операции и скалярное произведение, продолжая их по непрерывности с пространства Л, т. е. полагая х + у= lim (жп + 2/n), olx — lim ахп, п—юо п—юо (ж,у) = lim (xn,yn), п—>-оо где хп —у х и уп —у у, хп, уп G R. (Существование всех этих пределов и их независимость от выбора последовательностей {хп} и {уп} лег- легко устанавливается.) Тогда пополнение пространства С2[а,Ь] будет полным евклидовым пространством, очевидно, бесконечномерным и сепарабельным, т. е. гильбертовым пространством. В главе VII мы вернемся к этому вопросу и покажем, что те элементы, которые нужно присоединить к С2[а, Ь], чтобы получить полное простран- пространство, тоже можно представить как функции, но только уже не не- непрерывные (а именно, как функции, квадрат которых суммируем в смысле Лебега). 7. Подпространства, ортогональные дополнения, прямая сумма. В соответствии с общими определениями § 3 линейным мно- многообразием в гильбертовом пространстве Н мы назовем такую сово- совокупность L элементов из Н, что если f,g G L, то af+/3g G L для лю- любых чисел а и C. Замкнутое линейное многообразие называется подпространством. Приведем некоторые примеры подпространств гильбертова пространства. 1. Пусть h — произвольный элемент из Н. Совокупность всех элементов / G Н, ортогональных к h, образует в Н подпространство. 2. Пусть Н реализовано как fa, т.е. его элементы суть такие по- последовательности (xi,... , жп,...) чисел, что ^2 х\ < °°- Элементы, к подчиненные условию х\ — х^-, образуют подпространство.
§ 4. Евклидовы пространства 171 3. Пусть снова Н реализовано как пространство 1^- Элементы х = (#1,... , жп,...), у которых хп = 0 при п = 2,4,6,... (и жп произвольны при п = 1,3,5,...), образуют подпространство. Читателю рекомендуется проверить, что указанные в примерах 1-3 совокупности векторов действительно являются подпростран- подпространствами. Всякое подпространство гильбертова пространства либо являет- является конечномерным евклидовым пространством, либо само представ- представляет собой гильбертово пространство. Действительно, справедли- справедливость аксиом I—III для каждого такого подпространства очевидна, а справедливость аксиомы IV вытекает из следующей леммы. Лемма. Любое подмножество R' сепарабельного метрического пространства R само сепарабельно. Доказательство. Пусть ?i,...,&>,... — счетное всюду плотное множество в Л и an = inf p(?n,ri). eR1 Для любых натуральных пит найдется такая точка г\пш Е В!, что p(?n,Vnm) <CLn + 1/m. Пусть ? > 0 и 1/m < s/З; для любого rj G Rf найдется такое п, что p(?rnV) < ?/3 и, следовательно, Жп, Vnrn) < an + 1/m < г/3 + г/3 = 2г/3; но тогда р(г),г)пт) < г, т.е. не более чем счетное множество {f]nm} (n, m = 1, 2,...) всюду плотно в R'. Подпространства гильбертова пространства обладают некоторы- некоторыми специальными свойствами (не имеющими места для подпро- подпространств произвольного нормированного пространства). Эти свой- свойства связаны с наличием в гильбертовом пространстве скалярного произведения и основанного на нем понятия ортогональности. Применив процесс ортогонализации к какой-либо счетной всю- всюду плотной последовательности элементов произвольного подпро- подпространства гильбертова пространства, получаем следующую теорему. Теорема 6. В каждом подпространстве М пространства Н со- содержится ортогональная нормированная система {tpn}, линейное за- замыкание которой совпадает с М. Пусть М — подпространство гильбертова пространства Н. Обо- Обозначим через М± = HQM
172 Гл. III. Нормированные и топологические пространства множество элементов д Е Н, ортогональных ко всем элементам / Е М, и докажем, что М1- тоже есть подпространство простран- пространства Н. Линейность М1- очевидна, так как из (#ь/) = (#2?/) = О вытекает {а\д\ + «2#2, /) = 0. Для доказательства замкнутости до- допустим, что элементы дп принадлежат М1- и сходятся к д. Тогда для любого / Е М (д5 /) = Нт (дп, /) = 0, п—юо и потому д тоже входит в М-1. Подпространство М1- называется ортогональным дополнением подпространства М. Из теоремы б легко получается следующая теорема. Теорема 7. ЕслиМ — (замкнутое!) линейное подпространство пространства Н, то любой элемент / Е Н единственным образом представим в виде / = h + Ы, где h Е М и Ы Е М^. Доказательство. Докажем сначала существование такого разложения. Для этого найдем в М полную ортогональную норми- нормированную систему {(fn} и положим ^пЧ^пч сп — \JiVn)- 71=1 оо Так как (по неравенству Бесселя) ряд J^ c2n сходится, то элемент h 71=1 существует и принадлежит М. Положим Ы = / - h. Очевидно, что для всех n (hf,cpn) = 0 и, поскольку произвольный элемент (из М представим в виде оо С = / CLn^Pni 71=1 имеем оо 71=1 т.е. Ы Е М-К Допустим теперь, что, кроме построенного нами разложения / = h + hl', существует другое разложение: f ^ Jii -\- h^j h\ E Af, /i^ E Af . Тогда при всех п откуда следует, что h\ = /i, h1 = h . Из теоремы 7 вытекают некоторые полезные следствия.
§ 4. Евклидовы пространства 173 Следствие 1. Ортогональное дополнение к ортогональному дополнению линейного подпространства М совпадает с самим М. Таким образом, можно говорить о взаимно дополнительных под- подпространствах пространства Н. Если М и М1- — два таких допол- дополняющих друг друга подпространства и {^n}5 Wn} — полные (со- (соответственно в М и М-1) ортогональные системы, то соединение систем {(fin} и Wn} Дает полную ортогональную систему во всем пространстве Н. Поэтому имеет место следствие: Следствие 2. Каждая ортогональная нормированная система может быть расширена до системы, полной в Н. Если система {^п} конечна, то число входящих в нее элементов равно размерности подпространства М, порожденного {^п}5 и ко- коразмерности подпространства М^. Таким образом, получаем еще одно следствие: Следствие 3. Ортогональное дополнение к пространству ко- конечной размерности п имеет коразмерность п, и наоборот. Если каждый вектор / Е Н представим в виде / = /i + /i/, /iG M, Ы G М1- (М1- — ортогональное дополнение М), то говорят, что Н есть прямая сумма взаимно ортогональных подпространств М и М1- и пишут Н = МфМ±. Ясно, что понятие прямой суммы может быть непосредственно об- обобщено на любое конечное или даже счетное число подпространств; именно, говорят, что Н есть прямая сумма своих подпространств Мь..., Мп,... н = Mi е... е мп е..., если 1) подпространства Mi попарно ортогональны, т. е. любой вектор из Mi ортогонален любому вектору из М/, при г / fc; 2) каждый элемент / G Н может быть представлен в виде / = fti + ... + ftn + ... , hne мп, причем если число подпространств Мп бесконечно, то J^ll^nll2 — п сходящийся ряд. Легко проверить, что если такое представление элемента / существует, то оно единственно и что
174 Гл. III. Нормированные и топологические пространства Наряду с прямой суммой подпространств можно говорить о пря- прямой сумме конечного или счетного числа произвольных гильберто- гильбертовых пространств. Именно, если Н\ и Н^ — два гильбертовых про- пространства, то их прямая сумма Н определяется следующим обра- образом: элементы пространства Н — это всевозможные пары (fti,/^)? где hi Е Hi, /12 G H2, а скалярное произведение двух таких пар равно ((hi,h2),(K,K)) = (hi,K) + (h2,ti2). В пространстве Н содержатся, очевидно, взаимно ортогональные подпространства, состоящие из пар вида (hi,0) и @,/12) соответ- соответственно; первое из них можно естественным образом отождествить с пространством Hi, а второе — с пространством Н<±. Аналогично определяется сумма любого конечного числа про- пространств. Сумма Н — ^2 ®Нп счетного числа пространств Hi,..., Нп,... определяется так: элементы пространства Н — это всевоз- всевозможные последовательности вида h = (hi,... , hn,...), hn G Hn, такие, что J^ll^n||2 < 00. Скалярное произведение (h,g) элементов n h и д из Н равно 8. Характеристическое свойство евклидовых пространств. Рассмотрим следующий вопрос. Пусть R — нормированное про- пространство. Каким дополнительным условиям должна удовлетво- удовлетворять норма, определенная в R, чтобы пространство R было евкли- евклидовым, т. е. чтобы норма в нем определялась некоторым скаляр- скалярным произведением? Иначе говоря, как охарактеризовать евклидо- евклидовы пространства в классе всех нормированных пространств? Такую характеристику дает следующая теорема. Теорема 8. Для того чтобы нормированное пространство R было евклидовым, необходимо и достаточно, чтобы для любых двух элементов, /ид, выполнялось равенство H/ + # + ll/-2l|2 = 2(||/||2 + ||5l|2)- B5) Поскольку / + д и / — д — это диагонали параллелограмма, по- построенного на сторонах fug, равенство B5) выражает известное свойство параллелограмма в евклидовом пространстве: сумма квад- квадратов диагоналей параллелограмма равна сумме квадратов всех его сторон. Таким образом, необходимость условия очевидна. Докажем его достаточность. Положим (/,2) = !(Н/ + я||2-||/-#), B6)
§ 4. Евклидовы пространства 175 и покажем, что если равенство B5) выполнено, то функция B6) удовлетворяет всем аксиомам скалярного произведения. Поскольку при / = g имеем (/,/) = i(||2/||2-||/-/||2) = ||/||2, B7) это и будет то скалярное произведение, которое порождает в про- пространстве R заданную там норму. Прежде всего, из B6) сразу видно, что (/,#) = (9, f), т. е. выполнено свойство 1) скалярного произведения. Кроме того, в силу B7) имеет место и свойство 4). Для установления свойства 2) рассмотрим функцию трех векторов т.е. -||/ + й||2 + 11/-/*Ц2-||я + />||2 + ||5-/>||2- B8) Покажем, что она тождественно равна нулю. В силу B5) имеем \\f + g± /i||2 = 2||/ ± h\\2 + 2\\д\\2 - ||/ ± Л - д\\2. Подставив соответствующие выражения в B8), получим + II/ + Ч2 - ||/ - h\\2 - \\д + h\\2 + \\д - ЛЦ2. B9) Взяв полусумму B8) и B9), имеем - i(\\g ~ h + /||2 + \\д - h - /||2) - \\д + h\\2 + \\д - h\\2. В силу B5) первое слагаемое равно а второе — равно -\\д -h\\2 -"< Таким образом, Установим, наконец, свойство 3) — однородность скалярного про- произведения. Рассмотрим для этого при любых фиксированных / и д функцию <р(с) = (cf,g) -c(f,g).
176 Гл. III. Нормированные и топологические пространства Из B6) сразу следует, что и ip(—l) = 0, поскольку (—/,#) = — (/,#)• Поэтому для любого цело- целого п (nf,g) = (sgnn(/+ ... + /),#) = = sgnn[(/,#) + '- + (f,g)] = |n|sgnn(/,#) =n(f,g), т. e. (p(n) = 0. При целых р, q и q ф 0 т. e. (^(c) = 0 при всех рациональных с; поскольку функция у? непре- непрерывна, ф) = о. Тем самым мы показали, что функция (f,g) обладает всеми свой- свойствами скалярного произведения. Примеры. 1. Рассмотрим n-мерное пространство Ж?, в котором норма определена формулой ( При р ^ 1 все аксиомы нормы выполнены, однако евклидовым про- пространством Ж? будет только при р = 2. Действительно, рассмотрим в Ж? два вектора: / = A,1,0,0,... ,0); д = A,-1,0,0,..., 0); имеем / + # = B,0,0,... ,0), /-# = @,2,0,...,0), откуда так что тождество параллелограмма B5) при р ф 2 не выполняется. 2. Рассмотрим пространство непрерывных функций на отрезке [0,тг/2]. Положим /(?) = cost, g(t) = sint.
4. Евклидовы пространства 177 Имеем = max | cost + sint\ = л/2, II/ —^||= max | cost — sint| = 1. Отсюда видно, что Таким образом, норму пространства С[0, тг/2] нельзя задать с помо- помощью какого бы то ни было скалярного произведения. Легко видеть, что и пространство непрерывных функций С [а, Ь] на любом отрезке [а, Ь] не есть евклидово пространство. 9. Комплексные евклидовы пространства. Наряду с дей- действительным может быть введено и комплексное евклидово про- пространство (т. е. комплексное линейное пространство со скалярным произведением в нем). Однако аксиомы 1)-4), сформулированные в начале этого параграфа, не могут быть в комплексном простран- пространстве выполнены одновременно. Действительно, из 1) и 3) следует (Аж, Аж) = А2 (ж, ж), откуда при А = г имеем (гж,гж) = —(ж, ж), т. е. скалярные квадраты векторов ж и гх не могут быть одновремен- одновременно положительны. Иными словами, аксиомы 1) и 3) несовместимы с аксиомой 4). Поэтому аксиомы, с помощью которых определяется скалярное произведение, в комплексном случае должны быть не- несколько изменены по сравнению с действительным. В комплексном пространстве скалярное произведение мы определим как числовую (комплекснозначную) функцию двух векторов, удовлетворяющую следующим условиям: 1) (ж,у) = (у,ж), 2) (\х,у) = А(ж,?/), 3) (xi+x2,y) = (x1,y) + (x2,y), 4) (ж, ж) ^ 0, причем (ж, ж) > 0, если ж ф 0. (Таким образом, мы внесли поправку в первую аксиому, сохранив три остальные без изменений.)
178 Гл. III. Нормированные и топологические пространства Из условий 1) и 2) следует, что (х,Ху) = Х(х,у). Действительно, (х,Ху) = (Ху,х) = Х(у,х) = Х(х,у). Хорошо известный пример комплексного евклидова пространства п измерений — это линейное пространство Сп (пример 2 § 1), в ко- котором скалярное произведение элементов х = Oi,... , хп) и у = (у!,... ,уп) определяется формулой Как известно, всякое комплексное евклидово пространство размер- размерности п изоморфно этому пространству. Примерами бесконечномерных комплексных евклидовых прос- пространств могут служить: 1) комплексное пространство l^-, в котором элементы — это по- последовательности комплексных чисел X = \Х\ , . . . , Жп, . . . J, удовлетворяющие условию (X) ^2 \хп\2 < оо, 71=1 а скалярное произведение определяется формулой (ж, у) = п=1 2) пространство C2[ci, Ь] комплекснозначных непрерывных функ- функций на отрезке [а, Ь] со скалярным произведением (f,g) = ff(t)g(t)dt. а В комплексном евклидовом пространстве длина (норма) вектора определяется, как и в действительном случае, формулой Понятие угла между векторами в комплексном случае обычно (X 1]) не вводят (поскольку величина ,. ,.' ./ ,., вообще говоря, комплекс- \\х\\ ' \\y\\ ная и может не быть косинусом какого-либо действительного угла); однако понятие ортогональности сохраняется: элементы х и у назы- называются взаимно ортогональными, если (ж, у) = 0.
§ 5. Топологические линейные пространства 179 Если {^п} — какая-либо ортогональная система в комплексном евклидовом пространстве R, и / — произвольный элемент из R, то, как и в действительном случае, числа ап ТГЦт2(Л<Рп) \\фп\\ называются коэффициентами Фурье, а ряд п — рядом Фурье элемента / по ортогональной системе {^п}- Имеет место неравенство Бесселя: п В частности, если система {(рп} ортогональна и нормирована, то коэффициенты Фурье по такой системе определяются формулами Сп = (/,<?п), а неравенство Бесселя имеет вид п Полное комплексное евклидово пространство бесконечной размер- размерности называется комплексным гильбертовым пространством. На комплексный случай переносится теорема об изоморфизме гиль- гильбертовых пространств: Теорема 9. Все сепарабельные комплексные гильбертовы про- пространства изоморфны между собой. Простейшей реализацией комплексного гильбертова простран- пространства является комплексное пространство Ь- С другой, функцио- функциональной, реализацией комплексного гильбертова пространства мы познакомимся в гл. VII. Предоставляем читателю проверить, что все теоремы, доказан- доказанные выше для действительных евклидовых, в частности гильбер- гильбертовых, пространств, справедливы (с незначительными изменения- изменениями, учитывающими комплексность скалярного произведения) и для комплексных пространств. § 5. Топологические линейные пространства 1. Определение и примеры. Задание нормы — лишь один из возможных способов введения топологии в линейном простран- пространстве. Развитие таких областей функционального анализа, как те о-
180 Гл. III. Нормированные и топологические пространства р и я обобщенных функций (о них будет сказано в следующей главе), показало, что во многих случаях полезно рассматривать ли- линейные пространства с топологией, задаваемой не с помощью нор- нормы, а каким-либо иным способом. Определение 1. Множество Е называется топологическим линейным пространством, если I. Е представляет собой линейное пространство (с умножением элементов на действительные или комплексные числа). П. Е является топологическим пространством. III. Операция сложения и умножения на числа в Е непрерывны относительно заданной в Е топологии. Подробнее последнее условие означает следующее: 1) если zo = хо +уо, то для каждой окрестности U точки z$ можно указать такие окрестности V и W точек xq и у$ соответственно, что х + у Е U при х Е У, у Е W] 2) если a$x$ = уо, то для любой окрестности U точки уо существу- существуют такая окрестность V точки хо и такое число е > 0, что ах Е U при \а — ао\ < г и х G V. Из связи, существующей в линейном топологическом простран- пространстве между алгебраическими операциями и топологией, вытекает, что топология в таком пространстве полностью определяется зада- заданием системы окрестностей нуля. Действительно, пусть х — точ- точка линейного топологического пространства Е, и U — некоторая окрестность нуля в Е. Тогда U + х — «сдвиг» этой окрестности на ж — есть окрестность точки ж; очевидно, что любая окрестность любой точки х G Е может быть получена таким способом. Из непрерывности операций сложения и умножения на числа в топологическом линейном пространстве Е непосредственно выте- вытекают следующие утверждения. 1. Если U, V — открытые множества в Е, то и множе- множество U-\-V (т. е. совокупность всех элементов вида х-\-у, х G U,y G V) открыто. 2. Если U открыто, то и множество XU (т. е. совокупность всех элементов вида Лж, х G U) при любом Л ф 0 открыто. 3. Если F замкнутое множество в Е, то и XF замкнуто при любом Л. Примеры. 1. К топологическим линейным пространствам от- относятся прежде всего все нормированные пространства. Действи- Действительно, из свойств нормы сразу следует, что операции сложения векторов и умножения их на числа в нормированном пространстве непрерывны в той топологии, которая определяется нормой.
§ 5. Топологические линейные пространства 181 2. Зададим определяющую систему окрестностей нуля в про- пространстве М°° всевозможных числовых последовательностей х = = (xi,... , жп,...) так. Каждая окрестность t/(fci,... ,kr;e) опреде- определяется целыми числами к\,... , кг и числом г > 0 и состоит из всех тех ж Е М°°, которые удовлетворяют условиям: \xki\ <е, г = 1,... ,г. Легко проверить, что задание этой системы окрестностей превра- превращает М°° в линейное топологическое пространство. (Наряду с М°° можно рассматривать пространство С°° всех комплексных по- последовательностей .) 3. Пусть К [а, Ь] — пространство бесконечно дифференцируемыхг) функций на отрезке [а, Ь]. Топологию в К [а, Ь] определим с помощью следующей системы окрестностей нуля. Каждая такая окрестность Uте определяется номером т и числом е > 0 и состоит из всех функций ер, удовлетворяющих неравенствам \<рЮ(х)\<е, к = 0,1,...,т, где ipW — производная к-то порядка от функции (р. Тот факт, что в топологическом линейном пространстве тополо- топология связана с линейными операциями, определенными в нем, накла- накладывает на его топологию довольно жесткие ограничения. Именно, в топологическом линейном пространстве Е точка х и не содержа- содержащее ее замкнутое множество имеют непересекающиеся окрестно- окрестности. При доказательстве этого утверждения достаточно рассмотреть точку х = 0 и любое не содержащее ее замкнутое множество F. По- Положим U = Е \ F. В силу непрерывности операции вычитания в Е найдется такая окрестность нуля W, что W — W С U. В качестве W можно взять пересечение окрестностей нуля W\ и W^ таких, что х — у G U, если х G W\ и у G W^- Проверим, что замыкание окрест- окрестности W содержится в U. Пусть у G [W]. Тогда каждая окрестность точки у, в частности, у + W, содержит какую-либо точку z из W. Следовательно, z — у G W, т. е. у G W — W С С/, что и утверждалось. При этом W и .Е\[И/] — искомые окрестности точки 0 и множества F соответственно. Топологическое пространство называется Т\-пространством, если оно удовлетворяет аксиоме отделимости 7\, т.е. если любое его од- одноточечное подмножество замкнуто; очевидно, что линейное топо- топологическое пространство есть Т\ -пространство тогда и только тогда, 1)То есть, имеющих производные всех порядков.
182 Гл. III. Нормированные и топологические пространства когда пересечение всех окрестностей нуля не содержит ненулевых элементов. Топологические пространства, удовлетворяющие аксио- аксиомам отделимости Т\ и Тз, мы назвали в гл. II регулярными; из дока- доказанного в предыдущем абзаце следует, что топологическое линейное Т\ -пространство регулярно. В нормированных пространствах важную роль играет понятие ограниченного множества. Хотя там это понятие вводится при по- помощи нормы, оно может быть естественно сформулировано и для любых линейных топологических пространств. Множество М, лежащее в топологическом линейном простран- пространстве Е, назовем ограниченным, если для каждой окрестности ну- нуля U существует такое п > 0, что XU D М при всех А ^ п. Ясно, что для нормированных пространств это понятие ограни- ограниченности совпадает с ограниченностью по норме (т. е. с возможнос- возможностью поместить данное множество внутрь некоторого шара ||ж|| ^ R). Пространство Е называется локально ограниченным, если в нем су- существует хотя бы одно непустое открытое ограниченное множество. Всякое нормированное пространство локально ограничено. Приме- Примером пространства, не являющегося локально ограниченным, может служить пространство М°°, указанное в примере 2 (докажите это!). Упражнения. 1. Пусть Е — топологическое линейное пространство; докажите справедливость следующих утверждений: (а) множество М С Е ограничено тогда и только тогда, когда для любой последовательности {хп} С М и любой последовательности поло- положительных чисел {sn}i стремящейся к нулю, последовательность епхп стремится к нулю; (б) если {хп}^=1 С Е и хп —»¦ ж, то {хп} — ограниченное множество; (в) если Е локально ограничено, то в нем выполняется первая аксиома счетности. Выполнена ли первая аксиома счетности в пространстве Ж°° ? 2. Мы скажем, что множество М в топологическом линейном простран- пространстве Е поглощается окрестностью нуля U, если существует такое Л > О, что XU D М. Доказать, что в локально ограниченном пространстве суще- существует фундаментальная система окрестностей нуля, взаимно поглощаю- поглощающих друг друга. Что можно принять за такую систему в нормированном пространстве? 2. Локальная выпуклость. Произвольные топологические ли- линейные пространства могут обладать свойствами, слишком уж дале- далекими от привычных свойств евклидовых или нормированных про- пространств. Важный класс пространств, более общих, чем нормиро- нормированные, но сохраняющих многие свойства последних, образуют так называемые локально выпуклые пространства.
§ 5. Топологические линейные пространства 183 Определение 2. Топологическое линейное пространство на- называется локально выпуклым, если в нем всякое непустое открытое множество содержит непустое выпуклое открытое подмножество. Заметим, что если пространство Е локально выпукло, то для лю- любой точки х Е Е и любой ее окрестности U найдется такая выпуклая ее окрестность V, что х Е V С U. Действительно, достаточно про- проверить справедливость этого утверждения для точки х = 0. Пусть U — какая-нибудь окрестность нуля. Найдется такая окрестность нуля V, что V — V С U. Так как Е локально выпукло, то найдется непустое выпуклое открытое множество V С V, пусть у ? V, тогда V — у — выпуклая окрестность нуля, содержащаяся в U. Всякое нормированное пространство локально выпукло. Дейст- Действительно, в нем любое непустое открытое множество содержит неко- некоторый шар. Таким образом, всякое нормированное пространство ло- локально ограничено и локально выпукло. Можно показать, что, по су- существу, нормированными пространствами и исчерпывается класс пространств, обладающих обоими этими свойствами. Именно, назо- назовем линейное топологическое пространство Е нормируемым, если та топология, которая имеется в Е, может быть задана с помощью не- некоторой нормы. Имеет место следующая теорема: всякое отделимое локально выпуклое и локально ограниченное линейное топологиче- топологическое пространство нормируемо. Упражнения. 1. Докажите, что открытое множество U в тополо- топологическом линейном пространстве выпукло тогда и только тогда, когда U + U = 2U. 2. Пусть Е — линейное пространство; множество U С Е называется симметричным, если из х Е U следует —х Е U. Пусть Б — семейство всех выпуклых симметричных подмножеств пространства Е, совпадающих со своим ядром (см. § 2). Доказать справедливость следующих утверждений. (а) Семейство Б является определяющим семейством окрестностей ну- нуля для некоторой локально выпуклой отделимой топологии в простран- пространстве Е (эта топология называется ядерно-выпуклой). (б) Ядерно-выпуклая топология является сильнейшей из локально вы- выпуклых топологий, в которых линейные операции в Е непрерывны. (в) Всякий линейный функционал на Е непрерывен относительно ядерно-выпуклой топологии. 3. Счетно-нормированные пространства. Очень важным для анализа классом линейных топологических пространств ока- оказались так называемые счетно-нормированные пространства. Для того чтобы сформулировать соответствующее определение, нам по- понадобится одно вспомогательное понятие.
184 Гл. III. Нормированные и топологические пространства Пусть в линейном пространстве Е заданы две нормы ||-||i и ||-||2- Они называются согласованными, если всякая последовательность {хп} из Е, фундаментальная по каждой из этих норм и сходящаяся к некоторому пределу х Е Е по одной из них, сходится к тому же пределу ж и по второй норме. Говорят, что норма || • ||i не слабее, чем || • Цг, если существует такая постоянная с > 0, что ||#||i ^ с||ж||2 для всех х Е Е. Если первая норма не слабее второй, а вторая — не слабее первой, то эти две нормы называются эквивалентными. Две нормы называются сравнимыми, если одна из них слабее другой. Определение 3. Счетно-нормированным пространством на- называется линейное пространство Е, в котором задана счетная систе- система попарно согласованных норм ||-||п. Всякое счетно-нормированное пространство становится линейным топологическим, если за опре- определяющую систему окрестностей нуля принять совокупность мно- множеств Ur?, каждое из которых определяется номером г и положи- положительным числом ? и состоит из всех тех элементов х Е Е, которые удовлетворяют условиям ||x||i < г,... , ||ж||г < е. Мы предоставляем читателю проверить, что такая система ок- окрестностей нуля действительно определяет в Е топологию, в кото- которой операции сложения элементов и умножения их на числа непре- непрерывны. Заметим, что всякое счетно-нормированное пространство удов- удовлетворяет первой аксиоме счетности, поскольку систему окрест- окрестностей нуля Ur? можно заменить (не изменяя топологии) счетной подсистемой, в которой г принимает лишь значения 1,1/2,1/3,... ..., 1/п,... Более того, топология в счетно-нормированном про- пространстве может быть задана при помощи некоторой метрики, на- например, такой: га=1 Предлагаем читателю проверить, что функция р(х, у) удовлетворя- удовлетворяет всем аксиомам расстояния и инвариантна относительно сдвигов (т.е. р{х + z,y + z) = р{х,у), x,y,z G Е) и что порождаемая ею топология совпадает с исходной. Таким образом, мы получаем воз- возможность говорить о полноте счетно-нормированного пространства, понимая под этим полноту относительно введенной выше метрики. Заметим еще, что последовательность {ж&} фундаментальна относи- относительно метрики A) тогда и только тогда, когда она фундаментальна
§ 5. Топологические линейные пространства 185 относительно каждой из норм || • ||п, и сходится (в этой метри- метрике) к элементу х Е Е тогда и только тогда, когда она сходится к ж по каждой из норм || • ||п. Иными словами, полнота счетно- нормированного пространства означает, что в нем всякая последо- последовательность, фундаментальная по каждой из норм || • ||п, сходится. Примеры. 1. Важным примером счетно-нормированного про- пространства служит рассмотренное выше пространство К [а, Ь] беско- бесконечно дифференцируемых функций на отрезке, если считать, что норма || • ||ш в этом пространстве определяется формулой ||/||m= sup |/(*)(t)|. Очевидно, что все эти нормы согласованы между собой и что они определяют в К [а, Ь] ту самую топологию, которая была описана выше. 2. Пусть 5оо — пространство всех бесконечно дифференцируемых функций на прямой, стремящихся на бесконечности к нулю вместе со всеми своими производными быстрее, чем l/\t\ в любой степени (т.е. удовлетворяющих условию tkf(q\t) —у 0 при \t\ —У оо при лю- любых фиксированных к и q). В этом пространстве определим счетную систему норм, положив 11/11™= sup |t*/(e)(*)l. m = 0,1,2,... Нетрудно проверить, что эти нормы согласованы между собой. Та- Таким образом, 5оо — счетно-нормированное пространство. 3. Важный частный случай счетно-нормированных пространств — так называемые счетно-гильбертовы пространства. Пусть Н — линейное пространство, в котором задана счетная система скаляр- скалярных произведений (ср,ф)п, причем предположим, что нормы ||^||n = = л/(^> Ф)п, отвечающие этим скалярным произведениям, согласо- согласованы между собой. Если такое пространство полно, то оно называ- называется счетно-гильбертовым пространством. 4. Конкретным примером счетно-гильбертова пространства мо- может служить следующее пространство. Пусть Ф — совокупность всех таких числовых последовательностей {жп}, для которых при каждом целом к ^ 0 ряд Е 71=1 акх1
186 Гл. III. Нормированные и топологические пространства сходится. Зададим в этом пространстве счетную систему норм, по- положив № = \ 71=1 Нетрудно проверить, что эти нормы согласованы между собой и что Ф полно в указанном выше смысле. Ясно, что каждую из норм || • \\к можно задать с помощью скалярного произведения (х,у)к = п=1 т. е. Ф есть счетно-гильбертово пространство. Оно называется про- пространством быстро убывающих последовательностей. Если Е — счетно-нормированное пространство, то заданные в нем нормы || • \\к можно считать удовлетворяющими условию \\х\\к ^ \\x\\i ПРИ к < I, B) так как иначе мы могли бы нормы \\x\\k заменить нормами \\х\\'к =sup(||x||b... ,\\х\\к), определяющими в Е ту же самую топологию, что и исходная си- система норм. Пополнив пространство Е по каждой из норм || • Ц/,, мы получим систему полных нормированных пространств Ек. При этом из соотношения B) и согласованности норм следует, что име- имеются естественные вложения Ек э Ei при к < I. Таким образом, каждому счетно-нормированному пространству Е можно сопоставить убывающую цепочку полных нормированных пространств оо Ег Э • • • Э Ек э • • • ; П Ек Э Е. к=1 Можно показать, что пространство Е полно тогда и только то- оо гда, когда Е = f] Ек (докажите это!). Так, например, простран- k=i ство К[а, Ь] бесконечно дифференцируемых функций на отрезке [а, Ь] есть пересечение полных нормированных пространств Сп[а,Ь] (п = 0,1,2,...), где Сп[а,Ь] состоит из функций, имеющих непре- непрерывные производные до n-го порядка включительно, а норма в нем определяется формулой = sup |/(*>(t) |. 0<к<п
§ 5. Топологические линейные пространства 187 В 30-х годах, когда в основном в работах Банаха была построена тео- теория линейных нормированных пространств, сложилось впечатление, что этот класс пространств достаточно широк для того, чтобы обслуживать все конкретные нужды анализа. Впоследствии, однако, выяснилось, что это не так. Оказалось, что в ряде вопросов важны такие пространства, как пространство бесконечно дифференцируемых функций, пространство всех числовых последовательностей М°° и другие пространства, в кото- которых естественная для них топология не может быть задана с помощью какой бы то ни было нормы. Таким образом, линейные пространства — топологические, но не нормируемые — это вовсе не обязательно «экзоти- «экзотика» или «патология». Наоборот, некоторые из этих пространств предста- представляют собой не менее естественные и важные обобщения конечномерного евклидова пространства, чем, скажем, гильбертово пространство.
ГЛАВА IV ЛИНЕЙНЫЕ ФУНКЦИОНАЛЫ И ЛИНЕЙНЫЕ ОПЕРАТОРЫ § 1. Непрерывные линейные функционалы 1. Непрерывные линейные функционалы в топологичес- топологических линейных пространствах. В § 1 гл. III мы уже рассматри- рассматривали функционалы, определенные на линейном пространстве. Если речь идет о функционалах, заданных на топологическом ли- линейном пространстве, то основной интерес представляют непре- непрерывные функционалы; как обычно, функционал /, определен- определенный на пространстве Е, называется непрерывным, если для всякого хо Е Е и для всякого г > 0 существует такая окрестность U элемен- элемента Жо, ЧТО \f(x)-f(xo)\<s при x€U. A) Это определение относится, в частности, и к линейным функциона- функционалам. Если Е — конечномерное топологическое линейное про- пространство, то всякий линейный функционал на Е автоматически непрерывен. В общем случае из линейности функционала его не- непрерывность не вытекает. Следующее утверждение существенно для дальнейшего, хотя и почти очевидно. Если линейный функционал f непрерывен в какой-либо одной точке х Е Е, то он непрерывен и всюду на Е. Действительно, пусть у — произвольная точка в Е и пусть г > 0. Выберем окрестность U точки х так, чтобы выполнялось условие A). Тогда сдвиг этой окрестности V = U + (y-x) будет искомой окрестностью точки у, так как если z Е У, то z + x — y?Un, следовательно, Таким образом, проверять непрерывность линейного функциона- функционала достаточно в одной точке, например, в точке 0.
§ 1. Непрерывные линейные функционалы 189 Если Е — пространство с первой аксиомой счетности, то не- непрерывность линейного функционала на Е можно сформулировать в терминах последовательностей: функционал / называется непре- непрерывным в точке х Е Е, если из хп —у х следует f(xn) —У f(x). Проверка равносильности этого определения непрерывности приве- приведенному выше (при наличии первой аксиомы счетности) предостав- предоставляется читателю. Теорема 1. Для того чтобы линейный функционал f был не- непрерывен на Е, необходимо и достаточно, чтобы существовала такая окрестность нуля в Е, на которой функционал f ограничен. Доказательство. Если функционал / непрерывен в точке О, то для каждого г > 0 существует окрестность нуля, на которой \f(x)\ < e. Обратно, пусть U — такая окрестность нуля, что |/0)| < С при ж G [/, и пусть г > 0. Тогда 4^U есть та окрестность нуля, на которой |/(ж)| < е. Тем самым доказана непрерывность / в точке 0, а значит, и всюду. Упражнение. Пусть Е — топологическое линейное пространство; докажите справедливость следующих утверждений. (а) Линейный функционал / на Е непрерывен тогда и только тогда, когда существуют такое открытое множество U С Е и такое число ?, что t ф f(U), где f(U) — множество значений / на U. (б) Линейный функционал / на Е непрерывен тогда и только тогда, когда его ядро {х: f(x) = 0} замкнуто в Е. (в) Если всякий линейный функционал на Е непрерывен, то топология в Е совпадает с ядерно-выпуклой топологией (см. упражнение 2 в п. 2 § 5 гл. III). (г) Если Е бесконечномерно и нормируемо, то на нем существует не непрерывный линейный функционал (воспользуйтесь существовани- существованием в Е базиса Гамеля; см. упражнение в п. 3 § 1 гл. III). (д) Пусть в Е существует определяющая система окрестностей нуля, мощность которой не превосходит алгебраической размерности простран- пространства Е (т. е. мощности базиса Гамеля в Е; см. упражнение в п. 3 § 1 гл. III). Тогда на Е существует не непрерывный линейный функционал. (е) Для того чтобы линейный функционал / был непрерывен на Е, не- необходимо, а в случае, когда Е удовлетворяет первой аксиоме счетности, и достаточно, чтобы он был ограничен на каждом ограниченном множестве. 2. Линейные функционалы на нормированных простран- пространствах. Пусть рассматриваемое пространство Е нормировано. По теореме 1 всякий непрерывный линейный функционал / ограничен
190 Гл. IV. Линейные функционалы и операторы в некоторой окрестности нуля. Но в нормированном пространстве всякая окрестность нуля содержит шар и, значит, / ограничен на не- некотором шаре. В силу линейности функционала это равносильно его ограниченности на любом шаре, в частности, на единичном ||ж|| ^ 1. Обратно, из ограниченности функционала / на единичном шаре сле- следует, в силу той же теоремы 1, его непрерывность (ибо внутренность этого шара представляет окрестность нуля). Итак, в нормированном пространстве линейный функционал не- непрерывен в том и только том случае, когда его значения на еди- единичном шаре ограничены в совокупности. Пусть / — непрерывный линейный функционал в нормированном пространстве Е. Число ||/||= sup |/(x)|, B) IMI^i т.е. точную верхнюю грань значений |/(ж)| на единичном шаре про- пространства Е, мы назовем нормой функционала /. Отметим следую- следующие почти очевидные свойства |||| 1) 11/11 = sup Щ1; это сразу следует из того, что для всякого х/0 '(й) 2) Для любого х ? Е II f (тМ\ < II f II • llrll (Vi \\J\X)\\ ^ 11/11 IFII- К**) Действительно, если х ф 0, то элемент трту принадлежит единично- единичному шару, следовательно, по определению нормы функционала, _ 1/0*01 .. .. " \\А\ откуда следует C). Если же х = 0, то в C) справа и слева стоят нули. Упражнение. Пусть С ^ 0 — такое число, что 1/0*01 ^ С\\х\\ D) при любом х. Доказать, что ||/|| = inf С, где inf берется по всем С, удо- удовлетворяющим неравенству D). Рассмотрим примеры линейных функционалов в нормированных пространствах.
§ 1. Непрерывные линейные функционалы 191 1. Пусть Жп есть n-мерное евклидово пространство и а — какой- либо фиксированный вектор в нем. Скалярное произведение /О) = (ж, а), где х пробегает все Жп, представляет собой, очевидно, линейный функционал на!п. В силу неравенства Коши-Буняковского |/B0| = |(Ж,а)|^|ИНИ; E) следовательно, этот функционал ограничен, а значит, и непрерывен на W1. Из неравенства E) получаем, что Ш. < ца|| \\x\\ ^l|a|1" Так как правая часть этого неравенства не зависит от ж, то <ца11 \\x\\ ""' т.е. II/H ^ ||а||. Но положив х = а, получим |/(а)| = (а,а) = ||а||2, т.е. \\ Поэтому II/H = ||а||. 2. Интеграл I(x) = J x(t) dt, а где x(t) — непрерывная функция на [а, 6], представляет собой ли- линейный функционал в пространстве С [а, Ь]. Этот функционал огра- ограничен, а его норма равна Ъ — а. Действительно, I ь \1{х)\ = I x(t) dt ^ max \x(t)\(b - а) = ||ж||(Ь - а), а причем при х = const достигается равенство. 3. Рассмотрим более общий пример. Пусть yo(t) — фиксирован- фиксированная непрерывная функция на [а, Ь]. Положим для любой функции x(t)eC[a,b] ь F{x)= I x{t)yo(t) dt. а Этот функционал линеен. Он ограничен, так как \F(x)\ = \fx(t)yo(t)dt\ ^ \\x\\ / \yo(t)\dt. F) а а В силу линейности и ограниченности он непрерывен. Из F) следует оценка его нормы: \\F\\<f\yo(t)\dt. а (Докажите, что на самом деле здесь имеет место точное равенство!)
192 Гл. IV. Линейные функционалы и операторы 4. Рассмотрим в пространстве С [а, Ь] линейный функционал Sto(x) =x(t0), уже упоминавшийся в п. 5 § 1 гл. III. Его значение на функции x(t) определяется как значение x(t) в данной точке to- Ясно, что причем для х = const имеет место равенство. Отсюда сразу следует, что норма функционала St0 равна 1. 5. В любом евклидовом пространстве X можно определить ли- линейный функционал так же, как ив!п, выбрав некоторый фикси- фиксированный элемент a Е X и положив для любого х Е X F(x) = (ж, а). Как и в случае Мп, легко проверить, что при этом В дальнейшем мы будем рассматривать только непрерывные ли- линейные функционалы, а слово «непрерывный» будем для краткости опускать. Понятию нормы линейного функционала можно дать следующую наглядную интерпретацию. Мы уже видели (§ 1 гл. III), что всякому ненулевому линейному функционалу можно сопоставить гиперплос- гиперплоскость L, определяемую уравнением f(x) = 1. Найдем расстояние d от этой гиперплоскости до точки 0. По опре- определению, d = inf/(ж)=1 ||ЖИ- В силу оценки на гиперплоскости f(x) = 1 будем иметь ||ж|| ^ 1/II/II и> значит, d ^ 1/II/H. С другой стороны, в силу определения нормы / для любого г > 0 найдется такой элемент х?, подчиненный условию f(x?) = 1, что 1> A1/11-6I1^11; поэтому Поскольку г > 0 произвольно, получаем d= l/H/H,
§ 1. Непрерывные линейные функционалы 193 т. е. норма линейного функционала f обратна расстоянию гипер- гиперплоскости f(x) = 1 от точки 0. 3. Теорема Хана—Банаха в нормированном пространстве. В § 2 гл. III мы доказали общую теорему Хана-Банаха, согласно ко- которой всякий линейный функционал /о, определенный на некотором подпространстве L линейного пространства Е и удовлетворяющий условию |/о(аОЮО«0 G) (р — фиксированный однородно-выпуклый функционал на Е), мо- может быть продолжен на все Е с сохранением этого условия. При- Применительно к нормированным пространствам эту теорему можно сформулировать следующим образом: Пусть Е — действительное нормированное пространство, L — его подпространство и /о — ограниченный линейный функционал на L. Этот линейный функционал может быть продолжен до не- некоторого линейного функционала f на всем пространстве Е без уве- увеличения нормы, т. е. так, что Действительно, пусть ||/о||на L = k. Ясно, что к\\х\\ — однородно-выпуклый функционал. Взяв его в ка- качестве р и применяя общую теорему Хана-Банаха, получим требуе- требуемый результат. Эта форма теоремы Хана-Банаха допускает следующую геомет- геометрическую интерпретацию. Уравнение /о (х) = 1 (8) определяет в подпространстве L гиперплоскость, лежащую на рас- расстоянии 1/||/о || от нуля. Продолжая функционал /о без увеличения нормы до функционала на всем Е, мы проводим через эту частич- частичную гиперплоскость «большую» гиперплоскость во всем Е, причем «не позволяем» ей приблизиться к нулю. Комплексный вариант теоремы Хана—Банаха (теорема 4а § 2 гл. III), дает нам комплексный аналог предыдущей теоремы: Пусть Е — комплексное нормированное пространство, /о — ли- линейный ограниченный функционал, определенный на подпростран- подпространстве L С Е. Тогда существует линейный ограниченный функцио- функционал f, определенный на всем Е и удовлетворяющий условиям f(x)=fo(x), xeL, ||на Е = ||/о||на L-
194 Гл. IV. Линейные функционалы и операторы Укажем некоторые важные факты, вытекающие из теоремы Хана-Банаха для нормированных пространств. Предварительно сделаем следующее замечание. Выпуклое множество в линейном пространстве мы назвали выпуклым телом, если оно имеет непу- непустое ядро. Можно показать, что в нормированном пространстве ядро выпуклого множества совпадает с совокупностью его внутренних точек. Таким образом, в нормированном пространстве выпуклое тело — это выпуклое множество, имеющее хотя бы одну внутрен- внутреннюю точку. Отсюда и из теоремы 5 § 2 гл. III вытекает следующий факт. Следствие 1 (первая теорема отделимости). Пусть А и В — выпуклые множества в нормированном пространстве X, причем хо- хотя бы одно из них, скажем А, является выпуклым телом и его ядро не пересекается с В. Тогда существует ненулевой непрерывный ли- линейный функционал, разделяющий А и В. Существование ненулевого функционала, разделяющего А и В, обеспечивается самой теоремой 5 § 2 гл. III. Покажем, что соот- соответствующий функционал обязательно непрерывен. Действительно, если sup/(ж) ^ inf/(х), (9) то функционал / ограничен на А сверху. Пусть хо — внутренняя точка множества А и U(xo) — ее шаровая окрестность, целиком лежащая в А. В силу (9) функционал / ограничен на U(xq) сверху. Но тогда он ограничен на U{xq) и снизу (проведите доказательство!). Так как линейный функционал, ограниченный на каком-либо шаре, непрерывен, то наше утверждение доказано. Следствие 2 (вторая теорема отделимости). Пусть А — замкнутое выпуклое множество в нормированном пространстве X и хо Е X — точка, не принадлежащая А. Тогда существует непре- непрерывный линейный функционал, строго разделяющий xq и А. Действительно, достаточно взять некоторую выпуклую окрест- окрестность U точки хо, не пересекающуюся с А, и рассмотреть функ- функционал, разделяющий U и А. (Проведите доказательство того, что ненулевой функционал, разделяющий U и А, непременно строго разделяет хо и А.) Следствие 3 (лемма об аннуляторе). Для всякого (замкну- (замкнутого) собственного подпространства L нормированного простран- пространства X существует ненулевой непрерывный линейный функцио- функционал f, равный нулю на L.
§ 1. Непрерывные линейные функционалы 195 Действительно, пусть xq ^ L и / — непрерывный линейный функ- функционал, строго разделяющий ж о и L: /Оо) > sup /О). Тогда /(ж) = 0 на L, так как иначе верхняя грань справа была бы равна +оо. Совокупность функционалов, равных нулю на данном подпро- подпространстве, называется аннулятором этого подпространства и обо- обозначается lA 1). Следствие 4. Если ж о — ненулевой элемент в нормирован- нормированном пространстве X, то существует такой непрерывный линейный функционал f на X, что ||/|| = i, /ы = 1Ы|. (ю) Действительно, определив сперва функционал / на одномерном подпространстве, состоящем из элементов вида ахо, формулой f(axo) = а||жо||, а затем продолжив его без увеличения нормы на все X, мы и получим функционал, удовлетворяющий условиям A0). Замечание. Для произвольных локально-выпуклых прост- пространств следствия 1-3 остаются в силе без изменений, а следствие 4 может быть заменено утверждением: для всякого хо ф 0 существует такой непрерывный линейный функционал /, что /(жо) Ф 0. 4. Линейные функционалы в счетно-нормированном прос- пространстве. Пусть Е — счетно-нормированное пространство с норма- нормами || • ||& (к = 1,2,3,...); не ограничивая общности, можно считать (см. пример 4 в п. 3 § 5 гл. III), что для всякого х G Е \\X\\l ^ '•• ^ \\x\\n ^ ••• A1) Пусть / — непрерывный линейный функционал на Е; тогда в Е су- существует окрестность нуля С/, на которой / ограничен. В силу опре- определения топологии в счетно-нормированном пространстве найдутся такое натуральное к и такое г > 0, что шар В^? = {х : \\x\\k < s} целиком лежит в U; тогда функционал / ограничен на этом шаре и потому ограничен и непрерывен относительно нормы || • ||&, т.е. существует такое С > 0, что \f(x)\^C\\x\\k, xGE. 1) В § 4 гл. III мы обозначили так ортогональное дополнение подпространства в евклидовом пространстве. Как будет видно в следующем параграфе, в евкли- евклидовом пространстве понятия ортогонального дополнения и аннулятора равно- равносильны, поэтому совпадение обозначений оправдано.
196 Гл. IV. Линейные функционалы и операторы С другой стороны, очевидно, что если линейный функционал огра- ограничен по какой-либо из норм || • ||п, то он непрерывен на Е. Таким образом, если Е^ — запас всех линейных функционалов на Е, непрерывных относительно нормы || • ||n, a E* — запас всех ли- линейных непрерывных функционалов на Е, то оо Е* = U К- A2) га=1 Кроме того, из условия A1) следует, что Е{ С • • • С El С • • • Если / — непрерывный линейный функционал на Е, т.е. / Е Е*, то его порядком называется наименьшее из чисел п, для которых / Е Е^; в силу равенства A2) каждый непрерывный линейный функ- функционал на Е имеет конечный порядок. § 2. Сопряженное пространство 1. Определение сопряженного пространства. Для линейных функционалов можно определить операции сложения и умножения их на числа. Пусть /i и /2 — два линейных функционала на не- некотором линейном пространстве Е. Их суммой Д + Д называется линейный функционал Произведением af± линейного функционала Д на число а назы- называется функционал f(x)=af1(x), xeE. Равенства, определяющие Д + Д и аД, можно записать и так: (Л + h){x) = h(x) + f2(x), (аЛ)(ж) = ah(x). Ясно, что сумма Д + Д и произведение аД представляют собой линейные функционалы. Кроме того, если пространство Е тополо- топологическое, то из непрерывности функционалов Д и Д следует, что Д +/2 и аД тоже непрерывны на Е. Легко проверить, что так определенные операции сложения функционалов и умножения их на числа удовлетворяют всем ак- аксиомам линейного пространства. Иначе говоря, совокупность всех непрерывных линейных функционалов, определенных на некотором
§ 2. Сопряженное пространство 197 топологическом линейном пространстве Е, образует линейное про- пространство. Оно называется пространством, сопряженным с Е,и обо- обозначается Е*. Упражнение. Совокупность всех линейных функционалов на Е, не обязательно непрерывных, называется алгебраически сопряэюенным пространством и обозначается Е^. Привести пример топологического век- векторного пространства Е такого, что Е* ф Е*. В сопряженном пространстве Е* можно различными способами ввести топологию. Важнейшие из них — это сильная и слабая топо- топологии. 2. Сильная топология в сопряженном пространстве. Нач- Начнем с того простейшего случая, когда исходное пространство Е нор- нормировано. Для непрерывных линейных функционалов, заданных на нормированном пространстве, мы ввели понятие нормы, поло- положив IX/ М 11/11= sup \Ш. хфО \\Х\\ Эта величина удовлетворяет всем требованиям, содержащимся в оп- определении нормированного пространства. Действительно, 1) 11/11 > О ДЛЯ любого ненулевого линейного функционала /, 2) 1кЯ1 = Н 3I1/1+/2|| Таким образом, пространство Е*, сопряженное к нормированно- нормированному, можно наделить естественной структурой нормированного про- пространства. Топология в Е*, отвечающая введенной норме, называ- называется сильной топологией в Е*. Желая подчеркнуть, что Е* рассма- рассматривается как нормированное пространство, мы будем вместо Е* писать (Е*,\\ • ||). Установим следующее важное свойство пространства, сопряжен- сопряженного к нормированному. Теорема 1. Сопряженное пространство (Е*, 11 • 11) полно. Доказательство. Пусть {/п} — фундаментальная последо- последовательность линейных функционалов. Тогда для каждого г > О
198 Гл. IV. Линейные функционалы и операторы найдется такое JV, что ||/п - fm\\ < е для всех п,т ^ N. Отсюда для любого х Е Е получаем \fn(x) ~ fm(x)\ ^ ||/n - /m|| ' \\x\\ < е\\х\\, т.е. при любом х Е Е числовая последовательность {fn(x)} сходит- сходится. Положим /(ж) = lim fn{x). п—юо Проверим, что / представляет собой непрерывный линейный функ- функционал. Линейность проверяется непосредственно: f(ax+py) = lim fn(ax+/3y) = lim [afn(x)+0fn(y)] = af{x)+Cf(y). Для доказательства непрерывности функционала / вернемся к неравенству \fn(x) — fm(x)\ < s\\x\\ и перейдем в нем к пределу при т —У оо; получим \f(x)-fn(x)\ ^e\\x\\. Отсюда вытекает, что функционал / — fn ограничен. Но тогда огра- ограничен и, значит, непрерывен и функционал / = /п + (/ — /п). Кроме того, отсюда же следует, что ||/ — /п|| ^ г для всех п ^ JV, т. е. что {fn} сходится к /. Подчеркнем еще раз, что эта теорема справедлива независимо от того, полно или нет исходное пространство. Замечание. Если нормированное пространство Е не полно, а Е — его пополнение, то пространства Е* и (Е)* изоморфны. Действительно, если Е вложено в Е в качестве всюду плотного подмножества, то всякий линейный непрерывный на Е функцио- функционал / продолжается по непрерывности с Е на все Е. Обозначим это (единственное!) продолжение /. Ясно, что / G (Е)*, \\f\\ = ||/||, и что всякий функционал из (Е)* служит продолжением некоторого функционала из (Е)* (а именно, своего сужения на Е). Следователь- Следовательно, отображение / ->• / представляет собой изоморфное отображе- отображение пространства Е* на все пространство (Е)*. Определим теперь сильную топологию в пространстве, сопряжен- сопряженном к произвольному линейному топологическому. В пространстве, сопряженном к нормированному, мы определили окрестность нуля как совокупность функционалов, удовлетворяющих условию < г. Иначе говоря, за окрестность нуля в пространстве i?*, сопряженном к нормированному, принимается совокупность функционалов, для
§ 2. Сопряженное пространство 199 которых |/(ж)| < ?, когда х пробегает в Е единичный шар ||ж|| ^ 1. Беря всевозможные е, получим определяющую систему окрестно- окрестностей нуля. В случае, когда Е — не нормированное, а топологическое линейное пространство, вместо единичного шара в Е естественно взять произвольное ограниченное множество А. Окрестность нуля U?ja в Е* определяется как совокупность линейных функционалов, удовлетворяющих условию |/(ж)| < е при всех х G А. Варьируя г в А, получим определяющую систему окрестностей нуля в Е. Итак, сильная топология в Е* задается совокупностью окрестно- окрестностей нуля, зависящих от положительного числа е и ограниченного множества А С Е. Мы не будем здесь проверять, хотя это и неслож- несложно (см., например, [9]), что такая система окрестностей действитель- действительно превращает Е* в линейное топологическое пространство. Ясно, что в случае нормированного пространства Е только что описан- описанная сильная топология в Е* совпадает с той, которая определялась с помощью нормы. Заметим, что сильная топология в Е* обязательно удовлетворяет аксиоме отделимости Т\ и локально выпукла (независимо от топо- топологии в Е). Действительно, если /о Е Е* и /о Ф 0, то найдется такой элемент хо Е Е, что /o(#o) = ^5 положим г = i|/o(^o)| и А = {жо}, тогда /о ^ U?a, т.е. Е* — Т\-пространство. Для доказательства ло- локальной выпуклости сильной топологии в Е* достаточно заметить, что для любого е > 0 и любого ограниченного А С Е окрестность U?a выпукла в Е. Сильную топологию в Е* обозначим символом Ь; желая подчеркнуть, что Е* рассматривается в сильной топологии, мы будем писать (Е*, Ь) вместо Е*. 3. Примеры сопряженных пространств. 1. Пусть Е — n-мерное линейное пространство (действительное или комплексное). Выберем в нем какой-нибудь базис ei,..., еп; тог- п да всякий вектор х G Е однозначно представим в виде х = У^ Xjej. Если / — линейный функционал на Е, то ясно, что г=1 следовательно, линейный функционал однозначно определяется своими значениями на векторах базиса ei,..., еп, причем эти значе- значения можно задать произвольно. Определим линейные функционалы
200 Гл. IV. Линейные функционалы и операторы gi,...,gn, полагая 1, если г = j, 0, если i ф j. Очевидно, что эти функционалы линейно независимы. Ясно, что 9j(x) = хз'-> поэтому формулу A) можно записать в виде г=1 Таким образом, функционалы #i,...,gn составляют базис в про- пространстве Е*, т.е. Е* есть n-мерное линейное пространство; ба- базис д\,..., дп в Е* называют двойственным по отношению к базису еь.. . ,еп в Е. Различные нормы в пространстве Е индуцируют различные нор- нормы в Е*. Вот несколько примеров пар соответствующих друг другу норм в Е и Е* (читателю рекомендуется аккуратно провести соот- соответствующие доказательства): (a) ini=(En2I7! ii/ii=(Е1Л12I/2; г=1 г=1 г=1 г=1 (с) ||ж||= sup \xi\, п В этих формулах х\, ... , хп — это координаты вектора х Е Е в базисе ei, ... , еп, а Д, ... , /п — координаты функционала / Е Е* в двойственном базисе #i,..., дп. Упражнение. Доказать, что все перечисленные нормы определяют в n-мерном пространстве одну и ту же топологию. 2. Рассмотрим пространство со сходящихся к нулю последова- последовательностей х = (xi,... ,жп,...) с нормой ||ж|| = sup \xn\ и покажем, п что сопряженное к нему пространство (cq, || • ||) изоморфно про- пространству 1\ всех абсолютно суммируемых последовательностей (X) / = (/i,..., /п,...) с нормой II/H = ^2 \fn\- Любая последователь- п=1 ность / G h определяет в пространстве со линейный ограниченный
2. Сопряженное пространство 201 функционал / по формуле ясно, что \f(x) Рассмотрим в с0 оо 7-11 V 1 i xll Z_> \Jn п=1 векторы ei = A п=1 , так что | ,0,0,...,0, /1 ; CD CD 0, оо ^ Е п=1 -), П Г Г и положим x(N' = Е \f~\en (если fn = 0, то считаем, что -fj-r = 0). Тогда хW G со, Цх^Ц ^ 1 и п=1 n=l oo так что lim /(ж(лГ)) = ]Г \fn\ = ||/||. Следовательно, ||/|| ^ ]Г |/п 7V—^оо n_i n_i сопоставляя это с доказанным выше противоположным неравен- неравенством, заключаем, что ||/|| = Е \fn\ — 11/11- п=1 Таким образом, мы построили линейное изометрическое отображение / —у / пространства /i в пространство с^; оста- остается проверить, что образ пространства 1\ при этом отображении совпадает со всем Cq, т. е. что всякий функционал / G Cq представим в виде B), где / = {/п} ? ^ь Для всякого х = {xn} G со имеем оо х — Е хп^п-> причем ряд, стоящий справа, сходится в со к элемен- п=1 Л^ м ту ж, ибо ж - Е хп^п\ — sup |жп| ->• 0 при N -у оо. Так как ~ n=1 n>7V ^ оо _ функционал / G Cq непрерывен, то /(ж) = ^2 xnf(en); поэтому до- оо _ n=l 7V 7>е \ статочно проверить, что Е |/(еп)|<оо. Полагая ж^^Е - еп п=1 п=1 |/\б?г)| и замечая, что ж^ G со, Цж^^Ц ^ 1, имеем N N ~ У , 1/(еп)| = 2_^ 7Т( tJ^7^ ~ f(x ) ^ WfWi п=1 п=1 I*' ^ п" оо ^. откуда в силу произвольности N заключаем, что Е 1/(еп)| < оо. п=1
202 Гл. IV. Линейные функционалы и операторы 3. Нетрудно доказать, что пространство /*, сопряженное к про- пространству /]_, изоморфно пространству т, состоящему из всех огра- ограниченных последовательностей х = {хп} с нормой ||ж|| = sup \xn . п 4. Пусть р > 1 и 1р — пространство всех последовательностей х = {жп}, для которых можно доказать, что сопряженное к нему пространство I* изоморф- изоморфно пространству lq, l/p+ 1/q = 1. Общий вид линейного непрерыв- непрерывного функционала на 1Р: friXn] X = {Хп} elp, / = {/n} G lq. п=1 Доказательство основано на применении неравенства Гёльдера. 5. Выясним структуру пространства, сопряженного к гильбер- гильбертову. Теорема 2. Пусть Н — действительное гильбертово простран- пространство. Для всякого непрерывного линейного функционала f на Н существует единственный элемент xq E Н такой, что f(x) = (x,x0), хеН, C) причем II/H = ||жо||. Обратно, если х0 Е Н, то формула C) опреде- определяет такой непрерывный линейный функционал f, что \\f\\ = ||жо||. Таким образом, равенство C) определяет изоморфизм / —у хо меж- между пространствами Н* и Н. Доказательство. Очевидно, что для всякого Хо Е Н форму- формула C) определяет линейный функционал на Н. Так как |/(ж)| = = |(ж,жо)| ^ ||ж|| • ||жо||, т0 этот функционал непрерывен, а так как /(жо) = ||^о||25 то II/H = ||жо||. Покажем, что всякий непрерывный линейный функционал / на Н представим в виде C). Если / = 0, то полагаем х0 = 0. Пусть теперь / ф 0 и Но = {х: f(x) =0} — ядро функционала /; так как / непрерывен, то Hq — замкнутое линейное подпространство в Н. В п. 6 § 1 гл. III было показано, что коразмерность ядра любого линейного функционала равна 1. Поэтому, учитывая следствие 3 теоремы 7 из § 4 гл. III, заключа- заключаем, что ортогональное дополнение Hq~ к подпространству Hq од- одномерно, т.е. существует такой (ненулевой) вектор уо, ортогональ- ортогональный к Hq, что всякий вектор х Е Н однозначно представим в виде х = у + \уо, где у Е Hq. Очевидно, можно считать, что \\yo\\ = 1;
§ 2. Сопряженное пространство 203 положим хо = /B/оJ/о- Тогда для любого ж Е i? имеем ж = 2/ + А?/о, у е Но, (ж,ж0) = А(з/о,жо) = А/ B/о) (уо, 2/о) = А/B/о). Таким образом, /(ж) = (ж,жо) для всех х G Я. Если /(ж) = (ж,Жд), ж Е Н, то (ж,жо — Жд) = 0, откуда, полагая х = жо — х'о, получаем, Замечания. 1. Пусть Е — неполное евклидово простран- пространство, а Я — гильбертово пространство, являющееся его пополне- пополнением. Так как пространства Е* и Н* изоморфны (см. замечание в п. 2), а Н* изоморфно Н, то справедливо следующее утверждение: пространство Е*, сопряженное к неполному евклидову простран- пространству Е, изоморфно пополнению Н пространства Е. 2. Теорема 2 справедлива и для комплексного гильбертова про- пространства (доказательство в точности то же, с заменой лишь х0 = /B/о)? 2/о на Жо = /B/оJ/о) • Единственное отличие комплексного случая от действительного состоит в том, что теперь отображение Н в Н*, сопоставляющее элементу жо G Н функционал /(ж) = (ж,жо), является сопряженно-линейным изоморфизмом, т. е. элементу Ажо отвечает функционал А/. 6. В примерах 1-5 рассматривались нормированные пространст- пространства. Рассмотрим теперь пространство счетно-нормированное. Пусть Ф — действительное счетно-гильбертово пространство, состоящее из всех последовательностей ж = {жп}, для которых / ~ . 2ч1/2 ||ж||^ = у2_^ п хп) < оо при всех к = 1, 2,... 71=1 Скалярные произведения в Ф суть оо (гр пЛ, \ гп^гг п, h 19 У^ч У)к — / v ib ^пУпч гь — -L, Z/, . . . 71=1 Пространство Ф со скалярным произведением (•,•)& является евкли- евклидовым; пусть Ф/, — его пополнение. Легко видеть, что Ф/. можно отождествить с гильбертовым пространством всех последователь- последовательностей ж = {жп}, у которых \\x\\k < оо. В силу теоремы 2 про- пространство Ф?, сопряженное к Ф/,, изоморфно пространству Ф/,; при этом изоморфизме каждому непрерывному линейному функциона-
204 Гл. IV. Линейные функционалы и операторы лу / Е Ф^ сопоставляется такая последовательность / = {/п}, что п=1 оо f (ф\ ^^ I Т* f 1 ) —— > Т) Т* ^ Т* ^^ -1т* I- ^ Л, «/ Vх/ — VX5 «/ /« — / j lb ^njni >ь — X^nj ^ ^ki п=1 и обратно, каждая такая последовательность определяет элемент из Ф?. Определим теперь функционал / Е Ф^ не последовательно- последовательностью {/п}, а последовательностью {дп}, где дп = пк fn. Тогда -~. _„ /,1/2 И п=1 п=1 Таким образом, Ф^ можно отождествить с гильбертовым простран- пространством последовательностей {дп}, удовлетворяющих условию оо ^2п~кд1< оо, D) 71=1 и со скалярным произведением оо 71=1 ОО Так как Ф* = (J Ф?, то Ф* — пространство всех последователь- последовательностей {gn}, для каждой из которых существует свое к, такое, что выполняется условие D). Значение каждого такого функционала определено на любом эле- оо менте х = {хп} G Ф и равняется J^ xngn. 71=1 Итак, если пространство Ф есть пересечение убывающей це- цепочки гильбертовых пространств оо Ф = П Фк, Фх D ••• D Фк D •• , к=1 то Ф* есть сумма возрастающей цепочки гильбертовых про- пространств Ф*= П Ф?, Ф1С-СФ1С-- к=1 Удобно ввести обозначение Ф^ = Ф-к- Если еще обозначить про- пространство ^2 через Фо, то мы получим такую бесконечную в обе сто- стороны цепочку гильбертовых пространств • • • С Ф/e С • • • С Фг С Фо С Ф_1 С • • • С Ф-к С • • • , в которой Ф^ = Ф_/, при каждом к = О, =Ы, ±2,...
§ 2. Сопряженное пространство 205 4. Второе сопряженное пространство. Так как непрерывные линейные функционалы на линейном топологическом простран- пространстве Е сами образуют линейное топологическое пространство, — сопряженное к Е пространство (Е*, Ь), — то можно говорить о про- пространстве Е** непрерывных линейных функционалов на Е*, т.е. о втором сопряженном к Е и т. д. Заметим, что всякий элемент ж о из Е определяет некоторый ли- линейный функционал на Е*. Действительно, положим ^о(/) = /Ы, E) где хо — фиксированный элемент из Е, а / пробегает все Е*. Равен- Равенство E) ставит в соответствие каждому / некоторое число грХо(/), т.е. определяет функционал на Е*. Так как при этом то этот функционал линеен. Далее, всякий такой функционал непрерывен на ??*. В са- самом деле, пусть г > 0 и А — ограниченное множество в Е, содержа- содержащее хо. Рассмотрим в Е* окрестность нуля U(e,A). По определению U(e,A), имеем |^о(/I = 1/Ы|^ при feU(e,A). Но это означает, что функционал фХо непрерывен в точке 0, а сле- следовательно, и на всем пространстве Е*. Мы получили, таким образом, отображение всего пространства Е на некоторое подмножество пространства Е**. Это отображение, очевидно, линейно. Такое отображение Е в i?** называется есте- естественным отображением пространства Е во второе сопряженное. Обозначим его тг. Если на Е есть достаточно много линейных функ- функционалов (например, если Е нормировано или хотя бы локально выпукло и отделимо), то это отображение взаимно однозначно, так как тогда для любых двух различных х', х" G Е существует такой функционал / G Е*, что /(V) Ф f(x"), т.е. фх> и фх>> — различные функционалы на Е*. Если к тому же тг(Е) = i?**, то (отделимое ло- локально выпуклое) пространство Е называется полурефлексивным. В пространстве Е** (как сопряженном к (Е*, Ь)) можно ввести силь- сильную топологию, которую мы обозначим 6*. Если пространство Е по- полурефлексивно и отображение тг: Е —>¦ ?Г* непрерывно, то Е на- называется рефлексивным пространством. Можно показать, что ото- отображение тг всегда непрерывно, поэтому если Е рефлексивно, то естественное отображение тг; Е —У Е** представляет собой изо- изоморфизм между линейными топологическими пространствами Е иЕ** = (Я**,Ь).
206 Гл. IV. Линейные функционалы и операторы Поскольку мы можем теперь каждый элемент из Е рассматри- рассматривать еще и как элемент пространства ??**, удобно для значений линейного функционала / Е Е* вместо записи f(x) ввести более симметричное обозначение: /(*) = (/>*)• F) При фиксированном / Е Е* мы можем рассматривать (/, х) как функционал на Е, а при фиксированном х — как функционал на Е* (при этом уже х выступает в роли элемента из Е**). Если Е — нормированное пространство (следовательно, норми- нормированы и пространства Е*, Е** и т.д.), то естественное отобра- отображение пространства Е в Е** есть изометрия. Действительно, пусть х — элемент из Е. Обозначим его норму в Е символом ||ж||, а норму его образа в Е** символом \\x\\2. Покажем, что ||ж|| = ||ж||2. Пусть / — произвольный ненулевой элемент из Е*. Тогда 1^ЖЛ и, поскольку левая часть последнего неравенства не зависит от /, С другой стороны (следствие 4 теоремы Хана-Банаха для нормиро- нормированных пространств), для каждого хо G Е найдется такой ненулевой линейный функционал /о, что |(/о,жо)| = ||/о||-|Ы|, G) поэтому т.е. ||ж|| = ||ж||2, что и требовалось доказать. Таким образом, норми- нормированное пространство Е изометрично (вообще говоря, незамкнуто- незамкнутому) линейному многообразию тг(Е) в Е**; отождествляя Е с тг(Е), можно считать, что Е С Е**. Из изометричности естественного отображения тг: Е —у Е** для нормированных пространств следует, что понятия полурефлексив- полурефлексивности и рефлексивности для нормированных пространств совпада- совпадают. Поскольку пространство, сопряженное к нормированному, полно, всякое рефлексивное нормированное пространство Е полно. Конечномерные евклидовы пространства и гильбертово простран- пространство представляют собой простейшие примеры рефлексивных про- пространств (для них даже Е = Е*).
§ 3. Слабая топология и слабая сходимость 207 Пространство со сходящихся к нулю последовательностей пред- представляет собой пример полного нерефлексивного пространства. Действительно, как мы показали выше (пример 2 § 2), сопряжен- сопряженным к со является пространство 1\ всех абсолютно сходящихся чис- числовых рядов, которому в свою очередь сопряжено пространство т всех ограниченных последовательностей. Пространство С[а, Ь] непрерывных функций на некотором отрезке [а, Ь] тоже нерефлексивно. Мы, однако, не будем здесь приводить доказательства этого утверждения1). Примером рефлексивного пространства, не совпадающего со сво- своим сопряженным, может служить 1Р при 1 < р ф 2 (так как I* = lqj где 1/р+l/q = l, то l*p*=l*=lp). Упражнение. Докажите, что замкнутое подпространство рефлек- рефлексивного пространства рефлексивно. § 3. Слабая топология и слабая сходимость 1. Слабая топология и слабая сходимость в линейном то- топологическом пространстве. Рассмотрим линейное топологиче- топологическое пространство Е и совокупность всех непрерывных функциона- функционалов на нем. Если /i,..., /п — произвольный конечный набор таких функционалов иг — положительное число, то множество {х: \fi(x)\<e, г = 1,...,п} A) открыто в Е и содержит точку 0, т. е. представляет собой некото- некоторую окрестность нуля. Пересечение двух таких окрестностей всегда содержит множество вида A), и, следовательно, в Е можно ввес- ввести топологию, для которой совокупность множеств вида A) будет определяющей системой окрестностей нуля. Она называется слабой топологией пространства Е. Слабая топология в Е — это самая слабая из топологий, в которой непрерывны все линейные функ- функционалы, непрерывные в исходной топологии этого пространства. Ясно, что всякое множество в Е, открытое в смысле слабой то- топологии, открыто и в исходной топологии пространства Е, однако обратное, вообще говоря, неверно (множества вида A) не обязаны 1) Можно доказать даже следующее более сильное утверждение: не суще- существует никакого нормированного пространства, для которого С[а,6] было бы сопряженным пространством.
208 Гл. IV. Линейные функционалы и операторы образовывать определяющую систему окрестностей нуля в исход- исходной топологии). По терминологии, принятой нами в § 5 гл. II, это означает, что слабая топология пространства Е слабее, чем его исходная топология. Тем самым оправдывается принятое для нее название. Если в Е существует достаточно много непрерывных линейных функционалов (например, если Е нормировано), то слабая тополо- топология в Е удовлетворяет аксиоме отделимости Хаусдорфа. Легко так- также проверить, что операции сложения и умножения на числа, опре- определенные в Е, непрерывны относительно слабой топологии этого пространства. Даже в случае нормированных пространств слабая топология в Е может не удовлетворять первой аксиоме счетности. Следовательно, эта топология, вообще говоря, не описывается на языке сходящихся последовательностей. Тем не менее сходимость в Е, определяемая этой топологией, представляет собой важное понятие. Она называ- называется слабой сходимостью. В отличие от нее, сходимость, определя- определяемую исходной топологией пространства Е (нормой, если Е норми- нормировано), называют сильной сходимостью. Понятие слабой сходимости можно сформулировать следующим образом: последовательность {хп} элементов из Е называется сла- слабо сходящейся к хо Е Е, если для любого непрерывного линейного функционала ip(x) на Е числовая последовательность {ср(хп)} схо- сходится к ср(х0). Действительно, считая для простоты хо = 0, предположим, что ip(xn) —У 0 при всяком if Е Е*. Тогда для всякой слабой окрестности U = {x: \<fi(x)\ <e, г = 1,...,/с} точки 0, найдется такое JV, что хп Е U при всех п ^ N (для этого достаточно выбрать Ni так, что |^i(^n)| < ? ПРИ п ^ Ni и затем по- положить N = maxTVf). Обратно, если для каждой слабой окрестности нуля U существует такое JV, что хп G U для всех п ^ JV, то условие (р(хп) —У 0 при п —у оо, очевидно, выполнено для каждого фикси- фиксированного if G Е*. Из того, что слабая топология пространства Е слабее его сильной топологии, следует, что всякая сильно сходящая- сходящаяся последовательность сходится и слабо. Обратное, вообще говоря, неверно (см. примеры ниже). 2. Слабая сходимость в нормированных пространствах. Рассмотрим подробнее понятие слабой сходимости применительно к нормированным пространствам.
§ 3. Слабая топология и слабая сходимость 209 Теорема 1. Если {хп} — слабо сходящаяся последователь- последовательность в нормированном пространстве, то существует такое посто- постоянное число С, что Ит II < С ||^п|| ^ Ly- Иначе говоря, всякая слабо сходящаяся последовательность в нормированном пространстве ограничена. Доказательство. Рассмотрим в Е* множества Akn = {f: \(f,xn)\ О}, fe,n = l,2,... Эти множества замкнуты в силу непрерывности (/, хп) как функ- функции от / при фиксированном хп. Следовательно, замкнуты (как пе- оо ресечения замкнутых) и множества А^ = Q Акп. В силу слабой 71=1 сходимости {хп} последовательность (/, хп) ограничена для каждо- каждого / Е Е*, поэтому Е* = U Ак. к=1 Так как пространство Е* полно, то по теореме Бэра (§ 3 гл. II) хоть одно из множеств Аь, скажем Аь0, должно быть плотно в не- некотором шаре В [/о, г], а так как А^о замкнуто, то это означает, что B[fo,e] сАко. Но это значит, что последовательность {хп} ограничена на шаре В [/о, г], а следовательно, и на любом шаре в ??*, в частности на еди- единичном шаре этого пространства. Таким образом, последователь- последовательность {хп} ограничена как последовательность элементов из Е**. Но в силу изометричности естественного вложения Е в ?Г* это озна- означает ограниченность {хп} и в Е. Замечание. При доказательстве ограниченности последовательно- последовательности {хп} по норме мы воспользовались лишь тем, что числовая после- последовательность (/, хп) ограничена при каждом / ? Е*. Таким образом, если последовательность {хп} в Е такова, что числовая последователь- последовательность (/, хп) ограничена при каждом / Е Е*, то существует такая по- постоянная Сг, что \\хп\\ ^ С. Это утверждение можно обобщить: всякое слабо ограниченное (т. е. ограниченное в слабой топологии) подмноэюе- ство Q нормированного пространства Е сильно ограничено (т. е. содер- содержится в некотором шаре). Действительно, допустим, найдется такая по- последовательность {хп} С Q, что \\хп\\ —>- оо при п —>- оо. Так как Q слабо ограничено, то и множество {хп} слабо ограничено, т. е. поглощается лю- любой слабой окрестностью нуля; в частности, для любого / Е Е* найдется такое ЛГ, что {хп} С N{x : |(/, х)\ < 1}, откуда |(/, хп)\ < N для всех п. Но это в силу сделанного выше замечания противоречит предположению \\хп\\ —>- оо. Если учесть, что слабая ограниченность множества Q означа- означает, что на нем ограничен любой непрерывный линейный функционал, то
210 Гл. IV. Линейные функционалы и операторы мы приходим к следующему важному результату: для того чтобы под- мноэюество Q нормированного пространства было ограничено, необходи- необходимо и достаточно, чтобы на Q был ограничен любой функционал f Е Е*. Следующая теорема часто бывает полезна для фактической про- проверки слабой сходимости той или иной последовательности. Теорема 2. Последовательность {хп} элементов нормирован- нормированного пространства Е слабо сходится к х Е Е, если: 1) ||жп|| ограничены в совокупности некоторой константой М\ 2) f(xn) —У f(x) для всякого / Е А, где А —некоторое множество, линейная оболочка которого всюду плотна в Е*. Доказательство. Из условия 2) и определения действий над линейными функционалами следует, что если ср — линейная ком- комбинация элементов из А, то <р(хп) ->> (р(х). Пусть теперь ip — произвольный элемент из Е* и {cpk} — схо- сходящаяся к ср последовательность линейных комбинаций элементов из А. Покажем, что ср(хп) —У ц>(х). Пусть М таково, что ||жп|| ^ М, п = 1,2,..., ||ж|| ^ М. Оценим разность \(р(хп) — ц>(х)\. Так как cpk —У (р, то для любого е > 0 существует такое К, что \\ip — ipk\\ < ? для всех к ^ К. Поэтому \<р(хп) - (р(х)\ ^ \<р(хп) - <Pk(xn)\ + \4>k{xn) - <Рк(х)\ + + \(рк(х) - ф)\ ^еМ + еМ + \ч>к{хп) - ч>к{х)\. Но, по условию, (рк(хп) —У ^Рк(х) при п —> оо. Следовательно, <р(хп) — <р(х) —У 0 при п —У оо для всякого ip G Е*. Примеры. Посмотрим, какой смысл имеет понятие слабой схо- сходимости в некоторых конкретных пространствах. 1. В конечномерном евклидовом пространстве W1 слабая сходи- сходимость совпадает с сильной. Действительно, пусть е±,..., еп — какой- либо ортогональный нормированный базис в Rn и {xk} — последо- последовательность в Мп, слабо сходящаяся к элементу х. Пусть х = xA)ei Н Тогда х\ } = O/ei) - х[п) =
§ 3. Слабая топология и слабая сходимость 211 т.е. последовательность {хп} покоординатно сходится к х. Но тогда г=1 т.е. {хп} сильно сходится к х. Поскольку из сильной сходимости всегда вытекает слабая, равносильность этих сходимостей в W1 до- казана. 2. Слабая сходимость в 1^. Для слабой сходимости ограничен- ограниченной последовательности {xk} к х достаточно, чтобы выполнялись условия (xk,ei)=x)*) ->a;W = (х,е{), г = 1,2,..., где е1 = A,0,0,...), е2 = @,1,0,...), ... Действительно, линейные комбинации элементов е^ всюду плотны в пространстве Ь (совпадающем, как мы видели, со своим сопря- сопряженным). Поэтому наше утверждение вытекает из теоремы 2. Таким образом, слабая сходимость ограниченной последователь- последовательности {х^ в ^2 означает, что числовая последовательность х? коор- координат этих векторов сходится для каждого i = 1,2,... Иначе говоря, слабая сходимость совпадает с покоординатной (при условии огра- ограниченности). Нетрудно видеть, что в 1^ слабая сходимость не совпа- совпадает с сильной. Действительно, покажем, что последовательность ei,..., еп,... слабо сходится в 1^ к 0. Всякий линейный функцио- функционал / в ^2 записывается как скалярное произведение /(ж) = (ж, а) вектора х Е Ь на некоторый фиксированный вектор а = (сц, аг? • • • )• Поэтому f(en) = ап, и поскольку ап —У 0 при п —У оо для всякого a G Ь, получаем lim /(en) = 0 п—>-оо для каждого линейного функционала в 1^. В то же время в сильном смысле последовательность {еп} ни к ка- какому пределу не сходится. Упражнения. 1. Пусть последовательность {хп} элементов гильбер- гильбертова пространства Н слабо сходится к элементу ж, причем \\хп\\ —»¦ ||ж|| при п —>- оо. Доказать, что в этом случае последовательность {хп} сильно сходится к ж, т. е. \\хп — х\\ —»¦ 0. 2. Доказать, что утверждение упражнения 1 сохранится, если условие \\хп\\ —>- ||ж|| заменить условием ||xn|| ^ ||ж|| для всех п или условием lim \\хп\\ ^ ||ж||. гг—)-оо 3. Пусть i7 — (сепарабельное) гильбертово пространство и Q — его ограниченное подмножество. Тогда топология в Q, индуцируемая слабой топологией пространства Н, может быть задана некоторой метрикой.
212 Гл. IV. Линейные функционалы и операторы 4. Докажите, что всякое замкнутое выпуклое подмножество гиль- гильбертова пространства замкнуто в слабой топологии (в частности, всякое замкнутое линейное подпространство гильбертова пространства слабо за- замкнуто). Приведите пример замкнутого множества в гильбертовом про- пространстве, не являющегося слабо замкнутым. 3. Слабая сходимость в пространстве С [а, Ь] непрерывных функ- функций. Пусть {xn(t)} — последовательность функций из С[а, Ь], слабо сходящаяся к функции x(t). Последовательность {xn(t)} ограниче- ограничена по норме С[а,Ь]. Среди функционалов, определенных на С[а,Ь], имеются, в частности, функционалы ^0, каждый из которых есть значение функции в некоторой фиксированной точке to (см. при- пример 4 п. 2 § 1). Для каждого такого функционала St0 условие означает, что Таким образом, если последовательность {xn(t)} слабо сходится, то она: 1) равномерно ограничена, т.е. |жп(?)| ^ С при всех п = 1,2,... и а ^ t ^ Ъ] 2) сходится в каждой точке. Можно показать, что совокупность этих двух условий не только необходима, но и достаточна для слабой сходимости последова- последовательности {xn(t)} в С[а, Ь]. Иначе говоря, слабая сходимость в С[а, Ь] совпадает с поточечной (при условии ограниченности). Ясно, что эта сходимость не совпадает со сходимостью по норме С[а, Ь], т. е. равномерной сходимостью непрерывных функций. (При- (Приведите соответствующий пример.) 3. Слабая топология и слабая сходимость в сопряженном пространстве. В п. 2 предыдущего параграфа мы ввели в сопря- сопряженном пространстве Е* топологию, названную нами сильной, при- приняв за систему окрестностей нуля совокупность множеств вида UeA = {f:\f(x)\<e, xeA}, где А — произвольное ограниченное множество в Е, а е — произ- произвольное положительное число. Если мы здесь вместо всех ограни- ограниченных множеств будем рассматривать все конечные подмно- подмножества А С Е, то мы получим так называемую слабую топологию в сопряженном пространстве Е*. Поскольку всякое конечное мно- множество А С Е ограничено (обратное, вообще говоря, не верно), ясно,
§ 3. Слабая топология и слабая сходимость 213 что слабая топология пространства Е* слабее, чем сильная тополо- топология этого пространства. Вообще говоря, эти две топологии не совпа- совпадают. Слабая топология, введенная в Е*, определяет в этом простран- пространстве некоторую сходимость, называемую слабой сходимостью функ- функционалов. Слабая сходимость линейных функционалов представля- представляет собой важное понятие, играющее существенную роль во многих вопросах функционального анализа, в частности, в теории так на- называемых обобщенных функций, о которых будет идти речь в сле- следующем параграфе. Слабая сходимость последовательности {^рп} линейных функцио- функционалов есть, очевидно, сходимость этой последовательности на каж- каждом фиксированном элементе из Е. Иными словами, последо- последовательность {tpn} называется слабо сходящейся к ip Е Е*, если для каждого х Е Е выполнено соотношение <рп(х) -> <р(х). Ясно, что и в сопряженном пространстве последовательность, схо- сходящаяся в сильной топологии, сходится и слабо (но не наоборот). Пусть Е (а следовательно, и Е*) — банахово пространство. Имеет место следующая теорема, аналогичная теореме 1. Теорема 1*. Если {/п} — слабо сходящаяся последователь- последовательность линейных функционалов на банаховом пространстве, то су- существует такое постоянное число С, что Иначе говоря, всякая слабо сходящаяся последовательность элемен- элементов пространства, сопряженного банахову пространству, ограничена по норме. Доказательство не отличается от доказательства теоремы 1. Следующая теорема вполне аналогична теореме 2. Теорема 2*. Последовательность линейных функционалов {(Рп} из Е* слабо сходится к if Е Е*, если: 1) эта последовательность ограничена, т. е. 2) соотношение (срп,х) —> (ip,x) выполнено для всех х, принад- принадлежащих некоторому множеству, линейные комбинации элементов которого всюду плотны в Е. Доказательство то же, что в теореме 2.
214 Гл. IV. Линейные функционалы и операторы Рассмотрим пример. Пусть Е есть пространство С [а, Ь] непре- непрерывных функций1) и ф)=х@), т.е. ер есть ^-функция (см. § 1, п. 2, пример 4). Пусть, далее, {<Pn(t)} — последовательность непрерывных функций, удовлетво- удовлетворяющих следующим условиям: 1) ipn(t) = 0 при |*| > 1/n, ipn(t) > 0; 2) f(pn(t)dt = l. а Тогда для любой непрерывной на [а, Ь] функции x(t) с помощью тео- теоремы о среднем получаем Ъ 1/п Г ipn(t)x(t) dt = / ipn(t)x(t) dt ->• x@) при п ->• oo. a -1/n Выражение представляет собой линейный функционал на С [а, Ь]. Таким обра- образом, ^-функцию можно представить как предел в смысле слабой сходимости линейных функционалов на С [a, b] последовательности «обычных» функций. Замечание. Пространство Е* линейных функционалов на не- некотором пространстве Е мы можем рассматривать двояко: или как пространство, сопряженное к исходному пространству Е, или же считать само Е* основным пространством и связывать с ним со- сопряженное к нему пространство Е**. В соответствии с этим мы мо- можем в Е* вводить слабую топологию двумя способами: либо как в пространстве функционалов, определяя окрестности в Е* с по- помощью всевозможных конечных наборов элементов из Е, либо как в основном пространстве, с помощью пространства Е**. В случае рефлексивного пространства это, разумеется, одно и то же. Если же Е не рефлексивно, то это — две различные топологии в Е*. Чтобы избежать возможной здесь путаницы, будем слабую тополо- топологию, определяемую в основном пространстве (т.е. топологию в ??*, определяемую с помощью Е**) называть просто слабой топологией, а слабую топологию в пространстве функционалов (т. е. топологию в i?*, определяемую с помощью Е) называть *- слабой топологией. 1)Мы считаем, что О Е [а, Ь]. Можно было бы, конечно, вместо точки t = О взять любую другую.
§ 3. Слабая топология и слабая сходимость 215 Очевидно, что *-слабая топология в Е* слабее, чем слабая тополо- топология пространства Е* (т. е. в слабой топологии не меньше открытых множеств, чем в *-слабой топологии). 4. Ограниченные множества в сопряженном простран- пространстве. В различных применениях понятия слабой сходимости линей- линейных функционалов важную роль играет следующая теорема. Теорема 3. Если Е — сепарабельное линейное нормированное пространство, то в любой ограниченной последовательности непре- непрерывных линейных функционалов на Е сдержится слабо сходящаяся подпоследовательность. Доказательство. Выберем в Е счетное всюду плотное мно- множество (xi,..., жп,...). Если {(fn} — ограниченная (по норме) по- последовательность линейных функционалов на Е, то числовая по- последовательность ограничена. Поэтому из {(рп} можно так выбрать подпоследователь- подпоследовательность A) W чтобы числовая последовательность ср[ (xi), ... , cph (^i), ... схо- сходилась. Далее, из {(рп } можно так выбрать подпоследовательность чтобы сходилась последовательность (р\ ' (#2), • • • •> фп (#2), • • • Про- Продолжая этот процесс, получим такую систему последовательностей (каждая из которых содержится в предыдущей), что {(рп } сходится в точках xi,..., Xk- Тогда, взяв «диагональ» мы получим такую подпоследовательность линейных функциона- функционалов, что ср[ ' (жп), у?2 (жп),... сходится для всех п. Но тогда (в силу теоремы 2*) последовательность ср[ (ж), ср^ (х), ... сходится и для любого х е Е.
216 Гл. IV. Линейные функционалы и операторы Эта теорема вместе с теоремой 1* означает, что в пространстве Е*, сопряженном сепарабельному банахову пространству, ограни- ограниченные подмножества, и только они, являются счетно-предкомпакт- ными в *-слабой топологии. Покажем, что на самом деле здесь имеет место предкомпактность, а не только счетная предкомпактность. Докажем прежде всего следующую теорему. Теорема 4. Пусть S* — замкнутый единичный шар простран- пространства Е*, сопряженного к сепарабельному нормированному простран- пространству Е. Топологию, индуцированную в S* * -слабой топологией про- пространства Е*, можно задать при помощи метрики ~n\(f-9>xn)\, B) где {хп} — некоторое фиксированное счетное всюду плотное мно- множество в единичном шаре S пространства Е. Доказательство. Ясно, что функция p(f,g) обладает всеми свойствами расстояния; кроме того, она инвариантна относительно сдвигов: Поэтому достаточно проверить, что система окрестностей нуля, определяемая в S* слабой топологией пространства Е*, эквивалент- эквивалентна системе окрестностей нуля, определяемой в 5* расстоянием B), т. е. что а) любой «шар» Qe = {f:p(f,0)<e} содержит пересечение 5* с некоторой слабой окрестностью нуля в Е* и что б) всякая слабая окрестность нуля в Е* содержит пе- пересечение S* с некоторым Q?. Выберем N так, что 2~N < г/2 и рассмотрим слабую окрестность нуля V = VXl_XN,?/2 = {/ : |(/,xk)\ < e/2, k = l,...,N}. Тогда, если / е S* П V, то N оо 71=1 n=N+l N ra=l n=N+l т.е. 5* П V С Qe- Тем самым утверждение а) доказано. Докажем утверждение б). Пусть U = Uyi,...,ym.s = {/ : |(
§ 3. Слабая топология и слабая сходимость 217 — некоторая *-слабая окрестность нуля в Е*. Можно считать, что \\yk\\ ^ 1? к = 1,...,т; так как множество {хп} всюду плотно в 5, то найдутся такие номера ni,...,nm, что \\ук — хПк\\ < 5/2 (к = 1,...,т). Пусть N = max(ni,... , nm) и г = 2~GV+1)E. Тогда при / Е S* П Qe из неравенств 71=1 получаем, что |(/, жп)| < 2пг; в частности, Следовательно, для всех к = 1,..., т получаем |(/,Ы1 ^ \(f,xnh)\ + \(f,yk - хПк)\ < S/2 + ||Л| ¦ \\ук - хПк\\ < 5. Таким образом, S* П Q? С U. Теорема доказана. Ясно, что этот результат автоматически распространяется на лю- любой шар, а значит, и на любое ограниченное подмножество М С Е*. Мы показали (теорема 3), что из каждой ограниченной после- последовательности в Е* можно выбрать *-слабо сходящуюся подпосле- подпоследовательность. Иначе говоря, в пространстве ??*, сопряженном се- парабельному линейному нормированному и снабженном *-слабой топологией, каждое ограниченное подмножество М счетно-предком- пактно. Но в силу последней теоремы каждое такое множество есть метризуемое топологическое пространство, а для метрических про- пространств компактность и счетная компактность совпадают. Таким образом, мы получаем следующий результат. Теорема 3*. Всякое ограниченное множество М в простран- пространстве Е*, сопряженном сепарабельному нормированному простран- пространству, предкомпактно в смысле * -слабой топологии пространства Е*. Покажем теперь, что если Е — сепарабельное линейное норми- нормированное пространство, то всякий замкнутый шар в пространстве (Е*, Ь) замкнут в *-слабой топологии пространства Е*. Так как сдвиг в пространстве Е* переводит класс замкнутых (в *-слабой топологии) множеств в себя, то достаточно доказать, что в *-слабой топологии замкнут всякий шар вида 5* = {/ : ||/|| ^ с}. Пусть /о ^ S*. По определению нормы функционала найдется та- такой вектор х G Е, что ||ж|| = 1, /о (х) = a > с. Тогда множество U = {/ : /(ж) > a ^ с} будет *-слабой окрестностью функциона- функционала /о, не содержащей ни одного элемента из шара 5*; следовательно, шар 5* замкнут в *-слабой топологии.
218 Гл. IV. Линейные функционалы и операторы Из доказанного утверждения и теоремы 3* вытекает следующая теорема. Теорема 5. Всякий замкнутый шар в пространстве, сопря- сопряженном сепарабельному нормированному пространству, компактен в * -слабой топологии. Изложенные выше результаты об ограниченных множествах в сопря- сопряженных пространствах могут быть перенесены с нормированных про- пространств на произвольные локально выпуклые. См. по этому поводу, на- например, [42]. § 4. Обобщенные функции 1. Расширение понятия функции. В различных вопросах анализа термин «функция» приходится понимать с разной степенью общности. Иногда рассматриваются непрерывные функции, в дру- других вопросах приходится предполагать, что речь идет о функциях, дифференцируемых один или несколько раз, и т.д. Однако в ряде случаев классическое понятие функции, даже трактуемое в самом широком смысле, т. е. как произвольное правило, относящее каждо- каждому значению х из области определения этой функции некоторое чи- число у = /(ж), оказывается недостаточным. Вот два важных примера. 1) Распределение масс вдоль прямой удобно задавать плотностью этого распределения. Однако если на прямой существуют точки, несущие положительную массу, то плотность такого распределения заведомо не может быть описана никакой «обычной» функцией. 2) Применяя аппарат математического анализа к тем или иным задачам, мы сталкиваемся с невыполнимостью некоторых операций, например, функцию, не имеющую производной (в некоторых точках или даже всюду), нельзя дифференцировать, если производную по- понимать как «обычную» функцию. Конечно, затруднений такого типа можно было бы избежать, ограничившись, скажем, рассмотрением одних только аналитических функций. Однако такое сужение запа- запаса допустимых функций во многих случаях весьма нежелательно. Оказывается, однако, что подобные затруднения можно преодо- преодолеть путем не сужения, а существенного расширения понятия функ- функции, вводя так называемые обобщенные функции. Основой для вве- введения соответствующих определений нам послужит понятие сопря- сопряженного пространства, рассмотренное выше. Подчеркнем еще раз, что введение обобщенных функций было вызвано вовсе не стремлением к возможно большему расширению
§ 4. Обобщенные функции 219 понятий анализа, а совершенно конкретными задачами. По суще- существу, в физике обобщенные функции использовались уже довольно давно, во всяком случае раньше, чем была построена строгая мате- математическая теория обобщенных функций. Прежде чем переходить к точным определениям, изложим основ- основную идею построения. Пусть / — фиксированная функция на прямой, интегрируемая на каждом конечном интервале, и пусть ср — непрерывная функция, обращающаяся в нуль вне некоторого конечного интервала (такие функции мы в дальнейшем будем называть финитными). Каждой такой функции ср можно с помощью фиксированной функции / со- сопоставить число ^ (/,?>)= / f{x)<p(x)dx A) — ОО (фактически, в силу финитности (р(х) интеграл берется по некото- некоторому конечному интервалу). Иначе говоря, функцию / можно рас- рассматривать как функционал (линейный, в силу основных свойств интеграла) на некотором пространстве финитных функций. Однако функционалами вида A) не исчерпываются все функционалы, кото- которые можно ввести на таком пространстве; сопоставляя, например, каждой функции ср ее значение в точке х = 0, мы получим ли- линейный функционал, не представимый в виде A). Таким образом, функции f(x) естественным образом включаются в некоторое более широкое множество — совокупность всех линейных функционалов на финитных функциях. Запас функций ср можно выбирать различным образом; например, можно было бы взять все непрерывные финитные функции. Одна- Однако, как будет ясно из дальнейшего, разумно подчинить допустимые функции ip, помимо непрерывности и финитности, еще и достаточно жестким условиям гладкости. 2. Пространство основных функций. Перейдем теперь к точ- точным определениям. Рассмотрим на прямой совокупность К всех фи- финитных функций ср, имеющих непрерывные производные всех поряд- порядков1). Функции, принадлежащие К, образуют линейное простран- пространство (с обычными операциями сложения функций и умножения их на числа). В этом пространстве нельзя ввести норму, которая отве- отвечала бы излагаемой ниже теории, однако в нем естественным спо- способом вводится понятие сходимости. 1) Интервал, вне которого функция ip равна 0, может быть различным для различных ip G К.
220 Гл. IV. Линейные функционалы и операторы Последовательность {^п} элементов из К называется сходящей- сходящейся к функции ip Е К, если: 1) существует интервал, вне которого все срп равны нулю; 2) последовательность производных2) {ср^ '} поряд- порядка/с {к = 0,1, 2,...) сходится на этом интервале равномерно к ср(к'. (Равномерность сходимости по различным к не предполагается.) Линейное пространство К с той сходимостью, которую мы в нем определили, мы будем называть основным пространством, а его элементы — основными функциями. Нетрудно описать топологию в К, которой подчиняется заданная в К сходимость. Такая топология порождается системой окрестностей нуля, каждая из которых задается конечным набором 70, • • • ,7™. непрерывных положительных функций и состоит из тех принадлежащих К функций, которые при всех х удовлетворяют неравенствам Проверка того, что этой топологии действительно подчиняется описанная выше сходимость в К, предоставляется читателю. Упражнение. Обозначим через Кш подпространство пространст- пространства К, состоящего из всех функций ср ? К, равных 0 вне отрезка [—т,т]. В пространстве Кш можно ввести структуру счетно-нормированного про- пространства, полагая |И«= sup \<pw(x)\, n = 0,1,2,... Проверьте, что топология (соответственно сходимость последовательно- последовательностей) в пространстве Кш, порождаемая этой системой норм, совпадает с топологией (соответственно сходимостью), индуцированной в Кт опи- описанной выше топологией (сходимостью) в пространстве К. Ясно, что оо К\ С • • • С Кш С ..., причем К = (J Кт- Покажите, что множе- т = 1 ство Q С К тогда и только тогда ограничено относительно введенной в К топологии, когда существует такое т, что Q является ограниченным подмножеством счетно-нормированного пространства Кт. Пусть Т — ли- линейный функционал на пространстве К; докажите, что следующие че- четыре условия равносильны: (а) функционал Т непрерывен относитель- относительно топологии пространства К] (б) функционал Т ограничен на каждом ограниченном множестве Q С К] (в) если (рп ? К и (рп —»¦ оо (в смысле введенной в К сходимости последовательностей), то Т((рп) —»¦ 0; (г) для каждого m сужение Тш функционала Т на подпространство Кш С К есть непрерывный функционал на Кш. 2) Под производной нулевого порядка понимается, как обычно, сама функция.
§ 4. Обобщенные функции 221 3. Обобщенные функции. Определение 1. Обобщенной функцией (заданной на прямой — оо < х < оо) называется непрерывный функционал Т(ср) на основ- основном пространстве К. При этом непрерывность функционала пони- понимается в том смысле, что Т(срп) —у Т(ср), если последовательность (рп сходится к ср в основном пространстве К. Заметим, прежде всего, что всякая интегрируемая на любом ко- конечном интервале функция /(ж) порождает некоторую обобщенную функцию. Действительно, выражение оо Tf(ip) = Г f(x)ip(x)dx B) — оо есть непрерывный линейный функционал на К. Такие обобщен- обобщенные функции мы в дальнейшем будем называть регулярными, а все остальные, т.е. не представимые в виде B), — сингулярными. Приведем некоторые примеры сингулярных обобщенных функ- функций. 1. «^-функция»: Это — непрерывный линейный функционал на К, т. е. по введенной выше терминологии, обобщенная функция. Этот функционал обыч- обычно записывают в виде ОО I 5(x)<p(x)dx, C) — оо понимая под 5(х) «функцию», равную нулю при всех ж/Ои обра- обращающуюся в точке х = 0 в бесконечность так, что оо I S(x)dx = l. — оо Мы рассматривали уже ^-функцию в § 1 как функционал на про- пространстве всех непрерывных функций, определенных на некотором отрезке. Однако рассмотрение ^-функции как функционала на К имеет определенные преимущества, например, позволяет ввести для нее понятие производной. 2. «Смещенная ^-функция». Пусть Этот функционал естественно записать по аналогии с обозначени- обозначением C) в виде ^ I S(x — a)ip(x) dx. D) — оо
222 Гл. IV. Линейные функционалы и операторы 3. «Производная ^-функции». Каждой ср Е К ставится в соот- соответствие число —ср'(О). Несколько ниже мы выясним, почему этот функционал естественно считать производной функционала, ука- указанного в первом примере. 4. Рассмотрим функцию 1/х. Она не интегрируема ни на каком интервале, содержащем точку нуль. Однако для каждой ср Е К ин- интеграл ^ J — ОО существует и конечен в смысле главного значения по Коши. Дейст- Действительно, -оо -R -R -R Здесь (—Rj R) — интервал, вне которого ср обращается в нуль. Пер- Первый из стоящих справа интегралов существует в обычном смысле (под знаком интеграла стоит непрерывная функция), а второй ин- интеграл равен нулю в смысле главного значения. Таким образом, 1/х определяет некоторый функционал на К, т. е. обобщенную функ- функцию. Можно доказать, что ни одна из обобщенных функций, приве- приведенных в примерах 1-4, не является регулярной (т. е. не представля- представляется в виде B) ни с какой локально интегрируемой функцией /). 4. Действия над обобщенными функциями. Для обобщен- обобщенных функций, т. е. непрерывных линейных функционалов на К, определены операции сложения и умножения на числа. При этом, очевидно, для регулярных обобщенных функций (т. е. «обычных» функций на прямой) сложение их как обобщенных функций (т. е. линейных функционалов) совпадает с обычной операцией сложения функций. То же самое относится и к умножению на числа. Введем в пространстве обобщенных функций операцию предель- предельного перехода. Мы скажем, что последовательность обобщенных функций {/п} сходится к /, если для каждого ip Е К выполнено соотношение (fn,<p) ~+ С/»- Иначе говоря, сходимость последовательности обобщенных функ- функций мы определяем как ее сходимость на каждом элементе из К. Пространство обобщенных функций с этой сходимостью будем обо- обозначать К*. Если а — бесконечно дифференцируемая функция, то естествен- естественно определить произведение а на обобщенную функцию / формулой (а/, ф) = (/, аф)
§ 4. Обобщенные функции 223 (выражение, стоящее здесь справа, имеет смысл, так как oaf Е К). Все эти операции — сложение, умножение на числа и на бесконечно дифференцируемые функции, — непрерывны. Произведение двух обобщенных функций мы не вводим. Можно показать, что определить такое произведение невозможно, если по- потребовать, чтобы эта операция была непрерывна, а для регулярных обобщенных функций совпадала бы с обычным умножением функ- функций. Определим теперь для обобщенных функций операцию диффе- дифференцирования и рассмотрим ее свойства. Пусть сначала Т — функционал на К, определяемый некоторой непрерывно дифференцируемой функцией /: оо Т(<р)= I f(x)(p(x)dx. — оо Его производной естественно назвать функционал dT/dx, опреде- определяемый формулой оо 7р(^) = / f'{x)if{x)dx. — оо Интегрируя по частям и учитывая, что каждая основная функция if обращается в нуль вне некоторого конечного интервала, имеем оо оо 4г-(<р) = Г f'(x)ip(x)dx = — Г f(x)ip'(x)dx; — оо —оо таким образом, мы получили для dT/dx выражение, в котором про- производная функции / не участвует. Эти соображения подсказы- подсказывают следующее определение. Определение 2. Производной dT/dx обобщенной функции Г называется функционал, определяемый формулой f Ы = -2W). Ясно, что функционал, определяемый этой формулой, линеен и не- непрерывен, т. е. представляет собой обобщенную функцию. Аналогич- Аналогично определяются вторая, третья и дальнейшие производные. Обозначая обобщенную функцию символом /, мы будем обозна- обозначать ее производную (понимаемую в определенном только что смы- смысле) обычным символом /'. Непосредственно из определения производной обобщенной функ- функции вытекает справедливость следующих утверждений: 1. Всякая обобщенная функция имеет производные всех порядков.
224 Гл. IV. Линейные функционалы и операторы 2. Если последовательность обобщенных функций {fn} сходится к обобщенной функции / (в смысле определения сходимости обоб- обобщенных функций), то последовательность производных {/^} сво- сводится к производной f предельной функции. То же самое верно и для производных любого порядка. Это равносильно тому, что всякий сходящийся ряд, составленный из обобщенных функций, можно дифференцировать почленно любое число раз. Рассмотрим некоторые примеры. 1. Из сказанного выше ясно, что если / — регулярная (т.е. «на- «настоящая») функция, производная которой существует и непрерывна (или кусочно-непрерывна), то производная от нее как от обобщенной функции совпадает с ее производной в обычном смысле. 2. Пусть ( 1 при х > О, ( 1 при х > О, /0*0 = < п . п E) I 0 при х ^ 0. Эта функция, называемая функцией Хевисайда, определяет линей- линейный функционал (/, Ч>) = / <р(х) dx. о В соответствии с определением производной обобщенной функции имеем ^ (/» = -(/,?>') = " f <p'(x)dx = <p{0) О (поскольку if обращается в 0 на бесконечности). Таким образом, производная функции Хевисайда E) есть ^-функция. 3. Из примеров 1 и 2 ясно, что если / — функция, имеющая в точках xi, #2,... скачки, равные /ii, /12,..., и дифференцируе- дифференцируемая (в обычном смысле) в остальных точках, то производная от нее (как от обобщенной функции) представляет собой сумму обычной производной /' (в тех точках, где она существует) и выражения ви- вида YlhiS(x - Xi). 4. Применив определение производной к ^-функции, получим, что эта производная представляет собой функционал, принимающий на каждой функции из К значение —ip'@). А это и есть тот самый функционал, который мы уже назвали «производной от ^-функции». 5. Рассмотрим ряд оо 71=1
§ 4. Обобщенные функции 225 Его суммой служит функция, имеющая период 2тг и определяемая на отрезке [—тг, тг] формулами при 0 < х ^ тг, Обобщенная производная от нее равна оо Y G) Это — некоторая обобщенная функция (применяя ее к любой фи- финитной функции (р(х), мы всегда будем получать лишь конечное число отличных от нуля слагаемых). С другой стороны, дифферен- оо цируя ряд ^2 8ШЖПЖ почленно, мы получаем расходящийся ряд 71=1 cosnx. 71=1 Однако в смысле сходимости обобщенных функций этот ряд схо- сходится (а именно, к выражению G)). Таким образом, понятие обоб- обобщенной функции позволяет приписать некоторый вполне определен- определенный смысл сумме ряда, который в обычном смысле расходится. То же самое относится и ко многим расходящимся интегралам. С этим обстоятельством приходится часто встречаться в квантовой теории поля и ряде других областей теоретической физики. Впрочем, такая ситуация возникает уже при решении элементарных задач матема- математической физики с помощью метода Фурье. Например, при решении уравнения колебаний струны ^-4г = ^2^-| возникают тригономе- тригонометрические ряды, имеющие вторые производные по х и по t только в смысле теории обобщенных функций, и значит, удовлетворяющие этому уравнению тоже только в смысле этой теории. 5. Достаточность запаса основных функций. Мы определи- определили обобщенные функции как линейные функционалы на некотором пространстве — пространстве К финитных бесконечно дифферен- дифференцируемых функций. Можно было бы основное пространство выбрать и как-либо иначе. Рассмотрим соображения, которые определили выбор К в качестве пространства основных функций. Они примени- применимы и в других случаях. Наложив на элементы из К жесткие требо- требования финитности и бесконечной дифференцируемости, мы получи- получили, во-первых, большой запас обобщенных функций (сужение основ- основного пространства приводит, очевидно, к расширению сопряженного
226 Гл. IV. Линейные функционалы и операторы пространства), а во-вторых, большую свободу в применении к обоб- обобщенным функциям основных операций анализа (предельный пере- переход, дифференцирование). Но вместе с тем пространство основных функций К является не слишком узким. В нем достаточно много элементов для того, чтобы с их помощью можно было различать непрерывные функции. Точнее говоря, пусть Д и /2 — две раз- различные непрерывные (а следовательно, и локально интегрируемые) функции на прямой. Тогда существует такая функция ср € К, что ОО ОО / f1(x)<p(x)dxjt I f2(xMx)dx. (8) — ОО —ОО Действительно, положим /(ж) = fi(x) — /2(ж). Если /(ж) ф 0, то существует такая точка жо, что /(жо) Ф 0. Тогда /(ж) сохраняет знак в некотором интервале (а,/3), содержащем точку xq. Рассмотрим функцию 1 е (/з-*)(*-°о при а < х < в. О при остальных ж; эта функция равна нулю вне (а, /3) и положительна внутри этого интервала; кроме того, она имеет производные всех порядков, так что if Е К (проверьте существование производных в точках х — а и ж = C\). При этом, очевидно, оо C j f(x)<p(x)dx= f 1(х)ф)а!хфО. — оо а Мы показали, таким образом, что пространство К достаточно для различения любых двух непрерывных функцийг). 6. Восстановление функции по производной. Дифферен- Дифференциальные уравнения в классе обобщенных функций. Диф- Дифференциальные уравнения — одна из основных областей, где при- применяется теория обобщенных функций. Именно задачи, связанные с уравнениями, в значительной мере и стимулировали развитие этой теории. В основном она применяется к уравнениям в частных про- производных, которые мы здесь не рассматриваем. Однако мы кос- коснемся здесь некоторых простейших вопросов, относящихся к реше- решению (обыкновенных) дифференциальных уравнений с обобщенными функциями. Начнем с простейшего уравнения вида У' = f(x) (/(ж) — обобщенная, или «обычная», функция), т.е. с задачи о вос- восстановлении функции по ее производной. Начнем со случая /(ж) = 0. 1) Это утверждение можно распространить и на функции, существенно более общие, чем непрерывные, но для этого нужно пользоваться понятием интегри- интегрируемости по Лебегу, о чем речь будет идти в следующей главе.
§ 4. Обобщенные функции 227 Теорема 1. Только константы служат решениями (в классе обобщенных функций) уравнения У' = 0. (9) Доказательство. Уравнение (9) означает, что (?Д (р) = (^у5 — (р') = о A0) для любой основной функции ip Е К. Рассмотрим совокупность К тех основных функций, каждая из которых может быть предста- представлена как производная какой-то основной функции. Очевидно, что КA) есть линейное подпространство К. Положим (fi(x) = —cpf(x); функция ifi пробегает К^\ когда ср пробегает К. Равенство A0) определяет функционал у на К^\ Заметим теперь, что основная функция ср принадлежит К^ в том и только том случае, если (X) I (p(x)dx = 0, A1) — оо оо т. е. К^ есть ядро функционала Г (f(x) dx. Действительно, если — оо ip(x) =ф'{х), то то / ф)с1х = ф(х)\™оо=0. A2) — оо Обратно, выражение ф(х)= / <p(t)dt A3) — оо есть бесконечно дифференцируемая функция. Если A1) выполнено, то ф(х) — финитная функция. Ее производная равна ц>(х). В соот- соответствии с результатами п. 6 § 1 гл. III любую основную функцию if G К можно представить в виде где сро — фиксированная основная функция, не принадлежащая К^1) и удовлетворяющая условию оо J (po(x)dx = 1. — оо Для этого достаточно положить оо с= Г cp(x)dx, ср±(х) = ср(х) -оро(х).
228 Гл. IV. Линейные функционалы и операторы Таким образом, если задать значение функционала у на основ- основной функции сро(х), то тем самым он будет однозначно определен на всем К. Положив (у,(ро) = су, получим ОО ОО (y,<p) = (y,<Pi)+c(y,(po) = a I (p(x)dx = I a(p(x)dx, — ОО —(X) т. е. обобщенная функция у есть постоянная а, что и требовалось доказать. Отсюда следует, что если для двух обобщенных функций fug выполнено равенство ff = gf,Tof — g = const. Рассмотрим теперь уравнение У' = f(x), A4) где f(x) — произвольная обобщенная функция. Теорема 2. Уравнение A4) при каждом f G К* имеет решение, принадлежащее К*. Это решение естественно назвать первообразной обобщенной функции /. Доказательство. Уравнение A4) означает, что (!/',?>) = (!/,-?>') = (/>?>) A5) для любой основной функции ip G К. Это равенство определяет значение функционала у на всех основных функциях ср± из К^\ Используем теперь полученное выше представление элементов из К. Положив (у,ц>о) = 0, мы доопределим тем самым функционал у на всем К: именно, — (X) Этот функционал, как легко проверить, линеен и непрерывен. Кро- Кроме того, он удовлетворяет уравнению A4). Действительно, для вся- всякого ip G К (у1, <р) = (у, V) = (/, / <р'@ #) = (/, ф).
§ 4. Обобщенные функции 229 Итак, для каждой обобщенной функции f(x) существует решение уравнения У' = f(x), т. е. каждая обобщенная функция имеет первообразную. В силу тео- теоремы 1 эта первообразная определяется функцией f(x) однозначно с точностью до постоянного слагаемого. Полученные результаты легко переносятся на системы линейных уравнений. Ограничимся здесь соответствующими формулировка- формулировками, опуская доказательства. Рассмотрим однородную систему п линейных дифференциальных уравнений с п неизвестными функциями г = 1,...,п, A6) k=i где аи* — бесконечно дифференцируемые функции. Такая система имеет некоторое количество «классических» решений (т. е. решений, представляющих собой «обычные», причем бесконечно дифферен- дифференцируемые функции). Можно показать, что никаких новых решений в классе обобщенных функций система A6) не имеет. Для неоднородной системы вида п У'г = ^2агкУк + /г, к=1 где fi — обобщенные, а а^ — «обычные» бесконечно дифференци- дифференцируемые функции, решение существует в классе обобщенных функ- функций и определяется с точностью до произвольного решения одно- однородной системы A6). Если в системе A7) не только а^, но и fi — «обычные» функции, то все решения этой системы, существующие в К*, также оказыва- оказываются обычными функциями. 7. Некоторые обобщения. Выше мы рассматривали обобщен- обобщенные функции «одного действительного переменного», т. е. обобщен- обобщенные функции на прямой. Можно, на основе тех же идей, ввести обобщенные функции на ограниченном множестве, скажем, на от- отрезке или окружности, обобщенные функции нескольких перемен- переменных, обобщенные функции комплексного аргумента и т. д. Наконец, и для обобщенных функций на прямой то определение, которое бы- было дано выше, — далеко не единственно возможное. Рассмотрим вкратце некоторые из указанных типов обобщенных функций.
230 Гл. IV. Линейные функционалы и операторы а) Функции нескольких переменных. Рассмотрим в n-мерном про- пространстве совокупность Кп функций ip(xi,... ,хп), имеющих част- частные производные всех порядков по всем аргументам, и таких, что каждая из этих функций равна нулю вне некоторого параллелепи- параллелепипеда di^Xi ^bi, г = 1,.. . ,п. Совокупность Кп представляет собой линейное пространство (с обычными операциями сложения функций и умножения их на числа), в котором можно ввести сходимость следующим обра- образом: ifk —> ц>, если существует такой параллелепипед а^ ^ х\ ^ hi (г — 1,...,п), вне которого каждая из функций ср^ равна нулю, а в этом параллелепипеде имеет место равномерная сходимость: ^^ ^^ \^ для каждого фиксированного набора целых неотрицательных чисел Обобщенной функцией п переменных называется любой непре- непрерывный линейный функционал на Кп. Всякая «обычная» функция п переменных /(ж), интегрируемая в любой ограниченной области n-мерного пространства, есть в то же время и обобщенная функция. Значения отвечающего ей функционала определяются формулой ip(x)dx, х = (xi,... ,жп), dx = dx\ ... dxn. Как и в случае п = 1 различные непрерывные функции определя- определяют различные функционалы (т. е. представляют собой различные обобщенные функции). Для обобщенных функций п переменных понятия предельного перехода, производной и т.д. вводятся с помощью тех же методов, что и в случае одного переменного. Например, частные производные обобщенной функции вводятся формулой Отсюда видно, что каждая обобщенная функция п переменных име- имеет частные производные всех порядков. б) Комплексные обобщенные функции. Возьмем теперь в каче- качестве основных функций бесконечно дифференцируемые финитные функции на прямой, принимающие комплексные значения. Линей- Линейные функционалы на пространстве К таких функций естественно назвать комплексными обобщенными функциями. Напомним, что
§ 4. Обобщенные функции 231 в комплексном линейном пространстве существуют линейные и со- сопряженно-линейные функционалы. Первые удовлетворяют условию (а — число) (/, аср) = а(/, (р), а вторые — условию (/, аср) = а(/, <р). Если /(ж) — обычная комплекснозначная функция на прямой, то ей можно сопоставить линейный функционал на К двумя спосо- способами: оо (/j<p)i = / f(x)(p(x)dx, A8i) — оо оо С/»2= / f(x)<p(x)dx. A82) — ОО Этой же функции /(ж) можно сопоставить два сопряженно-линей- сопряженно-линейных функционала, а именно: — (X) ОО da;, (I83) 2 (/,?>) = / f(x)<p(x)dx. (I84) — (X) Выбор одной из этих четырех возможностей означает определенный способ вложения пространства «обычных» функций в пространство обобщенных функций. Операция над комплексными обобщенными функциями определяется аналогично тому, как это было описано выше для действительных функций. в) Обобщенные функции на окружности. Иногда полезно рас- рассматривать обобщенные функции, заданные на некотором ограни- ограниченном множестве. В качестве простейшего примера рассмотрим функции на окружности. За пространство основных функций при- примем совокупность всех бесконечно дифференцируемых функций на окружности, определив для них операции сложения и умножения на числа обычным образом. Последовательность функций {(рп(х)} в этом пространстве мы назовем сходящейся, если для каждого к = 0,1,2,... последовательность производных {(р^(х)} сходится на всей окружности равномерно. Поскольку здесь все множество ар- аргументов (окружность) ограничено, условие финитности основных функций автоматически отпадает. Линейные функционалы на этом пространстве мы назовем обобщенными функциями на окружности. Всякую обычную функцию на окружности можно рассматривать как периодическую функцию, заданную на всей прямой. Перено- Перенося это соображение на обобщенные функции, можно связать обоб- обобщенные функции на окружности с периодическими обобщенными
232 Гл. IV. Линейные функционалы и операторы функциями. При этом периодической обобщенной функцией (с пе- периодом а) естественно называть функционал /, удовлетворяющий условию для всякой основной функции ср. Примером периодической обобщен- обобщенной функции может служить функция оо оо 2_. cosnx = — i + тг 2^ $(х — 2ктг), п=1 к=-оо которая уже упоминалась выше. г) Другие основные пространства. Мы определили выше обоб- обобщенные функции на прямой как линейные функционалы на про- пространстве К бесконечно дифференцируемых финитных функций. Однако такой выбор основного пространства — не единственно воз- возможный. Например, вместо пространства финитных функций К можно было бы взять более широкое пространство всех бесконечно дифференцируемых функций (р(х) на прямой, убывающих вместе со своими производными быстрее, чем любая степень 1/\х\. Точнее говоря, будем считать, что (р(х) принадлежит основному простран- пространству, которое мы обозначим Sqq, если для любых фиксированных р, q = 0,1, 2,... существует такая постоянная Cpq (зависящая от р, q и ср), что \xp^q)(x)\<Cpq, -оо<ж<оо. A9) Сходимость в 5оо определяется таким образом: последовательность {(рп(х)} называется сходящейся к (р(х), если для каждого д=0,1,... последовательность {срп (х)} сходится равномерно на любом конеч- конечном интервале и если в неравенствах \Х ifn уХ)\ << Lypq постоянные Cpq можно выбрать не зависящими от п. При этом получается запас обобщенных функций несколько бо- более узкий, чем в случае пространства К. Например, функция f{x) = е*2 есть непрерывный линейный функционал на К, но не на S^. Вы- Выбор 5оо в качестве основного пространства удобен, например, при рассмотрении преобразования Фурье обобщенных функций. Вообще, как показало развитие теории обобщенных функций, нет необходимости связывать себя раз и навсегда каким-то определен- определенным выбором основного пространства, а целесообразно варьировать его в зависимости от рассматриваемого круга задач. При этом, одна- однако, существенное требование состоит в том, чтобы, с одной стороны,
§ 5. Линейные операторы 233 основных функций было «достаточно много» (чтобы с их помощью можно было различать «обычные» функции, а точнее, регулярные функционалы), а с другой, — чтобы эти основные функции облада- обладали достаточной гладкостью. Упражнение. Проверьте, что в пространстве Soo можно ввести структуру счетно-нормированного пространства, положив, например, p+q=n -оо<ж<оо и что последовательность, сходящаяся в Soo в определенном выше смы- смысле, сходится и в топологии, определяемой этими нормами. § 5. Линейные операторы 1. Определение и примеры линейных операторов. Пусть Е и Е\ — два линейных топологических пространства. Линейным оператором, действующим из Е в Е±, называется отображение у = Ах, хеЕ, уеЕи удовлетворяющее условию + (ЗАх2- Совокупность Da всех тех х Е Е, для которых отображение А опре- определено, называется областью определения оператора А; вообще го- говоря, не предполагается, что Da = Е, однако мы всегда будем счи- считать, что Da есть линейное многообразие, т.е. если ж, у G Da-, to ах + /Зу G Da при всех а, C. Оператор А называется непрерывным в точке хо G Da, если для любой окрестности V точки уо = Ахо существует такая окрестность U точки жо, что Ах G У, как только х G U П Da- Оператор А назы- называется непрерывным, если он непрерывен в каждой точке х G Da- Когда Е и Ei — нормированные пространства, это определение равносильно следующему: оператор А называется непрерывным, если для любого г > 0 существует такое S > 0, что из неравенства ||ж'-ж"|| <6, ж', х" е DA следует \\Ах' -Ах"\\ <е.
234 Гл. IV. Линейные функционалы и операторы Множество тех х Е Е, для которых Ах = 0, называется ядром ли- линейного оператора А и обозначается Кег А. Множество тех у Е Ei, для которых у = Ах при некотором х Е Da, называется образом линейного оператора А и обозначается Im А. Как ядро, так и образ линейного оператора, являются линейными многообразиями. Если оператор непрерывен и Da = Е, то Кег А является подпростран- подпространством, т. е. замкнут. Что же касается образа непрерывного линей- линейного оператора, то он не обязательно будет подпространством в Е\, даже если Da — Е. Понятие линейного функционала, введенное в начале этой гла- главы, есть частный случай линейного оператора. Именно, линейный функционал — это линейный оператор, переводящий данное про- пространство Е в числовую прямую Ж. Определения линейности и не- непрерывности оператора переходят при Е\ = Ж в соответствующие определения, введенные ранее для функционалов. Точно так же и ряд дальнейших понятий и фактов, излагаемых ниже для линейных операторов, представляет собой довольно ав- автоматическое обобщение результатов, уже изложенных в § 1 этой главы применительно к линейным функционалам. Примеры линейных операторов. 1. Пусть Е — линей- линейное топологическое пространство. Положим 1х = х для всех х Е Е. Такой оператор, переводящий каждый элемент пространства в се- себя, называется единичным оператором. 2. Пусть Е и Ei — произвольные линейные топологические про- пространства и пусть Ох = 0 для всех х Е Е (здесь 0 — нулевой элемент пространства Ei). Тогда О называется нулевым оператором. 3. Общий вид линейного оператора, переводящего конечномер- конечномерное пространство в конечномерное. Пусть А — линейный опера- оператор, отображающий n-мерное пространство W1 с базисом ei, ... , еп в ш-мерное пространство Мт с базисом Д, ... , /т. Если х — про- произвольный вектор из Жп, то п х = y^Xjej, г=1 и в силу линейности оператора А п Ах = y^XjAej. г=1
§ 5. Линейные операторы 235 Таким образом, оператор А задан, если известно, во что он пере- переводит базисные векторы ei,... ,еп. Рассмотрим разложения векто- векторов Aei по базису Д,..., /ш. Имеем k=l Отсюда ясно, что оператор А определяется матрицей коэффициен- коэффициентов ||а/^||. Образ пространства^71 в W71 представляет собой линейное подпространство, размерность которого равна, очевидно, рангу мат- матрицы ||а/^||, т.е. во всяком случае не превосходит п. Отметим, что всякий линейный оператор, заданный в конечномерном простран- пространстве, автоматически непрерывен. 4. Рассмотрим гильбертово пространство Н и в нем некоторое подпространство Hi. Разложив Н в прямую сумму подпространства Hi и его ортогонального дополнения, т. е. представив каждый эле- элемент h Е Н в виде h = h1+h2, he Hi, h2±H1, положим Ph = hi. Этот оператор Р естественно назвать оператором ортогонального проектирования, или ортопроектором Н на Hi. Линейность и непрерывность проверяются без труда. 5. Рассмотрим в пространстве непрерывных функций на отрезке [а, Ь] оператор, определяемый формулой ф(з) = fK(s,t)<p(t)dt, A) а где K(s,t) — некоторая фиксированная непрерывная функция двух переменных. Функция i/j(s) непрерывна для любой непрерывной функции cp(t), так что оператор A) действительно переводит про- пространство непрерывных функций в себя. Его линейность очевидна. Для того чтобы говорить о его непрерывности, необходимо пред- предварительно указать, какая топология рассматривается в нашем пространстве непрерывных функций. Читателю предлагается до- доказать непрерывность оператора в случаях, когда: а) рассматрива- рассматривается пространство С [а, Ь], т.е. пространство непрерывных функций с нормой \\ip\\ = max|(^(t)|; б) когда рассматривается С2[а, Ь], т.е. ОЬ ч 1/2 V(t)dt) ¦ а 6. В том же пространстве непрерывных функций рассмотрим опе- оператор /() = <po(t)<p(t),
236 Гл. IV. Линейные функционалы и операторы где (fo(i) — фиксированная непрерывная функция. Линейность это- этого оператора очевидна. (Докажите его непрерывность при нормиров- нормировках, указанных в предыдущем примере.) 7. Один из важнейших для анализа примеров линейных операто- операторов — это оператор дифференцирования. Его можно рассматривать в различных пространствах. а) Рассмотрим пространство непрерывных функций С [а, Ь] и опе- оператор Df(t) = /'(*), действующий в нем. Этот оператор (который мы считаем действую- действующим из С [а, Ь] опять-таки в С [а, Ь]) определен, очевидно, не на всем пространстве непрерывных функций, а лишь на линейном много- многообразии функций, имеющих непрерывную производную. Оператор D линеен, но не непрерывен. Это видно, например, из того, что после- последовательность /f\ _ sm nt ФпКЧ - п сходится к 0 (в метрике С [а, 6]), а последовательность D(pn(t) = cosnt не сходится. б) Оператор дифференцирования можно рассматривать как опе- оператор, действующий из пространства С1 непрерывно дифференци- дифференцируемых функций на [а, Ь] с нормой ||<p||i = max\ip(t)\ +max|(//(?)| в пространство С [а, Ь]. В этом случае оператор D линеен и непреры- непрерывен и отображает всё С1 на всё С[а, Ь]. в) Рассмотрение оператора дифференцирования как оператора, действующего из С1 в С[а,Ь], не вполне удобно, так как хотя при этом мы и получаем непрерывный оператор, определенный на всем пространстве, но не к любой функции из С1 можно применить этот оператор дважды. Удобнее рассматривать оператор дифференциро- дифференцирования в еще более узком пространстве, чем С1, а именно, в про- пространстве С°° бесконечно дифференцируемых функций на отрезке [а, 6], в котором топология задается счетной системой норм Оператор дифференцирования переводит все это пространство в се- себя, и, как легко проверить, непрерывен на нем. г) Бесконечно дифференцируемые функции составляют весьма узкий класс. Возможность рассматривать оператор дифференциро- дифференцирования в существенно более широком пространстве и вместе
§ 5. Линейные операторы 237 с тем как непрерывный оператор дают обобщенные функ- функции. В предыдущем параграфе мы уже говорили о том, как опре- определяется дифференцирование обобщенных функций. Из сказанного там ясно, что дифференцирование есть линейный оператор в про- пространстве обобщенных функций, притом непрерывный в том смы- смысле, что из сходимости последовательности обобщенных функций ifn(t)} к /(?) следует сходимость последовательности их производ- производных к производной обобщенной функции /(?). 2. Непрерывность и ограниченность. Линейный оператор, действующий из Е в Ei, называется ограниченным, если он опре- определен на всем Е и каждое ограниченное множество переводит сно- снова в ограниченное. Между ограниченностью и непрерывностью ли- линейного оператора существует тесная связь, а именно, справедливы следующие утверждения. I. Всякий непрерывный линейный оператор ограничен. Действительно, пусть М С Е — ограниченное множество, а мно- множество AM С Ei не ограничено. Тогда в Ei найдется такая окрест- окрестность нуля У, что ни одно из множеств л AM не содержится в V. Но тогда существует такая последовательность хп Е М, что ни один из элементов ^Ахп не принадлежит У, и мы получаем1), что \%п —У 0 в Е, но последовательность I ^Ахп > не сходится к 0 в Ei\ это противоречит непрерывности оператора А. П. Если А — ограниченный линейный оператор, действующий из Е в Ei, и в пространстве Е выполнена первая аксиома счетно- счетности, то оператор А непрерывен. Действительно, если А не непрерывен, то найдется такая окрест- окрестность нуля V в Ei и такая определяющая система {Un} окрестно- окрестностей нуля в Е, что C/n+i С С/л и для каждого п существует такое хп G ^С/п, что Ахп ? nV. Последовательность хп в Е ограничена (и даже стремится к 0), а последовательность Ахп не ограничена в Ei (поскольку она не содержится ни в одном из множеств nV). Итак, если оператор А не непрерывен, а в Е имеет место первая аксиома счетности, то А и не ограничен. Наше утверждение доказано. Итак, для оператора, заданного на пространстве с первой ак- аксиомой счетности (к которым, в частности, относятся все норми- нормированные и счетно-нормированные пространства), ограниченность равносильна непрерывности. 1)См. упражнение 1 в п. 1 § 5 гл. III.
238 Гл. IV. Линейные функционалы и операторы Все операторы, приведенные в примерах 1—6 в предыдущем пунк- пункте, непрерывны. В силу только что доказанного утверждения I все перечисленные там операторы ограничены. Если Е и Е\ — нормированные пространства, то условие ограни- ограниченности оператора А, действующего из Е в Ei, можно сформулиро- сформулировать так: оператор А называется ограниченным, если он переводит всякий шар в ограниченное множество. В силу линейности А это условие можно сформулировать так: оператор А ограничен, если существует такая постоянная С, что для всякого / Е Е \\Af\\^C\\f\\. Наименьшее из чисел С, удовлетворяющих этому неравенству, на- называется нормой оператора А и обозначается Теорема 1. Для любого ограниченного оператора А, действу- действующего из нормированного пространства в нормированное, = sup ||Ar||=supHM. B) \\x\\<:i x^o \\XW Доказательство. Введем обозначение a = sup ||Аж||.Всилу линейности А справедливо равенство м л м \\Ax\\ a= sup \\Ax\\ =sup\-f. \\х\\^1 хфО ПХП Поэтому для любого элемента х \\Ах\\/\\х\\^а, т.е. \\Ax\\ ^а\\х\\, откуда следует, что Далее, для любого е > 0 существует такой элемент х? ф 0, что или Поэтому а - г ^ inf С = и, в силу произвольности е, а ^ \\A\\. Следовательно, ||А|| = а
§ 5. Линейные операторы 239 3. Сумма и произведение операторов. Определение 1. Пусть Аи В — два линейных оператора, дей- действующих из линейного пространства Е в пространство Е\. Назовем их суммой А + В оператор С, ставящий в соответствие элементу х Е Е элемент у = Ах + Вх е Ех. Он определен на всех элементах, принадлежащих пересечению Da П Db областей определения операторов А и В. Легко проверить, что С = А + В — линейный оператор, непре- непрерывный, если А и В непрерывны. Если Е и Ei — нормированные пространства, а операторы А и В ограничены, то А + В тоже ограничен, причем \\А + в\\<:\\А\\ + \\в\\. C) Действительно, для всякого х \\(А + В)х\\ = \\Ах + Вх\\ 4: \\Ax\\ + \\Bx\\ 4 (\\A\\ + \\В\\)\\х\\, откуда и следует C). Определение 2. Пусть Аи В — линейные операторы, причем А действует из пространства Е в Ei, а В действует из Ei в Е<±. Про- Произведением В А операторов Аи В называется оператор С, ставящий в соответствие элементу х G Е элемент z = В {Ах) из Е^. Область определения Dc оператора С = В А состоит из тех х G Da, для которых Ах G Db- Ясно, что оператор В А линеен. Он непрерывен, если А и В непрерывны. Упражнение. Доказать, что Dc — линейное многообразие, если Da и Db линейные многообразия. Если А и В — ограниченные операторы, действующие в норми- нормированных пространствах, то и оператор В А ограничен, причем \\ВА\\<:\\В\\-\\А\\. D) Действительно, \\В(Ах)\\^\\В\\-\\Ах\\^\\В\\-\\А\\-\\х\\, E) откуда следует D). Сумма и произведение трех и более операторов определяются по- последовательно. Обе эти операции ассоциативны. Произведение к А оператора А на число к определяется как опе- оператор, который элементу х ставит в соответствие элемент к Ах.
240 Гл. IV. Линейные функционалы и операторы Совокупность С(Е,Е\) всех непрерывных линейных операторов, определенных на всем Е и отображающих Е в Е\ (где Е и Е\ — фиксированные линейные топологические пространства), образует, по отношению к введенным выше операциям сложения и умножения на числа, линейное пространство. Если Е и Е\ — нормированные пространства, то С[Е,Е\) — нормированное пространство (с тем определением нормы оператора, которое было дано выше). Упражнение. Пусть Е — нормированное, а Е\ — полное норми- нормированное пространства. Тогда: а) нормированное пространство С(Е,Е\) оо оо полно; б) если Ak G C(E,Ei) и ^ ||^fc|| < оо, то ряд ^ Ак сходится к k=i k=i некоторому оператору А ? C(E,Ei) и -It- к=1 4. Обратный оператор, обратимость. Пусть А — оператор, действующий из Е в Е±, и Da — область определения, a lm A — образ этого оператора. Определение 3. Оператор А называется обратимым, если для любого у Е Im А уравнение Ах = у имеет единственное решение. Если А обратим, то каждому у G ImA можно поставить в со- соответствие единственный элемент х G Dа-, являющийся решением уравнения Ах = у. Оператор, осуществляющий это соответствие, называется обратным к А и обозначается А~х. Теорема 2. Оператор А~х, обратный линейному оператору А, также линеен. Доказательство. Заметим прежде всего, что образ Im А опе- оператора А, т. е. Dа-1 , есть линейное многообразие. Пусть у\, у^&т А. Достаточно проверить выполнение равенства А~1(а1у1 + а2у2) = а^А^ух + а2А~ху2. G) Пусть Ах\ = у\ и Ах^ — ?/2- В силу линейности А имеем A{ol\X\ + а2х2) = оцу\ + а2у2- (8) По определению обратного оператора,
§ 5. Линейные операторы 241 откуда, умножая эти равенства на а± и а2 соответственно и скла- складывая, получим а\А~хух + а2А~ху2 = а\Х\ + а2х2. С другой стороны, из (8) и из определения обратного оператора следует, что а2х2 = А~1(а1у1 + а2у2), что вместе с предыдущим равенством дает А~1(а1у1 + а2у2) = aiA~V + a2A~1y2. Теорема 3 (теорема Банаха об обратном операторе). Пусть А — линейный ограниченный опреатор, взаимно однознач- однозначно отображающий банахово пространство Е на банахово простран- пространство Е\. Тогда обратный оператор А~х ограничен. Для доказательства нужна следующая лемма. Лемма. Пусть М — всюду плотное множество в банаховом про- пространстве Е. Тогда любой ненулевой элемент у Е Е можно разло- разложить в ряд У = У\ Н Ь уп + • • •, гдеук еМ и\\ук\\ * Доказательство. Элементы ук будем строить последователь- последовательно: у\ выберем так, чтобы Это возможно, так как неравенство (9) определяет сферу радиуса ||2/||/2 с центром в точке у, внутри которой должен найтись эле- элемент из М (М всюду плотно в Е). Выберем у2 Е М так, чтобы \\У ~У\- 2/2II ^ IMI/4, Уз — так, чтобы \\у - у1 - у2 - у3\\ ^ \\у\\/8 и вообще уп выберем так, чтобы \\у — у\ — • • • — уп\\ ^ ||^/||/2п. Такой выбор всегда возможен, так как М всюду плотно в Е. В силу выбора элементов ук 71 \\У — / ;Ук\\ ~^ О ПРИ п ~^ °°5 к=1 оо т.е. ряд ^2 yk сходится к у. Оценим нормы элементов ук\ к=1 Ы\ = Иг/1 - у + 2/IK Иг/i - г/|| + \\v\\ ^ з\\у\\/2, \Ы\ = Иг/2 + г/1 - у + у - г/1 IK Иг/ - ух - г/2|| + \\у - г/ilK ЧуШ-
242 Гл. IV. Линейные функционалы и операторы Наконец, \\Уп\\ =\\Уп + Уп-1 Н \-У1~У + у-У1 Уп-iW ^ ^\\У -У1 Уп\\ + ||2/ - 2/1 2/n-i|| ^ 3|М|/2П. Лемма доказана. Доказательство теоремы 3. В пространстве Е\ рассмо- рассмотрим множество Mk — совокупность тех ?/, для которых выполня- выполняется неравенство 11 ^4. х 2/11 ^ Щу\\ • Всякий элемент пространства Е\ оо попадает в некоторое Мк, т.е. Е\ — \] Мк. По теореме Бэра (те- к=1 орема 2 из п. 3 § 3 гл. II), хотя бы одно из множеств М/,, скажем, Мп, плотно в некотором шаре В. Внутри шара В выберем шаровой слой Р с центром в точке из Мп; слой Р — это совокупность то- точек z, для которых справедливо неравенство C < \\z — уо\\ < а, где О < /3 < а, у0 G Мп. Перенеся слой Р так, чтобы его центр попал в начало координат, получим шаровой слой Pq = {z : 0 < C < \\z\\ < а}. Покажем, что в Pq плотно некоторое множество Мдг. Пусть z е Р П Мп; тогда z - уо ? Pq и \\A~\z - yo)!! ^ \\А-гг\\ + WA^yoW < n(\\z\\ + \\уо\\) ^ n(\\z - j/оЦ + 2\\уо\\) = n\\z - уо\\ ( ^Г^) A0) Величина n(l + 2||^о||//^) не зависит от z. Положим1) N = l + n[l + 2\\yo\\/P}. Тогда в силу A0) z — yo€ Мдг, а из того, что Мп плотно в Р, следует, ЧТО Мдг ПЛОТНО В Д)- Рассмотрим произвольный ненулевой элемент у из Е\. Всегда можно подобрать Л так, чтобы было C < \\Xy\\ < а, т. е. Ху G Ро- Так как Мдг плотно в Pq5 можно построить последовательность ук G Мдг, сходящуюся к Ху. Тогда последовательность -гук сходится к у. Оче- Очевидно, что если yk G Мдг, то и \ук G Мдг при любом действительном Л Л ф 0; таким образом, Мдг плотно в Е\ / {0}, а потому и в Ei. Рассмотрим ненулевой элемент у G Е\\ по доказанной лемме его можно разложить в ряд по элементам из Мдг: У = У\ + • • • + У к + • • •, причем |Ы| <3\\у\\/2к. 1) Скобки [ ] означают целую часть числа.
§ 5. Линейные операторы 243 Рассмотрим в пространстве Е ряд, составленный из прообразов элементов ?//,, т.е. элементов Xk = А~1у\1. Этот ряд сходится к некоторому элементу ж, так как имеет место неравенство 11**11 = P~VIK ЩУк\\ < ft при этом ^ оо оо ink E ii^i ^ ЗЛ%|| Е к=1 к=1 оо В силу сходимости ряда ^2 хп и непрерывности оператора А п=1 можно применить А почленно к этому ряду. Получим Ах = Ахх + Ах2 Л = 2/1+2/2 4 = У, откуда х = А~ху. Кроме того, и так как оценка верна для любого у ф 0, то оператор А~х ограни- ограничен. Приведем некоторые важные следствия этой теоремы. Прежде всего дадим ее естественное обобщение на случай, когда отображе- отображение А не взаимно однозначно. Следствие 1 (теорема об открытом отображении). Линейное непрерывное отображение А банахова пространства Е на (все) ба- банахово пространство Е\ открыто. Это вытекает из доказанной теоремы и следующей леммы. Лемма. Пусть Е — банахово пространство и L — некоторое его замкнутое подпространство. Отображение В пространства Е на фактор-пространство E/L, ставящее в соответствие каждому х G Е класс смежности, содержащий х, открыто. Действительно, пусть Z = E/L, a G — открытое множество в Е и Г = BG. Пусть zq Е Г. Тогда найдется элемент жо, принадлежащий B~xzq П G. Пусть теперь U{xq) — ^-окрестность точки хо, целиком лежащая в G, и пусть z — произвольный элемент ^-окрестности точ- точки zo Е Г, т.е. ||2 — zo\\ < e. В соответствии с определением нормы в фактор-пространстве это означает существование такого элемента х Е B~xz, что ||ж —жо|| < ?, т. е. х Е U(x0) С G. Но тогда z E BG = Г, т. е. ^-окрестность точки z$ содержится в Г. Следовательно, Г откры- открыто. Лемма доказана.
244 Гл. IV. Линейные функционалы и операторы Представив отображение А пространства Е на Е\ как суперпо- суперпозицию отображения В пространства Е на Е/ Ker A = Z (открытого в силу леммы) и взаимно однозначного отображения С простран- пространства Z на Ei (открытого в силу теоремы 3), получаем, что А откры- открыто. Следствие 2 (лемма о тройке ). Пусть Е, Е\, Е2 — банаховы пространства и А, В — непрерывные линейные операторы из Е в Е\ и из Е в Е2 соответственно, причем В отображает Е на все Е2 (т. е. ЪиВ = Е2). Если при этом КетАэКетВ, A1) то существует такой непрерывный линейный оператор С', отобра- отображающий Е2 в Ei, что А = СВ. Символически это удобно изобразить такой схемой: КегБ У Е В ) Е2 П || КегА > Е Действительно, рассмотрим для каждого элемента z Е Е2 его полный прообраз В~^z Е Е. Из условия A1) следует, что все элемен- элементы ж, принадлежащие B~1z, переводятся оператором А в один и тот же элемент у. Этот элемент у мы и поставим в соответствие элемен- элементу z. Полученный оператор С отображает Е2 в Е\ и, очевидно, лине- линеен. Он непрерывен (а следовательно, и ограничен). Действительно, если G — открытое множество в Е\, то его полный прообраз C-1G при отображении С может быть записан как B(A~1G). Но A~XG открыто в силу непрерывности оператора А, а тогда и B(A~1G) от- открыто в силу следствия 1. Упражнения. 1. Пусть Е, Е\ — нормированные пространства; ли- линейный оператор А, действующий из Е в Ei, с областью определения Da С Е, представляющей собой линейное многообразие, называется замкнутым, если из условий xn E Da, xn —»¦ ж, Ахп —»¦ у следует, что х Е Da и Ах = у. Проверьте, что всякий ограниченный оператор замкнут. 2. Рассмотрим прямое произведение Е х Е\ пространств Е и Ei, т. е. линейное нормированное пространство, состоящее из всевозможных пар [х,у], х е Е, у е Еи с нормой || [ж, у] \\ = \\x\\ + \\y\U (|| • || и || • ||i — нормы в Е, Ei соответственно). Оператору А можно сопоставить множе- множество Ga = {[ж, г/], ж Е Da, у = Ах} С Е х Ei, называемое его графиком. Проверьте, что Ga — линейное многообразие в Е х Ei, замкнутое тогда и только тогда, когда оператор А замкнут. Докажите, что если Е, Е\ — банаховы пространства, а оператор А определен на всем Е и замкнут, то он ограничен (теорема Банаха о замкнутом графике).
§ 5. Линейные операторы 245 Указание. Примените теорему 3 к оператору Р: [ж, Ах] —»¦ ж, действую- действующему из Ga в Е. 3. Пусть Е и Ei — полные счетно-нормированные пространства. До- Докажите, что если А — непрерывный линейный оператор, взаимно одно- однозначно отображающий Е на Ei, то обратный оператор А~х непрерывен. Сформулируйте и докажите теорему о замкнутом графике для счетно- нормированных пространств. Рассмотрим множество С(Е,Е\) ограниченных линейных опера- операторов А, отображающих банахово пространство Е в банахово про- пространство Е\. Это — банахово пространство. Выделим в нем множе- множество QC(E,Ei) операторов, отображающих Е на все Е\ и имеющих ограниченный обратный. Это множество открыто в C(E,Ei). Имен- Именно, справедлива следующая теорема. Теорема 4. Пусть Aq?Q?(E, Е\) и пусть А А — произвольный оператор из С(Е,Е1) такой, что \\AA\\ < 1 /11^4.^"х11- Тогда оператор (Ао + ДА) существует и ограничен, т. е. А = Ао + А А е QC{E, E\). Доказательство. Фиксируем произвольный элемент у G Е\ и рассмотрим отображение В пространства Е в себя, определяемое формулой Вх = А~1у- А^ААх. Из условия ЦД-АЦ < Щ^!! следует, что отображение В сжимаю- сжимающее. Так как Е полно, то существует единственная неподвижная точка х отображения В: х = Вх = А^у - AqX откуда Ах = Aqx + ААх = у. Если Ах' = у, то х' — тоже неподвижная точка отображения В, так что х' = х. Таким образом, для всякого у G Е\ уравнение Ах — у имеет в Е единственное решение, т. е. оператор А обладает обрат- обратным А, определенным на всем Е\. По теореме 3 оператор А~х ограничен, что и требовалось доказать. Теорема 5. Пусть Е — банахово пространство, I — тожде- тождественный оператор в Е, а А — такой ограниченный линейный опера- оператор, отображающийЕ в себя, что \\A\\ < 1. Тогда оператор (I- А)~1 существует, ограничен и представляется в виде оо (I-A)-l=Y,Ak- A2) k=0
246 Гл. IV. Линейные функционалы и операторы Доказательство. Существование и ограниченность операто- оператора (/ — А)~г вытекает из теоремы 4 (впрочем, это следует также и из приводимого ниже рассуждения). оо оо Так как \\A\\ < 1, то ? \\Ак\\ ^ ? \\А\\к < оо. Пространство Е к=0 к=0 оо полно, поэтому из сходимости ряда ^2 \\Ак\\ вытекает, что сумма k=0 оо ряда ^2 Ак представляет собой ограниченный линейный оператор. к=0 Для любого п имеем п п k(T ~ Л) =1 ~An+1; к=0 к=0 переходя к пределу при п —У оо и учитывая, что ||An+1|| ^ ||A||n+1 —У —У 0, получаем оо оо (I - A)Y,Ak = ^Aft(i¦--А) = I, к=0 к=0 откуда ^ к=0 что и требовалось доказать. Упражнение. Пусть А — ограниченный линейный оператор, ото- отображающий банахово пространство Е на банахово пространство Е\. До- Докажите, что существует такая постоянная а > 0, что если В ? С(Е,Е\) ж \\А — В\\ < а, то В отображает Е на все Е\ (Банах). 5. Сопряженные операторы. Рассмотрим непрерывный ли- линейный оператор у = Ах, отображающий линейное топологическое пространство Е в такое же пространство Е\. Пусть д — линейный функционал, определенный на Ei, т.е. д G Е*. Применим функ- функционал д к элементу у = Ах; как легко проверить, д(Ах) есть не- непрерывный линейный функционал, определенный на Е; обозначим его /. Функционал / есть, таким образом, элемент пространства Е*. Каждому функционалу д G Е* мы поставили в соответствие функ- функционал / G Е*, т.е. получили некоторый оператор, отображающий Е* в Е*. Этот оператор называется сопряженным к оператору А и обозначается А*. Обозначив значение функционала / на элементе х символом (/,ж), получим, что (д,Ах) = (/,ж), или (д,Ах) = (А*д,х). Это соотношение можно принять за определение сопряженного оператора.
§ 5. Линейные операторы 247 Пример. Сопряженный оператор в конечномерном простран- пространстве. Пусть действительное n-мерное пространство W1 отобража- отображается в пространство W71 (m-мерное) оператором А и пусть ||а^|| — матрица этого оператора. Отображение у = Ах можно записать в виде системы равенств п а функционал f(x) — в виде /(*) = Е/л- Из равенства /О) = д(Ах) = получим, что fj = ^2 giCtij. Так как / = A*g, отсюда следует, что г=1 оператор А* задается матрицей, транспонированной по отношению к матрице оператора А. Следующие свойства сопряженных операторов вытекают сразу из определения. 1. Оператор А* линеен. 2. (А + ВУ = А* +В*. 3. Если к — число, то (кА)* = кА*. Если А — непрерывный оператор из Е в Е\, то А* есть непрерыв- непрерывный оператор из (Е*,Ь) в (Е*,Ь) (проверьте это!). Если Е и Е\ — банаховы пространства, то это утверждение может быть уточнено следующим образом: Теорема 6. Если А — ограниченный линейный оператор, ото- отображающий банахово пространство Е в банахово пространство Е\, то \\А*\\ = \\А\\. Доказательство. В силу свойств нормы оператора имеем \(А*д,х)\ = \(д,Ах)\^\\д\\-\\А\\-\\х\\, откуда \\А*д\\ ^ \\A\\ ¦ \\g\\; следовательно, \\А*\\ < \\A\\. A3)
248 Гл. IV. Линейные функционалы и операторы Пусть х Е Е и Ах ф 0; положим у о = ¦¦ ^ ¦¦ G i?i; очевидно, что || у о || = 1. По следствию из теоремы Хана-Банаха существует такой функционал д, что \\g\\ = 1 и (д,уо) = 1, т.е. (д,Ах) = ||Ах||. Из соотношений ||Ас|| = (д,Ах) = \(А*д,х)\ «С \\А*д\\-\\х\\ < ||А*||-|Ы|-|И1 = 11ЛНИ1 получаем ||А|| ^ Щ*||, что вместе с неравенством A3) дает Теорема доказана. Упражнение. Пусть Е и Е\ — рефлексивные банаховы простран- пространства hAg ?(E, Ei). Докажите, что А** = А. Следующее утверждение представляет собой еще одно полезное следствие теоремы Банаха об обратном операторе. Лемма (об аннуляторе ядра оператора). Пусть А — непрерыв- непрерывный линейный оператор, отображающий Е на все Е\, где Е, Е\ — банаховы пространства. Тогда (КетА^ =ImA*. A4) Действительно, проверим сначала включение (KerA)^ Dim A*. A5) Если / G Im А*, то существует такой элемент g G Е*, что / = А*д, и для всех х G Кет А имеем: (f,x) = (A*g,x) = (g,Ax)=0, т.е. / ? (КегЛ)^. Докажем теперь обратное включение: (Кет AI- dm А*. A6) Пусть / G (Кег А)^. Тогда для отображений f:E^R и А: Е -+ Ех выполнены условия леммы о тройке (следствие 2). Поэтому суще- существует такой элемент д G Е*, что (/,х) = (д,Ах), т.е. / = А*д. Тем самым включение A6), а значит, и равенство A4) доказаны. 6. Сопряженный оператор в евклидовом пространстве. Самосопряженные операторы. Рассмотрим случай, когда А — ограниченный оператор в гильбертовом пространстве Н (действи- (действительном или комплексном). Согласно теореме об общем виде ли- линейного непрерывного функционала в гильбертовом пространстве
§ 5. Линейные операторы 249 отображение т, сопоставляющее каждому у Е Н линейный функ- функционал (ту)(х) = (х,у), есть изоморфизм (или сопряженный изоморфизм, если Н комплекс- комплексно) пространства Н на все сопряженное пространство Н*. Пусть А* — оператор, сопряженный оператору А. Ясно, что отображение А* = т~х А*т представляет собой ограниченный линейный оператор, действующий в Н; легко видеть, что для любых х,у Е Н (Ах,у) = (х,А*у). Так как \\А*\\ = \\A\\, а отображения гиг изометричны, то \\А*\\ = \\А\\. Все сказанное справедливо, разумеется, и для конечномерно- конечномерного евклидова пространства, действительного или комплексного. Примем следующее соглашение. Если R — евклидово простран- пространство (конечной или бесконечной размерности), то оператором, со- сопряженным к действующему в R оператору А, мы назовем опре- определенный выше оператор А*, действующий в том же простран- пространстве R. Следует подчеркнуть, что это определение отличается от оп- определения сопряженного оператора в произвольном банаховом про- пространстве Е, согласно которому сопряженный оператор А* действу- действует в сопряженном пространстве Е*. Иногда оператор А*, в отличие от А*, называют эрмитово-сопряженным. Чтобы не усложнять тер- терминологии и обозначений, мы будем писать А* вместо А* и говорить о сопряженном операторе, помня, однако, что в евклидовом случае сопряженный оператор всегда понимается в смысле, указанном в этом пункте. Ясно, что в евклидовом пространстве R оператор, сопряжен- сопряженный к А, можно определить как такой оператор, который при всех х,у G R удовлетворяет равенству (Ах, у) = (х,А*у). Поскольку операторы А и А* действуют теперь в одном и том же пространстве, возможно равенство А = А*. Выделим важный класс операторов в евклидовом (в частности, гильбертовом) пространстве. Определение 4. Ограниченный линейный оператор А, дей- действующий в евклидовом пространстве Л, называется самосопряжен- самосопряженным, если А = А*, т. е. если (Ах, у) = (х,Ау) для всех ж, у G R.
250 Гл. IV. Линейные функционалы и операторы Отметим следующее важное свойство оператора А*, сопряжен- сопряженного к оператору А. Подпространство R\ евклидова пространства R называется инвариантным относительно оператора А, если из x?R\ вытекает Ах Е R\. Если подпространство R\ инвариантно относи- относительно А, то его ортогональное дополнение R^ инвариантно от- относительно А*. Действительно, если у Е R^, то для всех х Е R\ имеем (х,А*у) = (Ах,у)=0, поскольку Ах G i?i. В частности, если А — самосопряженный опе- оператор, то ортогональное дополнение к любому его инвариантному подпространству само инвариантно относительно А. Упражнение. Докажите, что если А л В — ограниченные линейные операторы в евклидовом пространстве, то справедливы равенства: = аА* +$В\ (АВ)*=В*А*, (А*)*=А, I* = I (/ — единичный оператор). 7. Спектр оператора. Резольвента1). Вряд ли можно указать более важное понятие в теории операторов, чем понятие спектра. Напомним прежде это понятие для конечномерного случая. Пусть А — линейный оператор в n-мерном пространстве Сп. Чис- Число Л называется собственным значением оператора А, если уравне- уравнение Ах = Хх имеет ненулевые решения. Совокупность всех собственных значений называется спектром оператора А, а все остальные значения Л — регулярными. Иначе говоря, Л есть регулярная точка, если опера- оператор А — XI обратим. При этом (А — Л/) определен на всем Сп и, как и всякий оператор в конечномерном пространстве, ограничен. Итак, в конечномерном пространстве существуют две возможности: 1) уравнение Ах = Хх имеет ненулевое решение, т. е. Л есть соб- собственное значение для А; оператор (А — Л/) при этом не сущест- существует; 2) существует ограниченный оператор (А — Л/), определенный на всем пространстве, т. е. Л есть регулярная точка. 1) Всюду, где речь идет о спектре оператора, мы считаем, что оператор дей- действует в комплексном пространстве.
§ 5. Линейные операторы 251 Но если А — оператор, заданный в бесконечномерном простран- пространстве Е, то имеется еще и третья возможность, а именно: 3) оператор (А — Л/) существует, т. е. уравнение Ах = Хх имеет лишь нулевое решение, но этот оператор определен не на всем Е (и, возможно, неограничен). Введем следующую терминологию. Число Л мы назовем регуляр- регулярным для оператора А, действующего в (комплексном) банаховом пространстве Е, если оператор R\ = (А-Л/), называемый резоль- резольвентой оператора А, определен на всем Е и, следовательно (теоре- (теорема 3), ограничен. Совокупность всех остальных значений Л называ- называется спектром оператора А. Спектру принадлежат все собственные значения оператора А, так как если (А — Х1)х = 0 при некотором х ф 0, то (А — Л/) не существует. Их совокупность называется точечным спектром. Остальная часть спектра, т. е. совокупность тех Л, для которых (А—Л/) существует, но определен не на всем Е, называется непрерывным спектром. Итак, каждое значение являет- является для оператора А или регулярным или собственным значением, или точкой непрерывного спектра. Возможность наличия у опера- оператора непрерывного спектра — существенное отличие теории опера- операторов в бесконечномерном пространстве от конечномерного случая. Пусть А — ограниченный оператор, действующий в банаховом пространстве Е. Если точка Л регулярна, т.е. оператор (А — Л/) определен на всем Е и ограничен, то при достаточно малом S опе- оператор (А - (Л + S)I)~1 тоже определен на всем Е и ограничен (теорема 4), т.е. точка Л + 8 тоже регулярна. Таким образом, ре- регулярные точки образуют открытое множество. Следовательно, спектр, т. е. дополнение этого множества, — замкнутое множество. Теорема 7. Если А — ограниченный линейный оператор в ба- банаховом пространстве i?n|A|>||A||, тоА — регулярная точка. Доказательство. Так как, очевидно, ТО При ||А|| < |А| этот ряд сходится и задает определенный на всем Е ограниченный оператор (теорема 5). Иначе говоря, спектр операто- оператора А содержится в круге радиуса \\A\\ с центром в нуле.
252 Гл. IV. Линейные функционалы и операторы Примеры. 1. В пространстве С [а, Ь] рассмотрим оператор А, определяемый формулой Ax(t)=tx(t). A7) Тогда (A-XI)x(t) = (t-\)x(t). Оператор A7) обратим при любом Л, так как из равенства (t - X)x(t) = 0 следует, что непрерывная функция x{t) тождественно равна нулю. Однако при А Е [а, Ъ] обратный оператор, задаваемый формулой (А - XI)-lx(t) = j^ определен не на всем С [а, Ъ] и неограничен. (Докажите это!) Таким образом, спектр оператора A7) представляет собой отрезок [а, 6], причем собственные значения отсутствуют, т. е. имеется лишь не- непрерывный спектр. 2. Рассмотрим в пространстве Ь оператор А, определяемый сле- следующим образом: А: (жьж2,...) -+ @,Ж1,ж2,...)- A8) Этот оператор не имеет собственных значений. (Докажите это!) Оператор А~х ограничен, но определен в 1^ лишь на подпростран- подпространстве х\ — 0, т. е. Л = 0 есть точка спектра оператора. Упражнения. Содержит ли спектр оператора A8) какие-либо точки, кроме Л = О? Замечания. A) Всякий ограниченный линейный оператор, опреде- определенный в комплексном банаховом пространстве, имеющем хотя бы один отличный от нуля элемент, имеет непустой спектр. Существуют операто- операторы, у которых спектр состоит из единственной точки (например, оператор умножения на число). B) Теорема 7 может быть уточнена следующим образом. Пусть (можно доказать, что этот предел существует для любого ограниченного оператора А), тогда спектр оператора А целиком леэюит в круге радиу- радиуса г с центром в нуле. Величина г называется спектральным радиусом оператора А. C) Резольвентные операторы R^ и Да, отвечающие точкам /и, и Л, пе- перестановочны между собой и удовлетворяют соотношению Rll-R\ = (fi-
6. Компактные операторы 253 которое легко проверить, умножив обе части этого равенства на Отсюда вытекает, что если Ло — регулярная точка для А, то производная от R\ по Л при Л = Ло, т. е. предел Дл°+АЛ~ Дл° lim Л АЛ (в смысле сходимости по операторной норме) существует, и равна R\Q. Упражнение. Пусть А — ограниченный самосопряженный оператор в комплексном гильбертовом пространстве Н. Докажите, что его спектр есть замкнутое ограниченное подмножество действительной оси. § 6. Компактные операторы 1. Определение и примеры компактных операторов. В от- отличие от линейных операторов в конечномерных пространствах, для которых имеется исчерпывающее описание, изучение произвольных линейных операторов в бесконечномерных пространствах предста- представляет собой весьма сложную и, по существу, необозримую задачу. Однако некоторые важные классы таких операторов могут быть описаны полностью. Среди них один из важнейших образуют так называемые компактные операторы. Эти операторы, с одной стороны, близки по своим свойствам к конечномерным (т. е. ограни- ограниченным операторам, переводящим данное пространство в конечно- конечномерное) и допускают достаточно детальное описание, а, с другой, играют важную роль в различных приложениях, в первую очередь в теории интегральных уравнений, которым будет посвящена гл. IX. Определение 1. Оператор А, отображающий банахово про- пространство Е в себя (или другое банахово пространство Е\), называ- называется компактным, или вполне непрерывным, если он каждое огра- ограниченное множество переводит в предкомпактное. В конечномерном нормированном пространстве всякий линейный оператор компактен, поскольку он переводит любое ограниченное множество в ограниченное, а в конечномерном пространстве всякое ограниченное множество компактно. В бесконечномерном пространстве компактность оператора есть требование существенно более сильное, чем просто его непрерыв- непрерывность (т. е. ограниченность). Например, единичный оператор в гиль- гильбертовом пространстве непрерывен, но отнюдь не компактен. (До- (Докажите это независимо от рассматриваемого ниже примера 1.)
254 Гл. IV. Линейные функционалы и операторы Рассмотрим некоторые примеры. 1. Пусть / — единичный оператор в банаховом пространстве Е. Покажем, что если Е бесконечномерно, то оператор / не компактен. Для этого достаточно, очевидно, сказать, что единичный шар в Е (который, разумеется, переводится оператором / в себя) не предком- пактен. Это в свою очередь вытекает из следующей леммы, которая понадобится нам и в дальнейшем. Лемма 1. Пусть х\, #2,... — линейно независимые векто- векторы в нормированном пространстве Е и пусть Еп — подпростран- подпространство, порожденное векторами ж]_,...,жп. Тогда существует после- последовательность векторов 2/i, у2,..., удовлетворяющая следующим условиям: 1) \\уп\\ = 1; 2) yn G Еп; 3) р(уп,Еп_1) > 1/2, где p(yn, En_i) — расстояние вектора уп от Еп-\, т. е. inf ||2/n-s||. Доказательство. Действительно, так как векторы х\, х<±,... линейно независимы, то хп ? Еп-\ и p(xn,En-i) = a > 0. Пусть х* — такой вектор из En-i, что \\хп — х*\\ < 2а. Тогда, поскольку а = р(хп,Еп-1) = р(хп -х*,Еп-1), вектор Уп = \\Xn-X~\\ удовлетворяет всем условиям 1)—3). За у\ при этом можно взять Х1/\\Х1\\. Лемма доказана. Пользуясь этой леммой, в единичном шаре всякого бесконечно- бесконечномерного нормированного пространства можно построить последова- последовательность векторов {уп}, для которой р(ут,Уп) > 1/2, т ф п. Ясно, что такая последовательность не может содержать никакой сходя- сходящейся подпоследовательности. А это и означает отсутствие пред- компактности. 2. Пусть А — непрерывный линейный оператор, переводящий ба- банахово пространство Е в некоторое его конечномерное подпростран- подпространство. Такой оператор компактен, поскольку он переводит всякое ограниченное подмножество М С Е в ограниченное подмножество конечномерного пространства, т. е. в предкомпактное множество. В частности, в гильбертовом пространстве оператор ортогональ- ортогонального проектирования на подпространство компактен в том и только том случае, если это подпространство имеет конечную размерность.
§ 6. Компактные операторы 255 3. Рассмотрим в пространстве Ь оператор А, определенный сле- следующим образом: если х = (xi,..., xnj...), то Ах = ^i,ix2,...,^rxn,...j. A) Этот оператор компактен. Действительно, поскольку всякое огра- ограниченное множество из Ь содержится в некотором шаре этого про- пространства, достаточно доказать, что образы шаров предкомпактны, а в силу линейности оператора достаточно проверить это для еди- единичного шара. Но оператор A) переводит единичный шар простран- пространства /2 B множество точек, содержащееся в основном параллелепи- параллелепипеде (см. гл. II, § 7, п. 1). Следовательно, это множество вполне ограничено, а значит, и предкомпактно. Упражнение. Пусть Ах = (aisci,..., апхп,...); при каких условиях на последовательность чисел {ап} этот оператор в Ь компактен? 4. В пространстве непрерывных функций С [а, Ь] важный класс компактных операторов образуют операторы, представимые в виде ъ Ах = y(s) = I K(s, t)x(t) dt. B) a Покажем справедливость следующего утверждения: если функ- функция K(s,t) ограничена на квадрате a^s^b, a^t^bu все ее точки разрыва лежат на конечном числе кривых t = ipk(s), к = 1,...,п, где ifk — непрерывные функции, то формула B) определяет в про- пространстве С[а, Ь] компактный оператор. Действительно, заметим, прежде всего, что в указанных условиях интеграл B) существует для любого s из отрезка [а, 6], т.е. функ- функция y(s) определена. Далее, пусть М= sup \K(s,t)\ a^s,t^b и пусть G — множество тех точек (s,?), для которых хотя бы при одном к = 1,..., п выполняется неравенство Следом G(s) этого множества на каждой прямой s = const служит объединение интервалов
256 Гл. IV. Линейные функционалы и операторы Пусть F — дополнение множества G до квадрата а ^ s, t ^ Ъ. Так как F компактно, а функция K(s,t) непрерывна на F, то существует такое S > О, что для любых точек (У,?'), (s",t") из F, удовлетворяющих условию \s'-s"\ + \t'-t"\ <ё. C) Оценим теперь разность y(s')—y(s") в предположении, что \s' — s"\ < < S. Имеем \y(s') - y(s")\ ^ f\K(s',t)-K(s",t)\x(t)\dt; a для оценки стоящего справа интеграла разобьем промежуток инте- интегрирования [а, Ь] на объединение интервалов G(s') U G(s"), которое обозначим Р, и остальную часть отрезка [а, Ь], которую обозначим Q. Заметив, что Р есть объединение интервалов, суммарная длина ко- которых не превосходит е/(ЗМ), получаем f \K(s',t)-K(s",t)\\x(t)\dt< Щх\\. р Интеграл по Q допускает, очевидно, оценку f \K(s',t)-k(s",t)\\x(t)\dt< |||x||. Q Таким образом, \y(s') - y(s")\ < е\\х\\. D) Неравенство D) показывает, что функция y(s) непрерывна, т.е. формула B) действительно определяет оператор, переводящий про- пространство С [а, Ь] в себя. Далее, из того же неравенства видно, что если {x(t)} — ограниченное множество в С[а,6], то соответствую- соответствующее множество {y(s)} равностепенно непрерывно. Наконец, если ||ж|| ^ С, то Цг/11 = sup \y(s)\ ^ sup / \K(s, t)\ \x(t)\dt <: M(b - a)\\x\\. a Таким образом, оператор B) переводит всякое ограниченное мно- множество из С[а, Ь] в множество функций, равномерно ограниченное и равностепенно непрерывное, т. е. предкомпактное. 4а. Расположение точек разрыва функции K(s,i) на конечном числе кривых, пересекающих прямые s = const лишь в одной точке, существенно. Пусть, например, 1 при s < 1/2, K(s,t) = . К J ' 0 при s ^ 1/2;
§ 6. Компактные операторы 257 оператор B) с таким ядром, заданным на квадрате 0 ^ s, t ^ 1 и имеющим точками разрыва весь отрезок s = l/2,0^?^l, пере- переводит функцию x{t) = 1 в разрывную функцию. 46. Если положить K(s,t) = 0 при ? > s, то оператор B) примет вид 8 y(s)= /K(s,t)x(t)dt. E) а Будем считать, что функция K(s,t) непрерывна при t < s; тогда из сказанного в примере 4 следует, что оператор E) вполне непре- непрерывен в С [а, Ь]. Этот оператор называется оператором типа Вольтерра1). Замечание. При принятом нами определении компактного оператора может оказаться, что образ замкнутого единичного шара некомпактен (хотя он предкомпактен). Действительно, рассмотрим в пространстве С[— 1,1] оператор интегрирования S Jx(s) = I x(t) dt; -i по доказанному выше, J — вполне непрерывный оператор в С[— 1,1]. Положим ( [ 0, если - 1 ^ t ^ О, xn(t) = < nt, если 0 < t ^ 1/п, [ 1, если 1/п < t ^ 1. Тогда хп G С[— 1,1], ||жп|| = 1 для всех п и О, если - 1 ^ t ^ О, yn(t) = Jxn(t) = <( п?2/2, если 0 < t ^ 1/п, - 1/Bп), если 1/п < t ^ 1. Ясно, что последовательность уп сходится в С[— 1,1] к функции = Г 0, если - 1 ^ t <: О, \ t, если 0 < t ^ 1, которая не является образом (при отображении J) никакой функции из С[— 1,1], ибо функция ^/(t) разрывна. Однако можно доказать, что если пространство рефлексивно (на- (например, гильбертово), то образ замкнутого единичного шара при компактном линейном отображении компактен. 1) Вито Вольтерра — итальянский математик, автор ряда работ по функци- функциональному анализу и интегральным уравнениям.
258 Гл. IV. Линейные функционалы и операторы 2. Основные свойства компактных операторов. Теорема 1. Если {Ап } — последовательность компактных опе- операторов в банаховом пространстве Е, сходящаяся по норме к неко- некоторому оператору А, то оператор А тоже компактен. Доказательство. Для установления компактности операто- оператора А достаточно показать, что, какова бы ни была ограниченная последовательность xi,..., жп,... элементов из Е, из последова- последовательности {Ажп} можно выделить сходящуюся подпоследователь- подпоследовательность. Так как оператор А\ компактен, то из последовательности {Aixn} можно выбрать сходящуюся подпоследовательность. Пусть х?\...,хР,... F) — такая подпоследовательность, что {Aia4 } сходится. Рассмотрим теперь последовательность {^жк }• Из нее опять-таки можно вы- выбрать сходящуюся подпоследовательность. Пусть — такая подпоследовательность, выбранная из F), что {^жк } схо- дится. При этом, очевидно, {AixKn J} тоже сходится. Рассуждая ана- аналогично, выберем из последовательности {хп } такую подпоследо- подпоследовательность , ч гC) г(з) что {Аз^п } сходится и т.д. Возьмем затем диагональную последо- последовательность *^1 1 • • • 1 ^п ' ' ' ' Каждый из операторов Ai, ..., An, ... переводит ее в сходящуюся. Покажем, что и оператор А тоже переводит ее в сходящуюся. Тем самым компактность А будет установлена. Так как пространство Е полно, то достаточно показать, что {Ахп} — фундаментальная по- последовательность. Имеем \\. G) Пусть ||жп|| ^ С; выберем сначала к так, что ||А- Ак\\ < е/(ЗС), а по- потом выберем такое N, чтобы при всех п > N и m > N выполнялось неравенство
§ 6. Компактные операторы 259 (это возможно, так как последовательность {А^Хп } сходится). При этих условиях из G) получаем, что II ЛТ(п) _ Лт(т)\\ <г р \\л.хп лхт || ^ t для всех достаточно больших пит. Теорема доказана. Легко проверить, что линейная комбинация компактных опера- операторов компактна. Следовательно, в пространстве С(Е, Е) всех огра- ограниченных линейных операторов, определенных на Е, компактные операторы образуют замкнутое линейное подпространство. Посмотрим теперь, будет ли совокупность компактных опера- операторов замкнута относительно операции перемножения операторов. На самом деле здесь справедливо даже существенно более сильное утверждение. Теорема 2. Если А — компактный оператор, а В — ограни- ограниченный, то операторы АВ и В А компактны. Доказательство. Если множество М С Е ограничено, то ВЫ тоже ограничено. Следовательно, АВМ предкомпактно, а это и означает, что оператор АВ компактен. Далее, если М ограничено, то AM предкомпактно, а тогда, в силу непрерывности В, множе- множество ВАМ тоже предкомпактно, т. е. оператор В А компактен. Теорема доказана. Следствие. В бесконечномерном пространстве Е компактный оператор не может иметь ограниченного обратного. Действительно, иначе единичный оператор / = А~х А был бы ком- компактен в Е, что невозможно (см. пример 1). Замечание. Теорема 2 показывает, что компактные операторы образуют в кольце всех ограниченных операторов С(Е,Е) двусто- двусторонний идеал1). Теорема 3. Оператор, сопряженный компактному, компактен. Доказательство. Пусть А — компактный оператор в бана- банаховом пространстве Е. Покажем, что сопряженный оператор А*, действующий в Е*, переводит каждое ограниченное подмножество из Е* в предкомпактное. Поскольку всякое ограниченное подмно- подмножество нормированного пространства содержится в некотором шаре, 1) Идеалом (двусторонним) в некотором кольце R называется такое подколь- цо il, что если а Е il, r E R, то ar E il и га Е il.
260 Гл. IV. Линейные функционалы и операторы достаточно показать, что А* переводит каждый шар в предкомпакт- ное множество. В силу линейности оператора А* достаточно пока- показать, что образ А* 5* замкнутого единичного шара 5* С Е* пред- компактен. Будем рассматривать элементы из Е* как функции не на всем пространстве Е, а лишь на компакте AS — замыкании образа еди- единичного шара при отображении А. При этом множество Ф функ- функций, отвечающих функционалам из S*, будет равномерно ограниче- ограничено и равностепенно непрерывно. Действительно, если \\cp\\ ^ 1, то sup \ф)\ = sup \ф)\ <С |M|sup||Ar|| <С \\A\\, xe-Xs xeas xes х ) — (рух )\ ^ \\ср\\ \\х — х || ^ \\х — х ц. Следовательно, это множество Ф предкомпактно в пространстве G[А5] (в силу теоремы Арцела). Но множество Ф с метрикой, инду- индуцированной обычной метрикой пространства непрерывных функций С [AS], изометрично множеству A*S* (с метрикой, индуцированной нормой пространства Е*). Действительно, если #i, д<± G S*, то ||A*0i -A*g2\\ = sup|(A*^i -A*g2,x)\ = xes = s\xp\(g1-g2,Ax)\= sup \(gi - g2,z)\ = xes zeAS = svp_\(gi-g2,z)\=p(g1,g2). Поскольку Ф предкомпактно, то оно вполне ограничено; следова- следовательно, вполне ограничено и изометричное ему множество A*S*. Поэтому A*S* предкомпактно в Е*. Теорема доказана. Замечание. Нетрудно проверить, что множество Ф замкну- замкнуто в CfAS], так что оно компактно, поэтому компактно и множе- множество A*S*, хотя (как это видно из замечания в п. 1) образ замкнутого единичного шара при произвольном вполне непрерывном отображе- отображении может не быть компактом. Ситуация в только что доказанной теореме отличается от общей тем, что замкнутый единичный шар S* в Е* компактен в *-слабой топологии пространства Е* (см. тео- теорему 5 § 3). Отсюда и следует компактность (в метрике простран- пространства Е*) образа множества S* для любого компактного оператора. Упражнения. 1. Пусть А — ограниченный линейный оператор в ба- банаховом пространстве. Докажите, что если оператор А* компактен, то и А компактен.
§ 6. Компактные операторы 261 2. Для того чтобы линейный оператор А в гильбертовом пространстве Н был компактен, необходимо и достаточно, чтобы (эрмитово) сопряжен- сопряженный к нему оператор А* был компактен. 3. Собственные значения компактного оператора. Теорема 4. Всякий компактный оператор А в банаховом про- пространстве Е имеет при любом 5 > 0 лишь конечное число линейно независимых собственных векторов, отвечающих собственным зна- значениям, по модулю превосходящим 5. Доказательство. Пусть Ai,..., Лп,... какая-либо последова- последовательность собственных значений оператора А (различных или с по- повторениями) таких, что |ЛП| > 5; xi,..., жп,... — отвечающая им последовательность собственных векторов, и пусть эти векторы ли- линейно независимы. Воспользуемся леммой 1 (п. 1) и построим такую последователь- последовательность векторов 2/i,..., уп,..., что 1) уп е Еп, 2) \\уп\\ = 1; 3) p(yn, ?n_i) = ^inf ^ \\yn - х\\ > 1/2, где Еп — подпространство, порожденное xi,..., хп. Последовательность {уп/\п} ограничена в силу неравенства |ЛП| > 5. Мы утверждаем, что из последовательности образов {А(уп/Хп)} нельзя выбрать сходящуюся. Действительно, пусть п Vn— Yl ak%k] тогда п-1 - / J Т %к ~г (%п%п — Уп к=1 k=i Поэтому при любых р > q 1/2, поскольку yq + zq — zp e Ep-i. Это противоречит компактности оператора А. Из доказанной теоремы, в частности, вытекает, что число линей- линейно независимых собственных векторов, отвечающих данному соб- собственному значению Л ф 0 компактного оператора А, конечно.
262 Гл. IV. Линейные функционалы и операторы Из этой теоремы следует также, что число собственных значе- значений Лп компактного оператора А во внешности круга |А| > S > О всегда конечно и что все собственные значения оператора А можно перенумеровать в порядке невозрастания модулей: |Ai| ^ | A.21 ^ 4. Компактные операторы в гильбертовом пространстве. Выше мы говорили о компактных операторах в произвольном бана- банаховом пространстве. Сейчас мы дополним эти сведения некоторыми фактами, относящимися к компактным операторам в гильбертовом пространстве. Мы назвали оператор А компактным, если он переводит всякое ограниченное множество в предкомпактное. Поскольку Н = Н*, т. е. Н есть пространство, сопряженное к сепарабельному, в нем все огра- ограниченные множества (и только они) слабо предкомпактны. Следова- Следовательно, в гильбертовом пространстве компактный оператор можно определить как оператор, переводящий всякое слабо предкомпакт- предкомпактное множество в множество, предкомпактное в сильной топологии. Наконец, в некоторых случаях удобно еще и такое определение компактности оператора в гильбертовом пространстве: оператор А называется компактным в Н, если он всякую слабо сходящуюся по- последовательность переводит в сильно сходящуюся. Действительно, пусть это последнее условие выполнено и пусть М — ограниченное множество в Н. Каждое бесконечное подмножество множества М содержит слабо сходящуюся последовательность. Если она перево- переводится в сильно сходящуюся последовательность, то AM предком- пактно. Обратно, пусть А — компактный оператор, {хп} — сла- слабо сходящаяся последовательность и ж — ее слабый предел. Тогда {Ажп} содержит подпоследовательность, сходящуюся сильно. В то же время {Ажп} сходится слабо, в силу непрерывности А, к Ах, от- откуда следует, что {Ажп} не может иметь более одной предельной точки. Следовательно, {Ажп} — сходящаяся последовательность. 5. Самосопряженные компактные операторы в Н. Для са- самосопряженных линейных операторов в конечномерном евклидо- евклидовом пространстве известна теорема о приведении матрицы такого оператора к диагональной форме в некотором ортогональном нор- нормированном базисе. В этом пункте мы распространим эту теорему на компактные самосопряженные операторы в гильбертовом про- пространстве. Результаты этого пункта справедливы как для действи- действительного, так и для комплексного гильбертова пространства. Для определенности будем считать, что Н комплексно. Установим прежде всего некоторые свойства собственных век- векторов и собственных значений самосопряженных операторов в Н,
§ 6. Компактные операторы 263 вполне аналогичные, впрочем, соответствующим свойствам конеч- конечномерных самосопряженных операторов. I. Все собственные значения самосопряженного оператора А в Н действительны. В самом деле, пусть Ах = Аж, ||ж|| ф 0, тогда А(ж,ж) = (Ах,х) = (ж, Аж) = (ж, Аж) = А(ж,ж), откуда Л = А. П. Собственные векторы самосопряженного оператора, отве- отвечающие различным собственным значениям, ортогональны. Действительно, если Ах = Хх и Ay = fiy, причем А ф /i, то А(ж, ^/) = (Аж, у) = (ж, Аз/) = (ж, /Х2/) = д(ж» 2/)» откуда (ж, ^/) = 0. Докажем теперь следующую фундаментальную теорему. Теорема 5 (Гильберт-Шмидт). Для любого компактного самосопряженного линейного оператора А в гильбертовом простран- пространстве Н существует ортогональная нормированная система {^рп} собственных векторов, отвечающих собственным значениям {Хп} (Ап ф 0), такая, что каждый элемент ? G Н записывается един- единственным образом в виде k где вектор ?' G Кет А, т. е. удовлетворяет условию А? = 0; при этом к и если система {^pn} бесконечна, то lim An = 0 (n ->• оо). Для доказательства этой основной теоремы нам понадобятся сле- следующие вспомогательные утверждения. Лемма 2. Если {?п} слабо сходится к ? и линейный самосопря- самосопряженный оператор А компактен, то Доказательство. Для всякого п \(Mn,Zn Но Mn,M - (M,Zn)\4: \Ы ¦ Шп -Oil, и так как числа ||?п|| ограничены, а ||А(^П — ^)|| —у 0, то 1(^п,У что и требовалось доказать.
264 Гл. IV. Линейные функционалы и операторы Теорема 3. Если функционал где А — ограниченный самосопряженный линейный оператор, до- достигает на единичном шаре максимума в точке ?о, то из (^OjV) = О вытекает, что Доказательство. Очевидно, ||?о|| = 1- Положим ^= ^A + H'NI2' где а — произвольное комплексное число. Из ||?о|| = 1 следует, что Далее, [<Жо) + a(Mo,ri) + а(А&,т)) + \a\2Q(r,)]. Число а можно взять сколь угодно малым по модулю и таким, что а(А{;о,и) — действительная величина. Тогда a{A^^rf) = d(A?o,r)) и <Ж) = Q(So) + MAto,v) + О(а2). Из последнего равенства ясно, что если (A?q,t)) ф 0, то а можно вы- выбрать так, что |Q(?)I > |Q(^o)|? а эт0 противоречит условию леммы. Из леммы 3 непосредственно вытекает, что если |Q(?)| достигает максимума при ^ = ^0, то ^о есть собственный вектор оператора. Доказательство теоремы 5. Будем строить элементы ср^ по индукции, в порядке убывания абсолютных величин соответст- соответствующих им собственных значений: |Ai| ^•••^ |ЛП| > ... Для построения элемента ipi рассмотрим выражение |Q(^)| = = |(А^,^)| и докажем, что оно на единичном шаре достигает макси- максимума. Пусть S= sup и ?i, ^2? • • • — такая последовательность, что ||^п|| = 1 и IO4fn,fn)| -> S при п ^ оо. Так как единичный шар в Н слабо компактен, то из {?п} можно выбрать подпоследовательность, слабо сходящуюся к некоторому элементу г]. При этом 117711 ^ 1 и в силу леммы 2 \(Ar,,rl)\=S.
§ 6. Компактные операторы 265 Элемент rj мы и примем за ср±. Ясно, что Ц77Ц в точности равня- равняется 1. (Действительно, пусть 117711 < 1? положим 771 = 77/1 Ml 5 тогда ||?7i|| = 1 и |(A?7i,77i)| > 5, что противоречит определению S.) При этом откуда 11 %# К^ь^)| =5. Пусть теперь собственные векторы отвечающие собственным значениям Ai,..., Лп, уже построены. Пусть M((^i,..., ipn) — подпространство, натянутое на (^i,..., ipn. Рассмотрим функционал на совокупности элементов, принадлежащих (т. е. ортогональных cpi,..., срп) и удовлетворяющих условию | Множество М^ есть подпространство, инвариантное относительно А (так как подпространство M((^i,... ,ipn) инвариантно и А само- самосопряжен). Применяя к М^ проведенные выше рассуждения, полу- получим, что в М^ найдется вектор (обозначим его cpn+i), собственный для оператора А. Возможны два случая: 1) после конечного числа шагов мы по- получим подпространство М^о, в котором (А?,?) = 0; 2) (А?,?) ^ О на М^ при всех п. В первом случае из леммы 3 вытекает, что М^о переводится опе- оператором А в нуль (положите г\ — А^о), т.е. целиком состоит из соб- собственных векторов, отвечающих Л = 0. Система построенных векто- векторов {(fn} состоит из конечного числа элементов. Во втором случае получаем последовательность {(рп} собствен- собственных векторов, для каждого из которых Лп ф 0. Покажем, что Лп —у 0. Последовательность {(рп} (как и всякая ортогональная нор- нормированная последовательность) слабо сходится к нулю, поэтому элементы Асрп = Хп(рп должны сходиться к нулю по норме, откуда |ЛП| = \\Асрп\\ ->0. Пусть
266 Гл. IV. Линейные функционалы и операторы Если ^М1и(/О,то (А?, f) ^ Ап||?||2 для всех п, т. е. (А?, f) = 0. Отсюда в силу леммы 3 (при max |(А?, ?)| = 0), примененной к М^, получаем At; = 0, т. е. подпространство М1- переводится оператором А в нуль. Из построения системы {^рп} ясно, что всякий вектор можно пред- представить в виде откуда вытекает, что Теорема доказана. Эта теорема играет фундаментальную роль в теории интегральных уравнений, о которых будет идти речь в гл. IX. Замечание. Доказанная теорема означает, что для всякого компактного самосопряженного оператора А в Н существует ортого- ортогональный базис пространства Н, состоящий из собственных векторов этого оператора. Действительно, для получения такого базиса до- достаточно дополнить построенную в доказательстве теоремы систему собственных векторов {^рп} произвольным ортогональным базисом подпространства М^, переводимого оператором А в нуль. Иными словами, здесь получается результат, вполне аналогичный теореме о приведении матрицы конечномерного самосопряженного операто- оператора к диагональному виду в ортогональном базисе. Для несамосопряженных операторов в n-мерном пространстве та- такое приведение, вообще говоря, невозможно, однако верна следую- следующая теорема: всякое линейное преобразование в п-мерном простран- пространстве имеет хотя бы один собственный вектор. Нетрудно убедить- убедиться, что это утверждение не переносится на компактные операторы в Н. Действительно, пусть оператор А задан в 1^ формулой Ах = А(Х1,..., хп,...) = (О, X!, Щ-,..., ^^,...). (8) Этот оператор компактен (проверьте!), но не имеет ни одного соб- собственного вектора (докажите это). Упражнение. Найдите спектр оператора (8).
ГЛАВА V МЕРА, ИЗМЕРИМЫЕ ФУНКЦИИ, ИНТЕГРАЛ Понятие меры /л(А) множества А является естественным обобще- обобщением понятий: 1) длины /(Д) отрезка Д, 2) площади S(F) плоской фигуры F, 3) объема V(G) пространственной фигуры G, 4) приращения ср{Ь) — ip(a) неубывающей функции cp{t) на полу- полуинтервале [а, Ь), 5) интеграла от неотрицательной функции, взятого по некоторой линейной, плоской или пространственной области, и т. п. Это понятие возникло в теории функций действительного пере- переменного, а оттуда перешло в теорию вероятностей, теорию динами- динамических систем, функциональный анализ и многие другие области математики. В § 1 этой главы мы изложим теорию меры для множеств на плос- плоскости, отправляясь от понятия площади прямоугольника. Общая теория меры будет изложена в §§ 2 и 3. Читатель легко заметит, что все рассуждения, проведенные в § 1, имеют общий характер и в аб- абстрактной теории повторяются без существенных изменений. § 1. Мера плоских множеств 1. Мера элементарных множеств. Рассмотрим систему в множеств на плоскости (х,у), каждое из которых определяется од- одним из неравенств вида а ^ х ^ Ь, а ^ х < Ь, а < х ^ Ь, а < х <Ь и одним из неравенств вида с^у ^ d, c^y <d, с<у ^ d, c<y <d, где а, 6, с и d — произвольные числа. Множества, принадлежащие этой системе, мы будем называть прямоугольниками. Замкнутый прямоугольник, определяемый неравенствами а^ж^б, с ^ у ^ d, представляет собой прямоугольник в обычном смысле (вместе с гра- границей), если а < d и с < d, отрезок (если а = Ъ и с < d или а < Ъ
268 Гл. V. Мера, измеримые функции, интеграл и с = сГ), точку (при а = 6, с = б?) и, наконец, пустое множество (если а > Ъ или с > d). Открытый прямоугольник а < х < Ь, с < у < d будет в зависимости от соотношений между а, 6, с и d прямоугольни- прямоугольником без границы или пустым множеством. Каждый из прямоуголь- прямоугольников остальных типов (назовем их полуоткрытыми) представляет собой настоящий прямоугольник без одной, двух или трех сторон, интервал, полуинтервал, либо, наконец, пустое множество. Класс всех прямоугольников на плоскости обозначим в. Для каждого из прямоугольников определим его меру в соответ- соответствии с известным из элементарной геометрии понятием площади. Именно: а) мера пустого множества равна 0; б) мера непустого прямоугольника (замкнутого, открытого или полуоткрытого), определяемого числами а, 6, с и d, равна (b-a)(d-c). Таким образом, каждому прямоугольнику Р из 6 поставлено в соответствие число т(Р) — его мера; при этом выполнены следу- следующие условия: 1) мера т{Р) принимает действительные неотрицательные зна- значения; п 2) мера т(Р) аддитивна, т.е. если Р = |J Pk и Pi П Ри = 0 при k=l г Ф к, то 1 ' п к=1 Наша задача — распространить, с сохранением свойств 1) и 2), меру т(Р), определенную пока для прямоугольников, на более широкий класс множеств. Сначала мы распространим меру на так называемые элементар- элементарные множества. Назовем плоское множество элементарными, если его можно представить хотя бы одним способом как объединение конечного числа попарно непересекающихся прямоугольников. Для дальнейшего нам понадобится следующая теорема. Теорема 1. Объединение, пересечение, разность и симметри- симметрическая разность двух элементарных множеств также являются эле- элементарными множествами. Таким образом, по терминологии, введенной в § 5 гл. I, элемен- элементарные множества образуют кольцо.
§ 1. Мера плоских мноэюеств 269 Доказательство. Ясно, что пересечение двух прямоугольни- прямоугольников есть снова прямоугольник. Поэтому, если k j два элементарных множества, то и их пересечение АпВ = — элементарное множество. Разность двух прямоугольников есть, как легко проверить, эле- элементарное множество. Следовательно, вычитая из прямоугольников некоторое элементарное множество, мы снова получим элементар- элементарное множество (как пересечение элементарных). Пусть теперь мно- множества А и В — элементарные. Найдется, очевидно, прямоуголь- прямоугольник Р, содержащий каждое из них. Тогда множество АиВ = Р\[(Р\А)П(Р\В)] в силу сказанного выше будет элементарным. Отсюда и из равенств А\В = Ап(Р\В), ААВ = (АиВ)\(АпВ) следует, что разность и симметрическая разность элементарных множеств являются элементарными множествами. Теорема дока- доказана. Определим теперь меру т'(А) для элементарных множеств сле- следующим образом: если к где Pk — попарно непересекающиеся прямоугольники, то к Покажем, что т'(А) не зависит от способа разложения А в сумму конечного числа прямоугольников. Пусть к j где Pk и Qj — прямоугольники, и Pi П Pk = 0, Qj П Qk = 0 при г ф к. Так как пересечение Pk П Qj двух прямоугольников есть пря- прямоугольник, то, в силу аддитивности меры для прямоугольников, Х>(рЛ) = Еш(р*n Qj) = Еш(^)- к k,j j В частности, для прямоугольников мера mf совпадает с исходной мерой т. Легко видеть, что определенная таким образом мера элементар- элементарных множеств неотрицательна и аддитивна. Установим следующее важное свойство меры элементарных мно- множеств.
270 Гл. V. Мера, измеримые функции, интеграл Теорема 2. Если А — элементарное множество и {Ап} — ко- конечная или счетная система элементарных множеств такая, что Ac(JAn, П ТО ^-— m'(A)^^2m'(An). A) П Доказательство. Для любого е > 0 и данного А можно, оче- очевидно, найти такое замкнутое элементарное множество А, ко- которое содержится в А и удовлетворяет условию тп'(А) ^тп'(А) -г/2. (Достаточно каждый из к составляющих А прямоугольников Pi за- заменить лежащим внутри него замкнутым прямоугольником с пло- площадью большей, чем m(Pi) — e/Bk).) Далее, для каждого Ап можно найти открытое элементарное множество Ап, содержащее Ап и удовлетворяющее условию т'(Ап) sC т'(Ап) + -ф^. Ясно, что _ _ Ac(JAn. п Из {Ап} можно (по лемме Гейне-Боре ля) выбрать конечную систе- систему АП1,..., АПз, покрывающую А. При этом, очевидно, г=1 (так как иначе А оказалось бы покрытым конечным числом пря- прямоугольников, суммарной площади меньшей, чем т'(А), что невоз- невозможно). Поэтому т'(А) 4: т'(А) + § ^ ^ г=1 E п п п п откуда в силу произвольности ? > 0 вытекает A). Свойство меры т', устанавливаемое теоремой 2 (мера множеств не превосходит суммы мер покрывающих его множеств, взятых в ко- конечном или счетном числе), называется полуаддитивностью. Из не- него вытекает свойство так называемой счетной аддитивности, или а -аддитивности, состоящее в следующем.
§ 1. Мера плоских мноэюеств 271 Пусть элементарное множество А представлено как сумма счет- счетного числа непересекающихся элементарных множеств Ап (п = 1,2,...): А = U An, 71=1 тогда ^ п=1 (т. е. мера суммы счетного числа непересекающихся слагаемых рав- равна сумме мер). Действительно, в силу аддитивности при любом N имеем: m'(A)^m'(\J Ап) =^™'( п=1 п=1 Переходя к пределу при N —у оо, получаем П=1 В силу теоремы 2 имеет место и противоположное неравенство. Та- Таким образом, а-аддитивность меры т! доказана. Замечание. У читателя может сложиться впечатление, что а-аддитивность меры на плоскости получается автоматически из ее аддитивности путем предельного перехода. На самом деле это не так (в доказательстве теоремы 2 мы, используя лемму Гейне-Боре- ля, существенно опирались на связь между метрическими и тополо- топологическими свойствами плоских множеств). В § 2 при изучении мер на произвольных абстрактных множествах мы увидим, что из адди- аддитивности меры, вообще говоря, ее а-аддитивность не следует. 2. Лебегова мера плоских множеств. Элементарные множе- множества не исчерпывают всех множеств, которые встречаются в гео- геометрии и в классическом анализе. Поэтому естественно попытаться распространить понятие меры, с сохранением ее основных свойств, на класс множеств более широкий, чем конечные объединения пря- прямоугольников со сторонами, параллельными осям координат. Решение этой задачи, в известном смысле окончательное, было дано А. Лебегом в начале XX века. При изложении теории меры Лебега нам придется рассматривать не только конечные, но и бесконечные объединения прямоугольни- прямоугольников. Для того чтобы при этом сразу же не столкнуться с множества- множествами «бесконечной меры», ограничимся сперва множествами, целиком принадлежащими квадрату Е = {0 ^ х ^ 1; 0 ^ у ^ 1}. На совокупности всех таких множеств определим функцию /i* (A) следующим образом.
272 Гл. V. Мера, измеримые функции, интеграл Определение 1. Внешней мерой множества А называется чи- число ^_^ ц*(А)= inf ?>(Р*), A) К где нижняя грань берется по всевозможным покрытиям множе- множества А конечными или счетными системами прямоугольников. Замечания. 1. Если бы мы в определении внешней меры рас- рассматривали покрытия, состоящие не только из прямоугольников, но из любых элементарных множеств (взятых в конечном или счет- счетном числе), то мы получили бы, очевидно, то же самое значе- значение /л* (А), поскольку всякое элементарное множество есть сумма конечного числа прямоугольников. 2. Если А — элементарное множество, то /л* (А) = т'(А). Дей- Действительно, пусть Pi, ... , Рп — составляющие А прямоугольники. Тогда, по определению, П Так как прямоугольники Pi покрывают А, то /л* (Л) ^ J2 г=1 = т'(А). Но если {Qj} — произвольная конечная или счетная систе- система прямоугольников, покрывающая А, то в силу теоремы 2 т'(А) ^ ^ ^m{Qj)i поэтому /л*(А) = т'{А). j Теорема 3. Если А где Ап — конечная или счетная система множеств, то В частности, если А С В, то /л*(А) ^ /л*(В). Доказательство. По определению внешней меры, для каж- каждого Ап найдется такая система прямоугольников {Рп^}, конечная или счетная, что Ап С (J Pnk и к где г > 0 выбрано произвольно. Тогда AcUU^nt. п к п к Гк
§ 1. Мера плоских мноэюеств 273 Поскольку ? > 0 произвольно, отсюда вытекает утверждение тео- теоремы. Так как на элементарных множествах mf и /i* совпадают, то тео- теорема 2 представляет собой частный случай теоремы 3. Определение 2. Множество А называется измеримым (в смы- смысле Лебега), если для любого г > 0 найдется такое элементарное множество В. что 1Л*(ААВ) <г. C) Функция /i*, рассматриваемая только на измеримых множествах, называется лебеговой мерой. Будем обозначать ее через \i. Замечание. Введенное нами определение измеримости имеет достаточно наглядный смысл. Оно означает, что множество измери- измеримо, если его можно «сколь угодно точно приблизить» элементарны- элементарными множествами. Итак, мы определили некоторый класс Ше множеств, называе- называемых измеримыми, и функцию /i, меру Лебега, на этом классе. Наша ближайшая цель — установить следующие факты: 1. Совокупность Ше измеримых мноэюеств замкнута относи- относительно операций взятия конечных или счетных сумм и пересече- пересечений (т. е. представляет собой сг-алгебру, см. определение в п. 4 § 5 гл. I). 2. Функция \i а-аддитивна на Ше- Нижеследующие теоремы представляют собой этапы доказатель- доказательства этих утверждений. Теорема 4. Дополнение измеримого множества измеримо. Это сразу следует из равенства (Е \ А) А (Е \ В) = А А В, которое проверяется непосредственно. Теорема 5. Сумма и пересечение конечного числа измеримых множеств суть измеримые множества. Доказательство. Достаточно провести доказательство для двух множеств. Пусть А\ и А<± — измеримые множества. Это значит, что для любого е > 0 найдутся такие элементарные множества В\ и ??2, что /x*(Ai Л Вх) < г/2, ii*(А2 А В2) < г/2. Так как (Аг U А2) А (Вг U В2) С (Аг А Вг) U (А2 А В2),
274 Гл. V. Мера, измеримые функции, интеграл ТО /x*[(Ai U А2) A (Bi U В2)] ^ 1Л*(А! Л Bi) + /i*(A2 Л В2) < г. Но В\ U ^2 — элементарное множество, поэтому множество Ai U А2 измеримо. Измеримость пересечения двух измеримых множеств вытекает из теоремы 4 и соотношения 2)]. D) Следствие. Разность и симметрическая разность двух измери- измеримых множеств измеримы. Это вытекает из теорем 4 и 5 и равенств А1\А2=А1П(Е\ А2), А1 А А2 = (Аг \ А2) U (А2 \ Аг). Теорема 6. Если А\, ..., Ап — попарно непересекающиеся измеримые множества, то Для доказательства этой теоремы нам понадобится следующая лемма. Лемма. Для любых двух множеств А и В Доказательство леммы. Так как AcBU(A А В), то в силу теоремы 3 Отсюда вытекает утверждение леммы в случае /л*(А) ^ /л*(В). Если же /л*(А) ^ fi*(B), то утверждение леммы вытекает из неравенства fi,*(B) ^/i*(i)+/i*(iAS), устанавливаемого аналогично. Доказательство теоремы 6. Как и в теореме 5, достаточно рассмотреть случай двух множеств. Выберем произвольное г > 0 и такие элементарные множества В\ и В2, что /i*(AiABi)<e, F) e. G)
§ 1. Мера плоских мноэюеств 275 Положим А = А\ U А<2 и В = В\ U 52. Множество А измеримо в силу теоремы 5. Так как множества А\ и А<± не пересекаются, то В1ПВ2 С (А1 Л ?i) U (А2 А Я2) и, следовательно, т'(В1ПВ2) ^2г. (8) В силу леммы из F) и G) вытекает, что |m'(?i)-/i*(^i)l<?, (9) |m'(?2)-/i*(^2)| <e. A0) Так как на совокупности элементарных множеств мера аддитивна, то из (8)—A0) получаем т'(В) = т^Вг) + т'(В2) - т1\ВХ П Б2) ^ /x*(^i) + /х*(А2) - 4г. Заметив еще, что А Л В С (Ai A 5i) U (А2 А 52) имеем, наконец, »*(А) ^ т'(В) -»*(ААВ)^ т'(В) - 2е ^ /i*(^i) + »*(М) ~ бе. Так как г > 0 может быть выбрано произвольно малым, то V*(A)Zv*(Ai) + n*(A2). Поскольку противоположное неравенство li*(A)^ii*(Al) + ii*(A2) справедливо (в силу теоремы 3) всегда, окончательно получаем так как А\, А<± и А измеримы, то здесь /i* можно заменить на \±. Теорема доказана. Из этой теоремы, в частности, следует, что для всякого измери- измеримого А Теорема 7. Сумма и пересечение счетного числа измеримых множеств суть измеримые множества. Доказательство. Пусть (X) — счетная система измеримых множеств и А = (J Ап. Положим 71=1 п—1 оо А'п = Ап \ U Ак. Ясно, что А = U А'п, причем множества Ап к=1 п=1 попарно не пересекаются. В силу теоремы 5 и следствия из нее все
276 Гл. V. Мера, измеримые функции, интеграл множества А'п измеримы. В силу теоремы б и определения внешней меры при любом конечном п Е -| к,— й А'к) ,—1 поэтому ряд Е ^А'п п=1 сходится и, следовательно, для любого г > 0 найдется такое N, что 2' >7V TV Так как множество С = (J Ап измеримо (как сумма конечного чи- п=1 ела измеримых множеств), то для него найдется такое элементарное множество В, что ц*(САВ) <е/2. A2) Поскольку AaBc(CaB)U[ U АЧ, то из A1) и A2) вытекает »*(А А В) <е, т. е. А измеримо. Так как дополнения измеримых множеств измеримы, то утверж- утверждение теоремы относительно пересечений вытекает из равенства f)An = E\{J(E\An). П П Теорема 7 усиливает теорему 5. Следующая теорема представля- представляет собой аналогичное усиление теоремы 6. Теорема 8. Если {Ап}—последовательность попарно непере- непересекающихся измеримых множеств и А = (J Ап, то Доказательство. В силу теоремы 6 при любом N и ап) = n=1 п=1
§ 1. Мера плоских мноэюеств 277 Переходя к пределу при N —у оо, получаем ОО ~ |. A3) 71=1 С другой стороны, согласно теореме 3 71=1 Из A3) и A4) вытекает утверждение теоремы. Установленное в теореме 8 свойство меры было названо ее счет- счетной аддитивностью, или а- аддитивностью. Из а-аддитивности вы- вытекает следующее свойство меры, называемое непрерывностью. Теорема 9. Если Ai D А2 D ... —последовательность вло- вложенных друг в друга измеримых множеств и А = f] An, то п /л(А) = lim /i(An). п—>-оо Доказательство. Достаточно рассмотреть случай А = 0; об- общий случай сводится к этому заменой Ап на An \ А. Имеем Ах = (A1\A2)U(A2\A3)U..., An = (An \ An+1) U (An+1 \ An+2) U ..., причем слагаемые не пересекаются. Поэтому, в силу а-аддитивнос- а-аддитивности \i (X) A5) _ A6) k=n так как ряд A5) сходится, то его остаток A6) стремится к 0 при п -У оо. Таким образом, /л(Ап) —У 0 при п —У оо, что и требовалось доказать.
278 Гл. V. Мера, измеримые функции, интеграл Следствие. Если Ai С А<± С ... —возрастающая последова- последовательность измеримых множеств и A = (JAn, П ТО = lim ц(Ап). пюо Для доказательства достаточно перейти от множеств Ап к их до- дополнениям и воспользоваться теоремой 9. Отметим в заключение еще одно очевидное, но важное обстоя- обстоятельство. Всякое множество А, внешняя мера которого равна О, измеримо. Достаточно положить В = 0; тогда »*(А АВ)= fi*(A Л 0) = »*(А) =0<г. Итак, мы распространили меру с элементарных множеств на бо- более широкий класс Ше, замкнутый относительно операций взятия счетных сумм и пересечений, т. е. представляющий собой сг-алгебру. Построенная мера сг-аддитивна на этом классе. Установленные вы- выше теоремы позволяют составить следующее представление о сово- совокупности измеримых по Лебегу множеств. Всякое открытое множество, принадлежащее Е, можно предста- представить как объединение конечного или счетного числа открытых пря- прямоугольников, т. е. измеримых множеств, и в силу теоремы 7 все открытые множества измеримы. Замкнутые множества суть допол- дополнения открытых, следовательно, они тоже измеримы. Согласно тео- теореме 7 измеримыми должны быть и все те множества, которые мо- могут быть получены из открытых и замкнутых с помощью конечного или счетного числа операций взятия счетных сумм и пересечений. Можно показать, однако, что этими множествами все измеримые множества еще не исчерпываются. 3. Некоторые дополнения и обобщения. Выше мы рассмат- рассматривали только те множества, которые содержатся в единичном ква- квадрате Е = {0 ^ ж, у ^ 1}. Нетрудно освободиться от этого ограни- ограничения, например, следующим образом. Представив всю плоскость как сумму полуоткрытых квадратов Епш = {п<ж^п + 1, т < у ^ ттг+1} (п,?71 — целые), мы будем говорить, что плоское мно- множество А измеримо, если его пересечение Апш = А П Епш с каждым из этих квадратов измеримо. При этом мы положим, по определе- определению, п,т Ряд, стоящий справа, либо сходится к конечному значению, либо расходится к +оо. Поэтому мера \± может принимать и бесконечные
§ 1. Мера плоских мноэюеств 279 значения. Все свойства меры и измеримых множеств, установлен- установленные выше, очевидным образом переносятся на этот случай1). На- Надо отметить лишь, что сумма счетного числа измеримых множеств конечной меры может иметь бесконечную меру. Класс измеримых множеств на всей плоскости обозначим 21. Мы изложили в этом параграфе построение меры Лебега для плоских множеств. Аналогично может быть построена лебегова ме- мера на прямой, в трехмерном пространстве или, вообще, в евклидовом пространстве любой размерности п. В каждом из этих случаев мера строится по одному и тому же образцу: исходя из меры, определен- определенной заранее для некоторой системы простейших множеств (прямо- (прямоугольников в случае плоскости, интервалов (а, 6), отрезков [а, Ь] и полуинтервалов (а, Ь], [а, Ь) в случае прямой, и т. п.), мы определяем меру вначале для конечных объединений таких множеств, а потом распространяем ее на гораздо более широкий класс множеств — на множества, измеримые по Лебегу. Само определение измеримос- измеримости дословно переносится на множества в пространстве любой раз- размерности. Вводя понятие меры Лебега, мы исходили из обычного опреде- определения площади. Аналогичное построение для одномерного случая опирается на понятие длины интервала (отрезка, полуинтервала). Здесь, однако, можно ввести понятие меры и иным, более общим способом. Пусть F(t) — некоторая неубывающая, непрерывная слева функ- функция на прямой. Положим т(а,Ь) = F(b) -F(a + 0), m[a,b] = F(b + 0) - F(a), m(a, b] = F(b + 0) - F(a + 0), m[a,b) = F(b)-F(a). Легко видеть, что так определенная функция интервала т неотри- неотрицательна и аддитивна. Применяя к ней рассуждения, аналогичные проведенным в настоящем параграфе, мы можем построить некото- некоторую меру [1р(А). При этом совокупность 2li? множеств, измеримых относительно данной меры, замкнута относительно операций взятия счетных сумм и пересечений, а мера \ip будет сг-аддитивна. Класс 2li? множеств, измеримых относительно \±р, будет, вообще говоря, 1) Однако в теореме 9 нужно добавить условие fi(Ei) < +oo, чтобы сходил- сходился ряд A5). Приведите пример, показывающий, что без этого условия теорема может стать неверной.
280 Гл. V. Мера, измеримые функции, интеграл зависеть от выбора функции F. Однако при любом выборе F от- открытые и замкнутые множества, а следовательно, и все их счетные суммы и пересечения заведомо будут измеримы. Меры, получаемые с помощью той или иной функции F, называются мерами Лебега- Стилтъеса. В частности, функции F(t) = t отвечает обычная мера Лебега на прямой. Если мера /лр такова, что она равна 0 для любого множества, обычная лебегова мера \л которого равна 0, то мера \лр называется абсолютно непрерывной (относительно /i). Если мера /лр целиком сосредоточена на конечном или счетном множестве точек (это бу- будет в том случае, когда множество значений функции F конечно или счетно), то она называется дискретной. Мера /лр называется сингулярной, если она равна 0 для любого одноточечного множе- множества, но имеется такое множество М лебеговой меры 0, что мера /лр его дополнения равна 0. Можно показать, что всякая мера /лр представима как сумма абсолютно непрерывной, дискретной и сингулярной мер. К мерам Лебега—Стилтьеса мы еще вернемся в следующей главе. Существование неизмеримых множеств. Мы видели, что класс измеримых по Лебегу множеств весьма широк. Естественно спро- спросить, существуют ли вообще неизмеримые множества? Покажем, что этот вопрос решается положительно. Проще всего неизмеримые множества строятся на окружности, на которой введена линейная мера Лебега. Пусть С — окружность, длина которой равна 1, и а — некоторое иррациональное число. Отнесем к одному классу те точки окруж- окружности С, которые могут быть переведены одна в другую поворотом окружности С на угол патг (п — целое). Каждый из этих классов будет, очевидно, состоять из счетного множества точек. Выберем из каждого такого класса по одной точке. Покажем, что полученное та- таким образом множество (обозначим его Фо) неизмеримо. Обозначим через Фп множество, получаемое из Фо поворотом на угол патг. Лег- Легко видеть, что все множества Фп попарно не пересекаются и в сумме составляют всю окружность С. Если бы множество Фо было изме- измеримо, то были измеримы и конгруэнтные ему множества Фп. Так как qq С = U Фп, ФпПФт = 0 при п/ш, п= —оо то в силу сг-аддитивности меры отсюда следовало бы, что 1=
2. Общее понятие меры 281 Но конгруэнтные множества должны иметь одну и ту же меру, так что если Фо измеримо, то Отсюда видно, что равенство A7) невозможно, так как сумма ряда, стоящего в его правой части, равна 0, если /х(Фо) = 0, и бесконечно- бесконечности, если /х(Фо) > 0. Итак, множество Фо (а следовательно, и каждое Фп) неизмеримо. § 2. Общее понятие меры. Продолжение меры с полукольца на кольцо. Аддитивность и а-аддитивность г) 1. Определение меры. Мы строили меру плоских множеств, отправляясь от меры (площади) прямоугольника и распространяя ее на более широкий класс множеств. Для наших построений суще- существенно было вовсе не конкретное выражение площади прямоуголь- прямоугольников, а лишь ее общие свойства. Именно, при продолжении плоской меры с прямоугольников на элементарные множества мы пользо- пользовались лишь тем, что площадь — это неотрицательная аддитивная функция множества, и тем, что совокупность прямоугольников есть полукольцо. При построении лебегова продолжения плоской меры была, кроме того, важна ее а-аддитивность. В силу только что сказанного, конструкции, изложенной в § 1 применительно к плоским множествам, можно придать вполне об- общую абстрактную форму. Тем самым ее применимость будет суще- существенно расширена. Этому и посвящены ближайшие два параграфа. Введем прежде всего следующее основное определение. Определение 1. Функция множества /л(А) называется мерой, если: 1) область определения вм функции /л(А) есть полукольцо мно- множеств, 2) значения функции fi(A) действительны и неотрицательны, 3) fi(A) аддитивна, т. е. для любого конечного разложения А = Ах U • • • U Ап 1) В этом параграфе и дальше мы будем систематически пользоваться поня- понятиями и фактами, изложенными в § 5 гл. I.
282 Гл. V. Мера, измеримые функции, интеграл множества A Е &^ на (попарно непересекающиеся) множества Ak ? &11 выполнено равенство Замечание. Из разложения 0 = 0U0 вытекает, что /i@) = = 2/i@), т.е. /i@) = 0. 2. Продолжение меры с полукольца на порожденное им кольцо. При построении меры плоских множеств первым шагом было распространение меры с прямоугольников на элементарные множества, т. е. на конечные суммы попарно непересекающихся пря- прямоугольников. Сейчас мы рассмотрим абстрактный аналог этой кон- конструкции. Сформулируем прежде всего следующее определение. Определение 2. Мера \i называется продолжением меры т, если 6т С 6М и для каждого A Е вт имеет место равенство ц(А) = т{А). Цель этого пункта состоит в доказательстве следующего предло- предложения. Теорема 1. Для каждой меры т(А), заданной на некотором по- полукольце &т, существует одно и только одно продолжение тп'(А), имеющее своей областью определения кольцо 9^(вт) (т. е. мини- минимальное кольцо над &т). Доказательство. Для каждого множества A G 9^(вт) суще- существует разложение п А = и вк, вке бго, BknBt = 0 при к ^ I A) к=1 (теорема 3 § 5 гл. I). Положим, по определению, к=1 Легко видеть, что величина т'(А), определенная равенством B), не зависит от выбора разложения A). Действительно, рассмотрим два разложения А = U Bi = U Cj, Bi G &m, Cj G &m.
2. Общее понятие меры 283 Так как все пересечения В{ П Cj принадлежат ©ш, то в силу адди- аддитивности меры т г=1 г=1 j=l j=l что и требовалось доказать. Неотрицательность и аддитивность функции т'(А), определяе- определяемой равенством B), очевидны. Итак, существование продолжения т' меры т на кольцо 9^(вт) доказано. Для доказательства его единственности заметим, что, по опреде- п лению продолжения, если A— (J Вк, где Вк — непересекающиеся к=1 _ множества из вт, то для любого продолжения т меры т на кольцо т(А) = к к т.е. мера т совпадает с мерой ттт/, определенной равенством B). Теорема доказана. По существу, мы повторили здесь, в абстрактных терминах, при- прием, которым мы в § 1 продолжили меру с прямоугольников на эле- элементарные множества. Класс элементарных множеств как раз и представляет собой минимальное кольцо над полукольцом прямо- прямоугольников. Из аддитивности и неотрицательности меры вытекают следую- следующие почти очевидные, но важные свойства. Теорема 2. Пусть m — мера, заданная на некотором кольце 9\т, и множества А,..., Ап принадлежат 9\т. Тогда п I. если U Ak С А и AiH Aj = 0 при i ф j, to к=1 k=l П. если U Ak D А, то к=1 k=l в частности, если А С А' и А, А' е 9\, то тп(А) ^ тп(А').
284 Гл. V. Мера, измеримые функции, интеграл Действительно, если А\,..., А2 попарно не пересекаются и содер- содержатся в А, то в силу аддитивности меры k=i k= (J Ak). Поскольку m[A\ \J Ak) ^ О, отсюда получаем свойство I. Далее, для любых А\, А2 Е 9tm имеем m(Ai U А2) = m(Ai) + т(А2) - m(Ai П А2) ^ m(Ai) + ш( По индукции отсюда получаем, что / n 4=i fc=i п Наконец, опять-таки в силу аддитивности меры из А С (J Ак сле- А;=1 дует, что m(A)=m(\J Ak)-m(\J Ak 4=1 у vfe=i откуда в силу предыдущего неравенства и вытекает свойство П. Мы доказали свойства I и II для меры, заданной на кольце мно- множеств. Но если мера первоначально была задана на полукольце, то при продолжении ее на кольцо меры множеств, принадлежащих исходному полукольцу, не меняются. Поэтому свойства I и II спра- справедливы и для мер на полукольцах. 3. а-аддитивность. В различных вопросах анализа приходит- приходится рассматривать объединения не только конечного, но и счетно- счетного числа множеств. В связи с этим условие аддитивности, которое мы наложили на меры (определение 1), естественно заменить более сильным требованием сг-аддитивности. Определение 3. Мера т называется счетно-аддитивной, или а-аддитивной, если для любых множеств А, А\,..., Ап,..., принад- принадлежащих ее области определения вт и удовлетворяющих условиям ОО А = U An, AiH Aj = 0 при i/ j, n=l имеет место равенство П=1
2. Общее понятие меры 285 Плоская мера Лебега, построенная нами в § 1, сг-аддитивна (тео- (теорема 8). Пример сг-аддитивной меры совсем иной природы можно построить следующим образом. Пусть X = {жьж2,...} — произвольное счетное множество и числа рп > 0 таковы, что 71=1 Соответствующий класс измеримых множеств состоит из всех под- подмножеств множества X. Для каждого А С X положим Легко проверить, что т(А) будет сг-аддитивной мерой, причем т(Х) = 1. Этот пример естественно появляется в связи со многими вопросами теории вероятностей. Укажем пример меры аддитивной, но не сг-аддитивной. Пусть X — множество всех рациональных точек отрезка [0,1], а &т со- состоит из пересечений множества X с произвольными интервалами (а, 6), отрезками [а, Ь] или полуинтервалами (а, Ь], [а, Ь) из [0,1]. Лег- Легко видеть, что &т представляет собой полукольцо. Для каждого такого множества Ааь Е вт положим т{АаЪ) = Ь- а. Эта мера аддитивна, однако она не сг-аддитивна, так как т(Х) = 1, и в то же время X есть сумма счетного числа точек, каждая из ко- которых имеет меру 0. Меры, которые будут рассматриваться здесь и в следующем па- параграфе, мы будем предполагать а-аддитивными. Теорема 3. Если мера т, определенная на некотором полу- полукольце &m, a-аддитивна, то и мера fi, получающаяся ее продолже- продолжением на кольцо 9t(©m), a-аддитивна. Доказательство. Пусть АеЩет), впещет), n = i,2,..., оо А = U Вп, 71=1 причем В8ПВГ = 0 при s ф г. Тогда существуют такие множества Aj и Bni из 6т, что
286 Гл. V. Мера, измеримые функции, интеграл причем множества в правых частях каждого из этих равенств по- попарно не пересекаются, а суммы по i и j конечны (теорема 3 § 5 гл. I). Пусть Cnij = Bni C\Aj. Легко видеть, что множества Спц попарно не пересекаются, и притом ОО Aj= U UCm;, Bni = \JCnij. n=l i j Поэтому в силу а-аддитивности меры т на вт имеем (Cnii), C) п=1 г (Cnij), D) з а в силу определения меры \i на 9^(вт) 2j), E) Вщ). F) Из (З)-(б) вытекает, что /л(А) = ^2 А^(^п)- (Суммы по г и по j здесь п=1 конечны, ряды по п сходятся.) Докажем теперь следующие основные свойства ст-аддитивных мер, представляющие собой обобщения на счетные суммы свойств, сформулированных в теореме 2. Поскольку, как мы установили, а-аддитивность меры сохраняется при продолжении меры на коль- кольцо, можно с самого начала считать, что мера задана на некотором кольце *И. Теорема 4. Пусть мера m a-аддитивна и множества А, А\,..., Ап,... принадлежат кольцу УК. Тогда оо la. Если U Ak С А и AiU Aj = 0 при i ф j, то (X) ^m(Ak) ^ m(A); (X) Пег (счетная полуаддитивность). Если (J Ak D А, то k=\
§ 3. Лебегово продолжение меры 287 Доказательство. Если все А^ не пересекаются и содержатся в А, то, в силу свойства I (теорема 2), при любом п имеем к=1 Переходя здесь к пределу при п —у оо, получаем первое утверждение теоремы. Докажем второе утверждение. Поскольку 9\ есть кольцо, множе- множества п—1 Вп = (АпПА)\ U Ак к=1 принадлежат У\. Так как ОО А = U Вп, Втс Ап 71=1 и множества Вп попарно не пересекаются, то (X) т(А) = Y,m{Bn) Замечание. Утверждение 1^- доказанной только что теоремы не опирается, очевидно, на а-аддитивность рассматриваемой меры; оно остается справедливым и для любых аддитивных мер. Наобо- Наоборот, утверждение П^- существенно использует а-аддитивность ме- меры. Действительно, в приведенном выше примере аддитивной, но не сг-аддитивной меры все пространство X, имеющее меру 1, покры- покрывается счетной суммой одноточечных множеств, каждое из кото- которых имеет меру 0. Более того, нетрудно убедиться, что свойство П^- на самом деле равносильно а-аддитивности. Действительно, пусть \i — некоторая мера, определенная на полукольце в. Пусть множе- множества A, Ai,..., Ап,... принадлежат в, А = (J А^ и все А^ попарно к не пересекаются. Тогда в силу свойства 1^- (которым, как мы видели, обладает любая мера) k=l Если же \i обладает и свойством П^, то (поскольку А^ в совокуп- совокупности покрывают А) \.—^ 2_^1^\Ак) ^ Ц\А) к=1
288 Гл. V. Мера, измеримые функции, интеграл и, таким образом, Проверить счетную полуаддитивность меры (свойство П^) бывает часто проще, чем прямо установить ее а-аддитивность. § 3. Лебегово продолжение меры 1. Лебегово продолжение меры, определенной на полу- полукольце с единицей. Если мера т, заданная на полукольце вт, обладает лишь свойством аддитивности (но не сг-аддитивности), то ее продолжением на 9\ (&т) исчерпываются в значительной степе- степени все возможности распространения такой меры с исходного по- полукольца на более широкий класс множеств. Если же рассматри- рассматриваемая мера сг-аддитивна, то она может быть распространена с вт на класс множеств значительно более обширный, чем кольцо 9^(?5тM и в некотором смысле максимальный. Это можно сделать с помощью так называемого лебегова продолжения. Снача- Сначала мы рассмотрим лебегово продолжение меры, заданной на полу- полукольце с единицей. Общий случай будет рассмотрен в следующем пункте. Пусть на некотором полукольце множеств &т с единицей Е зада- задана сг-аддитивная мера т. Определим на системе 21 всех подмножеств множества Е функцию /i* (A) — внешнюю меру следующим образом. Определение 1. Внешней мерой множества А С Е называет- называется число ,__ ц*(А) =inf Y,m(Bn), A) П где нижняя грань берется по всем покрытиям множества А конеч- конечными или счетными системами множеств Вп ? &т. Следующее свойство внешней меры играет основную роль во всем дальнейшем построении. Теорема 1 (счетная полуаддитивность). Если Ac\JAn, П где {Ап} — конечная или счетная система множеств, то п Доказательство этого утверждения совпадает с доказательством теоремы 3 § 1 и мы не будем его повторять.
§ 3. Лебегово продолжение меры 289 Определение 2. Множество А называется измеримым (по Лебегу), если, каково бы ни было е > 0, найдется такое В Е 9t(©m), что /х*(А Д Я) <е. Функция /i*, рассматриваемая только на измеримых множествах, называется лебеговой мерой (или просто мерой) и обозначается \i. Ясно, что все множества из &т и из 9К(&т) измеримы. При этом, если A G 6m, то fi(A)=m(A). Это равенство доказывается точно так же, как и его аналог для множеств на плоскости. Из равенства Ах Д А2 = (Е\А1) А (Е\А2) следует, что если А измеримо, то его дополнение тоже измеримо. Установим теперь основные свойства измеримых множеств и оп- определенной на них лебеговой меры. Теорема 2. Система Ш всех измеримых множеств есть кольцо. Доказательство. Так как всегда А1ПА2 = А1\(А1\А2), А1иА2=Е\[(Е\А1)П(Е\А2)}, то достаточно показать следующее. Если А\ G ШТ, А<± G ШТ, то и А = Аг \ А2 G ЯП. Пусть А\ и А2 измеримы; тогда существуют В\ G В2 G 9^Fт) такие, что /i*(Ai Д 5i) < г/2 и /i*(A2 Д Б2) < г/2. Полагая В = Bi\B2 G 9^(вт) и пользуясь соотношением (Л! \ В2) Д (Б! \ В2) С (Ai A Si) U (А2 А В2), получаем /**(ААВ) <е. В силу произвольности г > 0 отсюда вытекает измеримость множе- множества А. Замечание. Очевидно, что Е есть единица кольца ШТ, которое, таким образом, является алгеброй множеств.
290 Гл. V. Мера, измеримые функции, интеграл Теорема 3. На системе ЭД1 измеримых множеств функция fi(A) аддитивна. Доказательство этой теоремы представляет собой дословное по- повторение доказательства теоремы б § 1. Теорема 4. На системе 9Л измеримых множеств функция fi(A) a-аддитивна. Доказательство. Пусть оо А= U An, A,AuA2r-eWl, AiHAj = 0 при г ф j. п=1 В силу теоремы 1 5>(Л>), B) а в силу теоремы 3 при любом N N TV n=1 n=l откуда n Из B) и (З) следует утверждение теоремы. В § 1, рассматривая плоскую меру Лебега, мы показали, что не только конечные, но и счетные суммы и пересечения измери- измеримых множеств также измеримы. Это верно и в общем случае, т. е. справедлива следующая теорема. Теорема 5. Система Ш измеримых по Лебегу множеств явля- является а-алгеброй с единицей Е. Доказательство. Так как f)An = E\(J(E\An) П П и так как дополнение измеримого множества измеримо, то достаточ- достаточно показать следующее. Если А\, ..., Ап, ... принадлежат ШТ, то А = (J Ап также принадлежит ШТ. Доказательство этого утвержде- п ния, проведенное в теореме 7 § 1 для плоских множеств, дословно сохраняется и в общем случае. Так же как и в случае плоской меры Лебега, из а-аддитивности меры следует ее непрерывность, т. е. если \± — сг-аддитивная мера,
§ 3. Лебегово продолжение меры 291 определенная на сг-алгебре, А\ э • • • D An D ... — убывающая цепочка измеримых множеств и ТО /i(A) = lim п—>-оо а если Ai С • • • С Ап С ... — возрастающая цепочка измери- измеримых множеств и A = \JAn, П ТО /х(А) = lim ц(Ап). п—>-оо Доказательство, проведенное в § 1 для плоской меры (теорема 9), дословно переносится на общий случай. Итак, мы установили, что система 9Л представляет собой ст-алгеб- ру, а определенная на ней функция /л(А) обладает всеми свойствами сг-аддитивной меры. Тем самым оправдано следующее определение. Определение 3. Лебеговым продолжением \i — L(m) ме- меры т называется функция fi(A), определенная на системе измери- измеримых множеств ЭД1 и совпадающая на Ш1 с внешней мерой /л*{А). 2. Продолжение меры, заданной на полукольце без еди- единицы. Если полукольцо &т, на котором определена исходная ме- мера т, не имеет единицы, то построение лебегова продолжения, из- изложенное в предыдущем пункте, претерпевает некоторые, впрочем, незначительные, изменения. Определение 1 внешней меры сохраня- сохраняется, но внешняя мера /i* оказывается определенной только на си- системе 5М* таких множеств А, для каждого из которых существует покрытие U Вп множествами из вт с конечной суммой ^2т(Вп). п п Определение измеримости сохраняется без всяких изменений. Теоремы 2—4 и заключительное определение 3 сохраняют си- силу. Предположение о существовании единицы использовалось лишь в доказательстве теоремы 2. Чтобы дать доказательство теоремы 2 в общем случае, надо установить независимо, что из А\ G ЭД1, А<± G Ш1 вытекает А\ U А<± Е ШТ. Но это следует из включения (Аг U A2) A (#i U В2) С (Аг А Вг) U (А2 А В2). В случае, когда вт не имеет единицы, теорема 5 заменяется сле- следующей теоремой.
292 Гл. V. Мера, измеримые функции, интеграл Теорема 6. При любой исходной мере т система множеств Ш, измеримых по Лебегу, является 6-кольцом; измеримость множе- ОО ства А = (J Ап при измеримых Ап имеет место в том и только п=1 / N v том случае, если меры \i ( (J An j ограничены некоторой констан- константой, не зависящей от N. n=1 Доказательство этого утверждения предоставляется читателю. Замечание. Поскольку сейчас речь идет о мерах, принимаю- принимающих лишь конечные значения, необходимость последнего усло- условия очевидна. Из теоремы б вытекает следующий факт. Следствие. Система Ша всех множеств В Е Ш, являющих- являющихся подмножествами фиксированного множества A Е Ш, образует а-алгебру. Например, система всех измеримых по Лебегу (в смысле обычной лебеговой меры на прямой) подмножеств любого отрезка [а, Ь] есть сг-алгебра множеств. В заключение отметим еще одно свойство лебеговых мер. Определение 4. Мера \± называется полной, если из fi(A) = О и А' С А вытекает, что А' измеримо. Очевидно, что при этом /и(А') = 0. Без труда доказывается, что лебегово продолжение любой меры полно. Это вытекает из того, что при А' С А и /J>(A) = 0 неизбежно /i* (A1) = 0, а любое множество С, для которого /л* (С) = 0, измеримо, так как 0 G 9^(вт) и //(С Д 0)=//(С) =0. Всякую сг-аддитивную меру на сг-алгебре можно продолжить до полной, положив ее равной нулю для любого подмножества каждого множества нулевой меры. Дополнительные замечания. 1. Предположение о том, что исходная мера m задана на полуколь- полукольце (а не на некоторой произвольной системе множеств) существенно для однозначности ее продолжения. Рассмотрим в единичном квадрате систе- систему вертикальных и горизонтальных прямоугольников, т. е. таких прямо- прямоугольников, у которых или длина или ширина равна 1 (рис. 18), и при- припишем каждому такому прямоугольнику меру, равную его площади. На порожденную этими прямоугольниками алгебру (а тем более сг-алгебру) такая мера может быть продолжена неоднозначно (укажите хотя бы два различных продолжения).
3. Лебегово юлэюение меры 293 2. Укажем на связь между процессом продолжения меры по Лебегу и процессом пополнения метрического пространства. Заметим для этого, что т (А Д В) можно принять за расстояние между элементами А и В кольца 9^(вт). Тогда 9^(вт) ста- становится метрическим (вообще говоря, не- неполным) пространством и его пополнение состоит как раз из всех измеримых мно- множеств (при этом, однако, с метрической точки зрения множества А и В неразли- неразличимы, если /i(A Д В) = 0). 1 Рис. 18 Упражнения. 1. Пусть мера т задана на полукольце (с едини- единицей) Eт множеств из X и //* — отвечающая ей верхняя мера. Дока- Доказать, что множество А измеримо (по Лебегу) в том и только том слу- случае, если оно обладает следующим свойством, называемым измеримо- измеримостью по Каратеодори: для любого подмножества Z С X имеет место равенство f(Z) = f(Z П А) + f(Z\A). 2. Пусть сг-аддитивная мера т задана на кольце 9^ с единицей X и т(Х) = 1. Введем для каждого А С X наряду с внешней мерой /i* внутреннюю меру //*, положив Легко видеть, что всегда /i*(A) ^ /1*(А). Доказать, что (*) в том и только том случае, если множество А измеримо (в смысле опре- определения 2). В случае, когда мера задана на кольце с единицей, равенство (*) часто принимается за определение измеримости множества. 3. Расширение понятия измеримости в случае сг-конечной меры. Если исходная мера т задана в пространстве X на некото- некотором полукольце без единицы, то введенное выше определение изме- измеримости множества оказывается слишком узким. Например, если X — это плоскость, то такие множества, как вся плоскость, полоса, внешность круга и т.п., имеющие бесконечную площадь, при таком определении не попадают в число измеримых. Естественно расши- расширить понятие измеримости, допуская для меры и бесконечные зна- значения, с тем, чтобы совокупность измеримых множеств была, как и в случае, когда исходная мера задана на полукольце с единицей, сг-алгеброй (а не только й-кольцом).
294 Гл. V. Мера, измеримые функции, интеграл Мы ограничимся при этом практически наиболее важным слу- случаем так называемой сг-конечной меры, хотя соответствующее по- построение можно провести и в общем случае. Пусть сг-аддитивная мера т задана на некотором полукольце вт подмножеств множества X. Мы скажем, что эта мера а-конечна, если всё X может быть представлено как сумма счетного чис- числа множеств из &т (но не как сумма конечного числа мно- множеств из &т). Примером сг-конечной меры может служить пло- площадь, определенная на всех прямоугольниках на плоскости. Прос- Простой пример не сг-конечной меры можно получить следующим обра- образом. Пусть на отрезке [0,1] задана некоторая функция /(ж). Для каждого конечного подмножества А = {xi,... ,хп} отрезка поло- положим fi(A) = ^2f(xi). Если множество точек ж, в которых f(x) ф 0, несчетно, то такая мера на [0,1] не будет сг-конечной. Итак, пусть т есть сг-аддитивная и сг-конечная мера в X, опре- оо деленная на полукольце &т. Пусть X — (J Bi, Bi G &т. Перейдя от полукольца &т к порожденному им кольцу 9К(&т) и заменяя k-i Bk на Bk \ U Bi, можно считать, что X представлено как сумма г=1 счетного числа попарно непересекающихся измеримых мно- множеств, которые мы по-прежнему обозначим В\, В^-,--- Применив к m описанную в предыдущем пункте процедуру лебегова продол- продолжения, мы получим меру /i, определенную на й-кольце 9Я. Пусть В G Ш и Шв — система всех множеств из ШТ, содержащихся в В: Жв = {С: С еШ,В С С}. Тогда Шв есть сг-алгебра с единицей В (см. следствие из теоремы 6). Рассмотрим теперь совокупность 21 множеств А, имеющих изме- измеримое пересечение с каждым Bf. Иначе говоря, А ? 21 означает, что А представимо в виде оо А= U Ai, где AiefmBi. D) г=1 Система 21 представляет собой ст-алгебру (проверьте!), которую мы назовем прямой суммой сг-алгебр 9Лв{ • Множества D), составляю- составляющие сг-алгебру 21, мы назовем измеримыми и определим меру Д ка- каждого такого А следующим образом: если оо A=\JAi, Ai
3. Лебегово продолжение меры 295 ТО Поскольку мера всякого множества неотрицательна, стоящий здесь справа ряд сходится к некоторому неотрицательному значению или К +00. Теорема 7. В сделанных выше предположениях справедливы следующие утверждения: 1) а-алгебра 21 и мера J1 не зависят от выбора системы непересе- ОО кающихся множеств Bi из Ш, удовлетворяющих условию (J Bi = X; г=1 2) мера Jl a-аддитивна на 21; 3) совокупность множеств A Е 21, для которых J1(A) < oo, совпа- совпадает с 6-кольцом Ш и на этом 6-кольце J1 = /л. Доказательство. 1) Заметим прежде всего, что А Е 21 в том и только том случае, если А П С G Ш для любого С G ШТ. Достаточ- Достаточность этого условия ясна, поскольку оно означает, в частности, что АГ\ Bi е ЯП (i = 1,2,...); проверим его необходимость. Пусть А е 21 и С G ШТ. Положим Ci = С П Bi; тогда г=1 Так как при всяком 7V 7V N , TV 4=1 7 чг=1 то в силу теоремы б множество А П С измеримо. Пусть {Bi} и {В*} — две системы непересекающихся множеств из ШТ, такие, что UBi = UB* = X. Если A G 21, то, поскольку мера \i каждого множества из ШТ неотрицательна, выполнены равенства т.е. определяя Д(-А) по системе {Bi} или {5?}, мы получим один и тот же результат. 2) Пусть А^1), • • • е 21, А^) П А® =0,к^1,иА = \JA^k\ Тогда А; в силу о-аддитивности меры \± на ШТ: fl(A) = г=1
296 Гл. V. Мера, измеримые функции, интеграл () k=l i=l k=l т.е. J1 а-аддитивна. Наконец, 3) непосредственно следует из теоремы 6. Замечание. Описанное выше расширение понятия измеримости (с допущением для меры бесконечных значений) возможно и без предпо- предположения сг-конечности исходной меры, например, по следующей схеме. Пусть X — некоторое пространство и ЭД1 — какое-то ^-кольцо его под- подмножеств. Множество А С X называется измеримым относительно ЭД1, если АП В G 9Я для любого В ? 9Я. Нетрудно проверить, что система 21 измеримых относительно ЭД1 множеств есть сг-алгебра с единицей X, при- причем, если само ЭД1 есть сг-алгебра с той же единицей X, то 21 = ЭД1. Пусть теперь в X задана некоторая сг-аддитивная мера //, которую мы в силу п. 2 можем считать уже продолженной на некоторое ^-кольцо ЭД1 и пусть 21 — совокупность измеримых относительно ЭД1 множеств из X. Множество А ? 21 называется нулъ-мноэюеством, если /i(A П В) = 0 для любого 5 G 9Я. Теперь на 21 определяется мера /I (принимающая, вообще говоря, и бесконечные значения) следующим образом: если для данного A G 21 существует такое 5 G 9Я, что А Л В есть нуль-множество, то полагаем Для всех остальных A G 21 полагаем Нетрудно проверить, что мера /I сг-аддитивна и на ^-кольце 9Я С 21 сов- совпадает с fi. 4. Продолжение меры по Жордану. Рассматривая в § 2 этой гла- главы меры, удовлетворяющие лишь условию аддитивности, мы показали, что каждая такая мера т может быть продолжена с полукольца Eт на минимальное кольцо 9^(©т), порожденное этим полукольцом. Одна- Однако возможно и распространение меры на некоторое кольцо, более обшир- обширное, чем ЯК(&Ш). Соответствующее построение называется продолэюением меры по Жордану1). Идея этого построения, применявшегося в ряде част- частных случаев еще математиками Древней Греции, состоит в приближении «измеряемого» множества А множествами А' и А"', которым мера уже приписана, изнутри и снаружи, т. е. так, что А' С А С А". Пусть т — мера, заданная на некотором кольце *Н. Определение 5. Будем называть множество А измеримым по Жор- Жордану, если при любом е > 0 в кольце 9^ имеются множества А' и А", удовлетворяющие условиям A! Cic/, m{M'\M) <е. *) Камилл Жордан, французский математик A838-1922).
§ 3. Лебегово продолжение меры 297 Справедливо следующее утверждение. Теорема 8. Система *Н* измеримых по Жордану множеств является кольцом. Пусть 21 — система таких множеств А, для которых существует мно- множество В Э А из 9\. Для любого А и 9\ положим, по определению, р(А) = inf m(B), fi(A) = sup m(B). bca Функция jl(A) и ц(А) называются соответственно «внешней» и «внут- «внутренней» жордановой мерой множества А. Очевидно, что всегда fi(A) ^ ft(A). Теорема 9. Кольцо 9^* совпадает с системой тех множеств А ? 21, для которых fi(A) = fl{A). Для множеств из 21 имеют место следующие теоремы. п Теорема 10. Если А С |J Ak, то k = l Теорема 11. Если Ak С А (к = 1,...,п) и А{ П А3¦ = 0, то к = 1 Определим теперь функцию ц на области 6^ = 91* как общее значение внешней и внутренней меры: Из теорем 10 и 11 и из того очевидного обстоятельства, что для А ? р(А) = В(А) = т(А) вытекает следующее утверждение.
298 Гл. V. Мера, измеримые функции, интеграл Теорема 12. Функция {а(А) является мерой и продолжением ме- меры т. Изложенное построение применимо к любой мере т, определенной на кольце. В частности, его можно применить к множествам на плоскости. При этом за исходное кольцо принимается совокупность элементарных множеств (т.е. конечных сумм прямоугольников). Кольцо элементарных множеств зависит, очевидно, от выбора системы координат на плоско- плоскости (берутся прямоугольники со сторонами, параллельными осям коор- координат) . При переходе к плоской мере Жордана эта зависимость от выбора системы координат исчезает: отправляясь от любой системы координат {ж1,Ж2}, связанной с первоначальной системой {ж1,Ж2} ортогональным преобразованием xi = cos а • xi + sin а • ж 2 + сц, Х2 = — sin а • х\ + cos а • ж 2 + аг, мы получим одну и ту же меру Жордана. Этот факт вытекает из следу- следующей общей теоремы. Теорема 13. Для того чтобы жордановы продолжения /ii = j(mi) и [i2 = j(rri2) мер mi и rri2, определенных на кольцах *Hi и 9*2 совпадали, необходимо и достаточно выполнения условий: 9ti С 6М2, пц (А) = /12(А) на 9ti, %СбМ1, ш2 (А) = [л (А) на ^Н2 • Если исходная мера m определена не на кольце, а на полукольце &т, то ее жордановым продолжением естественно назвать меру получающуюся в результате продолжения т на кольцо !lH(Em) и даль- дальнейшего продолжения по Жордану. 5. Однозначность продолжения меры. Если множество А измери- измеримо по Жордану относительно меры //, т.е. принадлежит 9\* = !lH*(Em), то для любой меры Д, продолжающей т и определенной на 9**, значе- значение J1(A) совпадает со значением J(A) жорданова продолжения J = j(m). Можно показать, что продолжение меры т за пределы системы 9\* мно- множеств, измеримых по Жордану, не будет однозначно. Более точно это зна- значит следующее. Назовем множество А множеством однозначнос- однозначности для меры т, если: 1) существует мера, являющаяся продолжением меры т, определенная для множества А; 2) для любых двух такого рода мер /ii и /12 Имеет место теорема: система мноэюеств однозначности для меры т совпадает с системой мноэюеств, измеримых по Жордану относительно меры т, т. е. с кольцом 9**.
§ 3. Лебегово продолжение меры 299 Однако если рассматривать только сг-аддитивные меры и их продол- продолжения (а-аддитивные), то система множеств однозначности будет, вообще говоря, обширнее. Так как именно случай сг-аддитивных мер наиболее важен, то введем следующее определение. Определение 6. Множество А называется мноэюеством а-одно- а-однозначности для сг-аддитивной меры т, если: 1) существует сг-аддитивное продолжение Л меры т, определенное для А (т.е. такое, что А ? ©а); 2) для всяких двух таких сг-аддитивных продолжений Ai и Л2 справед- справедливо равенство Если А есть множество сг-однозначности для сг-аддитивной меры //, то в силу нашего определения существует единственно возможное значе- значение Х(А) для любого а-аддитивного продолжения меры //, определенного на А. Легко видеть, что каждое множество А, измеримое по ^Жордану, изме- измеримо и по Лебегу (но не наоборот! приведите пример), причем его жорда- нова и лебегова меры одинаковы. Отсюда непосредственно вытекает, что жорданово продолжение сг-аддитивной меры сг-аддитивно. Каждое множество А, измеримое по Лебегу, является множеством сг-однозначности для исходной меры т. Действительно, при любом е > О для А существует такое В Е *И, что fJ>*(A Д В) < s, каково бы ни было определенное для А продолжение Л меры т, Л(Б) = т\В), так как продолжение т' меры т на 9^ = !lH(Em) однозначно. Далее, Х(ААВ) ^fi*(AAB) <e и, следовательно, \Х(А)-т'(В)\ <е. Таким образом, для любых двух сг-аддитивных продолжений Ai и Лг ме- меры т имеем \\г(А)-\2(А)\<2е, откуда в силу произвольности е > О Можно показать, что система множеств, измеримых по Лебегу, исчерпы- исчерпывает всю систему множеств сг-однозначности для исходной меры т. Пусть т — некоторая сг-аддитивная мера с областью определения © и ЭД1 = L(&) — область определения ее лебегова продолжения. Легко убедиться в том, что каково бы ни было полукольцо ©i, удовлетворяющее
300 Гл. V. Мера, измеримые функции, интеграл условию 6 с &г с 9Я, всегда § 4. Измеримые функции 1. Определение и основные свойства измеримых функ- функций. Пусть X и Y — два произвольных множества и пусть в них выделены две системы подмножеств &х и Eу соответственно. Аб- Абстрактная функция у = f(x) с областью определения X, прини- принимающая значения на У, называется Fх, &у)-измеримой, если из А Е ву вытекает, что f~1(A) Е ©х- Например, если и за X, и за Y взять числовую прямую (т. е. рас- рассматривать действительные функции действительного переменно- переменного), а за 6j и 6у взять систему всех открытых (или всех замкну- замкнутых) подмножеств из М, то сформулированное определение измери- измеримости сведется к определению непрерывности. Взяв за &х и ©у систему всех борелевских множеств, мы придем к так называемым В-измеримым (или измеримым по Борелю) функциям. В дальнейшем мы будем интересоваться понятием измеримости главным образом с точки зрения теории интегрирования. В этом плане основное значение имеет понятие измеримости числовых функций, определенных на некотором множестве X с заданной на нем сг-аддитивной мерой \i. При этом за вх принимается совокуп- совокупность Eд всех измеримых относительно \± множеств из X, а за &у — совокупность всех 5-множеств на прямой. Поскольку всякая сг-ад- дитивная мера может быть продолжена на некоторую сг-алгебру, естественно с самого начала считать, что вм есть сг-алгебра. Та- Таким образом, для числовых функций мы приходим к следующему определению измеримости. Определение 1. Пусть X — множество, в котором задана сг-аддитивная мера /i, определенная на сг-алгебре вд. Действитель- Действительная функция /(ж) на X называется ц-измеримой, если для всякого борелевского множества А числовой прямой Г1 (Л) е бд. Аналогично, комплексная функция (р(х), определенная на X, на- называется /а-измеримой, если ср~1(А) G вм для всякого борелевско- борелевского подмножества комплексной плоскости. Легко проверить, что это
4. Измеримые функции 301 равносильно /i-измеримости действительной и мнимой частей этой функции по отдельности. Числовая функция, заданная на прямой, называется борелевской (или В-из меримой), если прообраз каждого борелевского множества есть борелевское множество. Теорема 1. Пусть X,Y и Z — произвольные множества с вы- выделенными в них системами подмножеств &х? © у и &z соответ- соответственно и пусть определенная на X функция у = /(ж) Fх, ву)-из- ву)-измерима, а определенная на Y функция z = g(y) (©у, &z)-измерима. Тогда функция z = <р(х) = g(f(x)) (&x,&z) -измерима. Коротко: измеримая функция от измеримой функции есть из- измеримая функция. Доказательство. Если A Е ©z, то в силу (©у, ©^-изме- ©^-измеримости функции g имеем: д~1(А) = В G ©у. В свою очередь в силу (©х, ©у)-измеримости функции / множество f~1(B) при- принадлежит ©х, т.е. /^(g^)) = cp~1(A) G ©x, т.е. функция ip (©х, ©^-измерима. Следствие. Борелевская функция от /и-измеримой числовой функции [i-измерима. В частности, непрерывная функция от fi-из- меримой \i-измерима. В дальнейшем, в случаях, когда это не может вызвать недоразу- недоразумения, мы вместо «//-измеримости» будем писать просто «измери- «измеримость». Теорема 2. Для того чтобы действительная функция f(x) бы- была измерима, необходимо и достаточно, чтобы при любом действи- действительном с множество {х : f{x) < с} было измеримо. Доказательство. Необходимость условия ясна, так как по- полупрямая (—оо, с) есть борелевское множество. Для доказательства достаточности заметим прежде всего, что сг-алгебра, порожденная системой Е всех полупрямых (—оо,с), совпадает с сг-алгеброй всех борелевских множеств на прямой. Но согласно п. 5 § 5 гл. I отсюда следует, что прообраз каждого борелевского множества принадле- принадлежит сг-алгебре, порожденной прообразами полупрямых, принадле- принадлежащих Е, т.е. измерим. Доказанное условие часто принимают за определение измеримо- измеримости, т.е. называют функцию f(x) измеримой, если все множества {х : f(x) < с} измеримы.
302 Гл. V. Мера, измеримые функции, интеграл 2. Действия над измеримыми функциями. Покажем, что совокупность измеримых функций, заданных на некотором множе- множестве, замкнута относительно арифметических операций. Теорема 3. Сумма, разность и произведение двух измеримых функций измеримы. Частное двух измеримых функций, при усло- условии, что знаменатель не обращается в нуль, тоже измеримо. Доказательство этой теоремы проведем в несколько шагов. 1) Если / измерима, то, очевидно, измеримы и функции kf и а + / при любых постоянных к и а. 2) Далее, если / и g — измеримые функции, то множество {x:f(x) >g(x)} измеримо. Действительно, ОО {х : f(x) > g(x)} = U ({х : f(x) > гк} П {х : д(х) < гк}), к=1 где сумма берется по всем рациональным числам г/., занумерован- занумерованным в любом порядке. Отсюда получаем, что {х : /(ж) > а - д(х)} = {х : f(x) + д(х) > а} измеримо, т. е. сумма измеримых функций измерима. 3) Из 1) и 2) следует измеримость разности / — д. 4) Произведение измеримых функций измеримо. Действительно, воспользуемся тождеством fg = \[(f + 9J-{f-9?]- Стоящее справа выражение есть измеримая функция. Это вытекает из 1)-3) и следствия из теоремы 1, в силу которого квадрат измери- измеримой функции измерим. 5) Если f(x) измерима и f(x) ф 0, то и 1//(ж) измерима. Дей- Действительно, если с > 0, то {х : 1//(х) < с} = {х : f(x) > 1/с} U {х : f(x) < 0}; если с < 0, то {х : 1//(х) < с} = {х : 0 > f(x) > 1/с}; а если с = 0, то {х : 1//(х) < с} = {х : f(x) < с}. Каждый раз справа мы получаем измеримое множество. Из 4) и 5) следует измеримость частного f(x)/g(x) (при условии д{х) ф 0). Итак, мы показали, что арифметические действия над измери- измеримыми функциями снова приводят к измеримым функциям. Покажем теперь, что совокупность измеримых функций замкнута по отношению не только к арифметическим операциям, но и к опе- операции предельного перехода.
4. Измеримые функции 303 Теорема 4. Предел сходящейся при каждом х Е X последова- последовательности измеримых функций измерим. Доказательство. Пусть fn{x) —> f(x); тогда {х : f{x) < с} = U U П Iх ¦ fm(x) < с - 1/к}. A) к n m>n Действительно, если f(x) < с, то существует такое /с, что f(x) < < с —2/к; далее, при этом к можно найти столь большое п, что при m ^ n выполнено неравенство fm(x) < с- 1/к, а это и означает, что х войдет в правую часть A). Обратно, если х принадлежит правой части равенства A), то су- существует такое к, что при всех достаточно больших m fm(x) <c-l/k, но тогда f(x) < с, т.е. х входит в левую часть равенства A). Если функции fn(x) измеримы, то множества {х : fm(x) < с- 1/к} измеримы. Так как совокупность измеримых множеств есть сг-ал- гебра, то в силу A) множества {х : f{x) < с} тоже измеримы, что и доказывает измеримость /(ж). Замечание. Как видно из сказанного, понятие измеримости функции не связано с наличием в рассматриваемых пространствах какой-либо меры. Должны лишь быть выделены системы множеств, называемых измеримыми. Однако фактически понятие измеримос- измеримости используется, как правило, для функций, определенных на не- некотором пространстве X с фиксированной мерой, заданной на ка- какой-либо сг-алгебре его подмножеств. Именно эта ситуация и будет рассматриваться в дальнейшем. Как уже было отмечено, сг-аддитивную меру, определенную на сг-алгебре в подмножеств некоторого множества X, можно без огра- ограничения общности считать полной, т. е. считать, что если А — изме- измеримое множество меры нуль, то всякое его подмножество А' изме- измеримо (и, конечно, /и(А') = 0). Это условие полноты меры мы всюду в дальнейшем будем предполагать выполненным. 3. Эквивалентность. При изучении измеримых функций часто можно пренебречь их значениями на множестве меры нуль. В связи с этим возникает следующее определение.
304 Гл. V. Мера, измеримые функции, интеграл Определение 2. Две функции, / и д, заданные на одном и том же измеримом множестве Е, называются эквивалентными (обозна- (обозначение: f ~ д), если ф : f(x) ф д(х)} = 0. Введем еще следующую терминологию. Говорят, что некоторое свойство выполнено почти всюду на Е, если оно выполнено на Е всюду, кроме, быть может, точек, образующих множество меры нуль. Таким образом, две функции называются эквивалентными, если они совпадают почти всюду. Теорема 5. Функция /(х), определенная на некотором изме- измеримом множестве Е и эквивалентная на нем некоторой измеримой функции д(х), тоже измерима. Доказательство. Из определения эквивалентности следует, что множества {х : /(ж) < а} и {х : д(х) < а} могут отличаться друг от друга только на некоторое множество меры нуль, следовательно (поскольку мера предположена полной), если второе из них измеримо, то измеримо и первое. Замечание. В классическом анализе понятие эквивалентности функций не играет существенной роли, так как там в основном рас- рассматриваются непрерывные функции одного или нескольких пере- переменных, а для них эквивалентность равносильна тождественности. Точнее, если две функции, /ид, непрерывные на некотором сегмен- сегменте Е, эквивалентны (относительно меры Лебега), то они совпадают. Действительно, если /(жо) Ф д(хо) в какой-либо точке жо, то в силу непрерывности /ид найдется окрестность точки жо, во всех точках которой /(х) ф д(х). Мера такой окрестности положительна, поэто- поэтому непрерывные функции не могут быть эквивалентны, если они не совпадают. Для произвольных измеримых функций эквивалентность вовсе не означает совпадения. Например, функция на прямой, равная еди- единице в рациональных точках и нулю в иррациональных, эквивалент- эквивалентна функции, тождественно равной нулю. 4. Сходимость почти всюду. Поскольку во многих случаях поведение измеримой функции на том или ином множестве меры нуль для нас несущественно, будет естественно ввести следующее обобщение обычного понятия поточечной сходимости.
4. Измеримые функции 305 Определение 3. Последовательность {/п(ж)} функций, опре- определенных на некотором пространстве X с заданной на нем мерой, называется сходящейся почти всюду к функции /(ж), если lim /„(ж) = /(ж) B) n—юо для почти всех ж Е X (т. е. множество тех точек ж, в которых B) не выполняется, имеет меру нуль). Пример. Последовательность функций fn(x) = (—ж)п, опреде- определенных на отрезке [0,1], при п —У оо сходится к функции /(ж) =0 почти всюду (а именно, всюду, кроме точки ж = 1). Теорема 4 допускает следующее обобщение. Теорема 4'. Если последовательность измеримых функций /п(ж) сходится к функции /(ж) почти всюду на X, то /(ж) также измерима. Доказательство. Пусть А — то множество, на котором lim /п(ж) = /(ж). пюо По условию, /i(X \ A) =0. Функция /(ж) измерима на А, а так как на множестве меры нуль, очевидно, вообще всякая функция измерима, то /(ж) измерима на X \ А, следовательно, она измерима и на множестве X. Упражнение. Пусть последовательность измеримых функций fn(x) сходится почти всюду к некоторой предельной функции /(ж). Доказать, что последовательность fn(x) сходится почти всюду к д{х) в том и только том случае, если д(х) эквивалентна /(ж). 5. Теорема Егорова. В 1911 г. Д. Ф. Егоровым была доказана следующая важная теорема, устанавливающая связь между поня- понятиями сходимости почти всюду и равномерной сходимости. Теорема 6. Пусть Е — множество конечной меры и последо- последовательность измеримых функций fn(x) сходится на Е почти всюду к /(ж). Тогда для любого S > 0 существует такое измеримое множе- множество Е$ С Е, что 1) ii(Es) > ii{E) - S; 2) на множестве Е$ последовательность {fn(x)} сходится к /(ж) равномерно. Доказательство. Согласно теореме 4; функция /(ж) измери- измерима. Положим
306 Гл. V. Мера, измеримые функции, интеграл Таким образом, Е7^ при фиксированных тип означает множество всех тех точек ж, для которых \fi{x)-f(x)\<l/m при всех г ^ п. Пусть Ет = U К- п=1 Из определения множеств Е™ ясно, что при фиксированном т г с • • • с ьп с ... В силу того, что сг-аддитивная мера непрерывна, для любого m и любого S > 0 найдется такое по(га), что ^m\EZ(m)) Положим qq тр r*\ тргп ^ = I I bno(m) m=l и покажем, что так построенное Е$ удовлетворяет требованиям тео- теоремы. Докажем сначала, что на Е$ последовательность {fi(x)} сходится равномерно к функции f(x). Это сразу вытекает из того, что если х ? Е$, то для любого m \fi(x) - f(x)\ < 1/m при г > no(m). Оценим теперь меру множества Е\Е$. Для этого заметим, что при всяком m имеем /л(Е \ Ет) = 0. Действительно, если ж0 G Е \ Ет, то существуют сколь угодно большие значения г, при которых |/гОо) -f(xO)\ ^ 1/ш, т.е. последовательность {fn(x)} в точке xq не сходится к f(x). Так как, по условию, {fn(x)} сходится к /(ж) почти всюду, то ц(Е\Ет) =0. Отсюда следует, что ,, ( тр \ тртп \ ,,( тртп \ тртп \ ^ г /гут 1ЛI Л/ \ Л/ ( \ I — LI I iz/ \ xZV ( \ I \ O/Z Поэтому \es) = Je\ п ^н)=к и (?\^ (X) Теорема доказана.
4. Измеримые функции 307 6. Сходимость по мере. Определение 4. Говорят, что последовательность измеримых функций fn(x) сходится по мере к функции /(ж), если для любо- любого а > 0 lim ii{x:\fn(x)-f(x)\ ^a} = 0. п—>-оо Нижеследующие теоремы 7 и 8 устанавливают связь между поня- понятиями сходимости почти всюду и сходимости по мере. Как и в пре- предыдущем пункте рассматриваемая мера предполагается конечной. Теорема 7. Если последовательность измеримых функций {fn(x)} сходится почти всюду к некоторой функции f(x), то она сходится к той же самой предельной функции f(x) по мере. Доказательство. Из теоремы 4' следует, что предельная функция /(ж) измерима. Пусть А — то множество (меры нуль), на котором /п(ж) не стремятся к /(ж). Пусть, далее, Ek(a) = {x:\fk(x)-f(x)\^a}, оо оо Rn(a) = U Ek{a), М = f) Rn(a). k=n n=l Ясно, что все эти множества измеримы. Так как то в силу свойства непрерывности меры /i(Rn(a)) ->• /л(М) при п ->• оо. Проверим теперь, что МсА. C) Действительно, если хо ^ А, т. е. если lim /nOo) = /Оо), п—>-оо то для данного a > 0 найдется такое п, что \fk(xo) - /0о)| < о- при k ^ п, т.е. хо ? Rn{&) и, тем более, хо ? М. Но /л(А) = 0, и поэтому из C) вытекает, что /и(М) = 0, и, следо- следовательно, n{Rn{o~)) —У 0 при п —У оо; так как Еп(о~) С Rn(o~), то теорема доказана.
308 Гл. V. Мера, измеримые функции, интеграл Нетрудно убедиться, что из сходимости последовательности функций по мере, вообще говоря, не следует ее сходимость по- почти всюду. Действительно, определим для каждого натурального к на полуинтервале @,1] функции Ак) Ак) h ? • • • ?/л следующим образом: [ 0 при остальных значениях х. Занумеровав все эти функции подряд, мы получим последова- последовательность, которая, как легко проверить, сходится по мере к нулю, но в то же время не сходится ни в одной точке (докажите это!). Упражнение. Пусть последовательность измеримых функций {fn(x)} сходится по мере к некоторой предельной функции f(x). Дока- Доказать, что последовательность {fn(x)} будет сходиться по мере к функции д(х) в том и только в том случае, если д{х) эквивалентна /(ж). Хотя приведенный выше пример показывает, что теорема 7 не мо- может быть обращена в полной мере, тем не менее справедлива сле- следующая теорема. Теорема 8. Пусть последовательность измеримых функций {fn(x)} сходится по мере к f(x). Тогда из этой последовательности можно выбрать подпоследовательность {fnk(x)}> сходящуюся к f(x) почти всюду. Доказательство. Пусть ?]_, е^-, ... — некоторая последова- последовательность положительных чисел, стремящихся к нулю, lim en = 0, п—>-оо и пусть положительные числа 771,..., г]п,... таковы, что ряд сходится. Построим последовательность индексов 7li < 712 < ... следующим образом: выберем п\ так, чтобы ф: \fni(x)-f(x)\ ^?i}<t>i (такое 7i 1 обязательно существует); далее выберем п^ > п\ так, что- чтобы fi{x : \fn2(x) - f(x)\ ^ e2} < 7/2.
4. Измеримые функции 309 Вообще, выберем rik > rik-i так, чтобы fi{x : \fnk(x) ~ /0I ^ ^} < ^- Покажем, что построенная последовательность сходится к /О) почти всюду. Действительно, пусть оо оо Ri=\J{x:\fnk(x)-ttx)\>eh Q=f]Ri- k=i i=l Так как Ri D R2 D R3 D • • • D Rn D • • •, то в силу непрерывности меры ц(Щ) —У n(Q)- оо С другой стороны, ясно, что /i(Ri) < J2 Vk, откуда /i(Ri) -У О k=i при г —У оо, т.е. /jl(Q) = 0. Остается проверить, что во всех точках множества Е \Q имеет место сходимость Пусть хо G E\Q. Тогда найдется такое го, что хо (? Ri0. Это означает, что для всех k ^ го хо i {x: \fnh{x) -/0I ^^}» т.е. |/nfc0o) - Так как, по условию, Sk —У 0, то lim /nfc0o) = /Оо)- Теорема доказана. 7. Теорема Лузина. С-свойство. Определение измеримой функции, данное в самом начале этого параграфа, относится к функциям на произвольных множествах и в общем случае никак не связано с понятием непрерывной функции. Однако, если речь идет о функциях на отрезке, то имеет место следующая важная теорема, установленная в 1913 г. Н. Н. Лузиным. Теорема 9. Для того чтобы функция / (ж), заданная на отрезке [а, Ь], была измерима, необходимо и достаточно, чтобы для любого е > 0 существовала такая непрерывная на [а, Ь] функция ср(х), что Иначе говоря, измеримая функция может быть сделана непре- непрерывной на [а, Ь] путем ее изменения на множестве сколь угодно ма- малой меры. Про функцию на отрезке, которая может быть сделана не-
310 Гл. V. Мера, измеримые функции, интеграл прерывной с помощью такой «малой деформации», говорят, что она обладает С-свойством (термин Н. Н. Лузина). Как показывает тео- теорема Лузина, для функций числового аргумента С-свойство можно положить в основу самого определения измеримости. Доказатель- Доказательство теоремы Лузина можно получить, воспользовавшись теоремой Егорова (проведите это доказательство!). Упражнение. Доказать, что если А — измеримое множество на от- отрезке [а, Ь], то для любого s>0 найдутся такое открытое множество GdA и такое замкнутое множество Fci, что /i(G \ А) < е и /i(A \ F) < е. § 5. Интеграл Лебега Понятие интеграла Римана, известное из элементарного курса анализа, применимо лишь к таким функциям, которые или непре- непрерывны или имеют «не слишком много» точек разрыва. Для измери- измеримых функций, которые могут быть разрывны всюду, где они опреде- определены (или же вообще могут быть заданы на абстрактном множестве, так, что для них понятие непрерывности просто не имеет смысла), римановская конструкция интеграла становится непригодной. Вме- Вместе с тем для таких функций имеется весьма совершенное и гибкое понятие интеграла, введенное Лебегом. Основная идея построения интеграла Лебега состоит в том, что здесь, в отличие от интеграла Римана, точки х группируются не по признаку их близости на оси ж, а по признаку близости значений функции в этих точках. Это сразу же позволяет распространить понятие интеграла на весьма широкий класс функций. Кроме того, интеграл Лебега определяется совершенно одинако- одинаково для функций, заданных на любых пространствах с мерой, в то время как интеграл Римана вводится сначала для функций одного переменного, а затем уже с соответствующими изменениями пере- переносится на случай нескольких переменных. Для функций же на аб- абстрактных пространствах с мерой интеграл Римана вообще не имеет смысла. Всюду, где не оговорено противное, будет рассматриваться не- некоторая полная сг-аддитивная мера /i, определенная на сг-алгебре множеств с единицей X. Все рассматриваемые множества А С X будут предполагаться измеримыми, а функции /(ж) — определен- определенными для х Е X и измеримыми. Нам удобно будет определить интеграл Лебега вначале для так называемых простых функций, а затем распространить его
5. Интеграл Лебега 311 на существенно более широкий класс функций. Пункты 2—5 содер- содержат построение интеграла Лебега для случая, когда мера всего пространства конечна. Случай бесконечной меры рассматривается в п. 6 этого параграфа. 1. Простые функции. Определение 1. Функция /(ж), определенная на некотором пространстве X с заданной на нем мерой, называется простой, если она измерима и принимает не более чем счетное число значений. Структура простых функций характеризуется следующей теоре- теоремой. Теорема 1. Функция / (ж), принимающая не более чем счетное число различных значений измерима в том и только том случае, если все множества Ап = {ж : /(ж) = уп} измеримы. Доказательство. Необходимость условия ясна, так как каж- каждое Ап есть прообраз одноточечного множества {уп}, а всякое одно- одноточечное множество является борелевским. Достаточность следует из того, что в условиях теоремы прообраз f~1(B) любого борелев- ского множества есть объединение (J Ап не более чем счетного упев числа измеримых множеств Ап, т.е. измерим. Использование простых функций в построении интеграла Лебега будет основано на следующей теореме. Теорема 2. Для измеримости функции /(ж) необходимо и до- достаточно, чтобы она могла быть представлена в виде предела рав- равномерно сходящейся последовательности простых измеримых функ- функций. Доказательство. Достаточность ясна из теоремы 4 преды- предыдущего параграфа. Для доказательства необходимости рассмотрим произвольную измеримую функцию f(x) и положим fn(x) = ттг/п, если m/n ^ /(ж) < (т + 1)/п (здесь m — целые, п — целые по- положительные). Ясно, что функции /п(ж) простые; при п —У оо они равномерно сходятся к /(ж), так как |/(ж) — /п(ж)| ^ 1/п.
312 Гл. V. Мера, измеримые функции, интеграл 2. Интеграл Лебега для простых функций. Мы введем по- понятие интеграла Лебега сначала для функций, названных выше про- простыми, т. е. для измеримых функций, принимающих конечное или счетное число значений. Пусть / — некоторая простая функция, принимающая значения 2/ь..., Уп,---] У% ФУз при г ф j, и пусть А — некоторое измеримое подмножество X. Естественно определить интеграл от функции / по множеству А равенством J f(x)d/n = y^2yniii(Ari), где Ап = {х : х е A, f(x)=yn}, A) А п если ряд справа сходится. Мы приходим к следующему определе- определению (в котором по понятным причинам заранее постулируется аб- абсолютная сходимость ряда). Определение 2. Простая функция / называется интегрируе- интегрируемой или суммируемой (по мере /i) на множестве А, если ряд A) абсолютно сходится. Если / интегрируема, то сумма ряда A) назы- называется интегралом от / по множеству А. В этом определении предполагается, что все уп различны. Можно, однако, представить значение интеграла от простой функции в ви- виде суммы произведений вида Ck^(Bk) и не предполагая, что все с/, различны. Это позволяет сделать следующая лемма. Лемма. Пусть А = (J В^, Bid В3 = 0 при i ф j и пусть на каж- к дом множестве В^ функция f принимает только одно значение с/.; тогда А к причем функция f интегрируема на А в том и только том случае, когда ряд B) абсолютно сходится. Доказательство. Легко видеть, что каждое множество Ап = {х : х G А, /(ж) = уп} является объединением тех ??/,, для которых с/. = уп. Поэтому n n ск=уп Так как мера неотрицательна, то Ск=уп
5. Интеграл Лебега 313 т.е. ряды ^2yn/j(An) и ^2ck/^(Bk) абсолютно сходятся или расхо- п к дятся одновременно. Лемма доказана. Установим некоторые свойства интеграла Лебега от простых функций. А) / [f(x) + g(x)]dfi = / f{x) d/i+ f g(x) d», A A A причем из существования интегралов в правой части равенства следует существование интеграла в левой. Для доказательства предположим, что / принимает значения fi на множествах Fi С A, a g — значения gj на множествах Gj С А, так что Ji= / f(x)dn = Y,fw(Fi), C) А г Тогда в силу леммы = / g(x) d/i = ^gj/iiGj). D) J = I [fix) + 9{x)№ = Y, Y,(fi + 9j) KFi П Gj); E) А г j HO fi(Fi) = Yffi(FinGj), М^-) = ^М^ПС,-), j г так что из абсолютной сходимости рядов C) и D) следует и абсо- абсолютная сходимость ряда E); при этом J = Jx + J2. Б) Для любого постоянного к J kf(x)dfi = к J f(x)dfjL, А А причем из существования интеграла в правой части следует су- существование интеграла в левой части. (Проверяется непосред- непосредственно.) В) Ограниченная на множестве А простая функция / интегри- интегрируема на А, причем если \f(x)\ ^ M на А, то f(z)dfi, A (Проверяется непосредственно.)
314 Гл. V. Мера, измеримые функции, интеграл 3. Общее определение интеграла Лебега на множестве ко- конечной меры. Определение 3. Назовем функцию / интегрируемой (сум- (суммируемой) на множестве А, если существует последовательность простых интегрируемых на А функций {/п}, сходящаяся рав- равномерно к/. Предел /= lim f fn(x)dn F) А обозначим / А и назовем интегралом функции f no множеству А. Это определение корректно, если выполнены следующие условия. 1. Предел F) для любой равномерно сходящейся последователь- последовательности простых интегрируемых на А функций существует. 2. Этот предел при заданной функции / не зависит от выбора последовательности {/п}. 3. Для простых функций определение интегрируемости и инте- интеграла равносильно данному в п. 2. Все эти условия действительно выполнены. Для доказательства первого достаточно заметить, что в силу свойств А), Б) и В) интеграла от простых функций fn(x)dfi- Г fm(x)dfi ^ fi(A) sup \fn(x) - fm(x)\. G) А Х^А Для доказательства второго условия надо рассмотреть две по- последовательности, {/п} и {/^}, сходящиеся к /. Если бы предел F) для этих двух последовательностей принимал различные значения, то для последовательности, полученной объединением этих двух, предел F) не существовал бы, что противоречит первому условию. Наконец, для доказательства справедливости третьего условия до- достаточно рассмотреть последовательность, в которой /п равняется / для всех п. Замечание. Мы видим, что в построении интеграла Лебега имеются два существенных этапа. Первый — непосредственное оп- определение интеграла (как суммы ряда) для некоторого класса функ- функций (простых суммируемых функций), достаточно простого и в то же время достаточно обширного, второй — распространение опре- определения интеграла на существенно более широкий класс функций
5. Интеграл Лебега 315 с помощью предельного перехода. По существу, сочетание этих прие- приемов — непосредственного конструктивного, но узкого определения и последующего предельного перехода присутствует в любом по- построении интеграла. Установим основные свойства интеграла Лебега. Непосредствен- Непосредственно из определения следует, что: I. fl.dii = ii(A). (8) П. Для любого постоянного к f kf(x)dfi = k f f(x)dfi, (9) A A причем из существования интеграла в правой части вытекает су- существование интеграла в левой. Это свойство выводится при помощи предельного перехода из свойства Б) для интеграла от простых функций. III. Аддитивность: f [f(x) + g(x)} dfi= f f(x) d/i+ f g(x) d/x, A0) A A A причем из существования интегралов в правой части вытекает существование интеграла в левой. Доказательство получается предельным переходом из свойст- свойства А) интеграла от простых функций. IV. Ограниченная на множестве А функция f интегрируема на А. Доказательство получается предельным переходом из свойст- свойства В) интеграла от простых функций, с использованием теоремы 2. V. Монотонность: если f(x)^ 0, то //(х)^О0 A1) А (в предположении, что интеграл существует). Для простых функций это утверждение следует прямо из опре- определения, а в общем случае его можно вывести, заметив, что если / измерима и неотрицательна, то найдется равномерно сходящая- сходящаяся к ней последовательность (см. теорему 2) неотрицательных простых функций. Из последнего свойства сразу следует, что если /(ж) ^ д(х), то / f(x)dfi^ f g(x)dfi, A2) А А а поэтому, если т ^ f(x) ^ М для всех (или почти всех) х G А, то тц(А) ^ f /(ж) dn ^ Мц(А). A3) А
316 Гл. V. Мера, измеримые функции, интеграл VI. Если ц(А) = 0, то J f(x) d\i = 0. А VI'. Если f(x) = g{x) почти всюду, то I f(x)d/i = I g(x)d/i, А А причем оба интеграла существуют или не существуют одновре- одновременно. Эти два утверждения непосредственно вытекают из определения интеграла Лебега. VII. Если функция ер интегрируема на А и почти всюду \f(x)\ ^ ^ ip(x), то / также интегрируема на А. Действительно, если / и ср — простые функции, то, удалив из множества А некоторое множество меры нуль, оставшееся множе- множество А' можно представить как объединение конечного или счетного числа множеств, на каждом из которых / и ip постоянны: /(ж) = ап, (р(х) = Ьп, причем \ап\ ^ Ъп. Из интегрируемости ср вытекает, что ^2 \ап\ и{Ап) ^ ^2 ЬпКАп) = / ф(х) dfi,= I <p(x) п п А' А Поэтому / тоже интегрируема, и \f f(x)dn I f(x)dfi А' п n)= I \f(x)\dfjL^ I <p(x)dfjL. n A' A В общем случае это утверждение доказывается предельным перехо- переходом с использованием теоремы 2. VIII. Интегралы h=ff(x)dii, I2= f\f(x)\dfi A4) А А существуют или не существуют одновременно. В самом деле, из существования интеграла 1^ вытекает существо- существование 1\ в силу свойства VII. Обратное для случая простой функции вытекает из определения интеграла, а для общего случая доказывается предельным перехо- переходом с использованием теоремы 2; при этом нужно воспользоваться неравенством |а|-|ЬК|а-Ь|. 4. а-аддитивность и абсолютная непрерывность интегра- интеграла Лебега. В предыдущем пункте были сформулированы свойства
5. Интеграл Лебега 317 интеграла Лебега по фиксированному множеству. Сейчас мы уста- установим некоторые свойства интеграла Лебега, рассматривая выра- выражение F(A)= f f(x)d» А как функцию множества, определенную на совокупности измери- измеримых множеств. Установим, прежде всего, следующее свойство: Теорема 3. Если А = (J An; Ai П Aj = 0 при г ф j, то п f f(x)dn = Y, I /0»0Ф, A5) A n An причем из существования интегралов левой части вытекает суще- существование интегралов и абсолютная сходимость ряда в правой ча- части. Доказательство. Сначала проверим утверждение теоремы для простой функции /, принимающей значения Пусть Вк = {х : х G А, /(ж) = ук}, Впк = {х : х е Ап, /(ж) = ук}- Тогда I /о) d/i = ^2 ук^(вк) = ^2vk^2 квпк) = А к к п = Е Е vkKBnk) = Е / /(ж) ф- п к п Ап Так как ряд ^2yk[i(Bk), в предположении интегрируемости / на А, абсолютно сходится, а меры всех множеств неотрицательны, то схо- сходятся абсолютно и все остальные ряды в цепочке равенств A6). В случае произвольной функции / из ее интегрируемости на А вытекает, что для любого е > 0 существует простая интегрируемая на А функция д, удовлетворяющая условию \f(x)-g(x)\<s. A7) Для д имеем / «?ог)ф = Е / з(ж)ф> А п Ап
318 Гл. V. Мера, измеримые функции, интеграл причем д интегрируема на каждом множестве Ап и ряд A8) аб- абсолютно сходится. Из этого последнего обстоятельства и из оцен- оценки A7) вытекает, что / тоже интегрируема на каждом Ап и \ f{x)dn- I g(x)d An An f(x) d/i- I g(x) d/i ^ e/i(A), 'A A что вместе с A8) приводит к абсолютной сходимости ряда п Ап и к оценке п Ап А Так как г > 0 произвольно, то п Ап А Следствие. Если f интегрируема на А, то f интегрируема и на любом измеримом множестве А' С А. Мы показали, что из интегрируемости функции / по множеству А следует, что если А = UAn и А{ П Aj = 0, i ф j, то / интегрируема по каждому Ап и интеграл по А равен сумме интегралов по мно- множествам Ап. Это утверждение может быть обращено в следующем смысле. Теорема 4. Если А = (J Ап, А^ П Aj = 0 при i ф j и ряд сходится, то функция / интегрируема на А и f f(x)dll = Y< I f^d^ A n An Доказательство. Новым по сравнению с предыдущей теоре- теоремой здесь является утверждение, что из сходимости ряда A9) вы- вытекает интегрируемость / на А. Сначала проведем доказательство для случая простой функ- функции /, принимающей значения /^. Положив Bi = {x:xeA, f(x)=fi}, Аы = АпПВи
5. Интеграл Лебега 319 имеем \JAni=Bi Ж f |/ Ап г Из сходимости ряда A9) вытекает, что сходятся ряды п г г Сходимость последнего ряда означает, что существует интеграл В общем случае аппроксимируем / простой функцией / так, что \f(x)-f(x)\<s. B0) Тогда _ / |()| / |()| / / Ап Ап и так как ряд ^2 ц(Ап) = /л(А) сходится, из сходимости ряда A9) п вытекает сходимость ряда п Ап т. е. по только что доказанному, интегрируемость на А простой функции /. Но тогда в силу B0) исходная функция / тоже инте- интегрируема на А. Теорема доказана. Неравенство Чебышева. Если (р(х) ^ 0 на А и с > 0, то fi{x : х е А, ф) ^с}^1 I ф) d». B1) А Действительно, пусть А' = {х: х G А, ф) ^ с}. Тогда f(f(x)d/i= f(f(x)d/i-\- Г (f(x)d/i^ Г(f(x)d/i ^ А А' А\А' А' Следствие. Если А то f{x) = О почти всюду. В самом деле, в силу неравенства Чебышева, имеем г: х е A, \f(x)\ ^ iI ^ n J \f(x)\d/i = 0 А
320 Гл. V. Мера, измеримые функции, интеграл для всех п. Поэтому В предыдущем пункте было указано, что интеграл Лебега по мно- множеству нулевой меры равен нулю для любой функции /. Это утверждение можно рассматривать как предельный случай следующей важной теоремы. Теорема 5 (абсолютная непрерывность интеграла Лебега). Если f(x) — суммируемая на множестве А функция, то для каждого г > 0 существует такое S > 0, что \ff(x)dfi < г для всякого измеримого е С А такого, что /i(e) < 5. Доказательство. Заметим прежде всего, что наше утвержде- утверждение очевидно, если / ограничена. Пусть теперь / — произвольная суммируемая на А функция. Положим Ап = {х: х е A, n ^ \f(x)\ < п + 1}, N Д/v = U An, Cn = A \ Д/у. Тогда в силу теоремы 3 оо А п=0 Ап Выберем N так, что оо Е n=N+l CN \f(x)\dli= f n=N+l и пусть Если теперь /i(e) < S, то е eHBN Первый из стоящих справа интегралов не превосходит г/2 (свой- (свойство V), а второй — не больше, чем интеграл, взятый по всему мно- множеству (Т/у, т. е. также не превосходит г/2; таким образом, получаем
5. Интеграл Лебега 321 Установленные свойства интеграла как функции множества приво- приводят к следующему результату. Пусть / — неотрицательная функ- функция, суммируемая на пространстве X по мере \±. Тогда функция F(A)= f f(x)dfi А определена для всех измеримых множеств А С X, неотрицатель- неотрицательна и а-аддитивна, т. е. удовлетворяет условию: если А = (J Ап п и А{ П Aj = 0, то F(A) = ^F(An). Иными словами, интеграл п от неотрицательной функции обладает как функция множества всеми свойствами а-аддитивной меры. Эта мера определена на той же сг-алгебре, что и исходная мера /i, и связана с \i условием: если 1л(А) = 0, то и F(A) = 0. 5. Предельный переход под знаком интеграла Лебега. Вопрос о предельном переходе под знаком интеграла, или, что то же самое, о почленном интегрировании сходящегося ряда, часто возни- возникает в различных задачах. В классическом анализе устанавливается, что достаточным усло- условием возможности такого предельного перехода является равномер- равномерная сходимость соответствующей последовательности (ряда). Сейчас мы установим некоторые теоремы о предельном переходе под знаком интеграла Лебега, представляющие собой далеко иду- идущие обобщения соответствующих теорем классического анализа. Теорема б (Лебег). Если последовательность {fn} на А схо- сходится к f и при всех п \fn{x)\ < ф), где if интегрируема на А, то предельная функция f интегрируема на А и I fn(x)dii^ I f(x)dfi. А А Доказательство. Из условия теоремы легко следует, что |/(ж)| ^ Ц>(х). Поэтому / (п. 3, свойство VII) интегрируема. Пусть е > 0 произвольно. По теореме 5 (об абсолютной непрерывности интеграла) найдется такое S > 0, что, если /л(В) < 5, то J <p{x)dii<l. B2) в В силу теоремы Егорова множество В, удовлетворяющее условию fi(B) < й, можно выбрать так, что последовательность {/п} сходится
322 Гл. V. Мера, измеримые функции, интеграл на С = А\В равномерно. Следовательно, найдется такое JV, что при п ^ N и х Е С выполнено неравенство Тогда J f(x)d/i- J fn(x)d/i = J [f(x)-fn(x)]d/i + J f(x)d/i- f fn(x)d/i, А И так как А \№ 1/ ' f(x) х) и d\i - с \fn(x)\ ^<p( - ffn(x)d» X) ТО в в силу B2) = е. в получаем Следствие. Если \fn(x)\ ^ М = const и /п —>- /, то | fn(x)djjJ^ I f(x)dfi. А А Замечание. Поскольку значения, принимаемые функцией на множестве меры 0, не влияют на величину интеграла, в теореме б достаточно предположить, что {/п} сходится к / почти всюду и что каждое из неравенств |/n(^)| ^ р(х) также выполняется лишь почти всюду. Теорема 7 (Б. Лев и). Пусть на множестве А причем функции fn интегрируемы и их интегралы ограничены в со- совокупности I fn(x)dn^K. А Тогда почти всюду на А существует (конечный) предел f(x) = lim fn(x), B3) п—Уоо функция f интегрируема на А и I fn(x)djjJ^ I f(x)dfi. А А При этом на множестве, на котором предел B3) не существует, функцию / можно задать произвольно, например, положив на этом множестве /(ж) = 0. Доказательство. Будем предполагать fi(x) ^ 0, так как об- общий случай легко сводится к этому путем перехода к функциям fn = fn - /l •
5. Интеграл Лебега 323 Рассмотрим множество П = {х : х е A, fn(x) ->• оо}. Легко видеть, что П = f] (J fin , где г п fiM = {ж : ж G Д /„(ж) > г}. В силу неравенства Чебышева B1) Так как п{г) С ••• С П^г) С ..., то ^({Ju^) ^ #/г; но при любом г ( , Ui) поэтому /jl(Q) ^ Х/г. Ввиду произвольности г отсюда следует, что ц(п) = 0. Тем самым доказано, что монотонная последовательность {fn(x)} почти всюду на А имеет конечный предел f(x). Обозначим через Аг множество тех точек х G А, для которых г- 1 ^ /(ж) < г, г = 1,2,..., и положим ср(х) = г на Аг. Если будет доказана интегрируемость ip(x) на А, то утверждение нашей теоремы сделается непосредственным следствием теоремы 6. Положим s Bs = U Аг- г=1 Так как на Bs функции fn и / ограничены и всегда <р(ж) ^ f(x) + 1, то /" <^(rr)d/x ^ /" /(rr)d/x+/x(A) = lim f fn(x)dla+lii(A) <: J J n—>-oo ^ Ho I <p(x)dfjL = ^rii(Ar). Bs r=l Ограниченность же этих сумм означает сходимость ряда (X) r=l A Таким образом, интегрируемость ср на А доказана. Условие моно- монотонного неубывания функций fn(ж) можно, очевидно, заменить в доказанной теореме условием их монотонного невозрастания.
324 Гл. V. Мера, измеримые функции, интеграл Следствие. Если фп(х) ^ 0 и оо / / Фп{х) d\i < оо, п=1 А оо то почти всюду на А ряд ^2 фп(х) сходится и 71=1 оо оо Фп(х)) dfJL= А п=1 п=1А Теорема 8 (Фату). Если последовательность измеримых не- неотрицательных функций {fn} сходится почти всюду на А к f и А то / интегрируема на А и А Доказательство. Положим (pn(x) = inf fk(x)\ k^n Lpn измерима, так как {х : ipn(x) < с} = U {х : fk(x) < с}. Далее, 0 ^ ц>п(х) ^ fn(x), поэтому срп интегрируемы, и f (fn(x) d/л ^ f fn(x) d/л ^ K; A A наконец, lim (pn(x) = f(x) n—>-oo почти всюду. Поэтому, применяя предыдущую теорему к {^п}5 по- получаем требуемый результат. 6. Интеграл Лебега по множеству бесконечной меры. До сих пор, говоря об интеграле и его свойствах, мы считали, что рас- рассматриваются функции, заданные на том или ином измеримом мно- множестве конечной меры. Однако часто приходится иметь дело с функ- функциями, заданными на множестве, мера которого бесконечна, напри- например, на прямой с лебеговой мерой на ней. Поэтому важно распро- распространить понятие интеграла и на этот случай. Мы ограничимся при
5. Интеграл Лебега 325 этом тем практически наиболее существенным случаем, когда рас- рассматриваемое множество X может быть представлено как сумма счетного числа множеств конечной меры: X = \jXn, /*(*„)< оо. B4) П Если пространство X, в котором задана мера /i, представимо как сумма счетного числа множеств конечной меры, то мера \i на X называется сг-конечной (см. п. 3 § 3). Примерами сг-конечных мер служат меры Лебега на прямой, плоскости, в n-мерном простран- пространстве. Меру, не удовлетворяющую условию сг-конечности, можно по- получить, например, приписав каждой точке на прямой вес 1. Тогда все подмножества прямой можно считать измеримыми, причем ко- конечные множества будут иметь конечную меру, а остальные — бес- бесконечную. Назовем исчерпывающей последовательностью всякую моно- монотонно возрастающую последовательность {Хп} измеримых подмно- подмножеств множества X, удовлетворяющую условию B4). Введем теперь следующее определение. Определение 4. Измеримая функция/, определенная на мно- множестве X с сг-конечной мерой /i, называется суммируемой на X, если она суммируема на каждом измеримом подмножестве А С X конечной меры и если для каждой исчерпывающей последователь- последовательности {Хп} предел lim [ fix) da B5) га-юо J существует и не зависит от выбора этой последовательности. Этот предел называется интегралом от / по множеству X и обознача- обозначается символом / / X Ясно также, что если функция / равна нулю вне некоторого мно- множества конечной меры, то для нее только что сформулированное определение интеграла равносильно тому, которое было дано в п. 3. Замечание. Определение интеграла от простой функции, дан- данное в п. 2, можно дословно перенести на случай бесконечной меры. Ясно при этом, что для суммируемости простой функции необходи- необходимо, чтобы каждое отличное от нуля значение она принимала только на множестве конечной меры. Определение суммируемости, данное в п. 3, существенно связано с предположением конечности меры мно- множества X. Действительно, если /л(Х) = оо, то из равномерной схо- сходимости последовательности простых суммируемых функций {(рп}
326 Гл. V. Мера, измеримые функции, интеграл не следует, вообще говоря, сходимость последовательности их инте- интегралов (приведите пример!). Результаты, изложенные в пп. 3 и 4 для случая конечной меры, в основном переносятся на интегралы по множеству бесконечной меры. Существенное отличие состоит в том, что в случае fi(X) = оо ограниченная измеримая функция на X не обязана быть суммируе- суммируемой. В частности, если fi(X) = оо, то никакая отличная от нуля константа не интегрируема на X. Читатель без труда проверит, что теоремы Лебега, Б. Леви и Фату остаются справедливыми в случае бесконечной меры. 7. Сравнение интеграла Лебега с интегралом Римана. Вы- Выясним связь между интегралами Лебега и Римана. При этом мы ограничимся простейшим случаем линейной меры Лебега на пря- прямой. Теорема 9. Если существует интеграл Римана I = (R)ff(x)dx, a то f интегрируема на [а, Ь] по Лебегу и I [a,b] Доказательство. Рассмотрим разбиение отрезка [а, Ь] на 2П частей точками , xk=a+ фг(Ь-а) и соответствующие этому разбиению суммы Дарбу: где Mnk — верхняя грань / на отрезке Хк-1 ^ X ^ Хк, a Tnnk — нижняя грань / на том же отрезке. По определению инте- интеграла Римана, / = lim пп = lim un. Положим fn(x) = Мпк при xk-i ^ х < хк, fn(x) = тппк при хк-Х ^ х < хк.
5. Интеграл Лебега 327 В точке х = Ъ функции fn и fn можно доопределить произвольно. Легко вычислить, что [a,b] [a,b] Так как последовательность {/п} не возрастает, а последователь- последовательность {fn} не убывает, то почти всюду fn(x) ->¦ /» > f(x), fn(x) -»¦ f{x) sC f(x). По теореме Б. Леви f f(x) d\i — lim Qn = I = lim ujn — f f(x) d\i. J n—>-oo n—>-oo •/ [a,6] [a,6] Поэтому / \f(x)-f(x)\d»= f (f(x)-f(x))d» = 0 [a,b] [a,b] и, следовательно, почти всюду fix) - f{x) = 0, т.е. f(x) = f(x)=f(x), f f(x)dfi = L [a,b] Теорема доказана. Легко указать примеры ограниченных функций на некотором от- отрезке, интегрируемых по Лебегу, но не интегрируемых по Риману (например, уже упоминавшаяся функция Дирихле на отрезке [0,1], равная 1 для рациональных и 0 для иррациональных х). Неогра- Неограниченные функции вообще не могут быть интегрируемы по Рима- Риману, но многие из них интегрируемы по Лебегу. В частности, любая функция /(ж) ^ 0, для которой интеграл Римана ъ Г f(x) dx существует при каждом е > 0 и имеет конечный предел / при е —> 0, интегрируема по Лебегу на [а, 6], причем ъ Г f(x) d/a = lim Г f(x) dx. [a,b] ?^ a+e
328 Гл. V. Мера, измеримые функции, интеграл Несобственный интеграл ъ lim Г f(x) dx в случае, когда lim Г \f(x)\dx = оо, е—>0 J а-\-е не существует в лебеговом смысле, поскольку, согласно свойст- свойству VIII п. 3, из суммируемости функции f(x) следует, что и функция \f(x)\ тоже суммируема. Например, интеграл 1 Г ^ sin i dx о существует как (условно сходящийся) несобственный интеграл Ри- мана, но не существует как интеграл Лебега. Если рассматривается функция на всей прямой (или полупря- полупрямой), то интеграл Римана для такой функции может существовать лишь в несобственном смысле. Опять-таки, если такой интеграл схо- сходится абсолютно, то соответствующий лебегов интеграл существует и имеет то же самое значение. Если же этот интеграл сходится лишь условно, то в лебеговом смысле функция не интегрируема. Напри- Например, функция sin х/х не интегрируема по Лебегу на всей прямой, поскольку г С1Т1 пп -ш = 00. — ОО Однако несобственный интеграл как известно, существует, и равен тг. § 6. Прямые произведения систем множеств и мер. Теорема Фубини В анализе важную роль играют теоремы о сведении двойного (или вообще многократного) интеграла к повторному. В теории кратных интегралов Лебега основным результатом является так называемая теорема Фубини, которая будет доказана в конце этого пара- параграфа. Предварительно мы установим некоторые вспомогательные понятия и факты, имеющие, впрочем, и самостоятельный интерес.
§ 6. Прямые произведения систем множеств и мер 329 1. Произведение систем множеств. Множество Z упорядо- упорядоченных пар (ж,у), где х G X, у G Y, называется прямым про- произведением множеств X и Y и обозначается X х Y. Аналогич- Аналогично, множество Z упорядоченных конечных последовательностей (ж1,...,жп), где Xk G Xfc, называется прямым произведением мно- множеств Х\,..., Хп и обозначается Z = X1x---xXn= ЕХк. В частном случае, когда Х\ — • • • — Хп = X, множество Z есть n-я степень множества X: Z = Хп. Например, координатное n-мерное пространство Жп есть n-я сте- степень числовой прямой Ж. Единичный куб /п, т. е. множество элемен- элементов из Жп с координатами, подчиненными условию О ^ хк ^ 1, к = 1,...,п, является n-й степенью единичного сегмента J1 = [0,1]. Если ©1,..., вп — системы подмножеств множеств Xi,..., Хп, то ^H=6i х ... х 6П обозначает систему подмножеств множества X = И Х&, представи- мых в виде А = А1х-..хАп, где Ак G ©л. Если ©1 = -.. = ©п = ©, то 9^ есть n-я степень системы ©: ^П = ©п. Например, система параллелепипедов в Ж71 есть n-я степень системы отрезков в Ж1. Теорема 1. Если ©i,..., ©п — полукольца, то и У\ = Н в^ есть полукольцо. Доказательство. Согласно определению полукольца нам нужно проверить, что если А, В G !lH, то А П 5 G !lH, и если, кроме га того, Б С А, то А = U С;, где d = В, dn Cj = 0 при г ф j г=1 и Сi G ?Н (г = 1,..., п). Проведем доказательство для случая п = 2. I. Пусть А е ©1 х ©2, В е ©1 х ©2; это значит, что A = AixA2, Ai G ©i, A2 G ©2, b = b1xB2j B1e&i, в2ев2.
330 Гл. V. Мера, измеримые функции, интеграл Тогда А П В = (Аг П Вх) х (А2 П В2), и так как А1 ПВг Е 6Ь А2ПБ2 G 62, то АПБ Е 6i х 62. П. Предположим теперь, дополнительно, что В1 С А1, В2 С А2; в силу того, что 6i и 62 — полукольца, имеют место разложения: Ах =B1UB[1) U-U5f, Но тогда А2 = B2UB2[1) ; = (Bi x B2) U (Bi x B^) U • • • U (Bi х B^)U U( ~D\ ) v D \ | | ( ~D\ ) \s D\ )\ II || / Dv / \/ Dv (iJi X ?JJ U -Di X Х)9 ) U ... U [13-, X JD9 U (В^Л) х В2) U (В^Л) х Б^1}) U -.. U (B[k) х В^°). Первым членом этого разложения служит В\ х В2 — В, и все члены принадлежат системе ©i x ©2. Теорема доказана. Однако из предположения, что системы в/, суть кольца (или сг-алгебры), еще не вытекает, вообще говоря, что произведение Н/е©*; будет кольцом (соответственно сг-алгеброй). 2. Произведения мер. Пусть на полукольцах ©i,..., ©п зада- заданы меры ),...,/in(An), Ak e &к. Для простоты будем считать эти меры конечными, хотя излагаемые ниже рассуждения и факты переносятся, без существенных измене- изменений, на случай сг-конечных мер (см., например, [21]). Определим на полукольце ^n=6i х-..х6п A) меру fji = 1лх X • • • X fJLn B) формулой fi(A) = /ii(Ai) x ... х fin(An), C)
§ 6. Прямые произведения систем множеств и мер 331 где А = Ах х • • • х Ап. Следует еще доказать, что ц(А) — действительно мера, т. е. что эта функция множества аддитивна. Сделаем это для случая п = 2. Пусть дано разложение А = Ах х А2 = \jB^k\ В^ П Ви) = 0 при i/ j, к В™ = В[к) х ?#°. В силу леммы 2 § 5 гл. I существуют такие разложения что множества 5} являются объединениями некоторых С} , и множества В^ ' — объединениями некоторых С^ . Очевидно, что причем в E) справа сумма берется по всем С[ Cii{ ии^ а в правой части равенства D) стоят по одному разу все члены, появляющиеся в правых частях равенств E). Поэтому к что и требовалось доказать. Таким образом, в частности, аддитивность элементарных мер в n-мерном евклидовом пространстве следует из аддитивности ли- линейной меры на прямой. Меру B), заданную на полукольце A) формулой C), мы будем называть произведением мер /ii,..., /in. Теорема 2. Если меры \i\, ... , \in а-аддитивны, то а-аддитивна и мера \i — \i\ х • • • х \in. Доказательство проведем для случая п = 2. Обозначим оо через Ai лебегово продолжение меры /i]_. Пусть С = (J Сп, где 71=1 Сп П Сш — 0 при п фт, причем С и Сп входят в 6i x 62, т. е. С = АхВ, Ae&i, 5g62, cn = AnxBnj Ane&u впее2.
332 Гл. V. Мера, измеримые функции, интеграл Пусть множества А и А\, A2, - - - лежат в пространстве X. Положим для х G X \ \1г\Вп), если х е Ап, fn(x) = < I О, если х f An. Легко видеть, что для х Е А поэтому в силу следствия из теоремы Б. Леви (см. п. 5 § 5) J2 I fn(x)d\1 = I fi2(B)d\1 = n A A HO / /n(rr)dAi = A и, следовательно, n Если /ii,...,/in сг-аддитивные меры, заданные соответственно на сг-алгебрах &i,..., ©п, то их произведением мы назовем лебегово продолжение меры \±\ х • • • х \±п. Будем обозначать его символом /il ® • • • ® /in ИЛИ (g) /ijfe. В частности, при /ii = * * * = /in = /i получаем n-ю степень меры /i: Например, n-мерная мера Лебега /in есть n-я степень линейной меры Лебега /i. Заметим, что произведение мер автоматически оказывается пол- полным (даже если меры \i\,..., \in были неполны). 3. Выражение плоской меры через интеграл линейной ме- меры сечений и геометрическое определение интеграла Ле- Лебега. Пусть область G на плоскости (ж, у) ограничена вертикалями х = а, у = Ъ и кривыми у = (р(х), у = ф(х). Как известно, площадь области G выражается интегралом V(G)= f{<p(x)-tl>(x)}dx. При этом разность ip(xo) — ф{хо) равна длине сечения области G вертикалью х = xq . Нашей задачей является перенести такой способ измерения площадей на произвольные меры-произведения
§ 6. Прямые произведения систем множеств и мер 333 В дальнейшем будет предполагаться, что меры \ix и \iy определены на сг-алгебрах, сг-аддитивны и обладают свойством полноты (если В С А и /л(А) = 0, то В измеримо), которым, как указывалось ранее, обладают все лебеговы продолжения. Введем обозначения: Ах = {у '• (х,у) G ^4} (х фиксировано), Ау = {х : (ж,у) Е А} (у фиксировано). Если X и Y — числовые прямые (а X х Y — плоскость), то АХо есть проекция на ось Y сечения множества А вертикальной прямой х = х0. Теорема 3. В перечисленных выше предположениях для лю- любого /а-измеримого множествах) А X Y Доказательство. Достаточно доказать равенство ц(А) = I ipA(x)dfjLx, где (рл(х) = fJ>y(Ax), F) х так как второе утверждение теоремы вполне аналогично первому. Заметим, что теорема автоматически включает в себя утверждение, что при почти всех х (в смысле меры /лх) множества Ах измеримы относительно меры \±у и что функция сра (х) измерима относитель- относительно меры \ix. Без этого формула F) не имела бы смысла. Мера \i — это лебегово продолжение меры m = \ix x /лу, опре- определенной на системе &т множеств вида А = Ауо х АХо. Для таких множеств равенство F) очевидно, так как для них <рА(х) = , О при х f Ayo. Без труда переносится равенство F) и на множества из разложимые в конечную сумму попарно непересекающихся мно- множеств из &т. Доказательство равенства F) в общем случае опирается на сле- следующую лемму, которая имеет и самостоятельный интерес для те- теории лебеговых продолжений. 1) Заметим, что интегрирование по X фактически сводится к интегрированию по множеству (J Ау С X, вне которого подынтегральная функция равна нулю. У Аналогично, / = / . Y U А*
334 Гл. V. Мера, измеримые функции, интеграл Лемма. Для любого fi-измеримого множества А существует множество В вида Вп = U Bnk •> Вп\ С • • • С Bnk С ..., к где множества Bnk принадлежат 9t(©m), причем А С В и 1л{А)=,л{В). G) Доказательство. По определению измеримости при любом п множество А можно погрузить во множество Сп = (J Апг — объеди- г нение множеств Апг из вт так, что ц(Сп) < ц(А) + 1/п. П Положим Вп = Р| С к и заметим, что множества Вп имеют к=1 вид Bn = {JSns, где Sns принадлежат ©ш. Положив, наконец, к Bnk = U Ens •> мы получим систему множеств Bnk с нужными свой- ствами. Лемма доказана. Равенство F) легко переносится с множеств Bnk G 9^(вт) на мно- множества Вп и 5 при помощи теоремы Б. Леви (теорема 7 § 5), так как 4>в{х) = lim фвп(х), фвг ^ Рв2^ •• В силу непрерывности меры эти равенства имеют место в каждой точке х. Если fi(A) = 0, то fi(B) = 0 и почти всюду 4>в{х) = /1у(Вх) = 0. Так как Ах С Вх, то для почти всех х множество Ах измеримо и if А = Цу(Ах) = 0, JcpA(x)dfix = 0 = fi(A). Следовательно, для множеств А меры нуль формула F) верна. В об- общем случае представим А в виде В\С, где в силу G), /л(С) = 0. Так как формула F) верна для множеств В и С, то легко видеть, что
§ 6. Прямые произведения систем мноэюеств и мер 335 она верна и для самого множества А. Доказательство теоремы 3 закончено. Пусть теперь Y — числовая прямая, \±у — линейная мера Лебега, а множество А есть множество точек (ж, у) вида где М — какое-то /i^-измеримое множество, a f(x) — интегрируемая неотрицательная функция. В этом случае f(x) при х Е М, О при х ? М, м Таким образом, доказана следующая теорема. Теорема 4. Интеграл Лебега неотрицательной функции f(x) равен мере /л = /лх ® /лу множества А, определенного соотношени- соотношением (8). Когда X — числовая прямая, множество М — отрезок, а функ- функция f(x) интегрируема по Риману, эта теорема сводится к известно- известному выражению интеграла через площадь, расположенную под гра- графиком функции. 4. Теорема Фубини. Рассмотрим тройное произведение U = = X х Y х Z; если на X, У, Z заданы меры fiXj /iy, fiZj то меру можно определить как (/lx ®fjLy) ® /Jz, или же как Их ® (Цу <8) Hz)- В действительности, как легко проверить, эти определения рав- равносильны. Следующая теорема является основной в теории кратных инте- интегралов. Теорема 5 (Фубини). Пусть меры цх и \iy определены на а-алгебрах, а-аддитивны и полны; пусть, далее, 1Л = fjix (g) цу и функция f(x,y) интегрируема по мере \i на множестве А С X х Y. (9)
336 Гл. V. Мера, измеримые функции, интеграл Тогда1) I /(ж, y)dfi= I ( I /(ж, у) dfiyj dfix= I ( I /(ж, у) dfixj djiy. A X Ax Y Ay A0) Утверждение теоремы включает существование внутренних ин- интегралов в скобках при почти всех значениях переменного, по кото- которому берутся внешние интегралы. Доказательство. Проведем сначала доказательство для слу- случая f(x,y) ^ 0. С этой целью рассмотрим тройное произведение U = X xY х Z, где третий множитель есть числовая прямая, и произведение мер А = \ix 0 \1У 0 /i1 = \i 0 /i1, где /i1 есть линейная лебегова мера. В U определим подмножество W условием: (x,y,z) G W, если (х,у) G А, 0 ^ z ^ f(x,y). В силу теоремы 4 \(W)= f f(x,y)dfi. A1) А С другой стороны, по теореме 3 A2) / X где ? = /iy х /i1 и Wjc обозначает множество пар (y,z), для которых (x,y,z) G W. При этом, снова по теореме 4, = / f(x,y)dny. A3) Сопоставляя A1), A2) и A3), получаем f f(x,y)dfJL= j(j f(x,y)dfJLy)dfJLx, A X Ax что и требовалось доказать. Общий случай сводится к разобранному при помощи равенств f(x,y) = f+(x,y) -f~(x,y), 1)См. сноску к теореме 3.
§ 6. Прямые произведения систем множеств и мер 337 Замечание. Как показывают приводимые ниже примеры, из существования повторных интегралов / ( / fdfiyj djix и I ( I fdfixj dfiy A4) X Ах У Ау не следуют, вообще говоря, ни равенства A0), ни интегрируемость функции /(ж, у) на А. Однако, если существует хотя бы один из ин- интегралов f ( / \f{x,y)\dny\dnx или I ( I \f(x,y)\dfixjdfiy, A5) X Ах Y Ау то f(x,y) интегрируема на А и справедливы равенства A0). Действительно, пусть, например, первый из интегралов A5) су- существует и равен М. Функция fn(x,y) = min{|/(x,^/)|,n} измерима, ограничена, а значит, и суммируема на А. По теореме Фубини I fn(x,y)dfjL = / ( / fn(x,y)dfjLyyj d/ix ^ М. A6) А X Ах Функции fn образуют монотонно неубывающую последователь- последовательность, почти всюду сходящуюся к \f(x,y)\. По теореме Б. Леви отсю- отсюда и из неравенства A6) следует, что функция \f(x,y)\ суммируема на А. Но тогда и /(ж, у) суммируема и для нее верна теорема Фуби- Фубини. Отсюда вытекает наше утверждение. Мы доказали теорему Фубини в предположении, что меры \ix и \iy (а значит, и \±) конечны. Однако она остается справедливой и в слу- случае сг-конечных мер (см., например, [21], с. 208). Приведем примеры функций, для которых существуют повторные ин- интегралы A4), но равенство A0) не имеет места. 1. Пусть А= [-1,1]2, f(x,y)= 2ХУ 22 пркх2+у2>0 и /@,0) =0; (ж + х ) тогда 1 J f(x,y)dx = 0 -1 при всех у и 1 f f(x,y)dy = 0 -1 при всех х. Поэтому f(x,y)dx)dy= I (/ f(x,y)dy)dx = 0,
338 Гл. V. Мера, измеримые функции, интеграл но интеграл в смысле двойного интеграла Лебега по квадрату не суще- существует, так как / / \f(x,y)\dxdy > jdr 2. Пусть А = [О, I]2, 0 22" 22" при!^^; ^ ^ у < ^L О в остальных случаях. Можно подсчитать, что f(ff(x,y)dx)dy = O, о о f(ff(x,y)dy)dx = l.
ГЛАВА VI НЕОПРЕДЕЛЕННЫЙ ИНТЕГРАЛ ЛЕБЕГА. ТЕОРИЯ ДИФФЕРЕНЦИРОВАНИЯ В этой главе мы будем рассматривать интеграл Лебега в основном для функций на прямой, считая, что мера, по которой этот интеграл берется, есть обычная линейная мера Лебега. Если / — суммируемая функция, определенная на измеримом пространстве X с мерой /i, то интеграл f f(x)d» (*) А существует для каждого измеримого А С X и при фиксированной / представляет собой функцию множества, определенную для всех из- измеримых подмножеств А С X. Такой интеграл называется неопре- неопределенным интегралом Лебега. Пространством X может, в частно- частности, служить отрезок числовой прямой. Если при этом А — тоже некоторый отрезок, то интеграл (*) будет функцией пары точек — концов отрезка А. Будем считать, что в этом случае мерой \± являет- является обычная мера Лебега и писать dt вместо d\i. Зафиксировав один из концов промежутка интегрирования, скажем, левый, мы можем х изучать свойства интеграла Г /(?) dt, взятого по отрезку [а, ж], как а функции одного переменного х. Эта задача приведет нас к рассмот- рассмотрению некоторых важных классов функций на прямой. Общей за- задаче изучения интеграла Лебега от фиксированной функции / как функции множества посвящен § 5. Из элементарного курса анализа известны следующие основные равенства, дающие связь между операциями дифференцирования и интегрирования: если / — непрерывная функция, a F — функция, имеющая непрерывную производную, то 2) I F'(t)dt = F(b) -F(a). а Спрашивается: верно ли равенство 1) для функций, суммируемых в смысле Лебега? Каков класс функций (возможно, более широкий), для которого выполняется равенство 2)? Этим вопросам посвящены следующее параграфы данной главы.
340 Гл. VI. Неопределенный интеграл Лебега § 1. Монотонные функции. Дифференцируемость интеграла по верхнему пределу 1. Основные свойства монотонных функций. Изучение свойств интеграла Лебега *(x)=ff{t)dt A) а как функции верхнего предела мы начнем со следующего очевид- очевидного, но важного замечания: если функция / неотрицательна, то Ф(ж) — монотонно неубывающая функция. Далее, всякая суммируе- суммируемая функция есть разность двух неотрицательных суммируемых: /(*) = /+(*) -/-(*)- B) Поэтому интеграл A) разлагается в разность двух монотонно не- неубывающих функций. Следовательно, изучение интеграла Лебега как функции верхнего предела можно свести к изучению монотон- монотонных функций того же типа. Монотонные функции (независимо от их происхождения) обладают рядом простых и важных свойств, кото- которые сейчас будут изложены. Напомним некоторые понятия. Всюду, где не оговорено против- противное, будут рассматриваться функции, заданные на некотором от- отрезке. Функция / называется монотонно неубывающей, если из х\ ^ х<± следует аналогично определяются монотонно невозрастающие функции. Пусть / — произвольная функция на прямой. Предел1) lim f(xo + h) h—>+0 (если он существует) называется пределом справа функции / в точ- точке хо и обозначается /(жо + 0). Аналогично определяется f(xo — 0) — предел слева функции / в точке xq. Равенство /(жо + 0) = /(жо — 0) означает, очевидно, что в точке xq функция / или непрерывна, или имеет устранимый разрыв. Точка, в которой оба эти предела су- существуют, но не равны между собой, называется точкой разрыва первого рода, а разность /(жо + 0) — /(жо ~~ 0) называется скачком функции / в этой точке. 1) Символ h —>¦ +0 означает, что h стремится к нулю, принимая только поло- положительные значения.
§ 1. Монотонные функции 341 Если /(ж0) = f(xo - 0), то / называется непрерывной слева в точ- точке жо, а если /(жо) = /(жо + 0), то / непрерывна справа в этой точке. Установим основные свойства монотонных функций. Для опре- определенности мы будем говорить о монотонно неубывающих функ- функциях, хотя ясно, что все сказанное ниже автоматически переносится на функции, монотонно невозрастающие. 1. Всякая монотонно неубывающая на [а, Ь] функция f измерима и ограничена, а следовательно, суммируема. Действительно, по определению монотонности, на [а,Ъ]. Далее, для любого постоянного с множество Ас = {х: f{X) < с} есть либо отрезок, либо полуинтервал (либо пусто). В самом деле, пусть точки, в которых /(ж) < с, существуют, и пусть d есть точ- точная верхняя грань таких ж. Тогда Ас есть или отрезок [а, б?], или полуинтервал [a, d). 2. Монотонная функция может иметь разрывы только первого рода. Действительно, пусть жо — произвольная точка на [а, Ъ] и хп—>хо, причем хп < жо- Тогда последовательность {/(жп)} ограничена сни- снизу и сверху (например, величинами /(а) и f(b)). Следовательно, она имеет хотя бы одну предельную точку. Но наличие у любой такой последовательности нескольких предельных точек противоречило бы, очевидно, монотонности функции /. Таким образом, /(жо — 0) существует. Аналогично устанавливается существование /(жо + 0). Монотонная функция не обязана быть непрерывной. Однако вер- верно следующее утверждение. 3. Множество точек разрыва монотонной функции не более чем счетно. Действительно, сумма любого конечного числа скачков монотон- монотонной функции / на отрезке [а, Ъ] не превосходит f(b) — /(а). Следо- Следовательно, для каждого п число скачков, величина которых больше, чем 1/п, конечно. Суммируя по всем п = 1, 2,..., получаем, что общее число скачков конечно или счетно. Среди монотонных функций простейшими являются так называ- называемые функции скачков. Они строятся следующим образом. Пусть на отрезке [а, Ъ] задано конечное или счетное число точек
342 Гл. VI. Неопределенный интеграл Лебега и пусть каждой из них поставлено в соответствие положительное число hnj причем ^2 hn < оо. Определим функцию / на [а, 6], ПОЛО- ПОЛОжив f(x) = Y, hn- C) хп<х Ясно, что эта функция монотонно неубывающая. Кроме того, она непрерывна слева1) в каждой точке, а совокупность ее точек разрыва совпадает с множеством {жп}2), причем скачок в точке хп равен hn. Действительно, f(x — 0) = lim f(x — г) = lim V^ hn, е-Ц-0 е-Ц-0 *-^ Xn<X—E но так как каждое xn, удовлетворяющее условию хп < ж, удовлет- удовлетворяет и условию хп < х — г при достаточно малом г, то последний предел равен ^2 hn = f(x). Таким образом, f(x - 0) = f(x). хп <ж Если точка ж совпадает с одной из точек хп, скажем, х = жПо, то /(жпо+0) = Дт^/(жп+е) = Дто ^ hn = т.е./(xno+0)-/(xno-0) = /ino. Наконец, если х не совпадает ни с одной из точек хп, то в ней функция скачков непрерывна (проведите доказательство!). Простейший тип функций скачков — ступенчатые функции, у ко- которых точки разрыва можно расположить в монотонную последова- последовательность xi < ••• <хп < ... В общем случае функция скачков может иметь и более сложную структуру, например, если {хп} — множество всех рациональных точек на отрезке [а, 6], a hn = l/2n, то формула C) определяет функцию скачков, разрывную в рациональных точках и непрерыв- непрерывную в иррациональных. 1) Если бы мы определили / формулой то получили бы функцию, непрерывную справа. 2)Если ни одна из точек хп не совпадает с 6, поскольку хп = Ь не участвует в сумме C). Чтобы учесть скачок в точке 6, надо вместо [а, Ь] рассматривать полуинтервал [a, b + е), е > 0.
§ 1. Монотонные функции 343 Другой тип монотонных функций, в некотором смысле противо- противоположный функциям скачков, — непрерывные монотонные функ- функции. Имеет место следующее утверждение. 4. Всякую монотонную функцию, непрерывную слева, можно представить как сумму непрерывной монотонной функции и функ- функции скачков (непрерывной слева) и притом единственным образом. Действительно, пусть / — неубывающая непрерывная слева функция и xi, Ж2, ... — все ее точки разрыва, a hi, /12, • • • — ее скачки в этих точках. Положим Н(х) = ^^ hn- хп<х Разность ip = / — Н есть неубывающая непрерывная функция. Для доказательства рассмотрим разность Сп(т") — сп(т') — \f(r") — fir'W — \Н(т") — Hir'W где x' < x". Здесь справа стоит разность между полным прираще- приращением функции / на отрезке [ж',ж"] и суммой ее скачков на этом отрезке. Ясно, что эта величина неотрицательна, т. е. ср — неубы- неубывающая функция. Далее, для произвольной точки ж* имеем ф* - 0) = /Or* - 0) - Н(х* - 0) = /Or* - 0) - хп <х* откуда <р(х* + 0) - <р(х* - 0) = /(ж* + 0) - /(ж* - 0) - h* = 0 (где h* — скачок функции Н в точке ж*). Отсюда и из непрерывно- непрерывности / и Н слева вытекает, что ср действительно непрерывна. 2. Дифферендируемость монотонной функции. Перейдем теперь к вопросу о существовании производной у монотонной функ- функции. Теорема 1 (Лебег). Монотонная функция f, определенная на отрезке [a,b], имеет почти всюду на этом отрезке конечную про- производную. Прежде всего введем некоторые понятия, которые будут нужны для доказательства этой теоремы. Как известно, производной функции / в точке жо называется пре- предел отношения /(ж) - /(жр) ( v
344 Гл. VI. Неопределенный интеграл Лебега при х —У xq. Этот предел может, конечно, и не существовать, однако всегда имеют смысл следующие четыре величины (которые могут принимать и бесконечные значения): Апр — верхний предел отношения D) при ж, стремящемся к хо справа (т.е. так, что х — хо > 0). Эта величина называется верхним правым производным числом. Лпр (нижнее правое производное число) — нижний предел отно- отношения D) при х —У хо справа. Алев (верхнее левое производное число) — верхний предел отно- отношения D) при х —> хо слева. Алев (нижнее левое производное число) — нижний предел отно- отношения D) при х —У хо слева. Рис. 19 На рис. 19 показаны прямые с угловыми коэффициентами Лпр, АПр, Алев, Алев соответственно. Ясно, что всегда АПр ^ Апр И Алев ^ Алев- Если Лпр и Лпр конечны и равны между собой, то это общее их зна- значение есть правая производная функции f(x) в точке Хо- Аналогич- Аналогично, если Ллев = Алев, то их общее значение есть левая производная. Существование у / в точке хо конечной производной равносильно тому, что в этой точке все производные числа функции / конечны и равны между собой. Поэтому утверждение теоремы Лебега мож- можно сформулировать следующим образом: для монотонной на [а, Ь] функции соотношения -00 < Алев = Апр = Алев = Апр < 00 выполнены почти всюду на [а, Ь].
§ 1. Монотонные функции 345 Упражнение. Пусть /*(ж) = —/(ж). Как связаны производные числа для /* с производными числами /? Ответьте на такой же вопрос при переходе от /(ж) к /(—ж). Доказательство теоремы Лебега опирается на приводимую ниже лемму, которой мы будем пользоваться и в дальнейшем. Введем следующее определение. Пусть д(х) — непрерывная функ- функция, заданная на отрезке а ^ ж ^ Ъ. Точку жо этого отрезка мы назовем точкой, невидимой справа для функции д, если существует такая точка ?(ж0 < ? ^ Ь), что д(х0) < д@ (рис. 20). а - ах Ъх а2 х0 b2 ? \J Рис. 20 Лемма (Ф. Рисе). Для любой непрерывной функции д мно- множество точек, невидимых справа, открыто на отрезке [а, Ь] и, сле- следовательно, представляется в виде суммы конечного или счетного числа попарно непересекающихся интервалов (а/., bk) (и, возможно, полуинтервала, содержащего точку а). В концевых точках этих ин- интервалов выполнены неравенства Доказательство леммы. Если жо — точка, невидимая справа для д, то тем же свойством будет обладать, в силу непре- непрерывности д, и любая точка, достаточно близкая к xq. Следователь- Следовательно, множество таких точек открыто на [а, 6]. Пусть (ak,bk) — один из составляющих его интервалов. Предположим, что 9Ы >g(bk); F) тогда в интервале (а&, bk) найдется внутренняя точка жо, в которой д(хо) > g(bk). Пусть ж* — самая правая из всех точек ж на (а/.,^), в которых д(х) = д(х0). Поскольку ж* Е (ctkjbk), существует такая точка ? > ж*, что 9@ > 9(х*)- Точка ? не может лежать на интервале (а/., Ьк), так как ж* — самая правая точка на этом интервале, в которой д(х) = д(хо), тогда как g(bk) < д(%о)- С другой стороны, неравенство ? > bk так- также невозможно, так как мы имели бы g(bk) < д(%о) < 9@1 a ^
346 Гл. VI. Неопределенный интеграл Лебега не является точкой, невидимой справа. Полученное противоречие показывает, что неравенство F) не имеет места, т.е. g(dk) ^ g(bk), и лемма доказана. Читатель без труда проверит, что фактически g(dk) = g(bk), если только ак ф а. Замечание. Назовем точку xq невидимой слева для непрерыв- непрерывной функции д(х), если существует такое ? < жо, что д(?) > д(хо). Такие же рассуждения показывают, что множество невидимых сле- слева точек есть сумма конечного или счетного числа попарно непе- неперекрывающихся интервалов (dk,bk) (и, возможно, полуинтервала, включающего точку Ь), причем дЫ) ^ д(Ък). Перейдем теперь к доказательству самой теоремы Лебега. Дока- Докажем ее сначала в предположении, что / — непрерывная монотон- монотонно неубывающая функция. Для доказательства теоремы достаточно установить, что почти всюду 1) Лпр < 00, 2) Ллев ^ Лпр. Действительно, если мы положим f*(x) = —/(—ж), то /* будет то- тоже монотонно неубывающей непрерывной функцией, определенной на отрезке [—6, —а]. Если Л*р и Ллев — верхнее правое и нижнее ле- левое производные числа для /*, то, как легко проверить (см. упраж- упражнение выше), производные числа функций / и /* в соответствующих точках связаны равенствами Л*р = Ллев, Алев = Апр. Поэтому, при- применив неравенство 2) к /*(ж), получим АПр ^ Ллев. G) Соединив полученные неравенства в одну цепочку и используя опре- определение производных чисел, будем иметь Лпр ^ Алев ^ Ллев ^ Апр ^ Апр, а это и означает, что Алев — ^пр — 1 *-лев — 1 *-пр • Покажем вначале, что Лпр < оо почти всюду. Если Лпр = оо в неко- некоторой точке хо, то для любого постоянного С > 0 справа от точки хо найдется такая точка ?, что
§ 1. Монотонные функции 347 ИЛИ ПО - С? > /Ы - Сх0. Иначе говоря, точка хо оказывается точкой, невидимой справа для функции д(х) = f(x) - Сх. В силу леммы Ф. Рисса множество таких точек открыто, и на концах составляющих его интервалов (akjbk) выполнены неравенства f(ak)-Cak^f(bk)-Cbk, f(bk)-f(ak) ^C(bk-ak). Деля на С и суммируя полученные неравенства по всем интервалам (ak,bk), получим _п ^ W(M~/M ^ f(b)-f{a) к ак) ^ 2_^ с ^ С к к Здесь С можно было взять как угодно большим. Таким образом, множество тех точек, в которых Лпр = оо, можно покрыть интерва- интервалами, сумма длин которых сколь угодно мала. Следовательно, мера этого множества равна 0. Тот же прием, связанный с леммой Ф. Рисса, позволяет дока- доказать, что почти всюду Алев ^ Лпр, но теперь этот прием придется применить дважды. Рассмотрим пару рациональных чисел с и С, для которых 0<с<С<оои положим р = с/С. Обозначим через Есс совокупность тех ж, для которых Лпр > С, а Алев < с. Если мы докажем, что \iEcc — 0, то отсюда будет следовать, что почти всюду Алев ^ Апр, так как множество тех точек, где Алев < Апр, очевидно, представимо в виде суммы не более чем счетного числа множеств вида Есс- Установим теперь основное неравенство. Для любого интервала (а, C) С [а, Ь] имеем /а(ЕсСП(а,C)) ^р(C-а). Действительно, прежде рассмотрим множество тех ж G («, /3), для которых Алев < с. Для всякой такой точки ж найдется такое ? < ж, f (?) — f (x) что i _ < с-> т-е- f@ - с? > f(x) - сх- Поэтому ж невидима s х слева для функции /(ж) — сх и по лемме Ф. Рисса (см. замечание выше) множество таких ж представимо в виде суммы не более чем счетного числа непересекающихся интервалов (ак, Eк) С (а, /3), при- причем f(ak) - сак ^ f(pk) - с/Зк, т.е. f(/3k)-f(ak)^c(/3k-ak). (8)
348 Гл. VI. Неопределенный интеграл Лебега На каждом из интервалов (а^,/?&) рассмотрим множество Gk тех ж, для которых Лпр > С. Снова применяя лемму Ф. Рисса (теперь, как и при доказательстве неравенства Лпр < оо, для точек, невидимых справа), мы получим, что Gk представимо в виде суммы не более чем счетного числа непересекающихся интервалов (ctkjiPkj) и 0kj-akj^±[f{l3kj)-f{akj)]. (9) Ясно, что множество Есс П (а, C) покрывается системой интерва- интервалов (akjjPkj)j причем в силу (8) и (9) имеем 5>*i - a*i) ^ Ь Е№;) - /("«)] ^ k,j k,j к к и основное неравенство доказано. Теперь легко доказать, что \iEcc — 0. При этом достаточно использовать только то свойство множества Есс, которое описывается основным неравенством. Лемма. Пусть измеримое множество А на отрезке [а, Ь] таково, что для любого интервала (а, C) С [а, Ь] выполняется неравенство ti(A П (а, /3)) ^ р(/3 - а), где 0 < р < 1. Тогда \iA = 0. Доказательство. Пусть \iA = t. Для любого е > 0 существу- существует такое открытое множество G, равное сумме счетного числа непе- непересекающихся интервалов (ат, Ьт), что А С G и ^{Ъш — am) < t + e m (см. упражнение в п. 7, § 4, гл. V). Положим tm = /i[A П (am,bm)]. Ясно, что t = X^m- По условию леммы, tm ^ р{Ъш — am). Следова- m тельно, t ^ p^2(bm — am) < p(t + г), и так как е > 0 произвольно, то m t ^ pt. Но 0 < р < 1 и поэтому t = 0. Лемма доказана, и тем самым завершено доказательство теоре- теоремы 1 в предположении непрерывности функции /. Те же рассуждения переносятся и на случай разрывной монотон- монотонной функции, если воспользоваться обобщением леммы Ф. Рисса на функции с разрывами первого рода. Пусть g — функция на отрезке [а, 6], имеющая разрывы только первого рода. Назовем точку хо G [а, Ь] невидимой справа для д(х), если существует такое ? > ж -0),д(хо),д(хо +0)]
§ 1. Монотонные функции 349 Тогда, как и в случае непрерывной д, множество точек, невидимых справа для д, открыто, и в концах составляющих его интервалов (cLk^bk) выполняются неравенства дЫ) ^ д(Ък). Хотя доказательство теоремы 1 довольно длинно, сама она имеет простой наглядный смысл. Поясним, например, почему Лпр (и Ллев) обязано быть конечным почти всюду. Отношение А//Аж — это «ко- «коэффициент растяжения» отрезка [а, Ъ] в данной точке х при отобра- отображении /. Так как при этом отображении конечный отрезок [а, Ь] пре- превращается в конечный отрезок [/(а), /(&)], то «растяжение» не мо- может быть бесконечным на множестве положительной меры. Иногда бывает полезна следующая теорема о почленном диф- дифференцировании ряда из монотонных функций, называемая иногда «малой теоремой Фубини». Теорема 2. Всюду сходящийся ряд n(x)=F(x), A0) П=1 где Fn — монотонно неубывающие функции на [a,b], почти всюду допускает почленное дифференцирование: 71=1 Доказательство. Заменив Fn(x) на Fn(x) — Fn(a), можно счи- считать, что все Fn(x) неотрицательны и обращаются в нуль при х — а. В силу теоремы 1 существует множество полной меры Е С [а, Ь], на котором существуют все F'n(x) и F'(x). Пусть жЕ^,а(Е[а,&] произвольно. Имеем - F[x) -ж f-ж Так как ? — х и Fn(?) — Fn(x) имеют одинаковый знак (монотон- (монотонность!), то при любом N EliJJUQ - Fn(x)} F(?) - F(x) Переходя к пределу при ? —у ж, получаем N 71=1
350 Гл. VI. Неопределенный интеграл Лебега Поскольку все F'n(n) ^ 0, отсюда следует, что оо Y,K(x)^F'(x). A1) п=1 Итак, ряд из производных F'n(x) сходится всюду на Е. Покажем, что при почти всех х в A1) имеет место знак равенства. Для каждого к найдется такая частичная сумма Snk(x) ряда A0), что 0^F(b)-Snk(b)<l/2k. Так как функция F(x) — Snk(x) = J^ Fm(x) — неубывающая, m>nk то и при любом х 0^F(x)-Snk(x) <1/2*, откуда следует, что ряд оо ?)№-Snfc(s)], A2) к=1 состоящий из неубывающих функций, сходится (даже равномерно) на всем отрезке [а, Ь]. Тогда, по уже доказанному, ряд ОО Y,[F'(x)-S'nk(x)}, A3) к=1 полученный из A2) почленным дифференцированием, сходится по- почти всюду. Следовательно, общий член ряда A3) почти всюду стре- стремится к нулю, т.е. Sfnk(x) — Ff(x) —у 0 почти всюду. Но если бы в неравенстве A1) стоял знак <, то никакая последовательность частичных сумм не могла бы сходиться к Ff(x). Следовательно, (X) n=l почти всюду. Теорема доказана. Следствие. Функция скачков имеет почти всюду производную, равную нулю. Действительно, такая функция есть сумма сходящегося ряда не- неубывающих «ступеней»: П при х ^ хп, ьп при х > хп, каждая из которых имеет почти всюду равную нулю производную. 3. Производная интеграла по верхнему пределу. Поскольку интеграл х Г if{t) dt a от любой суммируемой функции можно представить в виде разности двух монотонных функций, из теоремы 1 сразу вытекает следующий результат.
§ 2. Функции с ограниченным изменением 351 Теорема 3. Для каждой суммируемой функции ср производная &/<P(t)dt A4) a существует при почти всех х Необходимо подчеркнуть, что хотя мы и установили существова- существование производной A4) почти всюду, вопрос о равенстве a пока не обсуждался. В действительности (см. § 3) это равенство ока- оказывается верным почти всюду для любой суммируемой функции ср. § 2. Функции с ограниченным изменением Вопрос о дифференцируемости интеграла Лебега по верхнему пределу привел нас к рассмотрению класса функций, представи- мых в виде разностей монотонных функций. В этом параграфе мы дадим для этих функций другое описание, не опирающееся на по- понятие монотонности, и рассмотрим основные их свойства. Начнем с необходимых определений. Определение 1. Функция /, заданная на отрезке [а, 6], назы- называется функцией с ограниченным изменением, если существует та- такая постоянная С, что, каково бы ни было разбиение отрезка [а, Ь] точками а = хо < х\ < • • • < хп = Ь, выполнено неравенство Всякая монотонная функция имеет ограниченное изменение, так как для нее сумма, стоящая в A) слева, не зависит от выбора раз- разбиения и всегда равна |/(Ь) — /(а)|. Определение 2. Пусть / — функция с ограниченным измене- изменением. Точная верхняя грань сумм A) по всевозможным конечным разбиениям отрезка [а, Ь] называется полным изменением (или пол- полной вариацией) функции / на отрезке [а, Ь] и обозначается V6a[/]. Таким образом,
352 Гл. VI. Неопределенный интеграл Лебега Замечание. Функция /, заданная на всей прямой, называется функцией с ограниченным изменением, если величины V?[f] огра- ограничены в совокупности. При этом lim Vab[f] b—юо а—> — оо называется полным изменением функции / на прямой — оо < х < оо и обозначается V^^f/]. Установим основные свойства полного изменения функции. 1. Если а — постоянное число, то Va>f] = \a\Vba[f]. Это сразу следует из определения Va6[/]. 2. Если fug — функции с ограниченным изменением, то f + g тоже имеет ограниченное изменение и Vha[f + 9]^Vba[f] + Vba[g]- B) Действительно, для каждого разбиения отрезка [а, Ь] имеем ^2 \f(xk) + 9(xk) ~ f(xk-i) ~ 9(xk-i)\ ^ k k k откуда, поскольку всегда sup(A + В) ^ sup A + sup B, получаем требуемое неравенство. Свойства 1 и 2 означают, что линейная комбинация функций с ограниченным изменением (определенных на данном отрезке [а, Ь]) есть снова функция с ограниченным изменением. Иными словами, функции с ограниченным изменением образуют линейное простран- пространство (в отличие от множества монотонных функций, которые ли- линейного пространства не образуют). 3. Если а < Ъ < с, то vZ[f] + vbV} = vay]. (з) Действительно, рассмотрим сначала такое разбиение отрезка [ft, с], в котором Ъ служит одной из точек деления, скажем, хг = Ъ. Тогда it i/ы - /(**-i)i = Е k=l k=l п + Е |/Ы-/(^-1I^а[/] + ВД]- D) k=r+l
§ 2. Функции с ограниченным изменением 353 Возьмем теперь произвольное разбиение отрезка [а, с]. Ясно, что если к его точкам деления добавить еще одну, именно точку 6, то сумма Y,\f{*k) - f{*k-i)\ k=i от такого добавления не уменьшится. Следовательно, неравенство D) выполнено для любого разбиения отрезка [ft, с], поэтому v:m^vba[f]+vby]. D0 С другой стороны, для всякого г > 0 найдутся такие разбиения отрезков [а, Ь] и [Ь, с], что э Соединив эти два разбиения, мы получим разбиение отрезка [а, с], для которого i 3 В силу произвольности г > 0 отсюда следует, что Из D') и E) следует C). Так как полное изменение любой функции на любом отрезке не- неотрицательно, то из свойства 3 сразу следует свойство 4. 4. Функция монотонно неубывающая. 5. Если f непрерывна в точке ж* слева, то и v непрерывна в этой точке слева. Действительно, пусть ? > 0 задано. Выберем 5 > 0 так, что |/(ж*) — /(ж)| < г/2, как только ж* — S < ж ^ ж*. Далее, выберем разбиение а = жо < Ж1 < • • • < хп = ж* так, что
354 Гл. VI. Неопределенный интеграл Лебега При этом мы можем считать, что ж* - xn-i < S (иначе мы добавили бы еще одну точку разбиения, отчего разность, стоящая в F) слева, могла бы только уменьшиться), поэтому и, следовательно, п-1 к=1 Но тогда, тем более, Vf[f]- V?-1 [/]<?, т.е. «(o;*)-t;(a:n_i)<e. Так как v — монотонно неубывающая функция, то отсюда следует, что v(x*) — v(x) < г для всех ж таких, что хп-\ ^ х ^ ж*. А это и означает непрерывность функции v в точке ж* слева. Если / непрерывна в точке ж* справа, то, как показывают анало- аналогичные рассуждения, и v непрерывна в этой точке справа. Следова- Следовательно, если / непрерывна в некоторой точке (или на всем отрезке [а,Ь]), то непрерывна и v. Пусть / — произвольная функция на [а, Ь] с ограниченным изме- изменением и v — ее полное изменение на [а,ж]. Рассмотрим разность ip = v-f. Эта разность представляет собой монотонно неубывающую функ- функцию. Действительно, пусть х' ^ х". Тогда <р(х") - <р(х') = [v(x") - v(x')] - [fix11) - fix1)]. G) Но всегда „ \f(x")-f(x')\^v(x")-v(x') = V$ [/], поэтому правая, а значит, и левая части равенства G) неотрица- неотрицательны. Итак, поскольку / = v-<p, мы получили следующий результат: Теорема 1. Всякая функция с ограниченным изменением мо- может быть представлена как разность двух монотонно неубывающих функций. Обратное утверждение очевидно: всякая функция, представимая в виде разности двух монотонных, имеет ограниченное изменение.
§ 2. Функции с ограниченным изменением 355 Поэтому совокупность функций, представимых в виде разности мо- монотонных функций, рассмотренная нами еще в предыдущем пара- параграфе, это и есть совокупность функций с ограниченным изменени- изменением. Из теоремы 1 и установленной в предыдущем параграфе теоремы Лебега о существовании производной у монотонной функции сразу следует, что всякая функция с ограниченным изменением имеет по- почти всюду конечную производную. Перейдя от монотонных функций к функциям с ограниченным изменением, полезно следующим образом обобщить введенное вы- выше понятие функции скачков. Пусть х\,..., хп,... — конечное или счетное множество точек на [а, Ь]. Поставим в соответствие каждой из этих точек хп два числа дп и hn так, что Предположим, кроме того, что если хп = а, то дп = 0, а если хп = 6, то hn = 0. Положим Ф(х) = 22 9п + 22 h»- (8) Ж„^Ж Хп<Х Мы будем называть теперь функциями скачков любые функции вида (8). Полное изменение функции ф(х) равно, очевидно, Точками разрыва функции (8) служат те жп, для которых хотя бы одно из чисел gnj hn отлично от нуля; при этом ф{хп) - ф(хп - 0) = дп, ф(хп + 0) - ф{хп) = hn. Теперь легко получается следующее утверждение, обобщающее утверждение 4 п. 1 предыдущего параграфа. Всякая функция / с ограниченным изменением, определенная на [а, 6], может быть представлена, и притом единственным обра- образом, в виде / = (р + ф, где ip непрерывна, а ф — функция скачков. Упражнения. 1. Если / имеет на [а, Ь] ограниченную производную (т. е. f'{x) существует всюду и |/'(ж)| < С), то / — функция с ограничен- ограниченным изменением, причем
356 Гл. VI. Неопределенный интеграл Лебега 2. Пусть f(x) = ж sin 7J7 при х / 0 и /@) = 0. Показать, что изменение функции / на [0,1] бесконечно. Постоянные, и только они, представляют собой функции, полное изменение которых равно 0. Положим 11/11 = vba[f]. Величина V^[f] обладает свойствами 2) и 3) нормы (см. п. 1 § 3 гл. II), но не свойством 1). Если рассмотреть только функции, удо- удовлетворяющие дополнительному условию /(а) = 0, то они также образуют линейное пространство, в котором величина V?[f] обла- обладает уже всеми свойствами нормы. Пространство V0 [а, Ь] функций с ограниченным изменением на [а, Ь], удовлетворяющих условию /(а) = 0, с обычными определениями сложения и умножения на чи- числа и с нормой 11/11 = vha[f], называется пространством функций с ограниченным изменением. (Докажите полноту этого пространства.) Упражнение. Докажите, что ||/|| = |/(а)| + Va[f] является нормой в пространстве всех функций с ограниченным изменением на отрезке [а, Ь] и докажите полноту этого пространства. § 3. Производная неопределенного интеграла Лебега В § 1 мы показали, что интеграл Лебега как функция от х имеет почти всюду конечную производную. Одна- Однако мы пока еще не выяснили, как связана эта производная с подын- подынтегральной функцией. Сейчас мы установим следующий результат, упомянутый в конце § 1. Теорема 1. Для всякой суммируемой функции f почти всюду имеет место равенство A.jf(t)dt = f{x). a Доказательство. Положим Ф(х)= / f(t)dt.
§ 3. Производная неопределенного интеграла 357 Покажем вначале, что почти всюду х) ^ ч? ух). Если /(ж) < Ф'(ж), то найдутся такие рациональные числа а и /3, что j ух) <^ и, <^ р <^ ч? ух). у±) Пусть Еар — множество тех точек, в которых выполнено неравен- неравенство A). Оно измеримо, поскольку /иФ' измеримы. Покажем, что мера каждого из множеств Еар равна нулю. Так как число этих множеств счетно, то отсюда будет следовать, что Пусть е > 0 произвольно и пусть S > 0 таково, что f(t)dt как только /i(e) < 5 (такое 5 существует для любого г в силу абсо- абсолютной непрерывности интеграла; см. теорему 5 § 5 гл. V). Выберем теперь открытое множество G С [а,Ь] так, что GD Е„в и u(G) < и(Епв) + S (см. упражнение в п. 7 § 4 гл. V). Если х G Еа1з, то Щ^1>Р B) для всех ? > ж, достаточно близких к х. Записав неравенство B) в виде получаем, что точка ж — невидимая справа для функции Ф(ж) — /Зж на любом из составляющих интервалов множества G. Используя лемму Ф. Рисса, мы можем поэтому указать такое открытое множе- множество S = U(ab bk), состоящее из непересекающихся интервалов, что ЕаР CS cGm Ф(Ък)-Ф(ак)^/3(Ък-ак), или ьк I f(t)dt>0(bk-ak). а>к Суммируя такие неравенства по всем интервалам (ак,Ьк), соста- составляющим 5, получаем C)
358 Гл. VI. Неопределенный интеграл Лебега В то же время I f(t)dt= I f(t)dt+ I f(t)dt< S EaC S\EaC < a/i(Eaf3) + г <: a/i(S) + г + \a\S. D) Сравнивая (З) и D), получаем Таким образом, множество Еар можно заключить в открытое множество сколь угодно малой меры (мы можем считать, например, что \а\5 ^ г), а это и означает, что /i(Eap) = 0. Итак, мы показали, что f(x) 2 Ф'(я) почти всюду. Заменив f(x) на —/(ж), мы таким же путем получим, что почти всюду -f(x) ^ -Ф'(х), т.е. /(х)^Ф'(х) и, следовательно, почти всюду х f(T\ — ф'(т\ — А. [ f(t)dt § 4. Восстановление функции по ее производной. Абсолютно непрерывные функции Итак, мы решили первый из поставленных в начале этой главы вопросов, установив равенство х -р Г f(t)dt = f{x) (почти всюду) а для любой суммируемой на [а, Ь] функции /. Рассмотрим теперь вто- второй из сформулированных там вопросов, т. е. выясним, как обобща- обобщается на случай интеграла Лебега формула Ньютона-Лейбница F(x) =F(a)+ I F'(t)dt, A) a хорошо известная в случае непрерывно дифференцируемых функ- функций из элементарного анализа.
§ 4. Восстановление функции по ее производной 359 Естественно ограничиться рассмотрением функций F, заведо- заведомо дифференцируемых почти всюду (иначе равенство A) просто не имеет смысла). Как мы уже знаем, такими, в частности, являют- являются функции с ограниченным изменением. С другой стороны, интеграл, стоящий в A) справа, есть функ- функция с ограниченным изменением. Поэтому равенство A) не может быть верно для более широкого класса функций. Поскольку всякая функция с ограниченным изменением есть разность двух монотонно неубывающих, то именно монотонные функции и нужно рассмотреть в первую очередь. Однако для произвольных монотонных функций равенство A), вообще говоря, не имеет места. Вместе с тем справедлива следующая теорема. Теорема 1. Производная f монотонно неубывающей функ- функции f суммируема и f f(x)dx^f(b)-f(a). a Доказательство. По определению, производная функции / в точке х есть предел отношения1) Мх) = /(* + *)-/<*) B) при h —у 0. Из монотонности / вытекает ее суммируемость, а значит, и суммируемость каждой из функций cph. Поэтому равенство B) можно проинтегрировать. Получаем / <ph(x) dx=\] f(x + h)dx-\j f(x) dx = a a a b+h a+h = {/ fix)dx-\ f f(x)dx. b a Стоящее справа выражение при h —у +0 стремится к f(b) — f(a + 0). (Докажите!) Поэтому, применив теорему Фату (теорема 8 § 5 гл. V), мы получаем ff(x)dx^ Hm f<ph(x)dx a a (само существование интеграла от /; также обеспечивается теоре- теоремой Фату). Теорема доказана. 1) Чтобы выражение /(ж + К) имело смысл при любом х Е [а, Ь], можно счи- считать, что /(ж) = f(b) при х > Ь и f(x) = f(a) при х < a.
360 Гл. VI. Неопределенный интеграл Лебега 1 з 1 з Рис. 21 Нетрудно привести пример монотонной функции, для которой имеет место строгое неравенство I f'(x)dx<f(b)-f(a). а Достаточно положить 0 при 0 ^ х ^ 1/2, 1 при 1/2 < х ^ 1. Интересно, однако, что существуют непрерывные монотонные функции, для которых строгое неравенство ff'(t)dt<f(x)-f(a) а выполнено при всех х > а. Вот один из простейших примеров. Рас- Рассмотрим на отрезке [0,1] канторово множество и определим / сна- сначала на его смежных интервалах, положив 2/t — 1 1„ 1 О О /(*) = ¦ЛП-1 на к-м смежном интервале n-го ранга (включая и его концы). (Ин- (Интервалы нумеруются слева направо.) Следовательно, f(t) = 1/2 при 1/3 ^ * ^ 2/3, /(?) = 1/4 при 1/9 ^ t <: 2/9, /(?) = 3/4 при 7/9 ^ t ^ 8/9 и т. д. (рис. 21). Таким образом, / определена на отрезке [0,1] всюду, кроме точек второго рода канторова множества (т. е. точек, не при- принадлежащих ни смежным интервалам, ни совокупности их концов).
§ 4. Восстановление функции по ее производной 361 Доопределим теперь / в этих оставшихся точках следующим обра- образом. Пусть t* — одна из таких точек и пусть {tn} — сходящаяся к ней возрастающая последовательность точек первого рода (т. е. концов смежных интервалов). Тогда существует предел Ит /(*„); C) п>оо >-оо аналогично, существует и предел D) если {tfn} — убывающая последовательность точек первого рода, сходящаяся к ?*, причем пределы C) и D) равны между собой. При- Приняв это общее значение за /(?*), мы получим монотонную функ- функцию, определенную и непрерывную на всем отрезке [0,1], называе- называемую «канторовой лестницей». Ее производная равна, очевидно, ну- нулю в каждой точке любого смежного интервала, т. е. почти всюду. Следовательно, для этой функции имеем 0= ff(t)dt<f(x)-f(O) = f(x) о при любом х из полуинтервала 0 < х ^ 1. Отметим попутно, что в случае монотонной /(ж) равенство Ъ х Г f'(t) dt = f(b) — f(a) влечет равенство Г f'(t) dt = f(x) — f(a) при a a любом x из полуинтервала а < x ^ b. Чтобы описать класс функций, для которых имеет место равен- равенство ь I f(t)dt = f(b)-f(a), а введем следующее определение. Определение 1. Функция /, заданная на некотором отрезке [а, 6], называется абсолютно непрерывной на нем, если для любого г > 0 найдется такое S > 0, что, какова бы ни была конечная система попарно непересекающихся интервалов (ak,bk), k = l,...,n, с суммой длин, меньшей 5: выполнено неравенство k=l
362 Гл. VI. Неопределенный интеграл Лебега Ясно, что всякая абсолютно непрерывная функция равномерно не- непрерывна. Обратное, вообще говоря, неверно, например: описанная выше «канторова лестница» непрерывна (а значит, и равномерно непрерывна) на отрезке [0,1], однако она не абсолютно непрерывна. Действительно, канторово множество можно покрыть конечной си- системой интервалов (a/., bk) (к = 1,..., п), сумма длин которых сколь угодно мала. Вместе с тем для каждой такой системы интервалов выполнено, очевидно, равенство к=1 Укажем основные свойства абсолютно непрерывных функций. 1. Заметим прежде всего, что в определении 1 можно вместо лю- любой конечной системы интервалов с суммой длин < 5 рассма- рассматривать любую конечную или счетную систему интервалов, сумма длин которых < S. Действительно, пусть для данного е > О мы выбрали 5 > 0 так, что к=1 для любой конечной системы интервалов (а/., 6/.), удовлетворяющей условию ^2(h ~ о>к) < 8, к=1 и пусть (ак,/3к) — счетная система интервалов с суммой длин, не превосходящей S. Тогда при любом п имеем к=1 переходя здесь к пределу при п —у оо, получаем к=1 2. Всякая абсолютно непрерывная функция имеет ограниченное изменение. Действительно, абсолютная непрерывность функции / на отрез- отрезке [а, Ь] означает, в частности, что для каждого е > 0 можно S > О выбрать так, что полное изменение функции / на отрезке длины < S будет не больше, чем г. Поскольку отрезок [а, Ь] можно раз- разбить на конечное число отрезков длины < й, то и полное изменение функции / на [а, Ь] конечно.
§ 4. Восстановление функции по ее производной 363 3. Сумма абсолютно непрерывных функций и произведение такой функции на число суть абсолютно непрерывные функции. Это сразу вытекает из определения абсолютной непрерывности и свойств модуля суммы и произведения. Свойства 2 и 3 означают, что абсолютно непрерывные функции в пространстве всех1) функций с ограниченным изменением обра- образуют линейное многообразие. 4. Всякая абсолютно непрерывная функция может быть пред- представлена как разность двух абсолютно непрерывных неубывающих функций. Действительно, абсолютно непрерывная функция, как всякая функция с ограниченным изменением, может быть представлена в виде / = v-g, где Ф) = У?\/] и g(x)=v(x)-f(x) — неубывающие функции. Покажем, что каждая из этих двух функ- функций абсолютно непрерывна. Достаточно проверить это для v. Пусть е > 0 задано. Выберем S > 0 для этого е так, как это диктуется абсо- абсолютной непрерывностью функции /. Возьмем систему п интервалов (cLk,bk) с суммарной длиной меньше, чем ?, и рассмотрим сумму E) Эта сумма представляет собой точную верхнюю грань чисел п тк EEI^jmWOs/u-i)! F) к=11=1 по всевозможным конечным разбиениям С1п — 3?п,0 ^ *^п,1 ^ «^п,2 \ * * * \ %п,тп — ^п интервалов (сц, bi),..., (аП5 Ьп). Так как сумма длин всех интервалов (ж^5/_1, Xkj), по которым берется сумма F), не превосходит 5 > 0, то каждая из сумм F) не больше, чем г. Следовательно, и сумма E), — их точная верхняя грань, — не больше, чем е. Следующие две теоремы устанавливают тесную связь между по- понятием абсолютной непрерывности и неопределенным интегралом Лебега. 1)См. упражнение в § 2.
364 Гл. VI. Неопределенный интеграл Лебега Теорема 2. Функция F(x)= ff(t)dt, а представляющая собой неопределенный интеграл суммируемой функции, абсолютно непрерывна. Доказательство. Если {(а/., 6/.)} — какая-либо система не- непересекающихся интервалов, то k=l k=l'ak ' k=l ьк / в силу абсолютной непрерывности интеграла Лебега последнее вы- выражение стремится к нулю, когда суммарная длина интервалов (dk,bk) стремится к нулю. Теорема 3 (Лебег). Производная / = F' абсолютно непре- непрерывной функции, заданной на отрезке [a,b], суммируема на этом отрезке и для каждого х (а ^ х ^ Ь) ff(t)dt = F(x)-F(a). Теоремы 2 и 3 показывают, что абсолютно непрерывные функ- функции, и только они, восстанавливаются с точностью до постоянного слагаемого по своей производной с помощью операции интегрирова- интегрирования. Для доказательства теоремы 3 нам понадобится следующая лем- лемма. Лемма. Если производная абсолютно непрерывной монотонно неубывающей функции f равна 0 почти всюду, то эта функция — постоянная. Доказательство леммы. Пусть / задана на [а, Ь]. Так как / — непрерывная монотонная функция, то ее область значений есть отрезок [/(а),/F)]. Покажем, что длина этого отрезка равна нулю, если f'{x) = 0 почти всюду. Тем самым лемма будет доказана. Ра- Разобьем множество точек отрезка [а, Ь] на два класса: множество Е тех точек, в которых f'(x) = 0, и Z — его дополнение. По усло- условию леммы fi(Z) = 0. Выберем некоторое г > 0, найдем то 5 > 0,
§ 4. Восстановление функции по ее производной 365 которое отвечает этому е в силу абсолютной непрерывности функ- функции /, и заключим Z в открытое множество, мера которого меньше 8 (это возможно, поскольку /jl(Z) = 0). Иначе говоря, Z покрывает- покрывается конечной или счетной системой интервалов (а/.,^), сумма длин которых меньше 6. В соответствии с выбором 6 получаем к Следовательно, вся система интервалов (а/,,^) (а тем более, и за- заключенное в их сумме множество Z) переводится функцией / в мно- множество, мера которого меньше е. Таким образом, /i(/(Z)) = 0. Рассмотрим теперь множество Е = [a,b]\Z. Пусть хо Е Е. Тогда, поскольку f'(xo) = 0, для всех ж, достаточно близких к жо, выпол- выполнено неравенство , ч /О) - х-хо ^ fc' т.е. (мы считаем для определенности, что х > хо) f(x) - f(x0) < г(х - хо) ИЛИ гх0 - f(x0) < ex- /(ж); таким образом, xq есть точка, невидимая справа для функции д(х) — ех — f(x). Следовательно, по лемме Ф. Рисса, множество Е содержится в конечной или счетной системе непересекающихся интервалов (а^,/3^), в концах которых выполняются условия е/Зк ~ f{Hk) > еак - f(ak), откуда ?)(/(&) - /Ы) ^ е Y,(Pk ~ ак) ^ е{Ъ - а). к к Иначе говоря, множество Е переводится функцией / в множество, покрывающееся системой интервалов, сумма длин которых меньше е(Ь — а). Ввиду произвольности е отсюда следует, что /a(f(E)) = 0. Итак, и f(E), и f(Z) имеют меру нуль. Но в сумме эти два множе- множества составляют отрезок [/(a), f(b)]. Тем самым доказано, что длина этого отрезка есть нуль, т.е. что f(x) = const. Теперь уже легко доказывается и сама теорема 3. Достаточно ограничиться случаем, когда функция F(x) не убывает. В этом слу- случае х *(x)=F(x)- ff(t)dt G)
366 Гл. VI. Неопределенный интеграл Лебега представляет собой функцию, тоже монотонно неубывающую. Дей- Действительно, если х" > ж', то по теореме 1 Ф(х") - Ф(х') = F(x") - F(x') - f f(t) dt > 0. x' Кроме того, Ф абсолютно непрерывна (как разность двух абсолютно непрерывных функций) и Ф'(ж) = 0 почти всюду (согласно теореме 1 § 3). Поэтому в силу леммы Ф есть константа. Положив в G) х = а, получаем, что эта константа равна F(a). Теорема доказана. Мы видели выше, что всякую функцию / с ограниченным изме- изменением можно представить как сумму функции скачков Н и непре- непрерывной функции ер с ограниченным изменением (§ 2), / = я + <р. Рассмотрим теперь непрерывную, но не абсолютно непрерывную функцию с ограниченным изменением ip и положим ф(х)= f<p'(t)dt. а Разность х = ср-ф представляет собой непрерывную функцию с ограниченным измене- изменением. При этом а почти всюду. Назовем непрерывную функцию с ограниченным изменением син- сингулярной, если ее производная равна нулю почти всюду. Мы можем теперь сформулировать следующий результат: всякая функция с ограниченным изменением может быть пред- представлена в виде суммы трех компонент f = Н + ф + х (8) — функции скачков, абсолютно непрерывной функции и сингуляр- сингулярной функции. Нетрудно показать, что каждое из слагаемых в разложении (8) определяется самой функцией / однозначно с точностью до констан- константы. Если функции, входящие в равенство (8), нормировать, потребо- потребовав обращения двух из них в нуль в точке х = а, то разложение (8)
§ 4. Восстановление функции по ее производной 367 будет уже в точности единственным. Продифференцировав равен- равенство (8), мы получим, что почти всюду f(x) = ф'(х) (поскольку Н' и х' равны нулю почти всюду). Следовательно, при интегрировании производной от функции с ограниченным изменени- изменением восстанавливается не сама эта функция, а только ее абсолютно непрерывная компонента. Две другие компоненты (функция скач- скачков и сингулярная) при этом «бесследно исчезают». Поучительно сравнить результаты этого параграфа с тем, что дает теория обобщенных функций. Как и в гл. IV, будем понимать под обобщенной функцией линейный непрерывный функционал над пространством К финитных бесконечно дифференцируемых функ- функций. При этом обычной локально суммируемой функции / сопо- сопоставляется функционал, действующий на элементы ср Е К по фор- оо муле (/, ср) = Г f(x)cp(x)dx. Обобщенной производной от этого — оо функционала служит функционал, ставящий в соответствие эле- оо менту if Е К число (f',ip) = — Г f{x)ip'{x)dx. Так как в клас- — оо се обобщенных функций уравнение у' = 0 имеет только обычные решения (константы), то всякая обобщенная функция с точностью до константы восстанавливается по своей производной. В частно- частности, всякая локально суммируемая функция / с точностью до кон- константы почти всюду восстанавливается по своей обобщенной производной /'. Предположим теперь, что функция / почти всюду имеет производную, например, / — монотонная функция. Обозначим через Д = df/dx обычную производную функции /. (Мы уже видели, что df/dx может равняться 0 почти всюду, хо- хотя f(x) ^ const!) Функция df/dx является локально суммируе- суммируемой (мы предполагаем, что / монотонна) и, следовательно, мы мо- можем сопоставить этой функции функционал (обобщенную функцию) ОО in (fi,cp) = Г -j-if(x) dx. Существенный факт состоит в том, что об- — оо общенная функция Д, вообще говоря, не совпадает с обобщенной функцией /'. Например, если = \ при х > °' 0 при х ^ О, то Д = 0, а /; = 8 (см. пример 1 в п. 3 § 4 гл. IV). Теорема 3, собственно говоря, и означает, что среди всех функций с ограниченным изменением для абсолютно непрерывных функций
368 Гл. VI. Неопределенный интеграл Лебега (и только для них!) производная, понимаемая в обычном смысле, совпадает с обобщенной производной той же функции. Здесь мы снова сталкиваемся с тем положением, о котором уже говорилось в § 4 гл. IV: для выполнимости основных операций ана- анализа (в данном случае речь идет о восстановлении функции по ее производной) нужно или, оставаясь в рамках классических опре- определений, ограничиться достаточно узким запасом функций (абсо- (абсолютно непрерывными), или же, наоборот, существенно расширить понятие функции (расширив при этом и определение производной). Упражнения. 1. Показать, что определение абсолютной непрерыв- непрерывности, сформулированное выше, равносильно следующему: / абсолютно непрерывна на [а, Ь], если она каждое подмножество меры нуль этого от- отрезка переводит снова в множество меры нуль. 2. Найти обобщенную производную «канторовой лестницы». 3. Пусть / — функция с ограниченным изменением, /' — ее обобщен- обобщенная производная и /i — функционал (обобщенная функция), определяе- определяемый «обычной» производной df/dx функции /. Доказать, что а) если / абсолютно непрерывна, то /' = /i; б) если /' = /]_, то /(ж) эквивалентна абсолютно непрерывной функ- функции, т. е. совпадает с такой функцией почти всюду. В частности, если /' = /i и / непрерывна, то и / абсолютно непрерывна. § 5. Интеграл Лебега как функция множества. Теорема Радона—Никодима 1. Заряды. Разложение Хана и разложение Жордана. По- Понятия и факты, изложенные в прецыцущих параграфах цля функ- функций на прямой, распространяются в значительной степени и на функции, заданные на произвольном пространстве с мерой. Пусть X — некоторое пространство с (конечной) мерой \i и / — суммируемая по \i функция на X. При этом / будет суммируема на каждом измеримом подмножестве А множества X и, следова- следовательно, интеграл Ф(А)= f f(x)dfi A) А (с фиксированной /) представляет собой функцию множества, опре- определенную и сг-аддитивную на сг-алгебре E^ всех измеримых мно- множеств пространства X. Таким образом, для любого разложения A = \JAk к
§ 5. Интеграл Лебега как функция множества 369 измеримого множества А в конечную или счетную сумму попарно непересекающихся измеримых множеств выполнено равенство Иначе говоря, функция Ф, определенная равенством A), обладает всеми свойствами сг-аддитивной меры, за исключением, быть может, неотрицательности. (При неотрицательной / неотрицательна и Ф.) Определение 1. Произвольная (конечная) сг-аддитивная функция множества Ф, определенная на некоторой сг-алгебре под- подмножеств данного пространства X, называется знакопеременной мерой, или, короче, зарядом. Понятие заряда служит естественным обобщением понятия сг-ад- сг-аддитивной меры и, как мы увидим ниже, сводится в определенном смысле к этому понятию. Упражнение. Доказать, что для любого (конечного) заряда Ф, за- заданного на сг-алгебре множеств E, существует такая константа с, что с при всех Ag6. Если рассматривается реальный электрический заряд, располо- расположенный, скажем, на некоторой поверхности, то эту поверхность можно разделить на две области: несущую положительный заряд (т. е. такую, что любая ее часть заряжена положительно) и несущую отрицательный заряд. Математическим эквивалентом этого факта служит приводимая ниже теорема 1. Введем предварительно следующую терминологию. Пусть Ф — заряд, определенный на сг-алгебре E подмножеств пространства X. Множество Е Е в называется отрицательным относительно Ф, если Ф(Е Г\ F) ^ 0 для любого F Е в; аналогично Е называется положительным, если Ф(Е П F) ^ 0 для всех F Е в. Теорема 1. Если Ф — заряд, определенный на X, то суще- существует такое измеримое множество А~ С X, что А~ отрицательно и А^~ = X \ А~ положительно (относительно Ф). Доказательство. Положим a = in где нижняя грань берется по всем отрицательным множествам А. Пусть {Ап} — такая последовательность отрицательных множеств, что lim Ф(АП) = а.
370 Гл. VI. Неопределенный интеграл Лебега Тогда А~ = (J Ап представляет собой, как легко видеть, такое от- отрицательное множество, что Ф(А~) = а. Покажем, что А~ и есть искомое множество, т. е. покажем, что А+ = X \ А~ положительно. Пусть это не так, т. е. пусть А+ содержит такое из- измеримое подмножество Со, что Ф(Со) < 0. При этом множество Со не может быть отрицательным, так как иначе мы присоединили бы его к А~ и получили бы отрицательное множество А, для которого Ф(А) < а, что невозможно. Поэтому существует такое наименьшее целое число к\, для которого в Со найдется подмножество С\, удовлетворяющее условию Разумеется, С\ Ф Со- Для множества Со \ С\ можно повторить рас- рассуждение, проведенное для Со; мы получим множество Сг, удовле- удовлетворяющее условию Ф(С2) ^ 1/&2, к2^ки и т.д. Наконец, положим оо Fo = Со \ U Q. г=1 Множество Fo не пусто, так как Ф(С0) < 0, а Ф(С{) > 0 при г ^ 1. Из построения следует, что Fq отрицательно. Поэтому, присоединив его к А~, мы снова приходим к противоречию с определением а. Следовательно, для всех измеримых Е С X \ А~ имеем ад > о, т. е. X \ А положительно. Теорема доказана. Разбиение пространства X на отрицательную часть А и поло- положительную А^ называется разложением Хана. Разложение Хана, вообще говоря, не единственно, однако если X = А~ U A+ и X = A~UA+ — два таких разложения, то для всякого EG 6 Ф(ЕПА~) = Ф(ЕПА~) и Ф(ЕП4) = Ф(ЕП4). B)
§ 5. Интеграл Лебега как функция множества 371 Действительно, ЕП(А~ \А~) СЕПА~, C) откуда следует, что Ф(Е П (А^ \ А^)) ^ 0. В то же время ЕП(А~ \А~) СЕП4, D) откуда Ф(Е П (А~ \ А~)) ^ 0. Таким образом, Ф{Е П (А~ \ А~)) = 0. Аналогично получаем Ф(Е П (А^~ \ А^~)) ^ 0. Отсюда следует, что Ф(ЕПА~) = Ф(ЕПА~). Точно так же доказывается и второе из равенств B). Таким образом, на в заряд Ф однозначно определяет две неотри- неотрицательные функции множества, а именно: Ф+(Е) = Ф(?ПА+), Ф~(Е) = -Ф(ЕПА~), называемые соответственно верхней вариацией и нижней вариацией заряда Ф. При этом, очевидно, 1) ф = ф+-ф-, 2) Ф+ и Ф~ представляют собой неотрицательные сг-аддитивные функции множества, т. е. меры. Мерой будет, очевидно, и функция |Ф| = Ф+ + Ф~; она называет- называется полной вариацией заряда Ф, а представление Ф в виде разности верхней и нижней вариаций называется разложением Жордана это- этого заряда Ф. Замечание. Мы рассматривали сейчас конечные заряды, т.е. такие функции Ф, значения которых ограничены как сверху, так и снизу (см. упражнение в начале этого пункта). При этом Ф+ и Ф~ — конечные меры. Сказанное выше можно обобщить на за- заряды, ограниченные лишь с одной стороны, т. е. такие, для которых хотя бы одна из величин зирФ(А) и inf Ф{А) конечна. 2. Основные типы зарядов. Пусть \i — некоторая а-аддитив- а-аддитивная мера, определенная в пространстве X на некоторой сг-алгебре в. Множества, входящие в E, мы будем называть измеримыми. Введем следующие понятия. Мы скажем, что заряд Ф, определенный на множествах Е G 6, сосредоточен на измеримом множестве Д), если Ф(.Е) = 0 для каждого Е С X \ Aq . Множество Aq называется при этом носителем заряда Ф. Заряд Ф называется непрерывным, если Ф(.Е) = 0 для любого од- одноточечного множества Е. Заряд Ф называется дискретным, если
372 Гл. VI. Неопределенный интеграл Лебега он сосредоточен на некотором конечном или счетном множестве. Иными словами, дискретность заряда означает существование тако- такого конечного или счетного множества точек ci,..., сп,..., что для каждого Е С X Ф(Е) = ^ Заряд Ф называется абсолютно непрерывным (относительно данной меры /i), если Ф(А) = 0 для всякого измеримого А, для которого (л(А) = 0. Заряд Ф называется сингулярным (относительно меры /i), если он сосредоточен на некотором множестве нулевой /i-меры. Ясно, что если заряд одновременно абсолютно непрерывен и сингулярен отно- относительно /i, то он нулевой. 3. Абсолютно непрерывные заряды. Теорема Радона—Ни- кодима. Примером заряда, абсолютно непрерывного относительно данной меры /i, может служить интеграл Лебега Ф(А) = f f{x) 6ц А от фиксированной суммируемой функции /, рассматриваемый как функция множества. Оказывается, что этим и исчерпываются все абсолютно непрерывные заряды. Иначе говоря, справедлива сле- следующая теорема. Теорема 2 (Радон-Никодим). Пусть \i — некоторая ко- конечная а-аддитивная мера, определенная на а-алгебре в подмно- подмножеств из X, а Ф — заряд, определенный на той же а-алгебре и абсо- абсолютно непрерывный относительно \±. Тогда существует такая сум- суммируемая по \i функция f на X, что Ф(А)= f f(x)dfi А для каждого измеримого А. Эта функция, называемая производ- производной заряда Ф по мере \i, определяется однозначно, с точностью до \1-эквивалентности. (Две функции называются //-эквивалентными, если они совпада- совпадают почти всюду относительно меры /i.) Доказательство. Каждый заряд можно представить как раз- разность двух неотрицательных (см. п. 1), при этом абсолютно непре- непрерывный заряд представляется как разность абсолютно непрерыв- непрерывных. Поэтому доказательство теоремы достаточно провести для не- неотрицательных зарядов, т. е. для мер. Итак, пусть Ф — мера, аб- абсолютно непрерывная относительно данной меры \i. Докажем сле- следующую лемму.
§ 5. Интеграл Лебега как функция множества 373 Лемма. Пусть мера Ф абсолютно непрерывна относительно \± и не равна нулю тождественно. Тогда существуют такое п и такое измеримое множество В, что fi(B) > 0 и В положительно по отно- отношению к заряду Ф — ^/i. Доказательство леммы. Пусть X = А~ U A+ — разложение Хана, отвечающее заряду Ф — — /i (га = 1,2,...) и пусть ОО ОО Л" = П К, К = U а+. п=1 п=1 Тогда _ Ф(А0 ) ^ ^fi(A0 ) при всех га, т.е. $(Aq) = 0 и, следовательно, Ф(^) > 0, а значит, и /л(А^) > О (в силу абсолютной непрерывности Ф по /л). Поэтому найдется та- такое п, что fi(A+) > 0. Это п и множество В = А+ удовлетворяют условиям леммы. Перейдем теперь непосредственно к доказательству теоремы. Пусть К — множество функций / на X, обладающих следующими свойствами: / неотрицательны, интегрируемы по \± и Г f (x) d\i ^ А ^ Ф(-А) для всякого измеримого А. Пусть М = sup^ Г f(x) dfi по всем / G К \. х Возьмем последовательность функций {/п} из К такую, что lim Г fn(x)du = М. Положим gn(x) = max(/i(x),...,/n(x)). Покажем, что gn G К, т.е. что для всякого измеримого Е Е п Действительно, Е можно представить в виде (J Е^^ где Ej~ не пере- секаются и дп{х) = Л(ж) на ^; поэтому х; / х; ) = ад. Положим f(x) =
374 Гл. VI. Неопределенный интеграл Лебега Ясно, что при этом /(ж) = lim gn(x) и, следовательно, по теореме п—>-оо Б. Леви, Г fix) da = lim f gn(x) du = M. J n-^oo J X X Покажем теперь, что Ф(Е)- f f(x)dii = 0. E По построению, функция множества Х(Е) = Ф(Е)- f f(x)dfi Е неотрицательна и обладает всеми свойствами меры. Кроме того, она абсолютно непрерывна относительно \±. Если Л ^ 0, то в силу леммы найдутся такое г > 0 и такое В, fi(B) > 0, что s/i(EnB) ^ Х(ЕПВ) для любого измеримого Е. Тогда, положив h{x) = f{x) + ехв(х), где хв — индикатор множества В, мы получили бы для любого измеримого Е I h{x) dfi= I /(ж) dfi + sfiiEnB) ^ I /(ж) dn + ${EC\B) ^ Ф(Е). Е Е Е\В Это означало бы, что функция h принадлежит определенному выше множеству К. Но в то же время f h(x) dfi= f f(x) dfi + sfi(B) > M, X X а это противоречит определению М. Итак, существование такой функции /, что Ф(А)= f f(x)dn, А доказано. Покажем ее единственность. Если для всех A G в Ф(А)= f h(x)d»= f h{x)d^ A A то при любом п для множеств An = {x:f2{x)-h{x)>lln} имеем »(Ап)^п f (fi(x)-f2(x))dfji = 0. Аналогично, для Вш — {х : fi(x) — /2(ж) > 1/т} имеем 1*(Вт) = 0.
§ 6. Интеграл Стилтъеса 375 Так как {ж : Л (ж) # Мх)} = (\JAn) U ТО ц{х : Ш ? f2(x)} = О, т.е. fi(x) = /2(ж) почти всюду. Доказательство закончено. Замечание. Теорема Радона-Никодима представляет собой, очевидно, естественное обобщение теоремы Лебега о том, что абсо- абсолютно непрерывная функция есть интеграл от своей производной. Однако в то время как при рассмотрении функций на прямой у нас есть эффективный способ нахождения производной — вычисление предела отношения А/ к Ах, теорема Радона-Никодима лишь уста- устанавливает существование производной с?Ф jd\i абсолютно непрерыв- непрерывного заряда Ф по мере /i, но не дает способа для ее вычисления. Такой способ можно указать, но мы не будем на этом останавли- останавливаться. В общих чертах он состоит в вычислении предела отноше- отношения Ф(А)/[г(А) по некоторой системе множеств, «стягивающихся» в определенном смысле к данной точке. Детально эти вопросы рас- рассмотрены, например, в [53]. § 6. Интеграл Стилтьеса 1. Меры Стилтьеса. В § 1 предыдущей главы, говорилось о по- построении меры Лебега на прямой, мы уже упоминали о следующей конструкции. Пусть на некотором отрезке [а, Ь] задана монотонно неубывающая функция F, которую мы для определенности будем считать непрерывной слева. Определив меры всех отрезков, интер- интервалов и полуинтервалов, принадлежащих основному отрезку [а, 6], равенствами m(a,C)=F(C)-F(a + O), т(а, /3] = F@ + 0) - F(a + 0), мы можем затем распространить эту меру с помощью лебеговой процедуры продолжения меры на некоторую сг-алгебру а^, содер- содержащую все открытые и все замкнутые (а значит, и все борелевские) подмножества отрезка [а, Ь]. Меру [ip, полученную с помощью та- такого построения, называют мерой Лебега-Стилтъеса, отвечающей
376 Гл. VI. Неопределенный интеграл Лебега функции F, а саму функцию F называют производящей функцией этой меры1). Рассмотрим некоторые частные случаи мер Лебега-Стилтьеса. 1. Пусть F — функция скачков, xi, Ж2,... — ее точки разрыва, a /ii, /12, • • • — величины ее скачков в этих точках. Тогда мера /ip, отвечающая этой функции, устроена следующим образом: все под- подмножества отрезка [а, Ь] измеримы и мера множества А равна . B) Действительно, из определения меры Лебега-Стилтьеса сразу же видно, что мера каждой точки xi равна hi, а мера дополнения мно- множества {хг}(^1 равна нулю. Равенство B) для любого А С [а, Ь] выте- вытекает отсюда в силу а-аддитивности меры /ip. Мера /ip, построенная по какой-либо функции скачков, называется дискретной мерой. 2. Пусть F — абсолютно непрерывная неубывающая функция на [а, Ъ] и / = F' — ее производная. Тогда соответствующая мера /ip заведомо определена на всех измеримых по Лебегу подмножествах отрезков [а, 6], причем для каждого такого множества А /ip(A)= f f(x)dx. C) А Действительно, в силу теоремы Лебега для каждого полуинтервала М«.0) = ПР) - Па) = f f(x)dx. а Поскольку лебегово продолжение всякой сг-аддитивной меры од- однозначно определяется своими значениями на исходном полуколь- полукольце, отсюда следует равенство C) для всех измеримых по Лебегу А С [а, Ь]. Мера /ip, отвечающая абсолютно непрерывной функ- функции F, называется абсолютно непрерывной мерой. 3. Если F — сингулярная непрерывная функция, то отвечающая ей мера /ip целиком сосредоточена на том множестве лебеговой ме- меры нуль, на котором F' отлична от нуля или не существует. Сама мера /ip называется при этом сингулярной мерой. Ясно, что если F = F\ + F2, то /ip = /ip1 + /ip2; поэтому из раз- разложимости монотонной функции в сумму функции скачков, абсо- абсолютно непрерывной и сингулярной компонент следует, что всякую 1) Если монотонно неубывающая функция F не непрерывна слева, то по ней тоже можно определить меру, внеся в формулы A) очевидные изменения; на- например, надо положить т[а,/3] = F(C + 0) — F(a — 0) и т.д.
§ 6. Интеграл Стилтъеса 377 меру Лебега-Стилтъеса можно представить в виде суммы дис- дискретной, абсолютно непрерывной и сингулярной компонент. Раз- Разложение монотонной функции на три составляющие определяется с точностью до постоянных слагаемых. Поэтому разложение каждой меры Лебега-Стилтьеса на дискретную, абсолютно непрерывную и сингулярную компоненты однозначно. Сказанное выше относится к мерам Лебега-Стилтьеса на отрезке. Если теперь F — ограниченная (сверху и снизу) моно- монотонно неубывающая функция на всей прямой, то, определив меру любого отрезка, интервала и полуинтервала на прямой с помощью формул, аналогичных A), мы получим конечную меру на всей пря- прямой, которую мы тоже будем называть мерой Лебега-Стилтьеса. В частности, мера всей прямой при этом будет равна F(oc)-F(-oc), где F(oo) = lim F(x), F(-oo) = lim F(x) x—>-oo x—> — oo (существование пределов следует из монотонности и ограниченно- ограниченности F). Понятие меры Лебега-Стилтьеса на самом деле исчерпывает все меры (т. е. все конечные сг-аддитивные неотрицательные функции множеств) на прямой. Действительно, пусть \± — любая из таких мер. Положив F(x) =/i(-oo,x), мы получим монотонную функцию, такую, что отвечающая ей ме- мера Лебега-Стилтьеса совпадает с исходной мерой \i. Таким обра- образом, термин «меры Лебега-Стилтьеса» на самом деле не выделяет какого-либо специального класса мер на прямой, а указывает лишь на определенный способ построения таких мер — по заданной про- производящей функции. 2. Интеграл Лебега—Стилтьеса. Пусть \±р — мера на отрезке [а, 6], порожденная монотонной функцией F. Для этой меры обыч- обычным образом определяется класс суммируемых функций и вводится понятие интеграла Лебега ъ f f{x)dnF. а Такой интеграл, взятый по мере /ар, отвечающей функции F, назы- называется интегралом Лебега-Стилтьеса и обозначается символом I f(x)dF(x).
378 Гл. VI. Неопределенный интеграл Лебега Рассмотрим некоторые частные случаи. 1. Если F — функция скачков (т. е. если fip — дискретная мера), ъ то интеграл f f(x) dF(x) сводится, очевидно, к сумме ^2 f(xi)hi, где a i Xi — точки разрыва функции F, a hi — скачки F в точках Х{. 2. Если F — абсолютно непрерывная функция, то интеграл ь ь Лебега-Стилтьеса Г f(x)dF(x) равняется Г f(x)F'(x) dx, т.е. ин- а а тегралу от f(x)Ff(x), взятому по обычной лебеговой мере. Дей- Действительно, если /(ж) = const на некотором измеримом множе- множестве А С [а, Ь] и /(ж) =0 вне А, то равенство / f(x)dF(x) = f f(x)F'(x)dx D) а а следует из C). В силу а-аддитивности интегралов равенство D) рас- распространяется и на простые функции, суммируемые по мере fip. Пусть теперь {/п} — последовательность простых функций, рав- равномерно сходящаяся к /. Можно при этом считать, что последова- последовательность {/п} неубывающая. Тогда {fn(x)F'(x)} — неубывающая последовательность, почти всюду сходящаяся к f(x)Ff(x), и в силу теоремы Б. Леви, в равенстве f fn(x) dF(x) = ffn(x)F'(x)dx a a можно перейти к пределу при п —> оо. Из сказанного ясно, что если F есть сумма функции скачков и абсолютно непрерывной функции, то интеграл Лебега-Стилтьеса по мере /1р сводится к ряду (или конечной сумме) и интегралу по обычной мере Лебега. Если же F содержит и сингулярную компоненту, то такое сведение невозможно. Понятие интеграла Лебега—Стилтьеса можно естественным обра- образом расширить, перейдя от монотонных функций к произвольным функциям с ограниченным изменением. Пусть Ф — такая функция. Представим ее в виде разности двух монотонных функций ф = у — д, где v — полное изменение функции Ф на отрезке [а,ж]. Введем те- теперь интеграл Лебега-Стилтьеса по Ф, положив, по определению, / f(x) d*(x) = I /Or) dv(x) - I /Or) dg(x).
§ 6. Интеграл Стилтъеса 379 Нетрудно проверить, что если Ф представлена каким-либо иным способом как разность двух монотонных функций, скажем, Ф = w — h, то / f(x) dv(x) - J f(x) dg(x) = J f(x) dw(x) - I /Or) dh(x), a a a a т. е. для вычисления интеграла Лебега-Стилтьеса по данной функ- функции Ф можно пользоваться любым представлением этой функции в виде разности двух монотонных. 3. Некоторые применения интеграла Лебега—Стилтьеса в теории вероятностей. Интеграл Лебега-Стилтьеса находит применение как в анализе, так и во многих прикладных вопросах. В частности, это понятие широко используется в теории вероятнос- вероятностей. Напомним, что функцией распределения случайной величины ? называется функция F, определяемая для каждого х равенством F(x) = Р(? < х), т. е. F(x) есть вероятность того, что случайная величина ? примет значение, меньшее х. Очевидно, каждая функция распределения мо- монотонно не убывает, непрерывна слева и удовлетворяет условиям F(-oo)=0, F(+oo) = l. Обратно, каждую такую функцию можно считать функцией распре- распределения некоторой случайной величины. Существенными характеристиками случайной величины являют- являются ее математическое ожидание оо Щ= J xdF(x) E) — оо и дисперсия ^ Df= | (x-M02dF(x). F) — оо Среди случайных величин выделяют обычно так называемые дискретные и непрерывные случайные величины. Случайная вели- величина называется дискретной, если она может принимать лишь не- некоторое конечное или счетное число значений (например, число вызовов на телефонной станции за некоторый про- промежуток времени есть дискретная случайная величина).
380 Гл. VI. Неопределенный интеграл Лебега Если pi,..., pn,... — вероятности, с которыми величина ? прини- принимает значения xi,..., хп,..., то функцией распределения ? служит, очевидно, функция скачков. Для нее интегралы E) и F) сводятся соответственно к суммам U - aJpi, a = Mf. Случайная величина ? называется непрерывной, если ее функция распределения F абсолютно непрерывна. Производная F' этой функции распределения называется плотностью распределения ве- вероятностей случайной величины ?. В соответствии со сказанным в предыдущем пункте, для непрерывной случайной величины стил- тьесовские интегралы, выражающие ее математическое ожидание и дисперсию, сводятся к интегралам по обычной лебеговой мере: оо оо М? = / хр(х) dx, D? = Г (х - аJр(х) dx, — оо —оо где р = F' — плотность распределения вероятностей для ? и а = М?. В элементарных курсах теории вероятностей ограничиваются обычно рассмотрением дискретных и непрерывных случайных ве- величин, которые в основном только и встречаются в прикладных вопросах. Однако, вообще говоря, функция распределения случай- случайной величины может содержать и сингулярную компоненту, так что не всякую случайную величину можно представить как комбинацию дискретной и непрерывной. Пусть ? — случайная величина, F — ее функция распределения и г] = <?>(?) — другая случайная величина, представляющая собой боре- левскую функцию от ?. Математическое ожидание Мт/ величины г\ можно, по определению, записать как где Ф — функция распределения для г]. Существенно, однако, если (р сум- суммируема по мере, порождаемой на прямой функцией F, то математиче- математическое ожидание величины г\ можно записать и через функцию распределе- распределения F величины ?, а именно: Щ = M<p(f) = J (p(x)dF(x).
§ 6. Интеграл Стилтъеса 381 Действительно, функция у = (р(х) определяет отображение пря- прямой (—оо < х < оо) с заданной на ней мерой /if (порожденной F) в прямую (—оо < у < оо) с мерой //ф, в которую /if переводится ото- отображением у = <р(х). Но из результатов гл. V следует, что если (Х,/л) и (У, v) — два пространства с мерой, (р — сохраняющее меру (т. е. такое, что v(A) = /i((p~1(A))) отображение, переводящее (X,/i) в (У, i/), а / — суммируемая функция на (У, г/), то (замена переменных в интеграле Лебега). Положив здесь /(г/) = у и /л = //f, is = /л, мы и получим требуемое равенство. Таким образом, для вычисления математического ожидания (а также, конечно, и дисперсии) функции от величины ? достаточно знать лишь функцию распределе- распределения самой величины ?. 4. Интеграл Римана—Стилтьеса. Наряду с интегралом Лебе- га-Стилтьеса, рассмотренным выше и представляющим собой фак- фактически разность лебеговых интегралов от данной функции / по двум мерам, заданным на прямой, можно определить еще и так называемый интеграл Римана-Стилтьеса. Он вводится как предел интегральных сумм, аналогичных обычным интегральным суммам Римана. Пусть снова Ф — некоторая непрерывная слева функция с огра- ограниченным изменением, заданная на полуинтервале [а, Ь) и / — про- произвольная функция на этом же полуинтервале. Рассмотрим некото- некоторое разбиениех) а = хо < х\ < • • • < хп = Ъ полуинтервала [а, Ъ) на элементы [xi-i,Xi) и, выбрав в каждом из них произвольную точку ^, составим сумму ?. (г- П1 G) г=1 (под Ф{хп) при этом понимается Ф(Ь —0)). Если при тах(ж^ — Xi-i) —>- —>¦ 0 эти суммы стремятся к некоторому пределу (не зависящему ни от способа дробления промежутка [сц Ь), ни от выбора точек ^ в каждом из элементов разбиения), то этот предел называется ин- интегралом Римана-Стилтьеса от функции / по функции Ф по [а, Ь) и обозначается символом (8) 1) Поскольку в интеграле Стилтьеса вклад отдельных точек может быть от- отличен от нуля, элементы разбиения не должны иметь общих точек. Поэтому мы везде берем здесь полуинтервалы.
382 Гл. VI. Неопределенный интеграл Лебега Теорема 1. Если функция / непрерывна на отрезке [a,b], то ее интеграл Римана-Стилтьеса (8) существует и совпадает с соответ- соответствующим интегралом Лебега—Стилтьеса. Доказательство. Сумму G) можно рассматривать как инте- интеграл Лебега-Стилтьеса от ступенчатой функции fn(x) = /(&) При Xi-! ^ X < Xi. При измельчении разбиения промежутка [а, Ь) последовательность таких функций равномерно сходится к /. Поэтому предел этих сумм существует и представляет собой интеграл Лебега-Стилтьеса от предельной функции / (теорема о предельном переходе под зна- знаком интеграла). Вместе с тем именно этот предел мы и назвали интегралом Римана-Стилтьеса (8). Установим некоторые элементарные свойства интеграла Римана- Стилтьеса. 1. Справедлива оценка (теорема о среднем) f(x)d*(x) ^тах|/(х)|К6[Ф] (9) (Уа6[Ф] — полное изменение функции Ф на [а, Ь]). Действительно, при любом разбиении промежутка [а, Ъ) выполне- выполнено неравенство | Переходя в этом неравенстве к пределу, мы и получим оценку (9). При Ф(ж) = х она переходит в известную оценку Ъ f{x) dx ^ {Ь — a) max \f(x)\ а для интеграла Римана. 2. Если Ф = Ф1 + Ф2; то f f(x) AФ(х) = f f(x) d^{x) + / f(x) AФ2(х). а а а Действительно, при всяком разбиении промежутка [а, Ь) соответ- соответствующее равенство выполнено для интегральных сумм, следова- следовательно, оно сохраняется и в пределе, т. е. для интегралов.
§ 6. Интеграл Стилтъеса 383 Замечание 1. Мы определили интеграл Римана—Стилтьеса (8), считая, что функция Ф(ж) непрерывна слева. Однако определение этого интеграла как предела сумм G) сохраняет, очевидно, смысл и для любой функции Ф(ж) с ограниченным изменением. Замечание 2. Все сказанное об интеграле Римана-Стилтьеса по конечному промежутку легко переносится на случай, когда ин- интеграл берется по всей прямой или по полупрямой. Кроме того, мы определили интеграл Стилтьеса по полуинтерва- полуинтервалу [а, Ь). Аналогично можно определить интеграл по (а, 6], а также интегралы по [а, Ь] и (а, Ь). В случае интеграла Стилтьеса, в отличие от обычного риманова интеграла, значения интеграла по интерва- интервалу (а, 6), отрезку [а, Ь] и полуинтервалам (а, Ь] и [а, 6), вообще гово- говоря, не совпадают между собой. Например, если а — точка разрыва функции Ф, то интеграл по [а, Ь] равен интегралу, взятому по (а, Ь] плюс член вида f(a)h, где h = Ф(а + 0) - Ф(а). Приведенные свойства 1 и 2 выполнены для любой функции /, для которой входящие в их формулировки выражения имеют смысл. Если предположить, что /(ж) непрерывна на отрезке [а, 6], то соответствующий интеграл обладает еще следующими существен- существенными свойствами (при этом интеграл можно понимать как интеграл по отрезку [а, Ь] или по любому из полуинтервалов (а, Ь] и [а, Ь)). 3. Если Ф\ и Ф2 — две функции с ограниченным изменением на [а,Ь), совпадающие всюду, кроме конечного или счетного числа внутренних точек этого промежутка, то f f(x)d$1(x)= f f(x)d$2(x) a a для любой непрерывной на [а, Ь] функции /. Для доказательства рассмотрим сперва случай, когда Ф2 = 0, т. е. установим справедливость следующего утверждения. 3;. Если ф — функция с ограниченным изменением, отличная от нуля лишь в конечном или счетном числе точек, лежащих вну- внутри (а,Ь), то I f(x)d^(x) =0 а для любой непрерывной на [а, Ь] функции /. Действительно, это очевидно для функции, отличной от нуля в одной точке хо (если брать сколь угодно мелкие разбиения проме- промежутка [а, 6), не включая хо в число точек деления, то будут полу- получаться интегральные суммы, равные нулю), следовательно, по адди- аддитивности это верно и для любой функции, отличной от нуля в конеч- конечном числе точек. Пусть теперь ф отлична от нуля в точках ri,...,
384 Гл. VI. Неопределенный интеграл Лебега гп,... и 2/i,..., 2/п,... — ее значения в этих точках. Поскольку ф имеет ограниченное изменение, то J^bnl < сю. Выберем номер N п так, что ^2 \Уп\ < ?5 и представим ф в виде суммы n>N Ф = Фм + Ф, где фн принимает значения у\,..., уп в точках Т\,..., гдг и равна О во всех остальных, а ф отлична от 0 только в точках r/v+i, r/v+2? В силу свойства 2 / /(ж) #(а;) = / !{х) d<pN(x) + / f{x) йф{х). а а а Первый из этих интегралов по уже доказанному равен нулю, а вто- второй, по свойству 1, допускает оценку ъ _ / (ж) Aф (х) < max | / (ж) | 2е (поскольку, очевидно, V^f^] = 2 ^ \уп\ < 2е). В силу произвольно- n>N сти г отсюда вытекает наше утверждение. Теперь для доказательства свойства 3 рассмотрим разность ф = = <I>i — <1>2. Она отлична от нуля лишь в конечном или счетном числе точек, принадлежащих (а, Ь). Остается применять 2 и 3'. В частно- частности, поскольку функция с ограниченным изменением имеет не более чем счетное число точек разрыва, получаем следующее свойство. 4. Если функция f непрерывна, то интеграл Римана-Стилтьеса ъ Г f(x) с1Ф(х) не зависит от значений, принимаемых функцией Ф а в ее точках разрыва, лежащих внутри (а, Ь). Поскольку интеграл Римана—Стилтьеса от непрерывной функции совпадает с соответствующим интегралом Лебега-Стилтьеса, для интеграла Римана-Стилтьеса от непрерывной функции /(ж) спра- справедливы равенства а % если Ф — функция скачков, и ь ь f f(x) AФ(х) = / f(x) d&{x) dx, A0) а а если Ф — абсолютно непрерывная функция. Если при этом Ф; ин- интегрируема по Риману, то интеграл в A0) справа можно понимать в римановом смысле.
§ 6. Интеграл Стилтьеса 385 5. Предельный переход под знаком интеграла Стилтье- Стилтьеса. В гл. V мы доказали ряд теорем о предельном переходе под зна- знаком интеграла Лебега. При этом вопрос ставился следующим обра- образом: даны последовательность функций {/п} и интегралы от них по некоторой фиксированной мере; нас интересует возможность пре- предельного перехода под знаком интеграла. Однако применительно к интегралу Стилтьеса интересна и другая постановка вопроса; да- дана последовательность функций с ограниченным изменением {Фп}- При каких условиях для фиксированной функции / под знаком ин- интеграла f f{x)d*n{x) а возможен предельный переход? Здесь имеет место следующая теорема. Теорема 2 (первая теорема Хелли). Пусть функции Фп с ограниченным изменением на отрезке [а, Ъ] сходятся в каждой точ- точке этого отрезка к некоторой функции Ф, причем полные изменения функций Фп ограничены в совокупности: УЬ[ФП] ^ С, п = 1, 2, Тогда предельная функция Ф тоже имеет ограниченное изменение и для любой непрерывной функции f справедливо равенство lim / f(x) d$n(x) = f f(x) d*(x). A1) n—юо J J a a Доказательство. Покажем прежде всего, что полное измене- изменение предельной функции Ф не превосходит той же константы С, ко- которой ограничены все ^6[ФП]. Действительно, при любом разбиении отрезка [а, Ъ] точками a = хо < х\ < • • • < хш = Ъ имеем га га У] \Ф(хк) - Ф(а;*_1)| = lim V \Фп(хк) - Ф„(а*_1)| < С, k=l k=l следовательно, Покажем теперь, что соотношение A1) выполнено в том случае, если / — ступенчатая функция. Пусть / принимает значения hk на по- полуинтервалах [хк-1,Хк). Тогда f /(х)с1Фп(х) = а к а к
386 Гл. VI. Неопределенный интеграл Лебега Ясно, что первое из этих выражений при п —У оо переходит во вто- второе. Пусть теперь / — непрерывная функция иг — произвольное положительное число. Выберем ступенчатую функцию f? так, что \f(x)-fe(x)\<e/CC). Тогда ъ ъ - J f{x)d$n{x) ? а Ъ J а - f fE(x)d*n(x) fe(x)d*n(x)- f f(x)d*n(x) a В силу теоремы о среднем для интеграла Стилтьеса первое и тре- третье слагаемые здесь меньше, чем г/3, а второе — меньше г/3 при всех достаточно больших п. Поскольку г > 0 произвольно, отсюда вытекает утверждение теоремы. Замечание. Эта теорема переносится и на тот случай, когда в интегралах f f{x)d*n{x) а один или оба предела бесконечны. При этом, однако, функция / должна на бесконечности стремиться к некоторому конечному пре- пределу (это позволяет равномерно аппроксимировать ее на всем бес- бесконечном промежутке ступенчатыми функциями, принимающими лишь конечное число значений). Если первая теорема Хелли устанавливает условия, при которых в интеграле Римана-Стилтьеса можно переходить к пределу по не- некоторой последовательности {Фп} функций с ограниченным изме- изменением, то вторая выясняет, когда можно гарантировать само суще- существование последовательности, удовлетворяющей условиям первой. Теорема 3 (вторая теорема Хелли). Из всякого беско- бесконечного множества М функций Ф, заданных на некотором отрезке [a,b] и удовлетворяющих условиям : к A2)
§ 6. Интеграл Стилтъеса 387 (С п К — постоянные, одни и те же для всех Ф G М), можно выбрать последовательность, сходящуюся в каждой точке отрезка [а, Ь]. Доказательство. Достаточно доказать эту теорему для мо- монотонных функций. Действительно, пусть Ф = у-д, где v(x) — полное изменение функции Ф на отрезке [а,ж]. Тогда функции v, отвечающие всем Ф Е М, удовлетворяют неравенствам т. е. удовлетворяют условиям теоремы, и монотонны. Считая, что для монотонных функций теорема доказана, выберем последова- последовательность {Фп} из М так, чтобы для нее vn сходились к некоторому пределу v. Далее, функции тоже монотонны и удовлетворяют условиям теоремы. Поэтому из {Фп} можно выбрать подпоследовательность {ФПА,} так, что дПк схо- сходятся к некоторому пределу д. Но тогда ФПк (ж) -> Ф(ж) = v(x) - д(х). Итак, приведем доказательство теоремы для семейства М монотон- монотонных функций. Пусть ri,..., гп,... — все рациональные точки от- отрезка [а, Ь]. В силу A2) числа Ф(г\) (где Ф пробегает все М) образу- образуют ограниченное множество, поэтому найдется последовательность {Фп '}, сходящаяся в точке г\. Далее, из нее можно выбрать подпо- подпоследовательность {Фп }, сходящуюся в точке г 2 (и, конечно, в г\). Из {Фп } выберем подпоследовательность, сходящуюся в точке гз, и т.д. Диагональная последовательность {Фп } будет, очевидно, сходиться во всех рациональных точках отрезка [а, Ь]. Ее предел есть неубывающая функция Ф, определенная пока лишь в точках ri,..., гп,... Доопределим ее в остальных точках отрезка [а, 6], по- положив для иррациональных х Ф(х) = lim Ф(г) (г рациональны). г—ух—О Покажем, что полученная таким образом неубывающая функция Ф во всех точках непрерывности служит пределом последовательности {Фп }• Пусть х* — одна из таких точек. Тогда для заданного г > О можно найти такое S > 0, что \Ф(х*) - Ф(х)\ < г/б, как только \х* - х\ < 5. A3) Выберем рациональные точки г' и г" так, что г' < ж* < г" и г' > > ж* — й, г" < ж* + S. Пусть теперь по настолько велико, что при п > по выполнены неравенства |Фп(г;) - Ф(г')| < е/6, |Фп(г") - Ф(г")| < г/6. A4)
388 Гл. VI. Неопределенный интеграл Лебега Из A3) и A4) следует, что |*n(r')-*n(r")|<§?. Так как функция Фп неубывающая, то Фп(г') ^ Фп(^*) ^ $ni?")- Поэтому \Ф(х*) - Ф„(ж*)| ^ \Ф(х*) - Ф(г')| + |Ф(г') - Ф„(г')| + + |Фп(г')-Фп(^Ж| + | + ^ = е, а это и значит, что lim Фп(х*) = Ф(ж*). п—>-оо Итак, мы построили последовательность функций из М, сходя- сходящуюся к предельной функции Ф всюду, кроме, быть может, точек разрыва функции Ф. Так как множество таких точек не более чем счетно, то, применив снова диагональный процесс, можно из после- последовательности {Фп} выделить подпоследовательность, сходящуюся и в этих точках, т. е. всюду на [а, Ь]. 6. Общий вид линейных непрерывных функционалов в пространстве непрерывных функций. Выше мы уже указы- указывали некоторые применения интеграла Стилтьеса. Сейчас мы рас- рассмотрим еще одну задачу, связанную с этим понятием, а именно, выясним общий вид линейного функционала в пространстве С [а, Ь]. Теорема 4 (Ф. Рисе). Всякий линейный непрерывный функ- функционал F в пространстве С [а, Ь] представим в виде F(f)= ff(x)d$(x), A5) a где Ф — некоторая функция с ограниченным изменением1). При этом Доказательство. Пространство С [а, Ь] можно рассматривать как подпространство пространства M[a,b] всех ограниченных функ- функций на этом отрезке, с той же нормой ||/|| = sup |/0e)|, что и в С [а, Ь]. Пусть F — непрерывный линейный функционал на С [а, Ь]. По теореме Хана—Банаха его можно продолжить, с со- сохранением нормы, с С [а, Ь] на все M[a,b]. В частности, такой про- продолженный функционал будет определен на всех функциях вида ha(x)=0, hT{x) = {\ ПРИ ^Г' A6) [ 0 при х > г, если т > а. 1) Здесь имеется в виду интеграл по отрезку [а, Ь].
§ 6. Интеграл Стилтьеса 389 Положим Ф(г) = F(hT) A7) и покажем, что функция Ф имеет ограниченное изменение на отрез- отрезке [а, Ь]. Действительно, возьмем произвольное разбиение а = х0 < xi < • • • < хп = Ъ A8) этого отрезка и положим Тогда п п ^2\Ф(хк) -Ф(хк-1)\ = ^2<Хк(Ф(хк) -Ф(хк-!)) = к=1 к=1 cfc -hxk-i) = ¦ Но функция ^2 &k(hxk — hxk-г) принимает лишь значения =Ы и 0. к=1 Следовательно, ее норма равна 1. Таким образом, к=1 Поскольку это верно для любого разбиения отрезка [а, Ь], то Vo6[*] ^ \\F\\. Итак, мы построили по функционалу F функцию Ф, имеющую огра- ограниченное изменение. Покажем, что именно с помощью этой функции функционал F записывается в виде интеграла Стилтьеса A5). Пусть / — произвольная непрерывная функция на [а, Ь]. Зада- Зададим положительное е и выберем 8 > 0 так, что \f(x") — f(x')\ < s при \х" - х'\ < S. Выберем теперь разбиение A8) так, чтобы длина каждой из частей была меньше 6, и рассмотрим ступенчатую функ- функцию f?: fe(x)=f(xk) При Хк-г < X ^Хк, &=1,...,П, fs(a)=f(a). Ее, очевидно, можно записать в виде к=1
390 Гл. VI. Неопределенный интеграл Лебега где hT — функция, определенная равенством A6). Ясно, что \f(x) — f?(x)\ < г при всех х (а ^ х ^ 6), т.е. Найдем значение функционала F на элементе f?. В силу линейности этого функционала и определения функции hT оно равно Fife) = ?/(**)№*) ~ Fih,^)] = ? Пхк)[Ф(хк) - к=1 к=1 т. е. представляет собой интегральную сумму для интеграла ff(x)d*(x). Поэтому при достаточно мелком разбиении отрезка [а, Ь] F(fe)- f f(x)d$(x) а Но в то же время ъ <е. Следовательно, F(f)- ff(x)d*(x) <e(l откуда в силу произвольности е получаем равенство Ftf)=f f(x)d$(x). а Мы показали, что полное изменение функции Ф, определяемой фор- формулой A7), удовлетворяет неравенству К6И < 11*11- A9) С другой стороны, из теоремы о среднем для интеграла Римана- Стилтьеса сразу следует, что у?[ф]. B0) Сравнивая A9) и B0), получаем равенство \\F\\ = У?[Ф]. Теорема полностью доказана.
§ 6. Интеграл Стилтьеса 391 Замечание. Ясно, что взяв произвольную функцию с ограни- ограниченным изменением Ф на отрезке [а, Ь] и положив F(f)= ff(x)d*(x), а мы получим линейный функционал на пространстве С [а, Ь]. При этом две функции, Ф1 и Ф2, совпадающие на [а, Ь] всюду, за исклю- исключением не более чем счетного множества внутренних точек этого отрезка, определяют один и тот же линейный функционал; обрат- обратно, пусть Ф1 и Ф2 определяют один и тот же функционал на С[а, Ь], т-е- ъ ъ Г f(x) d$\(x) = f f(x) dФ2(x) a a для каждой непрерывной функции /. Отсюда легко следует, что ф1 _ ф2 — const во всех точках непрерывности функции Ф1 — Ф2, т. е. всюду, кроме, быть может, конечного или счетного множества точек. Таким образом, каждому непрерывному линейному функциона- функционалу на С [а, Ь] отвечает класс функций с ограниченным изменением на [а, Ь], причем Ф1 и Ф2 принадлежат одному классу в том и только том случае, если их разность отличается от постоянной не более чем в счетном числе внутренних точек отрезка [а, Ь]. В каждом таком классе можно выбрать одну и только одну функцию, равную ну- нулю в точке а и непрерывную справа всюду на полуинтервале (а, Ь]. Функции, удовлетворяющие этим условиям, образуют в простран- пространстве всех функций с ограниченным изменением на [а, Ь] замкнутое линейное подпространство, которое мы обозначим V°[a, b]. Заметим, наконец, что для любого функционала F на С [а, Ь] соответствующая функция Ф(т), определяемая равенством A7), есть функция имен- именно из V0 [а, Ь]. Так как для таких Ф(т) было установлено равенство ||F|| = Уаь[Ф], по теореме 4 можно придать следующий вид. Теорема 4'. Существует изоморфное (т.е. взаимно однознач- однозначное, линейное и изометричное) соответствие между пространствами (С[а, Ь])* и V°[a, b], устанавливаемое равенством F(f)= ff(x)d$(x). a Такое представление линейного функционала с помощью функ- функции из V0 [а, Ь] мы будем называть каноническим. Из этой теоремы легко получить следующую теорему о кано- каноническом представлении линейного функционала на пространстве С1 [а, Ь] непрерывных и непрерывно дифференцируемых функций, играющую существенную роль в вариационных задачах.
392 Гл. VI. Неопределенный интеграл Лебега Теорема 5. Всякий линейный функционал в пространстве С1 [а, Ь] можно представить одним и только одним способом в виде F(f)=af(a)+ f f'(x)d$(x), B1) a где a — число и Ф G V°[a, b]. Доказательство. Рассмотрим в С1 [а, Ь] подпространство С1 [а, Ь] функций, удовлетворяющих условию /(а) = 0, и оператор А = d/dx, переводящий это подпространство во все пространство C[a,b]. Пусть F — линейный функционал на С1 [а, 6]. Рассмотрим его сначала только на подпространстве С1 [а, Ь]. Теперь к оператору А: С1 [а, Ь] ->• С [а, Ь] и функционалу F: Ci[a,b] ->• R можно приме- применить лемму о тройке (гл. IV § 5, п. 4). В силу этой леммы найдется такое линейное отображение: ф : С[а, Ь] -»¦ R, что для каждой функции g G С1 [а, Ъ] F(g)=iP(Ag). B2) Каждая функция / G С1 [а, Ь] может быть представлена в виде f(x)=f(a)+g(x), geC^b]. Поэтому F(f) = F(f(a))+F(g). B3) В силу теоремы Рисса, равенства B2) и определения оператора А имеем: или ъ F(g)=4,(Ag)= fg'(x)d*(x), ъ F(g)= ff(x)d$(x), B4) а поскольку f'(x) = g'(x). Пусть а — значение функционала F на функции, тождественно равной единице. Тогда из B3) и B4) окон- окончательно получаем представление B1).
ГЛАВА VII ПРОСТРАНСТВА СУММИРУЕМЫХ ФУНКЦИЙ Один из важнейших классов нормированных пространств соста- составляют пространства суммируемых функций, в первую очередь про- пространство всех суммируемых функций L\ и пространство L^ функ- функций с суммируемым квадратом. Сейчас мы рассмотрим основные свойства этих пространств. Содержание этой главы опирается, с од- одной стороны, на общие свойства метрических и линейных нормиро- нормированных пространств, изложенные в гл. II—IV, а с другой, — на вве- введенное в гл. V понятие интеграла Лебега. § 1. Пространство L\ 1. Определение и основные свойства пространства L\. Пусть X — некоторое пространство с мерой /i; при этом мера само- самого X может быть конечной или бесконечной. Будем считать меру \i полной (т.е. любое подмножество любого множества меры нуль измеримо). Рассмотрим совокупность всех функций /, суммируе- суммируемых на X. Поскольку линейная комбинация суммируемых функций суммируема, эта совокупность, с обычными операциями сложения функций и умножения их на числа, образует линейное простран- пространство. Это пространство мы обозначим L\(X,\i) или, короче, про- просто L\. Введем в L\ норму, положив1) / A) Ясно, что при этом 11«/|| = Н-|1Л1, II/1 + /2KII/1II + II/2II. Однако для того чтобы выполнялось и последнее свойство нормы, а именно, > 0, если / ф О, 1) Здесь и далее символ / будет означать интегрирование по всему простран- пространству X.
394 Гл. VII. Пространства суммируемых функций нужно считать, что функции, эквивалентные друг другу на X, не различаются, а считаются за один и тот же элемент простран- пространства L\. В частности, нулевой элемент в L\ — это совокупность всех функций, равных нулю почти всюду. При этом выражение A) будет обладать всеми свойствами нормы. Итак, мы приходим к следую- следующему определению. Определение 1. Пространством L\ называется нормирован- нормированное пространство, элементами которого служат классы эквивалент- эквивалентных между собой суммируемых функций; сложение элементов в L\ и умножение их на числа определяются как обычное сложение и умно- умножение функций1), а норма задается формулой В Li, как и во всяком нормированном пространстве, с помощью фор- формулы вводится расстояние. Сходимость последовательности суммируе- суммируемых функций в смысле этого расстояния называют сходимостью в среднем. Пространство L\ можно считать состоящим из комплекс- комплексных функций (комплексное L\) или из одних только действитель- действительных (действительное L\). Содержание данного параграфа относится к обоим этим случаям. Весьма важен для многих вопросов анализа следующий факт. Теорема 1. Пространство L\ полно. Доказательство. Пусть {/п} — фундаментальная последо- последовательность в Li, т.е. ||/n-/m||->0 при n,m-^оо. Тогда можно найти такую возрастающую последовательность ин- индексов {п/.}, что \\fnk - fnk+1\\ * Из этого неравенства и теоремы Б. Леви вытекает, что ряд 1/^1 I ~1~ 1/П2 ~ Jn\ | ~Г • • • 1) Точнее: каждый элемент в Li — это класс эквивалентных между собой суммируемых функций; чтобы сложить два таких класса, надо взять в них по представителю и объявить суммой класс, содержащий сумму выбранных представителей. Ясно, что результат не зависит от произвола в выборе пред- представителей. Аналогично — и для умножения элемента из L\ на число.
1. Пространство L\ 395 сходится почти всюду на X. Но тогда и ряд сходится почти всюду на X к некоторой функции /О) = lim fnh{x). к—>-оо Таким образом, фундаментальная последовательность в L\ со- содержит подпоследовательность, сходящуюся почти всюду. Покажем теперь, что подпоследовательность {/nfc} сходится к той же функции /ив среднем. В силу фундаментальности последова- последовательности {/п} при любом фиксированном г > 0 для всех достаточ- достаточно больших к и I имеем Согласно теореме Фату в этом неравенстве можно перейти к пределу под знаком интеграла при I —у оо. Получаем f\fnk(x) - /0I ^ ^e, откуда следует, что / G L\ и что fnk —у /. Но из того, что фунда- фундаментальная последовательность содержит подпоследовательность, сходящуюся к некоторому пределу, следует, что и сама она сходит- сходится к тому же пределу. Теорема доказана. 2. Всюду плотные множества в L\. Для всякой функции /, суммируемой на X, и любого е > 0 существует такая простая сум- суммируемая функция ср(х), что f\f(x)-(p(x)\dii<e. Далее, поскольку для простой суммируемой функции, принимаю- принимающей значения у\, у2,... на множествах Е\, Е^,..., интеграл опреде- определяется как сумма ряда 71=1 (при условии его абсолютной сходимости), ясно, что всякую про- простую суммируемую функцию можно представить как предел (в сред- среднем) последовательности простых функций, принимающих лишь ко- конечное число значений. Итак, в пространстве L\ всюду плотны
396 Гл. VII. Пространства суммируемых функций функции, каждая из которых принимает лишь конечное число зна- значений (т. е. представляет собой конечную линейную комбинацию ин- индикаторов) . Пусть R — метрическое пространство с введенной в нем мерой, удовлетворяющей такому условию (выполненному для меры Лебега в евклидовом пространстве и во многих других практически инте- интересных случаях): все открытые и все замкнутые множества в R измеримы, и для любого измеримого множества М С R и любого г > 0 найдется1) такое открытое G D М, что »{G\M)<e. B) Тогда верна следующая теорема. Теорема 2. Множество всех непрерывных функций всюду плотно в L\ (R, /i). Доказательство. В силу сказанного выше достаточно дока- доказать, что всякая простая функция, принимающая конечное число значений, является пределом, в смысле сходимости в среднем, по- последовательности непрерывных функций. Далее, так как всякая суммируемая простая функция, принимающая конечное число зна- значений, есть линейная комбинация индикаторов Хм{х) измеримых множеств конечной меры, то достаточно провести доказательство для этих последних. Пусть М — измеримое множество в метри- метрическом пространстве R и /л(М) < оо. Тогда из условия B) сразу следует, что для любого г > 0 найдутся замкнутое множество Fm и открытое множество Gm такие, что FM CM CGM и Определим теперь функцию (р?(х), положив2) ф (х) {ре{Х) p(x,R\GM)+p(x,FMy Эта функция равна 0 при х Е R \ Gm и равна 1 при х Е Fm- Она непрерывна, так как каждая из функций p(x,Fm) и p(x,R \ Gm) непрерывна и их сумма нигде не обращается в 0. Функция \хм ~ Фе\ не превосходит 1 на Gm \ Fm и равна 0 вне этого множества. Сле- Следовательно, /\Хм(х) -(p?(x)\dfjL <е, откуда и вытекает утверждение теоремы. 1) Ср. упражнение в п. 7, § 4, гл. V. 2) р(х, А) означает от точки х до множества А.
1. Пространство L\ 397 Ясно, что пространство Li(X, /i) зависит и от выбора простран- пространства X, и от выбора меры \± в нем. Например, если мера \± сосре- сосредоточена в конечном числе точек, то L\(X,\i) будет просто конеч- конечномерным пространством. В анализе основную роль играют про- пространства L\ бесконечной размерности, но содержащие счетное всю- всюду плотное подмножество. Для того чтобы охарактеризовать такие пространства Li, введем еще одно понятие, относящееся, собствен- собственно, к общей теории меры. Определение 2. Мера \± называется мерой со счетным бази- базисом, если существует такая счетная система А = {Ап} (п = 1,2,...) измеримых подмножеств пространства X (счетный базис меры /i), что для всякого измеримого Мс1и всякого е > 0 найдется такое Ак е Л, что /а(М Д Ак) < г. В частности, мера \i имеет счетный базис, если ее можно предста- представить как лебегово продолжение меры т, определенной на некотором счетном полукольце в. В самом деле, в этом случае кольцо 9\(&) (очевидно, счетное) и представляет собой искомый базис. Отсюда видно, например, что счетный базис имеет мера Лебега на отрезке, поскольку для нее за исходное полукольцо можно принять совокуп- совокупность полуинтервалов с рациональными концами. Произведение \i = \i\ 0 \i^ двух мер со счетными базисами также обладает счетным базисом, ибо конечные суммы произведений эле- элементов из базиса меры \i\ на элементы из базиса меры \i^ образуют, как легко проверить, базис меры \i — /ii (g) \±2- Поэтому мера Лебега на плоскости (а также и в n-мерном пространстве) имеет счетный базис. Пусть А\,...,Ап,... C) есть счетный базис меры \i. Легко видеть, что, расширяя систему множеств C), можно образовать новый счетный базис этой меры Аи..., An,..., D) замкнутый по отношению к операциям вычитания и взятия конеч- конечных сумм и пересечений, т. е. являющийся кольцом. Теорема 3. Если мера \± имеет счетный базис, то в L\(X,\±) существует счетное всюду плотное множество функций. Доказательство. Покажем, что счетное всюду плотное мно- множество в L\ (X, /i) образуют конечные суммы E)
398 Гл. VII. Пространства суммируемых функций где Ck — рациональные числа, а Д — индикаторы элементов счет- счетного базиса меры \i. Счетность такого множества очевидна; покажем, что оно всю- всюду плотно в I/i (X, /i). Как мы уже показали, множество ступенча- ступенчатых функций, принимающих лишь конечное число значений, всюду плотно в L\. Так как любую такую функцию можно сколь угодно точно аппроксимировать функцией того же вида, но принимающей лишь рациональные значения, достаточно показать, что любую сту- ступенчатую функцию /, принимающую значения на множествах таких, что Уи п г=1 ¦¦¦,Уп ?н=Х, (все г Еи.. Е.ПЕ ц рациональны) ¦ ,Еп 7j = 0 при г ф можно сколь угодно точно аппроксимировать в смысле метрики L\ функциями вида E). Согласно сделанному замечанию можно без ограничения общности предполагать, что базис меры \± является кольцом. По определению счетного базиса меры /i, при любом г > 0 в нем существуют такие множества А±,..., Ап, что /i(Ek Л Ак) < г. Положим A'k=Ak\\JAi, fc = l,...,n, i<k и определим /*, положив {ук при х G А'к, п О при xeR\[J А[. Легко видеть, что при достаточно малом е мера сколь угодно мала и, следовательно, интеграл / \f(x) - Г(х)\ dn ^ Bтах\ук\)ц{х : f(x) ф f*(x)} сколь угодно мал при достаточно малом е. В силу сделанных нами предположений относительно базиса ме- меры /i, функция /* есть функция вида E). Теорема доказана.
2. Пространство L2 399 Для того частного случая, когда X есть отрезок числовой пря- прямой, a \i — мера Лебега, счетное всюду плотное множество в L\ можно получить и проще, например, взяв множество всех много- многочленов с рациональными коэффициентами. Оно всюду плотно (даже в смысле равномерной сходимости) в множестве непрерывных функ- функций, а эти последние образуют всюду плотное множество в L\(X, /л). § 2. Пространство L<i 1. Определение и основные свойства. Пространств L\ пред- представляет собой, как мы видели, полное нормированное (т. е. бана- банахово) линейное пространство. Однако оно не является евклидовым: определенную в нем норму нельзя задать с помощью какого-либо скалярного произведения. Это вытекает из «теоремы о параллело- параллелограмме», установленной в п. 8 § 4 гл. III. Например, для интегри- интегрируемых на отрезке [0, 2тг] функций / = 1, д = sin ж соотношение в L\ не выполняется. Функциональное пространство, не только нормированное, но и евклидово, можно построить, взяв совокупность функций с инте- интегрируемым квадратом. Введем соответствующие определения. Бу- Будем сперва рассматривать действительные функции /, определен- определенные на некотором пространстве X, с заданной на нем мерой \±. Все функции предполагаются измеримыми и определенными на X по- почти всюду. Эквивалентные между собой функции не различаются. Определение 1. Функция / называется функцией с интегри- интегрируемым квадратом на X, если интеграл I f(x)d/i существует (конечен). Совокупность всех таких функций мы обо- обозначим L2(X,/jl) или, короче, L^. Установим основные свойства функций с интегрируемым квадра- квадратом. 1. Произведение двух функций с интегрируемым квадратом есть интегрируемая функция. Это непосредственно вытекает из неравенства и свойств интеграла Лебега.
400 Гл. VII. Пространства суммируемых функций Следствие. Всякая функция f с интегрируемым квадратом на пространстве с конечной мерой интегрируема. В самом деле, достаточно, положив д(х) = 1, воспользоваться свойством 1. 2. Сумма двух функций из L^ также принадлежит L^. Действительно, (f(x) + g(x)J *С f(x) + 2\f(x)g(x)\ + g\x); в силу свойства 1 каждая из трех функций, стоящих справа, инте- интегрируема. 3. Если / Е 1/2 и а — произвольное число, то otj^L^. Действительно, если / G 1/2, то Г лО / \ -I ; оо. Свойства 2 и 3 означают, что линейные комбинации функций из L^ снова принадлежат L^\ при этом, очевидно, сложение функций из L^ и умножение их на числа удовлетворяют всем условиям, перечис- перечисленным в определении линейного пространства (§ 1 гл. III). Таким образом, совокупность L^ функций с интегрируемым, квадратом есть линейное пространство. Определим теперь в L^ скалярное произведение, положив Ясно, что все требования, входящие в определение скалярного произведения (см. § 4 гл. III), а именно: 1) (f,g) = (g,f), 2) (fi+f2,g) = (fi,g) + (h,g), 3) (af,g)=a(f,g), 4) (/,/)>0,если/^0, при этом выполнены. В частности, выполнение условия 4) обеспечи- обеспечивается тем, что мы условились не различать эквивалентные между собой функции (за нулевой элемент, таким образом, принимается совокупность всех функций на X, эквивалентных / = 0). Итак, введя для функций с интегрируемым квадратом операции сложения и умножения на число, а также скалярное произведение, мы приходим к следующему окончательному определению.
2. Пространство L2 401 Определение 2. Евклидовым пространством L^ называется линейное пространство, состоящее из классов эквивалентных между собой функций с интегрируемым квадратом, в котором скалярное произведение определено формулой = f f(x)g(x)dfi. В Z/2, как и во всяком евклидовом пространстве, выполнены нера- неравенство Коши—Буняковского и неравенство треугольника, которые в данном случае имеют вид (/ f(x)g(x) ф) 2 ^ / f (x) dn I g2(х) (f(x) + д{х))Чц ^Jfp(x)dn+, [дЦх) Лц. В частности, при fi(X) < 00 и д(х) = 1 неравенство Коши—Буняков- Коши—Буняковского превращается в следующую полезную оценку: f A) Норма в Z/2 определяется формулой а расстояние между элементами fug — формулой Величину f(f(x)-g(x)Jdii=\\f-g\\2 называют также средним квадратичным уклонением функций fug друг от друга. Сходимость функциональной последовательности в смысле мет- метрики пространства L^ называется сходимостью в среднем квадра- квадратичном. Если нет опасности спутать эту сходимость со сходимо- сходимостью в Li, определенной в предыдущем параграфе, мы и здесь будем пользоваться более коротким термином «сходимость в среднем».
402 Гл. VII. Пространства суммируемых функций Теорема 1. Пространство L2(X,/а) при /л(Х) < оо полно. Доказательство. Пусть {/п} — фундаментальная последо- последовательность в Z/2, т.е. ||/n-/m||->0 при n,m-^оо. Тогда в силу оценки A) получаем , B) т.е. последовательность {/п} фундаментальна и в метрике про- пространства L\. Повторяя рассуждения, которые были проведены при доказательстве полноты пространства Li, выберем из {/п} под- подпоследовательность {/nfc}, сходящуюся почти всюду к некоторой функции /. В неравенстве справедливом для членов этой подпоследовательности при всех до- достаточно больших к и I, можно, используя теорему Фату, перейти к пределу при I —у оо. Получим откуда следует, что / G L2 и что fnk —у /. Для завершения доказа- доказательства остается, как и в теореме 1 § 1, воспользоваться тем, что если фундаментальная последовательность содержит сходящуюся, то и сама она сходится к тому же пределу. 2. Случай бесконечной меры. Мы рассматривали только что функции с интегрируемым квадратом, определенные на некотором пространстве X конечной меры. При этом условие /л(Х) < оо ис- использовалось довольно существенно. Именно, сначала мы прибегли к нему, доказывая, что всякая функция с суммируемым квадратом суммируема и в первой степени, а затем — при выводе неравен- неравенства B), на которое опиралось доказательство полноты простран- пространства Z/2. Если рассматривать функции на множестве бесконечной ме- меры (например, на всей прямой с лебеговой мерой на ней), то не вся- всякая функция из Z/2 будет содержаться в L\. Например, функция 1/л/1 + х2 не интегрируема на всей прямой, а ее квадрат интегриру- интегрируем. Далее, в случае /л(Х) < оо имеет место неравенство A), означа- означающее, что из сходимости последовательности функций в L2 следует
2. Пространство L2 403 Г = < их сходимость в L\. При fi(X) = 00 это тоже неверно: например, последовательность функций на прямой 1/п при |ж| ^ п, 0 при \х\ > п сходится к 0 в пространстве 1/2(—оо,оо) функций с суммируе- суммируемым квадратом на прямой, но не сходится ни к какому пределу в Li(—00,00). Однако теорема о полноте пространства L<i оста- остается справедливой и при /л(Х) = оо 1). Докажем это утверждение. Как и в п. 6 § 5 гл. V, где мы ввели понятие интеграла по множеству бесконечной меры, будем предпо- предполагать, что все пространство X можно представить как счетную сумму множеств конечной меры. Пусть ОО X = U Хп, ц(Хп) < оо, ХпПХт = 0 при 71=1 — такое представление и пусть {/п} — фундаментальная последо- последовательность в L2(X,/jl). Таким образом, для каждого г > 0 суще- существует такое JV, что f[fk(x) - fi(x)]2dfjL < г для всех k,l ^ N. Введем обозначение _ 1 О при остальных х. Тогда в силу свойства а-аддитивности интеграла Лебега, имеем оо п=1Хп Для каждого конечного М и подавно м п=1Хп Совокупность функций с интегрируемым квадратом на каждом Хп представляет собой полное пространство. Положив f(n)(T\ — ]\ш f^(T) 1) Доказательство полноты пространства Li, проведенное в § 1, не зависит, очевидно, от предположения конечности меры пространства X.
404 Гл. VII. Пространства суммируемых функций (где сходимость понимается как сходимость в пространстве L,2(X, /i)), мы можем перейти к пределу при I —у оо в неравенстве C). Получаем J м п=1Хп Так как это неравенство выполнено для всех М, то в нем можно перейти к пределу при М —У оо. Таким образом, имеем п=1Хп Положив , , f(x) = f{n\x) при х&Хп, мы можем последнее неравенство переписать в виде f[fn(x) - f{x)]4ii «С e. Отсюда вытекает как принадлежность / к L^ (X, /i), так и сходи- сходимость последовательности {/п} к /. Упражнение. Определим Ьр(Х,/л) как совокупность классов экви- эквивалентных между собой функций, для которых Г \f(x)\pd/jJ < оо, где 1 ^ р < оо. Доказать, что Ьр{Хф) является банаховым пространством относительно нормы ||/|| = ( f \f(x)\pd/jJI^p. 3. Всюду плотные множества в L^. Теорема об изоморфиз- изоморфизме. Итак, пространство L2(X,/a) функций с интегрируемым квад- квадратом есть полное евклидово пространство. За исключением вы- вырожденных случаев, размерность этого пространства бесконечна. С точки зрения различных применений в анализе важно выяснить, когда пространство L2(X,/jl) сепарабельно, т.е. содержит счетное всюду плотное множество. В § 1 мы установили, что для простран- пространства L\ (X, /i) сепарабельность вытекает из существования у меры \i счетного базиса. Нетрудно убедиться, что это условие гарантиру- гарантирует и сепарабельность L^iX^n). Действительно, каждую функцию из Z/2 (X, /i) можно приблизить с любой точностью функциями, каж- каждая из которых равна 0 вне некоторого множества конечной ме- меры1). Далее, те же рассуждения, которые были проведены при до- доказательстве теоремы 3 § 1, показывают, что в совокупности таких функций можно выбрать счетное всюду плотное множество. 1) Если ц(Х) < сю, то этот шаг отпадает.
2. Пространство L2 405 Итак, если мера \± имеет счетный базис, то пространство L/2(X, /i) есть полное сепарабельное евклидово пространство. Иначе говоря, оставляя в стороне тот случай, когда 1/2 (X, /i) имеет конечную раз- размерность, мы получаем следующий результат: если мера \i имеет счетный базис, то L2(X,/jl) есть сепарабельное гильбертово про- пространство. В силу теоремы об изоморфизме гильбертовых пространств, это означает, что все такие L2(X,/a) изоморфны между собой. В част- частности, каждое такое L2(X,/a) изоморфно пространству fa числовых последовательностей со сходящейся суммой квадратов. Последнее можно рассматривать как 1/2 (X, /i), когда X счетно, a \i определе- определена на всех его подмножествах и равна 1 для каждой точки. Ниже мы будем рассматривать только L2(X,/i), отвечающие мерам со счетным базисом. В случаях, когда это не может вызвать недоразу- недоразумений, каждое такое пространство мы будем обозначать просто Z/2. Поскольку пространство Z/2 представляет собой, как мы выясни- выяснили, реализацию гильбертова пространства, на L/2 можно перенести все те понятия и факты, которые были установлены в § 4 гл. III для абстрактного гильбертова пространства. В частности, согласно теореме Рисса всякий линейный функцио- функционал в гильбертовом пространстве Н записывается в виде скалярного произведения где а — фиксированный вектор из Н. Поэтому всякий линейный функционал в Z/2 имеет вид F(f) = ff(x)g(x)dfi, где g — фиксированная функция с интегрируемым квадратом на X. 4. Комплексное пространство Z/2. Мы рассматривали сейчас действительное пространство Z/2. Изложенные результаты легко пе- переносятся на комплексный случай. Комплексная функция /, опре- определенная на некотором пространстве X с заданной на нем мерой /i, называется функцией с интегрируемым квадратом, если интеграл / X конечен. Определив сложение таких функций и умножение их на чи- числа обычным образом и введя скалярное произведение по формуле = / f{x)g{x)dii, х
406 Гл. VII. Пространства суммируемых функций мы получим евклидово пространство, называемое комплексным про- пространством Z/2. (При этом, как и в действительном случае, мы считаем эквивалентные между собой функции одним и тем же эле- элементом пространства.) Это пространство полно, а если мера \i име- имеет счетный базис, то и сепарабельно. Таким образом (отбрасывая конечномерный случай), мы получаем, что комплексное простран- пространство Z/2, отвечающее мере со счетным базисом, есть комплексное сепарабельное гильбертово пространство. Все такие пространства изоморфны между собой, и для них справедливы результаты, изло- изложенные в § 4 гл. III. 5. Сходимость в среднем квадратичном и ее связь с дру- другими типами сходимости функциональных последователь- последовательностей. Введя в пространстве L^ норму, мы определили тем самым для функций с интегрируемым квадратом следующее понятие схо- сходимости: U i если 12Л„ - lim f[fn(x) - f(x)]2dfi = 0. Мы назвали такую сходимость сходимостью в среднем квадратич- квадратичном. Посмотрим, как такая сходимость связана с другими типами сходимости функциональных последовательностей. Предположим сначала, что мера пространства-«носителя» X конечна. 1. Если последовательность {in} функций из Ь2(Х,/а) сходится в метрике 1/2(X,/i), то она сходится и в метрике Li(X,/i). Действительно, в силу неравенства B) имеем - f(x)\d» < [»(X) f(fn(x) - f(x)Jd» откуда и следует наше утверждение. 2. Если последовательность {/п} сходится равномерно, то она сходится и в среднем квадратичном. Действительно, при каждом г > 0 при всех достаточно больших п имеем \fn(x) - f(x)\ < e и, следовательно, f[fn{x) - f(x)]2dfi < e2ii(X), откуда вытекает наше утверждение. 3. Если последовательность суммируемых функций {in} сходит- сходится в среднем, то она сходится на X и по мере.
2. Пространство L2 407 Это утверждение сразу же следует из неравенства Чебышева (п. 4, § 5, гл. V). Отсюда и из теоремы 8 § 4 гл. V вытекает: 4. Если последовательность {fn} сходится в среднем, то из нее можно выбрать подпоследовательность {/nfc}; сходящуюся почти всюду. Заметим, что при доказательстве теоремы о полноте простран- пространства L\ мы уже установили этот факт, не опираясь на теорему 8 § 4 гл. V. Нетрудно убедиться в том, что из сходимости некоторой последо- последовательности в среднем (и даже в среднем квадратичном) не вытека- вытекает, вообще говоря, ее сходимость почти всюду. Действительно, по- последовательность {fn}, построенная в п. 6 § 4 гл. V, сходится к / = 0 в среднем (и даже в среднем квадратичном), но при этом, как мы видели, она не сходится к 0 ни в одной точке. Обратно, последова- последовательность {fn} может сходиться почти всюду (и даже всюду) и не сходиться при этом в среднем. Рассмотрим, например, на отрезке [0,1] последовательность функций Г п при х G @,1/п], fn(x) = < I 0 при остальных х. Очевидно, fn(x) —У 0 при всех х Е [0,1]. Но в то же время 1 / \fn(x)\dx = 1 при всех п. о Связь между различными типами сходимости в случае /л(Х) < оо можно изобразить следующей схемой: Равномерная сходимость сходимость в среднем квадратичном сходимость почти всюду сходимость в среднем (Li) сходимость по мере где направленная вверх стрелка означает возможность выбора из последовательности, сходящейся по мере, подпоследовательности, сходящейся почти всюду. В случае /л(Х) = оо (например, для функций на всей число- числовой прямой с мерой Лебега на ней) установленные выше связи уже
408 Гл. VII. Пространства суммируемых функций не имеют места. Например, последовательность 1/у/п при |ж| ^ п, ш = 0 при \х\ > п сходится равномерно на всей прямой к функции / = 0, однако она не сходится ни в среднем, ни в среднем квадратичном. Далее, при /л(Х) = оо, как мы уже указывали, сходимость в среднем квадра- квадратичном (т. е. в L2) не влечет за собой сходимости той же последова- последовательности в среднем (т.е. в L±). Заметим в заключение, что из сходимости в среднем ни при ц(Х) < оо, ни тем более при /л(Х) = оо не следует, вообще гово- говоря, сходимость в среднем квадратичном. § 3. Ортогональные системы функций в L^. Ряды по ортогональным системам Общие теоремы, установленные в § 4 гл. III для евклидовых про- пространств, говорят нам, что в L^ имеются полные ортогональные (в частности, ортогональные и нормированные) системы функций. Такие системы можно получить, например, применяя процесс ор- тогонализации, описанный там же, к той или иной полной системе. Если в Z/2 выбрана некоторая полная ортогональная система {^п}5 то, опять-таки в соответствии с общими результатами § 4 гл. III, каждый элемент / Е L^ можно представить как сумму ряда оо / = ^2 СпРп 71=1 — ряда Фурье функции / по ортогональной системе {^п}- При этом коэффициенты сп — коэффициенты Фурье функции / по системе (рп — определяются формулами сп = тгЛуг / f(x)(pn(x)dfji, \\ipn\\2 = /'(рЦх) d\i. \Wn\\ J J В этом параграфе мы рассмотрим важнейшие примеры ортогональ- ортогональных систем в пространствах L^ и отвечающие им разложения. 1. Тригонометрическая система. Тригонометрический ряд Фурье. Рассмотрим пространство 1/2 [—тг,тг] функций с интегрируе- интегрируемым квадратом на отрезке [—тг, тг] с обычной мерой Лебега на этом отрезке. В этом пространстве функции 1, cosnx, sinnx, n = l,2,..., A)
§ 3. Ортогональные системы функций в L2 409 образуют полную ортогональную систему, называемую тригоно- тригонометрической. Ортогональность легко проверяется прямым вычи- вычислением, например, при п ф т 7Г 7Г г -, Г cosnxcosmxdx = ^ Г cos n~^mx + cos n~^mx\dx = 0 и т. д. Полнота системы A) следует из теоремы Вейерштрасса об ап- аппроксимации любой непрерывной периодической функции тригоно- тригонометрическими многочленами1). Система A) не нормирована. Соот- Соответствующая нормированная система состоит из функций 1 cosnx sinnx _ -1 9 rz— 1 /— 1 /— 1 ltj — 1,Z,... л/2тг л/тг л/тг Пусть / — функция из 1/2 [—тг, тг]; ее коэффициенты Фурье, отвечаю- отвечающие функциям 1, cosnx, sinnx, принято обозначать ао/2, ап и Ъп. Таким образом, в соответствии с общими формулами для коэффи- коэффициентов Фурье имеем т = h I f^dx> т-е- а° = h I Н*)**' — 7Г —7Г 7Г 7Г ап = ^ J f{x) cosnx dx, bn = ^ J f (x) sinnxdx. — 7Г —7Г Соответствующий ряд Фурье имеет вид оо Щ- + 2_, ап cos nx + ^n sin пж 71=1 и для любой функции / G Z/2 сходится в среднем квадратичном именно к ней. Если п Sn(x) = ^г + ^^ а^ cos /еж + bk sin /еж jfe=i — частичная сумма ряда Фурье, то среднее квадратичное уклонение Sn от / можно найти по формуле \\f(x)-Sn(x)\\2 = 1) В § 2 гл. VIII мы докажем теорему Фейера, представляющую собой усиле- усиление теоремы Вейерштрасса. Тем самым будет дано и доказательство полноты тригонометрической системы (не опирающееся, конечно, на излагаемые здесь факты).
410 Гл. VII. Пространства суммируемых функций Среди всех тригонометрических многочленов k cos kx + Pk sin kx k=l с данным п частичная сумма ряда Фурье Sn дает наилучшую (в мет- метрике L2) аппроксимацию функции /. Неравенство Бесселя для три- тригонометрической системы имеет вид 71=1 но поскольку тригонометрическая система полна, на самом деле для любой функции из Z/2 имеет место равенство Парсеваля п=1 Для любой функции /Gl/2 квадраты ее коэффициентов Фурье об- образуют сходящийся ряд. Обратно, если числа ао, ап, Ъп (п = 1, 2,...) (X) о?п + Ьп таковы, что ряд J^ о?п + Ь2п сходится, то ряд 71=1 Щ- + 2_,ап cos пх ~^~ ^п81П пх п=1 тоже сходится (в L2), а его сумма представляет собой функцию, имеющую ао, ап, Ъп своими коэффициентами Фурье. Все эти утверждения (непосредственно вытекающие из общих ре- результатов § 4 гл. III) легко переносятся на функции, заданные на от- отрезке произвольной длины, скажем, [—/, I]. Если / — функция с сум- суммируемым квадратом на [—/,/], то замена х = 7rt/l, т.е. t = lx/тг, переводит /(?) в функцию f*(x) — /f^f ) на отрезке [—тг, тг]. В соответствии с этим ап = j f f(t) cos 2p <Й, п = 0,1,..., -/ bn = 7 / /(t)sin^p^, n = l,2,... -/ Ряд Фурье для функции /, заданной на отрезке длины 2/, имеет вид 71=1
§ 3. Ортогональные системы функций в L2 411 Замечания. 1. Тригонометрические ряды были использованы французским математиком Ж. Фурье в его работах по математиче- математической физике, в первую очередь по теории распространения тепла. Впрочем, формулы для коэффициентов ап и Ъп встречаются уже у Эйлера. В дальнейшем теория тригонометрических рядов разви- развивалась в работах Римана, Дирихле и др. Первоначально термины «ряд Фурье», «коэффициенты Фурье» и т.д. связывались именно с тригонометрической системой и лишь значительно позднее стали употребляться в общем смысле, описанном в § 4 гл. III (т. е. приме- применительно к произвольной ортогональной системе в любом евклидовом пространстве). 2. Из полноты тригонометрической системы и общих теорем § 4 гл. III следует, что для любой / Е L^ ее ряд Фурье оо ^тг- + /_^ ап cos nx + Ьп sin nx 71=1 сходится к данной функции / в среднем. Однако с точки зрения конкретных задач анализа важно установить условия, при которых этот ряд сходится к / в другом смысле, скажем, в каждой точке, или равномерно. Этот круг вопросов мы рассмотрим в следующей главе. 2. Тригонометрические системы на отрезке [О,тг]. Функции 1, cos ж, cos2x,..., B) sin ж, sin2x,... C) образуют в совокупности полную ортогональную систему на отрезке [—7г,тг]. Покажем, что каждая из двух систем B) и C) ортогональ- ортогональна и полна на отрезке [О,тг]. Ортогональность проверяется прямым подсчетом. Докажем полноту системы B). Пусть / — функция с ин- интегрируемым квадратом на [0, тг]. Доопределим ее на полуинтервале [—тг, 0) формулой /(-*) = я*) и разложим ее в ряд Фурье по системе 1, cosnx, sinnx, n = l,2,... Поскольку функция /, определенная теперь на [—тг,тг], — четная, все коэффициенты при синусах равны у нее нулю. Это сразу видно из формулы для коэффициентов: для четной функции / при п ^ 1 7Г О 7Г Г f(x) s'mnxdx = Г f{x) s'mnxdx + Г f(x) s'mnxdx = = - Г f(x) sin nxdx + Г f(x) sin nx dx = 0.
412 Гл. VII. Пространства суммируемых функций Иначе говоря, эту функцию на [—тг,тг] (а тем более и на [0, тг]) мож- можно аппроксимировать в среднем квадратичном с любой точностью линейными комбинациями элементов системы B). Отсюда следу- следует полнота системы B). Полнота системы C) на [0, тг] доказывает- доказывается аналогично, путем нечетного продолжения функции /, заданной на [0, тг], на полуинтервал [—тг, 0) по формуле f(-x) = -/(ж)- Полученная при таком продолжении функция на [—тг, тг] нечетна и разлагается на этом отрезке по одним синусам. 3. Ряд Фурье в комплексной форме. Тригонометрический ряд можно записать компактно, если воспользоваться формулами Эйлера inx _|_ -inx inx _ -inx cosnx = =7) и s'mnx = ^ • Внося эти выражения в ряд Фурье, получим га=1 оо 2 ап cos nx + bn sin nx = оо - 90 , Wn е%ПХ + е~1ПХ ih егпх-е~гпх п=1 оо оо оо ао. _1 V^ an — гЪп Jnx , V^ an + ibn „-inx _ V^ _ Anx 2 + Z^ 2 +Z^ 2 ~ / ' n ; где со = clq/2 и при п ^ 1 _ ап — ibn ^п — о 1 D) _ an + ibn с-п- 2 Выражение ^ оо п= —оо называется тригонометрическим рядом Фурье в комплексной фор- форме. Коэффициенты сп этого ряда выражаются через ап и Ъп с помо- помощью равенств D); однако легко написать для них и прямые форму- формулы. Действительно, как показывает непосредственное вычисление, 2тг при п = т.
§ 3. Ортогональные системы функций в L2 413 Поэтому, умножая равенство оо f(x)= 5] *neinx E) n= —00 на е~гшх (т = О, =Ы, ±2,...) и интегрируя, получаем I f(x)e-imx dx = 2тгст, — 7Г с™ = = ^ / f{x)e~imx dx, т = 0, ±1, ±2,... F) — 7Г Разложение E) остается в силе и для комплексных функций с ин- интегрируемым квадратом на отрезке [—тг, тг]. Иначе говоря, функ- функции егпх образуют базис в пространстве L^\—тг,тг] комплексных функций с интегрируемым квадратом модуля на отрезке [—тг,тг]. При этом выражения F) представляют собой скалярные произве- произведения / на егтх в этом комплексном пространстве. Заменив функции егпх на ег2^ж, можно перенести все сказанное на пространство L/2[—1,1] комплексных функций на отрезке произ- произвольной длины 21. 4. Многочлены Лежандра. Линейные комбинации функций 1, х, х2,... G) — это совокупность всех многочленов. Следовательно, система G) полна в пространстве L^ функций на произвольном отрезкех). Ор- тогонализируя систему G) на отрезке [—1,1] по отношению к ска- скалярному произведению 1 (/,#) = / f(x)g(x)dx, -1 мы получим полную ортогональную систему Qo(x), Qi(x), Q2(x),..., где Qn — многочлен n-й степени. Покажем, что каждый из мно- многочленов Qn{x) совпадает, с точностью до постоянного множителя, с многочленом ,п J2 1) Полнота системы многочленов в пространстве Ьг[а, Ь] функций с интегри- интегрируемым квадратом на произвольном отрезке [а, Ь] вытекает из теоремы Вейер- штрасса о равномерной аппроксимации любой непрерывной функции на отрезке многочленами. См. п. 2 8 2 гл. VIII.
414 Гл. VII. Пространства суммируемых функций В самом деле, во-первых, система {Rn} ортогональна. Пусть п ^ т. Так как k k dx x=—i dx x=i при всех & = 0,l,...,n — 1, то, интегрируя по частям, получаем l Г Rm(x)Rn(x) dx = -l Г п / 2 -i \ ?7l Q, /2 -1 \ Ti 7 <j» I ) — ( T* _L ) Г7 T* ^= 1 г т+п -. ... — (—l)n f \— (x2 — l)m\(x2 — l)ndx. (8) -l ^m Если ттг < п, то под знаком последнего интеграла стоит тожде- тождественный нуль, откуда следует ортогональность системы {Rn}. Во-вторых, ясно, что многочлен Rn имеет степень п, т. е. каждый Rn лежит в подпространстве, порожденном п + 1 первыми элемен- элементами системы G). Таким образом, как система {Rn}j так и система {Qn} обладают следующими свойствами: 1) ортогональность, 2) n-й элемент системы принадлежит подпространству, порож- порожденному элементами 1, ж, ..., хп~1. Но этими двумя свойствами каждый элемент системы определя- определяется однозначно с точностью до числового множителя (теорема 1 § 4 гл. III). Найдем теперь нормирующие множители для Rn(x). В случае n — vn равенство (8) дает1) I R2n(x) dx = (-l)n I [-?^{x2 ~ l)n] {x2 - l)ndx = -1 i\2rm . j [i x ) ax - 2n + l " -l Иначе говоря, норма многочлена Rn равна п\2п\ \ л-л- Таким образом, система многочленов п\ 2п V 2 не только ортогональна, но и нормирована. ^Последний интеграл можно вычислить элементарно, применяя рекуррент- рекуррентные формулы, или же путем сведения его к S-функции.
§ 3. Ортогональные системы функций в L2 415 Обычно рассматриваются не эти нормированные многочлены, а многочлены, определяемые формулой Их называют многочленами Лежандра, а саму эту формулу — фор- формулой Родрига. Из проведенных выкладок следует, что 1 Г 0 при п ф т, / Pn(x)Pm(x)dx = { 2 I Приведем явные выражения пяти первых многочленов Лежандра: Ро(х) = 1, Pi(x)=x, Р2(х) = \х2 - \, Рг{х) = |ж3 - \х, Р4(х) = f х* - fx2 + I Разложение функции / на отрезке [—1,1] по многочленам Лежан- Лежандра имеет вид ^ п=0 где 1 -1 5. Ортогональные системы в произведениях. Кратные ря- ряды Фурье. Пусть на множествах X' и X" определены меры // и \in. Соответствующие пространства функций с интегрируемым квадра- квадратом будем обозначать Ь'2 и LJ. В произведении X = X' х X" рассмотрим меру \i — \i 0 //' и обозначим через L^ отвечающее ей пространство функций с инте- интегрируемым квадратом. Функции из L^ будем записывать как функ- функции двух переменных. Теорема 1. Если {(рт} и {фп} — полные ортонормальные си- системы соответственно в L'2 и в L'2', то система всех произведений есть полная ортонормальная система в
416 Гл. VII. Пространства суммируемых функций Доказательство. В силу теоремы Фубини (замечание) ф2п(y)dfг")dfг' = l. X X' X" Если т ф mi, то в силу той же теоремы / X = / Фп(у)Фп1(у)у f (Pm(x)(Pm1(x)dfjLljdfjLn = О, X" X' поскольку функция fmn(x, y)fmin1 (x, у) двух переменных суммируе- суммируема на X = X' х X". Если т = TTii, ноп/ni, то f fmn(x,y)fmiril(x,y)dn= I </40)( f фп(у)Фп1(у)^")^' = 0. X X' X" Докажем полноту системы {/mn}. Допустим, что в L^ существует функция /, ортогональная ко всем функциям fmn. Положим Fm(y) = f f(x,y)(pm(x)d/if. х1 Легко видеть, что функция Fm(y) имеет интегрируемый квадрат. Поэтому Гт(у)фп(у) при любом п интегрируема. Снова используя теорему Фубини, получаем / Fm(y)^n(y) dfi" = f f(x,y)fmn(x,y)dfi = O. X" X В силу полноты системы {фп} отсюда вытекает, что для почти всех у Fm(y) = 0. Но тогда при почти каждом у имеют место равенства I f(x,y)<pm(x)dfjLr = 0 X' для всех т. В силу полноты системы {(рт} отсюда получается, что при почти каждом у множество тех ж, где /(*,!/) 7* 0, имеет меру нуль. В силу теоремы Фубини это означает, что на X функция f(x,y) равна 0 почти всюду. Применим эту теорему к некоторым конкретным ортогональным системам. В пространстве функций двух переменных f(x,y), -7г^ж,2/^тг,
§ 3. Ортогональные системы функций в L2 417 с интегрируемым квадратом полную ортогональную систему обра- образуют попарные произведения элементов систем: 1, cosmx, sinmx, m = l,2,..., 1, cosny, s'mny, n = l,2,..., т. е. функции 1, cosmx, sinmx, cosny, sinny, cosmxsinny, cos mx cos ny, smmxsmny, s'mmx cos ny. Соответствующий ряд Фурье выглядит несколько громоздко, поэто- поэтому здесь удобнее пользоваться показательными функциями imx Any — i(mx-\-ny) — r\ i-i 19 00 — О , /6, III — U, ^J- -L, ^-^1 • • • Этому базису отвечает ряд Фурье (X) Мтх+пу) т,п= — оо 7Г 7Г = 1 | f Стп, — ^ 4тг — 7Г —7Г Многочлены Лежандра дают в пространстве функций, опреде- определенных на квадрате -1 ^ ж, у ^ 1, полную ортонормальную систему, состоящую из многочленов 1п /2 -1 \п Все сказанное очевидным образом переносится на функции несколь- нескольких переменных. В частности, тригонометрический ряд Фурье для функции к переменных имеет вид (X) f(r гЛ — \^ С p^Oi^iH \-пкхк) где 7Г 7Г Cm...n* = j—y: / ••• / /(Ж1,...,ж*)е гИ1Ж1+ +ni!a:fc dXl...dxk. V 7 —7Г —7Г 6. Многочлены, ортогональные относительно данного ве- веса. Мы пришли к многочленам Лежандра, ортогонализируя функ- функции 1, ж, х2 , ... ,жп, ... (9)
418 Гл. VII. Пространства суммируемых функций относительно скалярного произведения 1 J f(x)g(x)dx, -1 отвечающего обычной мере Лебега на отрезке [—1,1]. Если на этом отрезке задать какую-либо иную меру \i такую, что функции (9) в соответствующем пространстве L^ со скалярным произведением 1 Г f(x)g(x) d\i линейно независимы, то, применив к (9) процесс ор- -1 тогонализации, мы придем к некоторой системе многочленов {Qn}, зависящей, вообще говоря, от выбора меры \±. Предположим, что ме- мера \i определена для измеримых по Лебегу подмножеств сегмента [—1,1] формулой »(Е) = / д{х) dx, A0) Е где д — фиксированная неотрицательная суммируемая функция. Условие ортонормальности Г 1 при т = п, (Qm,Qn) = \ n ' [ 0 при т ^ п в этом случае записывается в виде } ( 1 при т = п, Qm(x)Qn(x)g(x)dx = \ P (И) Jx у 0 при т ф п. Функция д, определяющая меру A0), носит название веса или ве- весовой функции. Таким образом, про многочлены, удовлетворяющие условию A1), говорят, что они ортогональны с весом д. Выбор то- того или иного веса приводит к различным системам многочленов. В частности, положив мы получим многочлены, совпадающие с точностью до постоянного множителя с так называемыми многочленами Чебышева, которые определяются формулой Тп(х) = cosnarccosx, n = l,2,..., и играют важную роль в различных интерполяционных задачах. Ортогональность этих многочленов относительно веса 1/л/1 — %2 легко проверяется. Действительно, полагая х = cos #, dx — - sin в dO,
§ 3. Ортогональные системы функций в L2 419 получаем } Тш(х)Тп(х) J ( \ ПРИ m = nj _^ л/1 — х2 ^ \ 0 при m ф п. 7. Ортогональный базис в пространствах Ьъ(—00,00) и ^2@, оо). Выше мы рассматривали ортогональные системы на от- отрезке, т. е. на множестве конечной меры. Рассмотрим теперь случай бесконечной меры, а именно, пространство L^(—00, 00) функций с интегрируемым квадратом на всей числовой прямой. Ортогональ- Ортогональную систему функций в нем нельзя построить ни из многочленов, ни из тригонометрических функций, ибо ни те, ни другие не при- принадлежат этому пространству. «Материал» для построения базиса в Z/2(—00, 00) естественно искать среди функций, достаточно быстро убывающих на бесконечности. В частности, такой базис можно по- получить ортогонализацией последовательности п -х1 /2 _ Q -1 г) Оу С- , IV VJ, -L , Zj , . . . Действительно, всякая функция вида Р(х)е~х /2, где Р — много- многочлен, принадлежит, очевидно, 1/2(—оо,оо), а полнота системы A2) будет доказана в п. 3 § 4 гл. VIII. Применив к функциям хпе~х I2 процесс ортогонализации, мы по- получим систему функций вида 4>п{х) = tfn(x)e-*2/2, п = 0,1, 2,..., A2) где Нп — многочлен степени п. Эти многочлены называются мно- многочленами Эрмита, а сами функции срп — функциями Эрмита. Не- Нетрудно показать, что многочлены Эрмита совпадают, с точностью до постоянного множителя, с многочленами Действительно, многочлен Н^ имеет, очевидно, степень п, а соотно- соотношение ортогональности I H^(x)H^(x)e x dx = 0, тфщ — оо легко получить интегрированием по частям. В силу теоремы об ор- ортогонализации существует лишь одна, с точностью до постоянных множителей, система ортогональных функций вида Рп(х)е~х /2, где Рп — многочлен n-й степени.
420 Гл. VII. Пространства суммируемых функций Полученный результат допускает и такое истолкование. Рассмот- Рассмотрим на прямой меру /i, имеющую плотность е~х , т. е. такую, что d\i — e dx. Это — конечная мера. В пространстве функций, интегрируемых с квадратом по этой мере, скалярное произведение имеет вид оо 2 (/,<?) = / f(x)g(x)e-x dx, — ОО а многочлены Эрмита образуют в нем ортогональную систему. Рассмотрим, наконец, пространство ^@, оо) функций с интегри- интегрируемым квадратом на полупрямой. Взяв в нем систему функций х е , и — и, -L, Z/, . . . , и применив к ним процесс ортогонализации, мы получим систему функций называемых функциями Лагерра. Соответствующие многочлены Ln называются многочленами Ла- Лагерра. Многочлены Лагерра можно рассматривать как ортогональ- ортогональный базис в пространстве функций, квадрат которых интегрируем на полупрямой @, оо) по мере d\i — е~х dx. В п. 3 § 4 гл. VIII мы докажем, что система функций Лагерра полна в L2@,oo). 8. Ортогональные многочлены с дискретным весом. Пусть п + 1 различным точкам жо, xi,..., хп действительной прямой при- приписаны в качестве «весов» положительные числа ро5 Ръ • • • jPm а ме- мера \i определена формулой ц(Е) = т. е. fi(E) равна сумме весов, содержащихся в Е точек х^. Измеримы- Измеримыми по этой «вырожденной» мере являются здесь любые множества и функции на прямой, причем любое множество Е, не содержащее точек Xk (к = 0,1,..., п), имеет меру 0. Тем самым интеграл по всей действительной прямой от функции / равен к=0
3. Ортогональные системы функций в L2 421 а скалярное произведение дается формулой п (f,g) = ^2pkf(%k)g(zk)- к=0 Очевидно, что функции / и д будут эквивалентны по мере /i, если f(xk) = д(хк) во всех точках хо, xi, ..., хп, и только в этом случае. Для этого вырожденного случая задача наилучшей аппроксима- аппроксимации в смысле расстояния в L^ сводится к определению сумм сО(ро + ci<pi -\ Ь cmcpm, обращающих в минимум выражение { } k=0 i=l т. е. к задаче «интерполирования по методу наименьших квадратов». В связи с задачей интерполирования по методу наименьших квад- квадратов многочленами заданной степени П. Л. Чебышев развил тео- теорию ортогональных многочленов. Чтобы изложить относящиеся сю- сюда результаты Чебышева, заметим, что система 1, ж, ж2, ..., хп A3) при нашей мере \i линейно независима, так как скалярное произве- произведение (xr,xs) выражается формулой k=o и детерминант Грама системы A3) есть (суммы по к от 0 до п) = P0Pl ••• Xq
422 Гл. VII. Пространства суммируемых функций Наоборот, функции хТ при г > п линейно зависят от функций си- системы A3), так как в нашем случае пространство L^ имеет размер- размерность п + 1. Поэтому процесс ортогонализации приводит к конечной системе многочленов Ро, Pi, ..., Рп, ортонормальных в том смысле, что п Yxk) = Srs k=0 и каждая функция / разлагается в конечный ряд г=0 k=0 В точках хк выполняются равенства г=0 т. е. полная сумма ряда есть просто интерполяционный многочлен Лагранжа. Неполные суммы crPr, m < n, являются многочленами m-й степени, приближающими / в точ- точках Xk наилучшим способом в том смысле, что выражение к=0 для Qm меньше, чем для любого другого многочлена той же степе- степени тп. 9. Системы Хаара и Радемахера—Уолша. Хааром был построен следующий пример полной системы функций на отрезке [0,1]. Система эта состоит из функции (fO = l и серий
§ 3. Ортогональные системы функций в L2 423 (n-я серия содержит 2п функций), где +1, 0 < х < 1/2, л/2, 0 < х < 1/4, ГО, 0 < х < 1/2, = <{ _^2, 1/4 < х < 1/2, у>12 = < л/2, 1/2 < ж < 3/4, О, 1/2 < ж < 1, [ -л/2, 3/4 < ж < 1. Вообще, положим (в точках разрыва значения функций можно брать про- произвольными) суп/2 %- 1 . . % ~ 1 , 1 г- 1 , 1 2n 2n+ о, г = 1,2,..., Легко видеть, что построенная система ортонормальна. Докажем ее пол- полноту. Разобьем отрезок [0,1] на 2n+1 равных интервалов А^ и рассмотрим множество Mn+i всех функций, сохраняющих постоянное значение на ка- каждом из интервалов А^. Очевидно, Мп-\-\ есть линейное подпространство размерности 2n+1. Кроме того, все функции нашей системы до функций n-й серии включительно войдут в Mn+i. Так как эти функции в силу ор- тонормальности нашей системы линейно независимы и так как их число равно то функция (fo и функции ifki серий к = 0,1,...,п образуют в Mn+i полную систему линейно независимых векторов. Отсюда, принимая во внимание, что любая непрерывная функция может быть сколь угодно точно аппроксимирована функцией из Mn+i (при достаточно большом п), мы убеждаемся в полноте нашей системы. Рассмотрим еще один пример ортонормальной системы функций на от- отрезке [0,1], принадлежащий Радемахеру. Положим Иными словами, функция (рт получается следующим образом: сегмент [0,1] делится на 2т равных частей А^, причем на интервалах А^ (г = 1,..., 2т) функция (рт принимает попеременно значения +1 и — 1. Ортонормальность системы <ро, <pi, ..., <рп, ... A4)
424 Гл. VII. Пространства суммируемых функций очевидна. Эта система не полна. Это следует хотя бы из того, что, напри- например, функция 2 = (P1(P2 = J1' I -1, если 0 < х < 1/4 или 3/4 < х < 1, если 1/4 < ж < 3/4, ортогональна ко всем функциям системы A4). Однако последнюю можно расширить до полной ортонормальной системы, добавив к ней функции вида (Prn1...rnk = <?mi • • '4>тк, 0 < ГГЦ < ГП2 < ' ' ' < ГПк. A5) Очевидно, что расширенная таким образом система, называемая си- системой Радемахера—Уолша, останется ортонормальной. Кроме того, она уже будет полной. Доказательство этого проводится аналогично доказа- доказательству полноты системы Хаара.
ГЛАВА VIII ТРИГОНОМЕТРИЧЕСКИЕ РЯДЫ. ПРЕОБРАЗОВАНИЯ ФУРЬЕ § 1. Условия сходимости ряда Фурье 1. Достаточные условия сходимости ряда Фурье в точ- точке. Рассмотрим снова пространство 1/2[—тг,тг] функций с сумми- суммируемым квадратом на отрезке [—тг,тг]. Это, как было показано в гл. VII, — полное бесконечномерное евклидово пространство, т. е. гильбертово пространство. Функции 1, cosnx, sinnx, n = l,2,..., A) образуют в нем полную ортогональную систему, поэтому для каж- каждой функции / Е 1/2 [—тг,7г] ряд Фурье оо тЯ + V^ an cosnx + Ьп sinnx, B) 71=1 ап = ^ J f(x) cosnxdx, bn = ^ J f(x)sinnxdx, C) — 7Г —7Г сходится к / в среднем квадратичном, т. е. в метрике пространства -^2 [—7г5 тг]- Однако в связи с применением рядов Фурье к задачам ма- математической физики и другим вопросам будет существенно устано- установить условия, гарантирующие сходимость ряда Фурье к / не только в среднем, но и в данной точке, всюду, или даже равномерно. Мы установим сейчас условия, достаточные для сходимости тригоно- тригонометрического ряда в данной точке. Сделаем некоторые предвари- предварительные замечания. Вместо функций, заданных на отрезке [—тг,тг], мы можем гово- говорить о периодических функциях с периодом 2тг на всей прямой, по- поскольку каждую функцию, заданную на отрезке, можно периоди- периодически продолжить1). Далее, функции, образующие тригонометри- тригонометрическую систему, ограничены, поэтому формулы C), определяющие коэффициенты Фурье по этой системе, имеют смысл для любой 1) Заменив, если нужно, /(ж) эквивалентной функцией, мы можем считать, ЧТО /( — 7Г) = /(?г).
426 Гл. VIII. Ряды. Преобразования Фурье суммируемой функции 1) (а не только для функций с сумми- суммируемым квадратом). Таким образом, каждой функции / Е L\[—тг,тг] отвечают совокупность ее коэффициентов Фурье и ее ряд Фурье оо а0 /(ж) ~ -# + У, ап cos пх + bn sin nx. п=1 Перейдем теперь к вопросу о сходимости этого ряда в данной точке х к значению функции / в этой точке. Положим Sn(x) = ^ + ^а/. coskx + bk s'mkx. D) k=l Преобразуем сначала Sn(x), подставив в D) вместо коэффициентов аи и bk их интегральные выражения C). Обозначив переменную ин- интегрирования через ?, мы получим 7Г П Sn(x) = ^ I f(t) \ ^ + /J cos кх cos fct + sin кх sin fct }> (it = / -7Г Воспользовавшись хорошо известной формулой ) ^ + cos и + cos 2и + • • • + cos пи = будем видеть 2 sin | ^sin ^^-(t — х) 7Г J — 7Г Это представление Sn(x) и различные его модификации называются интегралом Дирихле. 1)При этом, конечно, для произвольной суммируемой функции никаких ут- утверждений о сходимости ряда B) мы не делаем. 2) Для получения этой формулы достаточно просуммировать равенства sin| = 1 - sin ^ - sin ^ = cos и • 2 sin sin 2n + lu - sin 2n2 1ц = cosnw • 2sin |.
§ 1. Условия сходимости ряда Фурье 427 Сделаем замену, положив t — x = z. Поскольку под интегралом F) стоит периодическая функция с периодом 2тг, интеграл от нее по лю- любому отрезку длины 2тг имеет одну и ту же величину. Поэтому и при интегрировании по z мы можем сохранить прежние пределы — тг и тг. Получаем о , 1 nv / ~~ тг J J{ — 7Г Функция ) '"v / Z7T S1I1 | называется ядром Дирихле. Из равенства E) сразу видно, что при любом п тг / Dn(z)dz = l. Используя это равенство, запишем разность Sn(x) — f(x) в виде G) Таким образом, мы свели вопрос о сходимости Sn(x) к /(ж) к вопро- вопросу о стремлении к нулю интеграла G). Исследование этого интегра- интеграла опирается на следующую лемму. Лемма 1. Если функция ср суммируема на отрезке [a,b], то ъ lim [ Ых) sinpx dx = 0. Доказательство. Если ip — непрерывно дифференцируемая функция, то с помощью интегрирования по частям получаем, что при р —У оо Г ip(x) s'mpxdx = -(^(ж)С°^ж + Г 1р'(х)С08^х dx ->¦ 0. (8) a a Пусть теперь ср — произвольная суммируемая на [а, Ь] функция. Поскольку непрерывно дифференцируемые функции всюду плотны в Li[a, Ь], для любого г > 0 найдется такая непрерывно дифферен- дифференцируемая функция ip?, что f \ф) - ipe(x)\dx < 1- (9) a Далее, имеем ъ ъ , ъ [ (р(х) sin pxdx ^ Г [ср(х) — cp?(x)]smpx dx +\ Г (р?(х) sin pxdx
428 Гл. VIII. Ряды. Преобразования Фурье Первое слагаемое справа меньше, чем г/2, в силу (9), а второе — стремится к нулю при р —У оо согласно (8). Лемма доказана. Теперь мы легко можем доказать следующий достаточный при- признак сходимости ряда Фурье. Теорема 1. Если / — суммируемая функция и при фиксиро- фиксированном х и некотором 8 > 0 интеграл I t)-f{x) dt A0) t -д существует, то частичные суммы Sn ряда Фурье функции f сходятся в этой точке х к f(x). Доказательство. Перепишем интеграл G) в виде z)-f{x) z ¦ 2n 1 J - ] ] j^^dz. A1) — 7Г Если функция f(x + z)-f(x) z интегрируема (по z) в пределах от —S до 5, то она интегрируема и на всем отрезке [—тг,тг] (поскольку / G L\[—тг,тг]). Но тогда интег- интегрируема и функция f(x + z)-f(x) z z 2 sin (г/2)' поэтому к интегралу A1) можно применить лемму 1, и мы получаем, что этот интеграл стремится к нулю, когда п —у оо. Замечания. 1. Сходимость интеграла A0) называется услови- условием Дйни. Оно, в частности, выполнено, если в данной точке х функ- функция / непрерывна и имеет конечную производную, или хотя бы пра- правую и левую производные. Рассуждения, проведенные при доказательстве теоремы 1, оста- останутся в силе, если вместо условия Дйни потребовать сходимости следующих двух интегралов: -д О где f(x — 0) и f(x + 0) суть левый и правый пределы функции / в точке х (предполагается, что х есть точка разрыва первого рода для /). Действительно, разность м f[x + 0) + f[x - 0)
1. Условия сходимости ряда Фурье 429 sin ¦ . sm ¦ можно представить в виде о к / [/(ж + z) ~ f(x ~ °). при условии существования интегралов A2) эти выражения стре- стремятся к нулю, когда п —У оо. Отсюда вытекают достаточные условия «глобальной» сходимо- сходимости ряда Фурье, обычно приводимые в курсах анализа. Пусть / — ограниченная функция с периодом 2тг; имеющая разрывы лишь первого рода, и пусть / имеет в каждой точке левую и правую производные1). Тогда ее ряд Фурье сходится всюду, а его сумма равна f(x) в точках непрерывно- непрерывности и равна А(/(ж+0) + /(ж —0)) в точках разрыва. 2. Ядро Дирихле Dn(z), игравшее ос- основную роль в наших рассуждениях, представляет собой функцию, принимаю- принимающую в точке z = 0 значение ^ — и при больших значениях п бы- быстро колеблющуюся (рис. 22). В силу этого обстоятельства основной вклад в интеграл п f f(x + z)Dn(z)dz — 7Г при больших п дает лишь сколь угодно малая окрестность точки х. Для функций, удовлетворяющих условию Дйни, этот вклад стре- стремится к f(x) при п —у оо. Можно сказать, что ядра Дирихле Dn образуют последовательность функционалов, сходящуюся, в неко- некотором смысле, к ^-функции на множестве функций /, разложимых в сходящийся ряд Фурье. Ясно, что в смысле обычной сходимости последовательность {Dn} не стремится ни к какому пределу, поэтому, исследуя интеграл G), мы не могли применить какие-либо стандартные теоремы о предель- предельном переходе под знаком интеграла. Рис. 22 1) В точке разрыва первого рода левая и правая производные понимаются как lim h—не- h—несоответственно. f(x -h)- f(x - 0) -h lim f(x + h) - f(x + 0)
430 Гл. VIII. Ряды. Преобразования Фурье 3. Условие Дйни, обеспечивающее сходимость ряда Фурье, можно заменить другими условиями, но просто отбросить его в теореме 1 нельзя. Действительно, даже среди непрерывных существу- существуют функции с рядом Фурье, расходящимся в некоторых точках. Среди суммируемых функций существуют такие, ряд Фу- Фурье которых расходится всюду (А. Н. Колмогоров). Еще в 1915г. Н. Н. Лузин поставил следующую проблему: существуют ли в L^ функции, для которых ряд Фурье расходится на множестве положи- положительной меры? Как показал Л. Карлесон A966 г.), таких функций не существует. Тот факт, что существуют непрерывные функции, для которых ряд Фурье сходится не во всех точках, легко вытекает из общих теорем о слабой сходимости функционалов (п. 3 § 3 гл. IV). Заметим прежде всего, что 7Г Г \Dn(z)\dz -У оо при п -У оо. A3) — 7Г Действительно, числитель дроби обращается в 1 в точках, где 2п + 1 /с = 0,1,...,п. A4) 2 Окружим каждую из точек, определяемых условием A4), интерва- интервалом /п -hi /fc -+- L -7Г Длина любого из них равна, очевидно, , v В каждом из этих интервалов sin 2 на к-м интервала (к = 0,1,..., п). Имеем не меньше, чем 1/2. Оценим величину sin | Поэтому интеграл от |Dn(z)|, взятый только по промежуткам, определяемым условием A5), больше, чем сумма п п 1 1 4тг _ 2тг Z^ 2 ±±±ъ 3Bп + 1) Зтг Z^ к + 1' k=0 2п+1 к=0 Эта сумма стремится к оо при п —у оо. Отсюда вытекает соотноше- соотношение A3). Оно означает, что нормы функционалов Dn в пространстве
§ 1. Условия сходимости ряда Фурье 431 непрерывных функций не ограничены в совокупности. Но тогда в си- силу теоремы о слабой сходимости функционалов эта последователь- последовательность не может быть слабо сходящейся на пространстве непрерыв- непрерывных функций, т.е. имеются непрерывные функции /, для которых 7Г lim / Dn(x)f(x)dx >-оо не существует. 2. Условия равномерной сходимости ряда Фурье. Мы уста- установили условия, достаточные для сходимости ряда Фурье некото- некоторой функции / в каждой точке. Класс функций, удовлетворяющих этим условиям, весьма широк, и даже непрерывность вовсе не не- необходима для представимости функции суммой всюду сходящегося тригонометрического ряда. Положение несколько изменится, если мы будем интересоваться условиями равномерной сходимости ряда Фурье. Ясно, что если функция /(ж) имеет хотя бы один раз- разрыв, то ее ряд Фурье не может сходиться к ней равномерно, по- поскольку сумма равномерно сходящегося ряда непрерывных функ- функций всегда непрерывна. Таким образом, непрерывность функции есть необходимое (но, конечно, не достаточное) условие рав- равномерной сходимости ее ряда Фурье. Простое достаточное условие дает следующая теорема. Теорема 2. Если функция / с периодом 2тг абсолютно непре- непрерывна, а ее производная f принадлежит L^\—тг,тг], то ряд Фурье функции f сходится к ней равномерно на всей прямой. Доказательство. Обозначим через о!п и Ь'п коэффициенты Фурье функции /'. Так как / абсолютно непрерывна, то к инте- интегралу an = i Г f(x)cosnxdx — 7Г можно применить формулу интегрирования по частям. Получаем ап = ^ J f(x)cosnxdx = |^ _1| f(x)smnxdx = -% аналогично, bn = ^ J f(x)smnxdx = ^-.
432 Гл. VIII. Ряды. Преобразования Фурье Следовательно, п=1 п=1 Этот ряд сходится, поскольку °° 2 2 a J^ b'n + а'п < oo в силу неравенства Бесселя. Числовой ряд A6) п=1 служит, очевидно, мажорантой для ряда Фурье функции /. Но то- тогда, по признаку Вейерштрасса, ряд Фурье функции / равномерно (и абсолютно) сходится. Остается показать, что сумма этого ряда есть /. Пусть ер — сумма ряда Фурье функции /. Тогда ср имеет те же самые коэффициенты Фурье, что и /. Отсюда в силу непрерыв- непрерывности обеих функций получаем, что / = ср. Можно дать другое условие равномерной сходимости ряда Фурье, аналогичное условию Дйни, именно: Теорема 3. Если на некотором множестве Е С [—тг,тг] сумми- суммируемая функция / ограничена, а условие Дйни выполняется на Е равномерно, т. е. для всякого г > 0 существует такое 5 > 0, что _У \z\ < одновременно для всех х G Е, то ряд Фурье функции f сходится к этой функции равномерно на Е. Доказательство этой теоремы основано на лемме, служащей уси- усилением леммы 1 (см. п. 1). Лемма 2. Если В — нредкомнактное в метрике L\ [—тг, тг] мно- множество суммируемых функций, то для всякого е > 0 найдется такое N = N(e), что ъ f(t) sin At dt < e a при А ^ N(e) для всех f G В одновременно. Для доказательства леммы возьмем в В конечную г/2-сеть ifi,..., if k и выберем N так, чтобы ъ Г ifi(t) sin Xtdt i, г = !,...,&, при А ^ N.
2. Теорема Фейера 433 Если теперь / — произвольная функция из В, то при некотором i и, следовательно, ь , ь , ъ /(?) sin At dt ^\ J ifi(t) sin Xtdt + \ f (f - щ) sin Xt dt < s. a a a Тем самым лемма доказана. Применение этой леммы основано на том легко проверяемом фак- факте, что в условиях теоремы 3 множество функций предкомпактно. Дальнейшие подробности доказательства предо- предоставляем читателю. До сих пор мы говорили о функциях, заданных на отрезке [—тг, тг]. Ясно, что все сказанное может быть автоматически перенесено на функции, определенные на отрезке произвольной длины 21. Для случая нескольких независимых переменных тоже можно сформулировать как условия, достаточные для сходимости ряда Фурье в каждой точке, так и условия равномерной сходимости ряда Фурье. Мы не будем на этом останавливаться. § 2. Теорема Фейера 1. Теорема Фейера. Пусть / — непрерывная на прямой функ- функция с периодом 2тг. Эта функция определяется своим рядом Фурье ап cos nx + bn sin пх A) 71=1 однозначно. Действительно, если /i и /2 — две непрерывные функ- функции, имеющие одни и те же коэффициенты Фурье, то /i — /2 — непрерывная функция, равная нулю почти всюду и, следователь- следовательно, тождественный нуль. Однако поскольку ряд Фурье непрерывной функции, вообще говоря, не обязан сходиться, мы не можем такую функцию / получить непосредственным суммированием ее ряда Фу- Фурье. Способ восстановления непрерывной функции по ее ряду Фурье дает излагаемая ниже теорема, доказанная в 1905 г. Фейером. Пусть Sk (х) = ^ + Yl ai cos 3х +
434 Гл. VIII. Ряды. Преобразования Фурье — частичная сумма ряда Фурье функции /. Положим / ч _ 5р(ж) + Si(x) -\ h Sn-i(x) , v Выражения оп — средние арифметические сумм Sk — называются суммами Фейера функции /. Теорема 1 (Фейер). Если / — непрерывная функция с пе- периодом 2тг, то последовательность {an} ее сумм Фейера сходится к f равномерно на всей числовой оси. Доказательство. Воспользуемся полученным в предыдущем параграфе интегральным представлением частичных сумм ряда Фу- = l f Подставив эти интегралы в равенство C), получим для <тп(ж) сле- следующее выражение: которое с помощью формулыг) п-1 k=0 может быть представлено в виде так называемого интеграла Фейера: ( ) — ! 1 &п\%) — 2П7Г J — 7Г Выражение называется ядром Фейера. Формулу D) можно переписать в виде °п(х) = I f(x + z)$n(z)dz. F) — 7Г Нам нужно доказать, что при п —у оо это выражение равномер- равномерно стремится к /(ж). Отметим предварительно следующие свойства ядра Фейера: 1) Ф„(г) > О, 1) Эту формулу легко получить, суммируя по к равенства 2 sin Bк + 1)г • sin z = cos 2/cz — cos 2(/c + l)z.
2. Теорема Фейера 435 2) / *n{z)dz = \, — 7Г 3) при любом фиксированном 5 > 0 и п —у оо имеем / Фп(*) ^ = / Фп(*) ^ = туп(E) -> 0. -7Г E Первое из этих свойств очевидно, второе получается из равен- равенства F), если положить /(ж) = 1 и учесть, что для такой функ- функции ап(х) = 1 при всех п; наконец, третье свойство сразу вытекает из того, что если 5 < z ^ тг, то sin | ^ ^- и, следовательно, 2 Учитывая эти свойства ядра Фейера, нетрудно доказать теорему. Так как функция / — непрерывная и периодическая, то она огра- ограничена и равномерно непрерывна на всей прямой. Иначе говоря, существует такая постоянная М, что для всех х 1/0*01 ^ м G) и для каждого г > 0 найдется такое S > 0, что \f(x")-f(x')\<e/2, (8) как только \х"-х'\ <5. Для доказательства теоремы нам нужно оценить разность /(ж) - ап(х) = / [f(x) - f(x + z)]$n(z) dz, — 7Г которую можно представить в виде суммы следующих трех интегра- интегралов: J-= ] {f(x)-f(x + z)}*n(z)dz, — 7Г Jo= / {f(x)-f(x + -5 5 Из G) и (8) непосредственно вытекают следующие оценки: \J+\ ^1 f
436 Гл. VIII. Ряды. Преобразования Фурье Выберем теперь по настолько большим, чтобы при n ^ по и данном 5 выполнялось неравенство 2MVn(S) < е/4. Тогда \f(x) - ап(х)\ < е/2 + е/4 + е/4 = е, откуда в силу произвольности ? и следует утверждение теоремы. Отметим, что при доказательстве мы использовали только свой- свойства 1)—3) ядра Фейера. Это позволяет получать различные обобще- обобщения теоремы 1 (см., в частности, п. 3 этого параграфа). 2. Полнота тригонометрической системы. Теорема Вейер- штрасса. Из теоремы Фейера следует полнота тригонометрической системы в пространстве 1/2 [—тг, тг]. Действительно, в силу этой теоре- теоремы любая непрерывная функция есть предел равномерно (а значит, и в среднем) сходящейся последовательности тригонометрических многочленов оп. Остается заметить, что непрерывные функции всю- всюду плотны в Z/2. Теорему Фейера можно рассматривать как усиле- усиление теоремы Вейерштрасса об аппроксимации непрерывных функ- функций тригонометрическими многочленами: эта последняя устанавли- устанавливает, что всякая непрерывная функция есть равномерный предел какой-то последовательности тригонометрических многочленов, а теорема Фейера указывает вполне определенную последо- последовательность, обладающую этим свойством, — последовательность сумм Фейера C). Из теоремы Вейерштрасса о равномерной аппрок- аппроксимации непрерывной периодической функции тригонометрически- тригонометрическими многочленами легко следует и вторая теорема Вейерштрасса — об аппроксимации алгебраическими многочленами любой функ- функции, непрерывной па некотором отрезке [а, Ь]. Действительно, если /(ж) — такая функция, то, положив t = ^ ~ атг, т. е. х = -^-^—- + а, мы получим функцию (f(i) от ?, заданную на [0,тг]. Продолжим ее вначале на полусегмент [—тг,О), положив ip(—t) = ip(t), а потом, по периодичности, на всю прямую. Построим теперь тригонометри- тригонометрический многочлен Тп, удовлетворяющий условию \Tn(t) - ip(t)\ < г/2 при всех t. Далее, всякий тригонометрический многочлен разлагается в ряд Тейлора, сходящийся равномерно на любом конечном интервале. Пусть Рт — частичная сумма ряда Тейлора для Тп, такая, что \Tn(t) - Pm(t)\ < е/2 при 0 ^ t <: тг. Тогда №t)-Pm(t)\ <г при (К?^тг.
3. Интеграл Фурье 437 Сделав в Pm(t) обратную замену t = т—— тг, мы получим многочлен Qm(x), удовлетворяющий условию \f(x) - Qm(x)\ < г при а ^ х ^ Ь. 3. Теорема Фейера для пространства L\. В теореме Фейера до- достигнута определенная симметрия между условием и утверждением тео- теоремы. Из того, что функция / принадлежит пространству С[—тг, тг] непре- непрерывных функций, следует, что отвечающие ей суммы Фейера сходятся к / в метрике того же самого пространства С[—тг, тг]. Аналогичные теоремы можно получить и для других функциональных пространств, в частности, для пространства L\[—тг, тг]. Точнее говоря, имеет место следующая тео- теорема, которую естественно назвать теоремой Фейера для суммируемых функций: Если / — суммируемая на отрезке [—тг, тг] функция, то ее суммы Фей- Фейера сходятся к ней по норме пространства L\[—тг, тг]. Доказательство этого утверждения может быть получено с помощью рассуждений, близких к изложенным в п. 1. Мы не будем здесь их прово- проводить, однако отметим следующий важный факт, вытекающий из теоремы Фейера для суммируемых функций. Всякая суммируемая функция однозначно (с точностью до эквива- эквивалентности) определяется своими коэффициентами Фурье. Действительно, пусть / и g — две суммируемые функции, имеющие одинаковые коэффициенты Фурье. Тогда все коэффициенты Фурье функ- функции / — g равны 0. Следовательно, тождественно равны 0 и все суммы Фейера для / — д. Но тогда и их предел в Li, т. е. функция f — д, есть 0 почти всюду. § 3. Интеграл Фурье 1. Основная теорема. В § 1 были установлены условия, при ко- которых периодическая функция может быть разложена в сходящийся ряд Фурье, т. е. представлена как суперпозиция гармонических ко- колебаний. Попытаемся сейчас перенести этот результат на функции непериодические. Мы увидим, что при довольно общих допол- дополнительных условиях такое представление возможно, но только уже с помощью не ряда, а интеграла, так называемого интеграла Фурье. Начнем с наводящих соображений. Пусть функция / на каждом конечном интервале удовлетворяет условиям, обеспечивающим раз- разложимость ее в ряд Фурье. Иначе говоря, предположим, что / сум- суммируема на любом конечном интервале и в каждой точке удовлет- удовлетворяет условию Дйни. Рассматривая /, скажем, на отрезке [—/,/],
438 Гл. VIII. Ряды. Преобразования Фурье мы можем написать разложение этой функции в ряд Фурье: ОО /(ж) = ^ + ^ ак cos ^fx + bk sin !fx. A) Подставим сюда вместо ак и Ък их выражения: 1 l л l 1 ао = 7 / /(*)d*> ak = jf f(t)<x>s*ftdt, bk = ± J f (t) sin ^tdt. -i Получим z °° z /(ж) = 1 I /(?)d? + ^± | /(?) cos ^ж cos ^tdt+ i ' 1 I J \ ) J J — I J I I -I -/ k=i -i T'e' / °° / /w = i / /w *+? E f / /wcos t(* -x) dt- B) -/ a;=i -/ Дополним предположения о функции / еще одним: пусть эта функ- функция абсолютно интегрируема на всей прямой, т. е. оо — оо Перейдем теперь (пока чисто формально) в равенстве B) к пределу при I —У оо. В силу C) первое слагаемое в правой части равенства B) при I —У оо стремится к нулю. Второе слагаемое можно рассматри- рассматривать как интегральную сумму (но только распространенную на бес- бесконечный промежуток) для интеграла оо I F(X)d\ о от функции = ^ Г f (t) cos X(t — x)dt, -i
3. Интеграл Фурье 439 если положить А& = ктг/l и АЛ = тг/l. Поэтому формальный пре- предельный переход в B) при I —у оо приводит к равенству оо оо оо оо /(ж) = | I d\ I f(t) cos \(t-x)dt. D) О -оо Это и есть искомое представление. Введя обозначения: -1 °° 1 °° ах = ± I fit) cos Xtdt, Ъх = ± J f{t) sin Xtdt, — oo —oo равенство D) можно переписать в следующем виде, аналогичном ряду Фурье: ^ f[x)= Г (а\ cos Xx + b\ sin Xx) d\. E) о Мы получили равенство D), называемое формулой Фурье, с по- помощью формального предельного перехода. Можно было бы обосно- обосновать справедливость этого перехода (при сделанных выше предпо- предположениях о функции /), однако проще доказать равенство D) непо- непосредственно. Итак, докажем следующую теорему. Теорема 1. Если функция / абсолютно интегрируема на всей прямой и в точке х удовлетворяет условию Дйни, то имеет место равенство /(я) = 1 j dX j f(t) cos X(t-x)dt О -оо Доказательство. Введем обозначение А оо J(A) = | / d\ j f{t) cos A(t - x) dt. F) 0 -oo Нам нужно доказать, что lim J(A) существует и равен f{x). Так А-^оо как / абсолютно интегрируема, то внутренний интеграл в F) схо- сходится, а двойной интеграл сходится абсолютно. Используя теорему Фубини, изменим в повторном интеграле F) порядок интегрирова- интегрирования: J(A) = i J dxf fit) cos A(t - x) dX = 1 J f(t) S{nt{l;x) dt. — oo 0 —oo Заменой переменных t — x = z приведем этот интеграл к виду G) — ОО Хорошо известное равенство 1 J §mA
440 Гл. VIII. Ряды. Преобразования Фурье позволяет записать разность J(A) — f(x) в виде J(A) - f(x) = 1 J f{x + z)z~ f{x) sinAzdz. (8) — OO Представим стоящий справа интеграл в виде суммы трех слагае- слагаемых: W - f(x) = I / /(ж + 1"/(ж) «nAzdz+ -N + 1 / ЩЛШ Второй и третий члены справа представляют собой сходящиеся ин- интегралы, и каждый из них может быть сделан меньше, чем г/3, если число N взято достаточно большим. Первое слагаемое справа (при фиксированном N) стремится к нулю, когда А —У оо (в силу леммы 1 § 1 и условия Дйни). Таким образом, получаем lim (J(A) - f{x)) = 0, А—>-оо что и требовалось доказать. 2. Интеграл Фурье в комплексной форме. В интегральной формуле Фурье D) внутренний интеграл представляет собой четную функцию от Л, что позволяет переписать эту формулу в виде оо оо f(x) = ^r j dX j f(t) cos X(t-x)dt. (9) — oo —oo Далее, из абсолютной интегрируемости функции / следует, что ин- оо теграл Г /(?) sin X{t — х) dt существует и представляет собой не- — оо четную функцию от А. Поэтому оо оо i I dX I f(t) sin X(t-x)dt = 0 A0) — oo —oo (если интеграл по А понимать в смысле главного значения, т. е. как lim f ). Прибавив к (9) равенство A0), умноженное на —г, полу- N—>-оо J / — оо чим /Or) = i / d\ f — оо —оо Это равенство мы будем называть комплексной формулой Фурье.
§ 4. Преобразование Фурье, свойства и применения 441 § 4. Преобразование Фурье, свойства и применения 1. Преобразования Фурье и формула обращения. Интег- Интегральную формулу Фурье можно расчленить на два равенства. По- Положим оо д(Х)= } f(t)e-iXtdt. A) — ОО Тогда ^ /0»0 = 5F / 9WeiXxd\. B) — оо Заметим, что формула A) имеет смысл для любой абсолютно инте- интегрируемой функции /. Таким образом, каждой / Е L\{—oo,oo) мы с помощью формулы A) сопоставляем определенную функцию д, заданную на всей числовой прямой. Функция д называется преобра- преобразованием Фурье исходной функции /. Формула B), выражающая / через ее преобразование Фурье, называется формулой обращения для преобразования Фурье. Следует обратить внимание на сходство между формулами A) и B). Вторая из них отличается от первой лишь знаком в показателе и множителем 1/Bтг) перед интегралом. Можно было бы достигнуть здесь еще большей симметрии, опреде- определив д формулой д{Л) — —т= j J{x)e ax. ц ) ^ ^ -оо Тогда формула обращения приняла бы вид ]= I 9WeiXxd\, B') т. е. различие осталось бы только в знаке показателя экспоненты. Однако при всем их внешнем сходстве формулы A) и B), по су- существу, различны: в первой из них интеграл существует в обычном смысле (поскольку / Е L\{—oo,oo)), а во второй, вообще говоря, лишь в смысле главного значения. Кроме того, равенство A) — это определение функции д, а в равенстве B), представляю- представляющем собой иную запись интегральной формулы Фурье, содержится утверждение, что стоящий там справа интеграл равен исходной функции /. Как мы видели выше, для обеспечения этого равенства на / надо наложить, помимо интегрируемости, еще дополнительные условия, скажем, условие Дйни. Замечание. Мы определили преобразование Фурье д для вся- всякой функции / из Li(—оо, оо) и показали, что функция /, удовлет- удовлетворяющая условию Дйни в каждой точке, выражается с помощью
442 Гл. VIII. Ряды. Преобразования Фурье формулы обращения через свое преобразование Фурье д. Это по- положение вещей в точности аналогично тому, которое имеется для рядов Фурье. Действительно, коэффициенты Фурье определены для всякой / Е L\[—тг,тг], однако сходимость ряда Фурье (играющего здесь роль формулы обращения) можно гарантировать лишь при определенных дополнительных условиях (условие Дйни). Вместе с тем для преобразования Фурье (как и для ряда; см. конец § 2) имеет место следующее: если для функции / Е Li(—оо, оо) ОО / f(x)e~iXx dx = 0, — ОО то f(x) = О почти всюду. Действительно, из написанного выше равенства вытекает, во- первых, что для всех действительных t и Л ОО f — (X) Положим теперь ф) = f f(x + t)dt, о где ? — произвольное фиксированное действительное число. При- Применяя теорему Фубини и используя условие, наложенное на функ- функцию /, легко усмотреть, что функция ip (которая, как и /, принад- принадлежит Li(—оо, оо)) удовлетворяет тому же условию, т.е. — (X) при всех действительных Л. Но, как легко видеть, функция ср аб- абсолютно непрерывна на каждом конечном отрезке и, следователь- следовательно, почти всюду обладает конечной производной. В частности, эта функция почти всюду удовлетворяет условию Дйни. Поэтому в си- силу теоремы 1 § 3 она почти всюду обращается в 0, так как ее пре- преобразование Фурье есть тождественный 0. Но ip непрерывна, так что (р(х) = 0. Из этого вытекает, в частности, что при всех действитель- действительных ? ^ J f(t)dt = O о и, следовательно, f(x) =0 почти всюду.
§ 4. Преобразование Фурье, свойства и применения 443 Рассмотрим теперь некоторые примеры. 1. Пусть f(x) = е~71ж1 G > 0). Найдем преобразование Фурье этой функции. Имеем ОО / ¦* \ С г\/ /у* /1 \ /у* -ш С г\/ s~* д(Х) = J е~1Ще~гХх dx = J е~7|а — оо —оо ОО = 2 f e~lx cosXxdx. о С помощью двукратного интегрирования по частям находим 2. Пусть Г 1 = п [ 0 при 0 при ^ а, > а. Тогда д(Х) = J f(x)e~iXx dx = j e~iXx dx = 6*Л° 'f^ = MnAa. — а (Следует обратить внимание на то, что функция д здесь не при- принадлежит Li(—oo,oo).) 3. Пусть fix) = 2 1 2. Тогда ж + а (X) 5(А)= / е-<Ая^^2- C) — (X) Этот интеграл проще всего вычислить с помощью теории вычетов. Пусть сначала Л > 0. Дополнив действительную ось, по которой берется интеграл C), полуокружностью бесконечно большого ра- радиуса, лежащей в нижней полуплоскости (т. е. в той, где экспонента е-г\х СТремится к нулю), получим, что интеграл C) равен сумме вычетов подынтегральной функции в нижней полуплоскости, умно- — iXx женной на (—2тгг). В нижней полуплоскости функция -| ^ имеет один полюс первого порядка в точке х = — аъ. Вычет в этой точке находится по известной формуле: если f(z) = , , и (р(а) ф 0, a ip(z) имеет в точке z — а нуль первого порядка, то вычет функции / <^(а) тт в точке а равен ,( . Поэтому в нашем случае получаем г \а) д(Х) = -2тгг^ = Iе~пХ
444 Гл. VIII. Ряды. Преобразования Фурье При Л < 0 аналогично (рассматривая только верхнюю полуплос- полуплоскость вместо нижней) получаем д(Х) = %еа\ Таким образом, окончательно д{Х) = ^е~а'Л', -оо < Л < оо. Впрочем, этот результат можно получить сразу по формуле обра- обращения, используя пример 1 и теорему 1 § 3. 4. Положим f(x) = е~ах . Имеем д(Х) = J e-ax2e~iXxdx. D) — оо Здесь под интегралом стоит аналитическая функция, не имеющая особенностей в конечной части плоскости и стремящаяся к нулю вдоль каждой прямой, параллельной действительной оси. Поэтому в силу теоремы Коши интеграл D) не изменит своего значения, если его взять не по действительной оси, а вдоль любой прямой z = x-\-iy (у = const), параллельной этой оси. Таким образом, ОО • 2 • • д(Х) = Г е-а(ж+^) . е~Щх+гу) fa _ — оо _ ау2+\у Г -ах2-2агху-г\х j _ ау2+\у Г -ах2-ixBay+\) j — с- /с- LLJL — с- /с- LLJL. — оо —оо Выберем теперь постоянное значение у так, чтобы в показателе подынтегральной экспоненты исчезла мнимая часть, т. е. положим у = -Л/Bа). Тогда Л2 Л2 ОО 2 д(Х) =еа^~^ I e~ax dx = — оо поскольку 00 В частности, если положить а = 1/2, то мы получим fix) = в"*2/2, д(\) = л/2^е"л2/2, т. е. функция е~х I2 переводится преобразованием Фурье сама в себя (с точностью до постоянного множителя). 2. Основные свойства преобразования Фурье. Из формулы A), определяющей преобразование Фурье, вытекает ряд свойств это- этого преобразования. Рассмотрим эти свойства. Для сокращения за- записи будем преобразование Фурье функции / обозначать символом
§ 4. Преобразование Фурье, свойства и применения 445 F[f]. Иначе говоря, мы обозначим через F линейный оператор, опре- определенный на пространстве Ь\{—оо,оо) и ставящий в соответствие каждой функции из этого пространства ее преобразование Фурье1). 1. Если последовательность {/п} функций из Ь\{—оо, оо) сходит- сходится в метрике пространства Ь\{—оо, оо), то последовательность их преобразований Фурье gn = F[fn] сходится равномерно на всей пря- прямой. Это утверждение сразу вытекает из очевидной оценки: ОО |<?»(А) - gm(X)\ sC I \fn(x) - fm(x)\ dx. — ОО 2. Преобразование Фурье д абсолютно интегрируемой функции f представляет собой ограниченную непрерывную функцию, которая стремится к нулю при |Л| —У оо. Действительно, ограниченность функции g = F[f] сразу видна из оценки ^ Далее, если / — характеристическая функция интервала (а, 6), то для нее b .Л -гЛ g(\) = f е-*** dx = * -iXb Эта функция, очевидно, непрерывна и стремится к нулю при |Л| —> оо. Так как операция F перехода от / к g линейна, то от- отсюда следует, что преобразование Фурье любой ступенчатой функ- функции (т. е. линейной комбинации индикаторов интервалов) есть то- тоже непрерывная функция, стремящаяся к нулю при Л —> =Ьоо. На- Наконец, ступенчатые функции всюду плотны в Ь\{—оо,оо), поэтому если / G Li, то существует последовательность {/п} ступенчатых функций, сходящаяся к / в Ь±(—оо, оо). Тогда в силу свойства 1 по- последовательность функций gn = F[fn] сходится равномерно на всей прямой к функции д = F[f]. Но тогда предельная функция д тоже непрерывна и стремится к нулю при Л —> оо. Упражнения. 1. Доказать, что преобразование Фурье д абсолютно интегрируемой функции / равномерно непрерывно на всей прямой. 2. Пусть В — пространство равномерно непрерывных на (—оо, оо) функций, стремящихся к нулю на бесконечности. Показать, что преобра- преобразование Фурье F есть оператор из Li(—оо, оо) в В с нормой 1, удовлетво- удовлетворяющий условию KerF = 0. 1) Вообще говоря, не принадлежащее L\.
446 Гл. VIII. Ряды. Преобразования Фурье 3. Если f абсолютно непрерывна на каждом конечном интервале и f Е I/i(—оо, оо), то имеет место равенство F[f]=iXF[f]. Таким образом, дифференцированию функции (при указанных вы- выше условиях) отвечает умножение ее преобразования Фурье на гА. Действительно, абсолютно непрерывная на каждом конечном ин- интервале функция может быть записана в виде f(x) = /@)+ I f'(t)dt. о Из абсолютной интегрируемости /' следует, что стоящее здесь спра- справа выражение при х —> оо и при х —> — оо имеет предел. Этот предел может быть только нулем, так как иначе функция / не была бы интегрируема на всей прямой. Учитывая это, получаем с помощью интегрирования частям ОО F[f}(\)= / f(x)e-iXxdx = — ОО оо оо — оо J — оо что и требовалось доказать. Если функция / такова, что f(k~1) абсолютно непрерывна на каждом интервале и /,..., /^ Е Li(—оо, оо), то с помощью таких же рассуждений получим F[f{k)] = (i*)kF[f]. E) 4. Связь между степенью гладкости функции и скоростью убы- убывания на бесконечности ее преобразования Фурье. Разделив равен- равенство E) на (гЛ)^ и вспомнив, что преобразование Фурье всегда стре- стремится к нулю на бесконечности (свойство 2), получим, что если t абсолютно интегрируема, то \F[f}\ = ^т^ ->¦ оо, т. е. в этих условиях F[f] убывает на бесконечности быстрее, чем l/|A|fe. Итак, чем больше производных в L\ имеет /, тем быстрее убывает на бесконечности ее преобразование Фурье. 5. Если f" существует и принадлежит Li(—оо,оо), то F[f] аб- абсолютно интегрируема. Действительно, при указанных условиях F[f] ограничена и убы- убывает на бесконечности быстрее, чем 1/Л2. Отсюда следует интегри- интегрируемость.
§ 4. Преобразование Фурье, свойства и применения 447 Выше (свойство 4) мы показали, что чем больше производных имеет функция /, тем быстрее убывает на бесконечности ее преобра- преобразование Фурье. Справедливо и двойственное утверждение, а именно, чем быстрее убывает /, тем глаже ее преобразование Фурье. Точнее говоря, верно следующее утверждение. 6. Пусть как функция fix), так и xf{x) абсолютно интегрируе- интегрируемы. Тогда функция g = F[f] дифференцируема и g'(X) = F[-ixf(x)]. F) Действительно, продифференцировав интеграл оо I f(x)e~iXxdx, — ОО определяющий д, по параметру Л, мы получим интеграл оо —г Г xf{x)e~lXx dx, — оо который (в силу интегрируемости функции xf(x)) сходится рав- равномерно по Л. Следовательно, производная функция д существует и имеет место F). Если / такова, что абсолютно интегрируемы функции /(ж), xf(x),... ,жр/(ж), то, как показывают аналогичные рассуждения, функция д имеет производные до р-го порядка включительно, при- причем ,1Л g^(X)=F[(-ix)kf(x)}, k = 0,1,..., р. 7. Если потребовать, чтобы функция / убывала на бесконеч- бесконечности еще быстрее, то д будет еще более гладкой функцией. Из предположения, что xpf(x) Е Li(—oo,oo) при всех р, вытекает бес- бесконечная дифференцируемость функции д. Допустим теперь, что е^ж1/(ж) Е Li(—оо,оо) при некотором S > 0. Тогда д(Х) распростра- распространяется с действительной оси Л как аналитическая функция в полосу на плоскости ? = Л + i\i комплексного переменного, причем ширина этой полосы тем больше, чем больше S. Во всяком случае можно утверждать, что д будет аналитической функцией при \/л\ < S. Дей- Действительно, интеграл очевидно, будет сходиться при \/л\ < S и определять непрерыв- непрерывную функцию, совпадающую с преобразованием Фурье функции / на действительной оси. Тот факт, что эта функция дифференцируе- дифференцируема при |/i| < 5 в смысле теории аналитических функций, доказыва- доказывается совершенно так же, как свойство 6.
448 Гл. VIII. Ряды. Преобразования Фурье 3. Полнота функций Эрмита и Лагерра. Используя сообра- соображения, изложенные в предыдущем абзаце, можно показать, что если измеримая функция f почти всюду на интервале (а,Ь), где — оо^а<Ь^оо, отлична от 0; и удовлетворяет условию \f(x)\ ^ ^ Се~51ж1, где 8 > 0; то система функций {xnf(x)} (n = 0,1, 2,...) полна в 1/2 (а, Ь). Отсюда, в частности, будет следовать, что функции Эрмита обра- образуют полную систему в 1/2(—оо, оо), а функции Лагерра — в 1/2@, оо) (см. п. 7 § 3 гл. VII). Докажем сформулированное утверждение о полноте. Предполо- Предположим, что система {xnf(x)} не полна. Тогда в силу теоремы Хана- Банаха найдется такая ненулевая функция h Е L^{—оо, оо), что ОО I xnf(x)h(x)dx = 0, n = 0,1,2,... — ОО (Мы использовали теорему об общем виде линейного непрерывного функционала в гильбертовом пространстве; если рассматривается комплексное 1/2(а,6), то вместо h{x) надо писать h{x).) Ясно, что fh G Li(a,b) и, более того, e6l\x\fh G Li(a,b) при любом Si < S. В дальнейшем удобно считать, что f(x) и h(x) определены на всей прямой, продолжая их, если необходимо, за (а, Ь) нулем. Пусть g — преобразование Фурье функции fh, т. е. оо g(\)= / f(x)h(x)e-iXx dx. — (X) Из сказанного выше следует, что функция д продолжается как ана- аналитическая в полосу |Im (\ < 5. С другой стороны, в силу свойства б все производные этой функции при Л = 0 обращаются в 0, так что д(Х) = 0. По свойству единственности, доказанному в п. 1, отсюда следует, что f(x)h(x) = 0 почти всюду и, следовательно, h(x) = 0 почти всюду, так как f(x) почти всюду отлична от 0. Но это проти- противоречит нашему предположению о том, что h — ненулевая функция. Полученное противоречие и доказывает полноту системы {xnf(x)}. 4. Преобразование Фурье быстро убывающих бесконечно дифференцируемых функций. Пользуясь тем, что при перехо- переходе от функции / к ее преобразованию Фурье д свойства гладкости функции и убывания ее на бесконечности меняются ролями, легко указать естественные классы функций, которые переводятся пре- преобразованием Фурье сами в себя. Пусть 5оо — совокупность бесконечно дифференцируемых функ- функций на прямой, для каждой из которых существует набор постоян- постоянных Cpq (зависящих от самой функции / и чисел р, q) таких, что \XPf^(x)\<Cpq. G)
§ 4. Преобразование Фурье, свойства и применения 449 Покажем, что если / G Soo, то и д = F[/] G Soo- Прежде всего из G) следует абсолютная интегрируемость каждой из функций хр ^\ Действительно, поскольку G) выполняется при всех р и д, то т.е. функция хрf<yQ\x) убывает не медленнее, чем 1/х2. Отсюда в свою очередь следует, что функция F[f] имеет производные всех порядков. Наконец, согласно п. 2, из суммируемости f<yQ\x) (q = 1,2,...) следует, что д = F[f] убывает на бесконечности бы- быстрее, чем 1/|А|д. Рассмотрим теперь функции каждая из них, как преобразование Фурье интегрируемой функции, ограничена некоторой постоянной Dpq. Таким образом, если / Е Soo, то и д = F[f] G Sqo. Обратно, пусть д G Soo, тогда, по доказанному, функция ^ /*(х)= / g(X)e-iXxdx — оо входит в 5оо. Положим f(x) = <т^/*(—х). Ясно, что / G 5оо. В то же время по формуле обращения (X) (X) <?(А) = ^ / f*(x)eiXxdx= I f(x)e-iXxdx, — оо —оо т.е. д есть преобразование Фурье функции / G Sqo. Итак, преобра- преобразование Фурье переводит класс S^ снова в весь класс Sqo. Ясно, что это отображение взаимно однозначно. оо Упражнение. Пусть / ? 5оо и fxpf(x)dx = 0 при всех р ^ 0. Следует ли отсюда, что f(x) = 0? -оо 5. Преобразование Фурье и свертка функций. Пусть Д и /2 — интегрируемые на всей прямой функции. Функция оо — оо называется их сверткой. Функция f(x) определена при почти всех х и интегрируема. Действительно, двойной интеграл оо оо / / fi(Of2(x-Z)d?dx — ОО —ОО существует, поскольку существует интеграл оо оо — оо —оо
450 Гл. VIII. Ряды. Преобразования Фурье (см. замечание к теореме Фубини, п. 4, § б, гл. V). Следовательно, существует и интеграл оо оо оо / f(x)dx= / dx f MOM*-?)<%¦ — оо —оо —оо Функция / обозначается символом Д * Д. Вычислим преобразова- преобразование Фурье свертки двух функций из L\. Применяя теорему Фубини и полагая х — ? = rj, получаем оо оо , оо / f(x)e-iXxdx= / { — оо —оо оо — оо —оо оо ( оо { F[fi * /2] = F[/i]F[/2]. Итак, преобразование Фурье переводит операцию свертки в более простую операцию — умножение функций. Этот факт играет важ- важную роль во многих применениях преобразования Фурье. 6. Применение преобразования Фурье к решению урав- уравнения теплопроводности. Применение преобразования Фурье к дифференциальным уравнениям основано на том (см. п. 3), что оно переводит операцию дифференцирования в операцию умноже- умножения на независимое переменное. Следовательно, если у нас имеется линейное дифференциальное уравнение с постоянными коэффици- коэффициентами yw + сцу^-1) + • • • + ап-гу' + апу = ф), (8) то преобразование Фурье переводит его в алгебраическое урав- уравнение вида (i\)nz + diiiXy^z Л Ь dn-xiXz + anz = ^(A), (9) где z = F[y] и ф = F[(f\. Однако для обыкновенных дифференциаль- дифференциальных уравнений этот прием не открывает каких-либо существенно новых перспектив, так как решение линейных уравнений с постоян- постоянными коэффициентами и без того не представляет больших трудно- трудностей. Кроме того, переход от (8) к (9) возможен, если неизвестная функция у = у(х) интегрируема на всей прямой, а для решений
§ 4. Преобразование Фурье, свойства и применения 451 линейных уравнений с постоянными коэффициентами это, вообще говоря, не имеет места. Более существенно применение преобразования Фурье к уравне- уравнениям с частными производными, где оно позволяет, при определен- определенных условиях, свести решение такого уравнения к решению обык- обыкновенного дифференциального уравнения. Покажем это на примере решения задачи Коши для уравнения теплопроводности. Будем искать решение уравнения du(x,t) _ d2u(x,t) ( , dt ~ дх* ^ при — оо<ж<оои?^0, обращающееся при t = 0 в заданную функцию ио(х). Физический смысл этой задачи состоит в нахожде- нахождении температуры бесконечного теплопроводящего стержня в любой момент времени t > 0, если в начальный момент t = 0 его темпера- температура в каждой точке есть и${х). Предположив, что щ(х), uf0(x) и и$(х)) принадлежат L\{—оо, оо), будем искать решение поставленной задачи в классе функций и(х, ?), удовлетворяющих следующим условиям: 1) функции u(x,t), ux(x,t), uxx(x,t) абсолютно интегрируемы по всей оси х при любом фиксированном t ^ 0; 2) функция щ(х, t) имеет в каждом конечном интервале 0 ^ t ^ Т интегрируемую мажоранту /(ж) (не зависящую от ?): оо \ut(x,t)\ ^ /(ж), J f(x)dx < оо. — оо Выполним в уравнении A0) преобразование Фурье по х. При этом справа мы получим F[uxx(x,t)] = -А2?;(А,?), где v(X,t) = F[u(x,t)], а слева в силу условия 2) имеем F[ut] = / ut(x,t)e-lXx dx = ft — оо —оо Таким образом, преобразование Фурье переводит уравнение A0) в обыкновенное дифференциальное уравнение vt(X,t) = -A2?;(A,?), для которого нам теперь нужно найти решение, обращающееся при t = 0 в функцию оо — оо ОО vo(X) = F[uo(x)] = I uo(x)e~iXx dx.
452 Гл. VIII. Ряды. Преобразования Фурье Таким решением будет, очевидно, Теперь, для того чтобы получить решение нашей первоначальной задачи, остается найти ту функцию u(x,t), преобразованием Фурье которой служит функция г?(А, ?). Используя пример 4 п. 1, получаем Поэтому v(X,t) = т.е. u(x,t) = Мы получили так называемый интеграл Пуассона для решения уравнения теплопроводности. 7. Преобразование Фурье функций нескольких перемен- переменных. Преобразование Фурье, рассмотренное нами для функций од- одной переменной, легко переносится на функции нескольких пере- переменных. Пусть f(xi,... ,хп) — функция, интегрируемая по всему п-мер- ному пространству Жп. Ее преобразованием Фурье называется функ- функция оо оо q(Xi ... Лп) = Г Г f(xi ... xn)e~i<yXlXl^—^ХпХп") dxi .. .dxn. — оо —оо Этот n-кратный интеграл, заведомо существующий, поскольку f(xi,...,xn) интегрируема, можно записать, по теореме Фубини, в виде следующего повторного интеграла: .,...,Ап) = ОО — оо —оо —оо х e~iX2X2) dx2... }e~iXnXn dxn. A1) Иначе говоря, можно перейти от функции п переменных к ее пре- преобразованию Фурье, последовательно выполняя преобразования по
§ 4. Преобразование Фурье, свойства и применения 453 каждой из переменных в отдельности (в любом порядке). Обра- Обращая последовательно каждую из п операций в правой части равен- равенства A1), получим формулу ОО , ОО . / { / #(Аь...,Ап)х —оо —оо х eiXnXn d\n}eiXn-lXn~l} dAn_i .. Ее можно переписать в виде n-кратного интеграла +x^)d\1...d\n, A2) однако, поскольку функция g(Ai,..., Ап), вообще говоря, не обязана быть суммируемой по всему Мп, нужно указать, в каком смысле следует понимать этот интеграл и те условия на /(xi,..., жп), при которых она представляется интегралом A2). Один из возможных ответов на эти вопросы дает следующая тео- теорема. Теорема 1. Пусть функция f(xi,...,xn) интегрируема по все- всему пространству Жп и удовлетворяет условиям: |/0п + tbx2,... ,хп) - /On,... ,xn)\ ^ C\h\a, \f(x1,X2 +t2,...,Xn) - /(ЖЬ...,ЖП)| ^ G(xi)|t2|a, A3) |/(жь...,жп + tn) -()| ()||a где оо О ^ а ^ 1, Г С(х\) dx\ < оо, оо оо J ... | C(xi,...,xn_i)dxi ...б?жп_1 < оо. — оо —оо Тогда формула обращения A2) справедлива, если интеграл в ней понимать как 1 lim Bтг)п / {••• lim ] { lim f
454 Гл. VIII. Ряды. Преобразования Фурье Действительно, поскольку f(x±,..., хп) суммируема в Жп, то в си- силу теоремы Фубини она суммируема по х\ при почти всех ж2,..., хп. Следовательно, существует функция оо /i(Abx2,...,xn) = I f(xu...,xn)e-ixiXl dxx. — оо Из A3) следует, что /(xi, ... ,жп) как функция от х\ удовлетворя- удовлетворяет условию теоремы 1 § 3; поэтому f(xi,... ,хп) можно выразить через /i по формуле обращения Nl /(жь...,жп) = lim ту- f fi{\ux2,...,xn)eiXiXi d\i. Далее, если мы положим оо /2(Ab Л2, ж3,..., хп) = I /i(Ab ж2,..., хп)е~гХ2Х2 dx2, — оо то из условия A3) следует, что для Д справедлива формула обра- обращения /i(Ai,x2,...,xn)= lim i f /2(А1,А2,...,хп)егЖ2Л2^А2, 7V2-^oo Z7r J -N2 т.е. = lim i M lim i / /2(Ai,A2,...,xn)e^2A2^ TVi-^oo Z7r ^ L7V2-^oo Z7r ^ -TVi -7V2 Определив аналогичным образом /з(А1, А2,..., хп) и т. д., мы и при- придем к формуле A2). Преобразование Фурье функций нескольких переменных широко используется в теории уравнений с частными производными. Рас- Рассмотрим, например, уравнение ди _ д2и | д2и описывающее процесс распространения тепла в плоскости. Пусть в момент t = 0 температура задана: и@,х,у) = ио(х,у). Наложив на искомое решение уравнения A4) условия, аналогичные тем, которые указаны в п. 6, мы можем сделать в уравнении A4)
§ 5. Преобразование Фурье в Ьг( —оо,оо) 455 преобразование Фурье по переменным х и у. В результате получим обыкновенное уравнение ^ = -(А2 + <7>, A5) гДе оо оо v{t,X,a)= I f u(t,x,y)e-i(-Xx+<TyUxdy. — оо —оо Решив уравнение A5), можно затем найти решение исходного уравнения A4) с помощью формулы обращения. § 5. Преобразование Фурье в пространстве L^—oo,oo) 1. Теорема Планшереля. Вернемся сначала к тем результа- результатам, которые мы получили для рядов Фурье. Для большей анало- аналогии с преобразованием Фурье будем рассматривать ряд Фурье в ком- комплексной форме, т. е. возьмем на отрезке [—тг, тг] полную ортогональ- ортогональную систему функций егпх, п = О, =Ы, ±2,... и каждой суммируемой на отрезке [—тг, тг] функции / мы поставим в соответствие последо- последовательность ее коэффициентов Фурье с» = h I f(x)e~inx dx> n = °.±:L'±2' ¦ ¦ ¦ — 7Г Если функция / не только суммируема, но и имеет суммируемый квадрат, то ее коэффициенты Фурье удовлетворяют условию Иначе говоря, переход от суммируемой с квадратом функции к со- совокупности ее коэффициентов Фурье есть отображение евклидова пространства L^ на евклидово пространство Ь, причем это отобра- отображение линейно и удовлетворяет равенству Парсеваля (т. е. этот переход отличается лишь числовым множителем от пре- преобразования, сохраняющего норму). Обратимся теперь к преобразованию Фурье для функций, задан- заданных на всей прямой, и посмотрим, нельзя ли это преобразование трактовать как некоторый линейный оператор в комплексном про- пространстве 1/2(—оо, оо). Основная трудность состоит здесь в том, что
456 Гл. VIII. Ряды. Преобразования Фурье функция с интегрируемым квадратом на прямой не обязана при- принадлежать L\{—00,00), т.е. преобразование Фурье в смысле, опре- определенном в § 4, может для нее и не существовать. Однако для всякой / ? L2{—00, 00) можно определить преобразование Фурье в несколь- несколько ином смысле. При этом получается следующая теорема, которую можно рассматривать как аналог равенства Парсеваля A). Теорема (Планшерель, 1910 г.). Для всякой функции / ? I/2(—00,00) интеграл 9n(X)= f f(x)e-iXxdx -N при любом N представляет собой функцию от X, принадлежащую к L/2(—00,00). При N —у оо функции gjy сходятся в метрике про- пространства Z/2 к некоторому пределу д, причем оо оо / \g(X)\2d\ = 2n I \f(x)\2dx. B) — ОО —ОО Эту функцию д называют преобразованием Фурье функции / Е L^. Если f принадлежит также и к L\{—00,00), то соответствующая функция g совпадает с преобразованием Фурье функции / в обыч- обычном смысле. Доказательство. Основная идея доказательства состоит в том, что равенство B) устанавливается сперва для всех функций, принадлежащих классу Sqq бесконечно дифференцируемых быстро убывающих функций, которые всюду плотны в L^—00, 00), а потом распространяется по непрерывности на все L^—00,00). Реализуем теперь эту идею в деталях. 1) Пусть /i,/2 G Soo- Обозначим через д\ и д<± соответственно их преобразование Фурье. Имеем оо оо оо / Mx)J2(x)dx= / ^ / [gi(X)eiXxdX\f2(x)dx = =± J причем изменение порядка интегрирования здесь законно, посколь- поскольку функция абсолютно интегрируема в плоскости (ж, Л). Положив в полученном равенстве Д = /2 = / и д\ — д<± — д, получим, что формула B) верна для любой функции / G Soo.
§ 5. Преобразование Фурье в Ьг( —оо,оо) 457 2) Пусть теперь / — произвольная функция из 1/2 (—оо, оо), обра- обращающаяся в нуль вне некоторого интервала (—а, а). Тогда / инте- интегрируема на интервале (—а,а) (т.е. принадлежит Li(—a,a)), a сле- следовательно, и на всей прямой. Поэтому для нее определено преобра- преобразование Фурье д(Х)= I f(x)e-iXxdx. — ОО Пусть теперь {/п} — последовательность функций из S^, обра- обращающихся в нуль вне {—а, а) и сходящаяся по норме пространства 1/2(—оо, оо) к /. Поскольку / и все /п отличны от нуля лишь на ко- конечном интервале, последовательность {/п} сходится к / и по норме пространства Li(—оо, оо). Поэтому (см. п. 2 § 4) последовательность {дп} сходится к д равномерно на всей прямой. Кроме того, после- последовательность {дп} фундаментальна в Ьъ{—оо,оо). Действительно, дп — дт ? ^оо, поэтому в силу уже доказанного оо оо / \9n(X)-9mW\2dX = 2n f \fn(x)-fm(x)\2dx, — оо —оо откуда и следует фундаментальность последовательности {дп}- Зна- Значит, эта последовательность сходится в Z/2, причем к той же самой функции д, к которой она сходится равномерно. Поэтому в равен- равенстве n/nii2 = ^ы|2 можно перейти к пределу при п —> оо. Таким образом, получаем, что равенство B) справедливо для каждой / G 1/2, обращающейся в нуль вне некоторого интервала. 3) Пусть, наконец, / — произвольная функция из L^. Положим = i при 1Ж1 ^ N> 0 при |ж| > N. Ясно, что ||/-/лг||->0 при N -)> оо. Функция /дг принадлежит L\{—oo,oo), следовательно, для нее су- существует обычное преобразование Фурье. Оно равно оо N ) e-iXx dx = I f(x)e-iXx 9n(X)= ) fN(x)e-iXx dx = I f(x)e -оо -TV Поскольку в силу пункта 2) наших рассуждений
458 Гл. VIII. Ряды. Преобразования Фурье функции gjy сходятся в L^ к некоторому пределу, который мы обо- обозначим д. Поэтому в равенстве можно перейти к пределу при N —у оо, откуда получаем соотноше- соотношение B) для произвольной / Е L2(—00,00). Первая часть теоремы Планшереля доказана. Если теперь функция / принадлежит как L/2(—00,00), так и Li(—оо, 00), то для нее существует преобразование Фурье ОО д(Х) = J f(x)e~iXxdx, — ОО понимаемое в обычном смысле. При этом функции /дг сходятся к / в Li(—00,00) и, значит, их преобразования Фурье gjy сходятся к gf равномерно. Но, кроме того, как мы установили, функции д^ схо- сходятся в метрике 1/2(—оо, оо) к некоторому пределу, который мы обо- обозначили д. Отсюда следует, что gf совпадает с д. Доказательство закончено. Следствие. Из соотношения B) сразу вытекает, что для лю- любых /i, /2 Е I/2 (—00, 00) выполнено равенство оо оо / h(x)f2(x)dx = ± / gi(X)g2(X)d\. — ОО —ОО Для доказательства достаточно написать равенство B) для функ- функции Д + /2 и затем сравнить выражения справа и слева. Если равен- равенство B) означает сохранение нормы в L^ при преобразовании Фурье, то последнее равенство означает сохранение скалярного произве- произведения. 2. Функции Эрмита. Теорема Планшереля, изложенная в пре- предыдущем пункте, означает, что преобразование Фурье можно рас- рассматривать как ограниченный линейный оператор F, отображаю- отображающий пространство Z/2(—00,00) на себя. Если в этом пространстве выбрать какую-либо полную ортогональную нормированную систе- систему, то оператор F (как и любой другой линейный оператор) можно записать с помощью бесконечной матрицы. Вид этой матрицы зави- зависит, конечно, от выбора базиса. Проще всего матрица, отвечающая тому или иному оператору, выглядит в том случае, когда соответ- соответствующий базис состоит из собственных функций данного операто- оператора: в этом случае матрица имеет диагональную форму. Посмотрим,
§ 5. Преобразование Фурье в Ьг( —оо,оо) 459 существует ли такой базис для преобразования Фурье F1 Иначе го- говоря, посмотрим, какие функции из 1/2(—оо, оо) являются собствен- собственными для преобразования Фурье F1 Для этой цели заметим, что уравнение Ц - x2f = nf C) dx переводится преобразованием Фурье в такое же уравнение1) (по- (поскольку операция cP/dx2 переходит в умножение на —Л2, а умно- умножение на —х2 — в операцию d2/d\2). Поэтому естественно искать собственные функции оператора F как решения уравнения C). Бу- Будем искать решения этого уравнения, имеющие вид где w — многочлен. Подставив это выражение в C), получим для w уравнение w" - 2xw' = (fj, + l)w. Полагая w = a0 + a\x + V anxn, D) получаем равенство Ba2 + 3 • 2 • а%х + • • • + n(n — l)anxn~2) — - 2x(ai + 2a2x + • • • + nanxn~1) = = (fi + l)(ao + aix + h anxn). Сравнивая в нем коэффициенты при одинаковых степенях х слева и справа, находим, что -2пап = (fi + l)an, -2(га - l)an-i = (^ + !)ап-ь и т.д., вообще, к(к - 1)ак - 2(к - 2)ак-2 = (^ + l)afe_2. E) Поскольку мы считаем старший коэффициент ап отличным от нуля, должно быть /х = -Bга + 1) и an_i = О, т.е. [1 должно быть нечетным целым отрицательным числом. Все ко- коэффициенты многочлена w определяются соотношением E) с точно- точностью до постоянного множителя. При этом те коэффициенты, чет- четность индекса которых отлична от четности числа п, т. е. степени 1) Предполагается, конечно, что неизвестная функция / удовлетворяет соот- соответствующим условиям гладкости и убывания на бесконечности.
460 Гл. VIII. Ряды. Преобразования Фурье многочлена w, равны нулю. Наоборот, все коэффициенты с индек- индексами, имеющими ту же четность, что и п, отличны от нуля. Они находятся по рекуррентной формуле jfe(jfe-l) ак~2 = 2к-2п-4ак (если значение ап задано). Таким образом, мы получаем формулу для w: 2 n(n-l)(n-2)(n-3) п_4 \ _ п (тп п(п-1) 2 Итак, мы построили систему функций вида (рп(х) = wn(x)e~x2/2, n = 0,1, 2,... Ясно, что каждая из этих функций принадлежит L^—oo, оо) (благо- (благодаря наличию множителя е~х '2). Вдобавок, эти функции попарно ортогональны. Действительно, согласно C) имеем 4>п(х) - х2(рп(х) = -Bп (р'^(х) - x2ipm(x) = -Bm Умножив первое из этих равенств на ipm, а второе — на срп и вычитая из одного равенства другое, получаем ИЛИ УпЧ>т ~ <р'т<Рп]' = 2(Ш - П)(рп(рт. Если п т^ ш, то, интегрируя это равенство, получаем оо оо / <Рп(х)<Рт(х) dx = 2(m_ n) / [y?^m - <p'm<pn]'dx = — oo —oo Таким образом, ортогональность доказана. Каждый из элементов срп полученной ортогональной системы представляет собой многочлен степени п, умноженный на е~х I2. Следовательно, ее элементы должны, с точностью до числовых мно- множителей, совпадать с функциями Эрмита, которые мы построили в § 3 гл. VII ортогонализацией последовательности в пространстве 1/2(—оо, оо).
§ 6. Преобразование Лапласа 461 Покажем теперь, что функции {^п} являются собственными функциями преобразования Фурье: Fifn = cncpn. F) Это вытекает из следующих фактов. 1. Уравнение C) инвариантно относительно преобразования F. 2. Уравнение C) при каждом п имеет, с точностью до постоян- постоянного множителя, лишь одно решение вида Рп(х)е~х /2, где Рп — многочлен степени п. 3. Преобразование Фурье переводит хпе~х '2 в И-тИ е~х '2 = — Qn(x)e~x /2, где Q — многочлен степени п (последнее утвержде- утверждение легко проверяется по индукции). Из равенства F) следует, что при каждом целом к Fkipn = скпч>п. Но преобразование Фурье, примененное четырежды, переводит каж- каждую функцию в себя, умноженную на 4тг2. Поэтому с4 = 4тг2, т. е. сп может принимать лишь значения ± \/2тг и =Ьгл/2тг. Итак, преобразование Фурье F в пространстве L^—oo,oo) есть линейный оператор, который в базисе, состоящем из функций Эр- мита, записывается как диагональная матрица с элементами вида ±л/2тг и § 6. Преобразование Лапласа 1. Определение и основные свойства преобразования Ла- Лапласа. Применимость преобразования Фурье к дифференциаль- дифференциальным уравнениям существенно ограничивается тем, что это пре- преобразование определено лишь для функций, суммируемых на всей прямой. В частности, преобразование Фурье не существует для 1) Если преобразование Фурье определить формулой F[f] = -J= Г f(x)e~iXx dx V27r L (т.е. формулой A') § 4, а не формулой A)), то его четвертая степень будет единичным оператором, и в базисе, состоящем из функций Эрмита, мы получаем для F диагональную матрицу с элементами ±1 и ±г.
462 Гл. VIII. Ряды. Преобразования Фурье функций, растущих при х —у — оо или х —У +оо, а такие функ- функции нередко возникают при решении дифференциальных уравне- уравнений. Эту трудность можно преодолеть, распространив преобразо- преобразование Фурье на обобщенные функции; об этом пути мы скажем кратко в § 8 этой главы. Другой возможный подход, не выводящий за рамки классического понятия функции и классических методов анализа, состоит в замене преобразования Фурье так называемым преобразованием Лапласа. Пусть функция / (вообще говоря, не интегрируемая на всей пря- прямой) становится интегрируемой, если ее умножить на е~7Ж, где 7 — некоторое действительное число. Тогда интеграл ОО ОО g(s)= I f{x)e~isxdx = J f(x)e-iXxe^dx — ОО —(X) оказывается сходящимся для некоторых комплексных s = А + i/i, в частности, он сходится на прямой \± = —7. На этой прямой он служит преобразованием Фурье функции j[x)e~lx. Наиболее важный для приложений случай, в котором наши пред- предположения об интегрируемости функции f(x)e~7X выполнены, — это тот, когда / удовлетворяет следующим условиям: \f(x)\<Ce^x при ж ^ О, m /О) = 0 при х < 0 [ } Gо и С — постоянные). Интеграл оо оо g{s) = I f(x)e~isx dx= j f{x)e~isx dx B) — оо О существует при всех s = Л + i/i, таких, что \i < — 70 5 т-е- в полу- полуплоскости, ограниченной прямой Ims = —70, и представляет собой преобразование Фурье функции f(x)e^x. Эта последняя может быть получена из g с помощью формулы обращения (мы считаем, что / удовлетворяет условиям, при которых эта формула применима) оо f(x)e** = ± J g(s)eiX*d\, — ОО откуда . гд+оо /(*) = ^F / 9(s)et8Xds, s = \ + ifi. C) ill — 00 Поскольку функция f(x)e^x при \i < —70 убывает как экспонента (в силу A)), ее преобразование Фурье д, а значит, и g(s)etsx, есть функция, аналитическая в полуплоскости Ims < —70-
§ 6. Преобразование Лапласа 463 Сделаем теперь в формулах B) и C) замену переменных, поло- положив р = is и обозначив g(s) через Ф(р). Получим оо Ф(р)= | f(x)e-pxdx, B') о — д+гоо , —д+гоо /(Ж) = ^ / d>(p)e^f = ^ / Ф(р)е** dp. C') — ц — ioo — \i — гоо Функция Ф определена и аналитична в полуплоскости Rep > 70; она называется преобразованием Лапласа функции / (удовлетво- (удовлетворяющей условиям A)). Преобразование Лапласа по своим свойствам мало отличается от преобразования Фурье. Однако класс функций, для которых определено преобразование Лапласа, существенно отличен от клас- класса Li(—оо,оо) функций, для которых существует преобразование Фурье. 2. Применение преобразования Лапласа к решению диф- дифференциальных уравнений (операторный метод). Преобразо- Преобразование Лапласа можно применить для отыскания решений диффе- дифференциальных уравнений. Пусть дано линейное дифференциальное уравнение с постоянными коэффициентами у^+а1У{п-^ + --- + апу = Ъ{х), D) и пусть ищется его решение, удовлетворяющее начальным условиям 2/@) =2/о, 2/@) =2/ъ ¦¦-, 2/(n)(O)=2/n-i- E) Применим к уравнению D) преобразование Лапласа1), т.е. умно- умножим его на е~рх и проинтегрируем от 0 до оо. Пусть ОО Y(p) = I y(x)e~px dx о — преобразование Лапласа функции у. Интегрируя по частям, мы найдем преобразование Лапласа производной у'\ оо оо оо / у'(х)е-рх dx = у(х)е-рх +р f у{х)е~рх dx = pY(p) - у0. о ° о Применяя эту формулу последовательно, найдем (X) f y(n\x)e-px dx = о = p(pn~1Y{p) - уп-2 - РУп-3 РП~2Уо) - Уп-1 = п-1 = pnY(p) - уп_х - руп_2 р^уо = pnY(p) - J2 РП~1~кУк. к=0 1) Нетрудно показать законность его применения к уравнению D), если \Ь(х) растет не слишком быстро.
464 Гл. VIII. Ряды. Преобразования Фурье Пусть, наконец, ^ В(р) = I b(x)e~px dx. о В итоге преобразование Лапласа переводит дифференциальное уравнение D) (с учетом начальных условий E)) в алгебраическое уравнение Q(p) + R(p)Y(p) = В(р), где В — преобразование Лапласа функций 6, Q — многочлен от р степени п — 1, зависящий от коэффициентов уравнения и от началь- начальных данных. Наконец, п R = ^2an-kpk, а0 = 1, к=0 — характеристический многочлен уравнения D). Из полученного уравнения находим Y(o) - в(р) - Q(p) У W ~ R(p) ¦ Решение у получается отсюда по формуле обращения 2тгг У R(p) /i ioo — /i — ioo Этот интеграл обычно вычисляется с помощью вычетов. Для решения линейных дифференциальных уравнений с постоян- постоянными коэффициентами известен так называемый операторный метод. Он состоит в том, что в таком уравнении УМ + aiy<n-V + ¦ ¦ ¦ + any = Ъ(х) левая часть рассматривается как результат применения к неизвест- неизвестной функции у оператора а решение уравнения — как применение к его правой части урав- уравнения оператора, обратного к оператору F). Результат применения такого оператора к некоторым простейшим функциям — тригоно- тригонометрическим, показательным, степенным и их комбинациям — не- нетрудно найти с помощью непосредственных вычислений. Это дает возможность автоматически выписывать решение линейного урав- уравнения с постоянными коэффициентами, если его правая часть пред- представляет собой комбинации таких функций.
§ 7. Преобразование Фуръе-Стилтъеса 465 Ясно, что операторный метод можно истолковать как примене- применение в неявной форме преобразования Лапласа (устанавливающе- (устанавливающего определенное соответствие между алгеброй дифференциальных операторов вида F) и алгеброй многочленов), что как раз и можно рассматривать как обоснование этого метода, часто фигурирующего в технической литературе в виде некоторого «рецепта». § 7. Преобразование Фурье—Стилтьеса 1. Определение преобразования Фурье—Стилтьеса. Вер- Вернемся снова к преобразованию Фурье в пространстве L\{—оо, оо): оо д{\)= I e~iXxf{x)dx. — ОО Эту формулу можно переписать в виде интеграла Римана-Стил- тьеса оо д(Х)= } e-iXxdF(x), A) — ОО где F(x)= / f(t)dt B) — ОО — абсолютно непрерывная функция с ограниченным изменением ( ОО х на всей числовой оси (равным Г \f(x)\dx). Однако равенство A) оо имеет смысл не только для функций вида B), но и для любых функ- функций с ограниченным изменением на всей прямой. Интеграл оо д(Х)= J e-iXxdF(x), — оо где F — произвольная функция с ограниченным изменением на пря- прямой, мы будем называть преобразованием Фуръе-Стилтъеса функ- функции F. Для преобразования Фурье-Стилтьеса сохраняется ряд свойств, установленных нами ранее для обычного преобразования Фурье, например, следующее: функция д, определенная интегра- интегралом A), непрерывна и ограничена на всей прямой. Действительно, N I \e~i^ -e-i^\dF(x)+ I \e~iXlX -e-iX2X\dF(x). -N \x\>N
466 Гл. VIII. Ряды. Преобразования Фурье Второе слагаемое справа можно сделать сколь угодно малым (сра- (сразу при любых Ai и А2), взяв N достаточно большим, а первое при фиксированном N стремится к нулю при Ai — А2 —> 0. Однако не все свойства преобразования Фурье переносятся на преобразование Фурье-Стилтьеса. Так, оно не стремится, вообще говоря, к нулю при |А| —у оо. Пусть, например, 0 при х ^ О, 1 при х > 0. Тогда ^ g(X) = I e~iXx dF(x) = 1. —00 Аналогично, преобразование Фурье-Стилтьеса функции, равной О при х ^ хо и 1 при х > жо, есть е~гж°Л, т.е. периодическая функция от А. Если F — функция скачков, для которой точки п = 0, ±1, ±2, ... служат точками разрыва, а числа . . . , B_1, по, G-i, . . . , fln, . . . , У пп < 00, п — величинами скачков в этих точках, то оо j e~iXxdF{x) =^ane-inX — 00 n есть периодическая функция с периодом 2тт. Если же F имеет скачки ап в точках жп, образующих произвольную последовательность чи- чисел (вообще говоря, несоизмеримых), то ее преобразование Фурье- Стилтьеса имеет вид п Функции такого типа относятся к так называемым почти периоди- периодическим функциям. 2. Применения преобразования Фурье—Стилтьеса в тео- теории вероятностей. Для суммируемых на (—оо, оо) функций мы ввели в § 4 понятие свертки: оо f(x) = (/1 * /2)(х) = / h{x- 0/2@ <%. C) ОО Положим ж оо ж F(x)= f f(t)dt, F1(x)= f h(t)dt, F2(x)= f f2(t)dt.
§ 7. Преобразование Фуръе-Стилтъеса 467 Проинтегрировав равенство C), перепишем его следующим образом: X X ОО F(x)= I f(i)dt= I dt I fi(t-Z)MO<% = — oo —oo —oo OO , X { OO , X >. OO = I { I Mt-Odt}f2(Odt= J F1(x-OdF2(O — (X) —(X) (изменение порядка интегрирования здесь возможно в силу теоре- теоремы Фубини и абсолютной интегрируемости функции /). Полученное нами соотношение оо F(x)= f сопоставляет функциям F\ и F^ функцию F. Но интеграл, стоящий здесь справа, существует как интеграл Лебега—Стилтьеса не только для абсолютно непрерывных функций, но и для любых двух функ- функций с ограниченным изменением на всей прямой. Назовем выраже- ние F(x)= f F^x-OdF^), D) — (X) где F\ и F<z — произвольные функции с ограниченным изменением на прямой, сверткой этих двух функций и обозначим его F\ * F<i. Покажем, что выражение D) представляет собой функцию, опреде- определенную при всех значениях х и имеющую ограниченное изменение на всей прямой1). Действительно, F\ — функция с ограниченным изменением, сле- следовательно, она измерима по Борелю, а потому интеграл D) суще- существует при всех х. Далее, \F(xx)-F(x2)\ = откуда V[F] ^ т. e. F — функция с ограниченным изменением. 1)В книге В. И. Гливенко «Интеграл Стилтьеса» (Гостехиздат, 1936) дана элементарная конструкция, позволяющая придать смысл формуле D) без ис- использования меры.
468 Гл. VIII. Ряды. Преобразования Фурье Теорема 1. Если F есть свертка функций с ограниченным изменением F\ и F2, a g, g± и д2 — их преобразования Фурье- Стилтьеса, то Доказательство. Пусть F = F\ * F2 и а = жо,жь...,жп = Ъ — некоторое разбиение отрезка [а, Ь]. Тогда при каждом Л ь п Je-iXxdF(x)= lim ^e~iXi a maX Xk k=l fe~iXxdF(x)= f { f e~iXx dF1{ a —сю a—? Переходя здесь к пределу при а —>¦ —оо и 6—)- +оо, получаем оо оо оо I e~iXxdF(x)= I e-iXxdF!(x) f e~i4 dF2(g), — oo —oo —oo g(X) = gi(X)92(X). Теорема о том, что преобразование Фурье-Стилтьеса переводит свертку функций в умножение, широко используется в теории веро- вероятностей (метод характеристических функций). Если ? и г) — две независимые случайные величины, a F\ и F2 — их функции распределения, то величине ? + г\ отвечает функция рас- распределения F = Fi *F2. Необходимость рассматривать суммы независимых случайных слагаемых возникает в теории вероятностей очень часто. Переход от функций распределения к их преобразованиям Фурье-Стилтье- Фурье-Стилтьеса, — так называемым характеристическим функциям, — позволя- позволяет заменить операцию свертки более простой и удобной операцией умножения. Упражнения. 1. Доказать, что преобразование Фурье-Стилтьеса обладает свойством единственности: если функция F непрерывна сле- слева, а ее преобразование Фурье—Стилтьеса есть тождественный нуль, то F(x) = const. 2. Доказать, что операция свертки функций с ограниченным измене- изменением коммутативна и ассоциативна.
§ 8. Преобразование Фурье обобщенных функций 469 § 8. Преобразование Фурье обобщенных функций Мы уже говорили, что применение преобразования Фурье, пони- понимаемого в обычном смысле, в дифференциальных уравнениях и дру- других вопросах сильно ограничивается тем, что это преобразование определено лишь для функций, абсолютно интегрируемых на всей прямой. Применимость преобразования Фурье можно существенно расширить, введя понятие преобразования Фурье для обобщенных функций. Изложим основные идеи такого построения. Рассмотрим снова пространство Sqq функций, бесконечно диффе- дифференцируемых на всей прямой и убывающих на бесконечности вместе со своими производными быстрее, чем любая степень 1/\х\ (см. § 4, гл. IV). Приняв 5оо за пространство основных функций, рассмотрим соответствующее пространство обобщенных функций S^. Определим теперь в пространстве S^ преобразование Фурье. Для этого вспомним прежде всего, что пространство Sqq переводится пре- преобразованием Фурье (понимаемым в обычном смысле) в себя: если ф ? 5оо5 то F[ip] Е Sqo, причем F есть взаимно однозначное ото- отображение 5оо снова на все Sqq. Исходя из этого, введем следующее определение. Преобразованием Фурье обобщенной функции / Е S^ называется линейный функционал д Е S^, определяемый формулой (g,il>)=2n(f,(p), где ф = F[<p]. A) Эту формулу можно переписать и так: (FJ» = 2тг(./» = 2tt(/,F-V), т. е. преобразование Фурье функционала / Е S^ есть функционал, который на каждом элементе ф Е Soo принимает значение, равное (умноженному на 2тг) значению исходного функционала / на эле- элементе ер = Р~хф, где F~x — обратное преобразование Фурье. Поскольку ф = F[(f\ пробегает все Sqo, когда ip пробегает S^, равенство A) действительно определяет функционал на всем Sqq. Линейность и непрерывность этого функционала проверяются не- непосредственно . Среди элементов S^ содержатся все абсолютно интегрируемые функции. Для них только что сформулированное определение пре- преобразования Фурье совпадает с обычным. Действительно, если / ? Sqq, cp G Sqo, g = F[f] и ф = F[cp], то по теореме Планшереля получаем 2тг(,/» = («?,</>), B) причем при заданной / существует лишь одна, с точностью до экви- эквивалентности, функция д, удовлетворяющая этому равенству при
470 Гл. VIII. Ряды. Преобразования Фурье всех ip Е Sqq. С помощью соответствующего предельного перехо- перехода нетрудно показать, что равенство B) имеет место и для любой / Е I/i (—оо, оо). Таким образом, преобразование Фурье обобщенных функций представляет собой распределение классического преобра- преобразования на более широкий класс объектов. Примеры. 1. Пусть f(x) — с — const. Тогда ОО 2тг(/, if) = 2тг I ap(x) dx = 2тгсф@), ф = F[ip], — оо т. е. преобразование Фурье константы равно этой константе, умно- умноженной на 2тг и на й-функцию. 2. Пусть /(ж) = eiax. Тогда ОО 2тг(/, у?) = 2тг I е~гахф) dx = 2тг^(-а), — ОО т. е. преобразование Фурье функции ешх есть сдвинутая ^-функция 5(х + а), умноженная на 2тг. 3. Пусть /(ж) = х2. Тогда из равенства (X) ^"(Л) = - / ж2<^)е-аж da;, — ОО положив в нем Л = 0 и умножив его на 2тг, получаем т. е. преобразование Фурье функции х2 есть вторая производная от ^-функции, умноженная на —2тг. Сделаем несколько заключительных замечаний. Мы определили преобразование Фурье для обобщенных функций над 5оо. Но можно было бы взять и любое другое основное про- пространство, например, пространство К бесконечно дифференцируе- дифференцируемых финитных функций. Для каждой функции ср G К преобразова- преобразование Фурье (в обычном смысле) существует и, как можно проверить, представляет собой целую аналитическую функцию экспоненциаль- экспоненциального роста. Точнее говоря, преобразование Фурье есть линейный оператор, переводящий пространство К в пространство Z, элемента- элементами которого служат целые аналитические функции ф, для каждой из которых выполнены неравенства \з\"\ф(з)\^Сдеа^, д = 1,2,..., где т = Ims, aCg на — постоянные, зависящие от функции ф. По- Поскольку в пространстве К было введено понятие сходимости, ото- отображением F, переводящим К в Z, индуцируется некоторое понятие
8. Преобразование Фурье обобщенных функций 471 сходимости в Z: последовательность {фп} сходится в Z к ф, если соотношение срп —>¦ ср выполнено для соответствующих прообразов. Впрочем, это понятие сходимости нетрудно сформулировать и не пользуясь пространством К1). Пусть теперь / — произвольный элемент из К*. Поставим ему в соответствие линейный функционал д на Z, положив (д,ф) = где ф = Этот функционал д мы назовем преобразованием Фурье функциона- функционала /. Таким образом, преобразование Фурье обобщенной функции / над основным пространством К есть обобщенная функция над Z, т. е. над тем пространством, в которое К переводится преобразова- преобразованием Фурье, понимаемым в обычном смысле. То же самое построение проходит и для обобщенных функций над какими-либо иными пространствами основных функций. При этом каждый раз будет возникать схема, включающая в себя четы- четыре пространства: некоторое исходное пространство основных функ- функций, совокупность преобразований Фурье этих функций (т. е. второе пространство основных функций) и два сопряженных пространства. Пространство обобщенных функций Пространство преобразований Фурье обобщенных функций Пространство основных функций Пространство преобразований Фурье основных функций Эта схема сводится к двум пространствам, когда за основное про- пространство принимается S^, поскольку оно переводится преобразо- преобразованием Фурье само в себя. Понятие преобразования Фурье для обобщенных функций нашло широкое применение в теории дифференциальных уравнений с част- частными производными. Читатель может ознакомиться с этими вопро- вопросами, например, по книге Г. Е. Шилова [52]. 1) Именно, фп —>¦ 0 в Z, если при фиксированных Cq (q = 1, 2, ... ) выполняются неравенства qQiIi (<t\\ <? Г1 ра\т\ S Wn\S)\ <^ ^qC 1 и фп —>¦ 0 равномерно на каждом конечном интервале действительной оси.
ГЛАВА IX ЛИНЕЙНЫЕ ИНТЕГРАЛЬНЫЕ УРАВНЕНИЯ § 1. Основные определения. Некоторые задачи, приводящие к интегральным уравнениям 1. Типы интегральных уравнений. Интегральным уравнени- уравнением называется уравнение, которое содержит неизвестную функцию под знаком интеграла. Таково, например, уравнение ф) = /K(8,tMt)dt + f(a), A) а где / и К — известные функции, а ср — искомая. Переменные s и t пробегают здесь некоторый фиксированный отрезок [а, Ь]. Характерная особенность уравнения A) — его линейность: не- неизвестная функция if входит в него линейно. Ряд задач приводит и к нелинейным интегральным уравнениям, например, к уравнени- уравнениям вида <p(s) = fK(s,t)g(<p(t),t)dt, а где К и д — заданные функции. Мы, однако, во всем дальнейшем ограничимся линейными уравнениями. Отдельные интегральные уравнения рассматривались еще в на- начале девятнадцатого столетия. Так, еще в 1823 г. Абель рассмотрел уравнение носящее теперь его имя. Здесь / — заданная функция, a ip — иско- искомая. Абель показал, что решение этого уравнения имеет вид г /'(*) ^ Однако общая теория линейных интегральных уравнений была по- построена лишь на рубеже XIX и XX столетий, в основном в работах Вольтерра, Фредгольма и Гильберта.
§ 1. Основные определения 473 Уравнение A) называется уравнением Фредгольма второго рода (ср. п. 4 § 4 гл. II), а уравнение jK(s,tMt)dt = f(s) B) а (в котором неизвестная функция ср содержится только под знаком интеграла) — уравнением Фредгольма первого рода. Упомянутое выше уравнение Абеля относится к так называемым уравнениям Вольтерра; общий вид этих уравнений таков: JK(s,t)ip(t)dt = f(s) C) а (уравнение Вольтерра первого рода) или t + f(s) D) (уравнение Вольтерра второго рода). Ясно, что уравнение Воль- Вольтерра можно рассматривать как уравнение Фредгольма, в котором функция К удовлетворяет условию K(s,i) = 0 при t > s. Однако уравнения вольтеррова типа целесообразно выделить в осо- особый класс, поскольку они обладают рядом существенных свойств, отсутствующих у произвольных фредгольмовых уравнений. Если в уравнениях A), B) или C) функция / равна нулю, то такое уравнение называется однородным. В противном случае уравнение называется неоднородным. 2. Примеры задач, приводящих к интегральным уравне- уравнениям. В дальнейших параграфах этой главы мы рассмотрим основ- основные свойства линейных интегральных уравнений, но сначала мы опишем несколько задач, приводящих к таким уравнениям. 1. Равновесие нагруженной струны. Рассмотрим струну, т.е. уп- упругую материальную нить длины /, которая может свободно изги- изгибаться, но оказывает сопротивление растяжению, пропорциональ- пропорциональное величине этого растяжения. Пусть концы струны закреплены в точках х = 0 и х = I. Тогда в положении равновесия струна со- совпадает с отрезком оси ж, 0 ^ х ^ I. Предположим теперь, что в точке х = ? к струне приложена вертикальная сила Р = Р%. Под действием этой силы струна отклонится от положения равновесия и примет, очевидно, форму ломаной, изображенной на рис. 23.
474 Гл. IX. Линейные интегральные уравнения Рис. 23 Найдем величину S отклонения струны в точке ? под действием силы Р^, приложенной к этой точке. Если сила Р^ мала по срав- сравнению с натяжением ненагруженной струны То, то горизонтальную проекцию натяжения нагруженной струны можно по-прежнему счи- считать равной То. Тогда из условия равновесия струны получаем ра- равенство: х г |4 откуда Пусть теперь и{х) — прогиб струны в некоторой точке х под дей- действием силы Р^. Тогда ( ^ffi при 0 jrp- при ^ х ^ I. Из этих формул сразу видно, в частности, что G(x,?) = G(?,ж). Предположим теперь, что на струну действует сила, распределен- распределенная по ней непрерывно, с плотностью р(?). Если эта сила мала, то деформация зависит от силы линейно, а форма нагруженной струны описывается функцией и(х) = fG(x,ZMZ)dt. E) о Итак, если задана нагрузка, действующая на струну, то формула E) позволяет найти форму, которую примет струна под действием этой нагрузки. Рассмотрим теперь обратную задачу: найти то распределение на- нагрузки р, при котором струна примет заданную форму и. Мы полу- получили для нахождения функции р по заданной и уравнение, которое с точностью до обозначений есть уравнение B), т.е. интегральное уравнение Фредгольма первого рода. 2. Свободные и вынужденные колебания струны. Предположим теперь, что струна совершает какие-то колебания. Пусть u(x,t) —
§ 1. Основные определения 475 положение в момент t той точки струны, которая имеет абсциссу ж, и пусть р — линейная плотность струны1). На элемент струны дли- длины dx действует сила инерции, равная d2u{x,t) откУДа Подставив это выражение вместо р(?) в формулу E), мы получим JOP^§r1^. F) Предположим, что струна совершает гармонические колебания с не- некоторой фиксированной частотой и и амплитудой и(х), зависящей от х. Иначе говоря, пусть u(x,t) = u(x) smut. Подставив это выражение в F) и сократив обе части равенства на smut, получаем для и следующее интегральное уравнение: i и(х) = рол2 J G(x, 0u@ <*;• G) о Если струна совершает не свободные колебания, а вынужденные, под действием внешней силы, то, как показывает несложная вы- выкладка, соответствующее уравнение гармонических колебаний стру- струны будет иметь вид i и(х) = puJ2 Г G(x, 0u@ d?, + /(^), о т. е. будет неоднородным уравнением Фредгольма второго рода. 3. Сведение дифференциальных уравнений к интегральным. Ино- Иногда решение дифференциального уравнения целесообразно сводить к решению интегрального. Например, доказывая существование и единственность решения дифференциального уравнения У' = f(x,y) с начальным условием у(хо) = уо, мы видели (в гл. II), что его удобно свести к интегральному уравнению (нелинейному) х У = Уо+ f f(€,y)d?. Хо 1) Мы полагаем, что р = const, хотя это и несущественно для дальнейшего.
476 Гл. IX. Линейные интегральные уравнения Такое сведение возможно и для дифференциальных уравнений по- порядка выше первого. Рассмотрим, например, уравнение второго по- порядка У" + №)У = 0. Положив /(ж) = р2 — сг(х), где р = const, запишем его так: у" + р2у = а(х)у. (8) Как известно, решение уравнения У" + Р2У = 9(х) с начальными условиями у (а) = уо, у'{р) — Уо можно представить в виде у(х) = уо cos р(х - а) + ^ L + ^ / sin p(x - f )#(?) d^ Поэтому нахождение решения уравнения (8) с теми же начальными условиями сводится к решению интегрального уравнения \ = y0cosp(x - а) + § 2. Интегральные уравнения Фредгольма 1. Интегральный оператор Фредгольма. В этом параграфе мы будем рассматривать уравнения Фредгольма второго рода, т. е. уравнения вида ф) = fK(s,t)<p(t)dt + f(s). A) а Все встречающиеся здесь и ниже функции мы будем предполагать, вообще говоря, принимающими комплексные значения. Отно- Относительно функции К, называемой ядром этого уравнения, мы пред- предположим, что она измерима и принадлежит классу L^ на квадрате f f \K(s,t)\2dsdt <oo. B) а а Свободный член / уравнения A) — это некоторая заданная функ- функция из 1/2 [а, Ь], a ip — неизвестная функция из L^ [a, b]. Ядра класса Li называются ядрами Гильберта-Шмидта.
§ 2. Интегральные уравнения Фредгольма 477 Сопоставим уравнению A) оператор А, определяемый равенством Аср = ф; это означает, что f K(s,tMt)dt = <P(s). C) а Всякий оператор вида C) называется оператором Фредгольма. Если же ядро K(s,t) удовлетворяет условию B), то он называет- называется оператором Гильберта-Шмидта. Исследование уравнения A), разумеется, сводится к изучению свойств этого оператора. Теорема 1. Равенство C), где K(s,t) — функция с интегри- интегрируемым квадратом, определяет в пространстве L^ [a, b] компактный линейный оператор А, норма которого удовлетворяет неравенству \\A\\^Jff\K(s,t)\*dsdt. D) Ч a a Доказательство. Заметим прежде всего, что интеграл I \K{s,t)\2dt a существует в силу теоремы Фубини и условия B) для почти всех s. Иначе говоря, K(s,t) как функция от t при почти всех s принад- принадлежит 1/2[а,6]. Так как произведение функций с суммируемым ква- квадратом суммируемо, то интеграл, стоящий в C) справа, существует для почти всех s, т.е. функция ф определена почти всюду. Покажем, что ф G L2[cl, Ь]. В силу неравенства Коши—Буняковского для почти всех s имеем \ф(8)\2 = \f K(s,t)<p(t)dtf ^ f \K(s,t)\2dt f \ip(t)\2dt = a a a = \\<p\\2f\K(s,t)\2dt. a Интегрируя по s и заменяя повторный интеграл от \K(s,t)\2 двой- двойным, получим неравенство \\Aip\\2 = fms)\2ds ^ |М|2 / f\K(8,t)\2d8dt, a a a которое дает и интегрируемость |t/?(s)| , и оценку D) для нормы оператора А. Остается показать, что оператор А компактен. Пусть {Фп} — полная ортогональная система в Ьг[а, Ь]. Тогда всевозмож- всевозможные попарные произведения фт(з)фп(г) образуют полную систему
478 Гл. IX. Линейные интегральные уравнения в пространстве L2([a,b] х [а, Ь]) (см. теорему 1 п. 5 § 3 гл. VII) и, следовательно, ОО K(s t) ^ / a ib {.s\ib (t) m,n=l Положим теперь N KN(s,t) = V^ Q-mn^m(s)^n(t), т,п=1 и пусть An — оператор, определяемый ядром i^7v(s,t). Этот опе- оператор компактен, поскольку он переводит все Ьг[а, Ь] в конечно- конечномерное подпространство (в гл. IV мы назвали такие операторы конечномерными). Действительно, если ip Е Ьг[а, Ь], то ъ N ъ An^P = Г KN(sA)(p(t) dt = 7 amn^m(s) f (pityipnit) dt = a m,n=l a N N — / j rml J / ^ run nj где fc Ь„= f<p(t)il>n(t)dt, a т.е. каждый элемент cp G L2[a, Ь] переводится оператором An в эле- элемент конечномерного подпространства, порожденного векторами ^i,..., тД/у- Далее Kn(s, t) представляет собой частичную сумму ря- ряда Фурье функции K(s,t), поэтому ъ ъ J J (K(s,i) - KN(s,t)Jdsdt -»> 0 при N -»> оо. а а Отсюда, применив оценку D) к оператору А — An, имеем -»> 0 при N -»> оо. Воспользовавшись теоремой о том, что предел сходящейся после- последовательности компактных операторов компактен (п. 2 § б гл. IV), получаем компактность оператора А. Замечания. 1. В процессе доказательства теоремы 1 мы уста- установили, что всякий оператор Гильберта-Шмидта может быть пред- представлен как предел (в смысле сходимости по норме) последователь- последовательности конечномерных интегральных операторов.
§ 2. Интегральные уравнения Фредгольма 479 2. Пусть Ai иА2 —два оператора вида C) nKi(s,t), K2(s,t) —от- —отвечающие им ядра. Если операторы А\ и А2 равны, т.е. А\кр = А2(р для всех ip E L2[a,b], то Ki(s,t) = K2(s,t) почти всюду. Действи- Действительно, если ъ Aiip - А2(р = Г (K1(s,t) - K2(s,t))(p(t)dt = 0 а для всех ip E 1/2 [а, Ь], то при почти всех s E [а, Ь] ь I |ifiO,?) - K2(s,t)\2dt = 0 а и, значит, а а откуда и следует наше утверждение. Таким образом, если мы, как обычно, не будем различать эквивалентные между собой суммируе- суммируемые функции, то можно сказать, что соответствие между инте- интегральными операторами и ядрами взаимно однозначно. Теорема 2. Пусть А — оператор Гпльберта-Шмпдта, опреде- определяемый ядром K(s,t). Тогда сопряженный ему оператор А* опреде- определяется «сопряженным» ядром K(s,t). Доказательство. Используя теорему Фубини, получаем (Af,g) = f{fK(s,t)f(t)dt}g(S)dS = f f K(s,t)f(t)g(s) dtds = a a a a = / { / K(s, t)g(s) ds}f(t) dt= f f(t){ I K(s, t)g(s) ds}dt = a a a a = (f,A*g), откуда и следует утверждение теоремы. В частности, оператор А вида C) самосопряжен в L2[a,b], т.е. А* = А, тогда и только тогда, когда K(s,t) = K(t,s). В случае, когда рассматривается действительное гильбертово пространство (и, ста- стало быть, действительные ядра), условием самосопряженности слу- служит равенство K(s,t) = K(t,s). Замечание. Мы рассмотрели интегральные операторы, дей- действующие в пространстве L2[a,b]. Однако как все сказанное вы- выше, так и излагаемые ниже результаты переносятся без изменений на тот случай, когда вместо отрезка [а, Ь] берется любое другое про- пространство с мерой.
480 Гл. IX. Линейные интегральные уравнения 2. Уравнения с симметрическим ядром. Рассмотрим инте- интегральное уравнение Фредгольма второго рода f(a), E) словиям 1) I I \K(s,t)\2dsdt < оо, ядро которого удовлетворяет условиям ъ ъ \2 2) K(s,t) =K(t,s). Мы будем называть такие уравнения уравнениями с симметриче- симметрическим ядром. В силу теорем 1 и 2 предыдущего пункта соответствую- соответствующий оператор Фредгольма ь Aip= f K(s,t)tp(t)dt F) а компактен и самосопряжен. Следовательно, для него справедлива теорема Гильберта-Шмидта (п. 5 § б гл. IV). Применим эту теорему для отыскания решений уравнения E). Поскольку для нас имеют значение лишь компактность и самосопряженность оператора F), а не его интегральное представление, естественно писать уравне- уравнение E) в символической форме: <P = A<p + f. G) По теореме Гильберта-Шмидта для А существует такая ортонор- мальная система собственных функций {фп}^ отвечающих ненуле- ненулевым собственным значениям {Ап}, что каждый элемент ? из L^ пред- представим в виде ^>n + f, где А?' = 0. п Положим / = 5>Л + /', Af = O, (8) п и будем искать решение ср уравнения G) в виде <p = '52xnipn + (pl, V = 0. (9) п Подставив разложения (8) и (9) в уравнение G), получим
§ 2. Интегральные уравнения Фредгольма 481 Это равенство удовлетворяется в том и только том случае, когда /' = ?>', ХпО- ~ К) = Ъп, п = 1,2,..., т. е. когда /' = ?>', ж„ = -—\- при Л„ ф 1, 6П = 0 при Лп = 1. Последнее равенство дает необходимое и достаточное условие раз- разрешимости уравнения G). Координаты хп, отвечающие тем п, для которых Лп = 1, при этом произвольны. Мы получаем, таким обра- образом, следующий результат. Теорема 3. Если 1 не является собственным значением опе- оператора А, то уравнение G) при любом f имеет одно и только од- одно решение. Если же 1 есть собственное значение оператора А, то уравнение G) разрешимо в том и только том случае, когда свобод- свободный член f ортогонален всем собственным функциям оператора А, отвечающим собственному значению 1. Если это последнее условие выполнено, то уравнение G) имеет бесконечное множество решений. 3. Теоремы Фредгольма. Случай вырожденных ядер. Мы перейдем теперь к рассмотрению уравнений Фредгольма второго ро- рода с ядрами, подчиненными условию f f \K(s,t)\2dsdt <oo a a (обеспечивающему компактность оператора), но без условия сим- симметрии. Предположим сначала, что рассматривается уравнение t + f(s), A0) ядро которого — вырожденное, т. е. имеет вид п K(s,t) = Y,Pi(s)Qi(t), (И) 1=1 где Pi,Qi — функции из L^. Оператор с ядром вида A1) переводит всякую функцию if G 1/2 в сумму i=l
482 Гл. IX. Линейные интегральные уравнения т.е. в элемент конечномерного подпространства, порожденного функциями Pi [г = 1,... ,п). Заметим, что в выражении A1) функ- функции Pi,..., Рп можно считать линейно независимыми между собой. Действительно, если это не так, то, представив каждую из функций Pi как линейную комбинацию независимых, мы получим, что то же самое ядро K(s,t) можно записать в виде суммы меньшего числа слагаемых вида Pj(s)Qj(t), так что функции Р 3 линейно независи- независимы. Аналогичную редукцию можно проделать для функций Qj. Как легко видеть, после этих редукций получится ядро, в котором и Pj, и Qi будут между собой линейно независимы. Итак, будем решать уравнение A0) с вырожденным ядром A1), в котором функции Pi,..., Рп (так же, как и Qi,..., Qn) линейно независимы. Подставив в уравнение A0) вместо K(s,t) соответст- соответствующую сумму, получим ф) = Y, pi(s) I QittMt) dt + /(*). A2) г=1 а Введя обозначения ь fQi(t)<p(t)dt = qi, а перепишем уравнение A2) в виде Подставив это выражение для ср в уравнение A0), получим Y, I [? ] ). A3) i=l a j=l Положив b b f Qi(t)Pj(t) dt = aij, f Qi(t)f(t) dt = bu a a запишем равенство A3) так: n [E a Функции Pj, по предположению, линейно независимы, поэтому от- отсюда следует равенство соответствующих коэффициентов: п ijqj + bij i = l,...,n. A4)
§ 2. Интегральные уравнения Фредгольма 483 Мы получили для коэффициентов qi систему линейных уравнений. Решив ее, мы найдем функцию Эта функция удовлетворяет интегральному уравнению A0), по- поскольку все выкладки, с помощью которых мы пришли от урав- уравнения A0) к системе A4), можно проделать в обратном порядке. Итак, решение интегрального уравнения с вырожденным ядром сводится к решению соответствующей ему системы A4) линей- линейных алгебраических уравнений. Для систем линейных уравнений хорошо известны условия суще- существования и единственности решений. I. Система линейных алгебраических уравнений л. X —— ZI л. —— Wci'kW X —— \Хл X ) U —— \1J~\ ZI ) разрешима в том и только том случае, когда вектор у ортогонален каждому решению сопряженной однородной системы ЛТ1* ГЛ ЛТ1* II 1| П. Если детерминант матрицы Т отличен от нуля, то уравнение Тх = у имеет при любом у одно и только одно решение. Если же де- детерминант матрицы Т равен нулю, то однородное уравнение Тх = 0 имеет ненулевые решения. III. Поскольку матрица Т и сопряженная матрица Т* имеют один и тот же ранг, однородные системы Тх = 0 и T*z = 0 имеют одно и то же число линейно независимых решений. В силу той связи, которая, как мы выяснили, существует между интегральными уравнениями с вырожденными ядрами и система- системами линейных алгебраических уравнений, эти утверждения можно рассматривать как теоремы, относящиеся к решениям вырожден- вырожденных интегральных уравнений. Мы покажем в следующем пункте, что, по существу, эти же теоремы имеют место и для уравнений с произвольными (не обязательно вырожденными) ядрами. Однако, поскольку для невырожденных интегральных операторов такие понятия, как ранг матрицы и детерминант не имеют смысла, соответствующие теоремы нужно будет сформулировать так, чтобы эти понятия в них не участвовали. 4. Теоремы Фредгольма для уравнений с произвольными ядрами. Будем снова рассматривать уравнение ъ ip(s) = I K(s, t)<p(t) dt + /(s), A5)
484 Гл. IX. Линейные интегральные уравнения но теперь на его ядро будем накладывать лишь условие Гильберта- Шмидта ь ъ I I \K(s,t)\2dsdt < оо а а (обеспечивающее компактность оператора), но не будем это ядро предполагать ни вырожденным, ни симметрическим. Нас будут ин- интересовать условия разрешимости уравнения A5) и свойства его ре- решений. При этом существенным для нас будет лишь свойство ком- компактности оператора, отвечающего уравнению A5), а не его инте- интегральное представление. Поэтому мы будем все дальнейшие рас- рассмотрения вести для операторного уравнения <p = A<p + f, A6) считая, что А — произвольный компактный оператор, заданный в гильбертовом пространстве Н. Положив Т = I — А (где / — единичный оператор), перепишем уравнение A6) в виде 2V = /. A7) Будем наряду с этим уравнением рассматривать однородное урав- уравнение 7>о = 0 A8) и сопряженные уравнения T*ip = g, A9) Т*ф0 = 0 B0) (Т* = I — А*). Связь между свойствами решений этих четырех урав- уравнений устанавливается следующими теоремами Фредгольма. I. Неоднородное уравнение Тер = / разрешимо при тех и толь- только тех f, которые ортогональны каждому решению сопряженного однородного уравнения Т*фо = 0. II {Альтернатива Фредгольма.) Либо уравнение Тер = / имеет при любом / G Н одно и только одно решение, либо однородное уравнение Тсро = 0 имеет ненулевое решение. III. Однородные уравнения A8) и B0) имеют одно и то же, и притом конечное, число линейно независимых решений. Прежде чем приступать к доказательству этих теорем, заметим, что они справедливы (в силу сказанного в п. 2) для уравнений с сим- симметрическим ядром. При этом в силу совпадения А и А* теорема III становится тривиальной. С другой стороны, если А — вырожденный интегральный опера- оператор, то соответствующие уравнения сводятся, как мы видели выше,
§ 2. Интегральные уравнения Фредгольма 485 к системам линейных алгебраических уравнений; при этом теоремы Фредгольма автоматически переходят в теоремы о линейных систе- системах, приведенные в предыдущем пункте. Поскольку всякий компактный оператор есть предел сходящейся последовательности вырожденных, т.е. конечномерных, операторов, мы могли бы доказать теоремы Фредгольма с помощью соответст- соответствующего предельного перехода (от вырожденных ядер к невыро- невырожденным). Мы, однако, пойдем по другому пути и дадим доказа- доказательство этих теорем, не связанное с рассмотрением вырожденных уравнений. Доказательство теорем Фредгольма. Напомним, что Кег В есть совокупность нулей линейного непрерывного операто- оператора В (т.е. множество всех тех х Е Н, для которых Вх = 0), a Im В — область значений оператора В, т. е. совокупность векторов вида у = Вх. Ясно, что Кег В всегда есть замкнутое линейное под- подпространство. Множество Im В также представляет собой линейное многообразие, однако, вообще говоря, не замкнутое. Мы сейчас по- покажем, что для оператора Т = I—A, где А — комплексный оператор, замкнутость соответствующего многообразия имеет место. Лемма 1. Многообразие Im T замкнуто. Доказательство. Пусть уп Е ImT и уп —У у. По предположе- предположению существуют такие векторы xn E Я, что Уп — -L %п — %п Л-Хп. \^*-) Мы можем считать, что векторы хп ортогональны к КегТ, вычи- вычитая, если необходимо, из хп его проекцию на КегТ. Далее, мож- можно считать, что ||жп|| ограничены в совокупности. Действительно, в противном случае, переходя к подпоследовательности, мы бы име- имели ||жп|| —у оо и, разделив на \\хп\\, получили бы из B1), что ,,Хпи — А,,Хп,, —у 0. Но так как оператор А компактен, то, снова |Fn|| \\Хп\\ переходя к подпоследовательности, можно считать последователь- последовательность \ А,, х м \ сходящейся. Поэтому и uXnu будет сходиться, ска- I \\Xn\\ J \\хп\\ жем, к вектору z G Н. Ясно, что ||;z|| = 1 и Tz = 0, т. е. z G КегТ. Однако мы считаем векторы хп ортогональными к КегТ и, следова- следовательно, вектор z обязан быть ортогональным к КегТ. Полученное противоречие и позволяет считать, что ||жп|| ограничены в совокуп- совокупности. Вместе с тем в этом случае последовательность {Ажп} можно считать сходящейся, а тогда, как это следует из B1), будет сходя- сходящейся и последовательность {хп}. Если через х обозначить предел этой последовательности, то из B1) следует, что у = Тх. Лемма доказана.
486 Гл. IX. Линейные интегральные уравнения Лемма 2. Пространство Н является прямой ортогональной суммой замкнутых подпространств КегТ и ImT*, т.е. КегТ 0 ImT* = Я, B2) и аналогично, КегТ* 0 ImT = Я. B3) Доказательство. Мы уже знаем, что оба подпространства, фигурирующие в левой части равенства B2), замкнуты. Кроме то- того, они ортогональны, поскольку если h Е КегТ, то (h,T*x) = = (T/i, х) = 0 для всех х Е Я. Остается доказать, что никакой нену- ненулевой вектор не может быть одновременно ортогональным к КегТ и Im Т*. Но если вектор z ортогонален к Im Т*, то для любого х Е Я имеем (Tz,x) = (z,T*x) = 0, т. е. z Е КегТ. Равенство B3) доказы- доказывается аналогично. Лемма доказана. Из леммы 2 сразу вытекает первая теорема Фредгольма. Дей- Действительно, / _L КегТ* в том и только том случае, если / Е ImT, т.е. если существует такое ср, что Тер = /. Далее, для каждого целого к положим Нк = Im(Tfe), так что, в частности, Я1 = ImT. Ясно, что подпространства Нк образуют цепочку вложенных подпространств, HDH1 DH2 э ..., B4) а в силу леммы 1 все эти подпространства замкнуты. При этом Т{Нк) = Нк+1. Лемма 3. Существует такое f, что Hk+1 = Hk при всех k ^ j. Доказательство. Если такого j не существует, то, очевидно, все Нк различны. В этом случае можно построить такую ортонор- мированную последовательность {ж/.}, что х^ G Нк и ортогонально Нк+1. Пусть / > к. Тогда Ах\ - Ахк = -хк + (xi + Тхк - Тх{) и, следовательно, \\АХ1 — АХк\\ ^ 1, так как х\ + Тхк — Тх\ G Hk+1. Поэтому из последовательности {Аж&} нельзя выбрать сходящей- сходящейся подпоследовательности, что, однако, противоречит компактности оператора А. Тем самым лемма доказана. Лемма 4. Если КегТ = {0}, то ImT = Н. Доказательство. Если КегТ = {0}, то оператор Т взаим- взаимно однозначен и, следовательно, если при этом ImT ф Н, то це- цепочка B4) состоит из различных подпространств, а это противо- противоречит лемме 3. Поэтому ImT = Н. Аналогично, ImT* = Я, если КегТ* = {0}.
§ 2. Интегральные уравнения Фредгольма 487 Лемма 5. Если ImT = Н, то КегГ = {0}. Доказательство. Так как ImT = Н, то, по лемме 2, КегТ* = {0}, но тогда, по лемме 4, ImT* = Н и, следовательно, по лемме 2, КегТ = {0}. Совокупность лемм 4 и 5 и составляет содержание второй теоре- теоремы (альтернативы) Фредгольма. Тем самым эта теорема доказана. Докажем, наконец, третью теорему Фредгольма. Предположим, что подпространство КегТ бесконечномерно. То- Тогда в этом подпространстве найдется бесконечная ортонормирован- ная система {ж/.}. При этом Axk = ж/, и, следовательно, при к ф I имеем \\Axk — Axi\\ = у/2. Но тогда из последовательности {Аж/.} нельзя выбрать сходящейся подпоследовательности, что противоре- противоречит компактности оператора А. Пусть теперь \i — размерность КегТ иг/ — размерность КегТ*. Предположим, что \± < v. Пусть {<^i,..., (р^} — ортонормированный базис в КегТ и {^i,... ,фи} — ортонормированный базис в КегТ*. Положим ^ Sx = Tx + ^2( Так как оператор S получается из оператора Т прибавлением конечномерного оператора, то все результаты, доказанные выше для оператора Т, остаются верными и для оператора S. Покажем, что уравнение Sx = 0 имеет только тривиальное реше- решение. Действительно, допустим, что /1 Ггг + ^(гг,^)^=О. B5) Так как векторы г/jj в силу леммы 2 ортогональны ко всем векторам вида Тж, то из B5) следует, что (x,(pj) = 0 при 1 ^ j ^ II. Поэтому, с одной стороны, вектор х должен быть линейной комби- комбинацией векторов ipj, ас другой, — ортогонален им. Следовательно, х = 0. Итак, уравнение Sx = 0 имеет только тривиальное решение. Но тогда по второй теореме существует такой вектор у, что
Гл. IX. Линейные интегральные уравнения Умножив это равенство скалярно на Vv+ь мы получим справа 1, а слева 0, поскольку Ту е ImT, a ImT_LKerT*. Это противоречие возникло из предположения \i < v. Поэтому \i ^ v. Заменяя теперь оператор Т на Г*, мы получим \i ^ v и, следовательно, \i — v. Теорема III доказана полностью. Замечания. 1. В теоремах Фредгольма по существу речь идет об обратимости оператора A — I и эти теоремы означают, что Л = 1 — или регулярная точка для А, или собственное значение конечной кратности. Разумеется, все, что утверждается в этих теоремах, оста- остается справедливым и для операторов А — А/, если А / 0. Поэто- Поэтому всякая отличная от 0 точка спектра компактного оператора является его собственным значением конечной кратности. Кроме того, мы знаем, что множество таких собственных значений не бо- более чем счетно. Ввиду следствия к теореме 2 в п. 2 § б гл. IV нуль всегда принадлежит спектру компактного оператора в бесконеч- бесконечномерном пространстве, но не обязан, вообще говоря, быть собствен- собственным значением. Компактные операторы, для которых 0 служит единственной точкой спектра, называются (абстрактными) опера- операторами Вольтерра. 2. Мы доказали теоремы Фредгольма для уравнения вида ср = = Aip + /, где А — компактный оператор в гильбертовом простран- пространстве. Эти теоремы могут быть перенесены без существенных измене- изменений и на случай произвольного банахова пространства Е. При этом, разумеется, сопряженное уравнение ф = А*ф + д будет уравнени- уравнением в пространстве Е*, условие ортогональности (/,фо) = 0 нуж- нужно понимать как обращение в нуль на элементе / Е Е каждого функционала из подпространства КегТ* С Е* решений уравнения Т*фо = 0 и т. д. Изложение теорем Фредгольма для уравнений в ба- банаховом пространстве содержится, например, в книге JI. А. Люстер- ника и В. И. Соболева «Элементы функционального анализа». 5. Уравнения Вольтерра. Уравнением Вольтерра (второго ро- рода) называется интегральное уравнение ф) = fK(s,t)<p(t)dt + f(s), B6) а где K(s,t) — ограниченная измеримая функция: |if(s,?)| ^ M. По- Поскольку это уравнение можно рассматривать как частный случай уравнения Фредгольма (с ядром, равным нулю при t > s), теоремы Фредгольма справедливы и для уравнения B6). Однако для урав- уравнений Вольтерра эти теоремы можно уточнить следующим образом. Уравнение Вольтерра B6) при любой функции / G Ь2 имеет одно и только одно решение.
§ 2. Интегральные уравнения Фредгольма 489 Действительно, дословно повторяя рассуждения п. 4 § 4 гл. II, мы видим, что некоторая степень оператора s А(р= I K(s,t)(p(t)dt а является сжимающим оператором и, следовательно, однородное уравнение имеет единственное (тривиальное) решение. В силу тео- теорем Фредгольма отсюда и следует наше утверждение. Упражнение. Пусть на отрезке задано интегральное уравнение Фредгольма второго рода с непрерывным ядром. Доказать для такого уравнения теоремы Фредгольма в пространстве непрерывных функций. При этом роль «сопряженного уравнения» играет интегральное уравне- уравнение с транспонированным ядром, а ортогональность понимается в смы- смысле L2. 6. Интегральные уравнения первого рода. Абстрактным уравнением Фредгольма первого рода называется уравнение вида А<р = /, B7) т. е. уравнение, содержащее неизвестную функцию ср лишь под зна- знаком компактного оператора. Решение такого уравнения представляет собой задачу, вообще го- говоря, более сложную, чем решение уравнения второго рода, и урав- уравнение B7) не может иметь решения при любой правой части. Рассмотрим вначале в качестве простейшего примера уравнение f(s)= f<p(t)dt, а т. е. уравнение с ядром K(s,t) = < [ 0 при t > s. Оно имеет очевидное решение cp(s) = f'(s), если / абсолютно не- непрерывна и ее производная принадлежит Z/2, и оно неразрешимо в противном случае. Покажем, что и в общем случае уравнение B7) не может быть разрешимо при произвольном / Е Н. Действительно, существование решения уравнения Аср = / при любом / G Н означало бы, что этот оператор отображает Н снова на все Н. Покажем, что это невозмож- невозможно. Все Н можно представить как сумму счетного числа шаров Sn (например, шаров радиуса 1,...,п,... с центром в нуле). Каждый из них переводится компактным оператором А в предкомпактное множество. Таким образом, замыкание Im А есть сумма счетного
490 Гл. IX. Линейные интегральные уравнения числа компактов. Но в Н любой компакт нигде не плотен; в то же время Н, как и любое полное метрическое пространство, не может быть представлено как сумма счетного числа нигде не плотных мно- множеств. Таким образом, 1т А ф Н; иными словами, каков бы ни был компактный оператор А в Н, уравнение Акр = f не может быть разрешимо при всех / G Н. Другой существенный момент состоит в том, что оператор, обрат- обратный компактному, не ограничен. Поэтому, если /i и /2 — два близ- близких между собой элемента из Н и оба уравнения А<рх = /1, Аср2 = /2 разрешимы, то соответствующие решения cpi = А~х Д и ср2 = А~х f2 могут сильно отличаться друг от друга. Иначе говоря, сколь угод- угодно малая погрешность в свободном члене уравнения может привести к сколь угодно большой ошибке в решении. Задачи, в которых малое изменение исходных данных приводит к малому изменению решения (эта «малость» может в разных задачах пониматься по-разному), называются корректными. Решение интегрального уравнения пер- первого рода (в отличие от уравнения второго рода) — некорректная задача. За последнее время разного рода некорректные задачи и ме- методы их регуляризации (т. е. сведения их к задачам, в том или ином смысле корректным) получили широкое развитие. Однако изложе- изложение этих вопросов выходит за рамки данной книги. § 3. Интегральные уравнения, содержащие параметр. Метод Фредгольма 1. Спектр компактного оператора в Н. Будем рассматривать уравнение XA /, или, иначе, (/ - \A)v = /, A) где А — компактный оператор в гильбертовом пространстве Н, а Л — числовой параметр. В силу альтернативы Фредгольма возможны два и только два взаимоисключающих случая: 1. Уравнение A) имеет при данном Л одно и только одно решение для каждого / G Н. 2. Однородное уравнение ср = ХАср имеет ненулевое решение.
§ 3. Интегральные уравнения, содержащие параметр 491 В первом случае оператор / — ХА отображает, и притом взаимно однозначно, Н на всё Н. Отсюда следует существование ограничен- ограниченного обратного оператора (/ — ХА)~1. Это равносильно тому, что оператор ( А — -г-/) определен на всем Н и ограничен; иначе гово- говоря, в этом случае 1/Л не принадлежит спектру оператора А. Пусть теперь имеет место вторая возможность, т. е. существует такой отличный от нуля элемент ip\ Е Н, что или Асрх = j тогда 1/Л есть собственное значение оператора А. Мы получаем следующий результат: каждое отличное от нуля число \i — 1/Л является собственным значением компактного опе- оператора А либо регулярно. Иными словами, у компактного оператора непрерывный спектр либо совсем отсутствует, либо состоит из одной точки \i — 0. Объединив только что сказанное с теоремой 4 § б гл. IV, мы по- получаем следующее описание спектра компактного оператора в Н. Спектр любого компактного оператора А в Н состоит из конеч- конечного или счетного числа отличных от нуля собственных значений /ii,..., /in,..., каждое из которых имеет конечную кратность, и точ- точки нуль.г) Точка нуль — единственная возможная предельная точ- точка для последовательности {/in}- Сама точка \± = 0 может быть собственным значением конечной или бесконечной кратности, а мо- может и не быть точкой множества собственных значений. Как было показано в п. 5 § 2 для уравнения if = XBip + /, где В — интегральный оператор вольтеррова типа, всегда имеет место первый случай альтернативы Фредгольма (разрешимость при любом / G 1/2). Иначе говоря, спектр интегрального оператора ти- типа Вольтерра состоит из одной точки \i — 0. Вместе с тем в конце п. 4 § 2 мы назвали абстрактным оператором Вольтерра компактный оператор, спектр которого сводится к точке 0. Поэтому можно ска- сказать, что интегральный оператор Вольтерра является и абстракт- абстрактным оператором Вольтерра, и вся эта терминология оказывается оправданной. 2. Отыскание решения в виде ряда по степеням Л. Детер- Детерминанты Фредгольма. Формально решение уравнения 1) /j, = 0 обязательно принадлежит спектру А, поскольку А 1 не может быть ограничен в бесконечномерном Н (см. следствие к теореме 2 в п. 2 § 6 гл. IV).
492 Гл. IX. Линейные интегральные уравнения можно записать в виде 1/. B) Эта формула действительно определяет решение, если \\XA\\ < 1, т.е. |А| < тгттм поскольку в этом случае оператор (/ — ХА)~1 суще- существует, определен на всем Н и ограничен (см. п. 7 § 5 гл. IV). При этом оператор (/ — ХА)-1 можно представить как сумму степенного ряда (/ - ХА)-1 = / + ХА + Х2А2 + • • • + ХпАп + ..., сходимость которого (по норме) обеспечивается условием |А| < < 1/ЦАЦ. Следовательно, решение B) нашего уравнения A) можно записать так: V = / + XAf + A2 A2f + • • • + XnAnf + ... C) Этот же результат получится, если искать решение уравнения A) в виде степенного ряда ifx = <Л) + А + • • • + Xnifn + ... (где ipn от А уже не зависят). Подставив этот ряд вместо ср в правую и левую части уравнения ip = ХАср + / и приравняв затем коэффи- коэффициенты при одинаковых степенях А в обеих частях равенства, мы получим <Ро = f, <fi=Af, ..., ipn = Aifn-i = Anf, т.е. ряд (З). Покажем, что если А — интегральный оператор Гильберта- Шмидта, т. е. оператор, определяемый квадратично интегрируемым ядром K(s,t), то оператор (/ — ХА)~г при достаточно малых значе- значениях А может быть записан как сумма / + АГ(А) единичного опе- оператора / и некоторого интегрального оператора АГ(А) Гильберта- Шмидта с квадратично интегрируемым ядром, зависящим от па- параметра А. Выясним сначала, каким образом записываются ядра операторов А2,А3 и т.д. Рассмотрим для этого более общий вопрос: пусть даны два интегральных оператора ъ ъ А(р= I K(s, t)ip(t) dt, Bip= I Q(s, t)ip(t) dt, где b b b b I I \K(s,t)\2dsdt = k2 < oo, If \Q(s,t)\2dsdt = q2 < oo.
§ 3. Интегральные уравнения, содержащие параметр 493 Найдем ядро оператора АВ. Имеем Ь Г Ь Л = I \K(s, и) I Q(u, t)if(t) dt\ du = a a b , b ^ = f\f K(s, u)Q(u, t) du\ip[t) dt. a a Возможность изменения здесь порядка интегрирования вытекает из теоремы Фубини, поскольку подынтегральная функция K(s,u)Q(u,t)<p(t) суммируема по совокупности переменных и и t как произведение двух функций K(s,u)<p(t) и Q(u,t), квадрат каждой из которых суммируем. Положим b R(s, t)= I K(s, u)Q(u, t) du; D) a а в силу неравенства Коши-Буняковского имеем ъ ъ \R(s,t)\2 <: f \K(s,u)\2du f \Q(u,t)\2du, a a откуда b b \R(s,t)\2dsdt^k2q2. Итак, произведение двух интегральных операторов типа Гильберта- Шмидта есть оператор того же типа, с ядром, определяемым фор- формулой D). В частности, положив А = В, получаем, что А2 есть интегральный оператор с ядром ъ K2(s,t) = [ K(s,u)K(u,t)du, а которое удовлетворяет условию I I \K2(s,t)\2dsdt ^ [/ / \K(s,t)\2dsdt\2 = к4, а а а а откуда Щ2|| ^ к2, где ъ ъ к2 = I I \K(s,t)\2dsdt. а а Аналогично получаем, что каждый из операторов Ап определя- определяется ядром ъ Kn(s,t) = I Kn-i(s,u)K(u,t) du, n = 2,3,...,
494 Гл. IX. Линейные интегральные уравнения удовлетворяющим условию \Kn{s,t)\2dsdt^k2n. E) Ядра Kn(s,i) называются итерированными ядрами. При |А| < 1/к ряд K(s, t) + XK2(s, ?) + ••• + \n-lKn(s, t) + ... сходится в силу оценки E) в пространстве L2([a,b] x [a, b]) к неко- некоторой функции Г(з,?;А), квадрат которой суммируем по s и t при каждом |А| < 1/к. Интегральный оператор Г(А), для которого функ- функция Г(з,?; А) служит ядром, есть сумма сходящегося ряда А + АА2 + ... + Ап-1Ап + ... F) компактных операторов и, следовательно, он компактен. Домножив эту сумму на А и прибавив к ней единичный оператор /, мы и получим оператор (/ — ХА)~1. Итак, действительно, при |А| < 1/к оператор (/ — ХА)~1 есть сумма единичного оператора / и компактного оператора АГ(А) с ядром ОО XT(s,t;\) = ^2\nKn(s,t). 71=1 Условие |А| < 1/к достаточно для сходимости ряда F), но вовсе не необходимо. В некоторых случаях этот ряд может оказаться схо- сходящимся даже при всех значениях А. Например, если А — оператор вольтеррова типа с ядром, удовлетворяющим условию то, как показывает прямой подсчет, для итерированных ядер Kn(s,t) справедлива оценка: \Kn{s,t)\^ """ (n-1)! ' откуда следует сходимость ряда F) при любом А. Однако, вообще говоря, степенной ряд F) имеет некоторый конеч- конечный радиус сходимости. В то же время уравнение ip = \Acp-\-f имеет решение при всех А, кроме конечного или счетного числа значений, именно таких, что 1/А есть собственное значение оператора А. Фред- го льм показал, что для интегрального оператора А, определяемо- определяемого ограниченным и непрерывным ядром K(s,t), решение
§ 3. Интегральные уравнения, содержащие параметр 495 уравнения ср = ХАср + / может быть найдено следующим способом. Введем обозначение k\s: Н ^П J Ъг(п + \ К( f \ и определим функции D(X) и D(s, t; Л), называемые, соответственно, детерминантом Фредгольма и минором Фредголъма, формулами: ъ ъ = 1-Л Тогда для интегрального уравнения ъ <p(s) = \fK(s,t)<p(t)dt а резольвентное ядро дается формулой и решение записывается в виде 2&^ (9) для всех значений Л, таких, что 1/Л не есть собственное значение интегрального оператора А, отвечающего ядру K(s,t). При этом D(X) и D(s,t;X) представляют собой целые аналитические функ- функции параметра Л и D(X) = 0 в том и только том случае, если 1/Л есть собственное значение интегрального оператора А. Как показал в 1921г. Т. Карлеман, формулы G), (8) и (9), полученные Фредголь- мом в предположении непрерывности ядра K(s,i), остаются в силе и для любого ядра с интегрируемым квадратом. Мы не бу- будем приводить здесь выводы формулы (9) и формул G), (8I). 1)См. Carleman Т. Zur Theorie der Integralgleichungen // Math. Zeitschr. — 1921. № 9. — S. 196-217, а также Smithies F. The Fredholm theory of integral equations // Duke Math. Journal. — 1941. № 8. — P. 107-130. Вывод формул G), (8) и (9) см. в книгах [35] и [46].
ГЛАВА X ЭЛЕМЕНТЫ ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ В ЛИНЕЙНЫХ ПРОСТРАНСТВАХ В тех вопросах функционального анализа, которыми мы занима- занимались в предыдущих главах, основную роль играли понятия линей- линейного функционала и линейного оператора. Однако некоторые за- задачи, возникающие в функциональном анализе, носят существенно нелинейный характер; они приводят к необходимости развивать на- наряду с «линейным» и «нелинейный» функциональный анализ, т. е. изучать нелинейные функционалы и нелинейные операторы в бес- бесконечномерных пространствах. К нелинейному функциональному анализу относится, по существу, такая классическая область мате- математики, как вариационное исчисление, основы которого были зало- заложены еще в XVII—XVIII вв. в работах Бернулли, Эйлера, Лагранжа. Однако в целом нелинейный функциональный анализ представляет собой сравнительно новую область математики, пока еще далекую от своего завершения. В этой главе мы изложим некоторые перво- первоначальные понятия, относящиеся к нелинейному функционально- функциональному анализу, в основном к теории дифференцирования, и некоторые применения этих понятий. § 1. Дифференцирование в линейных пространствах 1. Сильный дифференциал (дифференциал Фреше). Пусть X и Y — два нормированных пространства и F — отображе- отображение, действующее из X в Y и определенное на некотором открытом подмножестве О пространствах. Мы назовем это отображение диф- дифференцируемым в данной точке х Е О, если существует такой огра- ограниченный линейный оператор Lx Е C(X,Y), что для любого е > О можно найти S > 0, при котором из неравенства \\h\\ < S следует неравенство + h)-F(x)-Lxh\\^4h\\- A) То же самое сокращенно записывают так: F(x + h) - F{x) - Lxh = o(h). B) Из A) следует, что дифференцируемое в точке х отображение непрерывно в этой точке. Выражение Lxh (представляющее собой,
§ 1. Дифференцирование в линейных пространствах 497 очевидно, при каждом h Е X элемент пространства Y) называ- называется сильным дифференциалом (или дифференциалом Фреше) ото- отображения F в точке х. Сам линейный оператор Lx называется производной, точнее, сильной производной отображения F в точке х. Мы будем обозначать эту производную символом F'(x). Если отображение F дифференцируемо в точке ж, то соответст- соответствующая производная определяется единственным образом. В самом деле, равенство \\L\h — L2h\\ = o(h) для операторов Li G ?(X,Y) (г = 1, 2) возможно, лишь если L\ = L2. Установим теперь некоторые элементарные факты, непосредст- непосредственно вытекающие из определения производной. 1. Если F(x) = уо = const, то F'(x) = 0 (т.е. F'(x) в этом случае есть нулевой оператор). 2. Производная непрерывного линейного отображения L есть са- само это отображение: L'(x) = L. C) Действительно, по определению имеем L(x + h)-L(x) =L(h). Несколько менее очевиден следующий важный результат. 3. (Производная сложной функции). Пусть X, Y, Z — три нор- нормированных пространства, U(xq) — окрестность точки жо G I, F — отображение этой окрестности в Y, уо = F(xo), V(yo) — окрестность точки уо G Y и G — отображение этой окрестно- окрестности в Z. Тогда, если отображение F дифференцируемо в точке хо, a G дифференцируемо в точке у$, то отображение Н = GF (кото- (которое определено в некоторой окрестности точки xq) дифференцируемо в точке хо и Н'(х0) = G'(yo)F'(xo). D) Действительно, в силу сделанных предположений F(x0 +0= F{x0) + F'(so)? + ox @, G(yo +V)= G(y0) + G'{yo)ri + o2(v). Ho F'(xq) и G'(yo) — ограниченные линейные операторы. Поэтому Н(х0 +0= G(y0 + F'(xo)Z + @) + G'(yo)(F'(xo)Z (Проведите аккуратно выкладку сгиб.) Если F, G и Н — числовые функции, то формула D) превраща- превращается в известное правило дифференцирования сложной функции.
498 Гл. X. Элементы дифференциального исчисления 4. Пусть F и G — два непрерывных отображения, действующих из X в Y. Если F и G дифференцируемы в точке хо, то и отобра- отображения F + G и aF (a — число) тоже дифференцируемо в этой точке, причем (F + G)'(xo) = F'(x0) + G'(so), E) (aF)'(xo)=aF'(xo). F) Действительно, из определения суммы операторов и произведе- произведения оператора на число сразу получаем, что (F + G)(x0 + ft) = F(x0 + ft) + G(x0 + ft) = = F(x0) + G(x0) + Ff(x0)h + Gf(x0)h + oi(ft), aF(xo+h) = aF(x0) + aF'(xo)h + o2(ft), откуда следуют равенства E) и F). 2. Слабый дифференциал (дифференциал Гато). Пусть снова F есть отображение, действующее из X в Y. Слабым диф- дифференциалом или дифференциалом Гато отображения F в точке х (при приращении ft) называется предел где сходимость понимается как сходимость по норме в простран- пространстве Y. Иногда, следуя Лагранжу, выражение DF(x, ft) называют первой вариацией отображения F в точке х. Слабый дифференциал DF(x, ft) может и не быть линеен по ft. Если же такая линейность имеет место, т. е. если где F'c(x) — ограниченный линейный оператор, то этот оператор называется слабой производной (или производной Гато). Заметим, что для слабых производных теорема о дифференциро- дифференцировании сложной функции, вообще говоря, неверна. (Приведите при- пример!) 3. Формула конечных приращений. Пусть О — открытое множество в X и пусть отрезок [жо,ж] целиком содержится в О. Пусть, наконец, F есть отображение X в У, определенное на О и имеющее слабую производную F'c в каждой точке отрезка [хо, х]. Положив Ах = х — хо и взяв произвольный функционал <р G У*, рассмотрим числовую функцию = <p(F(xo+tAx)),
§ 1. Дифференцирование в линейных пространствах 499 определенную при 0 ^ t ^ 1. Эта функция дифференцируема по t. Действительно, в выражении fit + At) -fit) ( F(x0 + tAx + At Ax) - F(x0 + t Ax) \ = П) At = П At ) можно перейти к пределу под знаком непрерывного линейного функ- функционала ср. В результате получаем f(t)=<p(Flc(x0+tAx)Ax). Применив к функции / на отрезке [0,1] формулу конечных при- приращений, получим Д1) =/@)+ /'(#), где (К 0^1, ?>№) - F(x0)) = 4>{F'c(x0 + в Ах) Ах). G) Это равенство имеет место для любого функционала ср G К* (вели- (величина 0 зависит, разумеется, от ср). Из G) получаем \<p(F(x) - F(xo))\ ^ |М| • sup ||F'(ar0 + в Ах)\\ ¦ \\ Ах\\. (8) Выберем теперь ненулевой функционал ср так, что = \\<p\\-\\F(x)-F(xo)\\ (такой функционал ip существует в силу следствия 4 теоремы Хана- Банаха (см. п. 3 § 1 гл. IV)). При этом из (8) получаем \\F(x) - F(xo)\\ ^ sup ||Fc'0ro +вАх)\\-\\Ах\\, Ах = х — хо. (9) Это неравенство можно рассматривать как аналог формулы конеч- конечных приращений для числовых функций. Применив формулу (9) к отображению х ^ F(x) - получим следующее неравенство: \\F(x) - F(x0) - Ffc0) Ax\\ ^ J2 A0) 4. Связь между слабой и сильной дифферендируемо- стью. Сильная и слабая дифференцируемость представляют со- собой различные понятия даже в случае конечномерных пространств.
500 Гл. X. Элементы дифференциального исчисления Действительно, из анализа хорошо известно, что для числовой функции /О) = /оь...,жп) при n ^ 2 из существования производной при любом фиксированном h = (hi,..., hn) еще не следует диффе- ренцируемость этой функции, т. е. возможность представить ее при- приращение f(x-\-h) — f(x) в виде суммы линейной (по К) части и члена выше первого порядка малости относительно h. Простейшим примером здесь может служить функция двух пере- переменных (ЙГ 6СЛИ ^'«2) #@,0), ) [ 0, если (ж1,ж2) = @,0). Эта функция непрерывна всюду на плоскости, включая точку @, 0). В точке @, 0) ее слабый дифференциал существует и равен 0, по- поскольку /@ + ^)-/@) t*hjh2 _ 11111 I 11111 Л, Л 9т9 *-*' Вместе с тем этот дифференциал не является главной линейной ча- частью приращения функции A1) в точке @,0). Действительно, если положить /i2 = til, то г f(huh2)-f @,0) у lim ——¦—,,. и = lim — ll^ll K 1 ,п = ^ Ф 0. 2 Однако если отображение F имеет сильную производную, то оно имеет и слабую, причем сильная и слабая производные совпада- совпадают. Действительно, для сильно дифференцируемого отображения имеем F(x + th) - F(x) = F'(x)(th) + o(th) = tF'(x)h + o(th), Выясним условия, при которых из слабой дифференцируемости отображения F следует его сильная дифференцируемость. Теорема 1. Если слабая производная F'c (x) отображения F су- существует в некоторой окрестности U точки хо и представляет собой в этой окрестности (операторную) функцию от х, непрерывную в xq,
§ 1. Дифференцирование в линейных пространствах 501 то в точке xq сильная производная Ff(xo) существует и совпадает со слабой. Доказательство. По е > 0 найдем 5 > 0 так, чтобы при ||ft|| < S выполнялось неравенство: Применив к отображению F формулу A0), получим: \\F(xo+h)-F(xo)-Ffco)h\\ < sup \\F^xo+eh)-F^xo)\\- Тем самым имеет место A), т.е. доказано как существование сильной производной F'(xo), так и ее совпадение со слабой произ- производной. В дальнейшем мы будем, если не оговорено противное, рассмат- рассматривать такие отображения, которые дифференцируемы в сильном, а значит, и в слабом смысле. 5. Дифференцируемые функционалы. Мы ввели дифферен- дифференциал отображения F, действующего из одного нормированного про- пространства X в другое нормированное пространство Y. Производная Ff(x) такого отображения при каждом х — это линейный оператор из X в У, т. е. элемент пространства С(Х, Y). В частности, если Y — числовая прямая, то F — принимающая числовые значения функ- функция на X, т.е. функционал. При этом производная функционала F в точке Xq есть линейный функционал (зависящий от жо), т-б. элемент пространства X*. Пример. Рассмотрим в действительном гильбертовом простран- пространстве Н функционал F{x) = ||ж||2. Тогда ||x + ft||2- ||ж||2 = 2(x,ft) + ||ft||2; величина 2(ж, ft) представляет собой главную линейную (по ft) часть этого выражения, следовательно, F'(x) = F'c(x) = 2х. Упражнение. Найти производную функционала ||ж|| в гильбертовом пространстве. (Ответ: ж/||ж|| при х ф 0; при х = 0 не существует.) 6. Абстрактные функции. Предположим теперь, что к чис- числовой прямой сводится пространство аргументов X. Отображение F(x), сопоставляющее числу х элемент некоторого банахова про- пространства У, называется абстрактной функцией. Производная F' (х)
502 Гл. X. Элементы дифференциального исчисления абстрактной функции (если она существует) представляет собой (при каждом х) элемент пространства Y — касательный вектор к кривой F(x). Для абстрактной функции (представляющей собой функцию одного числового аргумента) слабая дифференцируемость совпадает с сильной. 7. Интеграл. Пусть F — абстрактная функция действительно- действительного аргумента t со значениями в банаховом пространстве Y. Если F задана на отрезке [а, 6], то можно определить интеграл функции F по отрезку [а, Ь]. Этот интеграл понимается как предел интеграль- интегральных сумм п-1 ?>(&)(**+!-**)> A2) отвечающих разбиениям a = to<t1<---<tn = b, & е [tk,tk+1]. При условии, что max(t&+i — ?&) —у 0. Интеграл (представляющий собой, очевидно, элемент из Y) обозначается символом ь I F(t) dt. A3) а Рассуждения, в значительной мере аналогичные проводимым для функций, принимающих скалярные значения, показывают, что ин- интеграл от функции, непрерывной на отрезке, существует; при этом он обладает свойствами обычного риманова интеграла. Среди этих свойств отметим следующие. 1. Если U — фиксированное линейное непрерывное отображение пространства Y в некоторое пространство Z, то ъ ъ I UF(t) dt = U f F(t) dt. a a 2. Если F(t) имеет вид f(t)yo, где f(t) — числовая функция, а у о — фиксированный элемент из У, то ъ ъ = yoff(t)dt. 3. ь f\\F(t)\\dt.
§ 1. Дифференцирование в линейных пространствах 503 Пусть снова X и Y — нормированные пространства, а ВС(Х, Y) — линейное пространство всех непрерывных ограничен- ограниченных1) отображений X в Y. В пространстве ВС(Х, Y) можно ввести топологию, принимая за окрестности нуля множества Un? = \F: sup \\F(x)\\<s\. На подпространстве C(X,Y) С ВС(Х, Y) всех линейных непрерыв- непрерывных отображений X в Y эта топология совпадает с обычной топо- топологией в C(X,Y), задаваемой операторной нормой. Пусть J — — [жо,жо + Ах] — какой-нибудь прямолинейный отрезок в X. До- Допустим, что задано непрерывное отображение этого отрезка в про- пространство ВС(Х, У), т. е. что каждой точке х Е J сопоставлено неко- некоторое отображение F(x) Е ВС(Х, У), непрерывно зависящее от век- векторного параметра х G J. Тогда можно определить интеграл от F{x) по отрезку J, полагая I F(x) dx= I F(x0 + t Ax) (Ax) dt A4) xo 0 (здесь F(xo -\-t Ax)(Ax) при каждом ? G [0,1] есть элемент простран- пространства У, являющийся образом элемента Ах G X при отображении F(xo + ? Аж)). Ясно, что интеграл, стоящий в правой части форму- формулы A4), существует и является элементом пространства Y. Применим эту конструкцию к восстановлению отображения по его производной. Рассмотрим отображение F, которое действует из X в Y и имеет на отрезке [хо, хо + Ах] непрерывно зависящую от х сильную произ- Л о водную F'(х). Тогда существует интеграл Г F'(x) dt. Докажем, что имеет место равенство жо+Лж I A5) о обобщающее формулу Ньютона-Лейбница. Действительно, по опре- определению I F'(x) dx = lim ^ F'(x0 + tkAx)(Ax)(tk+1 - tk) = хо к=0 n-1 k=o 1) Отображение F: X —>¦ Y называется ограниченным, если для всякого огра- ограниченного множества Q С X множество F(Q) ограничено в У. Нелинейное непрерывное отображение не обязательно ограничено.
504 Гл. X. Элементы дифференциального исчисления где Хк = х0 + tkAx, Ахк = (tk+i - tk)Ax, 5 = max(tk+i - tk). к Но в то же время при любом разбиении отрезка 0 ^ t ^ 1 имеем п-1 Ах) - F(x0) = ^2[F(x0 + t/c+i Аж) - F(x0 + tkAx)} = fc=0 n-l k=0 По формуле A0) получаем n-l |^[F(rrfc+i) - F(x,) - F'(xk)Axk]\\ <: k=0 n-l <: \\Ax\\ X)(**+i - **) sup 1№* + ^A^) - k=0 ° Так как производная Ff(x) непрерывна, а следовательно, и равно- равномерно непрерывна на отрезке [хо, хо + Ах], правая часть неравен- неравенства A6) стремится к нулю при неограниченном измельчении раз- разбиения отрезка [жо,жо + Аж], откуда и вытекает равенство A5). 8. Производные высших порядков. Пусть F — дифференци- дифференцируемое отображение, действующее из X в Y. Его производная Ff(x) при каждом х G X есть элемент из С(Х, Y), т. е. F' есть отображение пространства X в пространство линейных операторов С(Х, Y). Если это отображение дифференцируемо, то его производная называется второй производной отображения F и обозначается символом F"'. Таким образом, F"(x) есть элемент пространства С(Х,С(Х, Y)) ли- линейных операторов, действующих из X в ?(Х, Y). Покажем, что эле- элементы этого пространства допускают более удобную и наглядную интерпретацию в виде так называемых билинейных отображений. Мы говорим, что задано билинейное отображение пространства X в пространство У, если каждой упорядоченной паре элементов х,х' из X поставлен в соответствие элемент у = B(x,xf) G Y так, что выполнены следующие условия: 1) для любых xi, Ж2, х[, х'2 из X и любых чисел а,{3 имеют ра- равенства: +f3x2jx[) =aB(xux'1)+f3B(x2jx'1)J В{хиах'1 + /Зх'2) = аВ{хих'1)
§ 1. Дифференцирование в линейных пространствах 505 2) существует такое положительное число М, что \\В(х,х')\\^М\\х\\-\\х'\\ A7) при всех i,x'gI. Первое из этих условий означает, что отображение В линейно по каждому из двух своих аргументов; нетрудно показать, что вто- второе условие равносильно непрерывности В по совокупности аргу- аргументов. Наименьшее из чисел М, удовлетворяющих условию A7), назы- называется нормой билинейного отображения В и обозначается \\B\\. Линейные операции над билинейными отображениями опреде- определяются обычным способом и обладают обычными свойствами. Та- Таким образом, билинейные отображения пространства X в простран- пространство Y сами образуют линейное нормированное пространство, кото- которое мы обозначим B(X2,Y). При полноте Y полно и B(X2,Y). Каждому элементу А из пространства ?(X,?(X,Y)) можно по- поставить в соответствие элемент из ??(Х2,У), положив В(х,х') = (Ах)х'. A8) Очевидно, что это соответствие линейно. Покажем, что оно также и изометрично и отображает пространство ?(Х, ?(Х, Y)) на все про- пространство B(X2,Y). Действительно, если у = B(x,xf) = (Ax)xf, то \\у\\^\\Ах\\-\\х'\\^\\А\\-\\х\\-\\х'\\, откуда \\B\\ < ||А||. A9) С другой стороны, если задано билинейное отображение В, то при фиксированном х G X отображение х' —> (Ах)х' = В(х,х') есть линейное отображение пространства X в Y. Таким образом, каждому х G X ставится в соответствие элемент Ах пространства ?(X,Y); очевидно, что Ах линейно зависит от ж, т. е. билинейное отображение В определяет некоторый элемент А пространства ?(Х, ?(Х, Y)). При этом ясно, что отображение В вос- восстанавливается по А при помощи формулы A8) и \\Ах\\= sup \\(Ax)x'\\= sup \\В(х,х')\\ ^ \\B\\ - \\x\\, IHI^i |И|^1 откуда \\B\\. B0) Сопоставляя A9) и B0), получаем ||А|| = \\B\\. Итак, соответствие между В{Х2, Y) и ?(Х, ?(Х, У)), определяемое равенством A8), ли- линейно и изометрично, а следовательно, взаимно однозначно. При этом образ пространства ?(X,?(X,Y)) есть все B(X2,Y).
506 Гл. X. Элементы дифференциального исчисления Мы выяснили, что вторая производная Fff(x) есть элемент про- пространства С(Х, С(Х, Y)).B соответствии с только что сказанным мы можем считать F"(x) элементом пространства B(X2,Y). Рассмотрим элементарный пример. Пусть X и Y — конечномер- конечномерные евклидовы пространства размерностей тип соответственно. Тогда каждое линейное отображение X в Y можно задать некото- некоторой (п х т)-матрицей. Таким образом, производная F'(x) отображе- отображения F, действующего из X в У, есть (зависящая от ж Е X) матрица. Если в X и Y выбраны базисы, скажем, еь...,ет в X и /i,...,/n в У, то х = xiei Н Ь хтет, у = y1f1 Н Ь Ут/п- Тогда отображение у = F(x) можно записать в виде уп = Fn(xb...,xm), и г^_ dyi_ дух ~ дх\ дх2 ''' дхш Ff(x)= дуп дуп дуп - дх\ дх2 ''' дхш - Вторая производная F" {х) определяется в этом случае совокупно- совокупностью пхтхт величин а\~^ = -^—^—. Такую совокупность величин dk,ij можно рассматривать как определяемое формулой линейное отображение пространства X в пространство С(Х, Y) или как определяемое формулой т Ук = ^2 ak,iJXiX'j билинейное отображение пространства X в Y. Очевидным образом можно ввести понятие третьей, четвертой и вообще п-и производной отображения F, действующего из X в У, определив n-ю производную как производную от производной (п — 1)-го порядка. При этом, очевидно, n-я производная предста- представляет собой элемент пространства С(Х, С{Х,..., С(Х, Y)...)). По- Повторяя рассуждения, проведенные для второй производной, мож- можно каждому элементу этого пространства естественным образом по- поставить в соответствие элемент пространства N(Xn, Y) п-линейных
§ 1. Дифференцирование в линейных пространствах 507 отображений X в Y. При этом под п-линейным отображением по- понимается такое соответствие у = 7V(V, ж",..., ж(п)) между упорядо- упорядоченными системами (V , ж",... , ж(п)) элементов из X и элементами пространства У, которое линейно по каждому из хг при фиксиро- фиксированных остальных элементах и удовлетворяет при некотором М > 0 условию ||/V(V г" г^П < Mllr'l \\±\ ух , х , . . . , х л| ^ iK/ цл | (n) Таким образом, n-ю производную отображения F можно считать элементом пространства N(Xn,Y). 9. Дифференциалы высших порядков. Мы определили (сильный) дифференциал отображения F как результат примене- применения к элементу h G X линейного оператора Ff(x), т.е. dF = Ff(x)h. Дифференциал второго порядка определяется как cPF=F"(x)(h, /i), т.е. как квадратичное выражение, отвечающее отображе- отображению F"(x) G B(X2,Y). Аналогично дифференциалом n-го порядка называется dnF = F^n\x)(h, h,..., /i), т.е. тот элемент простран- пространства У, в который элемент (h,h,...,h) G X х X х • • • х X = Хп переводится отображением F^n\x). 10. Формула Тейлора. Сильная дифференцируемость отобра- отображения F означает, что разность F(x + К) — F(x) может быть пред- представлена в виде суммы линейного члена и слагаемого, имеющего порядок выше первого относительно \\h\\. Обобщением этого факта является формула, аналогичная формуле Тейлора для числовых функций. Теорема 2. Пусть F — отображение, действующее из X в Y, определенное в некоторой области О С X и такое, что F^ (x) су- существует и представляет собой равномерно непрерывную функцию от х в О. Тогда имеет место равенство F{x + К) - F{x) = F'(x)h + ±F"(x)(h, h) + • • • ¦¦¦ + ^(#,..,4+^4, B1) Доказательство будем вести по индукции. При п = 1 равен- равенство B1) тривиально. Возьмем теперь произвольное фиксированное п и предположим, что равенство, получающееся из B1) заменой п на п — 1, уже доказано для всех отображений, удовлетворяющих
508 Гл. X. Элементы дифференциального исчисления условиям теоремы, в которых п заменено на п — 1. Тогда для ото- отображения F' имеем F'(x + Л) = F'(x) + F"(x)h + ±F'"(x)(h, Л) + • • • ^M,h), B2) где ||cji(x,/i)|| = с^ЦЛЦ71). Интегрируя обе части равенства B2) по отрезку [x,x + h] и пользуясь формулой Ньютона-Лейбница A5), мы получим 1 1 г F(x + h) -F(x) = f Ff(x + th)hdt= f If'(x)+tF"(x)h+ о о + ^?2F'"(x)(/i, Л) + l^r-1^^/!,..., h)}hdt + Лп, B3) l где Rn = /" uoi{x,th)hdt. о Из B3) получаем F(x + h) -F(x) =F'(x)h+ + iF"(rr)(/i, Л) + • • • + ±FM(h,..., h) + i?n, причем / 0 Тем самым наше утверждение доказано. Формулу B1) называют формулой Тейлора для отображений. § 2. Теорема о неявной функции и некоторые ее применения 1. Теорема о неявной функции. Одна из важнейших теорем классического анализа, имеющая разнообразные применения, — это теорема о неявной функции. Мы сейчас покажем, что эта теорема переносится без больших изменений с числовых функций на отобра- отображения произвольных банаховых пространств. Теорема 1. Пусть X,Y,Z — банаховы пространства, U — окрестность точки (жо,2/о) ^ X х Y и F — отображение U в Z, обладающее следующими свойствами: 1. F непрерывно в точке (жо,2/о)- 2.F(xo,yo) = 0.
§ 2. Теорема о неявной функции 509 3. Частная производная Fy(x,y) существует в U и непрерывна в точке (хо,уо), а оператор Fy(xo,yo) имеет ограниченный обратный. Тогда уравнение F(x,y) = 0 разрешимо в некоторой окрестности точки (хо,уо). Точнее это означает следующее: существуют такие е > 0, S > 0 и такое отображение У = №, A) определенное при \\х — хо\\ < S и непрерывное в точке хо, что каждая пара (х,у), для которой \\х — xq\\ < 5 и у = f(x), удовлетворяет уравнению F(x,y)=O, B) и обратно, каждая пара (х,у), удовлетворяющая уравнению B) и условиям \\х — хо\\ < 8, ||з/ — 2/о|| ^ е, удовлетворяет и A). Доказательство. Обозначим через С/(ж) С Y совокупность тех у, для которых (х,у) G U при данном х. Будем считать, что ||ж — жо|| настолько мало, что уо G ?7(ж), и рассмотрим определенное на С/(ж) отображение А^: A{x)y = y-[F^x0,y0)]-1F(x,y). C) Ясно, что уравнение А(х)У = У равносильно уравнению F(x,y) = 0. Для доказательства существования решения уравнения C) при- применим принцип сжимающих отображений. С этой целью покажем, что для каждого достаточно малого г > 0 найдется такое 5 > 0, что при ||ж — жо|| < ? отображение А^ является сжимающим и перево- переводит шар || у — у о || ^ г в себя. Начнем с того, что вычислим и оце- оценим по норме производную отображения А^. Имеем в силу формул C)-E) § 1: A{x)(y) = I-[F^xo,yo)]-1F^x,y) = = [F^xo^oT'iFyixoiVo) -F'y[x,y)\. В силу непрерывности производной F'y в точке (жо,2/о) можно вы- выбрать г и 5 так, что \\A{x)(y)\\^q<l. Это неравенство вследствие формулы конечных приращений озна- означает, что отображение А(х) пространства Y при любом ж, удовлет- удовлетворяющем неравенству ||ж — жо|| < S на шаре \\у — уо\\ ^ г является сжимающим. Оценим теперь ||А(жJ/о ~ 2/о||- Имеем: \\А(х)Уо ~ 2/о|| '
510 Гл. X. Элементы дифференциального исчисления В силу непрерывности отображения F в точке (жо?2/о) последнее выражение можно сделать за счет выбора 8 сколь угодно малым. Пусть 8 > 0 настолько мало, что \\А(х)Уо — 2/о11 < еA - Я) при \\х^-х\\<8. Проверим, что при таком выборе 8 отображение А^ переводит замкнутый шар 112/ — 2/о 11 ^ е в себя. Действительно, если ||ж —жо|| < 8 и II2/ — 2/о|| ^ ?5 то из формулы конечных приращений получим \\А(х)У ~ 2/о|| ^ \\А(х)Уо ~ 2/о|| + \\А(х)У ~ А(х)Уо\\ ^ ^гA-^)+ sup ||А/(я)B/о + % Итак, при ||ж — жо|| < 8 отображение А^ переводит замкнутый шар \\у—2/о || ^ ев себя и является на этом шаре сжимающим. Значит, в этом шаре существует единственная неподвижная точка 2/* = /(ж), т. е. точка, для которой y*=y*-[F^xo,yo)]-1F(x,y*), т. е. в силу условия 3 теоремы F(x,y*) = 0. Отображение / и есть искомое. Действительно, справедливость уравнения B) уже проверена. Равенство /(жо) = 2/о вытекает из единственности неподвижной точки для отображения А(жо), а непре- непрерывность построенной функции / следует из того, что в приведен- приведенных выше рассуждениях величина е может быть взята сколь угодно малой. Замечание. Нетрудно показать, что если в теореме 1 предпо- предположить отображение F непрерывным в окрестности U (а не только в точке (жо,2/о)M т0 соответствующее отображение / будет непре- непрерывно в некоторой окрестности точки xq. Нижеследующая теорема устанавливает условия, при которых функция, определяемая уравнением вида F(x, у) = 0, дифферен- дифференцируема. Теорема 2. Пусть выполнены условия теоремы 1, и пусть, кро- кроме того, в U существует частная производная Fx, непрерывная в точ- точке (жо,2/о)- Тогда отображение f дифференцируемо в точке хо и /'Ы = -[F'ixcyoT'FUxo^o). D)
§ 2. Теорема о неявной функции 511 Доказательство. Обозначим выражение, стоящее в D) спра- справа, через Л. Оно представляет собой линейный оператор, действую- действующий из X в Y. Доказать, что этот оператор служит производной отображения / в точке xq, это значит доказать существование для каждого е > 0 такого S > 0, что при любом х таком, что ||ж — жо|| < 8, выполнено неравенство Ц/0) - /Оо) - Л(ж - жо)|| < е\\х - хо\\. E) Полагая f(x)=y,n заменив /Оо) на уо, а оператор Л — его выра- выражением D), имеем /О) -/Оо) - А(х-хо) = = У ~ Уо + [i^Oo^o)] i^0o,2/oH - хо) = = [F^(xo,yo)]~1{K(xo,yo)(x - х0) + F^(xo,yo)(y ~ Уо)}- Но F(x,y) = F(xo^yo) = 0, поэтому с помощью формулы конечных приращений получаем такую оценку: х \\{F(x,y) -F(xo,yo) - F^(xo,yo)(x-xo) - F^(xo,yo)(y-yo)}\\ ^H^Oo^o)]^ sup WF^xo + 0(x - xo),yo + O^y - y0))- О<6>,6>1<1 -Fy(xo,yo)\\ • ||ж + sup \\F'(x0 + 0(x - xo),yo + 6x(y - 2/0))- О<6>,6>1<1 - F'y(x0,y0)\\ ¦ \\y - 1/о||] ^ r,[\\x - xo\\ + |||/ где величина г) может быть сделана сколь угодно малой в силу не- непрерывности производных F'x и Fy, если величина S достаточно ма- мала. Таким образом, мы получили, что - А(х - хо)\\ ^ Ы\х -хо\\ + \\№ - f(xo)\\] ^ ^ П[\\х -хо\\ + \\Цх - хо)\\ + \\f(x) - f(x0) - А(х - хо)\\]. Отсюда при достаточно малом rj получаем ||/(аО - f(x0) - А(х - хо)\\ < г,{1 - ^(l + \\А\\)\\х - хо\\, и для доказательства неравенства E) остается лишь выбрать г] так, что 77A - ^)-1A + ||Л||) ^ е. Теорема доказана. Рассмотрим теперь некоторые применения теоремы о неявной функции.
512 Гл. X. Элементы дифференциального исчисления 2. Теорема о зависимости решения дифференциального уравнения от начальных данных. Рассмотрим задачу Коши для дифференциального уравнения dx/dt = /(?,ж), x(t0) = ж0, F) где /(?,ж) и х — элементы некоторого банахова пространства Е. Задача F) равносильна интегральному уравнению x(t)-x0- f f(r,x(r))dr = 0. G) to Запишем это уравнение как F(xo,x(t)) = 0. Таким образом, F — это оператор, отображающий прямую сумму пространства Е и про- пространства Cfi[to,ti] непрерывно дифференцируемых функций со значениями в Е в пространство C^[to,ti]. Если функция f(t,x) не- непрерывна и имеет непрерывную по (?, х) производную, то выражение x(t)- f f(r,x(r))dr to определяет дифференцируемое отображение пространства Сд[го, t\] в себя. Следовательно, и F(xo,x(t)) есть дифференцируемый по x(t) оператор, а так как хо входит в F(xo,x(t)) аддитивно, то F есть дифференцируемая функция наЕх C^[to,ti]. Дифференциал этой функции по х имеет вид F'xh = h(t) - f fx(T,x(T))h(T)dT. (8) to Правая часть этого равенства определяет оператор, отображающий C^j[to,ti] в себя. Этот оператор обратим. Действительно, для любой функции y(t) G C^[?o,?i] уравнение F'xh(t) = y(t), или t hit)- f &(T,x(T))h(T)dT = y(t), to равносильно дифференциальному уравнению ^y'(t) (9) с начальным условием h(to) = у (to). Уравнение (9) — это линейное уравнение с непрерывными коэф- коэффициентами, поэтому в силу известных теорем (см. [24]) существует
§ 2. Теорема о неявной функции 513 единственное решение этого уравнения, определенное на всем отрез- отрезке [to,^1] и удовлетворяющее указанному выше начальному усло- условию, а это и означает обратимость оператора F'x. Полученный результат означает, что к уравнению применима теорема о неявной функции. В силу этой теоремы ре- решение х = x{t) данного уравнения, которое может рассматривать- рассматриваться как функция переменного начального значения xq\ х = ж(?,жо), дифференцируемым образом зависит от хо- В частности, принимая за Е конечномерное пространство, мы получаем обычную теорему о непрерывной дифференцируемой зависимости решения системы дифференциальных уравнений от начальных условий. Аналогичным образом с помощью теоремы о неявной функции может быть получено утверждение о дифференцируемой зависимос- зависимости решения дифференциального уравнения f = /(*>*>«) от параметра а, если его правая часть дифференцируемым образом зависит от а. 3. Касательные многообразия. Теорема Люстерника. В ка- качестве еще одного применения теоремы о неявной функции рассмот- рассмотрим следующий вопрос. Пусть F(x), где х = (xi,X2), — дифферен- дифференцируемая функция на плоскости. Уравнение F(x) = 0 определяет на плоскости некоторую кривую С. Пусть хо — точка, принадле- принадлежащая этой кривой. Касательная к кривой С в данной точке мо- может быть определена либо как совокупность векторов вида хо + th, где h — вектор, перпендикулярный вектору F'(xo) (т.е. градиенту функции F в точке жо), либо как совокупность точек xq + th, рас- расстояние которых до кривой С есть бесконечно малая выше первого порядка относительно t. Содержание теоремы Люстерника состо- состоит в том, что эквивалентность двух определений касательной име- имеет место и для многообразий в произвольных банаховых простран- пространствах. Введем некоторые понятия и обозначения, необходимые для точной формулировки соответствующей теоремы. Пусть X и Y — банаховы пространства и F — отображение про- пространства X в Y. Пусть далее Mq — совокупность точек из X, удов- удовлетворяющих уравнению F(x) = 0, и хо G Mq. Предположим, что отображение F непрерывно дифференцируемо в некоторой окрест- окрестности U точки хо. Мы назовем отображение F регулярным в точ- точке хо, если линейный оператор Ff(xo) отображает пространство X на всё Y.
514 Гл. X. Элементы дифференциального исчисления Обозначим через То совокупность элементов /i G I, удовлетво- удовлетворяющих условию F'(xo)h = 0, т. е. То = Ker F'(xo). Ясно, что То есть подпространство в X. Сдвиг этого подпространства на вектор жо, т.е. многообразие хо + Tq, обозначим через ТХо и назовем линейным многообразием, касательным к множеству Mq в точке х$. Имеет место следующая теорема. Теорема 3 (Л.А. Люстерник). При указанных выше усло- условиях относительно F элемент xq + h принадлежит касательному многообразию ТХо в том и только том случае, если расстояние эле- элемента хо + th от множества Mq есть величина выше первого порядка малости относительно t. Эта теорема играет очень важную роль в задачах оптимального управления. Она служит инструментом, с помощью которого извест- известное правило множителей Лагранжа нахождения условного экстре- экстремума может быть распространено на широкий круг экстремальных задач в банаховых пространствах. Сколько-нибудь полное изложение этих вопросов выходит за рам- рамки настоящей книги (о них см., например, в книге: А. Д. Иоффе, В. М. Тихомиров. Теория экстремальных задач. — М.: Наука, 1974). Мы ограничимся тем, что проведем доказательство теоремы Лю- стерника для так называемого «разложимого» случая, в котором теорема Люстерника почти непосредственно вытекает из теоремы о неявной функции. Именно, предположим, что пространство, на ко- котором определено отображение F, может быть разложено в прямую сумму х = т0 е тс подпространства То = Ker F'(хо) и некоторого пространства Т^. (За- (Заметим, что в банаховом пространстве, отличном от гильбертова, не всякое подпространство имеет прямое дополнение. Более того, можно показать, что если в пространстве X всякое линейное под- подпространство имеет прямое дополнение, то X — гильбертово про- пространство.) При этом предположении теорема 3 может быть сформулирована следующим более точным образом. Теорема 4. Если х = т0 е тс и отображение F: X —» Y удовлетворяет указанным выше усло- условиям, то существует такое гомеоморфное отображение окрестности точки хо в Мо на окрестность этой же точки в ТХо, что расстояние
§ 2. Теорема о неявной функции 515 между соответствующими друг другу точками есть величина выс- высшего порядка малости по сравнению с их расстояниями до точки хо. Доказательство. Обозначим через А оператор F'(xo), рас- рассматриваемый только на подпространстве Х^, т. е. М = Р'Ы? при ?ет?. Покажем, что А отображает Т% на все Y. Действительно, по условию каждый элемент из X имеет вид ж = Л + ?, he То, ^Гс. Поэтому F'(xo)x = F'(xo)(h + 0= F'(xo)Z = М, (Ю) так как F'(xo)h = 0. Но по условию F'(xo) отображает X на все У, а это и означает, что At; пробегает все У, когда ? пробегает Х^. Далее отображение А: Гс -^ Y взаимно однозначно, так как, если А?\ = А&, т. е. F/(xo)(?i —?2) = 0, то ?i — ?2 е То, откуда ?i — ?2 = 0. Итак, оператор А обратим и по тео- теореме Банаха обратный оператор А~х линеен и ограничен. Представив каждый элемент х G X в виде перепишем уравнение F(x) = 0, определяющее многообразие М, так: Частный дифференциал этой функции в точке @,0), отвечающий приращению А? второго аргумента, имеет вид Оператор А = Ф^@,0) имеет обратный, поэтому в силу теоремы о неявной функции уравнение Ф(/г,?) = 0 в некоторой окрестности точки @, 0) равносильно уравнению вида где ф(К) — дифференцируемое отображение, удовлетворяющее ус- условию ф@) = 0. Мы получили, что каждая точка х G Mq, достаточно близкая к точке жо, имеет вид х = х0 + ft + ^(ft), /1 G Го, Тем самым построено отображение жо + ft- ^ жо + h
516 Гл. X. Элементы дифференциального исчисления некоторой окрестности точки xq в Тх$ на окрестность той же точки в Mq. Это отображение взаимно однозначно и непрерывно. Остается показать, что расстояние между соответствующими друг другу точ- точками, т. е. величина ||т/>(/&)||, имеет высший порядок малости по срав- сравнению с \\h\\. Дифференцируя равенство Ф(Н,ф(Н)) = 0, имеем: Ф'Л@,0)Л + Ф?@,0)ip'(O)h = Ф'Л@,0)Л + Аф\ЪIъ = О, откуда р'(О)Н A-4'@0)h -A-lF'(xv)h = 0. Поэтому в равенстве первые два слагаемых справа равны нулю, т. е. Ф(Н) = о(\\Щ), что и требовалось. Теорема доказана. § 3. Экстремальные задачи Один из самых старых и наиболее разработанных разделов не- нелинейного функционального анализа — нахождение экстремумов функционалов. Изучение таких задач составляет содержание так называемого вариационного исчисления. Большинство ме- методов, существующих в вариационном исчислении, связано со спе- специальным видом тех функционалов, экстремальные значения кото- которых ищутся. Однако некоторые общие приемы и результаты могут быть сформулированы и для более или менее произвольных функ- функционалов. Не ставя себе здесь задачи сколько-нибудь полного изло- изложения вариационных методов, мы ограничимся кратким рассмот- рассмотрением элементов общей теории, лежащих в основе вариационного исчисления. 1. Необходимые условия экстремума. Пусть F — некото- некоторый действительный функционал, определенный на банаховом про- пространстве X. Говорят, что функционал F достигает в точке xq минимума, если для всех ж, достаточно близких к хо, выполнено неравенство F(x) — F(xq) ^ 0. Аналогично определяется максимум функционала. Если в данной точке хо функционал F достигает ми- минимума или максимума, то мы будем говорить, что в этой точке функционал F имеет экстремум.
§ 3. Экстремальные задачи 517 К отысканию экстремумов тех или иных функционалов могут быть сведены многие физические и механические задачи. Для функций п переменных хорошо известно следующее необ- необходимое условие экстремума: если функция / дифференцируема в точке хо = (xj,..., х^) и имеет в этой точке экстремум, то в этой точке df = 0 или, что равносильно, &_ = ...= 9L=0 дх\ дхп Это условие легко переносится на функционалы на произвольном нормированном пространстве. Теорема 1. Для того чтобы дифференцируемый функционал F достигал в точке хо экстремума, необходимо, чтобы его дифферен- дифференциал в этой точке равнялся нулю при всех h : F'(xo)h = 0. Иначе говоря, необходимо, чтобы F'(x0) = 0. Доказательство. По определению дифференцируемости имеем F(x0 + h) - F(x0) = F'(xo)h + o(h). A) Если Ff(xo)h ф 0 для некоторого /i, то при достаточно малых дей- действительных Л знак всего выражения F'(xo)(Xh) + o(Xh) совпадает со знаком его главного члена Ff(xo)(Xh). Но Ff(xo) — линейный функционал, поэтому F'(xo)(\h) = XF'(xo)h. Следовательно, если F'(xo)h ф 0, то выражение A) может принимать при сколь угодно малых h как положительные, так и отрицательные значения, т. е. экстремума в точке хо быть не может. Рассмотрим некоторые примеры. 1. Пусть F(x)= I f(t,x(t))dt, B) a где / — непрерывно дифференцируемая функция. Этот функцио- функционал, рассматриваемый в пространстве С [а, Ь] непрерывных функций на отрезке [а, 6], дифференцируем. Действительно, F{x + h) - F{x) = I [fit, x(t) + hit)) - fit, xit))]dt = a = f ti(t,x(t))h(t)dt + o(h), a откуда dF = I f'x{t,x{t))h{t)dt.
518 Гл. X. Элементы дифференциального исчисления Равенство нулю этого линейного функционала для всех h Е С [а, Ь] означает, что fx(t,x(t)) = 0. Действительно, при всяком x(t) Е С [а, Ъ] производная fx(t,x(t)) есть непрерывная функция от t. Если в ка- какой-то точке to она отлична от нуля, скажем, fx(to, x(to)) > 0, то это неравенство имеет место и в некоторой окрестности (а,/3) точки to. Тогда, положив ии\ / (t-a)(C-t) при a^t^/3, h(t) = < [ 0 при остальных ?, получаем f&(t,x)h(t)dt>0. а Полученное противоречие доказывает наше утверждение. Уравне- Уравнение fx(t,x) = 0 определяет, вообще говоря, некоторую кривую, на которой функционал B) может достигать экстремума. 2. Рассмотрим на том же пространстве С[а, Ь] функционал F{x) = I /tfF,6MuM6Ki#2, C) где K(€i,%2) — непрерывная функция, удовлетворяющая условию K(^ij ?2) — K(&j ?i)- Нетрудно подсчитать, что дифференциал этого функционала равен а а Если при всяком h G С [а, Ь] это выражение равно нулю, то в силу рассуждений, проведенных в примере 1, имеем ъ J K(€i, &)a(fi) <%1 = 0 Для всех 6, а ^ Ь ^ Ь. а Одно из решений этого уравнения — функция х = 0. Ответ на во- вопрос о том, имеется ли в этой точке экстремум и существуют ли дру- другие точки, в которых экстремум возможен, зависит от вида функ- функции K(?i,%2) и требует дополнительного исследования. 3. Рассмотрим функционал F(x) = / f(t,x(t),x'(t))dt, D) а определенный на пространстве С1 [а, Ь] непрерывно дифференцируе- дифференцируемых функций на отрезке [а, Ь]. Здесь x'(t) = XJ\ , a f{t,x,x') — дважды дифференцируемая функция своих аргументов. Функцио- Функционал D) играет основную роль во многих вопросах вариационного
§ 3. Экстремальные задачи 519 исчисления. Найдем его дифференциал. Пользуясь формулой Тей- Тейлора, получаем ъ F{x + К) - F{x) = I [f(t, x + h, х' + ti) - /(?, ж, x')]dt = где \\h\\ — норма функции h как элемента пространства С1 [а, 6]. Итак, необходимое условие экстремума для функционала D) имеет вид ь dF= f(fxh + fx,h')dt = O. E) В такой интегральной форме это условие мало пригодно для на- нахождения той функции ж, на которой достигается экстремум. Пре- Преобразуем его к более удобному виду, проинтегрировав в E) член f'x,h' по частям1). Получим а Таким образом, dF = J (fx- jtf^hdt + f'x,h =0. F) a Это равенство должно выполняться при всех h, в том числе и таких, для которых h(a) = h(b) = 0. Следовательно, = 0 при всех h, для которых h(a) = h(b) = 0, откуда, в силу рассужде- рассуждений, аналогичных проведенным в примере 1, получаем ^х dt^x' ~ ^ ' Поэтому равенство F) сводится к /;,//= 0. (8) 1) Эта операция требует дополнительного обоснования, поскольку существо- существование производной х", входящей в выражение -frzf',, не предполагается. См. по этому поводу любой курс вариационного исчисления.
520 Гл. X. Элементы дифференциального исчисления Если функционал D) рассматривается на всех непрерывно диф- дифференцируемых функциях ж, определенных на [а, Ь], то мы можем взять h так, что h(a) = 0, h(b) ф 0, и тогда из равенства (8) получим h = 0, (9) а положив h(b) = 0, h(a) ф 0, получим = о- (ю) t=a Таким образом, из условия F) (т. е. из равенства нулю дифферен- дифференциала D)) вытекает, что функция ж, на которой функционал D) достигает экстремума, должна удовлетворять дифференциальному уравнению G) и граничным условиям (9), A0) на концах отрезка [а, Ь]. Общее решение дифференциального уравнения второго поряд- порядка содержит две произвольные постоянные и в нашем распоряжении оказывается как раз то число граничных условий, которое нужно для отыскания этих постоянных. 2. Второй дифференциал. Достаточные условия экстре- экстремума функционала. Вернемся снова к нахождению экстремума функции п переменных. Пусть для функции f(xi,...,xn) в точке (ж?,...,ж^) выполнено условие df = 0. Тогда, как известно, для решения вопроса о том, действительно ли в данной точке имеет- имеется экстремум или нет, следует рассмотреть второй дифференциал. Именно, справедливы следующие утверждения. 1. Если функция f(xi,... ,хп) имеет в точке (ж?,...,ж^) ми- минимум, то в этой точке d2/ ^ 0. (Аналогично, если в точке (ж?,..., х^) имеется максимум, то в этой точке d2/ ^ 0.) 2. Если в точке (ж°,... ,ж°) выполнены условия df = 0 и d2 f = >^ -~—i-— dxi dxk > 0 i,k=l (когда не все dxi = 0), то в этой точке f(x) имеет минимум (ана- (аналогично, максимум, если d2/ < 0). Короче говоря, неотрицательность второго дифференциала не- необходима, а его положительная определенность достаточна для минимума. Посмотрим, в какой мере эти факты переносятся на функциона- функционалы, заданные на банаховом пространстве.
§ 3. Экстремальные задачи 521 Теорема 2. Пусть F — действительный функционал, задан- заданный в банаховом пространстве X и имеющий в некоторой окрест- окрестности точки хо непрерывную вторую производную. Если этот функ- функционал достигает в точке хо минимума, то d2F(xo) ^ 0 1). Доказательство. По формуле Тейлора получаем F(x0 + К) - F(x0) = F'(xo)h + ±F"(xo)(h, h) + o(\\h\\2). Если в точке хо функционал F имеет минимум, то F'(xo) = 0 и оста- остается равенство F(x0 + h)- F(x0) = ±F"(xo)(h, h) + o(\\h\\2). A1) Если при каком-либо h выполнено неравенство F"(xo)(h,h) <0, A2) то, поскольку F"(xo)(sh,sh) = s2F"(xo)(h,h), существуют и сколь угодно малые по норме элементы /i, для которых выполнено A2). Но при достаточно малых \\h\\ знак всего выражения A1) определяется знаком главного члена \F" (xq)Ai, /i), и мы получаем F(x0 + h) - F(x0) = \F"{x<>){h, h) + o(\\h\\2) < 0, т. е. минимума в точке xq нет. Аналогичную теорему можно сформулировать для максимума. Доказанная теорема есть прямое обобщение соответствующей теоремы для функций конечного числа переменных. Иначе об- обстоит дело с достаточным условием. Упомянутое выше условие F"(xo)(h,h) > 0, достаточное для минимума в случае функций п переменных, не является достаточным для функционалов, опреде- определенных на банаховом пространстве бесконечного числа измерений. Рассмотрим простой пример. Пусть в гильбертовом пространстве fa задан функционал П=1 71=1 В точке 0 первый дифференциал этого функционала равен 0, а вто- оо у2 рой — ряду 2 ^2 ^Ь т-е- представляет собой положительно опре- 71=1 П деленный функционал. Тем не менее в точке 0 нет минимума, так как F@) = 0 и F @,..., 0,1/п, 0,...) = 1/п5 - 1/п4 < 0. Следова- 71-1 тельно, в любой близости от точки 0 существуют точки, в которых F{x) < F@). Введем следующее понятие. Квадратичный функционал В назы- называется сильно положительным, если существуют такое постоянное число с > 0, что В(х,х) ^ с||ж||2 для всех х. :) Это неравенство означает, что F"(xo)(h,h) ^ 0 для всех h.
522 Гл. X. Элементы дифференциального исчисления Теорема 3. Если функционал F, определенный в банаховом пространстве X, удовлетворяет условиям 1) dF(x0) = О, 2) d2F(xo) —сильно положительный квадратичный функционал, то F имеет в точке xq минимум. Доказательство. Пусть F"(xo)(h,h) ^ c||/i||2. Выберем е > О настолько малым, чтобы при \\h\\ < г величина o(||/i||2) в равен- равенстве A1) удовлетворяла условию |o(||/i||2)| < f||ft||2. Тогда F(x0 + ft) - F(x0) = \F'\xv){K h) + o(\\h\\2) > % \\hf > 0 при \\h\\ < e. В конечномерном пространстве сильная положительность квад- квадратичной формы эквивалентна ее положительной определенности, поэтому (при равенстве нулю первого дифференциала) положитель- положительная определенность второго дифференциала достаточна для экстре- экстремума функции. В бесконечномерном случае (как показывает приве- приведенный выше пример) сильная положительность есть более сильное условие, чем положительная определенность. Условие сильной положительности второго дифференциала, га- гарантирующее минимум, удобно тем, что оно применимо к любому дважды дифференцируемому функционалу (независимо от его кон- конкретного вида) в любом банаховом пространстве. Вместе с тем это условие обычно оказывается слишком грубым и трудно проверяе- проверяемым в практически важных случаях. В вариационном исчислении устанавливаются более тонкие достаточные условия экстремума (использующие конкретный вид тех функционалов, которые рассма- рассматриваются в вариационных задачах); однако изложение этих вопро- вопросов не входит в задачу данной книги. 3. Экстремальные задачи с ограничениями. Выше речь шла о нахождении экстремума для функционалов, заданных на всем пространстве, т. е. как обычно говорят, об экстремальных задачах без ограничений. При наличии тех или иных ограничений, опреде- определяющих ту область, на которой задан рассматриваемый функцио- функционал, утверждения, приведенные в пп. 1 и 2, вообще говоря, неспра- несправедливы. Это видно уже на простейшем примере функции, заданной на отрезке: если такая функция достигает экстремума в граничной точке, то ее первый дифференциал в этой точке может быть отли- отличен от нуля, а знак второго дифференциала может быть любым. Рассмотрение экстремальных задач при наличии ограничений со- составляет обширную и важную область математики, включающую
§ 3. Экстремальные задачи 523 такие разделы, как классическое вариационное исчисление, опти- оптимальное управление, линейное и выпуклое программирование и т. д. Мы здесь ограничимся тем, что приведем лишь один результат. Его доказательство основано на применении теоремы Люстерника, иг- играющей важную роль во многих вопросах теории экстремальных задач. Пусть X и Y — банаховы пространства, F — функция на X и Ф: X —у Y — отображение пространства X в Y. Допустим, что ищет- ищется минимум функции F(x) на множестве, определяемом условием Ф(х) = 0. Теорема. Пусть функция F и отображение Ф непрерывно диф- дифференцируемы в некоторой окрестности точки хо, удовлетворяющей условию Ф(жо) = 0, и пусть образ пространства X при отображении Ф'(жо) : X —У Y замкнут. Если в точке хо достигается локальный ми- минимум функции F(x) на множестве {х : Ф(х) = 0}, то существуют число Ао и линейный функционал у*, определенный HaY, не равные нулю одновременно и такие, что X0F(x0) + [Ф'Ы] V = 0. A3) Доказательство. Введем обозначение L = Ф'(жо)Х. По усло- условию L — замкнутое подпространство. Если L ф У, то, согласно следствию 3 теоремы Хана-Банаха (п. 3 § 1 гл. IV) найдется нену- ненулевой функционал 2/о ? ^% равный нулю на L. Для него при всех х G X имеем ([Ф'(хо)Уу^х) = (у^Ф'(хо)х) = 0, так как Ф'(хо)х е L. Поэтому, приняв 2/о за У* и положив Ао = 0, получаем A3). Рассмотрим теперь случай, когда Ф(жо)Х = Y. Применив к отоб- отображению Ф теорему Люстерника, получаем, что для каждого h G X, удовлетворяющего условию при всех достаточно малых t существует такой элемент x(t,h) = хо +th + r(t), что Ф(х(г,Н)) = 0, t^lKt)!! -У 0 при t -У 0. Рассмотрим функцию f(t)=F(x(t,h)). Ее производная в нуле = F'(xo)h 4L dt t=o
524 Гл. X. Элементы дифференциального исчисления должна быть равна нулю. Действительно, если F'(xo)h = c^0, то знак разности F(x(t, h)) - F(x0) = ct + F'(xo)r(t) + o(t) определяется членом ct и, следовательно, меняется при замене t на — ?, а при этом в точке хо не может быть экстремума. Итак, мы получаем, что F'(xo)h = 0 для всех h таких, что h Е КегФ'(жо). Иначе говоря, Ff(xo) есть элемент из X*, ортогональный подпро- подпространству КегФ'(жо) С X. Но согласно лемме об аннуляторе ядра оператора (см. п. 5, § 5, гл. IV) [КетФ'(хо)]±=1т[Ф'(хо)}\ Это означает, что если F'(xo) Е [КегФ'(жо)]"*", то найдется такой функционал у* Е Y*, что F'(x0) = -[Ф'(хо)}*у*. A4) Положив Ао = 1 и взяв тот функционал у*, для которого выполнено равенство A4), мы и получим A3). Доказанная теорема представляет собой бесконечномерное обоб- обобщение известного из классического анализа правила множителей Лагранжа для задач на условный экстремум. Действительно, если X и Y — конечномерные пространства, т. е. если ищется минимум функции /о(жъ • • • Jxn) при условиях fi(xi,... ,хп) = 0 (г = 1,... ,га), то функционал у* — это система т чисел Ai, ... , Am. Условие замк- замкнутости образа пространства X в Y при линейном отображении в ко- конечномерном случае выполнено автоматически. Равенство A3) при этом превращается в т г=0 т. е. в известное правило Лагранжа для нахождения условного экс- экстремума. § 4. Метод Ньютона Одним из хорошо известных методов решения уравнений вида f(x) = 0 A) (/ — числовая функция числового аргумента, определенная на не- некотором отрезке [а, Ь]) является так называемый метод Ньютона,
4. Метод Ньютона 525 или метод касательных. Он состоит в том, что по рекуррентной формуле хп+1-хп f{xn) B) ищутся последовательные приближения к решению. (За нулевое приближение жо при этом берется произвольная точка того от- отрезка, на котором / определена.) Геометри- Геометрический смысл этого метода иллюстрирует- иллюстрируется рис. 24. Можно показать, что если ж* — единственный корень уравнения A) на отрез- отрезке [а, Ь] и функция / имеет на этом отрезке не обращающуюся в нуль первую производ- производную и ограниченную вторую производную, то существует «область притяжения корня ж*», *о*iХ2 N. т. е. такая окрестность точки ж*, что при лю- ^¦^ бом выборе точки xq в этой окрестности по- Рис. 24 следовательность B) сходится к ж*. Метод Ньютона может быть перенесен на операторные уравнения. Мы изложим его для уравнений в банахо- банаховых пространствах. Рассмотрим уравнение F(x) = 0, C) где F — отображение банахова пространства X в банахово про- пространство Y. Предположим, что отображение F сильно дифферен- дифференцируемо в некотором шаре В(хо,г) радиуса г (центр которого жо мы примем за нулевое приближение искомого решения). Заменяя, как и в одномерном случае, выражение F(xq) — F(x) его главной линейной частью, т.е. элементом ^;(жо)(жо —х), мы получаем из C) линейное уравнение F'(xo)(xo-x)=F(xo), решение которого естественно рассматривать как следующее приближение к точно- точному решению ж уравнения C) (существование оператора [^(жо)] здесь, конечно, предполагается). Повторяя те же рассуждения, мы получаем последовательность xn+1=xn-[F'{xb)]-l{F{xn)) D)
526 Гл. X. Элементы дифференциального исчисления приближенных решений уравнения C). В бесконечномерном случае нахождение обратного оператора [F'f^)] может быть достаточ- достаточно сложной задачей. Поэтому здесь бывает целесообразно пользо- пользоваться так называемым модифицированным методом Ньютона (см. [27, 28]). Модификация состоит в том, что вместо последовательно- последовательности D) рассматривается последовательность, определяемая форму- формулой Xn+i =xn- [F'ixoT^Fixn)), E) т.е. обратный оператор [^'(жо)] берется на каждом шаге при од- одном и том же значении аргумента х = х$. Хотя такая модифика- модификация уменьшает скорость сходимости, она часто оказывается целесо- целесообразной с вычислительной точки зрения. Перейдем теперь к фор- формулировке и доказательству точного утверждения. Теорема 1. Пусть отображение F сильно дифференцируемо в некотором шаре В(хо,г) с центром хо и радиусом г, а производная F{x) удовлетворяет в этом шаре условию Липшица: \\Fl(x1)-F'(x2)\\^L\\x1-x2\\. Пусть [Ff (хо)] ~1 существует и M=\\[F'(xo)]-1\\, k=\\[F'(xo)}-1F(xo)\\, h = MkL. Тогда, если h < 1/4, то в шаре \\х — хо\\ ^ Ыо, где to — мень- меньший корень уравнения Ы2 — t + 1 = 0, уравнение F(x) = 0 имеет единственное решение х* и последовательность {хп}, определяемая рекуррентной формулой E), сходится к этому решению. Доказательство. Рассмотрим в пространствеX отображение Ах — х — [Ff(xo)]~1F(xo). Его сильная производная равна 0 в точ- точке хо. Это отображение переводит шар ||ж — жо|| ^ kto в себя. Дей- Действительно, Ах - хо = х - хо - [F\xo)]~1F(x) = = [F'{xo)]-l{F'{xo){x - хо) - F(x) + F(x0)} - [F'(xoT1 F(x0). Поэтому \\Ax - soil ^ Н^'ЫГ1!! • \\F\xo){x - x0) - F(x) + F(xo)\\ + + ||Ас-а;оКМ||^'(а;о)(а;-а;о)-^(а:)+^(а;о)|| + А:. F) Рассмотрим вспомогательное отображение Ф{х) = F{x) - F(x0) - F'(xo){x - хо).
4. Метод Ньютона 527 Оно дифференцируемо и его производная равна Ф'(х) = F'(x) - —Ff(xo). Если ||ж — жо|| < kto, то имеет место оценка ||Ф'(ж)|| = \\F\x) - *"ЫН «С Ц\х - жо|К Ltok. Отсюда по теореме о среднем (формула (9) § 1) получаем ||Ф(а;)|| = \\Ф(х) - ФЫ|| ^ Ltok\\x - хо\\ ^ Lt20k2. G) Итак, если ||ж — жо|| ^ tok, то из F) и G) получаем \\Ах - хо\\ ^ MLtlk2 + k = k(MLt20k + 1) = k(ht20 + 1) = kt0, а это и означает, что отображение А переводит шар ||ж — жо|| ^ kto в себя. Покажем теперь, что А — сжимающее отображение этого шара. При ||ж — жо|| ^ kto имеем А'(х) =1- [F'ixo^F'ix) = [F'ixoT^F'ixo) - F'(x)), откуда \\А'(х)\\ <: M\\F'(x0) - F'(x)\\ <: ML\\x - xo\\ ^ MLkt0. Ho to — меньший корень уравнения ht2— ?+1=0, т.е. to = —^h ' Поэтому ||A'(aO|| ^ MLkt0 = hto = hl~^h~Ah = 1 ~ ^ ~ 4h =q<\, (8) откуда \\Ax\ — Ax2\\ < ^\\x\— Ж2Ц, т. e. A — сжимающее отображение. Следовательно, отображение А имеет в шаре ||ж — жо|| ^ kto одну и только одну неподвижную точку ж*. Для этой точки х* =ж* - [F'ixo^Fix*), т.е. F(x*)=Q. Вместе с тем Ахп = хп- [Ff(x0)]~1F(xn) = хп+1 и в силу теоремы о сжимающих отображениях последовательность {хп} сходится к х*. Из неравенства (8) сразу вытекает следующая оценка скорости сходимости модифицированного метода Ньютона: ^xoT'Fixo)]], (9) т. е. погрешность модифицированного метода Ньютона убывает как геометрическая прогрессия. Отметим для сравнения, что обычный метод Ньютона (в котором приближения определяются формулой D), а не E)) сходится быстрее, чем геометрическая прогрессия: для этого метода 1 \\ХП Х || ^ O7l-
528 Гл. X. Элементы дифференциального исчисления Пример. Рассмотрим нелинейное интегральное уравнение ъ x{s) = I K(s,t,x(t))dt, A0) а где K(s,t,u) — непрерывная и непрерывно дифференцируемая функция своих аргументов. Введя отображение у = F(x), опреде- определяемое равенством ъ y(s)=x(s)- fK(s,t,x(t))dt, а запишем уравнение A0) в виде F(x) = 0. Пусть хо — нулевое приближение для решения этого уравнения. Тогда первая поправка Ax(s) = х\ — хо определяется из уравнения F'(xo)Ax = -F(xo). A1) Если функция K(s,t,u) и функциональное пространство, в кото- котором рассматривается уравнение A0), таковы, что производная Ff(x) отображения F может быть вычислена «дифференцированием под знаком интеграла», т. е. если z = F'(xo)x означает, что ъ z(s) = x(s) - f K'u(s,t,x0(t))x(t)dt, a то уравнение A1) принимает вид ь Ax(s) = f K'u(s,t,x0(t))Ax(t) dt + ipo(s), A2) a где b <Po(s)= I K(s,t,xo(t))dt-xo(s). a Аналогично находятся и следующие поправки. Таким образом, нахождение каждого следующего приближения сводится к решению линейного интегрального уравнения. Если применяется модифицированный метод Ньютона, то при этом на каждом шаге приходится решать линейное уравнение с одним и тем же ядром. Более подробное изложение метода Ньютона и связанных с ним вопросов имеется в книге [28], а также в статье Л. В. Канто- Канторовича [27], которому и принадлежат основные результаты, относя- относящиеся к обоснованию метода Ньютона для операторных уравнений.
ДОПОЛНЕНИЕ БАНАХОВЫ АЛГЕБРЫ В. М. ТИХОМИРОВ В третьей главе этой книги изучались линейные пространства. Там был выделен важный класс линейных пространств — банаховы простран- пространства. Здесь, в этом дополнении, будут изучаться банаховы алгебры, т. е. банаховы пространства, в которых определено умножение элементов. Наличие умножения в сочетании с линейной и метрической структурой наделяет банаховы алгебры рядом замечательных свойств. § 1. Определение и примеры банаховых алгебр 1. Банаховы алгебры, изоморфизмы банаховых алгебр. Напом- Напомним, что линейным пространством называется непустое множество эле- элементов, в котором введены две операции — сложение и умножение на чи- числа, удовлетворяющие восьми аксиомам, сформулированным в § 1 гл. III. Определение 1. Линейное пространство X называется алгеброй, если в нем введена еще одна алгебраическая операция — умножение, которое подчинено следующим аксиомам: 1. (xy)z = x(yz). 2. х(у + z) = ху + xz; (у + z)x = ух + zx. 3. а(ху) = (ах)у = х(ау). 4. Если существует элемент е ? I такой, что ех = хе = х для всех х G X, то е называется единицей алгебры X, а сама алгебра называется алгеброй с единицей1) . 5. Если операция умножения коммутативна, т. е. если выполняется ак- аксиома: ху = ух, то алгебру X называют коммутативной алгеброй. Коммутативные алгебры с единицей и будут в основном объектом на- нашего дальнейшего рассмотрения. Всюду в этом дополнении числовое поле, над которым рассматрива- рассматриваются наши алгебры, это поле С комплексных чисел. В § 3 гл. III было введено понятие нормированного пространства, т. е. линейного пространства, снабженного нормой ||ж||, удовлетворяющей трем аксиомам, сформулированным в п. 1 § 3 гл. П. 1) Единица в алгебре всегда единственна, ибо если бы элемент е1 также обладал свойством 4, то мы бы получили ее' = е = е'.
530 Дополнение. Банаховы алгебры Определение 2. Нормированное пространство X называется нор- нормированной алгеброй, если оно является алгеброй с единицей и при этом выполнены еще две аксиомы: 6. ||е|| = 1. 7- Если нормированная алгебра X вдобавок полна (т.е. является ба- банаховым пространством), то она называется банаховой алгеброй. Отображение F: X —»¦ У называют гомоморфизмом алгебры X в У, если удовлетворяются условия: F(x + у) = Fx + Fy, A) F(ax) = aFx, B) F{xy) = Fx • Fy. C) Две алгебры, Х и У, называются изоморфными, если существует взаимно однозначное отображение F, удовлетворяющее услови- ям A)-C). Нормированные пространства X и У называют изометричными, если существует взаимно однозначное отображение F: X —»- У, для которого выполнены условия A) и B) и, кроме того, \\Fx\\Y = \\x\\x. Определение 3. Две банаховы алгебры X и У мы назовем изоме- изометрически изоморфными, если существует алгебраический изоморфизм F: X •<->- У, являющийся изометрией X и У как нормированных пространств. 2. Примеры банаховых алгебр. 1. Поле С. Комплексные числа {z} доставляют простейший пример банаховой алгебры, если ввести норму формулой: z = х + гу. Комплексные числа образуют поле С. В поле С для всех элементов, кроме нуля, определено деление — операция, обратная умножению. Мы покажем в дальнейшем, что С есть единственная нормированная алгебра, являющаяся полем. 2. Алгебра Ст- Пусть Т — некоторое компактное хаусдорфово то- топологическое пространство. Обозначим через Ст линейное пространство всех непрерывных комплексных функций x(t), заданных на Т с обычны- обычными для функций операциями сложения и умножения на число, в котором норма определяется равенством \\x\\ =тах|ж(Г)|. Ранее в гл. II и III рассматривался частный случай пространства Ст, когда Т = [а, Ь] есть отрезок вещественной прямой. Другим важным част- частным случаем пространства Ст является пространство Сп = {(zi,..., zn)}
§ 1. Определение и примеры банаховых алгебр 531 n-мерных комплексных векторов, т. е. функций на пространстве из п то- точек. Сложение, умножение на числа и умножение элементов Сп произво- производятся покоординатно, а норма определяется формулой Алгебра Ст является коммутативной банаховой алгеброй. Единицей в Ст служит функция e(t) = 1. Проверка всех аксиом не составляет труда. 3. Алгебра Л аналитических функций в круге. Обозначим через Л линейное пространство всех функций x(z) комплексного перемен- переменного z, определенных и непрерывных в круге К = {z: z ^ 1} и анали- аналитических внутри этого круга. Определим умножение в Л как обычное умножение функций и зададим норму формулой \\x\\ = max |ж(^)|. Этим путем мы превратим Л в коммутативную банахову алгебру с еди- единицей. Справедливость всех аксиом и здесь вполне очевидна. 4. Алгебра 1\. Обозначим через h совокупность всех двусторон- двусторонних абсолютно суммируемых комплексных последовательностей х = = (..., х-п,..., ж-1, жо, xi,..., хп,...) с нормой оо к = — оо Произведением х • у двух таких последовательностей: У = (. ..,г/-п,...,2/о,...,2/п,...) назовем их свертку z = х * у, т.е. последовательность, члены которой определяются так: оо Zn = (х *у)п = ^^ Хп-кУк- E) к = — оо Если каждой последовательности х из h сопоставить ряд Фурье x{t) = оо = ^2 хк^гЫ @ ^ t ^ 2тг), то последовательность, определенная фор- к = -оо мулой E), соответствует произведению функций x(t) • y(t), построенных по последовательностям хну. Таким образом, алгебра h и алгебра W функций x{t) с абсолютно сходящимися рядами Фурье и нормой, опре- определяемой D), изометрически изоморфны. Поэтому большинство аксиом алгебры и нормированного пространства для h проверяются без труда, так как для W они верны тривиально. Проверим аксиому 7. Имеем для z = х * у: п,к
532 Дополнение. Банаховы алгебры Алгебра W, очевидно, коммутативна, следовательно, коммутативна и алгебра 1\. Единицей в h служит последовательность е, соответству- соответствующая функции e(t) = 1: у этой последовательности все компоненты суть нули, за исключением компоненты с нулевым номером, которая равна единице. В дальнейшем мы будем пользоваться изоморфизмом li ++ W и соответствием {хп} •<-»¦ x(t), не оговаривая этого особо. 5. Банахова алгебра ограниченных операторов. Пусть X — банахово пространство. Рассмотрим пространство С(Х,Х) всех ли- линейных непрерывных операторов, преобразующих X в себя, с обычными для операторов действиями сложения, умножения оператора на число и умножения (п. 3 § 5 гл. IV). Единицей в С(Х,Х) служит тождествен- тождественный оператор. Превратим С(Х,Х) в банахову алгебру, определив норму как обычно: \\A\\ = sup \\Ax\\. Действительно, аксиома 7 была уже проверена ранее (см. формулу D) в п. 3 § 5 гл. IV). Доказать полноту ?(Х,Х) представлялось читателю в упражнении, приведенном там же. Алгебра С(Х, X) — один из важней- важнейших примеров некоммутативной банаховой алгебры с единицей. 3. Максимальные идеалы. Определение 4. Идеалом I коммутативной алгебры X называется подпространство X, обладающее тем свойством, что для всякого у Е I и любого х из X произведение ух принадлежит I. Идеал, состоящий из одного нуля, а также идеал, состоящий из всего X, мы называем тривиальными и в дальнейшем исключаем из рассмотрения. Максималь- Максимальным называется идеал, не содержащийся ни в каком другом нетривиаль- нетривиальном идеале. Введенные понятия рассмотрим на примере алгебры Ст- Пусть Т — непустое подмножество компакта Т. Множество Mjr = = {x(t) E Ст'- x(t) = 0,t G J7}, состоящее из функций, обращающихся в нуль на J7, образует, как легко видеть, идеал в Ст- Максимальные идеалы в Ст допускают простое описание, являющееся к тому же ключом к пониманию всего замысла теории коммутативных банаховых алгебр. Лемма 1. Максимальный идеал алгебры Ст есть совокупность всех функций из Ст, обращающихся в нуль в какой-либо одной фиксированной точке то множества Т. Доказательство, а) Пусть MTQ = {x(t) Е Ст : ж (то) = 0}. Тогда Мто есть идеал. Покажем, что он максимален. Действительно, пусть xo(t) ф Мто, т.е. жо(то) ф 0. Для любого y(t) E Ст положим: z(t) = y(t) —-(—^-. Тогда 2(то) = 0 и, следовательно, z(t) принадле- жит Мто. Итак, добавление любого элемента не из Мто приводит к тому, что идеал, порожденный Мто и этим элементом, становится тривиаль- тривиальным. Следовательно, Мто — максимален.
§ 2. Спектр и резольвента 533 б) Пусть наоборот, М — какой-либо максимальный идеал из Ст- Покажем, что все функции, входящие в этот идеал, обращаются в нуль в некоторой точке. Действительно, если это не так, то для каждой точ- точки т G Т найдется функция xT{t) Е М такая, что хт(т) ф 0. В силу непрерывности xT(t) no t найдется такая окрестность UT точки т, что xT(t) ф 0 в UT. Из открытого покрытия Т C{JUT выберем конечное по- т крытие UT1,..., UTn . Тогда в силу определения идеала п xo(t) = хТ1 (t) • хТ1 (t) + • • • + хТп (t) • хТп (t) = Y^ \xrk (t)\2 k = l принадлежит М. В силу того, что xo(t) > 0 всюду на Т, функция l/xo(t) будет непрерыв- непрерывной. Поэтому 1 = (l/(xo(t)) • xo(t) E M. Но идеал, содержащий единицу алгебры, содержит и любой элемент алгебры, ибо y(t) = y(t) • 1. Поэтому М — тривиальный идеал, что противоречит предположению о том, что М — максимальный, а следовательно, нетривиальный идеал. Таким образом, мы получили, что между максимальными идеалами и точками из пространства-носителя Т можно установить взаимно од- однозначное соответствие. Это позволяет трактовать функции на Т как «функции на пространстве максимальных идеалов». Мы покажем, — ив этом цель излагаемой ниже теории коммутативных банаховых алгебр, — что всякая такая алгебра X допускает реализацию в виде подалгебры алгебры непрерывных функций на компактном хаус- дорфовом топологическом пространстве, образованном ее максимальны- максимальными идеалами. § 2. Спектр и резольвента В этом параграфе алгебра X не обязательно коммутативна, но имеет единицу. Многие рассмотрения здесь подобны тем, которые проводились в § 5 гл. IV. 1. Определения и примеры. Определение. Элемент х ? X называется обратимым, если имеет обратный, т.е. если найдется такой элемент ж, что х • х~х = х~х • х = е. В противном случае элемент х называется необратимым. Спектром а(х) элемента х Е X называется множество комплексных чисел Л, для которых элемент Ле — х необратим. Если Л ^ сг(ж), точку Л называют регулярной. Функция Rx : С \ <т(х) -+ X, Rxx = ж(Л) = (Ле - ж),
534 Дополнение. Банаховы алгебры определенная на множестве регулярных точек элемента ж, называется резольвентой этого элемента. Спектральным радиусом г (ж) элемента iGl называется число г(ж) = sup |Л|. A) \?<т(х) Введенные важные понятия проиллюстрируем на примерах. а) Если X = С, то обратимы все элементы кроме нуля. б) Если X = Ст, то для обратимости x{t) необходимо и достаточно, чтобы функция x{t) была всюду отлична от нуля. Спектр а(х) совпадает с множеством значений ж(?); резольвента R\ имеет вид Ял = \-x(ty а г(х) = ||ж|| = тах|ж(?)|. в) Если X = C(Y,Y) — алгебра ограниченных операторов, то обрати- обратимые элементы суть обратимые операторы, спектр и резольвента в этом случае совпадают со спектром и (с точностью до знака) резольвентой опе- оператора, которые были введены в п. 7 § 5 гл. IV. Собственно говоря, в этом параграфе мы в общем виде исследуем те понятия, которые вводились ранее для банаховой алгебры ограниченных линейных операторов. 2. Свойства спектра. Теорема 1. 1°. Для любого линейного функционала /(ж) из сопря- сопряженного пространства X* функция /(ж(Л)) = F(X) аналитична на С\сг(ж) и F(X) ->> О при |Л| ->> оо. 2°. Спектр а(х) элемента х банаховой алгебры X есть непустое ком- компактное множество в С. Имеет место неравенство: r(x) ^ \\x\\. B) Доказательству теоремы 1 предпошлем несколько лемм. Лемма 1 (ср. с теоремой 5 § 5 гл. IV). Пусть элемент х из банаховой алгебры X имеет норму, меньшую единицы. Тогда элемент е — х обратим и (е - ж) = е + х-\ \-хп + ... Действительно, положив sn = е + х + • • • + жп, имеем: k IMIn+1 I Итак, последовательность sn фундаментальна. Так как X полно, то она сходится к некоторому элементу s ? X. При этом s(e — ж) = lim sn(e — ж) = lim (e — xn+1) = e. п—)-оо п—)-оо Аналогично доказывается, что (е — x)s = е.
§ 2. Спектр и резольвента 535 Следствие. Для всякого ж Е X (е — tx)~ —te при t —>- 0. Действительно, (е — ?ж)-1 = lim (е + tx + • • • + (tx)n) = е + O(t). п—)-оо Лемма 2 (ср. с теоремой 4 § 5 гл. IV). Пусть жо — обратимый элемент Тогда х\ = жо + Аж — обратимый элемент, при этом Действительно, xi=xo+Ax=xo(e+xo~1Ax)=xo(e—ж), ||ж|| = ||—ж^ Применив лемму 1, мы находим, что ж^~ = (е — ж)~ ж^ , что и требо- требовалось. Следствие 1. Множество обратимых элементов банаховой алгебры открыто (в нормированной топологии банаховой алгебры). Множество не- необратимых элементов замкнуто. Следствие 2. Резольвента ж (Л) есть непрерывная функция от Л на С \ а(х). Действительно, в силу следствия из леммы 1 х(Хо + АЛ) = (Лое - х + АЛе) = (е + А\х(Хо)У1х(Хо) > х(Х0). АЛ-^О Лемма 3 (ср. с п. 7 § 5 гл. IV). Пусть X, /i E С \ <т(ж). Тогда а) Лаж • Ямж = Ямж • R\x; б) R\x — R^x = (ц — X)R\x • R/^x (тождество Гильберта). Доказательство. а) Лаж • Ямж = (Ле — x)~1(/ie — х)~х = [(/хе — х)(Хе — ж)] = = [(Ле — х)(/ле — ж)] = R^ б) В силу а) и определения R\ и Ям имеем R\x = (/хе — x)R\x • Ямж, Ямж = (Ле — x)R\x • Ямж, откуда Яаж — R^x = (/хе — Xe)R\x • Ямж = (// — X)R\x • Ямж, что и требо- требовалось. Следствие. Если Ло Е С \ сг(х), то х'(Хо) = —ж2(Ло). Имеем в силу б) и следствия 2 леммы 2: = lim Л—^Ло Теперь докажем теорему 1.
536 Дополнение. Банаховы алгебры 1°. Пусть /(ж) — линейный непрерывный функционал на ж, т.е. /(ж) G X*. Положим F(A) = /(ж(Л)) = f(R\x). Имеем в силу следствия из леммы 3 для Ло ф <т(х): Таким образом, доказана аналогичность F(X). Далее, при |Л| > ||ж|| в силу леммы 1 мы получим: ША)тш|х.| 2°. а) Непустота спектра сг(ж). Пусть сг(ж) = 0. Тогда в силу 1° для всякого элемента / Е X* F(A) — целая функция, стремящаяся к нулю при |Л| —>- оо. Значит, F(X) = 0, т. е. /((Ле — ж)) = 0 для любого / Е X*, а значит, в силу следствия 4 из теоремы Хана-Банаха (п. 3 § 1 гл. IV), (Ле — х)~ =0, чего не может быть. б) Компактность спектра а(х). Если |Л| > ||ж||, то в силу лем- леммы 1 элемент Ле — ж = Л(е— у) обратим, откуда следует ограничен- ограниченность сг(х), а заодно и неравенство B). Замкнутость а(х) следует сразу из леммы 2: если Ло регулярно, то окрестность |АЛ| < Ця^Ао)!! состоит из регулярных точек, так как (Ло + АЛ)е — х = Лое — х + АЛ е. Отметим два следствия из теоремы 1. Следствие 1. Банахова алгебра над полем С, являющаяся полем, изометрически изоморфна С. Действительно, пусть X есть «банахово поле» и ж — произвольный элемент из X. Найдем то Л, для которого элемент Ле — ж необратим и, значит, есть нуль. Мы получим, что ж = Ле. Легко понять, что соответ- соответствие ж •<->- Л есть изоморфизм X и С. Так как ||е|| = 1, то ||ж|| = |Л|. Мы получили изометрию X и С. Следствие 2. Спектр любого нулевого оператора А из С(Х,Х) не пуст. Это утверждение без доказательства уже формулировалось ранее (см. гл. IV, § 5, п. 7). 3. Теорема о спектральном радиусе. Теорема 2. Имеет место следующая формула для спектрального радиуса: r(x) = lim д/INF- (З)
3. Некоторые вспомогательные результаты 537 Действительно, пусть / — любой элемент из X*. В силу теоремы 1 функция F(X) = /(ж(Л)) аналитична на С \ а(х). В частности, F(X) ана- литична в области |Л| > ||ж||. В этой области в силу леммы 1 / j Л П-\- L ' п=0Л откуда п=0 причем это разложение, верное вследствие леммы 1 при |Л| > ||ж||, должно иметь место при |Л| > г (ж) в силу теоремы единственности для аналити- аналитических функций и, значит, sup А 71 + 1 < оо. Мы получили, что множество векторов хп/Хп+1 является слабо огра- ограниченным, а значит, оно ограничено сильно. (Этот результат, называемый иногда принципом равномерной ограниченности, или теоремой Банаха- Штейнгауза, был доказан в § 3 гл. IV: подробнее об этом см. в моногра- монографии [21], гл. П.) Таким образом, существует число с(Л), зависящее от Л, такое, что II хп ; с(л), II Л ¦ откуда lim ||ж?г||1/7г ^ |Л| для всех {Л : |Л| > г(ж)}, т.е. п—)-оо Ш \\хп\\^п^г(х). п—Уоо С другой стороны, если Л Е <т(ж), то Хп Е сг(хп), так как эле- элемент Хпе — хп, очевидно, делится на Ле — х. В силу теоремы 1, если ц Е &(х), то \/л\ ^ ||ж||. Полагая /i = Лп, полагаем, что из Л Е <т(ж) следует, что |Л| откуда r(x) ^ lim ^/||xn||. Теорема доказана. § 3. Некоторые вспомогательные результаты В этом коротком параграфе сосредоточен ряд вспомогательных утвер- утверждений, при доказательстве которых используются стандартные техни- технические приемы. 1. Теорема о фактор-алгебре. Пусть X — коммутативная банахова алгебра с единицей, / — идеал в X.
538 Дополнение. Банаховы алгебры Отметим, во-первых, что / состоит лишь из необратимых элемен- элементов, ибо если z G / обратим, то для любого х Е X мы получим, что (xz~x)z = х Е /, т. е. I тривиален, а этот случай мы исключаем. Во- вторых, в силу леммы 1 § 2 расстояние от единицы е до любого необра- необратимого элемента, а значит, и до любого идеала, не меньше единицы. Рассмотрим теперь фактор-пространство X/I (см. § 1 гл. III) и опреде- определим там операцию умножения, назвав произведением двух классов ? и ц из X/I тот класс ?, который содержит элемент х • у, где жиу — предста- представители классов ? и ту. (Проверьте, что результат не изменится, если хну заменить любыми другими представителями тех же классов ? и т/, и что введенная операция «умножение» удовлетворяет аксиомам 1-5 § 1.) Таким образом, X/I становится коммутативной алгеброй. Назовем ее фактор-алгеброй Хпо идеалу I. Введем в X/1 норму, как и в п. 3 § 3 гл. III: ||€|| = inf||x + 2/||, yei где х — представитель ?. Имеет место Теорема!.. Если X — есть банахова алгебра, а I — замкнутый идеал в ней, то фактор-алгебра X/I также является банаховой алгеброй с еди- единицей. В п. 3 § 3 гл. III было показано, что фактор-пространство банахова пространства по любому его замкнутому подпространству является ба- банаховым пространством. Таким образом, нам остается лишь проверить, что выполняются аксиомы 6 и 7 из п. 1 § 1: а) ||^|| = inf \\xy + z\\ <С inf ||(x + u)(y + v)\\ «С z?l u,v?l ^\\ + \\\\y + \\ u?l v?l 6) E = e+I, т.е. E2 = e2+I=e+I, значит, Е2 = Е, откуда 2. Но элемент Е не эквивалентен нулю, так как окрестность точки е, как мы отметили выше, не содержит необратимых элементов, из которых состоит /. Значит, 1 ^ \\E\\. Но, с другой стороны, \\E\\ = inf ||e + г/||, т.е. u?l \\E\\ ^ 1. Итак, \\E\\ = 1. Теорема доказана. 2. Три леммы. Нам далее понадобятся три леммы: теоретико-мно- теоретико-множественная, алгебраическая и топологическая. Лемма 1. Всякий нетривиальный идеал I содержится в максималь- максимальном идеале. Доказательство этой леммы основано на лемме Цорна, сформулиро- сформулированной в п. 7 § 5 гл. I. Действительно, пусть J — множество всех нетривиальных идеалов, содержащих /. Оно частично упорядочено по вложению: I\ ^ /2, если 1\ С /2- Для всякого линейно упорядоченного множества {/«} из J объ- объединение IJ Ia есть нетривиальный идеал, служащий верхней гранью для a {Ia}- Значит, в силу леммы Цорна / подчинен максимальному элементу в J, т. е. максимальному идеалу.
4. Основные теоремы 539 Следствие. Если X не есть поле, то в нем имеется максимальный идеал. Более того, каждый необратимый элемент, отличный от нуля, со- содержится в некотором максимальном идеале. Действительно, возьмем любой необратимый элемент жо / 0 и рас- рассмотрим совокупность хо • X. Это есть, конечно, идеал. Он содержит хо и не содержит е — единицы X, т. е. не является тривиальным идеалом, следовательно, в силу леммы 1 содержится в максимальном идеале. Лемма 2. Для того чтобы идеал I содержался в некотором нетри- нетривиальном идеале I С X, необходимо и достаточно, чтобы алгебра X/1 имела нетривиальный идеал. Докажем необходимость. Пусть /С/'СХ, ///', Хф1'. Выделим среди классов ? ? X/I те ?' = ж'+/, для которых х' Е I'. Лег- Легко проверить, что получится нетривиальный идеал в X/I. Достаточность получается аналогично. Лемма 3. Замыкание нетривиального идеала I есть нетривиальный идеал. Нетривиальность следует из того, что / состоит лишь из необратимых элементов, остальное следует из непрерывности алгебраических опера- операций. Следствие. Максимальный идеал замкнут. § 4. Основные теоремы В этом параграфе X — коммутативная банахова алгебра с единицей. 1. Линейные непрерывные мультипликативные функционалы и максимальные идеалы. Определение. 1. Линейный непрерывный функционал / на бана- банаховой алгебре X называется мультипликативным, если для любых х f(x-y) = f(x)-f(y). A) Совокупность всех нетривиальных линейных непрерывных мультиплика- мультипликативных функционалов мы обозначим через М. Заметим, что линейный непрерывный мультипликативный функцио- функционал мы могли бы определить как непрерывный гомоморфизм X в С. Если / Е Л4, то 1/(*I < Ы, B)
540 Дополнение. Банаховы алгебры ибо если для некоторого ж<э, по норме равного единице, |/Ы|=А>1, то |/(а#)| = Лп -> оо, т. е. мы получили бы, что / не непрерывен. Далее, /(е) = /(е2) = (/(е)J, откуда либо /(е) = 0, т. е. / тривиален, либо /(е) = 1. C) Из B) и C) следует, что нетривиальные линейные непрерывные муль- мультипликативные функционалы имеют норму единица и, следовательно, М есть подмножество единичной сферы в сопряженном пространстве X*. Нулевое подпространство функционала / (т. е. совокупность тех ж Е X, для которых /(ж) = 0) обозначим Кег/ и назовем ядром /. Лемма 1. Ядро Кег / при f E Л4 есть максимальный идеал. Действительно, из у е I = Кег / и ж Е X следует, что /(* ¦ у) = /Ы ¦ /(*) = о, т. е. у • х Е Кег /. Таким образом, Кег / — идеал. Покажем, что Кег / — максимальный идеал. Допустим, что это не так, т.е. Кег/ можно расширить до идеала I Ф X, содержащего хо (? Кег/. Но Кег/ имеет коразмерность 1 (см. гл. III, § 1, п. 6). Значит, элемент е можно представить так: е = Ажо + У, где |/ Е Кег/. Отсюда следует, что е Е /. Значит, I = X. Противоречие доказывает лемму. Лемма 2. По всякому максимальному идеалу М можно однознач- однозначно построить линейный непрерывный мультипликативный функционал / Е jM такой, что М = Кег /. Действительно, в силу следствия из леммы 3 § 3 М — замкнутый иде- идеал. Применив теорему 1 § 3, мы получим, что Х/М есть банахова алгебра. Но в силу леммы 2 § 3 Х/М не имеет нетривиальных идеалов, т. е. ал- алгебра Х/М не содержит необратимых элементов, отличных от нуля (см. следствие из леммы 1 § 3). Значит, Х/М есть поле, являющееся банаховой алгеброй. В силу следствия 1 из теоремы 1 § 2 поле Х/М изоморфно С. Это, по определению, означает, что для любого х Е X найдется однозначно число /(ж) Е С такое, что х = /(ж) • е + u, u E М. D)
4. Основные теоремы 541 Покажем, что / есть гомоморфизм. Докажем, например, что fix -у) = = /(ж) • f(y). Имеем ж = /(ж) • е + и, и G М, У = f(y) -e + v, v<EM, откуда ж?/ = /(ж) • /(г/) • е + w, w e M. Но это и означает, что /(ж • у) = /(ж) • /(г/). Соотношения /(ж + г/) = = f(x)-\-f(y) и /(Лж) = А/(ж) доказывается аналогично. Кроме того, если ж G М, то из D) следует, что /(ж) = 0, а если ж = е, то /(ж) = 1. Лемма доказана. Итак, мы получили, что между максимальными идеалами {М} и функ- функционалами / из АЛ существует однозначное соответствие. В силу этого обстоятельства условимся функционалы из АЛ обозначать /м, а буквой М — соответствующие им максимальные идеалы. Для множества всех максимальных идеалов {е} мы будем употреблять ту же букву АЛ, что и для соответствующего ему множества {/м}. Пусть ж — некоторый элемент из X. Рассмотрим функцию х(М) на множества АЛ, задав ее формулой х(М) = fM(x). E) (Значение функции ж(М), построенной по элементу ж, на максимальном идеале М равно числу /м(ж), т.е. значению на элементе ж гомоморфиз- гомоморфизма, соответствующего идеалу М'.) Мы получили реализацию элементов алгебры X в виде функций на множестве А4, о которой говорили в кон- конце § 1. 2. Топология в множестве АЛ. Основные теоремы. Нам осталось доказать, что А4 компактно в некоторой топологии и что функции х(М) непрерывны в той же топологии. Чуть ранее мы упомянули, что АЛ есть подмножество единичного ша- шара. С другой стороны, в п. 4 § 3 гл. IV было приведено доказательство для сепарабельного случая следующего утверждения. Единичный шар пространства X*, сопряэюенного к банаховому про- пространству, компактен в *-слабой топологии. Доказательство этой теоремы в общем случае можно найти, например, в [21, с. 459]. Напомним, что *-слабая топология определяется системой окрестно- окрестностей UXl,...,Xm,s(fo) = {fe X*: \f(xk) - fo(xk)\ <6, k = 1,..., m}. F) Множество АЛ мы рассмотрим именно в *-слабой топологии. Компакт- Компактность АЛ вытекает из сформулированного выше результата и следующей леммы.
542 Дополнение. Банаховы алгебры Лемма 3. Множество АЛ есть замкнутое подмножество единичного шара в X*, и функции х(М) непрерывны на АЛ. Действительно, пусть функционал /о принадлежит замыканию АЛ. Это значит, что внутри любой базисной окрестности отображения /о най- найдется гомоморфизм /м, порожденный максимальным идеалом М. Возь- Возьмем окрестности Ux,y,x+y,s(fo)- В силу F) и определения х(М) мы полу- получим \fM(x)-Mx)\<S, \MV)-Mv)\<8, G) \fM(x + y)-fo(x + y)\<6. Но /м есть гомоморфизм, т. е. /м(ж + у) = /м(ж) + /м(у). Тогда из G) следует, что Аналогично показывается, что fo(ax) = afo(x) и fo(xy) = fo(x)fo(y). (Надо взять окрестности Ux,aX:s(fo) и UX:y,xy:s(fo)-) Значит, / есть непрерывный линейный мультипликативный функцио- функционал. Далее, взяв окрестности Ues(fo), мы получим, что /о(е) = 1, т.е. /о нетривиален. Значит, /о ? АЛ, т.е. АЛ замкнуто. Покажем, что функция хо(М) = /м(ж<э) непрерывна на АЛ. Пусть Mo G АЛ. Для е > 0 возьмем окрестность UXQ?(Mo). Если М G ^жО?5 т0 в силу F) получится, что 1/мЫ - /мо(жо)| = \хо(М) - хо(Мо)\ < 6. Но это и означает непрерывность функции хо(М) в точке Mq. Лемма доказана. Теорема 1. Отображение х —»¦ ж(М) задает гомоморфизм алгебры X в алгебру См непрерывных функций на компактном хаусдорфовом про- пространстве АЛ максимальных идеалов алгебры X; при этом \\х(М)\\ =тах|ж(М)| ^ ||ж||. (8) В силу сказанного выше в этом параграфе, нам остается доказать лишь соотношение (8). Заметим, что для всякого М элемент х — /м(х)е по определению /м(ж) принадлежит идеалу М, т.е. является необратимым. Поэтому /м(ж) G сг(х). С другой стороны, взяв любое число Ао G сг(ж), мы обнару- обнаруживаем, что х — Аое необратим и, значит, принадлежит максимальному идеалу М, откуда Итак, образ АЛ при отображении х(М) совпадает с а(х). Следовательно, в силу утверждения 2° теоремы 1 § 2, мы получаем, что неравенство (8) справедливо. Нам осталось лишь уточнить теорему 1 при разных допущениях об ал- алгебре X. Введем определения трех понятий.
4. Основные теоремы 543 Определение 2. Пересечение R = р| М всех максимальных иде- мсм алов называется радикалом X. Если R = {0}, то говорят, что X не имеет радикала. Банахова алгебра X называется регулярной, если ||ж2|| = ||ж||2. Банахова алгебра X называется симметричной, если для всякой функ- функции х(М) найдется элемент у Е X такой, что у(М) = х(М). (Черта означает комплексное сопряжение.) Теорема 2. а) Если радикал алгебры X состоит из одного нуля, то отображение х —»¦ х(М) является взаимно однозначным. б) Если алгебра X регулярна, то X изометрически изоморфна со своим образом См, в частности, X не имеет радикала. в) Если алгебра X симметрична, то образ X при отображении х —»¦ —> х(М) всюду плотен в См- г) Если алгебра X обладает свойствами б) ив), то X изометрически изоморфна См- Доказательство. Сначала выведем последнее утверждение из ос- остальных. В силу б) взаимно однозначное отображение х ++ х(М) является изометрией: \\x\\x = max |ж(М)|. мем В силу в) {х(М)} всюду плотно в См- Но X — полное пространство. Значит, и {х(М)У (вследствие равенства норм в X и в См) полно, откуда Докажем а). Пусть хо ф 0, а хо(М) = 0 на j\4. Это означает, что /м(жо) = 0 для всех М, т.е. хо Е Ker/м для всех М, значит, хо Е R. Но R = {0}, откуда хо = 0. Противоречие доказывает а). Для доказательства б) заметим, что из равенства ||ж2|| = ||ж||2 сразу следует, что Применив теорему о спектральном радиусе (теорема 2 § 2), мы полу- получаем, что г(х) = \\x\\. (9) Тогда из (9), во-первых, следует, что радикал состоит только из нуля. Действительно, если допустить, что 0 ф хо Е Я, то для всех М выражение /м(жо) = 0, т.е. сг(жо) совпадает лишь с нулем, что противоречит тому, что г(хо) = \\xo\\ ф 0. Далее, из (9) следует, что отображение х ++ х(М), являющееся изо- изоморфизмом X и соответствующей подалгебры {х(М)} в См будет изоме- изометрией, ибо в силу (8) \\х(М)\\См = max \х(М)\ = г(х) = \\x\\. Доказательство в) требует привлечения одной из весьма замечатель- замечательных теорем алгебры и анализа — теоремы Стоуна-Вейерштрасса, которая звучит так:
544 Дополнение. Банаховы алгебры Пусть А есть подалгебра банаховой алгебры Ст непрерывных функций на компакт Т такая, что 1) единица (т. е. функция e(t) = 1) принадлеэюит А. 2) алгебра А разделяет точки Т (т. е. для любых t\ ф t2 существует функция x{t) ? А такая, что x{t\) ф xfa)). 3) алгебра А инвариантна по отношению к комплексному сопряэюению (т. е. из x(t) G А следует, что x(t) E А). Тогда А всюду плотна в Ст- Доказательство теоремы Стоуна-Вейерштрасса см. в [13, с. 53-56; 21, с. 296-297; 26, с. 20]. Докажем теперь в). Пусть А = {х(М)} означает образ X при отобра- отображении х —>- х(М). Из D) сразу следует, что е —»¦ е(М) = 1, т.е. е(М) = 1 Е А. Пусть Mi и М.2 — два различных максимальных идеала. Это означает, что су- существует элемент жо, принадлежащий М\ и не принадлежащий Мъ (или наоборот), откуда хо(Мг) = /мхОо) = 0, хо(М2) = /м2(ж0) ф 0, т. е. А разделяет точки М. Далее, по самому определению, симметричная алгебра А инвариантна относительно комплексного сопряжения. Приме- Применение теоремы Стоуна-Вейерштрасса приводит к в). Теорема доказана. 3. Теорема Винера; упражнения. Приложения теории банаховых алгебр весьма разнообразны. Напомним ряд результатов из алгебры и анализа, которые уже были получены вами по ходу дела. Банахова алгебра над полем С, являющаяся полем, изометрически изо- изоморфна С. Спектр любого ненулевого ограниченного оператора в банаховом про- пространстве не пуст. Для любого ограниченного оператора А в банаховом пространстве X существует предел lim ^/||An|| = г (А), и спектр А целиком леэюит в круге |Л| ^ г(А). Докажем теперь, используя теорию коммутативных банаховых алгебр, следующую теорему Винера: Если функция х(в) разлагается в абсолютно сходящийся ряд Фурье оо х(@) = Е хк& и нигде не обращается в нуль, то и функция у(в) = к = — оо = 1/х(в) также разлагается в абсолютно сходящийся ряд Фурье. Рассмотрим изометрически изоморфные алгебры 1\ и W (см. пример 4 п. 2 § 1). Найдем пространство М для них. Легко понять, что гомомор- гомоморфизм W в С достаточно задать на функции xo(t) = elt и далее он распро- распространится на W однозначно. Положим
4. Основные теоремы 545 Тогда В силу B) = 1/мЫ| ^ \Ы\ = 1, |1/С| = 1/мК)! «с откуда |?| = 1, т. е. ? = ег . Мы получили, что М находится во взаимно однозначном соответствии с окружностью |?| = 1. Для любой последо- последовательности ж = (..., ж-те,..., ж<э,..., жп,...) G /i, и соответствующей ей функции ж(?) = ^ХкегЫ G VF имеем: fc /м(ж) = /м(ж(?)) = Поэтому тот факт, что функция ж@) не обращается в нуль ни для каких —тг ^ в < тг, означает, что ж не принадлежит ни одному максимальному идеалу. Значит, в силу следствия из леммы 1 § 3, эта последовательность обратима в алгебре 1\. Положим у = ж = (..., г/-те, • • •, 2/о, • • •, 2/п, • • • )• Тогда = fM(y)= что и требовалось. Два других важных приложения теории банаховых алгебр — спек- спектральную теорему для ограниченных операторов и теорему Стоуна- Чеха — мы сформулируем ниже в виде упражнений (см. упражнения 8 и 9). Упражнения. 1. а) Показать, что пространство максимальных иде- идеалов алгебры Л (см. пример 3 п. 2 § 1) можно взаимно однозначно и не- непрерывно сопоставить с точками единичного круга ||^|| ^ 1. б) Показать, что Л регулярна, несимметрична и не имеет радикала. 2. Какое обстоятельство мешает тому, чтобы можно было утверждать, что h (см. пример 4 п. 2 § 1) изометрически изоморфна пространству См, т.е. пространству всех непрерывных функций на окружности |?| = 1? 3. Доказать, что имеет место теорема: Пусть причем x(z) ф 0 при \z\ ^ 1. Тогда функция y(z) = l/x(z) разлагается в ряд Тейлора, абсолютно сходящийся при \z\ ^ 1.
546 Дополнение. Банаховы алгебры 4. Обозначим через Сп[а,Ь] совокупность п раз непрерывно дифферен- дифференцируемых на [а, Ь] функций x(t). а) Показать, что Сп[а,Ь] становится банаховой алгеброй относительно обычных операций и нормы, задаваемой формулой: п ^-^ к\ a<t<b к=0 ^ ^ б) Найти максимальные идеалы Сп[а,Ь] (см. [13, с. 19, 20]). в) Проверить, что Сп[а,Ь] есть симметричная алгебра без радикала. Что дает в этом случае применение теоремы 2? 5. Пусть CBV [0,1] означает алгебру непрерывных комплексных функ- функций ограниченной вариации на отрезке [0,1] с нормой \\т\\ — чип ПгГЛП -I-V^Frl II II — oup 11 »*^ v У11 ' 0 L J* а) Показать, что CBV [0,1] есть банахова алгебра. б) Найти максимальные идеалы этой алгебры. 6. Привести пример банаховой алгебры, совпадающей со своим ради- радикалом. 7. Описать все замкнутые идеалы в алгебре С[а,Ь]. 8. Пусть Т — вполне регулярное топологическое пространство (см. п. 6 § 5 гл. II). Обозначим через Вт множество всех определенных на Т ограниченных комплексных функций с обычными операциями и нормой \\x\\ =sup ter а) Проверить, что Вт есть регулярная симметричная алгебра без ра- радикала. б) Показать, что точки Т гомеоморфно вкладываются в пространство М максимальных идеалов алгебры Вт, причем образ Т при этом вложе- вложении является в М всюду плотным подмножеством. в) Показать, что любая ограниченная комплексная функция на образе Т при этом вложении допускает единственное непрерывное продолжение на М. Утверждение б), дополненное тем, что М есть компакт (это послед- последнее обстоятельство сразу следует из а), если применить теоремы 1 и 2 § 4), составляет содержание известной теоремы Тихонова о бикомпактном расширении. Утверждение в) принадлежит Стоуну и Чеху. Бикомпакт- Бикомпактное расширение, обладающее свойством в), называется максимальным. Утверждение в) означает, что М есть максимальное бикомпактное рас- расширение (см. [22, с. 23]). 9. Пусть Н — гильбертово пространство. В алгебре С(Н, Н) рассмо- рассмотрим коммутативную подалгебру В(Ао), порожденную самосопряженным оператором Aq (т. е. являющуюся замыканием линейной оболочки степе- степеней Ао).
4. Основные теоремы 547 а) Показать, что В(Ао) регулярна и не имеет радикала. б) Показать, что В(Ао) симметрична, причем х(М) =ж*(М), где х* — оператор, сопряженный к оператору х G В(Ао), х(М) — отобра- отображение, построенное в § 4. По поводу б) см. также упражнение 10 в). Применение теоремы 2 § 4 к алгебре В(Ао) приводит к так называемой спектральной теореме для самосопряженных операторов (см. [22], гл. X; [26], гл. II). 10. Говорят, что банахова алгебра (необязательно коммутативная) есть алгебра с инволюцией, если имеется отображение X —)¦ X, обладающее свойствами: (х + у)* = х* + у*, (ху)* = у*х*, (ах)* = аж*, (ж*)* = х. Алгебра с инволюцией называется 5*-алгеброй, если, кроме того, ||жж*|| = = Ы\2. а) Показать, что алгебра С(Н,Н) есть 5*-алгебра (см. [22, с. 26]). б) Показать, что коммутативная 5*-алгебра регулярна (см. [22, с. 26]). в) Показать, что 5*-алгебра симметрична, более того, х(М) = х*(М) (см. [22, с. 27], лемма Аренса). Утверждения б) и в) в сочетании с теоремой 2 приводят к такому ре- результату, принадлежащему Гельфанду и Наймарку и называемому ино- иногда основной теоремой теории коммутативных банаховых алгебр: Коммутативная В* -алгебра изометрически изоморфна алгебре См и при этом изоморфизме х(М) = х*(М). Итак, абстрактный алгебраический объект, описываемый двадцатью четырьмя аксиомами A3 аксиом коммутативной алгебры, 5 аксиом, свя- связанных с нормой, аксиома полноты и 5 аксиом 5*-алгебры), оказа- оказалось возможным реализовать в виде алгебры всех непрерывных функций на компактном хаусдорфовом топологическом пространстве. Этот результат позволяет рассмотреть с единой точки зрения такие, казалось бы, весьма далекие друг от друга факты, как теорема Вине- Винера об абсолютно сходящихся тригонометрических рядах, теорема о спек- спектральном разложении самосопряженного оператора, топологические тео- теоремы Тихонова, Стоуна и Чеха и ряд других.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Абсолютная непрерывность инте- интеграла Лебега 320 Абсолютно непрерывная мера 280 — функция 361 и далее — непрерывный заряд 372 Абстрактная функция 501 Абстрактное уравнение Фредголь- ма первого рода 489 Абстрактный оператор Вольтерра 488, 491 Аддитивный функцинал 135 Аксиома выбора 44 — нормальности 104 — отделимости Т\ 103 — Т2 (хаусдорфова) 103 — - Т3 103 --ТА 104 — счетности первая 97 — вторая 96 — треугольника 54 — Цермело 44 Аксиоматическая теория множеств 45 Алгебра (банахова, коммутативная, нормированная, с единицей) 529 — множеств 48 — измеримых 289 — с абсолютно сходящимися ря- рядами Фурье 531 инволюцией 547 — функций, аналитических в кру- круге 531 , непрерывных на компакте 530 — h 531 Алгебраическая размерность 134, 154, 189 Алгебраически сопряженное прост- пространство 197 Алгебраические действия над из- измеримыми функциями 302 Алгебраическое число 29 Альтернатива Фредгольма 484 Аннулятор 195 Антисимметричность 36 Арифметическое (евклидово) про- пространство 55, 131 База топологии 94 Базис в конечномерном линейном пространстве 133 — Гамеля 134, 189 — двойственный 200 — меры 397 Банахова алгебра 529 — ограниченных операторов 532 — регулярная 543 — симметричная 543 —, основные теоремы о коммута- коммутативных 547 Банахово пространство 151 Бесконечное множество 26, 31 Бесконечномерное линейное прост- пространство 133 Биекция 21 Бикомпакт 114 Бикомпактное расширение 546 — топологическое пространство 114 Билинейное отображение 504 Бинарное отношение 25 Борелевская функция 300 Борелевское множество 53, 69 Вариационное исчисление 516, 519, 522 Вариация заряда, верхняя, нижняя и полная 371 — отображения первая 498
Предметный указатель 549 Векторное пространство 130 Верхний предел функции в точке 111 Верхняя грань 46 Вес (весовая функция) 418 Взаимно однозначное соответствие 21 между интегральными опера- операторами и их ядрами 479 линейными функционалами и гиперплоскостями 139 Внешняя мера 272, 288, 297 —, полу аддитивность 272 —, - счетная 288 Внутренняя мера 293, 297 - точка множества 68 Восстановление функции по ее про- производной 226, 358, 364, 367, 503 Вполне непрерывный оператор 253 - ограниченное множество 116 - регулярное топологическое про- пространство 105 - упорядоченное множестве 40 Всюду плотное подмножество 65 в пространстве L\ 396-399 L2 404 Вторая аксиома счетности 96 - производная отображения 504 и далее Второе сопряженное пространство 205 Выпуклая оболочка 141 Выпуклое множество 140 - тело 140 - в нормированном пространстве 194 Выпуклый функционал 142 Вычитание множеств 19 Геометрическая интерпретация ли- линейного функционала 30 - теоремы Хана-Банаха 193 Геометрический смысл нормы ли- линейного функционала 192 Геометрическое определение инте- интеграла Лебега 332 Гильбертов кирпич 117, 140 Гильбертово пространство 167, 405 - комплексное 179, 406 Гиперплоскость 138 Глобальная сходимость ряда Фу- Фурье 429 Гомеоморфизм пространств метри- метрических 62 — топологических 101 Гомоморфизм алгебр 530 Грань симплекса 141 График оператора 244 Двойственности принцип 19 Двойственный базис 200 Действительное линейное прост- пространство 131 Детерминант Грама 421 — Фредгольма 495 Диагональная процедура Кантора 32 Диаметр множества 77 Дискретная мера 280, 376 — топология 93 Дискретный заряд 371 Дисперсия 379 Дифференциал Гато 498 — Фреше 497 Дифференциалы высших порядков отображения 507 Дифференциальное уравнение в классе обобщенных функций 226 и далее — второго порядка 476 —, зависимость решений от на- начальных данных 512 —, параметра 513 — с постоянными коэффициента- коэффициентами 450 —, теорема существования и един- единственности 86—89 Дифференцируемый функционал 501 Длина кривой в метрическом про- пространстве 128 Дополнение множества 19 Достаточность запаса основных функций 225 Достаточные условия минимума функционала 520 — сходимости интеграла Фурье 439 многомерного 453 ряда Фурье 428 равномерной 431
550 Предметный указатель Евклидово пространство 155, 174 - комплексное 177 - n-мерное арифметическое 55 Единица алгебры 529 - системы множеств 48 Единичный оператор 234 Естественное отображение Е в Е** 205 Задача Коши 86 - для уравнения теплопроводно- теплопроводности 451 на плоскости 454 Задачи, приводящие к интеграль- интегральным уравнениям 473 Замена переменных в интеграле Лебега 381 Замкнутая ортонормальная систе- система 163 Замкнутое множество в метриче- метрическом пространстве 67 топологическом пространстве 92 - на прямой 69 - подпространство нормированного пространства 152 - покрытие 98 Замкнутость максимальных идеа- идеалов 539 - множества необратимых элемен- элементов банаховой алгебры 535 Замкнутый оператор 244 - отрезок 139 - шар 63 Замыкание линейное 153 - множества в пространстве метри- метрическом 63 топологическом 92 Заряд 369 - непрерывный, дискретный, абсо- абсолютно непрерывный и сингу- сингулярный 371 Знакопеременная мера 369 Идеал в кольце 532 - коммутативной алгебры 532 Измеримая функция 300, 311 —, действия над ними 302 Измеримое множество273, 289, 293, 371 —, свойства 273 Измеримость по Каратеодори 293 Изолированная точка множества в метрическом пространстве 64 Изометрически изоморфные алге- алгебры 530 Изометричность отображения нор- нормированного пространства во второе сопряженное 206 Изометрия 62 Изоморфизм алгебр 530 - между гильбертовым пространст- пространством и ему сопряженным 202 - пространств гильбертовых сепа- рабельных 169 комплексных 179 - евклидовых 168 - - линейных 132, 134 --L2(X,fi) 404 комплексных 406 - частично упорядоченных мно- множеств 37 Индикатор 36 Интеграл Дирихле 426 —, основные свойства 313 и далее - как сг-аддитивная функция мно- множества 320 - Лебега 310 и далее —, замена переменных 381 - неопределенный 339 —, основные свойства 315 - по множеству бесконечной ме- меры 324 и далее —, сравнение с интегралом Рима- на 326 —, , несобственным 328 - Лебега-Стилтьеса 377 и далее по функции монотонной 377 ограниченной вариации 378 - от простой функции 312 , свойства 313 - по множеству 312 - Пуассона 452 - Римана 326 - Римана-Стилтьеса 381 и далее - Фейера 434 - Фурье (см. Преобразование Фу- Фурье) 437 и далее - в комплексной форме 440 Интегральное неравенство Гёльде- ра 60
Предметный указатель 551 Интегральное неравенство Коши- Буняковского 57 - Минковского 60 - уравнение 472 - - Абеля 472 - - Вольтерра 90, 473, 488 —, задачи, к нему приводящие 473 - - нелинейное 89, 472, 528 - - Фредгольма 88, 473, 475, 480, 489 Интегрируемая функция 312 - простая 312 Интегрируемость ограниченной из- измеримой функции 313 Интервал в множестве порядковых чисел 113 Интерполирование по методу наи- наименьших квадратов 421 Инъекция 21 Исключающее «или» 20 Исчерпывающая последователь- последовательность множеств 325 Итерированные ядра 494 Канторова лестница 361 Канторово множество 70 —, точка первого и второго рода 71 Касательное многообразие к мно- множеству 513 Классы смежности по подпростран- подпространству 134 Колебание функции в точке 111 Колебания струны 474 Кольцо множеств измеримых 289 - -, - по Жордану 297, 298 —, порожденное полукольцом 51 - элементарных 268 Коммутативная алгебра 529 Компакт 107, 115 Компактное топологическое прост- пространство 107 Компактность замкнутых подмно- подмножеств компактного пространст- пространства 109 - интегрального оператора 255 - спектра элемента алгебры 534 - счетно-компактного метрическо- метрического пространства 118 Компактный оператор 253 - в гильбертовом пространстве 262 Комплексное пространство гиль- гильбертово 179 - евклидово 177 - линейное 178 Композиция борелевской функции с измеримой 301 - измеримых функций 301 Компонента открытого множества 73 Конечное множество 26 - разложение множества 49 Конечномерный оператор 478 Континуум-гипотеза 45 Контрпример к теореме Фубини 337 Координаты вектора в евклидовом пространстве 162 Коразмерность 135 - ядра линейного функционала 137 Корректная задача 490 Коэффициенты Фурье 164, 179, 408, 410, 426, 442, 455 —, однозначность определения функции по ним 437 - по ортонормальной системе 162 Критерий базы топологии 95 - измеримости функции 301, 311 простой 311 - компактности пространства мет- метрического 118 топологического 108 - непрерывности линейного функ- функционала в пространстве норми- нормированном 190 топологическом 189 - отображения топологического пространства 101 - полноты метрического простран- пространства 76, 77 - ортогональной нормированной системы 166 - счетно-нормированного прост- пространства 184 - предельности точки в Т\ -прост- -пространствах 103 - предкомпактности множества в полном метрическом простран- пространстве 119 - слабой сходимости в нормирован- нормированном пространстве 210 последовательности функцио- функционалов 212
552 Предметный указатель Критерий суммируемости простой функции 312 — счетной компактности топологи- топологического пространства 113 Лебегова мера 271, 273, 289 Лебегово продолжение меры 291 , полнота 292 Лемма Аренса 547 — Гейне-Бореля 107 — о замкнутости образа 485 — замыкании идеала алгебры 539 — максимальных идеалах алгеб- алгебры непрерывных функций 532 — равномерном стремлении к ну- нулю коэффициентов Фурье ком- компактного множества функций 432 — разложении гильбертова прост- пространства в прямую сумму КегТ и ГтТ* 486 — сепарабельности подмножества 171 — стремлении к нулю коэффи- коэффициентов Фурье суммируемой функции 427 — существовании максимального идеала 538 — тройке 244 — ядре мультипликативного фун- функционала 540 — об аннуляторе 194 ядра оператора 248 — об обратимости элементов, близ- близких к единичному 534 , — обратимому 535 — Рисса о множестве невидимых то- точек 345 — обобщенная 348 — Цорна 46 Леммы об идеалах фактор-алгебры 538-540 Линейная зависимость и независи- независимость 132 — оболочка 134 Линейно упорядоченное множест- множество 38 Линейное замыкание 153 — многообразие 153, 170 — абсолютно непрерывных функ- функций 363 Линейное замыкание в гильберто- гильбертовом пространстве 170 —, касательное к множеству 514 — пространство 130 и далее — топологическое 180 Линейные функционалы в счетно- нормированном пространстве 195 Линейный оператор 233 и далее (см. также оператор) —, график 244 — замкнутый 244 — непрерывный 233 — ограниченный 237 — самосопряженный 249 —, сопряженный к данному 246 — эрмитово сопряженный 249 Линейный функционал 136, 188 и далее (см. также Функционал линейный) — не непрерывный 189 Локальная выпуклость нормиро- нормированного пространства 183 — сильной топологии в Е* 199 — ограниченность нормированного пространства 182, 193 Локально выпуклое топологичес- топологическое линейное пространство 182 — ограниченное топологическое ли- линейное пространство 182 Ломаные Эйлера 121 Максимальная цепь 45 Максимальное бикомпактное рас- расширение 546 Максимальный идеал 532 — алгебры Ст 532 — элемент 37 Максимум функционала 516 Математическое ожидание 379 Мера 281, 267 и далее — абсолютно непрерывная 280 — дискретная 280 — Жордана 298 — Лебега 289 — на плоскости 273 —, непрерывность 277 —, полнота 292 — п-мерная 332
Предметный указатель 553 Мера Лебега-Стилтьеса 279, 375, 377 абсолютно непрерывная 280, 376 дискретная 280, 376 , производящая функция 375 , примеры 376 сингулярная 280, 376 - на классе прямоугольников 268 - полукольце 281 -, непрерывность 290 - полная 292 - сингулярная 280 - со счетным базисом 397 - а-аддитивная 284 - сг-конечная 294 Метод касательных 525 - математической индукции 46 - Ньютона 524 - модифицированный 526 —, пример 528 - последовательных приближений 83 - характеристических функций 468 Метризуемое пространство 106 Метрический компакт 115 Метрическое пространство 54, 55 Минимальная топология, порож- порожденная системой множеств 94 - а-алгебра 53 Минимальное кольцо, порожденное системой множеств 49 Минимальный элемент 37 Минимум функционала 516 Минор Фредгольма 495 Многочлены Лагерра 420 - Лежандра 415 и далее - Чебышева 418 - Эрмита 419 Множеств алгебра 48 - кольцо 47 - объединение 18 - пересечение 18 - полукольцо 49 - равенство 18 - разность 19 - симметрическая 19 - система 47 Множества диаметр 77 - дополнение 19 - замыкание 63, 92 Множества мощность 33 Множество 17 - бесконечное 26, 31 - всюду плотное 65 - выпуклое 140 - замкнутое 67, 92 - измеримое 273, 289, 294 - относительно ^-кольца 296 - - по Жордану 296, 299 - конечное 26 - линейно упорядоченное 38 - неизмеримое 280 - несчетное 27 - нигде не плотное 66 - ограниченное 63 - однозначности меры 298 - открытое 68, 72, 92 - относительно компактное 115 - отрицательное относительно за- заряда 369 - плотное в другом множестве 65 - положительное относительно за- заряда 369 - предкомпактное 115 - пустое 17 - симметричное 183 - совершенно упорядоченное 38 - счетное 27, 30 - счетно-предкомпактное 115 - упорядоченное 38 - частично 37 - сг-однозначности меры 299 Множители Лагранжа 524 Монотонные функции 340 Мощность континуума 34 - множества 33 - всех подмножеств натурально- натурального ряда 35 -Ni 44 Мультипликативный функционал 539 «Наивная» теория множеств 45 Наличие счетной базы у вполне ог- ограниченных метрических прост- пространств 116 Направленное множество 37 Наследственное свойство 105 Наследственность полной регуляр- регулярности 105
554 Предметный указатель Начальный отрезок упорядоченно- упорядоченного множества 42 Невидимая справа или слева точка 345, 346 Неизмеримое множество 280 Неисключающее «или» 20 Некоммутативная банахова алгеб- алгебра 532 Некомпактность единичного опера- оператора в банаховом пространстве 253 Некорректная задача 490 Нелинейное интегральное уравне- уравнение 89, 528 Необратимый элемент алгебры 533 Необходимое условие минимума функционала 520 для задачи с ограничения- ограничениями 520 , контрпример 521 - экстремума функционала 517 Неопределенный интеграл Лебега 339, 363 Неподвижная точка отображения 82, ПО Непрерывная кривая в метричес- метрическом пространстве 127 Непрерывное отображение прост- пространства метрического 61 топологического 99 Непрерывность линейного операто- оператора 237 - меры 277, 290 - слева и справа 341 - сложной функции 100 Непрерывный заряд 371 - спектр 251 - функционал на линейном топо- топологическом пространстве 188 Неприводимость а- алгебры 52 Непустота спектра элемента алге- алгебры 534 Неравенство Бесселя 163, 165, 179 - для тригонометрической систе- системы 410 - Гёльдера 58 - интегральное 60 - Коши-Буняковского 55, 155 интегральное 57, 401 - Минковского 58 - интегральное 60 Неравенство Чебышева 319 Несепарабельность пространства т 66 Несравнимые элементы 38 Несчетное множество 27 Несчетность множества действи- действительных чисел 31 Нигде не плотное множество в ме- метрическом пространстве 66 Нижний предел функции в точке 111 Норма 150 - билинейного отображения 505 - линейного оператора 238 сопряженного 247 - функционала 190 Нормальное пространство 104 Нормированная алгебра 530 Нормированное пространство 151 Нормируемость 183 - локально выпуклых, локаль- локально ограниченных линейных то- топологических пространств 183 - пространства, сопряженного к нормируемому 197 Носитель заряда 371 Нулевой оператор 234 Нуль-множество 296 Область значений функции 20 - определения оператора 233 - функции 21 Обобщение принципа сжимающих отображений 90 Обобщенная производная 223 —, сравнение с обычной 367 - теорема Арцела 124 - функция 221 и далее - комплексная 230 - на окружности 231 пространстве Кп 230 - первообразная 228 - периодическая 232 —, производная 223 - регулярная 221 - сингулярная 221 Образ множества 21 - оператора 234 - элемента 21 Обратимый оператор 240 - элемент алгебры 533
Предметный указатель 555 Общий вид линейного оператора из тгргг ГО>т OQ/1 К В К ZO4 в пространстве со 200 гильбертовом 202, 204 конечномерном 199 счетно-нормированном 195 1и1р 202 С[а, Ъ] 388 С^Ь] 391 Объединение множеств 18 Ограниченное множество в прост- пространстве метрическом 63 линейном топологическом 182 - отображение 503 Ограниченность слабо ограничен- ограниченного подмножества нормирован- нормированного пространства 209 - сходящейся последовательнос- последовательности элементов нормированного пространства 208 функционалов на банахо- банаховом пространстве 213 Однозначность определения сум- суммируемой функции по ее пре- преобразованию Фурье 442 коэффициентам Фурье 437, 442 - продолжения меры 282, 292, 298 и далее Однородно-выпуклый функционал 142 - на комплексном пространстве 147 Однородный функционал 136 Окрестность множества 103 - точки 92 Оператор 233 и далее - Вольтерра 257, 489, 489 - вполне непрерывный 253 в гильбертовом пространстве 262 - Гильберта-Шмидта 477 , компактность 477 , сопряженный оператор 479 - дифференцирования 236 - единичный 234 - замкнутый 244 - компактный 253 - в гильбертовом пространстве 262 - конечномерный 253 - линейный 233 --изГвМт 234 - непрерывный 233 - нулевой 234 - обратимый 240 - обратный к данному 240 - ортогонального проектирования 235 - самосопряженный 249, 262 - сопряженный 246 - в евклидовом пространстве 249 - Фредгольма 477 - эрмитово-сопряженный 249 Операторный метод решения диф- дифференциальных уравнений 463, 464 Операции над множествами 18 Операция замыкания в простран- пространстве метрическом 63 топологическом 106 Определяющая система окрестно- окрестностей 97 Оптимальное управление 523 Ортогонализация 159 Ортогональная нормированная си- система 157 Ортогональное дополнение 172 Ортогональность векторов 156, 178 - с весом 418 Ортогональные многочлены Лагер- ра 420 - Лежандра 417 и далее - с дискретным весом 420 - Чебышева 418 - Эрмита 419 - системы на произведении прост- пространств 415 - функций в L2 408 Радемахера-Уолша 422 Хаара 422 Ортогональный базис 157 - в пространствах Ьг(—оо,оо) и L2@,oo) 419 - из собственных векторов 266 - нормированный 157 Ортонормальная система 156 Ортопроектор 235 Основной параллелепипед гильбер- гильбертова пространства 117 Остаток упорядоченного множест- множества 42
556 Предметный указатель Отделимость выпуклых множеств в пространстве линейном 148 нормированном 194 - сильной топологии в Е* 199 Отделимые топологические прост- пространства 181 Открытое множество в простран- пространстве метрическом 68 топологическом 92 - на прямой 69 - покрытие 97 Открытость множества обратимых ограниченных операторов 243 элементов банаховой алгебры 535 Открытый отрезок 139 - шар 63 Относительная топология 94 Отношение бинарное 25 - эквивалентности 24 Отображение 21 (см. также Опера- Оператор, Функционал, Функция) 21 - билинейное 504 - гомеоморфное пространств мет- метрических 62 топологических 101 - дифференцируемое 496 - замкнутое 101 - линейного топологического про- пространства во второе сопряжен- сопряженное 205 - непрерывное 99-101 - ограниченное 503 - открытое 101 - регулярное 513 -, сохраняющее порядок 37 - п-линейное 507 - «в» 21 - «на» 21 Оценка скорости сходимости мето- метода Ньютона 527 Первая аксиома счетности 97 - вариация отображения 498 Первообразная обобщенной функ- функции 228 Пересечение множеств 18 - системы подпространств линей- линейного пространства 134 Плотное подмножество в метриче- метрическом пространстве 65 Плотность распределения вероят- вероятностей 380 Поглощение 145, 182 Подмножество 17 - собственное 17 Подпокрытие 98 Подпространство нулей линейного функционала 137 - пространства гильбертова 170 - линейного 133 нормированного 153 - метрического 61 , порожденное множеством элементов 134 - топологического 94 Покрытие (открытое, замкнутое, конечное, счетное) 97 Полная вариация заряда 371 - функции 351 и далее - мера 292 - ограниченность 115 - регулярность топологического пространства 105 - система элементов в нормирован- нормированном пространстве 153 - упорядоченность 40 Полное метрическое пространство 73 Полнота пространства рефлексив- рефлексивного нормированного 207 —, сопряженного к нормированно- нормированному, в сильной топологии 197 —, счетно-нормированного 184, 185 - - С[а, Ъ] 74 - - Li 393 - - L2 402 - - h 75 - т 76 ЕП 1-7 Л /4 En Ш>п i-7 л х, U^o 74 - системы функций Лагерра 448 тригонометрических 409, 410, 436 Уолша 422 Хаара 422 Эрмита 448
Предметный указатель 557 Полный прообраз 21 — системы множеств 53 Полуаддитивность меры 270, 286, 288 Полукольцо 49 Полунепрерывная функция на ме- метрическом пространстве 111 Полунепрерывность снизу (сверху) 111 длины кривой в метрическом пространстве 128 Пополнение пространства 78, 170 Порядковое число 40 Порядковый тип 38 --ш 39 — uj\ 44 Порядковых чисел произведение 41 — сравнение 42 — сумма 41 Порядок функционала на счет- но-нормированном пространст- пространстве 196 Последовательность сходящаяся 56, 98 — в счетно-нормированном прост- пространстве 185 обобщенных функций 222 — - слабо 208 — фундаментальная 73 «Почти всюду» 304 Почти периодические функции 466 Правило множителей Лагранжа 524 Предел последовательности в ме- метрическом пространстве 65 — справа или слева 340 Предельная точка в метрическом пространстве 64 топологическом пространстве 92 Т\ -пространстве 103 Предельный переход под знаком интеграла Лебега 321 Стилтьеса 385 Преобразование Лапласа 462-463 —, применение к решению диффе- дифференциальных уравнений 463 — Фурье 441 быстроубывающих функций 446 — в пространстве Ьг(—оо, оо) 455 — обобщенных функций 469 Преобразование Лапласа обобщен- обобщенных функций, примеры 470 —, однозначность определения функции 442 —, основные свойства 444 —, примеры 444 — свертки 447, 449 —, формула обращения 441 — функции п переменных 452 и далее — функционала 471 - Фурье-Стилтьеса 465, 468 — свертки функций с ограничен- ограниченным изменением 467 Применения принципа сжимающих отображений 81-91 - теоремы о неявной функции 510 Пример аддитивной, но не а-адди- а-аддитивной меры 285 - не вполне ограниченного множе- множества 116 - неизмеримого множества 280 - несепарабельного пространства 66, 159 - не сг-конечной меры 294 - счетно-компактного, но не ком- компактного пространства 113 - функции, дифференцируемой только слабо 500 Примеры банаховых алгебр 530 — линейных операторов 234 — функционалов 136 на нормированных простран- пространствах 190 — ортогональных базисов 157 - преобразований Фурье 444 обобщенных функций 470 - производных от обобщенных функций 224 - пространств векторных 131 — нормированных 151 — сопряженных 199 — счетно-нормированных 185 — топологических линейных 180 - слабо сходящихся последователь- последовательностей 210 - экстремальных задач 517 Принцип двойственности 19 — равномерной ограниченности 537 — сжимающих отображений 82 , обобщение 90
558 Предметный указатель Принцип сжимающих отображе- отображений, применения 81—91 Проблема Н. Н. Лузина 430 Программирование линейное и вы- выпуклое 523 Продолжение меры 282 - по Жордану 296 Лебегу 288 Произведение бесконечно диффе- дифференцируемой функции на обоб- обобщенную 222 - мер 330 - оператора на число 239 - операторов 239 - порядковых чисел 41 - функционала на число 196 - элемента линейного пространст- пространства на число 130 - элементов алгебры 530 Производная Гато 498 - заряда по мере 372 - интеграла по верхнему пределу 351, 356 - линейного отображения 497 - обобщенной функции 223 - сложной функции 497 - Фреше 497 Производные высших порядков 504 Производные числа 344 Производящая функция меры Ле- бега-Стилтьеса 376 Прообраз 21 - топологии 100 Простая функция 311 - суммируемая (интегрируемая) 312 Пространства гомеоморфные 62, 101 - изометричные 62, 530 - изоморфные евклидовы 168 - линейные 132 Пространство арифметическое 55, 131 - банахово 151 - бикомпактное 114 - быстро убывающих последова- последовательностей 186 - векторное 130 - вполне регулярное 105 - второе сопряженное 205 - гильбертово 167 Пространство дискретное 55-57, 66, 74 - евклидово 155, 177 - изолированных точек 55—57, 65, 74 - компактное 107 - линейное 130, 180 - метризуемое 106 - метрическое 54, 55 - сепарабельное 66, 97 - нормальное 104 - нормированное 151 - основных функций 219 - полное 73 - полурефлексивное 205 - регулярное 104 - рефлексивное 205 - с аксиомой счетности второй 96 первой 97 - связное 98 - сепарабельное 66, 97 - слипшихся точек 93 - со счетной базой 96 метрическое 97 - сопряженное 197 -, - к пространству быстро убыва- убывающих последовательностей 200 -, гильбертову 203 —, счетно-нормированному 203 -, С[а, Ь] 391 -, со 200 -, /i, /p 202 -, Жп, Сп 200 - счетно-гильбертово 185 - счетно-компактное 112 - счетно-нормированное 183 - топологическое 91 - функций с ограниченным измене- изменением 352 - хаусдорфово 103 - Сп 131, 133, 152, 178 - С[а,Ъ] 56, 66, 67, 131, 152, 177, 207, 212, 388 -С^Ь] 391, 518 -Сп[а,Ъ] 186, 546 -С2[а,Ъ] 57, 66, 76, 158 - комплексное 178 - СТ 530 - CBV[0,1] 546 -с 131 - со 131, 206
Предметный указатель 559 Пространство Cq 201 - К 219, 470 - К* 471 -К[а,Ъ] 181, 185, 186 - Кш 220 - Кп 230 - Li 394 и далее, 407 , плотность множества функций непрерывных 396 —, простых 396 - L2 399, 406 - комплексное 406 - Lp 404 - h 200, 206 - h 56, 66, 75, 116, 131, 157, 211 - комплексное 178 - lp 61, 207 - /;, /;* 202,207 - т 58, 66, 132, 152, 199, 206 - Ж 74, 131, 151 -Ж1 55 -Жп 55, 74, 116, 131, 133, 151, 191, 199, 210 - Жп 56, 66, 74, 151 - Ж% 58, 176, 199 - Ж^ 56, 66, 74, 151, 199 - Ж°° 132, 181 - Sao 185, 232, 233, 448, 469 - S^ 469 -V°[a,b] 391, 356 -Z470 Процесс ортогонализации 161 Прямая сумма счетного числа под- подпространств 173 - сг-алгебр 294 Прямое произведение множеств 329 - систем множеств 329 Прямоугольник 267 Пустое множество 17 Равенство множеств 18 - Парсеваля 163 - для тригонометрической систе- системы 410 - порядковых чисел 42 Равновесие нагруженной струны 473 Равномерная непрерывность отоб- отображения метрического прост- пространства 123 Равномерная ограниченность се- семейства функций 119 Равностепенная непрерывность се- семейства функций 120 Радикал банаховой алгебры 543 Разбиение множества на классы 23 Разделение выпуклых подмножеств с помощью линейных функцио- функционалов 149, 194 Разложение Жордана 371 — меры Лебега—Стилтьеса в сумму абсолютно непрерывной, диск- дискретной и сингулярной 376 — функции в ряд Фурье (см. Ряд Фурье) — монотонной на непрерывную и функцию скачков 343 — по многочленам Лежандра 415 — с ограниченным изменением на абсолютно непрерывную, сингу- сингулярную и функцию скачков 366 в разность монотонных 379 — Хана 370 Размерность линейного простран- пространства 133 Разность множеств 19 Расстояние в метрическом прост- пространстве 54 — между двумя множествами 72 — между кривыми 129 — от точки до множества 72 Регулярная банахова алгебра 543 — точка оператора 250 — элемента алгебры 533 Регулярное отображение 513 — топологическое пространство 104 Регулярность отделимых линей- линейных топологических прост- пространств 182 Резольвента оператора 251 — элемента алгебры 534 Резольвентное ядро 495 Рефлексивное линейное топологи- топологическое пространство 205 Рефлексивность 24, 36 Решетка 46 Ряд Фурье 162, 164, 164, 179, 425 — в комплексной форме 412, 440 — по ортогональной системе фун- функций 408
560 Предметный указатель Ряд Фурье по ортонормальной си- системе 162 тригонометрической системе на отрезке [—тг, тг] 409 на произвольном отрезке 410 - расходящийся 430 —, суммирование по Фейеру 434 и далее —, сходимость в точке 428 —, — глобальная 429 —, - равномерная 431 функции двух переменных 417 Самосопряженный оператор 249, 262 Сведение дифференциального уравнения второго порядка к интегральному уравнению 475 Свертка 449 - в h 531 - функций с ограниченным измене- изменением 467, 468 Свойства абсолютно непрерывных функций 362 - измеримых множеств 289 и далее - функций 300 и далее - интеграла абстрактной функции 502 - Лебега 313 и далее - Римана—Стилтьеса 382 и далее - полной вариации 352 - преобразования Фурье 444 - производной Фреше 497 - спектра и резольвенты элемента алгебры 534 - счетных множеств 27, 28, 30 - функций с интегрируемым ква- квадратом 399 Свойство параллелограмма 174 Связное двоеточие 93, 102 Связность открытого множества в - топологического пространства 98 Связь между гладкостью функции и убыванием ее преобразования Фурье на бесконечности 445 Сдвиг открытого множества 180 Сепарабельное пространство мет- метрическое 66 - топологическое 96 Сепарабельность подмножеств сепарабельного метрического пространства 171 -пространств Rn, R?, М?>, /2, С[а,Ъ], С2[а,Ъ] 66 - пространства L\ 397 - - L2 404 Сжатие (сжимающее отображение) метрического пространства 82 Сильная производная отображения 497 - сходимость в линейном нормиро- нормированном пространстве 208 - топология в пространстве, сопря- сопряженном к линейному нормиро- нормированному 197, 198 , топологическому 198 Сильно положительный квадра- квадратичный функционал 521 Сильный дифференциал 497 Симметрическая разность 19 Симметричная банахова алгебра 543 Симметричное множество в линей- линейном пространстве 183 Симметричность 24 Симплекс 141 Сингулярная функция 366 Сингулярный заряд 372 Система множеств 47 - окрестностей нуля 180 - ортогональных векторов 156 - функций Радемахера 424 Уолша 424 Хаара 422, 424 Скалярное произведение 155, 177 - в комплексном пространстве 177 - - L2 400 Скачок функции в точке разрыва 340 Слабая производная отображения 498 - сходимость в пространстве ли- линейном топологическом 208 нормированном 208 функционалов 213 С[а,Ь] 212
Предметный указатель 561 Слабая сходимость в пространстве h 211 - топология в пространстве линей- линейном топологическом 207 сопряженном 212 , - к банахову 213 и далее Слабо ограниченное подмножество в нормированном пространстве 209 Слабый дифференциал 498 След системы множеств 94 Случайная величина 379 - дискретная и непрерывная 379 Собственное значение 250 - подмножество 17 - подпространство 133 Совершенно упорядоченное множе- множество 38 Согласованные нормы 184 Соответствие взаимно однозначное 21 Сопряженное пространство 197 - ядро 479 Сопряженно-линейный изомор- изоморфизм 200 - функционал 136 Сопряженно-однородный функцио- функционал 136 Сопряженный оператор 246 - в евклидовом пространстве 249 —, свойства 247 Спектр оператора (точечный и не- непрерывный) 250 - в гильбертовом пространстве, компактного 491 - элемента алгебры 533 Спектральная теорема для ограни- ограниченных самосопряженных опе- операторов 547 Спектральный радиус 252, 536 - элемента алгебры 534 Сравнение порядковых чисел 42 - топологий 93, 96 Сравнимые нормы 184 Среднее квадратичное уклонение 401 Степень меры 332 - множества 329 - системы множеств 329 Строение класса множеств, изме- измеримых по Лебегу 289 и далее Структура 46 Струна 473 Сумма множеств 18 - упорядоченная 41 - операторов 239 - порядковых чисел 41 - функционалов 196 - элементов векторного простран- пространства 130 Суммируемая функция 312, 325 Суммы Дарбу 326 - Фейера 434 Сходимость в пространстве К 220 Li 394, 404 L2 401, 404 Soo 232 Z 470 - среднем 394 квадратичном 401 - по мере 307, 406 - последовательности в простран- пространстве метрическом 64 топологическом 98 - функций, сравнение разных ви- видов 406 - почти всюду 305, 407 Счетная аддитивность меры 270, 284, 290 Лебега 277 - база 96 - у вполне ограниченных метри- метрических пространств 116 - компактность 114 Счетно-гильбертово пространство 185 Счетно-компактное топологичес- топологическое пространство 113 Счетно-нормированное простран- пространство 183 Счетно-предкомпактное множест- множество 115 Счетное множество 27, 30 Счетность множества рациональ- рациональных чисел 27 - ортогональной системы в сепара- бельном евклидовом простран- пространстве 159 Счетный базис меры 397 Сюръекция 21
562 Предметный указатель Теорема Арцела 120 - обобщенная 124 - Банаха о замкнутом графике 244 - об обратном операторе 241 - Банаха-Штейнгауза 537 - Бэра 78 - Вейерштрасса 153, 158, 409, 413, 427, 436 - Винера 544 - Гельфанда-Наймарка 547 - Гильберта-Шмидта 263 - Егорова 305 - Кантора-Бернштейна 33 - Карлесона 430 - Лебега о восстановлении аб- абсолютно непрерывной функции по ее производной 364 дифференцируемости моно- монотонной функции 343 предельном переходе 321 - Леви 322 - Лузина 309 - Люстерника о касательном мно- многообразии 514 в разложимом случае 514 - о банаховой алгебре, изоморфной полю С 536 - вложенных шарах 76 - выборе счетного подпокрытия в пространствах со счетной базой 98 - выделении подпоследователь- подпоследовательности, сходящейся почти всю- всюду, из последовательности, схо- сходящейся по мере 308 - гомеоморфности непрерывной биекции компакта в хаусдорфо- во пространство 110 - гомоморфизме банаховой ал- алгебры в алгебру непрерывных функций 542 - дифференцировании интеграла по верхнему пределу 351 - дифференцируемости функций с ограниченным изменением 354 - достижении нижней грани по- полунепрерывной функции 112 - зависимости решения диффе- дифференциального уравнения от на- начальных данных 512 Теорема о замкнутости компакта в объемлющем хаусдорфовом пространстве 109 множества компактных опе- операторов 258 — компактности замкнутого шара в пространстве, сопряженном сепарабельному нормированно- нормированному в смысле *-слабой топологии 218 оператора, сопряженного ком- компактному 259 Гильберта-Шмидта 477 произведения операторов, один из которых компактен 259 спектра элемента алгебры 536 композиции измеримых функ- функций 301 — метризуемости единичного ша- шара в пространстве,сопряженном сепарабельному нормированно- нормированному 216 — множителях Лагранжа 524 — мощности множества всех под- подмножеств 34 — наличии счетной базы у сепа- рабельных метрических прост- пространств 97 — неподвижной точке 82 — непрерывном образе компакт- компактного пространства 110 — непрерывности композиции не- непрерывных отображений 101 — непустоте спектра 252, 536 — неявной функции, дифференци- руемость 508 , существование 508 — нормальности компакта 109 — пересечении выпуклых мно- множеств 141 колец 48 топологий 93 — полной и замкнутой ортого- ортогональных системах 164, 166 — полной ограниченности счетно- компактного метрического про- пространства 117 — полноте произведения полных ортогональных систем 415 — полноте пространства L\ 394 L2 402
Предметный указатель 563 Теорема о полноте пространства, сопряженного к нормируемому 197 — полуаддитивности меры, задан- заданной на кольце 283 — пополнении метрического про- пространства 78 — почленном дифференцирова- дифференцировании ряда из монотонных функ- функций 349 — предкомпактности ограничен- ограниченных множеств в Е* в смысле слабой топологии 217 — продолжении меры с полуколь- полукольца на порожденное им кольцо 282 — прообразе пересечения мно- множеств 22 суммы множеств 22 — пространстве, сопряженном к счетно-нормированному 204 , — гильбертову 204 — прямом произведении полуко- полуколец 329 — равенстве норм оператора и его сопряженного 247 — равномерной непрерывности непрерывного отображения метрического компакта 124 — разделении выпуклых мно- множеств 194 — разложении абсолютно непре- непрерывной функции в разность мо- монотонных абсолютно непрерыв- непрерывных функций 363 гильбертова пространства в прямую сумму подпространст- подпространства и его ортогонального допол- дополнения 172 заряда 369 монотонной функции на функцию скачков и непрерыв- непрерывную 343 отображения по формуле Тейлора 507 функции с ограниченным из- изменением в разность монотон- монотонных 354 связи выпуклых функционалов и выпуклых множеств 143 Теорема о сепарабельности про- пространства L\ 397 — слабой сходимости последова- последовательности элементов нормиро- нормированного пространства 210 функционалов на банахо- банаховом пространстве 213 — собственных векторах и собст- собственных числах компактного оператора 261, 263 — совпадении компактности и счетной компактности для про- пространств со счетной базой 114 — спектральном радиусе 252, 536 — спектре ограниченного операто- оператора 251, 536 — сравнении интеграла Римана с интегралом Лебега 326 Лебега-Стилтьеса 382 — сравнимости порядковых чисел 42 — среднем 382 — строении минимального кольца над полукольцом 51 суммируемости производной монотонной функции 359 — существовании базиса подпро- подпространства гильбертова прост- пространства 171 кривой наименьшей длины между двумя точками метриче- метрического компакта 129 минимального кольца 48 минимальной сг-алгебры 52 предельной точки у бесконеч- бесконечного подмножества компактно- компактного пространства 108 сильной производной 500 — сходимости метода Ньютона 526 по мере последовательности, сходящейся почти всюду 307 ряда Фурье в точке 428 равномерной 432 — счетности множества точек раз- разрыва монотонной функции 341 — фактор-алгебре 537 — сг-аддитивности прямого произ- произведения мер 331
564 Предметный указатель Теорема об абсолютной непрерыв- непрерывности неопределенного интегра- интеграла Лебега 364 — аналитичности резольвенты элемента алгебры 535 — идеалах фактор-алгебры 538 — измеримости предела последо- последовательности функции 303 — изоморфизме банаховой алгеб- алгебры с алгеброй См 543 пространств сепарабельных гильбертовых 169, 179 С[а,Ь]* и V°[a,b] 391 — обращении оператора, близкого к единичному 245 преобразования Фурье 439 функции п переменных 453 — общем виде линейного функци- функционала на пространстве гильбер- гильбертовом 204, 405 С^а.Ь] 392 — ограниченности непрерывной функции на компактном прост- пространстве 110 снизу функции, полунепре- полунепрерывной снизу на компактном Т\ -пространстве 112 спектра линейного оператора 251 — ортогонализации 159 — отделении непересекающихся выпуклых подмножеств в веще- вещественном линейном пространст- пространстве 149 — отделимости (первая и вторая) 194 — открытом отображении 243 — открытости множества обрати- обратимых операторов 243 — условиях счетной компактнос- компактности 113 — условном экстремуме 524 — Пеано 121 — Планшереля 456 — Радона-Никодима 372 — Рисса об общем виде линейного функционала на С [а, Ь] 388 на с^а.Ь] 391 — Рисса-Фишера 165 — Стоуна-Вейерштрасса 543 Теорема Стоуна-Чеха 547 - Тихонова 547 - Урысона о метризуемости 107 продолжении 107 - Фату 324 - Фейера 409, 434 - для пространства L\ 437 - Фубини 335 - «малая» 349 - Хана-Банаха 145 в пространстве комплексном 147 нормированном 193 - Хаусдорфа 45 - Хелли первая 385 - вторая 386 - Цермело 44 Теоремы Фредгольма для уравне- уравнений в пространстве банаховом 489 непрерывных функций 489 с ядром вырожденным 481 симметрическим 481 произвольным 483 Теория множеств 17, 45 - обобщенных функций 221 и далее Тождество Гильберта 535 Топологическое пространство 91 - линейное 180 - со счетной базой 98 Топология 91 - в множестве максимальных иде- идеалов 541 - счетно-нормированном прост- пространстве 184 - дискретная 93 -, порожденная системой множеств 94 -, способы задания 105 - тривиальная 93 - ядерно-выпуклая 183 Тотальная система векторов 167 Точечный спектр 251 Точка внутренняя 68 - изолированная 64 - неподвижная 82 - предельная в пространстве мет- метрическом 64 топологическом 92
Предметный указатель 565 Точка прикосновения в простран- пространстве метрическом 63, 65 топологическом 92 Точки невидимые слева 346 — справа 345 — общего положения в линейном пространстве 141 — разрыва монотонной функции 341 — первого рода 340 Точная верхняя или нижняя грань 46 Транзитивность 24, 36 Трансфинит 40 -и 40 -ил 44 -cj* 40 Трансфинитная индукция 46 Трансфинитное порядковое число 40 Трансцендентное число 32 Тривиальный идеал алгебры 532 Тригонометрическая система на отрезке [—тг, тг] 409 [О,тг] 411 — на плоскости 417 Тригонометрический ряд Фурье 409 в комплексной форме 412 для функций п переменных 417 Угол между векторами 156 Умножение в алгебре 529 Упорядоченная сумма 41 Упорядоченное множество 38 — произведение 41 Уравнение Абеля 472 — Вольтерра 90 — второго рода 473, 488 — первого рода 473 — колебаний струны 474 — равновесия нагруженной струны 473 — теплопроводности 451, 454 — Фредгольма второго рода 88, 473 с симметрическим ядром 480 — первого рода 473 абстрактное 489 Условие Дини 428, 432 — Липшица 72 Условия сжимаемости 83—85 Условный экстремум 524 Фактор-алгебра 537 Фактор-пространство пространства банахова 154 - линейного 134 - нормированного 153 Формула для спектрального ради- радиуса элемента алгебры 536 - конечных приращений для ото- отображения 498 - Ньютона-Лейбница 358 обобщенная 503 - обращения для преобразования Фурье 441, 453 - Родрига 415 - Тейлора для отображений 508 - Фурье 439 - комплексная 440 Фундаментальная последователь- последовательность точек в метрическом про- пространстве 73 Функции Лагерра 420 —, полнота 448 - Эрмита 419 - как собственные функции пре- преобразования Фурье 461 —, полнота 448 Функционал 111, 135 - аддитивный 135 - выпуклый 142 - дифференцируемый 501 - линейный 136 —, геометрический смысл 137 и далее - непрерывный на пространстве нормированном 190 на пространстве счетно-нор- мированном 195 h,lp 199 со 200 С[а,Ь] 388, 391 W1 199 , примеры 191 - ограниченный 189 —, примеры 136 - Минковского 143 - мультипликативный 539 - на пространстве гильбертовом 204
566 Предметный указатель Функционал не непрерывный 189 - непрерывный 188 - однородно-выпуклый 142 - на комплексном пространстве 147 - однородный 136 - положительно-однородный 142 - разделяющий множества 149, 194 - сопряженно-линейный 136 - сопряженно-однородный 136 Функция 20 - абсолютно непрерывная 361 - абстрактная 501 - весовая 418 - Дирихле 305, 327 - измеримая 300 -, - по Борелю 300 - монотонно неубывающая (невоз- растающая) 340 - непрерывная в пространстве ме- метрическом 62 топологическом 99 - обобщенная 221 - основная 220 - простая 311 - распределения 379 - с интегрируемым квадратом 399 комплексная 405 - с ограниченным изменением 352 - сингулярная 366 - суммируемая 312, 325 - финитная 219 - Хевисайда 224 - 5-измеримая 300 - (&х, 0у)-измеримая 300 - //-измеримая 300 Характеристическое свойство ев- евклидовых пространств 174 Хаусдорфова аксиома отделимости 103 Хаусдорфовы пространства 103 Центрированная система множеств 107 Цепь в частично упорядоченном множестве 45 Частичная упорядоченность топо- топологий 92 Частичная упорядоченность 36 Число алгебраическое 29 - производное (верхнее, нижнее, левое, правое) 344 - трансфинитное 40 - трансцендентное 32 Шар замкнутый 63 - открытый 63 Шара центр и радиус 63 Эквивалентность множеств 29 Эквивалентность норм 155, 184 Эквивалентные функции 304, 372 Экстремальные задачи 516 и далее Экстремальные задачи с ограниче- ограничениями 522 Экстремум функционала 516 —, необходимые условия 517, 521 Элементарное множество на плос- плоскости 268 Эрмитово-сопряженный оператор 249 Ядерно-выпуклая топология 183 Ядерно-выпуклая топология 189 Ядро Гильберта-Шмидта 476, 484 - Дирихле 427 - интегрального уравнения Фред- гольма 89, 476 - итерированное 494 - линейного оператора 234 - функционала 137 - множества в пространстве линей- линейном 140 нормированном 194 - произведения двух интегральных операторов 493 - Фейера 434 5-измеримая функция 300 В-множества 53 5-пространство 151 В*-алгебра 547 С-свойство 310 ^-мерная грань симплекса 141 п-линейное отображение 507 n-мерное пространство арифмети- арифметическое 131 - евклидово 55 n-мерный симплекс 141 n-я производная отображения 506 n-я степень меры 332
Предметный указатель 567 n-я степень множества 329 - системы множеств 329 Т\ -пространство 102, 181 Т2-пространство 103 *-слабая топология 214 ?-алгебра 52 ^-кольцо 52 - измеримых множеств 292 ^-функция 137, 192, 212, 214, 221 - смещенная 221 -, производная 222 ^-окрестность 63 s-сеть 116 //-измеримая функция 300 //-эквивалентные функции 372 а-аддитивность интеграла Лебега 317, 320 - меры 270, 273, 277, 284, 290 -- Лебега 321, 321 а-алгебра 52 - измеримых множеств 273, 290, 292 неприводимая 52 сг-кольцо 52 сг-конечная мера 294
СПИСОК ЛИТЕРАТУРЫ 1. Авербух В. И., Смоляное О. Г. Теория дифференцирования в линейных топологических пространствах // УМН. — 1967. — Т. XXII, вып. 6. — С. 200-260. 2. Александров П. С. Введение в общую теорию множеств и функций. — М.: Гостехиздат, 1948. 3. Ахиезер Н. И., Глазман И. М. Теория линейных операторов. — М.: Наука, 1966. 4. Банах С. Курс функцюнального анал1зу. — Кшв: Радянська школа, 1948. 5. Березанский Ю. М. Разложение по собственным функциям самосопря- самосопряженных операторов. — Киев: Наукова думка, 1965. 6. Бохнер С. Лекции об интегралах Фурье. — М.: Физматгиз, 1962. 7. Бурбаки Н. Общая топология. Основные структуры. — 2-е изд. — М.: Наука, 1968. 8. Бурбаки Н. Теория множеств. — М.: Мир, 1965. 9. Бурбаки Н. Топологические векторные пространства. — М.: ИЛ, 1959. 10. Виленкин Н. Я. и др. Функциональный анализ. — М.: Наука, 1964. 11. Винер Н. Интеграл Фурье и некоторые его приложения. — М.: Физ- Физматгиз, 1963. 12. Винер Н., Пэли Р. Преобразование Фурье в комплексной области. — М.: Наука, 1964. 13. Гельфанд И.М., Райков Д. А., Шилов Г.Е. Коммутативные нормиро- нормированные кольца. — М.: Физматгиз, 1960. 14. Гельфанд Д. А., Шилов Г.Е. Обобщенные функции и действия над ними. — 2-е изд. — М.: Физматгиз, 1959. 15. Гельфанд И.М., Шилов Г.Е. Пространства основных и обобщенных функций. — М.: Физматгиз, 1958. 16. Гельфанд И.М., Шилов Г.Е. Некоторые вопросы теории дифферци- альных уравнений. — М.: Физматгиз, 1958. 17. Гельфанд И.М., Шилов Г.Е. Некоторые применения гармонического анализа. Оснащенные гильбертовы пространства. — М.: Физматгиз. 1961. 18. Гохберг И. Ц., Крейн М. Г. Введение в теорию линейных несамосопря- несамосопряженных операторов. — М.: Наука, 1965. 19. Гохберг И.Ц., Крейн М.Г. Теория вольтерровых операторов в гиль- гильбертовых пространствах и ее приложения. — М.: Наука, 1967. 20. Вулих Б. 3. Теория полуупорядоченных пространств. — М.: Физмат- Физматгиз, 1961. 21. Данфорд Н., Шварц Дэю. Т. Линейные операторы. Общая теория. — М.: ИЛ, 1962.
Список литературы 569 22. Данфорд Н., Шварц Дэю. Т. Линейные операторы. Спектральная тео- теория. — М.: Мир, 1966. 23. Дэй М. Линейное нормированное пространства. — М.: ИЛ, 1961. 24. Дьедонне Ж. Основы математического анализа. — М.: Мир, 1964. 25. Зигмунд А. Тригонометрические ряды, т. 1, 2. — М.: Мир, 1965. 26. Иосида К. Функциональный анализ. — М.: Мир, 1967. 27. Канторович Л. В. Функциональный анализ и прикладная математи- математика // УМН. — 1948. — Т. III, вып. 6. — С. 89-185. 28. Канторович Л. В., Акилов Г. П. Функциональный анализ.— 2-е изд.— М.: Наука, 1977. 29. Келл Дэю. Л. Общая топология. — М.: Наука, 1968. 30. Красносельский М.А. Топологические методы в теории нелинейных дифференциальных уравнений. — М.: Гостехиздат, 1956. 31. Куратовский К. Топология, т. 1. — М.: Мир, 1966. 32. Лебег А. Интегрирование и отыскание примитивных функций. — М.: ГТТИ, 1934. 33. Лоэв М. Теория вероятностей. — М.: ИЛ, 1962. 34. Люмис Л. Введение в абстрактный гармонический анализ. — М.: ИЛ, 1956. 35. Михлин С. Г. Лекции по интегральным уравнениям. — М.: Физматгиз, 1959. 36. Морен К. Методы гильбертова пространства. — М.: Мир, 1965. 37. Наймарк М. А. Нормированные кольца. — 2-е изд. — М.: Наука, 1968. 38. Наймарк М. А. Линейные дифференциальные операторы. — 2-е изд.— М.: Наука, 1969. 39. Натансон И. П. Теория функций вещественной переменной. — 2-е изд. — М.: Гостехиздат, 1957. 40. Плеснер А. И. Спектральная теория линейных операторов. — М.: На- Наука, 1965. 41. Рисе Ф., Надь Б. С. Лекции по функциональному анализу. — 2-е изд. — М.: Мир, 1979. 42. Робертсон А., Робертсон В. Топологические векторные пространст- пространства. — М.: Мир, 1967. 43. Рудин У. Основы математического анализа. — М.: Мир, 1966. 44. Сакс С. Теория интеграла. — М.: ИЛ, 1949. 45. Титчмарш Е. Введение в теорию интегралов Фурье. — М.: Гостехиз- Гостехиздат, 1948. 46. Трикоми Ф. Интегральные уравнения. — М.: ИЛ, 1960. 47. Френкель А., Бар-Хиллел И. Основания теории множеств. — М.: Мир, 1966. 48. Халмош П. Теория меры. — М.: ИЛ, 1953. 49. Халмош П. Конечномерные векторные пространства. — М.: Физмат- Физматгиз, 1963. 50. Халмош П. Лекции по эргодической теории. — М.: ИЛ, 1959. 51. Хилл Е., Филине Р. Функциональный анализ и полугруппы. — М.: ИЛ, 1962. 52. Шилов Г. Е. Математический анализ. Второй специальный курс. — 2-е изд. — М.: МГУ, 1984.
570 Предметный указатель 53. Шилов Г. E.j Гуревич Б. Л. Интеграл, мера и производная. Общая тео- теория. — М.: Наука, 1967. 54. Шилов Г. E.j Фан Дик Тинь. Интеграл, мера и производная на линей- линейных пространствах. — М.: Наука, 1967. 55. Эдварде Р. Функциональный анализ. — М.: Мир, 1967. 56. Schwartz L. Theorie des distributions, I, II, — Paris, 1951. 57. Fraenkel F. Abstract set theory. — Amsterdam, 1953. РАСПРЕДЕЛЕНИЕ ЛИТЕРАТУРЫ ПО ГЛАВАМ Глава I. 2; 8; 47; 56. Глава П. 2; 4; 7; 24; 29; 31. Глава III. 4; 9; 10; 13; 15; 17; 20; 21; 23; 24; 26; 27; 28; 34; 36; 37; 41; 42; 49; 51; 55. Глава IV. 3-5; 13-19; 21-23; 26; 34; 36-38; 40; 52; 57. Глава V. 12; 21; 32; 33; 39; 41; 44; 48; 50; 53; 54. Глава VI. 21; 28. Глава VII. 32; 39; 41; 44; 53. Глава VIII. 6; 11; 12; 14-17; 25; 52. Глава IX. 35; 46. Глава X. 1; 24; 28; 30; 43; 51. Дополнение. 13; 21; 22; 26.
Учебное издание КОЛМОГОРОВ Андрей Николаевич ФОМИН Сергей Васильевич ЭЛЕМЕНТЫ ТЕОРИИ ФУНКЦИЙ И ФУНКЦИОНАЛЬНОГО АНАЛИЗА Редактор И. Л. Легостаева Корректор Т.Ю. Вайсберг Оригинал-макет: И.Л. Панкратьева ЛР №071930 от 06.07.99. Подписано в печать 09.02.04. Формат 60x90/16. Бумага офсетная. Печать офсетная. Усл. печ. л. 36. Уч.-изд. л. 33,3. Заказ № Издательская фирма «Физико-математическая литература» МАИК «Наука/Интерпериодика» 117997, Москва, ул. Профсоюзная, 90 E-mail: fizmat@maik.ru, http://www.fml.ru Отпечатано с готовых диапозитивов в ПФ «Полиграфист» 160001, г. Вологда, ул. Челюскинцев, 3 Тел.: (8172) 72-55-31, 72-61-75, факс: (8172) 72-60-72 E-mail: form.pfp@votel.ru http://www.vologda/~pfpv ISBN 5-9221-0266-4 985922 10266Т